Инструментальное, или оперантное, обусловливание

Не все виды научения можно объяснить классическим обусловливанием. При классическом обусловливании условный и безусловный стимулы предшествуют условной реакции. Но условные связи могут также возникать между реакциями и стимулами, которые следуют за ними, другими словами, между поведением и его последствиями.

Например, собака научается «служить», чтобы получить угощение; ребенок научается говорить «пожалуйста», чтобы получить конфетку. Эти реакции являются инструментами для получения какой-то награды. Инструментальное обусловливание — это процедура научения, при которой реакции приводят к награждению или желаемому эффекту.

Принципы инструментального научения открыл американский психолог Эдвард Торндайк (Edward Thorndike) примерно в то время, когда Павлов проводил эксперименты в России. Животное — обычно голодная кошка, помещалась в специальную клетку, названную «за- гадкой», и должна была научиться какой-то реакции; например, наступить на маленький рычаг для того, чтобы открыть дверь и выйти наружу.

Когда кошке это удавалось, она награждалась пищей и вновь возвращалась в ящик. После нескольких проб кошка спокойно подходила к рычагу, нажимала на него лапой, выходила через открытую дверь и ела.

Формирование реакции происходило путем проб и ошибок, как результат выбора нужного эталона поведения и последующего его за- крепления. Научение, согласно Торндайку, управляется законом эффекта: поведение контролируется его результатами и последствиями; поведение, которое приводит к достижению положительного результата, удовлетворению, закрепляется, и наоборот — не приводящее к положительному результату стирается или ослабляется.

Спустя несколько десятилетий после опубликования работ Торндайка другой американский психолог, Б. Скиннер, развил идеи своего предшественника. Скиннер подчеркивал, что при инструментальном обусловливании животное оперирует со средой, производит какое-нибудь движение, воздействует на среду. Поэтому процесс научения этим реакциям он назвал оперантным обусловливанием.

Для изучения оперантного обусловливания Б. Скиннер изобрел экспериментальную камеру, получившую название скиннеровского ящика. Камера звуко- и светонепроницаема, в ней поддерживается постоянная температура, и она полностью контролируется. Камера снабжена приспособлением, которым животное может оперировать для получения вознаграждения.

Например, крыса, нажимая на рычаг, получает пищу из тонкой трубочки. Скиннеровский ящик позволил изучать отношения между реакцией и ее последствиями и анализировать, как эти последствия влияют на поведение.

Оперантное обусловливание подчеркивает, что поведение есть функция его последствий. Поведение усиливается позитивным или негативным подкреплением; оно ослабляется наказанием.

Позитивное подкрепление — это предъявление стимулов, которые усиливают реакцию. Иными словами, это награждение. Примером может служить учитель, который хвалит ребенка за прилежную учебу.

Негативное подкрепление — процесс усиления поведения путем изъятия, удаления негативных стимулов, таких как боль, скука, избыток тепла или холода и т. п. Примером может служить прием таблетки анальгина при головной боли. Другой пример: пациент, испытывающий страх в метро, может избежать этого переживания, оставшись дома.

Наказание. И позитивное и негативное подкрепления усиливают частоту реакции. Наказание уменьшает частоту реакции. Часто путают наказание и негативное подкрепление, но они совершенно различны. Подкрепление усиливает поведение, а наказание ослабляет его.

Если ток выключается, когда крыса нажимает на рычаг, — это негативное подкрепление; оно увеличивает вероятность того, что крыса на- жмет на педаль, когда ток снова включат. Но если ток включается, когда крыса нажимает на рычаг, то это наказание; менее вероятно, что крыса снова нажмет на рычаг.

Дискриминационное научение имеет место тогда, когда реакция награждается (или наказывается) в одной ситуации, но не награждается (не наказывается) — в другой. В таком случае говорят, что реакция (поведение) находится под контролем стимула.

Этот процесс особенно важен в объяснении гибкости поведения в различных социальных ситуациях. Дискриминация (различение) стимулов позволяет на- учиться тому, что является подходящим (подкрепляемым) и неподходящим (неподкрепляемым) в данной ситуации. Например, ворчливая жена вряд ли будет бранить мужа в присутствии гостей.

Генерализация состоит в том, что поведение обнаруживается в иных ситуациях, а не только тех, в которых оно было приобретено. Например, терапевт может помочь пациенту стать более уверенным и экспрессивным во время терапии. Но цель терапии в том, чтобы пациент стал более уверенным в реальных жизненных ситуациях, другими словами, очень важно, чтобы произошла генерализация.

Узнай цену консультации

"Да забей ты на эти дипломы и экзамены!” (дворник Кузьмич)