9. Режимы подкрепления

В контексте учения о высшей нервной деятельности подкреплением называется сочетание безусловного раздражителя, вызывающего биологически значимую реакцию, с предваряющим ее индифферентным стимулом, что приводит к формированию классического условного рефлекса. В качестве подкрепляющего рассматривают любой стимул, увеличивающий вероятность определенной реакции или формы поведения.

Ряд видов научения требует подкрепления. При инструментальном научении подкреплением служат награда или наказание. В отдельных видах научения человека подкреплением является просто информация о том, правильны или нет его действия.

Вторичное подкрепление. В ходе ассоциативного научения некоторые сигналы, которые изначально не имели никакой ценности или не говорили об опасности, соединяются в сознании с событиями, обладающими ценностью или связанными с опасностью. Если это происходит, сигналы или события, ранее носившие нейтральный характер, начинают сами действовать как поощрение или наказание; такой процесс носит название вторичного подкрепления. Классический пример вторичного подкрепления — деньги. Животные в ящике Скиннера готовы нажимать на рычаг, чтобы завладеть специальными жетонами, обмениваемыми на пищу, или добиться того, что начнет звонить звонок, со звуком которого они приучены отождествлять появление еды. Научение, приводящее к избеганию, иллюстрирует вариант вторичного подкрепления через наказание. Животное выполняет определенные действия при появлении сигнала, который, хотя сам и не является неприятным, постоянно сопровождает какое-то неприятное событие. Например, собака, которую часто бьют, съеживается и обращается в бегство, стоит ее хозяину поднять руку, хотя в самой по себе поднятой руке ничего опасного нет. При использовании для контроля за поведением положительного и отрицательного вторичного подкрепления нет необходимости в частом фактическом поощрении или наказании. Так, когда животных дрессируют по методу последовательных приближений, подкреплением при каждой попытке обычно служит лишь щелкающий звук, который до этого регулярно сопровождал появление пищи.

Поощрение или наказание. Одна из проблем научения — не только добиться нового, желательного поведения, но и избавиться от проявлений нежелательного. Главная цель наказания — устранить имеющее место поведение, а не заменить его новым. Часто, например, при воспитании детей или их обучении, возникает вопрос, что лучше: наказать за проступок или дождаться желательного поведения и поощрить ребенка. Наибольших результатов удается достичь, когда наказание сопровождает старое поведение, а награда — новое. Хотя это всего лишь общее правило, которое не может использоваться во всех случаях жизни, оно подчеркивает важный принцип: следует обращать внимание не только на само поведение — нежелательное, устраняемое при помощи наказания, и желательное, поощряемое наградой, — но и на наличие альтернативы данному типу поведения.

Частичное подкрепление. Инструментальное научение с использованием поощрения — например, приучение крысы в ящике Скиннера нажимать на рычаг ради получения пищи или похвала ребенку, когда он говорит "спасибо" и "пожалуйста", — предполагает несколько видов зависимости между поведением и поощрением. Самый обычный вид зависимости — постоянное подкрепление, при котором награда выдается за каждую правильную реакцию. Другой вариант — частичное подкрепление, предлагающее поощрение только при некоторых правильных реакциях, скажем в каждом третьем случае желаемого поведения, или в каждом десятом, или при его первом проявлении каждый час или каждый день. Воздействие частичного подкрепления важно и представляет большой интерес. При частичном подкреплении для освоения желаемого поведения требуется больше времени, но результаты оказываются гораздо более стойкими. Сохранение эффекта особенно заметно, когда поощрение прекращается; такая процедура называется "угасанием". Поведение, освоенное при частичном подкреплении, сохраняется надолго, а освоенное при постоянном подкреплении быстро прекращается.

Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления.

Режим подкрепления - правило, устанавливающее вероятность, с которой подкрепление будет происходить.

Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве ситуаций повседневной жизни, однако, это либо неосуществимо, либо неэкономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным. Ребенок плачет неоднократно, прежде чем добьется внимания матери. Неподкрепленные реакции встречаются до тех пор, пока одна из них не будет подкреплена.

Скиннер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение. Хотя возможны многие различные режимы подкрепления, их все можно классифицировать в соответствии с двумя основными параметрами:

1) подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления);

2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления).

Режимы подкрепления – любой из режимов, в котором субъекту предъявляется подкрепление, определяемых некоторыми пространственными, временными или последовательными аспектами реакции. В приводящемся ниже описании подразумевается, что речь идет в оперантном поведении, хотя некоторые из этих режимов использовались в классическом обусловливании (например, непрерывное подкрепление), употребление термина режим подкрепления в таком контексте редко. Притягательность режимов подкрепления для многих психологов, особенно скиннеровских бихевиористов, объясняется тем фактом, что подкрепление поведения в повседневной жизни обычно нерегулярно и неоднообразно. Поэтому были приложены значительные усилия для исследования того эффекта, который оказывает режимы представления подкрепления на создание и поддержание поведения. Следующий список включает наиболее полно изученные режимы подкрепления. Используемая здесь система классификации более или менее стандартна, хотя в специальной литературе можно встретить и другие: сначала представлены "простые" режимы, где имеется единственный тип сопряженности между реакцией и подкреплением; затем описываются "составные" режимы, где действуют два или более простых режима; в заключение приводятся "специальные" режимы, которые не подходят ни к одному из предыдущих классов.

I. Простые режимы. Все нижеперечисленные режимы, в которых имеется только одна связь между реакцией и появлением подкрепляющего стимула.

1.Непрерывное подкрепление (crf, или CRF). Довольно просто: подкрепляется каждая реакция.


Информация о работе «Основы психологии поведения животных»
Раздел: Психология
Количество знаков с пробелами: 64093
Количество таблиц: 0
Количество изображений: 0

Похожие работы

Скачать
256180
0
0

... и изживает их в "обезвреженной" форме. 6. Интроспективный подход в психологии. Психология сознания и самосознания. Диагностика самосознания   Интроспективная y – наука о сознании. В основе И. психологии лежат представления связанные с развитием естеств. наук в 19в., которые стремились отыскать простейшие элементы сознания, т.е. атомы, кот. были бы неделимы и неизменны и складываясь образуют ...

Скачать
25527
0
0

... человек еще не совсем отделился от природы, и ответы нужно искать у предков людей и у животных, наших братьев, так как вышли мы все из природы. II. Основная часть: сравнение психики животных и человека: История сравнительных исследований даланемало примеров того общего,что обнаруживается в психике человека и животных. Тенденция выстраивания фактов, добытых вэтих исследованиях, такова,что в них ...

Скачать
17003
1
0

... наблюдается у стадных животных. Когда животные в случае опасности скопом нападают на хищника.  4. Попрошайничество. Попрошайничество, видимо присутствует как врожденный элемент поведения у детенышей большинства животных и пернатых. Как элемент поведения, он активен пока детеныш не подрастет, затем он видимо затухает, ведь выросшая особь способна сама добывать пропитание. Хотя и зрелом возрасте ...

Скачать
25086
0
0

... акты всегда отличаются наличием такой ориентировочной основы действия, такой стратегии и тактики. В этом случае А.Р. Лурия обращался к некоторым классическим опытам, в которых изучалось интеллектуальное поведение животных. Эти опыты были проделаны Кёлером, и получили известность как элементарнейшие опыты с употреблением орудий. Употребление орудий есть всегда типичное интеллектуальное действие. ...

0 комментариев


Наверх