Irvuz

Виды подкрепления

Типы и режимы подкреплений

Виды подкрепления

Одним из примечательных идей скиннеровской теории обусловливания является понятие подкрепления.

Подкрепление (punishment) — это любое событие (стимул), которое следует за реакцией и увеличивает вероятность ее появления.

Когда голубь, например, тычет клювом в диск, то это поведение является оперантным, и если оно сопровождается подкреплением, таким, как еда, то вероятность клевания диска возрастает.

В соответствии с этим взглядом, подкреплениие усиливает то поведение, за которым следует, и нет необходимости прибегать к биологическим объяснениям, чтобы определить, почему так происходит.

Очень важным является то, что стимулы, которые изначально не являются подкреплениями, могут превратиться в таковые благодаря ассоциированию с другими подкреплениями. Некоторые стимулы, такие, как деньги, становятся генерализованным подкреплением, поскольку они обеспечивают доступ ко множеству других видов подкрепления.

Подкрепление определяется через его воздействие на поведение – а именно через рост вероятности поведенческой реакции. Часто трудно точно определить, что может послужить таким подкреплением, так как оно варьирует от индивида к индивиду, от организма к организму.

Теоретики, занимающиеся научением, признавали два типа подкрепления:.- Первичное подкрепление – это любое событие или объект, сами по себе обладающие подкрепляющими свойствами.

Таким образом, они не требуют предварительной ассоциации с другими подкреплениями, чтобы удовлетворить биологическую потребность. Первичные подкрепляющие стимулы для людей – это пища, вода, физический комфорт и секс. Их ценностное значение для организма не зависит от научения.

– Вторичное, или усвоеное подкрепление, с другой стороны, -это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма.

Примерами общих вторичных подкрепляющих стимулов у людей являются деньги, внимание, привязанности и хорошие оценки.

Генерализация и различение стимулов. Особенностью подкрепления является то, что поведение, усиленное в одной ситуации, весьма вероятно повторится, когда организм столкнется с другими ситуациями, напоминающими ее.

Если бы это было не так, то поведенческий репертуар человека был бы так сильно ограничен и хаотичен, что мы бы, возможно, проснувшись утром, долго размышляли над тем, как реагировать должным образом на каждую новую ситуацию. В теории Скиннера тенденция подкрепленного поведения распространяться на множество подобных положений называется генерализацией стимула.

Например, деньги не могут удовлетворить какое-либо из наших первичных влечений, однако благодаря системе культурного обмена деньги являются мощным и сильным фактором для получения множества удовольствий. Иные виды генерализованных условных подкрепляющих стимулов – это лесть, похвала привязанности и подчинение себе других.

Эти так называемые социальные подкрепляющие стимулы (включающие в себя поведение других людей) часто действуют очень сложно и едва уловимо, но они существенны для нашего поведения в разнообразных ситуациях. Социальное одобрение — это еще более сильный генерализованный условный стимул.

Хотя способность обобщать реакции – важный аспект многих наших повседневных социальных интеракций, все же очевидно, что при адаптивном поведении нужно обладать способностью делать различия в разных ситуациях.

Различение стимула, составная часть обобщения, – это процесс научения реагировать адекватным образом в различных ситуациях окружения.

Способность к различению приобретается через подкрепление реакций в присутствии одних стимулов и неподкрепление их в присутствии других стимулов. Различительные стимулы таким образом дают возможность предвидеть вероятные результаты, связанные с изъявлением особой оперантной реакции в различных социальных ситуациях.

Соответственно, индивидуальные вариации различительной способности зависят от уникального прошлого опыта различных подкреплений.

Скиннер предположил, что здоровое личностное развитие происходит в результате взаимодействия генерализирующей и различительной способностей, с помощью которых мы регулируем наше поведение так, чтобы максимизировать позитивное подкрепление и минимизировать наказание.

Режимы подкрепления

Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение, неподкрепленное, или наказуемое, имеет тенденцию не повторяться или подавляться. Следовательно, концепция подкрепления играет ключевую роль в теории Скиннера.

Поведение понятно, если его можно контролировать, внося определенные изменения в условия среды. Понять поведение — значит управлять им. Управление поведением осуществляется через выбор типа реакции, которую необходимо подкрепить, и определение степени вероятности ее повторного появления.

Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления.

Режим подкрепления – правило, устанавливающее вероятность, с которой подкрепление будет происходить.

Режим подкрепления можно построить, задавая определенный временной интервал или определенный интервал реакций.

Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию.

Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию.

В большинстве ситуаций повседневной жизни, однако, это либо неосуществимо, либо неэкономично для сохранения желаемой реакции, так как подкрепление поведения бывает не всегда одинаковым и регулярным.

В случае если задается интервал реакций, т.е. определенное соотношение подкреплений и реакций, подкрепления появляются после того, как выполнено определенное число реакций (например, нажатий на рычаг или на ключ). Таким образом, подкрепления не обязательно следуют после каждого ответа, а могут подаваться лишь время от времени.

Более того, подкрепления могут подаваться в регулярном или фиксированном режиме – всегда через определенный интервал времени или после определенного количества реакций, либо их можно подавать в переменном режиме – то через одну минуту, то через две, то после пары реакций, то после серии реакций.

Каждая схема, или режим подкрепления, как правило, стабилизирует поведение по-разному.

Скиннер тщательно изучал, как режим прерывистого, или частичного, подкрепления влияет на оперантное поведение.

Еыделяют следующие параметры подачи подкреплений:- подкрепление может иметь место только после того, как истек определенный или случайный временной интервал с момента предыдущего подкрепления (так называемый режим временного подкрепления),

– подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций (режим пропорционального подкрепления).

В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления:
— Режим подкрепления с постоянным соотношением (ПС). В данном режиме организм подкрепляется по наличию заранее определенного или «постоянного» числа соответствующих реакций.

Этот режим является всеобщим в повседневной жизни и ему принадлежит значительная роль в контроле над поведением.

Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции.

Режим ПС обычно устанавливает чрезвычайно высокий оперантный уровень, так как чем чаще организм реагирует, тем большее подкрепление он получает.

Режим подкрепления с постоянным интервалом (ПИ). В режиме подкрепления с постоянным интервалом организм подкрепляется после того, как твердо установленный или «постоянный» временной интервал проходит с момента предыдущего подкрепления.

На уровне человека режим ПИ действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Подобно этому, еженедельная выдача денег ребенку на карманные расходы образует ПИ форму подкрепления. Университеты обычно работают в соответствии с временным режимом ПИ.

Экзамены устанавливаются на регулярной основе и отчеты об академической успеваемости издаются в установленные сроки. Любопытно, что режим ПИ дает низкую скорость реагирования сразу после того, как получено подкрепление – феномен, названный паузой после подкрепления.

Это показательно для студентов, испытывающих трудности при обучении в середине семестра (предполагается, что они сдали экзамен хорошо), так как следующий экзамен будет еще нескоро. Они буквально делают перерыв в обучении.

Режим подкрепления с вариативным соотношением (ВС). В этом режиме организм подкрепляется на основе какого-то в среднем предопределенного числа реакций.

Возможно, наиболее драматической иллюстрацией поведения человека, находящегося под контролем режима ВС, является захватывающая азартная игра. Рассмотрим действия человека у игрального автомата, где нужно опускать монетку или специальной рукояткой вытягивать приз.

Эти аппараты запрограммированы таким образом, что подкрепление (деньги) распределяется в соответствии с числом попыток, за которые человек платит, чтобы управлять рукояткой.

Однако выигрыш непредсказуем, непостоянен и редко позволяет получать свыше того, что вложил игрок. Это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты.

Далее, угасание поведения, приобретенного в соответствии с режимом ВС, происходит очень медленно, так как организм точно не знает, когда будет следующее подкрепление.

Таким образом, игрок принуждается опускать монеты в прорезь автомата, несмотря на ничтожный выигрыш (или даже проигрыш), в полной уверенности, что в следующий раз он «сорвет куш».

Такая настойчивость типична для поведения, вызванного режимом ВС.

Режим подкрепления с вариативный интервалом (ВИ). В этом режиме организм получает подкрепление после того, как проходит неопределенный временной интервал. Подобно режиму ПИ, подкрепление при этом условии зависит от времени. Однако время между подкреплениями по режиму ВИ варьирует вокруг какой-то средней величины, а не является точно установленным.

Как правило, скорость реагирования при режиме ВИ является прямой функцией примененной длины интервала: короткие интервалы порождают высокую скорость, а длинные интервалы порождают низкую скорость. Также при подкреплении в режиме ВИ организм стремится установить постоянную скорость реагирования, и при отсутствии подкрепления реакции угасают медленно.

В конечном итоге организм не может точно предвидеть, когда будет следующее подкрепление.

В повседневной жизни режим ВИ нечасто встречается, хотя несколько его вариантов можно наблюдать. Родитель, например, может хвалить поведение ребенка довольно произвольно, рассчитывая, что ребенок будет продолжать вести себя соответствующим образом и в неподкрепленные интервалы времени.

Подобно этому, профессора, которые дают «неожиданные» контрольные работы, частота которых варьирует от одной в три дня до одной в три недели, в среднем одна в две недели, используют режим ВИ. При этих условиях от студентов можно ожидать сохранения относительно высокого уровня прилежания, так как они никогда не знают, в какой момент будет следующая контрольная работа.

Как правило, режим ВИ порождает более высокую скорость реагирования и большую сопротивляемость угасанию, чем режим ПИ.

Виды подкрепления

Как отмечалось ранее, под подкреплением понимается какое-либо действие, призванное усилить определенную реакцию.

Хотя оперантное обусловливание опирается в первую очередь на использование подкрепления с положительной валентностью, основанных на приближении организма к, такого, как пища, деньги или похвала, последователи Скиннера подчеркивают также важность подкреплений, основанных на бегстве организма от, или на избегании им отвращающих (неприятных) стимулов. В таких случаях реакции подкрепляются устранением неприятных стимулов или возможностью их избежать, а не появлением приятных стимулов. Во всех этих случаях результатом должно быть сохранение или усиление реакции. В связи с этим различают два вида подкреплений:- Позитивное подкрепление – это приятный стимул, который следуя за желательной реакцией, усиливает ее или поддерживает на том же уровне, т.е. повышает вероятность ее повторения.

– Негативное подкрепление – это неприятный стимул, устранение которого усиливает желательную реакцию.

Вместе с тем существует и множество самих способов подкрепления. К наиболее распространенным относятся поощрение (предъявление приятных стимулов) и наказание (предъявление неприятных стимулов).

Как поощрение, так и наказание могут выполняться двумя способами, это зависит от того, что следует за реакцией: предъявление или устранение приятного или неприятного стимула. Подкрепление усиливает реакцию; наказание – ослабляет ее.

https://www.youtube.com/watch?v=F-iarniau7g

Таким образом, в практике воспитания чаще всего используются четыре разновидности подкрепления:- если вслед за желательной реакцией ребенка следует вызывающий приятные ощущения и переживания подкрепляющий стимул, то результат – положительное поощрение;- если за нежелательной реакцией следует не вызывающий приятных ощущений и переживаний подкрепляющий стимул, то результат – положительное наказание;- если вызывающий неприятные ощущения и переживания подкрепляющий стимул устраняется после получения желательной реакции, то результат – отрицательное поощрение;

– если приятный стимул устраняется после той или иной нежелательной реакции ребенка, то результат – отрицательное наказание.

Источник: https://psyera.ru/tipy-i-rezhimy-podkrepleniy-957.htm

Как пользоваться подкреплением – психология

Виды подкрепления

Подкрепление — обязательное условие любого . Главное правило: «Что подкрепляем — то и получаем».

Как пользоваться подкреплением

Принципы использования подкрепления положительного и отрицательного одинаковы.

  • Моментальность или опережение действия

То есть в идеале подкреплять нужно не действия, а уже момент принятия решения об этих действиях и затем само действие. Так шанс, что нежелательное поведение вообще осуществится предельно мал.

Однако давать подкрепление сильно заранее — тоже не стоит, и так, как предугадать действия не всегда возможно — то лучше подкрепление использовать «здесь и сейчас», то есть в момент, как нужное действие совершилось.

Для этого дрессировщики животных часто используют , который заменяет подкрепление моментальным звуком (щелчком).

  • Чем подкрепление меньше — тем лучше

Подкрепление — всегда маленькое: фраза, слово, взгляд. Большое подкрепление отвлекает от работы, и может быть получено только в честь какого-то выдающегося события. Чем меньше подкрепление — тем лучше.

Опять же, применительно к лошадям. Учимся поднимать ногу вот уже месяц.

И наконец, лошадь поднимает и удерживает ногу на весу в течении 5 секунд! Все, супер! Лошадь получает яблоко и окончание занятия, ее чистят, к ней много внимания, ее все любят — одним словом много положительных подкреплений. Но.

Это только единственный раз, тот самый, когда она поняла, что делать. В следующее занятие в ответ на поднятую ногу лошадь получит обычную похвалу: щелчок кликера или лакомство и «Хорошо!»

  • Чем труднее работа — тем больше подкрепление

Подкрепление разное для каждого действия. Чем труднее действие — тем больше подкрепление. Здесь еще важно осознание самого обучаемого: для кого-то написать статью — это так, фигня, а для кого-то трудная задача. Соответственно соизмерять подкрепление нужно не только со своим представлением о трудности работы, но и с ожиданием обучаемого.'

Для одной лошади — подвиг быть рядом с человеком и не бегать от него, а для другой — это естественная норма. Поощрять таких лошадей стоит по-разному: одну сильно и много, а вторую — слегка и достаточно равнодушно.

  • Сформированный навык — это норма.

А значит ни о каком подкреплении речи уже не идет. Единственное, чтобы поддержать нужный навык иногда полезно поощрять спонтанно за выполненное действие. '

Вернемся к лошадям. Учимся останавливаться по команде человека. Первая остановка — это хорошо, это здорово, это похвала. Через два дня лошадь делает это моментально сама. За это больше не хвалим — это норма. Не бежать впереди человека — норма. Теперь хвалим редко, спонтанно, например 1 раз за занятие, только для того, чтобы поддерживать навык.

Источник:

Что такое подкрепление?

Автор Татьяна в 02/04/2015. Бихевиоризм

Подкрепление — термин, используемый в оперантном обусловливании для обозначения всего, что увеличивает вероятность повторения реакции. Обратите внимание: подкрепление определяется тем, какое воздействие оно имеет на поведение — ​​например, увеличивает или усиливает его отдельные проявления.

Подкрепление может включать в себя похвалу — к примеру, сразу после того, как ребёнок убирает свои игрушки. Подкрепляя желаемое поведение похвалой, мама может добиться того, что ребёнок снова и снова выполнять то же действие.

Сила реакции

То, как и когда происходит подкрепление, может повлиять на силу реакции. Эта сила представляет собой интенсивность, частоту, продолжительность и точность реакции после подкрепления. В ситуации, когда подкрепление контролируется, — например, в процессе обучения, — сроки предъявления подкрепления можно изменять по своему усмотрению.

На ранних стадиях обучения часто используется непрерывное подкрепление — в этом случае подкрепление предъявляется каждый раз, когда происходит желаемое поведение. Как только поведение было закреплено, можно переходить к частичному подкреплению.

Выделяют четыре основных режима частичного подкрепления:

  • режим подкрепления с фиксированной пропорцией: подкрепление поведения совершается после определённого количества реакций;
  • режим подкрепления с фиксированным интервалом: подкрепление поведения происходит после определённого периода;
  • режим подкрепления с изменяющейся пропорцией: подкрепление поведения происходит после неопределённого числа реакций;
  • режим подкрепления с изменяющимся интервалом: подкрепление поведения предъявляется после неустановленного периода времени.

Источник:

Систематическое использование подкрепления — Популярная Психология

Систематические программы, часто называемые управлением случайностью и заключающиеся в управлении подкреплением с целью подавления нежелательного поведения или проявления и сохранения эффективного поведения, позволяют достигнуть значительного успеха, особенно в лечебных заведениях.

Подавление проблематичного поведения сводится к тому, чтобы убрать положительные стимулы, подкрепляющие его, в тех случаях, когда их удается идентифицировать.

Иногда идентификация не вызывает никаких затруднений, как, например, в приведенном ниже случае.

Иногда она требует чрезвычайно тщательного наблюдения и анализа, которые позволяют терапевту узнать, что именно поддерживает неадаптивное поведение.

Разбор случая: поведенческая терапия для любителя пускать пыль в глаза. Родители привели Билли, 6-летнего первоклассника, в психологическую клинику, потому что он ненавидел школу, а его учительница сказала им, что демонстративное поведение их ребенка разлагает класс и способствует изоляции мальчика.

Наблюдения за Билли и его родителями во время первого интервью ясно показали, что и мать и отец с восхищением и без всякой критики относились ко всему, что делал их сын.

После проведения дальнейшей оценки была предложена программа, включающая в себя три фазы: 1) родителям показали различие между демонстративным и подобающим поведением Билли; 2) им предлагалось выказывать отсутствие внимания и интереса в случае демонстрации их сыном неадаптивного поведения, но одобрять подобающее его поведение, и 3) учительнице Билли посоветовали игнорировать его, насколько это возможно, когда он вел себя демонстративно, и обращать свое внимание на тех детей, которые вели себя подобающим образом.

Несмотря на то что в течение нескольких первых дней осуществления программы демонстративное поведение Билли в классе усилилось, в дальнейшем оно резко пошло на убыль, когда не стало получать подкрепления со стороны родителей и учительницы. По мере ослабления неадаптивного поведения мальчика одноклассники стали лучше относиться к нему, что, в свою очередь, помогло подкрепить его положительные поведенческие паттерны и изменило негативное отношение ребенка к школе.

В случае Билли нежелательное поведение было изменено посредством уничтожения подкрепляющих его стимулов. В других случаях терапия необходима для того, чтобы установить желаемое поведение. При этом чаще всего используются следующие техники: формирование ответа, жетонная система и заключение контрактов о поведении.

Формирование ответа.

При формировании ответа часто используют положительное подкрепление, то есть постепенно приближаются к такой ответной реакции, которая вызывает активное сопротивление или изначально отсутствует в репертуаре поведения индивида. Такая техника широко применяется в работе с проблемным детским поведением. Хорошей ее иллюстрацией может быть следующее классическое исследование.

Разбор случая: формирование поведения у аутичного мальчика. У 3-летнего аутич — ного мальчика отсутствовало нормальное вербальное и социальное поведение.

Он не умел правильно есть, ему были свойственно саморазрушительное поведение и неуправляемые вспышки ярости. Незадолго до этого он перенес операцию по поводу катаракты и должен был носить очки для восстановления нормального зрения.

Однако он отказывался делать это и разбивал одну пару очков за другой.

Для решения проблемы с очками терапевт применил технику формирования поведения. В начале мальчика научили ожидать получения кусочка сластей или фруктов при звуке игрушечного звонка. В дальнейшем перешли к обучению с оправами от очков.

Сначала мальчика поощряли конфетами или фруктами, когда он подбирал оправу, затем, — когда держал ее; и далее — поэтапно: когда носил в руках, подносил к глазам, прикладывал под любым углом к голове.

Благодаря последовательному приближению к заданной цели мальчик, в конце концов, научился носить очки с корректирующими линзами в течение 12 часов в сутки.

Жетонная система. Одобрение и другие неосязаемые положительные стимулы могут оказаться неэффективными, если программы модификации поведения используются при тяжелых неадаптивных поведенческих паттернах.

В таких случаях подобающее поведение может вознаграждаться вещественными положительными стимулами в виде каких-либо символов, которые в дальнейшем можно обменять на желаемый предмет или определенные привилегии.

В ходе работы со стационарными больными, страдающими шизофренией, было, например, установлено, что большинству пациентов посещение больничного магазина, прослушивание музыкальных записей и просмотр кино казались привлекательными занятиями. В результате данные виды деятельности были выбраны терапевтом в качестве положительных стимулов за социально приемлемое поведение.

Чтобы получить разрешение на любое из этих занятий, клиент должен был заработать определенное количество жетонов, демонстрируя в палате соответствующее поведение. В главе 18 мы опишем еще одну программу по «экономике жетонов», оказавшуюся чрезвычайно успешной и используемой при работе с хроническими клиентами, постоянно находящимися в больнице и считавшимися не поддающимися лечению.

Жетонную систему использовали с целью формирования адаптивного поведения, варьирующего от элементарных реакций, например соблюдения основных правил в процессе еды и уборки постели, до ежедневного выполнения ответственной работы в больнице.

В последнем случае экономика жетонов напоминает внешний мир, где человеку платят за сделанную работу жетонами, которые позднее можно обменять на желаемые предметы и занятия.

Использование жетонов в качестве положительных стимулов за надлежащее поведение имеет ряд несомненных преимуществ: 1) количество заработанных жетонов непосредственно зависит от количества проявлений желательного поведения; 2) жетоны, как и деньги во внешнем мире, можно сделать единым общим платежным средством, то есть на них можно что-либо «купить», они не являются предметом потребления, сохраняют свое побуждающее значение; 3) жетоны помогают сократить временной разрыв между надлежащим исполнением и подкреплением; 4) количество заработанных жетонов и способ их «траты» зависят главным образом от самого клиента и 5) жетоны служат своего рода мостом между больничным окружением и требованиями, системой оплаты, существующими во внешнем мире.

Конечной целью «экономики жетонов», как и других программ, использующих внешнее подкрепление, является не только получение желаемых ответных реакций, но и доведение их до того уровня, когда выработанные адаптивные действия будут подкреплять сами себя; таким образом будет обеспечено естественное, а не искусственное вознаграждение за желательное поведение. Так, для того чтобы помочь детям преодолеть трудности чтения, в самом начале можно использовать внешнее подкрепление. В то же время предполагается, что, как только ребенок научится читать, данный навык обеспечит внутреннее подкрепление, поскольку малыш сможет наслаждаться самим процессом чтения.

Источник: https://obu4ayka.ru/otnosheniya/__trashed-1059.html

ovdmitjb

Add comment