Формирование (психология) - Shaping (psychology)

Формирование - это парадигма обусловливания, используемая в основном в экспериментальном анализе поведения . Используемый метод дифференциального усиления из последовательных приближений . Он был введен Б.Ф. Скиннером с голубями и распространился на собак, дельфинов, людей и другие виды. При формировании форма существующей реакции постепенно изменяется в ходе последовательных испытаний в направлении желаемого целевого поведения за счет усиления определенных сегментов поведения. Скиннер объяснил формирование формы следующим образом:

Сначала даем птице корм, когда она немного поворачивается в направлении пятна от любой части клетки. Это увеличивает частоту такого поведения. Затем мы удерживаем подкрепление до тех пор, пока не будет сделано небольшое движение к точке. Это снова меняет общее распределение поведения без создания новой единицы. Мы продолжаем усиливать позиции, последовательно приближаясь к точке, затем подкрепляя только тогда, когда голова немного сдвинута вперед, и, наконец, только когда клюв действительно соприкасается с точкой. ... Первоначальная вероятность ответа в его окончательной форме очень мала; в некоторых случаях он может даже быть нулевым. Таким образом мы можем построить сложные операторы, которые иначе никогда бы не появились в репертуаре организма. Усиливая серию последовательных приближений, мы доводим редкий ответ до очень высокой вероятности за короткое время. ... Полный акт поворота к точке из любой точки коробки, ходьбы к ней, поднятия головы и удара по точке может показаться функционально согласованной единицей поведения; но он построен путем непрерывного процесса дифференцированного подкрепления недифференцированного поведения, точно так же, как скульптор вылепляет свою фигуру из куска глины.

Последовательные приближения

Усиленные последовательные приближения становятся все более точными приближениями к желаемой тренеру реакции, «целевой» реакции. По мере обучения тренер перестает использовать менее точные приближения. Например, при обучении крысы нажимать на рычаг можно усилить следующие последовательные приближения:

  1. просто поворот к рычагу будет усилен
  2. только движение к рычагу будет усилено
  3. усиливается только перемещение на указанное расстояние от рычага
  4. только касание рычага какой-либо частью тела, например носом, будет усилено
  5. только прикосновение к рычагу указанной лапой будет усилено
  6. только частичное нажатие на рычаг указанной лапой будет усилено
  7. только полное нажатие на рычаг указанной лапой будет усилено

Тренер начинает с закрепления всего поведения в первой категории, в данном случае поворачиваясь к рычагу. Когда животное регулярно выполняет эту реакцию (повороты), дрессировщик ограничивает подкрепление реакциями второй категории (движение вперед), затем третьей и так далее, переходя к каждому более точному приближению по мере того, как животное изучает тот, который в настоящее время подкреплен. Таким образом, отклик постепенно приближается к желаемому поведению, пока, наконец, не будет установлен целевой отклик (нажатие рычага). Поначалу крыса вряд ли нажмет на рычаг; в конце концов давит быстро.

Формирование иногда не удается. Часто цитируемым примером является попытка Мэриан и Келлер Бреланд (ученики Б. Ф. Скиннера) сформировать свинью и енота, чтобы положить монету в копилку, используя пищу в качестве подкрепления. Вместо того, чтобы научиться класть монету, свинья стала укоренять ее в земле, а енот «мыл» и растирал монеты. То есть животные обращались с монетой так же, как они обращались с продуктами питания, которые они готовили к употреблению, и это называется поведением «получение пищи». В случае с енотом он смог научиться класть одну монету в коробку, чтобы получить пищевое вознаграждение, но когда непредвиденные обстоятельства были изменены таким образом, что для получения награды требовалось две монеты, енот не мог выучить новое, более сложное правило. После того, что можно охарактеризовать как выражение разочарования, енот прибегает к элементарным привычкам «добывать пищу», обычным для его вида. Эти результаты показывают ограничение когнитивных способностей енота, чтобы даже представить возможность того, что две монеты можно обменять на еду, независимо от существующих непредвиденных обстоятельств, связанных с автоформированием. С тех пор, как были опубликованы наблюдения Бреланда, было сообщено о многих других примерах необученной реакции на естественные стимулы; во многих контекстах стимулы называются «знаковыми стимулами», а связанное с ними поведение называется «отслеживанием знаков».

Практическое применение

Формирование используется для тренировки оперантных реакций у лабораторных животных и в прикладном анализе поведения для изменения поведения человека или животных, которое считается неадаптивным или дисфункциональным. Он также играет важную роль в дрессировке коммерческих животных. Формирование помогает в «различении», то есть способности различать стимулы, которые усиливаются и не подкрепляются, и в «обобщении», то есть применении реакции, усвоенной в одной ситуации, к другой, но схожей ситуации.

Шейпинг также можно использовать в реабилитационном центре. Например, тренировка на брусьях может приближаться к ходьбе с ходунками . Или шейпинг может научить пациентов, как увеличить время между посещениями туалета.

Автоформирование

Автоформирование (иногда называемое отслеживанием знаков ) - это любая из множества экспериментальных процедур, используемых для изучения классической обусловленности . При автоформировании, в отличие от шейпинга, награда приходит независимо от поведения животного. В своей простейшей форме автоформирование очень похоже на процедуру кондиционирования слюны Павлова с использованием собак. В самой известной методике Павлова короткий звуковой сигнал надежно предшествовал подаче пищи собакам. Собаки естественно, безусловно, выделяли слюноотделение ( безусловный ответ ) на пищу ( безусловный раздражитель ), которую им давали, но в результате обучения, условно, приходили слюноотделение ( условный ответ ) на тон ( условный раздражитель ), предсказывающий пищу. При автоматическом формировании свет надежно включается незадолго до того, как животным дают пищу. Животные естественно, безусловно, проявляют завершающую реакцию на даваемую им пищу, но благодаря обучению, условно, стали выполнять те же самые согласованные действия, направленные на условный раздражитель, предсказывающий пищу.

Автоформирование представляет собой интересную головоломку для утверждения Б. Ф. Скиннера о том, что нужно использовать формирование как метод обучения голубя клевать ключ. В конце концов, если животное может формировать себя, зачем использовать трудоемкий процесс формирования? Автоформирование также противоречит принципу подкрепления Скиннера. Во время автоформирования еда поступает независимо от поведения животного. Если имело место подкрепление, случайное поведение должно возрасти, потому что оно должно было быть вознаграждено случайной пищей. Тем не менее, у голубей надежно развивается клевание клавиш, даже если такое поведение никогда не было вознаграждено.

Но наиболее четкое свидетельство того, что автоматическое формирование находится под контролем Павлова, а не Скиннера, было найдено с использованием процедуры пропуска. В этой процедуре корм обычно назначается для доставки после каждого предъявления стимула (часто вспышки света), за исключением случаев, когда животное фактически выполняет завершающую реакцию на раздражитель, и в этом случае пища не предоставляется. Здесь, если бы поведение находилось под инструментальным контролем, животное перестало бы пытаться потреблять стимул, поскольку за этим поведением следует отказ от еды. Но животные упорствуют в попытках потребить условный раздражитель в течение тысяч попыток (явление, известное как негативное самообслуживание ), неспособные прекратить свою поведенческую реакцию на условный раздражитель, даже если он мешает им получить вознаграждение.

Смотрите также

Рекомендации

Внешние ссылки