Методологический анализ в психологии - Федор Василюк
Шрифт:
Интервал:
Закладка:
Можно, конечно, было бы попытаться спасти природную целостность реакции как единицы поведения, если предположить, что, несмотря на появление подкрепления, реакция еще продолжается вплоть до присущей ей «естественной границы» и только там останавливается. Но на такой шаг Скиннер пойти не может, ибо в этом случае придется признать, что кроме фундаментальной схемы оперантного обусловливания S0—R0=> S1—R1 | (где S0—R0 — оперантный рефлекс, скажем, нажатие на рычаг при виде рычага, S1— R1 — безусловный рефлекс, например, появление пищи и реакция ее поедания, а стрелкой обозначено отношение временной последовательности) существует такой вариант отношений между оперантной реакцией R0 и подкрепляющим стимулом S1, когда действие S1, начинается до того, как завершилась реакция R0. В проекции на временную ось эти отношения можно изобразить таким образом.
Схема Зв. Вариант временных отношений между оперантной реакцией R0 и подкреплением S1. На схеме S0—R0— оперантный рефлекс; S1— подкрепление (безусловный стимул); R1 — безусловная реакция
В этом случае совершенно непонятно, что же именно «подкрепляется» в начале действия стимула S1. Может быть, только тот фрагмент реакции (х — 1), который успел осуществиться до t0, начала действия подкрепления? А что подкрепляется в точке t1 — фрагмент ли реакции (1–2) или фрагмент (х — 2)? Словом, степень неопределенности становится так высока, что рассыпается краеугольный камень радикального бихевиоризма — фундаментальная схема оперантного обусловливания с ее основным принципом следования подкрепления за оперантной реакцией. Понятно, что это была бы слишком дорогая цена за указанную попытку спасти естественную целостность реакции как единицы поведения.
Итак, вопреки декларациям Скиннера, эксперимент оказывается не прибором, с помощью которого можно объективно наблюдать естественные части поведения, а ножницами, кроящими это поведение как заблагорассудится. И остается только слепо верить, что ножницы эксперимента по какому-то мистическому стечению обстоятельств точно попадают на швы между отдельными поведенческими актами.
Таким образом, и при рассмотрении временного аспекта обсуждаемой проблемы оказывается, что скиннеровский эксперимент не способен улавливать и идентифицировать теоретически постулируемые единицы поведения. Следует только оговориться, что эта неспособность метода строго очертить временные рамки реакции и решить таким образом стоящую перед ним теоретическую проблему в какой-то мере компенсируется достаточным для многих технических целей резким сужением зоны протекания оперантной реакции за счет сильного уменьшения интервалов между следующими друг за другом подкреплениями. Поэтому, кстати сказать, в качестве положительного подкрепления при дрессировке животных Скиннер рекомендует пользоваться не пищей, поскольку ее невозможно быстро предъявить и поскольку придется ждать окончания безусловного реагирования, а условным сигналом о пище (Skinner, 1951).
Резюмируем сказанное относительно понятия оперантного рефлекса. Зона протекания оперантной реакции ограничивается (но не очерчивается) двумя следующими друг за другом безусловными стимулами. Это другая формулировка того положения, что оперантная реакция осуществляется в условиях отсутствия безусловного стимула и вне данности животному связи его реакции с возможным появлением подкрепления. То есть оперантная реакция не осуществляется «ради чего-то», иначе говоря, не подлежит действию целевой причинности. Не происходит она и «потому что» появился некоторый стимул или возникла определенная потребность[56], то есть за ней не стоит и действующая (Мы пользуемся здесь учением Аристотеля о четырех видах причин — целевой, действующей, материальной и формальной (Аристотель, 1975).) причина. Материальный состав реакции (то есть те конкретные движения, которые вызвали наблюдаемое перемещение рычажка или другое действие) является неопределенным, а ее конкретная форма задается случайно, внешним образом — прерывающим реакцию появлением подкрепления, то есть о материальной и формальной причине оперантной реакции говорить тоже не приходится. Итак, понятие оперантной реакции ни в одном пункте не несет причинного характера. Оперантный рефлекс только вероятностен, это — поведенческая случайность.
3. Предмет исследования — оперантное приспособление организма к среде
В современной методологии уже стало общим местом, что предмет научного исследования — это не просто некоторая область действительности, а содержательная абстракция, выделяющая и описывающая определенный аспект этой области и задающая форму и характер ставящихся в ней проблем.
Чтобы определить предмет исследования радикального бихевиоризма, нужно описать, как в этой теории представляется основной механизм приспособления организма к среде и каково представление о самой этой среде.
Из предыдущего изложения ясно, что центральный вопрос, который стоит перед Скиннером, заключается в объяснении того, как из случайных движений, являющихся частями «тотального функционирования организма», из движений, которые содержательно никак не связаны с условиями среды, не меняются в процессе жизни особи и являются, так сказать, двигательными «выбросами» организма, как из этих движений возникает поведение, поддерживающее существование животного и внешне кажущееся «целесообразным».
Рассматривая понятие оперантного ответа, нетрудно заметить его сходство с биологическим понятием мутации. Оперантный ответ так же относится к онтогенезу, как мутация к филогенезу. И Скиннер действительно считает, что процесс индивидуального приспособления следует мыслить по образцу приспособления видового (а последнее — как процесс случайный, строго по Дарвину). Движение точно так же, как мутация, может случайно оказаться выгодным организму и будет в этом случае подкреплено, так что вероятность его осуществления в будущем поведении возрастет. Процесс индивидуального приспособления превращается в «естественный отбор» случайных движений организма (а процесс обучения, соответственно, в «искусственную селекцию» этих до и независимо от всякого обучения и тренировки сложившихся движений). В функциональном плане поведение в каждый данный момент будет представлять собой слепую пробу, которая при благоприятном стечении обстоятельств может случайно (хотя, быть может, и с очень большой вероятностью) оказаться целесообразной.
Какой должна быть среда животного, чтобы такой механизм приспособления был необходимым и достаточным для обеспечения его жизнедеятельности?
Условием, задающим необходимость, является такая организация среды, при которой отсутствует всякая данность животному в какой-либо чувственной форме жизненно важных для него объектов («подкреплений») и способа их возникновения в стимульном поле. А раз так, раз появление этих объектов всегда является непредвиденной случайностью — либо «чудесным даром», либо «иррациональной карой», появляющимися из некоторой трансцендентной реальности принципиально не прослеживаемым образом, то, естественно, животное вынуждено действовать «наобум», производить слепые пробы. Соль скоро приходится действовать в абсолютной темное, когда невозможно наблюдать за тем, как именно твои действия приводят к хорошим или плохим результатам, ничего другого не остается, как превратиться в суеверное существо[57], действующее не на основе знания и опыта, а на основе случайных совпадений.
Что касается достаточности «случайного» приспособления, то она могла бы быть гарантирована двумя условиями. Первое из них состоит в том, что среда должна обладать конечным набором ситуаций, а животное — равнопорядковым этому набору репертуаром движений. Второе — в том, что среда должна обладать стабильностью, хотя бы временной. Тогда во время очередного стабильного периода перераспределением вероятностей входящих в репертуар организма оперантных рефлексов можно было бы достичь приспособления к среде.
И последнее: «Чтобы быть эффективным, подкрепление должно предлагаться почти одновременно с желаемым поведением» (Skinner, 1951, р. 413). Если мы наблюдаем некоторое развертывающееся движение, то, по логике Скиннера, преимущественно подкрепляется завершающая его часть, непосредственно предшествующая появлению подкрепления; а значит, если это движение достаточно долговременно, то начальные его части не подкрепляются, и «возникающее в результате угасание аннулирует влияние подкрепления» (Skinner, 1938). Каким образом? Например, первая часть движения составляет необходимое звено для осуществления завершающей части, и тогда рост вероятности последней, который является следствием подкрепления, будет ограничен низкой вероятностью начального этапа.