Эпистемологическое допущение
Глава 5. Эпистемологическое допущение
Мы видели, сколь трудно определить, что такое "ментальный"- мыслительный - уровень функционирования. Чем бы сознание ни являлось, совсем не обязательно, чтобы оно действовало подобно ЭВМ, Утверждение специалистов в области моделирования процессов познания, согласно которому разум можно понимать как процесс переработки информации по эвристическим правилам, практически оказывается непонятным. Машинная модель совершенно бесполезна при попытке объяснить, что происходит с людьми в процессе мышления и восприятия. А тот факт, что люди обладают способностью мыслить и воспринимать, вовсе не дает оснований для оптимизма тем исследователям, которые пытаются воспроизвести человеческое поведение с помощью цифровой вычислительной машины.
Однако для оптимизма еще сохраняется одно основание: хотя действия человека не могут быть объяснены на основе предположения, что люди на самом деле следуют эвристическим правилам, неосознанно выполняя некоторую последовательность операций, разумное поведение может быть тем не менее формализовано в терминах такого рода правил и благодаря этому воспроизведено на машине*. В этом состоит эпистемологическое допущение.
Рассмотрим, например, движение планет. Обращаясь вокруг Солнца, они не решают дифференциальных уравнений. Они вооб-
* Под "воспроизведением" понимается реализация существенных характеристик рассматриваемого поведения. Имеется в виду не абсолютно полное копирование, а отношение, подобное тому, которое имеется между Эйфелевой башней, которая сделана из стали, и ее фотографией. Поскольку мы не можем рассчитывать на то, что вычислительные машины будут двигаться и проявлять формы человеческого поведения в обычном смысле слова, нас не будет интересовать использование формальной теории некоторой деятельности, являющейся точной копией этой деятельности. Реализацию существенных характеристик некоторых действий, без имитации действий ао всех деталях, можно было бы, вообще говоря, назвать "моделированием". Так, на ЭВМ можно моделировать выборы, не предполагая фактического голосования. Однако термин "моделирование" уже "узурпирован" теми исследователями, которые занимаются построением моделей когнитивных процессов и включают в эти модели не только главные черты поведения, но и те шаги, которые имеют место при его осуществлении.
143
ще не следуют каким-либо правилам, однако их поведение подчиняется определенным законам, для понимания которых используется формальный аппарат - в данном случае дифферентциальные уравнения,- выражающий это поведение как движение в соответствии с некоторым правилом. Или другой пример; велосипедист для сохранения равновесия то и дело перемещает центр тяжести своего тела, предотвращая тем самым падение. Рациональное содержание его движений можно выразить правилом: ехать так, чтобы кривизна траектории его пути была все время обратно пропорциональна квадрату скорости*. Велосипедист, разумеется, не следует этому правилу сознательно, и нет оснований предполагать, что он следует ему бессознательно. Тем не менее такая формализация помогает нам выразить или понять его компетенцию, то есть его способность реализовать данное поведение- Это, однако, не является способом объяснения его действий. Формализация говорит лишь о том, что значит хорошо ездить на велосипеде, и ничего о том, что происходит в моз-
* Пример с велосипедистом заимствован мною из книги М. Пеляного "Познание и личность" (М. Рolаnyi, Personal Knowledge, London. R. & К. Paul, p. 49). Анализ этого примера, проводимый Поляным, заслуживает того, чтобы привести его полностью: "После моих бесед с физиками, инженерами и изготовителями велосипедов я пришел к выводу, что принцип, в соответствии с которым велосипедист удерживает равновесие, мало кому известен. Правило, которому следует велосипедист, заключается в следующем: когда он начинает падать на правую сторону, он поворачивает руль вправо с тем, чтобы траектория велосипеда также отклонилась вправо. В результате возникает центробежная сила, толкающая велосипедиста влево и уравновешивающая силу тяжести, действующую справа. Этот маневр быстро приводит к тому, что велосипедист начинает падать влево; противодействуя этому, он поворачивает руль влево; подобным образом он и едет, продолжительное время сохраняя равновесие. Нетрудно показать, что для данного угла наклона кривизна траектории обратно пропорциональна квадрату скорости, с которой движется велосипедист.
Но можно ли на основании этого утверждать, что мы доподлинно знаем, как ездить на велосипеде? Совершенно очевидно, что невозможно ехать так, чтобы угол поворота руля велосипеда все время находился в соответствии с отношением угла наклона к квадрату скорости, с которой вы движетесь; даже если вы будете выполнять это правило, то все равно свалитесь с велосипеда, поскольку существует еще масса других факторов, которые следует учитывать при практической везде, но на которые не распространяется данное правило*.
В этом примере содержится важная догадка - догадка о том, что формализм не может быть основой действий. Однако Поляный несколько смазывает ее значение, ссылаясь на "скрытые правила" (р. 53). Эта ссылка показывает, что Поляный, как и Платон, не делает различия между вы полнение некоторого действия и компетенцией, между пониманием чего-то человеком и научным объяснением, между правилом, которому следуют, и правилом, которое используется для описания происходящего. Именно это смешение понятий и поре не дает оптимизм, свойственный исследователям в области моделирования процессов познания,
У самого Поляного есть свои возражения против упомянутого только что направления исследований. Он считает, что "в некотором существенном
144
гу или разуме велосипедиста в процессе выполнения им этой задачи.
Таким образом, существует почти неуловимое, но очень важное различие между психологическим и эпистемологическим допущением. И то и другое основано на платоновском представлении о понимании как о формализации. Однако сторонники психологического допущения (исследователи, занимающиеся моделированием процессов познания) считают, что правила, применяемые для формализации поведения, являются теми же самыми, что и правила, реализующие это поведение. Сторонники же эпистемологического допущения (исследователи в области "искусственного интеллекта") утверждают, что всякое непроизвольное поведение может быть формализовано в соответствии с некоторыми правилами, а также что эти правила, какими бы они ни были, могут затем использоваться вычислительной машиной для воспроизведения этого поведения.
Эпистемологическое допущение слабее и потому менее уязвимо, чем психологическое. Но тем не менее оно уязвимо. Сторонники эпистемологического допущения понимают, что их формальный аппарат, рассматриваемый в качестве теории компетенции, не обязан быть теорией человеческой деятельности. Однако их зависимость от платоновских идей не позволяет им осознать, что любая теория компетенции не может служить адекватной теорией также и машинного функционирования. Таким образом, эпистемологическое допущение основано на двух утверждениях: а) всякое непроизвольное поведение может быть формализовано и б) для воспроизведения интересующего нас поведения может быть использован формальный метод. В этой главе мы подвергнем критическому анализу утверждение а) на том основании, что оно неоправданно распространяет методологию естественных наук на область психических явлений, а также утверждение б), поскольку теория компетенции, как мы постараемся показать, не может быть теорией деятельности: в отличие от технологического применения законов физики, служащего для реализации соответствующих физических феноменов,теория компетенции, в которой не учитывается ни время, ни контекст, не может быть использова-
смысле слова мы действительно знаем соответствующие правила; однако при этом он утверждает, что "мы не можем обращаться с ними так, как будто они составляют неосознаваемое знание, поскольку главное э этом знании (более или менее подсознательном) - ориентация на некоторую конечную цель. Именно это качество "потенциально-вспомогательной" осознаваемости, качество функциональной формируемости действий машина не может имитировать, поскольку она всегда работает на одном-эдинственном уровне осознания" (из личной переписки), Это интересная промежуточная позиция; при этом, однако, автор оставляет открытым вопрос о том, насколько необходимо предполагать, что мы в каком бы то ни было смысле вообще следуем правилам при наличии этого второго типа осознания.
145
на для воспроизведения протекающего во времени поведения, требующегося в человеческой деятельности; в действительности теория человеческой деятельности вообще не может существовать. Если этот аргумент убедителен, то эпистемологическое допущение - в той форме, в какой его придерживаются сторонники "искусственного интеллекта", - как выясняется, несостоятельно и, если его правильно понимать, свидетельствует скорее против, чем в пользу возможности создания "искусственного интеллекта".
Утверждение а) - о том, что всякое непроизвольное поведение может быть формализовано,- не является аксиомой. Оно, скорее, выражает определенную концепцию "понимания", которая глубоко укоренилась в нашей культуре, но которая, возможно, окажется в конце концов ошибочной. Поэтому нам следует обратиться к эмпирическому материалу, который может быть использован для оправдания этой гипотезы. Мы выяснили, что никакие эмпирические доказательства, основанные на успехах в области "искусственного интеллекта", недостаточны, поскольку представляют собой просто интерпретацию, причем преувеличивающую значение таких скромных результатов, как рассмотренная нами работа Д. Боброва.
Поскольку эпистемологическое допущение находит поддержку в двух сферах успешной формализации - физике и лингвистике,- нам предстоит рассмотреть обе эти области. В физике действительно имеются формальные структуры, описывающие поведение (например, обращение планет вокруг Солнца), однако, как мы вскоре убедимся, такого рода формализм не пригоден для исследователей "искусственного интеллекта". В то же время мы увидим, что в лингвистике существует некоторый формальный аппарат, имеющий прямое отношение к искусственному интеллекту и свидетельствующий в пользу предположения, согласно которому всякое непроизвольное поведение может быть формализовано- Однако, как выяснится, этот аппарат, выражающий компетенцию говорящего, иными словами, то, что он способен осуществить, не позволяет применить ЭВМ для воспроизведения его действий, то есть того, что реализуется в его поведении.
I. Ошибочный аргумент, основанный на успехах физики
Оптимизм М.Минского - то есть его уверенность в том, что всякое непроизвольное поведение поддается формализации и благодаря этому может быть воспроизведено на цифровой вычислительной машине,- является типичным примером эпистемологического допущения. Именно эта уверенность позволяет Минскому с такой твердостью заявлять, что нет оснований
146
полагать, будто "машины подвержены каким-либо ограничениям, не распространяющимся на человека"*. Рассмотрим доводы, приводимые в поддержку этого утверждения. Для начала, однако, выясним, что сторонник формальных методов имеет в виду под машиной.
Цифровая вычислительная машина - это машина, которая работает в соответствии с теми критериями, которые Платон некогда выдвигал для понимания всякого упорядоченного поведения. Эта машина, согласно определению М.Минского, которое в свою очередь основано на определении А.Тьюринга, есть "подчиняющийся правилам механизм". У Тьюринга мы читаем: "Предполагается, что эти машины [придерживаются]... определенных, раз навсегда заданных правил... Обязанность контролирующего устройства - следить за тем, чтобы эти команды выполнялись безошибочно и в правильном порядке. Контролирующее устройство сконструировано так, что это происходит непременно"**. Следовательно, рассматриваемая машина является ограниченным, но весьма фундаментальным типом механизма. Она работает с четко определенными квантами данных - битами информации- в соответствии со строгими правилами, которые применяются к этим данным однозначно. Утверждается, что машина такого типа - машина Тьюринга, выражающая сущность ЦВМ, может, в принципе, делать все то, что может делать человек, то есть разделяет, в принципе, только те ограничения, которым подвластен и последний.
М.Минский рассматривает встречное "антиформалистское" утверждение, согласно которому существуют "процессы, которые, будучи каким-либо способом полностью определены, в то же время не могут быть описаны вообще"***. Вместо того чтобы прямо ответить на это возражение, он ссылается на "блестящую", по его мнению, статью А.Тьюринга, аргументы которой содержат "убедительное опровержение многих из таких возражений"****. На деле же Тьюринг принимает подобные возражении, обосновывая это следующим образом: "Невозможно выработать правила, предписывающие, что именно должен делать человек во всех случаях, при всех возможных обстоятельствах"*****. По-видимому, здесь Тьюринг обобщает довод Л.Витгенштейна о том, что невозможно описать нормативные правила, которые заранее предписывают правильное использование слова во всех ситуациях. "Опровержение" Тьюринга состоит в том, что он проводит различие между "правилами действия" и "законами поведения", а затем утвер-
* М. Минский. Вычисления и автоматы. М., 1971, с. 18.
** А.Тьюринг. Могут ли машины мыслить? с. 23-24.
*** М. Минский. Вычисления и автоматы, М., 1971, с. 134.
**** М. Минский. Цит. соч., с. 137.
***** А. Тьюринг. Цит. соч., с. 46.
147
ждает, что "в отсутствии законов поведения, которые в своей совокупности полностью определяли бы нашу жизнь, нельзя убедиться столь же легко, как в отсутствии законченного списка правил действия"*.
В качестве ответа на утверждение Л.Витгенштейна это можно принять. А.Тьюринг, в сущности, утверждает, что, хотя мы не можем сформулировать нормативные правила для правильного применения отдельного предиката, это еще не доказывает, что мы не можем сформулировать правила, которые описывают, как в действительности отдельный индивидуум применяет такой предикат. Другими словам, хотя Тьюринг готов допустить, что в принципе невозможно представить набор правил, описывающих, что должен делать человек в каждом конкретном случае, он тем не менее считает, что в принципе существует возможность открытия системы правил, описывающих, что человек мог бы делать в каждом таком случае. Но почему это предположение кажется столь самоочевидным, что бремя доказательства ложится на тех, кто подвергает его сомнению? Почему мы должны убеждаться в отсутствии "законченного списка правил действия", а не в его наличии? Здесь мы опять сталкиваемся с эпистемологическим допущением- Попытаемся выделить тот фактор, который придает этому положению предполагаемую априорную правдоподобность.
Начнем с того, что понятие " законы поведения" допускает двоякое толкование. В том смысле, в каком закономерность означает упорядоченность, человеческое поведение, безусловно, закономерно. Но предполагать, что интересующие нас законы поведения могут быть воплощены в программах для ЭВМ или в каком-либо эквивалентном формализме,- совсем иное и гораздо более серьезное утверждение, которое нуждается в дальнейшем обосновании.
Сторонники "искусственного интеллекта" игнорируют этот вопрос, исходя из установки, согласно которой любое описание поведения может быть формализовано и затем представлено в виде программы для ЭВМ. Они предполагают, что-по крайней мере в принципе - поведение человека можно представить с помощью набора независимых утверждений, описывающих "входы" организма и соотнесенных с утверждениями, описывающими его "выходы". Наиболее характерный пример такого рода утверждения можно заимствовать у Дж.Калбертсона, начинающего с заявления о том, что по крайней мере в теории можно построить робот, используя лишь триггеры, и заканчивающего заявлением, что из этого следует возможность воспроизведения всего человеческого поведения в целом:
* Там же, с. 47,
148
"Используя подходящие рецепторы и эффекторы, мы можем связать их вместе посредством центральных клеток. Если бы мы могли располагать достаточным количеством центральных клеток, если бы они были достаточно малы и каждая из них имела бы достаточное число концевых пластинок, если бы каждый синапс можно было снабдить пластинками в достаточном числе, если бы, наконец, мы располагали временем, достаточным, чтобы собрать все это вместе, то мы могли бы построить роботы, действующие по любой заданной программе, то есть роботы, ведущие себя при любом состоянии внешней среды так, как желательно нам... Было бы нетрудно построить робот, ведущий себя в точности, как Джон Джонс или Генри Смит, или же робот, имеющий любое желаемое усовершенствование свойств поведения Джонса или Смита"*.
Далее автор выражается еще более определенно:
"В силу того что принципиально они могут выполнять любую заданную программу, полные роботы могут совершать предписанные им действия в любых предписанных условиях: искусно разрешать проблемы, сочинять симфонии, создавать произведения искусства, литературы и инженерного дела, преследовать любые цели"**.
Но, как мы видели в гл. 4, неизвестно, какими предположительно должны быть эти "входы" и "выходы" в применении к человеку***. Согласно Дж. Калбертсону, мозг функционирует на основе установления связей между изолированными квантами данных; это утверждение в свою очередь основано на предположении, что нейроны работают как переключатели. Поскольку в гл. 3 мы видели, что это, по-видимому, не так и что, более того, нет ни одного аргумента в пользу данного предположения, в то время как имеется несколько аргументов против, мы вправе усомниться в том, что "входы" и "выходы" у человека существуют изолированно, а их соотношения могут быть формализованы. Предположение Калбертсона остается предположением и более ничем; поэтому оно никоим образом не может подтвердить его заключений.
Убежденный сторонник формальных методов имеет все же еще один ход. Используя неоднозначность понятия "законы поведения", он может трактовать поведение не как осмысленное человеческое действие, а просто как физическое движение человеческого организма, В таком случае, поскольку тело человека является частью физического мира, а, как мы видели, объекты физического мира подчиняются законам, которые могут быть выражены с помощью поддающихся программированию формализованных построений, то сторонник формального подхода может
* Дж. Калбертсон. Некоторые неэкономичные роботы. - В кн.; Автоматы, под ред. К.Шеннона и Дж.Маккарти, М, 1956, с. 142.
** Там же, с. 160.
*** Ответ на вопрос о том, почему нельзя найти таких допускающих выделения входов и выходов, можно будет дать только после того, как мы опишем отношения между человеком и окружающим его миром. См. гл. 8, особенно с. 235-236.
149
настаивать на том, что законы человеческого поведения также подчиняются предложенному им формальному описанию. Для большей конкретности возьмем нервную систему: она подчиняется законам физики и химии, с чем мы уже имели случай согласиться. Тогда мы так или иначе могли бы воспроизвести поведение нервной системы с помощью некоторого физического устройства. Последнее не обязательно должно быть цифровой машиной или реализацией функции "входа-выхода", прямо описывающей поведение человека; оно может, к примеру, иметь форму "аналоговой вычислительной машины", использующей ионные растворы, электрические свойства которых меняются в зависимости от степени локальной насыщенности. В этом случае, как мы указывали в гл, 4, зная сочетание растворов в этом устройстве, мы могли, хотя бы в принципе, написать физико-химические уравнения, описывающие его "влажные" компоненты, и решить эти уравнения на совершенно "сухой" цифровой вычислительной машине. Следовательно, при наличии достаточного количества времени и памяти на ЦВМ можно промоделировать любую вычислительную машину, даже такого специального вида, как аналоговая. Вообще говоря, приняв такие фундаментальные допущения, как положение о том, что нервная система есть часть физического мира и что любой физический процесс может быть описан с помощью некоторого математического формализма (который в свою очередь можно запрограммировать на ЦВМ), можно прийти к весьма сильному утверждению, согласно которому поведение, являющееся результатом "переработки информации" у человека независимо от того, можно или нет его непосредственно формализовать, опосредованно всегда может быть воспроизведено на некоторой цифровой вычислительной машине.
Это утверждение может вполне объяснить уверенность сторонников формальных методов, но что фактически объясняет или доказывает та фундаментальная истина, что любая форма "переработки информации" (даже та, которую на практике можно осуществить только на "аналоговой вычислительной машине") может быть в принципе моделируема на ЦВМ? Как мы видели, она не оправдывает претензий "менталистов", согласно которым, хотя человек в процессе переработки информации не осознает используемые им операции дискретного характера, он тем не менее бессознательно следует некоторому набору правил. Оправдывает ли это заключение эпистемологическое допущение о том, что всякое непроизвольное поведение может быть формализовано?
Необходимо четко определить, что следует считать процессом переработки информации на вычислительной машине. Цифровая машина, решая уравнения, которые описывают аналоговое
150
устройство по переработке информации, и моделируя таким образом реализуемую ими функцию, тем самым еще не моделирует соответствующий "информационный процесс". Последний касается информации, перерабатываемой моделируемым аналогом, а она совершенно отлична от информации, касающейся физических или химических свойств аналога. Следовательно, приведенное выше сильное утверждение, гласящее, что любой вид информации может быть передан цифровой машине для переработки, вводит в заблуждение. Не вызывает сомнений только тот факт, что для любого заданного вида информации можно в принципе составить программу для ЦВМ, имитирующую устройство, которое может обрабатывать указанную информацию.
Таким образом, поведение человека, понимаемое как движение- как поступление "входных" и выдача "выходных" физических сигналов,- является, по-видимому, вполне закономерным в том смысле, какой предполагают сторонники формальных методов. Однако это никоим образом не обосновывает их допущения в том виде, в каком оно представлено у М.Минского и А.Тьюринга. Ибо когда Минский и Тьюринг заявляют, что человек есть машина Тьюринга, они не имеют права подразумевать под этим, что человек есть физическая система. В противном случае можно было бы сказать, что и самолеты, и корабли - все это тоже машины Тьюринга. Их поведение также можно описать с помощью законов, представляемых в математической форме,- законов, устанавливающих соответствие между энергетическими "входами" и "выходами",- и воспроизвести, по крайней мере в принципе, на ЦВМ с любой степенью точности. Несомненно, когда М.Минский и А.Тьюринг заявляют, что человека можно рассматривать как машину Тьюринга, они, скорее всего, имеют в виду, что ЦВМ может воспроизводить человеческое поведение не путем решения физических уравнений, а путем процесса переработки данных, полученных из окружающей среды, посредством логических операций, которые можно свести к операциям сравнения, классификации и булевым операциям. Как заметил Минский:
"Умственные процессы похожи на... тот вид процессов, который мы встречаем в программах вычислительных машин: произвольные ассоциации символов, древообразные схемы распределения памяти, условные переходы и т. п."*.
Исследователи в области "искусственного интеллекта" утверждают, что этот ментальный уровень "переработки информации" можно описать с помощью формальных цифровых моделей. Все работы в этой области нацелены на использование логических операций для манипулирования данными, получен-
* М.Мinsky. Matter, Mind, and Models,- In: M.Minsky.(ed). Semantic Information Processing, p, 429.
151
ными непосредственно из окружающего мира, но не для решения уравнений физики, описывающих физические объекты. Аргументы из области физики привлекаются лишь для того, чтобы показать, что энергетическое состояние "входов" и нейрофизиологические процессы, направленные на их преобразование, могут в принципе быть описаны в цифровой форме.
Никто не пробовал - и не пытается пробовать - использовать законы физики для детального вычисления движения человеческого тела. Это и физически вряд ли возможно, поскольку, как показал Х.Дж. Бремерман:
"Ни одна система переработки данных, будь то искусственная или естественная , не может переработать более (20x10*') бит/сек на грамм своей массы"*.
Далее Бремерман продолжает:
" В году 2х 107 секунд. Возраст Земли равен почти 109 лет, ее масса меньше чем 6 х 1027 граммов. Следовательно, даже вычислительная машина размером с Землю не могла бы переработать более 103 бит в течение времени, равного возрасту Земли. [Даже без учета того, между прочим, факта, что, чем больше вычислительная машина, тем в большей степени скорость света становится фактором, замедляющим ее работу. - Х.Д. Доказательство теорем и решение задач... ведет к экспоненциальному росту дерева задач. Если наше предположение верно, то получается, что трудности, которые в настоящее время стоят на пути исследований в области распознавания образов и доказательства теорем, не будут разрешены и тогда, когда на грядущих сверхмощных вычислительных машинах будет достигнута предельная скорость обработки данных"**.
Если эти расчеты верны, то любая попытка моделирования мозга как физической системы невозможна в собственном смысле слова; необходимые для этого громадные вычисления могут оказаться неосуществимыми в силу самих законов физики и теории информации, требующих таких вычислений.
По-видимому, это смешение законов физики с правилами переработки информации служит для исследователей проблем "искусственного интеллекта", начиная с А.Тьюринга и кончая М.Минским, своего рода прибежищем; оно позволяет им верить в возможность формализации человеческого поведения; что же касается бремени доказательства, то оно, по их мнению, ложится на тех, кто утверждает, что существуют "процессы, которые, будучи каким-либо способом полностью определены, в то же время не могут быть описаны вообще"***.
Но если сомнительность аргументации, основанной на оперировании понятиями "законы физики" и "правила переработки информации", установлена, как еще может обосновываться тезис
* H.J.Bremermann. Optimization Through Evolution and Recombination. In: Self-Organizing Systems, Washington. 1962, p. 1. ** Ibid., p. 2. *** M. Mинский. Вычисление и автоматы, с. 134.
152
о том, что человеческое поведение на уровне переработки информации", как выражаются специалисты в области "искусственного интеллекта", можно описать с помощью строгих правил?
II. Ошибочный аргумент, основанный на успехах современной лингвистики
Если ни один аргумент, базирующийся на материале из области физических наук, не может быть привлечен для выяснения вопроса о перспективах работ в области "искусственного интеллекта" (поскольку направление "искусственного интеллекта" имеет задачей формализацию человеческого поведении, а не физического движения), то остается единственная надежда-вернуться в сферу самих наук о поведении. Галилей смог заложить фундамент современной физики потому, что, абстрагировавшись от ряда представлений аристотелевой физики о свойствах и отношениях тел, обнаружил, что для описания движения материальных объектов достаточно оставшихся математических соотношений. Чтобы оптимизм сторонников "искусственного интеллекта" получил обоснование, необходим Галилей исследования разума, который, применив надлежащие абстракции, открыл бы формальный аппарат, достаточный для описания человеческого поведения.
Дж. Маккарти следующим образом формулирует это стремление связать физику с науками о поведении:
"Хотя для выражения наиболее важных областей математики были созданы формальные теории, а в формализации отдельных эмпирических наук был достигнут некоторый прогресс, в настоящее время не существует формальной теории, позволяющей выразить тот тип анализа в терминах "средств и целей", который используется в повседневной жизни... Наш подход к проблеме "искусственного интеллекта" требует формальной теории"
Недавно такой крупный прорыв - в направлении формализации лингвистики - был осуществлен Н. Хомским и другими представителями трансформационной лингвистики. Они нашли, что если отвлечься от использования языка человеком - от употребления тех или иных предложений в различных конкретных ситуациях,- то можно формализовать все остальное в языке, то есть человеческую способность к узнаванию грамматически правильных и отбрасыванию грамматически неправильных предложений. Иными словами, они считают, что создаваемая ими формальная теория в состоянии охватить многое из того, что относится к
* J. McCarthy. Programs with Common Sense.-ln: M,Minsky (ed.). Semantic Information Processing, p. 410,
153
лингвистической компетенции))*. Этот успех воодушевил тех. исследователей в области "искусственного интеллекта", которые утверждают, что человеческое поведение может быть формализо-
* Н.Хомский имеет обыкновение опредять "лингвистическую компетенцию" и "использование языка" таким образом, чтобы обеспечить это разделение, а связь между теорией компетенции и теорией употребления языка превратить в чисто эмпирический вопрос. Например он говорит: "...чтобы избежать одного постоянного недоразумения, вероятно, стоит повторить, что порождающая грамматика не является моделью для говорящего или для слушающего. Она стремится охарактеризовать в наиболее нейтральных терминах знание языка, которое дает основу для действительного использования языка говорящим-слушающим. Когда мы говорим о грамматике, что она порождает предложение с определенным структурным описанием, мы просто имеем в виду, что грамматика приписывает предложению это структурное описание" (Н.Хомский. Аспекты теории синтаксиса67- М., 1972, с. 13-14) (курсив мой. - Х.Д) .
Однако это прямолинейное определение не отвечает полностью на вопрос, в чем, по мнению Н.Хомского, заключается различие между понятиями языковых компетенции и употребления, которые он вводит. Если компетенцией считать знание какого-то языка, то вопрос о роли правил, описывающих компетенцию, и об их участии в употреблении языка оказывается вопросом эмпирическим. Но в ряде случаев Хомский считает компетенцию необходимой для употребления языка; эта мысль имеется уже в самом определении "компетенции", "употребления" языка и их отношений: "Под "порождающей грамматикой" я имею в виду описание той невыраженной компетенции говорящего-слушающего, которая лежит в основе фактического употребления им языка, как в процессе речи, так и при ее восприятии (понимании). Порождающая грамматика по своему замыслу должна служить установлению соответствий между фонетическими и семантическими представлениями - их "спариванию" в некоторой бесконечной области. Таким образом, порождающая грамматика представляет собой определенную гипотезу, объясняющую, каким образом говорящий-слушающий интерпретирует те или иные речевые акты-высказывания, отвлекаясь от многих факторов, которые, взаимодействуя с не находящей выражения компетенцией, определяют фактическое использование, употребление языка" (N. Сhоmsky. Cartesian Linguistics. New York, Harper and Row, 1966, p. 75) (курсив мой.- Х.Д.) -Или возьмем следующее замечание: "Мы должны абстрагировать для отдельного и независимого изучения определенную систему интеллектуальных способностей, систему знаний и убеждений, которая развивается в раннем детстве и во взаимодействии с многими другими факторами определяет те виды поведения, которые мы наблюдаем; если ввести формальный термин, то можно сказать, что мы должны изолировать и изучать систему языковой компетенции, которая лежит в основе поведения, но которая не реализуется в поведении каким-либо прямым или простым образом" (Н.Хомский. Язык и мышление, с. 15 (курсив мой. - Х.Д.) -Когда Хомский говорит о "не выраженой компетенции", которая "лежит в основе фактического употребления" языка и которая "определяет... виды поведения", мы сталкиваемся с той же самой тенденцией, что и у М.Поляного, который полагает, что правило, описывающее, как он считает, "компетенцию велосипедной езды", используется в самом процессе езды на велосипеде. При таком прочтении роль формальных методов, выражающих "компетенцию", перестает быть нейтральной. Сколь бы строгим ни был формализм, он обязательно должен использоваться в языковом поведении.
154
вано без сведения его к физическому уровню, ибо он говорит в пользу по крайней мере первой части эпистемологической гипотезы. В самом деле, определенная область упорядоченного поведения, на первый взгляд не подчиняющаяся никаким правилам, была описана с помощью сложных правил такого типа, что они могут быть непосредственно запрограммированы для передачи их цифровой вычислительной машине ("непосредственно", то есть минуя описание колебаний голосовых связок говорящего или физико-химических процессов, протекающих в его мозгу).
Но такая формализация подтверждает лишь половину эпистемологического допущения. Лингвистическая компетенция отно-
Но тем не менее если различие "компетенции" и "использования" необходимо приводит к отделению формальной теории от теории психологической, то отношения между теорией компетенции и теорией использования* языка не могут строиться на основе определения; другими словами, если в определение компетенции включен в качестве ее характеристики тот факт, что она лежит в основе использования языка, то недостаточно считать компетенцию просто формальной теорией, которая служит "установлению соответствий между фонетическими и семантическими представлениями - их "спариванию" в некоторой бесконечной области"» Ибо под компетенцией в этом случае понималась бы некая идеализированная психологическая теория, описывающая процесс реализации языка, а различение лингвистической компетенции и употребление языка свидетельствовало бы только о признании того факта, что существуют и другие факторы, такие, как утомление или обучение, которые в данном случае не рассматриваются.
Иногда кажется, что Хомский придерживается именно такой точки зрения: "Мы интерпретируем то, что говорится в нашем присутствии, не только с помощью лингвистических принципов, определяющих фонетические и семантические свойства высказывания. Фундаментальную роль в определении того, как произносятся, идентифицируются и понимаются высказывания, играют экстралингвистические представления о данном говорящем и о той ситуации, в которой он находится. Использование языка, кроме того, подчиняется принципам концептуальной структуры (например, ограничениям, которым подчинена память), -принципам, которые, строго говоря, не могут быть отнесены к языку как таковому.
Следовательно, для того, чтобы изучить язык, мы должны попытаться выделить ту разнородную группу факторов, которая взаимодействует с лежащей в ее основе компетенцией, в результате чего окажется возможным определить и то, что относится к фактическому использованию языка; в строгом смысле слова термин "компетенция" означает способность идеализированного говорящего-слушающего ассоциировать звуки и значения в точном соответствии с правилами своего языка". (N.Chomsky. The Formal Nature of Language.-In: E.H. Lenneberg. (ed). Biological Foundations of Language, New York-London-Sydney, 1967, p. 398; (курсив мой.- Х.Д.).
Какова же в таком случае связь между лингвистической компетенцией и употреблением языка? Что, если вдруг психолингвисты обнаружат, что произнесение высказывания происходит вообще без участия тех правил, которые предписывает лингвистический формализм Хомского? По-видимому, именно в пользу этой точки зрения свидетельствуют последние результаты, полученные в психолингвистике [ср. следующие слова Т.Бивера: "В поведенческих процессах используются лингвистически определенные внутренние и внешние структуры, но грамматические процессы,
155
сится к другой области исследования,, нежели та, которую сторонники "искусственного интеллекта" стремятся формализовать. Если машины должны общаться с человеком на естественном языке, то их программы должны содержать не только правила грамматики, но и правила, относящиеся к "лингвистическому использованию языка". Другими словами, те факторы, которые были опущены при формулировке лингвистической теории - тот, например, факт, что люди умеют применять язык,- и должны быть формализованы.
Вопрос об оправдании эпистемологического допущения сводится к следующей принципиальной проблеме: есть ли основание
связывающие эти структуры внутри некоторой грамматики, не находят зеркального отражения в поведении, не моделируются им непосредственно. Такой вывод служит опровержением любой из тех моделей распознавания речи, в которых делается попытка представить грамматические правила как такую составляющую процессов распознавания, которая поддается обособлению" (Т. Веver. The Cognitive Basis for Linguistic Structures, Preprint, p. 101, глава, из которой взята эта цитата, озаглавлена "Неразличение взрослыми лингвистической компетенции и использования языка") - Откажется ли теперь Хомский от своего формального подхода к описанию языка? По всей видимости, ему хотелось бы сохранить обе возможности: с одной стороны, сделать свое формальное описание компетенции независимым от психологии (в результате чего оно сохранило бы свою силу, какими бы ни оказались экспериментальные результаты), а с другой стороны, признать роль формализма в употреблении языка вопросом определения. Так, Хомский пишет: "Когда мы говорим, что предложение имеет определенный вывод по отношению к конкретной порождающей грамматике, мы ничего не говорим о том, как практически и эффективным образом действовать говорящему или слушающему, чтобы построить этот вывод. Эти вопросы относятся к теории использования языка - к теории употреблений". (Н.Хомский. Аспекты теории синтаксиса, с, 14; курсив мой- Х.Д,). Однако на с. 30 своей работы "Язык и мышление" он говорит: "Проблема определения характера таких грамматик и принципов, которые управляют ими, является типичной проблемой науки, возможно, очень трудной проблемой, но в принципе допускающей определенные ответы, которые истинны или ложны в зависимости от того, соответствуют они умственной реальности или нет" .
Мы сталкиваемся здесь с явной неопределенностью в вопросе о статусе формальных грамматических структур, характеризующих интуитивное узнавание говорящим грамматической правильности, В основе этой неопределенности лежит весьма сильная конъюнкция - объединение двух допущений:платоновского, гласящего,что формализм, который дает возможность понять поведение, используется и при построении этого поведения; и кантовского, согласно которому всякое упорядоченное поведение подчиняется некоторым правилам (оба допущения нашли подкрепление в идее создания соответствующих программ для вычислительных машин). Н.Хомский не подвергает сомнению ни допущение, согласно которому "человек, который усвоил знание языка, хранит в себе систему правил" (Н.Хомский. Язык и мышление, с. 37), ни утверждение о том, что эти правила функционируют как "механизм" для "порождения" предложений. Если допустить, что оба эти утверждения справедливы, то мы придем к картезианской теории врожденных идей Хомского - теории, которая даже ему самому кажется не очень приемлемой: "Нелегко согласиться с точкой
156
полагать, что может существовать некоторая формальная теория "употребления" языка? Имеется два рода причин считать, что подобное распространение лингвистической теории невозможно. Во-первых, несостоятельна попытка опереться на принцип (к рассмотрению которого мы обратимся в следующей главе), гласящий; коль скоро существует теория употребления языка, то должна существовать и теория человеческого познания в целом; ибо такая теория неосуществима. Во-вторых, не всякое языковое поведение подчиняется правилам; мы признаем некоторые языковые обороты необычными - нарушающими правила,- но это не
зрения, в соответствии с которой уже ребенок в состоянии построить чрезвычайно сложный механизм, порождающий множество предложений, лишь некоторые из которых ребенок слышал раньше, а взрослый человек умеет мгновенно определять, может ли (а если может, то как) этот механизм породить данное конкретное языковое выражение; при этом следует принимать во внимание, что механизм, о котором идет речь, обладает многими свойствами, характерными для абстрактной дедуктивной теории. Тем не менее, по-видимому, такое описание употребления языка говорящими -тем, к кому обращена речь, и тем, кто воспринимает ее со стороны,- довольно близко к истине" (N. Chomsky. A Review of B.F. Skinner's "Verbal Behavior"-In.: The Structure of Language, Englewood Cliffs, N J. Prentice-Hall, 1964, p. 577).
Эта точка зрения при всем своем неправдоподобии, кажется приемлемой благодаря существованию вычислительных машин: "В принципе не составит трудности заложить в программу вычислительной машины схему, которая жестко ограничивает вид порождающей грамматики или процедуру оценки для грамматик данного вида, или методику определения того, совместимы ли фиксированные данные с грамматикой данного вида, или определенную подструктуру элементов (типа различных признаков), правил и принципов и так далее - коротко говоря, универсальную грамматику того типа, что была предложена в последние годы" (Н.Хомский, Язык и мышление, с. 101) ,
Далее Хомский переходит к установлению связей между этой машинной моделью и классической традицией: "По причинам, уже упоминавшимся мною, я считаю, что эти предложения вполне могут рассматриваться как дальнейшее развитие классической рационалистической доктрины, как разработка некоторых из ее главных идей относительно языка и мышления" (там же) .
В заключение Н.Хомский пишет: "Проведя те виды исследования, которые представляются сейчас осуществимыми, и концентрируя внимание на определенных проблемах, которые сейчас доступны для изучения, мы, вероятно, можем расшифровать с некоторой степенью подробности те сложные и абстрактные вычисления, которые определяют, отчасти, сущность результатов перцепции и характер знания, которое мы можем усвоить, - весьма специфические способы интерпретации явлений, которые, в большой степени, находятся за пределами нашего сознания и контроля и которые, вероятно, являются уникальными свойствами человека" ("Язык и мышление", с. 116). В такого рода неокартезианстве находит свое полное выражение традиционное философское допущение: отличительный атрибут человека можно видеть в том, что он представляет собой чрезвычайно сложно организованную вычислительную машину. Пожалуй, со времен Т.Гоббса, который (несколько преждевременно) вывел это заключение из ньютоновской физики, эта идея впервые вновь появилась на сцене.
157
мешает нам понимать их смысл. К рассмотрению этого дескриптивного" возражения мы сейчас и перейдем.
Во многих случаях носитель языка признает то или иное словоупотребление необычным, но тем не менее он в состоянии его понять. Например, фраза "Мысль еще не дошла до бумаги"68 пена нам в ситуации, когда речь идет об обещании, данном каким-то автором; но машина, достигнув этого момента, не сможет работать дальше, поскольку ее правила "допускают до бумаги" только такие объекты, как знаки, нанесенные чернилами, оттиски типографских букв, и т. п. Кроме того, поскольку мысль не является физическим объектом, машина сможет только отвергнуть то, что она может "дойти до бумаги" или в лучшем случае дать упомянутому обороту произвольную интерпретацию. Понимание этой же фразы слушателем-человеком далеко не произвольно. Зная из опыта, сколь далеки подчас бывают намерения людей от их осуществления, зная также, сколь многое требуется для написания книги, выслушавший эту фразу человек уловит ее основной смысл, а тот, кто ее произнес, по реакции слушающего поймет, что его поняли. Значит ли это, что в актах понимания или использования необычных оборотов речи человек исходит из определенного правила- в данном случае из правила, позволяющего соответствующим образом модифицировать значение выражения "дойти до"?,Скорее всего, не значит, поскольку данный оборот признается "необычным", по-видимому, даже теми, кто его произносит.
Этот пример подводит нас к основной трудности, стоящей на пути моделирования поведения. Акты поведения, если оно запрограммировано, либо выполняются в строгом соответствии с правилами, либо носят случайный характер. Поэтому, столкнувшись с новым оборотом, машина должна либо поступить с ним как с понятным случаем, подпадающим под правила, либо сделать шаг наугад. Человек как носитель языка чувствует, что у него есть третья возможность. Он может оценить оборот как необычный, как случай, не подпадающий под правила, и тем не менее осмыслить оборот - придать ему то или иное значение в контексте человеческой жизни, не следуя каким-либо жестким правилам, но и не приписывая ему произвольного значения.
Откровенное нарушение правил использования языка особенно наглядно демонстрирует эту способность. Люди, как правило, понимают друг друга, даже если один из говорящих допускает грамматическую или семантическую ошибку. Выражение может быть не только вне правил, но фактически запрещаться ими,- и тем не менее подобное нарушение часто проходит незамеченным, поскольку соответствующий оборот легко понять.
Человек, сталкиваясь с необычными выражениями и явными ошибками, постепенно адаптируется к ним, осмысляя те измене-
158
ния в понимании языка, которые они вносят. Для машины же есть только две возможности. Она может начать с ошибки, а затем, когда ее научат, пересмотреть правила с тем, чтобы в них был предусмотрен новый оборот. Другой путь состоит в том, чтобы заранее вложить в машину все нужные правила - даже правила о том, как нарушать правила и все-таки сохранять способность осмысления языковых выражений. Принять первый вариант - первоначальная ошибка, а затем ее исправление - значит допустить в принципе, а не только на практике, что машина обречена следовать за человеком, т. е. что она не способна к достижению человеческого уровня. Второй же вариант - вариант, при котором правила, охватывающие все возможные случаи, должны быть либо прямо заложены в машину, либо вырабатываться в ней в ходе обучения (поскольку это единственный способ, позволяющий цифровой вычислительной машине моделировать способность человека оперировать необычным словоупотреблением),- противоречит как логике, так и опыту.
С логической точки зрения трудно усмотреть, каким образом можно сформулировать правила разумного нарушения правил. Ибо независимо от того, какие метаправила формулируются, мы интуитивно чувствуем, что носитель языка может и их нарушать, рассчитывая на то, что контекст позволит донести смысл его речи до собеседника. Таким образом, независимо от того, какой выбран уровень метаправил, всегда, по-видимому, существует более высокий уровень понимания - не выраженное явно понимание того, как нарушать правила более низких уровней и тем не менее быть понимаемым.
В феноменологическом (эмпирическом) плане постулирование системы неосознаваемых метаправил, в которых мы не отдаем себе отчета, ведет к возникновению других трудностей. Так же как в шахматах принятие цифровой модели предполагает, что шахматист неосознанно использует эвристические правила (даже когда согласно его собственному отчету он поглощен выявлением сильных и слабых сторон позиции, сложившейся на доске), так и допущение о предсуществовании правил устранения языковых неоднозначностей вводит представление о процессе, относительно которого мы не располагаем опытными данными,- представление, в котором должным образом не учитывается наше ощущение необычности определенных языковых оборотов.
И здесь, как и в случае с шахматами, эта насмешка со стороны феноменологических свидетельств приводит к телеологической загадке: почему, если каждый понимаемый нами случай применения языка подчиняется правилам, некоторые из этих случаев кажутся нам необычными,- настолько необычными, что мы не можем применить к ним какое-либо правило для объяснения своей интерпретации? Почему, располагая правилами такой силы
159
и молниеносной способностью использовать их на подсознательном уровне, мы уже на уровне сознания в иных случаях приходим в замешательство и считаем эти случаи необычными, причем даже после того, как поняли их?
Эти соображения подсказывают нам, в каком месте возникают противоречия. Они возникают, когда мы требуем создания формализма для применения языка, сравнимого с формализмом общей теории синтаксической и семантической компетенции. Последняя может содержать точное знание, поскольку имеет дело с вневременными явлениями и не претендует на формализацию феномена понимания языка в различных конкретных ситуациях.
Описанные трудности, однако, не волнуют лингвистов, которые, подобно истинным ученым, с большой осторожностью ограничивают свою область исследования "лингвистической компетенцией", т. е. общими принципами, которые применяются во всех случаях. Что же касается нашей способности применять язык в конкретных ситуациях, то ее исключают из рассмотрения как экстралингвистическую. Как указывает С. Кьеркегор, законы науки69 универсальны и вневременны, они трактуют всякий опыт так, как если бы он мог иметь место или был в прошлом*, Исследователи же в области "искусственного интеллекта" хотят, чтобы их машины взаимодействовали с людьми в реальных жизненных ситуациях, при которых объекты имеют специфическое ситуативное значение. Но вычислительные машины не участвуют в ситуациях. Каждый бит информации всегда имеет одно и то же значение. Вычислительные машины, правда, не являются "трасцендентально тупыми", как сказал бы Кант, Они могут применить правило к конкретному случаю, если этот случай предварительно однозначно описан в терминах общих признаков, фигурирующих в этом правиле. Они могут, таким образом, моделировать одну из разновидностей теоретического понимания. Но у машин отсутствует практический интеллект. Они "экзистенциально тупы" в том смысле, что не в состоянии справляться с конкретными ситуациями. Иными словами, они не допускают неоднозначности и нарушения правил до тех пор, пока в них не будут введены правила оперирования с отклонениями от правил, причем такие, которые полностью исключают возможность неоднозначности. Для того чтобы преодолеть эту неспособность, исследователи в области "искусственного интеллекта" должны разработать вневременную, внеситуативную теорию текущей человеческой деятельности.
Своеобразие, важность - и вместе с тем проклятие - работ по созданию систем общения человека с машиной на естественном
* S.Kiеrkegaard Concluding Unscientific Postscript, Princeton, N.J.; Princeton University Press, 1944, p. 108, 311.
160
языке состоит в том, что машине приходится использовать формальные методы для того, чтобы справляться с реальными жизненными ситуациями, как только они возникают. Она должна иметь дело с явлениями, которые принадлежат к "миру ситуаций", окружающему человека, как если бы эти явления относились к объективному формализуемому универсуму научного знания. Исследователь, уверенный в разрешимости задачи оснащения машины способностью понимать и использовать язык и вдохновляемый успехами в области лингвистики, не понимает не столько того, как функционирует сознание, сколько того, каково соотношение между феноменами теоретического и практического понимания. Он полагает, что мир практики, в который активно вовлечен индивид, можно понять в тех же терминах, что и объективный мир научного знания. Короче, он утверждает, вслед за пионером этой идеи - Лейбницем, что можно создать теорию практики.
Подобная прикладная теория, однако, не может быть аналогичной приложениям теоретической физики к технике, какие бы параллели здесь ни проводились. Когда мы используем законы физики для управления ракетами, реальное движение последних в пространстве есть конкретная реализация вневременных, универсальных законов, соотносимых с ситуацией не иначе, как в собственных терминах. Но в случае языка, как мы видели, говорящий принимает обычные ситуативные представления и цели как сами собой разумеющиеся. Таким образом, общие законы "лингвистической компетенции" не могут прямо применяться к моделированию языкового поведения. Чтобы от лингвистического формализма перейти к конкретному употреблению языка, следует учитывать тот факт, что говорящий понимает ситуацию, в которой находится. Если теория использования языка возможна как самостоятельная теория, то это должна быть теория совсем иного рода - теория ситуативного контекста, полностью описывающая его в универсально значимых, но не в физических терминах. Однако ни физика, ни лингвистика не предложили ни одного подхода к созданию подобной теории и, более того, не подали никакой надежды на то, что такая теория когда-либо появится.
Заключение
Чтобы опровергнуть эпистемологическое допущение о возможности теории, охватывающей практическую деятельность, а в случае языка - о возможности полной формализации правил, управляющих использованием языковых выражений в реальных условиях,- недостаточно указать на то, что до сих пор не су-
161
ществует системы автоматического перевода, или на то, что способы использования языка чрезвычайно гибки и явно не подчиняются правилам. "Формалист" может, следуя Платону, парировать это возражение, заявив, что если мы не в состоянии формализовать нашу способность пользоваться разговорным языком, то это доказывает лишь недостаточное понимание данного типа поведения, а также то, что правила полного описания употребления языка еще не найдены*.
Эта оборонительная позиция на первый взгляд как будто бы напоминает позицию представителей эвристического программирования, уверенных в том, что рано или поздно они найдут эвристики, обеспечивающие машине возможность играть в шахматы,- пусть до сих пор эти эвристики и не найдены. Но это только на первый взгляд: если уверенность в своей правоте, присущая составителю эвристических программ, базируется на необоснованном психологическом допущении относительно характера информационных процессов, протекающих в мозгу человека, то утверждение "формалиста" основывается на истинном понимании природы научного объяснения. До тех пор, пока наше поведение не определено в терминах единственно возможных и точно определенных реакций на точно определенные объекты в среде универсально определенных ситуаций, мы не "поймем" наше поведение в единственно возможном для науки смысле.
Чтобы противостоять этому априорному императиву теоретического понимания, недостаточно апелляции к феноменологическому описанию» Надо показать невыполнимость этого теоретического императива в его собственных терминах- показать, что правила, которые дают возможность носителю языка говорить, не могут быть полностью формализованы, а также что эпистемологическое допущение не только неправдоподобно, но и ведет к противоречиям.
Л. Витгенштейн был, по-видимому, первым философом со времен Б. Паскаля, который заметил: "Вообще говоря, мы
* Эта точка зрения отчетливо и наивно выражена во введении К.Сайра к сборнику "Моделирование разума":
" Любая умственная функция, отличающаяся тем, что 1) ее вход и выход могут быть выражены в точном виде и 2) выполняемое ею преобразование может быть приближено некоторыми уравнениями, описывающими определенные соотношения между входом и выходом, - любая такая функция уже только на зтом основании может быть промоделирована с той или иной степенью точности. В то же время если у нас нет четкого представления ни о входе, ни о выходе, ни о соответствующем преобразовании, то мы не сможем получить адекватную модель этой функции. Однако наше бессилие в этом случае можно будет считать свидетельством недостаточного уровня развития нашего мышления, а не признаком какой-то "трансцендентальности" умственных функций" (K.Sayre and J.Сrosson (eds.). The Modeling of Mind, South Bend, Ind., Notre Dame University Press, 1962, p. 14).
162
используем язык, не руководствуясь строгими правилами, и учат нас языку тоже не по строгим правилам"*. Однако аргументация Л. Витгенштейна, направленная против утверждения, что язык есть исчисление, базируется не только на феноменологическом описании такого использования языка, которое не подчиняется каким-либо правилам. Его сильнейший аргумент носит диалектический характер и основан на представлении о сведении одних правил к другим. В соответствии со взглядами критикуемых им философов-рационалистов, он сначала предполагает, что всякое непроизвольное поведение должно подчиняться правилам, а затем сводит это предположение к абсурду, требуя для применяемых правил в свою очередь правил их применения, и так далее.
Бесспорно, что мы всегда имеем возможность нарушить правила и вместе с тем быть понятыми. В конце концов, то, что нарушениям правил не поставлено границ,- это мы просто чувствуем. Но мы можем и ошибаться. Остается неясным вопрос о том, возможно ли полное понимание поведения в терминах правил. Л.Витгенштейн утверждает, как некогда утверждал Аристотель в споре с Платоном, что всегда должно оставаться место для интерпретации. И вопрос не в том (как, по-видимому, считает Тьюринг), имеются ли правила, диктующие нам то, что надлежит делать, -его мы вправе игнорировать. Главное состоит в том, могут ли существовать правила, описывающие то, что говорящий делает в действительности. Чтобы иметь полную теорию того, что может делать носитель языка, нужно располагать не только грамматическими и семантическими правилами, но и правилами, которые дали бы возможность человеку или машине распознавать контекст, в котором правила должны применяться. Так, должны существовать правила для распознавания ситуации, намерений говорящего и т. д. Но если теория требует дальнейших правил для объяснения того, каким образом осуществляется применение этих правил, то, рассуждая чисто логически, мы впадаем в бесконечное сведение одних правил к другим. И то что мы, несмотря на это, ухитряемся применять язык, означает, что такая редукция не представляет проблемы для человека. Если "искусственный интеллект" возможен, то сведение, редукция правил не должна быть проблемой и для машин.
Л. Витгенштейн, как и специалисты в области вычислительной математики и ЭВМ, вынуждены согласиться с тем, что существует некоторый уровень, на котором правила просто применяются непосредственно, и для своего применения не требуют новых правил. Однако относительно того, как описывать этот камень преткновения, мнение Л.Витгенштейна коренным образом отли-
* L.Wittgenstein. The Blue and Brown Books, Oxford, EngL, B. Brackwell, I960, p. 25.
163
чается от взглядов специалистов в области "искусственного интеллекта". Витгенштейн вообще не видит здесь проблемы: мы "вытаскиваем" такое количество правил, которого требует данная ситуация. На каком-то уровне, в зависимости от того, что именно мы пытаемся делать, интерпретация правила совершенно очевидна и редукция прекращается*.
Для тех, кто имеет дело с вычислительными машинами, редукция также прекращается вместе с интерпретацией, которая самоочевидна, однако эта интерпретация не имеет ничего общего с требованиями ситуации. И не может иметь, поскольку вычислительная машина не человек, и не находится "в ситуации". Она не порождает какого-либо ситуативного контекста. Для специалиста в области вычислительной математики и техники решение проблемы состоит в том, чтобы создать машину, способную реагировать в конечном счете на кванты свободных от контекста, полностью детерминированных данных, понимание которых не требует дальнейшей интерпретации. Как только данные введены в машину, дальнейшая их обработка должна производиться по правилам. Но считывание данных есть непосредственное отражение детерминированности признаков машинной среды, таких, как, например, дырочки на перфокартах или мозаика телевизионной камеры; поэтому на этом самом низком уровне машине не нужны правила для применения ее правил. Точно так же, как красное пятно управляет поведением птенца серебристой чайки в процессе питания, а глаз лягушки автоматически сигнализирует о наличии движущегося черного пятна, так и человеческое поведение, если бы его удалось понять до конца и "компьютеризовать", представлялось бы как управляемое специфическими условиями внешней среды.
В качестве психологической теории поведения человека эта гипотеза, разумеется, неприемлема. Чувство необычности, возникающее при отклонении от правильного словоупотребления, наряду с ощущением того, что ничто в окружающем мире не обязано вызывать в нас неизбежную и неизменную реакцию,
*См., например: L. Wittgenstein. Philosophical Investigations. Oxford, Eng., B.BIackwell, 1953, p. 39, 40, 41, 42. Витгенштейн пишет также:
" Правило есть своего рода дорожный указатель. - Разрешает ли дорожный указатель все мои сомнения по поводу того, куда направиться? Говорит ли он, куда двигаться, миновав его: вдоль дороги по тропинке или по пересеченной местности? Он не определяет, какой путь мне нужно избрать, -тот, который указывает его стрелка, или, скажем, противоположный. - А если бы был не один, а целая серия указателей и проезжая часть дороги была бы размечена,- разве интерпретация всего этого была бы единственной!- Можно сказать, что дорожный указатель действительно разрешает все сомнения. Но можно сказать и так: иногда разрешает, а иногда нет. Но в таком виде утверждение уже перестает быть философским и переходит в область эмпирических соображений" (р. 39, 40)
164
До сих пор эту взаимозависимость между целым и его частями не удавалось отразить в программах для вычислительных машин. Для Ниссера этой проблемы даже не существует, но, противопоставляя цифровую модель нейронных процессов, основанную на представлениях трансформационной лингвистики, аналоговой модели мозга, развивавшейся ранними гештальтпсихологами, он невольно преподносит в несколько ином свете важное различие между механистическими и гештальтистскими моделями психологических процессов: " [Гештальтисты] относились к числу "нативистов"; они были убеждены, что процессы восприятии определяются с необходимостью действующими врожденными принципами, а не обучением. Адекватная организация восприятия... возникает благодаря определенным процессам в мозгу, которые протекают в соответствии с неизменными (и "холистскими") законами физики и химии... Воспринимаемый мир всегда принимает "наилучшую" и "структурно простейшую" форму благодаря принципу равновесия, который преобладает над любыми возможными результатами обучения или практики"*. Подобная аналоговая схема функций мозга, в соответствии с которой информации интегрируется благодаря действию принципа равновесия; а не за счет срабатывания двупозиционных переключателей, была необходима для объяснения гештальтпсихологами роли глобального предвидения в структурировании человеческого опыта. Представители этого направления были вынуждены порвать с рационалистической традицией, ведущей от Декарта к Канту, согласно которой разум есть то, что приводит в действие независимо от него существующие врожденные принципы (Декарт) или правила (Кант), служащие организации опыта, без них не структурированного. Эта рационалистическая концепция (при условии использования минимальных "порций" четко определенных опытных данных) прекрасно поддается машинному моделированию, но гештальтисты понимали, что их принципы организации - подобно равновесным конфигурациям, образуемым электрическими зарядами на искривленной поверхности,- не могут быть отделены от организуемых ими элементов. Стало быть, если бы в то время существовала цифровая модель мозга, гештальтисты отвергли бы ее**. У.Ниссер не видит этого, полагая, что цифровая модель "встроенных" правил, предложенная лингвистами, является шагом вперед по сравнению с гештальтистской аналоговой мо- * Ibid. р. 246. ** Разумеется, явления, связанные с полями, можно, как и всякие вообще физические явления, моделировать, решая соответствующие дифференциальные уравнения, описывающие силы, участвующие в этих явлениях. Однако этот факт никак не связан с точкой зрения гештзльтистов, из которой вытекает, что человеческое поведение можно моделировать лишь косвенно, создавая модели соответствующего физического аналога (мозга) , а не прямо, с помощью программы для цифровой машины. 210 целью. Восторги Ниссера по поводу лингвистической модели, заставившие его забыть и последние открытия в области нейрофизиологии, и трудности проблемы "искусственного интеллекта", и соображения, исходя из которых гештальтисты предложили именно аналоговую модель, порождены в первую очередь логической ошибкой non sequitur 84: "Гештальтпсихологи так и не смогли дать сколько-нибудь удовлетворительного описания или анализа структур, заложенных в восприятии. Немногочисленные попытки ad hoc определить "поля сил" в зрении или "ионное равновесие" в мозгу закончились неудачно. В лингвистике же, напротив, изучение "синтаксических структур" имеет длинную историю"*. Совершенно непонятно, каким образом длинная история изучения синтаксических структур" может доказать, что лингвистическая модель нейронных процессов лучше, чем гештальтистская. По-видимому, это означает, что по крайней мере те правила, поисками которых заняты лингвисты - в случае, если они будут найдены,- окажутся такого рода, что их можно будет моделировать на машине (ведь ее-то мы уже знаем), тогда как гештальтистские принципы равновесия могут моделироваться только на аналоговом устройстве, имитирующем работу мозга,- устройстве, к созданию которого в настоящее время мы даже не знаем как подступиться. Все это так, однако невольно приходит на ум забавный эпизод с пьяницей, который где-то в темноте потерял ключ, но ищет его под фонарем, потому что там светлее. В самом деле, хорошо было бы иметь программируемую модель в лингвистике- и вообще в психологии, - но факт остается фактом, и современные лингвисты ничуть не лучше, чем гештальтпсихологи, представляют, что происходит в мозгу. Более того, в качестве теории компетенции - знания языка, но не его применения - современная лингвистика даже не пытается ответить на вопрос о том, в чем проявляется разумное поведение. Стало быть, дело обстоит еще хуже уличный фонарь даже не горит. Мы уже убедились, что попытки моделирования процесса использования языка были на редкость безуспешными. Сравнивая гештальтистскую и лингвистическую модели мозга, Ниссер, сам того не желая, привлек внимание к отличительным особенностям модели мозга, которые полностью соответствуют тем особенностям "холистских" процессов, которые он недооценивает. Тот тип гештальтистского феномена восприятия, который Ниссер проиллюстрировал на примере с ритмом (ритм как то, что придает значение отдельным длительностям и вместе с тем образуется из них), предполагает, что, даже если мозг и интегрирует стимулы, он делает это иначе, чем цифровая машина, которая * U.Neisser, Op.cit., p. 241. 211 применяет независимо установленные эвристические правила к независимо заданным "квантам" информации. Среди специалистов в области вычислительных машин только Д.Маккей понял суть дела. Его вывод таков: "Вполне возможно, что только специализированный аналоговый механизм сможет удовлетворить всему спектру требований. Что же касается нас, имеющих дело с жесткими схемами, то мы должны быть очень осторожны, настаивая на утверждении, что информационные процессы того типа, которые происходят в мозгу человека, могут быть воплощены в схеме, допускающей реализацию. Здесь, по-видимому, будет неизбежным применение определенного рода "мокрой" технологии"*. Если, исходя из феноменологических и нейрофизиологических доказательств, согласиться с тем, что нервная система есть некий тип аналогового устройства, оперирующего с состояниями равновесия, мы должны бдительно следить за тем, чтобы эта модель нервной системы (понимаемая как "мозг в колбе", который получает из окружающего мира энергию и посылает вовне ответы-реакции) не проникла в психологию. Процесс человеческого восприятия следует рассматривать в иных терминах, нежели нервную систему человека. Чтобы получить альтернативное объяснение разумного поведения, мы должны дать описание общих и фундаментальных черт человеческой деятельности. Признавая отсутствие работоспособной машинной модели и оставляя нейрофизиологам вопрос о том, как интегрируются в мозгу поступающие физические стимулы, мы должны еще раз задаться вопросом: "Каким образом нежестко определенные целостные прогнозы используются человеком для организации его опыта?" Э. Гуссерль не идет далее утверждения, что "трансцендентальное сознание" имеет wunderbare85 способность осмысления, делающую возможным восприятие, распознавание и исследование переживаемых им объектов. Подобно гештальтистам, Гуссерль трактует эти значения как частично неопределенные целостности, а не как эксплицитные программы или правила. Но даже он не свободен от традиционной рационалистической точки зрении, и поэтому критика, высказанная нами ранее в адрес Ниссера, в равной мере относится и к нему. Гуссерль вслед за Декартом и Кантом считает, что форму можно отграничить от содержания и что глобальное предвосхищение можно отделить от сенсорного чувствования. Так, его ноэма, или перцептивная антиципация, в одном главном подобна правилу или программе: она существует в уме или трансцендентальном сознании независимо от ее применения к опыту, который она структурирует. * fr D.Mас Кау. A Mind' s Eye View of the Brain,-In: Progress In Brain Research, 17; Cybernetics of the Nervous System, Amsterdam, Holland, Eteevier Publishing Company, 1965, p. 16. Том, из которого взята эта цитата,посвящен памяти Н. Винера. 212 М. Мерло-Понти пытается поправить объяснение Э.Гуссерля в этом пункте и в то же время разработать общее описание феномена предвосхищения, тяготеющее к точке зрения гештальтистов. Он утверждает, что именно тело сообщает нам значение, открытое Гуссерлем. В конечном счете именно наше тело улавливает ритм. Мы располагаем телесной организацией, позволяющей нам реагировать на звуковые структуры. Наше тело не есть какое-то правило, локализованное в разуме,- правило, которое можно сформулировать или использовать вне зависимости от реальной деятельности по антиципации ритмических длительностей. Вообще говоря, в процессе приобретения любого навыка - будь то умение танцевать, водить машину или говорить на иностранном языке- мы должны на первых порах медленно, трудно и осознанно следовать правилам. Затем наступает момент, когда управление наконец передается телу, И по-видимому, в этот момент мы не просто переводим соответствующие жесткие правила в подсознание, а, скорее, подбираем определенный мускульный гештальт, который сообщает нашему поведению новую гибкость и плавность. То же самое имеет место и при приобретении навыка восприятия. Возьмем один из примеров М.Мерло-Понти: чтобы приобрести навык на ощупь определять шелк, нужно научиться производить (или готовиться производить) пальцами определенные действия, имея при этом определенные ожидания. До приобретения соответствующего навыка мы испытываем в соответствующей ситуации только неясные ощущения. Легче всего осознать роль тела в случае вкусовых ощущений, слухового восприятия и осязания, однако уже способность зрительного восприятия есть навык, которому приходится учиться. Фокусировка зрения, восприятие объектов в правильной перспективе, выделение определенных деталей - все это включает в себя координированные действия и ряд предвосхищений. Как замечает Пиаже, "перцептивные "константности" являются, скорее всего, продуктом действий в собственном смысле слова, состоящих в реальных или потенциальных перемещениях взгляда или функционирующих органов"*. Эти телесные навыки или умения дают нам возможность не только распознавать объекты в каждой отдельной сенсорной модальности; благодаря нашей способности к установлению чувственной эквивалентности наших исследовательских навыков мы можем зрительно воспринимать и вместе с тем осязать некоторый объект как один и тот же. Вычислительной машине для выполнения тех же функций должна быть задана программа по составле- * Ж. Пиаже. Психология интеллекта. - В кн.: Ж. Пиаже. Избранные психологические труды. М., 1969, с. 138. 213 нию соответствующего списка характеристик визуально анализируемого объекта и сравнению этого списка с четко определенным списком признаков, зафиксированных подвижными органами тактильной рецепции, ощупывающими тот же самый объект. Это значит, что в рамках каждой сенсорной модальности должна существовать некоторая внутренняя модель каждого объекта и что распознавание объектов - визуальное или тактильное - должно осуществляться путем анализа этого объекта в терминах отличительных признаков, общих для обеих модальностей. Мое тело дает мне возможность миновать этот формальный анализ. Навык в отличие от фиксированной ответной реакции или множества реакций может быть использован бесконечным числом способов. Когда у воспринимающего субъекта вырабатывается навык, субъект уже " не соединяет вместе отдельные движения и отдельные стимулы - он приобретает способность отвечать реакцией определенного вида на ситуации определенного общего типа. Ситуации могут широко варьировать в зависимости от условий, и ответные движения могут быть передоверены иногда одному исполнительному органу, иногда другому, причем как ситуации, так и ответные реакции в разных случаях имеют сходство не столько благодаря частичному тождеству их элементов, сколько в силу присущего им общего смыслового значения"*. Так, твердую поверхность я могу почувствовать руками, ногами и даже взглядом. Мое тело, таким образом, является тем, что М.Мерло-Понти называет "синергической системой"**, т. е. "уже готовой системой сенсорных эквивалентов и переходов от одной сенсорной модальности к другой"***. "Объект, предъявленный одному из органов чувств, вызывает согласованное действие всех остальных. Я воспринимаю окрашенную поверхность, потому что у меня есть зрительное поле и его организация такова, что мой взгляд фиксирует эту поверхность; я воспринимаю некий предмет, потому что у меня есть экзистенциальное поле, и каждое явление, когда оно появляется в этом поле, "притягивает" к себе мое тело как целое в качестве системы перцептивных способностей****. Для того чтобы должным образом распознать объект, воспринимающему субъекту, как и машине, требуется обратная связь. Но ее характер в обоих случаях принципиально различен. Самое большее, что может сделать машина, - это выдвинуть конкретное множество гипотез и затем установить, подтверждаются или опровергаются они экспериментальными данными. Тело же может постоянно модифицировать свои предвидения по более гибкому принципу: коль скоро мы наделены телом, нам нет необходимости проверять отдельные характеристики или кон- *М.Меrleau-Ponty. Phenomenology of Perception, p. 142,, ** Ibid.r p. 234, *** Ibid., p. 235. **** Ibid., p. 318. 214 кретный ряд характеристик, мы просто схватываем объект на основе предвидения. Нет необходимости определять это схватывание с помощью какого-то специфического набора признаков- оно является следствием растущего овладения предметом, то есть того, что М. Мерло-Понти называет максимальным постижением сути. В чем состоит это "максимальное постижение", зависит как от целей субъекта, так и от разнообразия ситуаций. Поэтому оно не может быть выражено в терминах, не зависящих от ситуаций и целей. В заключение подчеркну; распознавание образов не представляет особой трудности для цифровой машины, если число признаков, определяющих образ, невелико; однако распознавание сложных образов теми же методами невозможно. Представители трансцендентальной феноменологии, в частности Э. Гуссерль, указывали на то, что у человека процесс распознавания сложных образов происходит путем выделения в какой-то степени неопределенного целого, которое постепенно наполняется содержанием в ходе антиципации, происходящей на основе опыта. Экзистенциальные феноменологи, и в их числе М. Мерло-Понти, связывали эту способность с нашим активным телом, элементы которого, взаимодействуя, образуют органическую целостность и которое устроено таким образом, что реагирует на окружающую среду, непрерывно ощущая как свои цели, так и собственное функционирование. Поскольку, как выяснилось, распознавание образов есть неотъемлемое телесное умение, проявляющееся во всяком разумном поведении, то вопрос о том, возможен ли искусственный интеллект, связан с проблемой создания "субъекта", наделенного искусственным телом. Эта проблема представляет известный интерес для философов только в том случае, если мы ограничимся вопросом о том, можно ли создать подобный робот средствами цифровой вычислительной техники. (Что касается меня лично, то я склонен положительно отвечать на этот вопрос в принципе с той, однако, оговоркой, что для создания искусственного тела следует использовать компоненты, достаточно похожие на компоненты человеческого организма.) Проект создания такого робота, управляемого цифровой машиной, осуществляется в настоящее время в Массачусетском технологическом институте86. Интересно с философской точки зрения рассмотреть его программу и заложенные в ней допущения. Руководитель этого проекта М.Минский из скромности ограничивает свою задачу созданием механического манипулятора "плечо - рука - кисть", управляемого "телеглазом"; однако предполагается, что робот будет уметь пользоваться инструментами для построения тех или иных объектов. Для начала конструкторы поставили перед собой простую за- 215 дачу - запрограммировать упрощенную механическую руку для сборки сооружений из кубиков. Задача эта была выполнена, что и дало основание для далеко идущих надежд. Однако проблема распространения результатов, полученных в этой работе, на более широкую область остается по-прежнему открытой. Для того чтобы просто устроенная искусственная рука могла поднять кубик, требуется поместить этот кубик в определенную предметную среду, туда же ввести механическую руку и совместить их в пространстве. Это уже достаточное достижение. Математическое описание движений руки в предметном пространстве сталкивается с неожиданными неувязками. Так, в предметном пространстве существуют близкие друг к другу точки, которые далеки друг от друга с точки зрения их достижимости; чтобы почесать спину, нам приходится не только принимать соответствующую позу, но иногда пользоваться каким-либо предметом. Жизнь нашего тела создает собственное моторное пространство, в котором реально близкие друг другу пункты могут оказаться далеко один от другого. Доступность точек этого пространства для нашего тела носит автоматический характер - они становятся для нас доступными по-разному, и никакой потребности в обращении к математике для оптимизации наших действий у нас не возникает. Для математика-программиста же, которому необходимо запрограммировать вычислитедьную машину таким образом, чтобы она управляла движением механической руки в предметном пространстве, эти неувязки до сих пор являются непреодолимым препятствием. Чем гибче рука, то есть чем большим числом степеней свободы она обладает, тем более трудоемкими и продолжительными становятся соответствующие машинные вычисления. Согласно неподтвержденным сообщениям, для искусственной руки, обладающей шестью степенями свободы, разработанной М. Минским в 1965 г., до сих пор еще не создана программа, позволяющая ей хоти бы просто двигаться, не говоря уже о поднимании отдельных предметов или использовании инструментов. Здесь уместно напомнить еще один факт: для всех навыков, которые применяются в реальном времени (например, при игре в настольный теннис), вычисления должны производиться тоже в реальном времени (так что машина должна успеть рассчитать траекторию полета шарика от одного игрока к другому в течение самого полета). С учетом этого перспективы становятся совсем уже малообещающими Э.Фейгенбаум в своем сообщении о текущем состоянии работ по созданию роботов замечает: "Как в Массачусетском технологическом институте, так и в Стенфордском университете проводилась разработка программ, обеспечивающих управление манипуляторами "плечо - рука" самых различных типов, от простейших до самых сложных, от антропоморфических до 216 сугубо неантропоморфических. Ни один из более сложных манипуляторов не кажется достаточно удачным, хотя публикации, посвященные анализу соответствующих достижений и неудач, отсутствуют"*. Что же побуждает исследователей, несмотря на столь серьезные затруднения, посвящать свои усилия реализации этого проекта? Простая убежденность в том, что если мы, "машины из мяса", как остроумно выразился М. Минский, можем играть в настольный теннис, то почему бы машине из металла не научиться тому же, - ведь ни принципиальных, ни практических ограничений здесь, казалось бы, не существует. Но прежде чем производить подобный логический переход, специалистам, работающим над созданием роботов, следует подвергнуть анализу основную предпосылку своих рассуждений -допущение, согласно которому существенного различия между "машинами из мяса" и машинами из металла, между живыми манипуляторами, наделенными телом, и манипуляторами, управляемыми каким-либо искусственным способом, не существует. Иначе говоря, нужно попытаться ответить на вопросы: как человек играет в настольный теннис или, говоря яснее, как он пользуется предметами, орудиями, инструментами? М. Хайдеггер, М. Мерло-Понти и М. Поляный уделили этим вопросам достаточно много внимания. Каждый из них рассматривал чрезвычайно важный фактор, который отличает наш опыт использования орудий от приобретенного в опыте знания о том или ином предмете. Слепой, проводя рукой по палке, которая ему помогает при ходьбе, осознает ее положение и такие ее объективные характеристики, как вес, твердость, гладкость и т. д. Когда же он нащупывает палкой путь, он не сознает ни ее положения в предметной среде, ни ее физических характеристик, ни изменений в давлении палки на свою ладонь; палка в этом случае становится как бы частью его тела, средством доступа к предметам, которых она касается, Поляный говорит: "Когда мы применяем орудия труда или исследования, они уже не выступают по отношению к нам как внешние предметы... они теперь... образуют как бы часть нас самих - людей, оперирующих ими. Мы как бы проникнем в них и переносим на них часть своего существования. Мы принимаем их экзистенциально - как бы"пребываем" в них"**. Так мы можем привести исследовательский прибор в соприкосновение с объектами внешнего мира, не отдавая себе отчета о физическом положении прибора. М. Мерло-Понти в этой связи замечал: * Э. Фейгенбаум. Искусственный интеллект: темы исследований во втором десятилетии развития. - Кибернетический сборник, новая серия вып. 10, М., 1973, с, 179. ** М. Роlanyi. Personal Knowledge; Towards a Post-Critical Philosophy, New York, Harper and Row, 1964, p. 59. 217 "Вся операция происходит в сфере феноменального; она не переходит в предметный мир, и лишь наблюдатель, перенося свои объективные представления о живом теле на действующего субъекта, может считать, что ... рука движется в объективном пространстве"*. Тем не менее М. Мерло-Понти допускает, что с точки зрения науки эта способность представляется "магической"; не удивительно поэтому, что, не имея другого объяснения человеческих действий, специалисты в области вычислительных систем придерживаются предположения о том, что человек бессознательное невероятной скоростью проделывает те громадные по объему вычисления, которые предусмотрены машинной программой, предназначенной для выполнения аналогичной задачи. К сожалению, из-за отсутствия альтернативного объяснения подобные взгляды кажутся убедительными. Для выдвижения приемлемой альтернативы нам необходимо показать, каким образом можно выполнить те или иные физические задачи, не прибегая к принципам физики или геометрии. Рассмотрим простейший акт - случайный взмах руки. Я не стараюсь, чтобы моя "объективная" рука заняла "объективное" место в пространстве. Для того чтобы произвести данный жест, мне не нужно обращение к геометрии, ибо я не стремлюсь достичь конкретной цели. Теперь предположим, что, выполняя это движение, я невольно коснулся какого-то предмета и это удовлетворило мою потребность контакта с вещами (подробнее об этой потребности см. гл. 9) - Затем я могу повторить то же самое движение, на сей раз специально для того, чтобы коснуться того же предмета, и при этом я не буду использовать законы, требующиеся для описания моего движения как движения физического. Теперь я знаю способ приведения в соприкосновение двух объектов в предметном пространстве без обращения к использованию какого-либо принципа, за исключением императива: "Сделай это еще раз!" Преимущественно так и образуются навыки. Существенно добавить, что, хотя наука требует, чтобы реализация навыков описывалась в соответствии с правилами, совсем не обязательно, чтобы эти правила были включены в сам процесс реализации. Далее, человек способен запоминать, совершенствовать и видоизменять эти в некоторой степени неопределенные моторные схемы. Ж. Пиаже собрал огромный материал, проследив развитие моторных навыков, которые он назвал операциями, и пришел к следующему заключению гештальтистского характера88: "Специфическая природа операций ... заключается, напротив, в том, что они никогда не существуют в разрывном состоянии ,.. единичная операция не могла бы быть операцией, поскольку сущность операций состоит в том, чтобы образовывать системы. Именно здесь и необходимо особенно * М.Мerleau-Рonty. Op,cit. p. 106. 218 энергично возразить против логического атомизма, схема которого ложилась тяжким бременем на психологию мышления"*. Такого же рода анализ позволяет рассеять и иллюзии, возникшие благодаря успеху работ в области машинного перевода на их ранних стадиях. Если бы для понимания языка человек был вынужден прибегать к использованию семантических и синтаксических правил, а также хранить и извлекать из памяти бесконечное множество фактов, то ему было бы так же трудно действовать, как и машинам. Носитель языка тем не менее, сам не осознавая того, порождает множество семантических двусмысленностей; затем он сам их устраняет, причем скорее на основе обращения к фактам, чем путем выделения сложных образов по их признакам или осуществления вычислений, описывающих движение руки в предметном пространстве. Возможно, что язык также является навыком, который приобретается в результате поиска, направляемого некоторым врожденным механизмом, и использование которого происходит без применения правил. Именно так полагает Л. Витгенштейн: "Вообще говоря, мы используем язык, не руководствуясь строгими правилами, и учат нас языку тоже не по строгим правилам"**. Подобную точку зрения нельзя назвать бихевиористской. Нашу способность использовать язык в той или иной ситуации и вообще целостный характер функционирования значений, организующих и структурирующих компоненты актов проявления навыков, невозможно объяснить ни ассоциациями нейтральных четко определенных элементов, ни тем более их сочетанием в соответствии с определенными правилами. Если язык понимать как моторный навык, то осваивать и "вживаться" в него мы должны по тому же принципу, как мы осваиваем инструменты. М. Поляный говорит: "Использование языка в речи, чтении или письме означает обогащение нашей телесной организации и наше становление как разумных человеческих существ. Можно сказать, что, когда мы учимся использовать язык, прибор или орудие труда, тем самым осознавая их подобно тому, как мы осознаем наше тело, мы интериоризируем эти вещи и заставляем себя как бы вживаться в них”*** И опять, поскольку человек наделен телом, выполнение им того или иного действия совсем не обязательно должно быть * Ж. Пиаже, Цит. соч., с. 93. Эти моторные схемы наверняка базируются на мышечной и нейронной основе; однако нет никаких оснований полагать, что эти физические корреляты состоят из последовательности независимых друг от друга операций, которая определяется правилами. Как глобальный характер этих моторных схем, так и их неопределенность исключают такую возможность, ** L. Wittgenstein. The Blue and Brown Books, p. 25. *** M.Polanyi. The Logic of Tacit Inference. In: Knowing and Being, Chicago, University of Chicago Press, 1969,P. 148. M. Поляный здесь опять 219 каким-либо образом связано с правилами, необходимыми нам для объективного анализа соответствующей его "компетенции". Исследователи, работающие в области "искусственного интеллекта", так же как и представители направления трансцендентальной феноменологии, убеждены, что существует только один подход к информации - сделать ее объектом переработки со стороны лишенного живого тела устройства. Для феноменолога-трансценденталиста это предположение делает организацию нашего разумного поведения непостижимой. Что же касается специалистов по "искусственному интеллекту", то это предположение как будто бы подтверждает их допущение, согласно которому разумное поведение может быть результатом пассивного получения данных и последующего проведения вычислений, необходимых для описаний объективного владения навыком -"компетенции". Но, как мы видели, телесность человека предоставляет ему другую возможность. Телесная организация человека позволяет ему выполнить следующие три функции, для которых нет машинных программ - таковые не только еще не созданы, но даже не существуют в проекте. Первая функция заключается в феномене "внутреннего горизонта", то есть в способности к частично неопределенному, не поддающемуся четкому описанию предвосхищению частично определенных данных (сюда не относится предвосхищение полностью определенных или полностью неопределенных альтернатив- феномены, которые только и поддаются цифровой реализации). Вторая функция состоит в использовании глобального характера этого предвосхищения - антиципации, определяющей значение учитываемых в ней деталей и в то же время определяемого ею. Суть третьей функции - в способности антиципации перемещаться от одной чувственной модальности к другой и от одного действующего органа к другому. Все эти функции включаются в общую способность человека к приобретению телесных умений и навыков. Благодаря этой фундаментальной способности наделенный телом субъект может существовать в окружающем его мире, не пытаясь решить невыполнимую задачу формализации всего и вся. вступает в противоречие с самим собой, поскольку в более поздних работах он предлагает следующее объяснение процесса обучении языку: "На вопрос о том, каким образом ребенок может научиться выполнять действия из того или иного поведенческого репертуара (в соответствии с) необозримым набором сложных правил, которые доступны пониманию только небольшого круга специалистов, мы можем ответить, что целеустремленное воображение в достаточной мере обладает способностью достижения стоящих перед ним целей, используя в качестве вспомогательных средств подходящие правила, о которых сам субъект не имеет четкого представления" (М. Рolanyi. Sence-giving and Sence Reading.-In:Knowing and Being, p, 200.) 220 Описанные информационные процессы", основанные на телесной организации- процессы, при которых значение целого обладает приоритетом по отношению к составляющим целое элементам, - с нашей точки зрении имеют место в таком сложном феномене, как распознавание устной речи, с которого мы начали наш анализ. Они также являются необходимыми для объяснения нашей способности к распознаванию типического, семейного сходства, а также такого сходства, при котором распознаваемые объекты вообще не имеют общих черт. Во всех этих случаях индивидуальные черты наполняются содержанием на основе некоторой неопределенной антиципации целого. Если эти глобальные формы распознавания образов недоступны цифровой машине, которая, будучи лишена тела, не может реагировать на воздействия как некая целостность, а вынуждена строить процесс распознавания на основе четко определенных деталей, то тогда вполне оправдан пессимизм А. Эттингера, заканчивающего свою статью о распознавании речи следующим выводом: "Если мы в действительности обладаем способностью использования глобального контекста, не прибегая к помощи формализации... то наш оптимистический дискретный перечислительный подход обречен на неудачу"*. * А.Оеttinger. The Semantic Wall (опубликовано в издании Лаборатории фирмы Белл). 221 К главе 8 |
Критика искусственного разума
ОТ ИЗДАТЕЛЬСТВА
Книга американского философа Хьюберта Дрейфуса посвящена методологическим проблемам кибернетики, точнее, вопросу о возможностях и пределах машинной имитации и "усиления" человеческого разума. В научной литературе эта область исследований известна как кибернетическое моделирование познавательных процессов и разработка систем "искусственного интеллекта". Под последним понимаются системы, которые по некоторым своим характеристикам существенно приближаются к процессам функционирования чисто человеческих феноменов восприятия и мышления и их проявления в разумном поведении.
Следует подчеркнуть, что в нашей стране данная область кибернетики является предметом активных исследований. Так в Академии наук СССР имеется Научный совет по искусственному интеллекту, являющийся одновременно секцией Научного совета по комплексной проблеме "Кибернетика" при Президиуме Академии. Модельно-кибернетические исследования интенсивно ведутся в Институте кибернетики АН УССР и многих других научных центрах. В этой работе советские ученые деятельно сотрудничают со своими зарубежными коллегами: в 1975 г. в Тбилиси была проведена IV Международная объединенная конференция по искусственному интеллекту, в которой приняла участие большая группа американских кибернетиков; б апреле 1977 г. в Ленинграде состоялось Международное совещание по искусственному интеллекту, на котором специалисты из Советского Союза обсуждали проблемы кибернетического моделирования познавательных процессов совместно со своими коллегами из США и других зарубежных стран. За последние годы в нашей стране был переведен ряд книг и статей, написанных видными американскими кибернетиками, с многими из которых автор полемизирует в предлагаемой читателю монографии.
Книга написана не ученым-кибернетиком, а философом, основательно изучившим соответствующую проблематику и стремящимся осмыслить возможности и границы "искусственного разума". При этом автор уделяет особое внимание не столько возможностям данного направления исследований (о них уже
5
достаточно много написано самими специалистами в области "искусственного интеллекта"), сколько пределам его развития, которые X. Дрейфус и стремится выявить в ходе своего анализа. Появление такого рода работы в западной философско-кибернетической литературе не случайно. Оно вызвано рекламными заявлениями, которые были сделаны представителями данного направления кибернетики в США, а также тем обстоятельством, что некоторые из выдвигавшихся ими прогнозов относительно реализации тех или иных модельно-кибернетических проектов оказались неоправданными. В этой связи X. Дрейфус ставит ряд важных проблем методологического характера, заслуживающих критического анализа и осмысления с позиций диалектико-материалистической методологии. Такой анализ предпринят в статье "Что же могут вычислительные машины? (вместо послесловия) ", написанной доктором философских наук Б.В. Бирюковым, которая помещена в конце книги. Книга снабжена также примечаниями, разъясняющими, уточняющими и исправляющими отдельные ее положения.
Предлагаемая вниманию читателей работа X. Дрейфуса, основанная на богатом фактическом материале и носящая дискуссионный характер, несомненно, привлечет внимание кибернетиков, философов, психологов и специалистов других областей знания.
6
I
С тех пор как древние греки изобрели логику и геометрию, мысль о том, что всякое рассуждение может быть сведено к своего рода вычислению - так что любые дискуссии можно было бы считать улаженными раз и навсегда,- занимала умы большинства представителей точного знания на Западе. Первым, кто высказал эту мысль, был Сократ. Рассказ об "искусственном интеллекте" можно было бы начать с 450 г, до н. э., когда (как повествует Платон) Сократ обратился с вопросом к афинскому гражданину Эвтифрону, который собирался в порыве благочестия выдать властям своего отца, совершившего убийство; "Открой же мне теперь... то, что для тебя, по твоему признанию, совершенно ясно, то есть как надобно отличать благочестие от нечестия.,, что такое сама эта идея, чтобы, смотря на нее и пользуясь ею, как образцом, я мог бы согласное с нею- и в твоих поступках, и в поступках других людей - назвать святым, а несогласное - не святым"*, Сократ просит Эвтифрона открыть ему то, что специалисты по математическому обеспечению вычислительных машин назвали бы "эффективной процедурой", набором "сообщаемых нам время от времени правил, которые точно регламентируют наше поведение"**.
Платон придал этой потребности в моральной уверенности эпистемологический характер. Согласно Платону, всякое знание должно быть представлено в виде точных определений, которыми может пользоваться всякий. Если человек не может представить свое умение в виде такого рода точных правил, то есть если он не в состоянии обратить свои знания о том, как нечто делается, в знание о том, что делать, значит, он располагает не знанием, а верой, уверенностью. Согласно Платону, повара, например, руководствующиеся в своем деле вкусом и интуицией, и поэты, работа
* Платон. Соч., т. 1, Эвтифрон 5 D, 6 Е, СПб., 1863, с. 362, 365. (Звездочками отмечены подстрочные примечания автора; цифрами -примечания к русскому переводу, помещенные в конце книги. - Ред.)
** М. Минский. Вычисления и автоматы1- М., 1971,с, 135. Разумеется, Минский имеет в виду вычислительные процессы, а не действия морального характера.
7
которых зависит от вдохновения, вообще не обладают знанием: то, что они делают, не связано с пониманием и не может быть понято. Таким образом, все, что не может быть сформулировано в виде четких правил - все сферы человеческой мысли, требующие мастерства, интуиции или чувства традиции,- следует расценивать как своего рода бессмысленную одержимость.
Однако Платона еще нельзя считать кибернетиком в полном смысле слова (хотя, согласно Н. Винеру, он был первым, кто употребил этот термин2), поскольку его интересовали главным образом семантические, а не синтаксические критерии. Платон исходил из предположения, что человек понимает значение понятий, составляющих правила. В "Государстве"* Платон говорит, что понимание как таковое (то есть подразделяющаяся на части и подчиняющаяся правилам линия познания)3 зависит от разума, который предполагает диалектический анализ и в конечном счете интуитивные представления о значении основных понятий, используемых в процессе понимания. Таким образом, Платон признает, что его правила не могут быть полностью формализованы. Точно так же современный специалист по вычислительным машинам М. Минский, пытаясь реконструировать представления Платона об эффективной процедуре4, замечает: "Эта попытка дать определение вызывает критику, потому что интерпретация предусмотренных правил не должна зависеть от некоторого субъекта или посредника"**.
Аристотель, расходившийся с Платоном в этом вопросе, как и во многих других, касающихся приложения теории к практике, с удовлетворением отмечает, что для применения платоновских правил необходимо обращение к интуиции. По его мнению, совсем не просто найти формулу, с помощью которой можно было бы определить, как далеко может зайти человек и до какой степени он может заблуждаться, прежде чем в наших глазах он станет виновным5. Точно так же трудно дать определение и в случае любого объекта восприятия; такого рода вопросы о степени виновности неразрывно связаны с обстоятельствами, сопутствующими рассматриваемому конкретному случаю, где единственным нашим критерием служит восприятие***.
Для того чтобы осуществить идею Платона,требуется только одно: исключить какое бы то ни было обращение к интуиции и оценкам, носящим характер мнений. Подобно тому как Г. Галилей пришел к своему открытию чисто формального описания движения физических тел, исключив из рассмотрения все второ-
* См.: Платон. Соч. т. 3. ч. 1,M., 1971, с 89-454. **
** См.: М. Минский. Цит. соч. с. 135.
*** См.: Аристотель. Этика (к Никомаху) . В кн.: Этика Аристотеля, СПб., 1908.
8
степенные факторы и телеологические соображения, новый Галилей в науке о человеческом поведении мог бы добиться успеха, сведя все семантические соображения (обращение к значениям) к методам синтаксических (формальных) преобразований.
Убеждение в возможности такого рода тотальной формализации познания вскоре стало доминирующим в западной мысли. Теперь оно уже выражала основной моральный и интеллектуальный императив, а успехи физических наук подтверждали (как это казалось философам XVI в., а сегодня - таким мыслителям, как Минский) возможность реализации этого императива. Впервые синтаксическая концепция мышления как процесса вычисления была в явной форме сформулирована Т. Гоббсом: "Когда человек рассуждает, он лишь образует в уме итоговую сумму путем сложения частей... ибо рассуждение,., есть не что иное, как подсчитывание"*.
Оставалось только установить первичные элементы - словесные "кванты"6, которыми мог бы оперировать этот чисто синтаксический "калькулятор"- Лейбниц - изобретатель двоичной системы счисления - посвятил свою жизнь разработке необходимого для этого однозначного формального языка. Он полагал, что ему удалось найти универсальную и точную систему обозначений, некоторую алгебру, символический язык, "универсальную характеристику"7, с помощью которой каждому объекту можно приписать определяющее его "характеристическое число". Используя этот прием, всякое понятие можно представить в виде небольшого количества исходных и неопределяемых идей; все знание же может получить выражение и быть объединено в единой дедуктивной системе. На основе этих характеристических чисел-характеристик и правил их комбинирования может быть разрешен любой спор и решена любая проблема. "И если кто-нибудь усомнился бы в том, что я выдвигаю, я ответил бы ему: "Давайте вычислим, сударь!" - и мы, взяв перо и чернила, быстро вышли бы из затруднительного положения"**.
Подобно современному специалисту по математическому обеспечению ЭВМ, сообщающему о некоторой программе, которую он еще только собирается составить, Лейбниц заявляет:
"Так как в силу удивительной связи, в которой находятся все вещи, чрезвычайно трудно выделить изолированные характеристические числа, изображающие небольшое число отдельных вещей, п придумал остроумный искусственный прием, с помощью которого удастся предварительно выра-
* Гоббс. Избран, произв., т.2, М., 1964, с. 75, 76, G. W. Lеibniz. Fragments гиг Logik, Akademie-Verlag. Berlin, 1960,S.91ff8.
9
зить (darlegen) и зафиксировать определенные соотношения, после чего их уже можно подтвердить далее арифметическим вычислением"*.
И Лейбниц не скрывает огромной важности этой почти завершенной программы:
"...после того как для большинства понятий будут установлены характеристические числа, человеческий род приобретет как бы новый орган, который расширит творческие возможности духа в гораздо большей мере, чем это делают оптические инструменты по отношению к остроте зрения, и который в той же мере превзойдет микроскопы и телескопы, в какой разум превосходит зрение"**.
Обладая этим новым мощным инструментом, искусство, способы формализации которого безуспешно искал Платон, можно поднять до уровня теории, В одной из своих "финансовых заявок" (где он объясняет, каким образом можно было бы свести все мышление к манипулированию числами, если бы для этого имелось достаточно средств и времени) Лейбниц замечает:
",,.наиболее важные наблюдения и тонкости в разного рода занятиях и профессиях до сих пор не описаны. Это подтверждается на опыте, когда, пытаясь что-либо произвести, мы переходим от теории к практике. Разумеется, мы имеем возможность самым детальным образом описать результаты этой практики, ибо практика есть, по сути, не что иное, как более сложная и подробная теория"***.
Если Лейбниц только обещает, то Дж. Буль - математик и логик XIX в.- предпринимает шаги для реализации этой программы. Подобно Гоббсу, Буль считает, что рассуждение есть вычисление; его цель -"исследовать основные законы тех операций разума, посредством которых осуществляется рассуждение, выразить их на символическом языке некоторого исчисления"****.
Булева алгебра - это бинарная алгебра для представления элементарных логических функций. Если а и b- переменные, точка представляет союз "и", знак плюс - союз "или", а 1 и 0 представляют соответственно "истину" и "ложь", то правила логических переходов могут быть представлены в следующем алгебраическом виде9:
а+ а = а, а + 0 = а, а + 1 = 1,
а* а = а, а * 0 = 0, а +*1 = а.
Теперь западный человек был готов к началу вычисления.
Почти немедленно - с появлением изобретений Ч.Бэббеджа (1835)- практика стала догонять теорию10. Бэббедж задумал
* G.W. Leibniz; Selections. Ph. W i e n e r led.). New York, Siribner, 1951, p. 15,
** Ibid., p. 23.
*** Ibid.,p. 48 (курсив мой. -Х.Д.).
**** G.Boole, Collected Logical Works. Vol. II. The Laws of Thought (1854). Lasaller Illinois, 1952, p. 1.
10
проект "аналитической машины", как он ее назвал, которая - хотя она так и не была построена11 -должна была функционировать в точности так же, как и современная цифровая вычислительная машина: в ней использовались перфокарты, сочетание арифметических и логических операций, а логические решения, принимавшиеся в ходе вычислительного процесса, находились в зависимости от результатов предшествующих вычислений .
Существенная особенность машины Бэббеджа заключалась в том, что она была цифровой. Существует два основных типа вычислительных машин: аналоговые и цифровые. Аналоговые машины не вычисляют в строгом смысле слова- их функционирование заключается в измерении физических величин. Используя такие физические величины, как электрическое напряжение, длительность, угол поворота диска и т,д., пропорциональные исследуемой величине, они физически комбинируют упомянутые величины и измеряют получающийся результат. Типичный пример аналоговой вычислительной машины - логарифмическая линейка. В цифровой вычислительной машине, как это следует из используемого в ее названии слова "цифровая" - по-английски digit, что по-латыни означает "палец", - все величины представлены дискретными состояниями, например состояниями реле ("включено - выключено") телефонного диска, занимающего любую из десяти позиций, и т. д. Такая машина для получения результата считает в буквальном смысле слова.
Таким образом, в то время как аналоговые вычислительные машины оперируют непрерывными величинами, все цифровые вычислительные машины являются машинами с дискретными состояниями, или машинами дискретного действия. Говоря словами А.Тьюринга, получившего известность благодаря данному им определению природы цифровой вычислительной машины12, работа машины с дискретными состояниями
"складывается из совершающихся последовательно одна за другой резких смен их состояния- Состояния, о которых идет речь, достаточно отличны друг от друга, для того чтобы можно было пренебречь возможностью принять по ошибке одно из них за другое. Строго говоря, таких машин не существует. В действительности всякое движение непрерывно. Однако имеется много видов машин, которые удобно считать машинами с дискретными состояниями. Например, если рассматривать выключатели осветительной сети, то удобно считать, отвлекаясь от действительного положения деп, что каждый выключатель может быть либо включен, либо выключен. То, что выключатель фактически имеет также и промежуточные состояния, несущественно для наших целей, и мы можем об этом забыть"*.
Идеи Бэббеджа опередили технологию его времени, ибо в то время еще не существовало быстрого и эффективного способа
* А. Тьюринг. Может ли машина мыслить? М., 1960, с. 28.
11
представления цифр и манипулирования с ними. Для реализации дискретных состояний Бэббеджу пришлось использовать неуклюжие механические средства, такие, например, как зубчатое колесо. Необходимым технологическим решением оказались электрические переключательные схемы. Когда в 1944 г. Х.Айкен построил первую работающую цифровую вычислительную маши-ну, она представляла собой электромеханическое устройство, в которое входило около 3000 телефонных реле. Однако подобные машины работали еще медленно; и лишь следующее поколение вычислительных машин, в котором использовались электронные лампы, знаменовало собой появление современной ЭВМ, пригодной для любых вычислений.
Но что значит "для любых вычислений"? Цифровая вычислительная машина оперирует абстрактными символами, которые могут означать все что угодно, и логическими операциями, которые могут связывать все что угодно; поэтому любая цифровая вычислительная машина (в отличие от аналоговой) универсальна. Во-первых, говоря словами Тьюринга, она может моделировать любую другую цифровую вычислительную машину.
"Именно зто особое свойство цифровых вычислительных мэшин - то, что они могут имитировать любую машину с дискретными состояниями,- и имеют в виду, когда говорят, что цифровые вычислительные машины являются универсальными машинами. Из того, что имеются машины, обладающие свойством универсальности, вытекает важное следствие: чтобы выполнять различные вычислительные процедуры, нам вовсе не нужно создавать все новые и новые разнообразные машины (если отвлечься от растущих требований к быстрое вычислений). Все вычисления могут быть выполнена с помощью одной-единственной цифровой вычислительной машины, если снабжать ее надлежащей программой для каждого случая. В дальнейшем мы увидим в качестве следствия из этого результата, что все цифровые вычислительные машины в каком-то смысле эквивалентны друг другу"*.
Во-вторых (для философа это крайне важно), любой процесс, в случае если его можно формализовать таким образом, чтобы он представлял собой последовательность правил выполнения некоторых действий над дискретными элементами, может быть, по крайней мере в принципе, воспроизведен на такой машине. Следовательно, даже аналоговая вычислительная машина может быть промоделирована на машине цифровой, при условии что отношение между состояниями входа аналоговой машины и состояниями ее выхода будет описано точной математической функцией**.
* Там же, с, 31.
** В гл. 5 нам представится случай разобраться в том, как этот принцип создает у исследователей, работающих в области моделирования мыслительных процессов человека, глубокую, однако ни на чем не основанную уверенность в правильности избранного ими пути*
12
Однако эти машины так и остались бы просто арифмометрами-"переростками", если бы в них не нашли свое воплощение идеи Платона, рафинированные двумя тысячелетиями развития метафизики. Наконец появилась машина, оперирующая "квантами" данных по синтаксическим правилам. Более того, эти правила встроены в схемы самой машины. После того как в машину закладывается программа, отпадает всякая необходимость в интерпретации: никакого обращения к человеческой интуиции, никаких суждений, основанных на мнениях. Именно к этому стремились Т. Гоббс и Г.Лейбниц; недаром М. Хайдеггер справедливо назвал кибернетику кульминацией философской традиции*.
Таким образом, пока практичные люди вроде Дж. Эккерта и Дж. Мошли проектировали в Пенсильванском университете первую электронную цифровую вычислительную машину, теоретики, такие, как А. Тьюринг, пытаясь понять, какова сущность и возможности машин такого типа, оказались вовлеченными в круг вопросов, который до той поры находился в ведении философов; какова природа рассуждения как такового?
В 1950 г. Тьюринг написал программную статью "Вычислительные машины и интеллект", в которой подчеркнул, что «наш интерес к "мыслящим машинам" возник благодаря машине особого рода, обычно называемой "электронной вычислительной машиной" или "цифровой вычислительной машиной"»**. Затем он поставил вопрос: "Могут ли (такие.- Х.Д.) машины мыслить?"
Для получения ответа на него Тьюринг предложил тест, который назвал игрой в имитацию. Мы читаем:
"Эта новая форма проблемы может быть описана с помощью игры, которую мы назовем "игрой в имитацию". В этой игре участвуют три человека; мужчина (А), женщина (B) и кто-нибудь задающий вопросы (С), которым может быть лицо любого пола. Задающий вопросы отделен от двух других участников игры стенами комнаты, в которой он находится. Цель игры для задающего вопросы состоит в том, чтобы определить, кто из двух других участников игры является мужчиной (А), а кто -женщиной (В) - Он знает их под обозначениями X и У и в конце игры говорит либо: "X есть А и У есть В", либо: "X есть В, и У есть А". Ему разрешается задавать вопросы такого, например, рода:
С: "Попрошу X сообщить мне длину его (или ее) волос".
Допустим теперь, что в действительности X есть А. В таком случае А и должен давать ответ. Для А цель игры состоит в том, чтобы побудить С прийти к неверному заключению. Поэтому его ответ может быть, например, таким:
* М. Неidеgger. La fin de la philosophie et la tache de la pensee,-ln: Kierkegaard vivant, Paris, 1966, p. 178-17913: "В нашу эпоху философия пришла к своему завершению. Она нашла свое место в научном взгляде на мир.,. Фундаментальной особенностью научного детерминизма является его кибернетичность",
** А.Тьюринг. Цит, соч., с. 22-23.
13
"Мои волосы коротко острижены, а самые длинные пряди имеют около девяти дюймов в длину".
Чтобы задающий вопросы не мог определить по голосу, кто из двух других участников игры мужчина, а кто - женщина, ответы на вопросы следовало бы давать в письменном виде или, еще лучше, печатать на машинке. Идеальным случаем было бы телеграфное сообщение между комнатами, где находятся участники игры. Если же этого сделать нельзя, то ответы и вопросы может передавать какой-нибудь посредник. Цель игры для третьего игрока - женщины (В) - состоит в том, чтобы помочь задающему вопросы. Для нее, вероятно, лучшая стратегия - давать правдивые ответы. Она также может делать такие замечания, как: "Женщина - я, не слушайте его!" - но этим она ничего не достигнет, так как мужчина тоже может делать подобные замечания.
Поставим теперь вопрос: "Что произойдет, если в этой игре вместо А будет участвовать машина?" Будет ли в этом случае задающий вопросы ошибаться столь же часто, как и в игре, где участниками являются только люди? Эти вопросы и заменят наш первоначальный вопрос: "Могут ли машины мыслить?"*
Этот тест получил известность как тест Тьюринга. Вероятно, философу простое сходство в поведении машины и поведении человека покажется недостаточным основанием для признания за машиной свойства разумности**, но в качестве цели работы для тех, кто действительно пытается построить думающую машину, а также в качестве критерия, которым можно было бы пользоваться при критической оценке этих попыток, тест Тьюринга подходил как нельзя лучше.
Конечно, ни одна из существовавших тогда машин не могла быть немедленно использована в качестве партнера в игре Тьюринга. Цифровые вычислительные машины, несмотря на их быстродействие, точность и универсальность, все еще оставались ничем иным, как устройствами для переработки символов произвольного вида. Дело, однако, явно склонялось в пользу лейбницевской позиции. Пришло время для создания соответствующего символизма и детальных предписаний, с помощью которых правила ведения рассуждений можно было бы включить в программу для вычислительной машины. Осознав эту задачу, Тьюринг и предложил критерий проверки эффективности такой программы. Однако его статья заканчивается лишь очень общими соображениями по поводу имеющихся перспектив:
"Мы можем надеяться, что машины в конце концов будут успешно соперничать с людьми во всех чисто интеллектуальных областях. Но какие из этих областей наиболее пригодны для того, чтобы начать именно с них? Решение даже этого вопроса наталкивается на затруднении. Многие считают, что начать лучше всего с какой-нибудь очень абстрактной деятельности, например с игры в шахматы. Другие предлагают снабдить машину хорошими органами чувств, а затем научить ее понимать и говорить по-англий-
* Там же, с. 19-20,
** См., например, критические статьи К. Гундерсома и М.Скрайвена в кн.: A. R. Anderson. Minds and Machines. N.Y., Prlntice-Hah, 1964.
14
ски. В этом случае машину можно будет обучать, как ребенка: указывать на предметы и называть их и т. д. В чем состоит правильный ответ на этот вопрос, я не знаю, но думаю, что следует испытать оба подхода"*
Методов нахождения правил, существование которых предполагали мыслители от Платона до Тьюринга - методов превращения любой практической деятельности, будь то игра в шахматы или обучение языку, в набор указаний-команд, который Лейбниц называл теорией,- еще не было. Но немедленно, как будто по подсказке Тьюринга, начались работы по программированию игры в шахматы и машинной обработке информации, записанной на естественном языке. В том же году, когда была опубликована статья Тьюринга, появилась статья создателя теории информации К. Шеннона о машинах, играющих в шахматы, в которой обсуждались возможные подходы к программированию игры в шахматы на цифровой вычислительной машине.
"Исследование одного направления развития игры на 40 кодов вперед настолько же плохо, как и исследование вариантов только на два хода. Подходящим компромиссом было бы исследование только важнейших возможных вариантов, таких, как форсированные варианты взятия фигур и основные угрозы, и продолжение их исследования настолько далеко, чтобы проверить каждый такой вариант до полной ясности. Вполне возможно установить некоторые грубые критерии для выбора важнейших вариантов, конечно, не так эффективно, как это делает шахматист, но достаточно для того, чтобы ощутимо уменьшить число вариантов и, следовательно, позволить рассматривать достаточно глубоко выбранные варианты"**.
К. Шеннон не составил шахматной программы, но он выразил уверенность в том, что "по описанной выше программе машина будет играть довольно сильно и по скорости сравнимо с человеком"***.
В 1955 г. А. Ньюэлл произвел серьезный обзор проблем, возникающих при программировании игры в шахматы, включив в него собственные соображения по поводу того, как к этим проблемам можно было бы подойти. Он писал: "Эти (предлагаемые им.- Х.Д.) механизмы настолько сложны, что невозможно сказать заранее, будут ли они работать"****. Однако уже в следующем году мы стали свидетелями потрясающего успеха. Группа исследователей из Лос-Аламоса составила программу, которая позволила машине играть в шахматы на уменьшенной
* А. Тьюринг. Цит. соч., с. 57.
** К. Ш е н н о н. Машина для игры в шахматы.- В кн.: К.Шеннон. Работы по теории информации и кибернетике1. М-, 1963, с. 187. ***Там же, с. 188.
**** А. Newell. The Chess Machine.- In: The Modeling of Mind, К. М. Say-re and FJ. Crosson (eds.). South Bend, tnd., Notre Dame University Press, 1963, p. 89.
15
доске - хотя и слабо, но с полным соблюдением шахматных правил. Анализируя эту работу, А.Ньюэлл, Дж.Шоу и Г.Саймон писали: "машина с очень несложной программой способна по крайней мере вступить на шахматное поприще: она может обыграть начинающего игрока"*- К 1957 г. А. Бернштейн уже располагал программой для IBM-7G4, сыгравшей две "сносные любительские партии"**.
Тем временем А.Эттингер работал над реализацией второго из предложенных Тьюрингом подходов. Уже в 1952 г, он реализовал на машине программу, моделирующую простой условный рефлекс-способность усиления или ослаблении определенной реакции в зависимости от положительного или отрицательного подкрепления. Затем А.Эттингер занялся проблемой автоматического перевода и составил программу для машинной реализации русско-английского словаря. Казалось, что дальнейшие исследования в этом направлении приведут к созданию такой машины, которую можно научить устанавливать связи между словами и объектами.
Однако ни тот, ни другой подход не привели ни к чему, хотя бы отдаленно напоминающему общую теорию разумного поведения. Отсутствовали правила, в соответствии с которыми любой вид интеллектуальной деятельности можно было бы представить в виде набора инструкций (команд, указаний). В это время Г.Саймон и А.Ньюэлл, анализируя процесс решения студентами логических задач, обратили внимание на то, что их испытуемые зачастую пользуются такими правилами или "прямолинейными" приемами, которые, не будучи универсально применимыми, во многих случаях приводят к успеху, хотя случается и так, что они не позволяют решить задачу. Примером такого чисто эмпирического приема может служить следующее правило: всегда старайся заменить длинное выражение более коротким. А.Ньюэлл и Г.Саймон решили попытаться разработать модель такого практического интеллекта. Получающиеся при этом программы были названы "эвристическими" этим подчеркивалось их отличие от так называемых алгоритмических программ, которые хотя и гарантируют решение соответствующих задач (используя метод исчерпывающего поиска), однако слишком громоздки для практической реализации.
Понятие практически применимого правила дало возможность расширить поле деятельности исследователей, занятых поисками путей программирования на вычислительных машинах таких
* А. Ньюэлл, Дж. Шоу, Г.Саймон. Программа для игры в шахматы и проблема сложности. -- В кн.: Вычислительные машины и мышление, под ред. Э.Фейгенбаума и Дж. Фепьдмана^. М., 1967, с.45.
** Тамже, с. 45.
16
форм поведения, которые имеют место при решении задач общего характера. Волнение, вызванное появлением этой новой идеи, в некоторой степени отразилось на первом параграфе ставшей классической статьи А.Ньюэлла, Дж.Шоу и Г.Саймона «Эмпирические исследования машины "Логик-теоретик"; пример изучения эвристики»:
"Эта работа касается изучения процесса решения задач и является частью программы исследования сложных систем обработки информации. Мы разработали схему дни нахождения доказательства теорем в элементарной символической логике. Составив по этой схеме программу для вычислительной машины, мы с ее помощью получили эмпирические данные, касающиеся процесса решения задач в элементарной логике- Мы назвали эту программу «машина Логик-теоретик» (ЛТ). Она была разработана для того, чтобы изучить возможность решения таких трудных задач, как доказательство математических теорем, выявление научных законов в совокупности опытных данных, игра в шахматы или понимание смысла английской прозы.
Цель настоящего исследования -разобраться в тех сложных процессах ("эвристиках"), которые участвуют в решении задач. Поэтому мы не интересуемся методами, обеспечивающими решения задач, но требующими очень большого объема вычислений, а стремимся понять, каким образом, например, математик в состоянии доказать теорему, даже если он вначале не знает, как ему это сделать, и сможет ли он вообще ее доказать" .
Однако вскоре А.Ньюэлл и Г.Саймон осознали, что и этот подход не может считаться достаточно общим. В следующем, 1957 г. они поставили перед собой задачу выделить используемые в "Логике-теоретике" эвристики и применить их к другим задачам того же рода. В результате возникла программа, получмвшая название "Общий решатель задач"-по-английски "General Problem Solving (сокращенное название - GPS). Мотивы, побудившие ее авторов заняться "Общим решателем задач", и направленность всей работы в своем первом серьезном отчете об этом начинании Ньюэлл, Шоу и Саймон объясняют следующим образом:
"Данная статья... является частью работы, посвященной изучению чрезвычайно сложных процессов, протекающих при разумном, адаптивном и творческом поведении .,
Решению задач может способствовать использование информации самого различного рода; информация может подсказать порядок, в котором следует проверять возможные решения; послужить основанием для того, чтобы исключить из рассмотрения целый класс решений, считавшихся ранее допустимыми; она может оказаться простым тестом для различения правдоподобных и маловероятных вариантов и т. д. Всякая информации такого рода есть эвристика, то есть то, что способствует открытию. Эвристики в редких случаях могут служить безошибочным руководством... Они часто "срабатывают", но их результаты варьируют от
А. Ньюэлл, Дж. Шоу, Г Саймон. Эмпирические исследования машины "Логик-теоретик"; пример изучения эвристики. - В кн.: Вычислительные машины и мышление, 113.
17
задачи к задаче, и успешность их применения нельзя гарантировать"*.
Для того чтобы передать смысл тех общих эвристик, которые Ньюэлл и Саймон используют в своей программе, они приводят пример повседневного разумного поведении:
"Я хочу отправить своего сына в ясли. Что мешает достичь соответствия между тем, что есть, и тем, к чему я стремлюсь? Расстояние. Что может устранить это несоответствие? Использование автомашины. Но мой автомобиль не работает. Что нужно, чтобы он заработал? Новый аккумулятор. А где его достать? В авторемонтной мастерской. Итак, мне нужно обратиться в авторемонтную мастерскую. Но в мастерской не знают о том, что мне нужен аккумулятор. В чем затруднение? В связи. Как установить связь? Для этого существует телефон... И так далее.
Такого рода анализ - классификация объектов с точки зрения функций, которые они выполняют, и переход от поставленных целей к необходимым для их выполнения функциям и средствам их реализации и обратно - составляет основу системы эвристик GPS.
Точнее, такая эвристическая система анализа в терминах "средств и целей" предполагает следующее:
1.Если дан объект, отличный от цели - желаемого объекта,- то следует стремиться к тому, чтобы установить различия между наличным объектом и целью.
2.Операторы воздействуют на одни признаки операндов10, оставляя другие неизменными. Следовательно, операторы можно охарактеризовать, указав на изменений, которые они производят; применяя соответствующие операторы к имеющимся объектам, можно устранять различия между ними и целевыми объектами.
3. Одни различия поддаются воздействию операторов с большим трудом, чем другие. Поэтому следует стремиться к элиминации "трудных" различий, пусть даже ценой введений новых различий, но меньшей трудности. Этот процесс можно продолжать до тех пор, пока не будет достигнут прогресс в элиминации более "трудных" различий"**.
Когда выяснилось, что цифровые машины могут решать задачи такого, например, рода, как задача о людоедах и миссионерах (каким образом переправить через реку трех людоедов и трех миссионеров, и при этом так, чтобы ни один миссионер не был съеден?) 17, возникло ощущение, что наконец-то мечта философов нашла необходимые для своей реализации технические средства и что в универсальную быстродействующую ЭВМ удалось ввести правила, превращающие рассуждение в вычисление, Г.Саймон и А.Ньюэлл почувствовали важность момента и торжественно провозгласили наступление эры разумных машин:
"Мы начинаем понимать, как использовать ЭВМ для решения задач, по отношению к которым мы не располагаем регулярно применимыми и эффективными алгоритмами. И теперь, по крайней мере в некоторой ограниченной области, мы умеем не только программировать
* A. Newell, J. C.Shaw and H. A. Simоn. Report on a General Problem-Solving Program, -In: Proc. int. Conf. on Information Processing, Paris, UNESCO, 1960, p. 257. ** Ibid., p. 259.
18
ЭВМ таким образом, чтобы она успешно выполняла действия, ведущие к решению задачи, но и закладывать в нее способность научения этому.
Короче говоря, теперь в нашем распоряжении имеются элементы теории эвристического (в отличие от алгоритмического) решения задач. Мы можем использовать эту теорию как для того, чтобы понять, как организованы эвристические процессы у человека, так и для того, чтобы моделировать эти процессы на цифровой машине. Интуицию, инсайт и обучение нельзя более считать исключительной прерогативой человека; ими располагает любая достаточно крупная быстродействующая ЭВМ, запрограммированная соответствующим образом"*.
Эта область исследований, в которой цифровые вычислительные машины используются для моделирования разумного поведения, вскоре получила название "искусственного интеллекта". Не следует, однако, думать, что она действительно соответствует этому названию. Вне всякого сомнения, искусственная нервная система, в достаточной степени близкая к человеческой, которая связана с органами чувств и реализована в некотором теле, конечно, будет обладать разумом. Однако термин "искусственный" не означает, что исследователи искусственного интеллекта пытаются построить искусственного человека. На современном уровне развития физики, химии и нейрофизиологии это недостижимо. Саймон и другие пионеры "искусственного интеллекта" предлагают создать нечто более ограниченное: эвристическую программу, дающую возможность цифровой машине, перерабатывающей информацию, проявлять разумность.
Термин "интеллект" тоже может привести к недоразумениям. Проектируя робота, никто не ожидает от него, что он будет воспроизводить любое поведение, которое считается разумным для человека. Роботу не придется, например, выбирать себе хорошую жену или переходить улицу на оживленном перекрестке. Он должен конкурировать с человеком только в более объективных и отвлеченных сферах человеческого поведения - с тем чтобы быть в состоянии одержать верх в игре Тьюринга.
Но именно эта ограниченность цели, поставленной исследователями, работающими в области "искусственного интеллекта", придает такое большое значение их работе. Эти "последние метафизики" делают ставку только на способность человека к формализации своего поведения; в случае выигрыша они смогут, пренебрегая мозгом и телом, постичь самую суть рационального.
Вычислительные машины уже привели к научно-технической революции, сравнимой по значению с промышленной революцией. Если Саймон прав, говоря о неизбежности "искусственного интеллекта", то ЭВМ подводят нас к грани свершения еще более значительной, концептуальной революции - к изменению наших
* H.A.Simon, A.Newell Heuristic Problem Solving: The Next Advance in Operations Research.- Operations Research, vol. 6, 1958, January-February, p. 6.
19
представлений о человеке. Важность этой революции ощущается всеми, однако мы настолько близки к соответствующим событиям, что порой бывает трудно четко представить себе их смысл. Во всяком случае, ясно следующее. Аристотель назвал человека разумным животным, и с тех пор считалось, что разум неразрывно связан с сущностью человека. Если мы находимся на пороге создания искусственного интеллекта, то в ближайшее время мы станем свидетелями триумфа весьма ограниченного представления о разуме. Действительно, если разум может быть "заложен" в вычислительную машину, то это подтвердит такое понимание природы человека, к которому в течение двух тысяч лет на ощупь шли западные мыслители и которое лишь сегодня получило средства для выражения и реализации. Воплощение этой интуитивной идеи коренным образом изменит наши представления о самих себе. Если же создание "искусственного интеллекта" окажется невозможным, то нам придется найти ту границу, которая отделяет человеческий разум от искусственного, что также радикально изменит наше понимание самих себя. Таким образом, наступил тот момент, когда мы должны либо окончательно признать, что имеющее за собой глубочайшую традицию интуитивное прозрение оказалось верным, либо отказаться от тех представлений, которые в течение двух тысячелетий считались проникновением в природу человека.
Хотя сейчас, по-видимому, еще не наступило время решения этого вопроса, мы все-таки обязаны попытаться определить масштабы и пределы такого рода разума, который полностью вступил в свои права с тех пор, как "аналитическая машина" была доведена до совершенства. Мы должны попытаться понять, в какой степени осуществим "искусственный интеллект", а если возможности машинного моделирования разумного поведения ограниченны, мы должны найти эти границы, определить, где они проходят. Все, что мы узнаем о границах разумного в применении к вычислительным машинам, будет добавлением к нашему представлению о характере и объеме человеческого интеллекта. Для этого нам понадобится ни больше ни меньше, как критика "искусственного разума".
II
Потребность в критике "искусственного разума" есть лишь частное проявление общей потребности в критическом отношении к наукам о поведении. Н.Хомский однажды заметил, что в этих науках "всегда наблюдалась вполне естественная, но достойная сожаления тенденция к "экстраполяции": полученный в результате тщательной экспериментальной работы и точной обработки
20
данных минимум знаний экстраполировался на вопросы, которые имеют гораздо более широкое значение и наполнены огромным социальным содержанием". Его вывод, относящийся к 1968 г., состоит е следующем:
«[ Специалисты ] несут на себе ответственность за тог чтобы были ясны действительные пределы их знания и тех результатов, которые получены ими на сегодняшний день, а внимательный анализ этих пределов продемонстрирует, по моему мнению, что практически в каждой области социальных и поведенческих наук достигнутые на сегодня результаты не оправдывают такую "экстраполяцию"»*.
На первый взгляд кажется, будто искусственный интеллект является счастливым исключением из этого прискорбного правила. Каждый день мы читаем о том, как цифровые вычислительные машины играют в шахматы, переводят тексты, распознают образы и скоро вообще смогут делать всю нашу работу. В самом деле, это начинает походить на детскую забаву. В буквальном см: юле этого слова! В издании Североамериканского газетного объединения, вышедшем в декабре 1968 г., была помещена статья, озаглавленная "Компьютер для детишек", в которой говорится:
"Западногерманское издательство "Космос".-, предложило новую идею подарка... Это самый настоящий (хотя и маленький) компьютер стоимостью не более 20 долларов. Работает на батарейках и внешне напоминает портативную пишущую машинку. Однако, как и в любую большую ЭВМ, в это устройство можно вводить программы для перевода с иностранных языков, диагностики заболеваний и даже для получений прогноза погоды".
Из статьи под названием "Будьте знакомы: Шейки -первый электронный человек", появившейся 20 ноября 1970 г, в журнале "Life", ошарашенный читатель узнает о существовании ЭВМ, «"смонтированной из пяти главных электронных систем, в значительной степени соответствующих основным способностям человека: восприятию, разуму, речи, памяти [и] "самосознанию"» . Судя по статье, эта ЭВМ "видит", "понимает", "учится" и вообще "доказала, что машины могут мыслить". Цитируются также высказывания некоторых известных ученых - специалистов по вычислительным машинам, которые предсказывают, что по прошествии трех-пятнадцати лет "будет создана машина, общий интеллект которой будет на уровне среднего человека, а еще через несколько месяцев он окажется на уровне гения,..".
Хотя до создания совершенного робота пройдет еще несколько лет, все, кто интересуется, как будет выглядеть мир на рубеже двух столетий, могут посмотреть фильм "2001 год: космическая Одиссея", в котором показан робот по имени ХЭЛ, невозмутимый, рассудительный, знающий и умеющий чуть ли не все на свете. И этот фильм нельзя считать просто плодом научной фантазии: "Космическая Одиссея" снималась после тщательной
* Н. Хомский. Язык и мышление19 М., 1972, с. 10-11.
21
документальной проверки. Постановщик фильма С.Кубрик консультировался с самыми видными специалистами по вычислительной математике и технике, стремясь избежать ошибок и не включать в фильм совсем уж маловероятные вещи. Сам Тьюринг в 1950 г, выразил уверенность в том, что "к концу нашего века употребление слов и мнения, разделяемые большинством образованных людей, изменятся настолько, что можно будет говорить о мыслящих машинах, не боясь, что тебя поймут неправильно"*. Технический консультант этого фильма профессор Массачусетского технологического института М.Минский, работавший в своей лаборатории над одним из первых прототипов ХЭЛа, заверил Кубрика, что если Тьюринг и ошибается, то только в сторону излишнего пессимизма.
Тот факт, что С. Кубрик правильно истолковал слова М. Минского, очевиден из редакционной статьи последнего в "Science Journal", которая весьма напоминает сценарий к фильму "2001 год":
"Сначала машины выполняли самые простые действия. Но скоро их поведение станет фантастически изящным. Если раньше глаза ЭВМ могли нащупать лишь дырочки на перфокартах, то сейчас они распознают контуры на ровном фоне. Скоро они станут соперничать с человеком в анализе окружающей его обстановки. Было время, когда машины просто склады-вали столбики цифр. Сейчас они могут участвовать в играх (типа шахмат), понимают простой разговор, учитывают множество факторов при принятии решений. Что будет дальше?
Сегодня машины решают задачи главным образом по тем правилам, которые мы в них закладываем. Однако недалеко то время, когда мы, возможно, научимся настраивать их таким образом, чтобы они могли работать над очень важной проблемой совершенствовании собственной способности решения задач. При этом может случиться так, что после перехода через некоторый порог способности машины будут расти все быстрее, словно по спирали удаляясь от исходной точки, так что создание надежного их "регулятора" окажется совсем нелегким делом"**.
Складывается впечатление, что нет предела размаху и великолепию надлежащим образом запрограммированной ЭЦВМ, Неудивительно поэтому, что среди тех, кто занимается философией науки, встречается мнение, согласно которому машина в состоянии делать все, что в состоянии делать человек (это сопровождается попыткой представить себе, чем такая точка зрения чревата для философского осмысления разума); в то же время некоторые моралисты и теологи не на жизнь, а на смерть защищают такие в высшей степени утонченные формы поведения, как моральный выбор, любовь и творчество, считая их находящимися вне досягаемости машины. Однако мыслители как того, так и другого
* А. Тьюринг. Цит. соч., с. 32.
** M.Minsky. Machines Are More Than They Seem.-Science Journal, 1968, October, p. 3,
22
толка оставляют без внимания вопрос, который должен был бы предшествовать всем остальным, а именно: действительно ли машины могут достичь хотя бы элементов творчества, играя в шахматы, разрешая простые проблемные ситуации, читая простые предложения и распознавай образы? По-видимому, это связано с тем, что под влиянием прессы и таких исследователей, работающих в области "искусственного интеллекта", как М. Минский, у них сложилось впечатление, что простые задачи - и даже некоторые из очень трудных - уже решены или находятся на пороге решения. Поэтому прежде всего займемся проверкой этих заверений.
Уместно начать с предсказания, сделанного Г.Саймоном в 1957 г., когда, казалось, его "Общий решатель задач" открывал эру искусственного интеллекта:
"В мои намерения не входит удивить или поразить вас. То, что я хочу сказать, можно выразить в нескольких словах: в настоящее время в мире существуют машины, которые мыслят, учатся и проявляют способность к творчеству. Более того, эти их способности будут быстро расти вплоть до того момента в обозримом уже будущем, когда сфера их деятельности охватит круг всех вопросов, над которыми когда-либо размышлял человеческий разум".
Далее Саймон продолжает:
"1. Не пройдет и десяти лет, как цифровая вычислительная машина станет чемпионом мира по шахматам, если не будут введены правила, не допускающие ее к соревнованиям.
2. Не пройдет и 10 лет, как вычислительная машина найдет и докажет важную и до сих пор неизвестную математическую теорему.
3. Не пройдет и десяти лет, как большинство психологических теорий примет форму программ для вычислительных машин или качественных утверждений о тех или иных характеристиках машинных программ”*
К сожалению, десятая годовщина этого исторического выступления прошла незамеченной, а исследователям "искусственного интеллекта" ни на одной из своих многочисленных конференций (как международных, так и внутри США) так и не удалось выкроить время между докладами, посвященными их успешной работе, чтобы сопоставить эти предсказания с реальными результатами. До настоящего момента прошло уже четырнадцать лет20, и нас по-прежнему предупреждают, что, быть может, вскоре нам будет трудно справляться с нашими роботами. Вне всякого сомнения, давно пора сопоставить эти своеобразные пророчества с действительностью.
По прошествии пяти лет после предсказаний Саймона в опубликованных работах появились намеки на то, что первое из
* H.A.Simon, A.Nеwell, Heuristic Problem Solving: The Next Advance »n Operations Research. Operations Research, voL 6, 1958, p. 6 .
23
его предвидений уже наполовину осуществилось, а в отношении второго наблюдается значительный прогресс. Что касается этого последнего, то есть предсказания о машинных открытиях теорем, то его стали считать "исполнившимся" после того, как У.Р.Эш-би - один из ведущих авторитетов в этой области - в произведенном им обзоре коллективного труда "Вычислительные машины и мышление", вышедшего под редакцией Э.Фейгенбаума и Дж. Фельдмана, поделился своими восторгами по поводу математических способностей надлежащим образом запрограммированной ЭВМ: "Программа Гелернтера для доказательства теорем нашла новое доказательство теоремы pons asinorum, которое не требует никаких построений". Это доказательство, продолжает доктор Эшби, "в течение 2000 лет оставалось незамеченным величайшими математиками.,, будь оно найдено, это доказательство получило бы самую высокую оценку"*.
Машинная теорема выглядит внушительно, и наивный читатель невольно начинает разделять энтузиазм У.Эшби. Однако небольшое углубление в вопрос показывает, что pons asinorum, или «ослиный мост», есть не что иное, как элементарная теорема, доказываемая в геометрии Евклида21; согласно этой теореме, в равнобедренном треугольнике углы, лежащие против равных сторон, равны. Более того, первое упоминание об этом будто бы новом доказательстве, "открытом" машиной, приписывается Пап-пу Александрийскому, жившему в конце III - начале IV в. н.э.** Несоответствие между ликованием Эшби, древностью теоремы и тривиальностью ее доказательства просто поразительно. Нет, мы еще весьма далеки от "важной математической теоремы", которая должна была быть найдена к 1967 году!
История с игрой в шахматы более запутана, она могла бы послужить моделью для изучения процесса возникновения интеллектуального смога, В 1958 г,, через год после предсказания Саймона, появилась тщательно разработанная шахматная программа Ньюэлла, Шоу и Саймона. Как указывалось в их классической работе, названной "Программа для игры в шахматы и проблема сложности", эта программа была "еще полностью не отлажена", так что о ее поведении имелся "лишь небольшой фактический - материал"***; тем не менее авторы предполагают, что принципов, заложенных ими в программу, достаточно для разыгрывания дебютов. Это была последняя подробная публикация, посвященная данной программе. Однако в том же году Ньюэлл, Шоу и Саймон
* W,R. Ashby. Review of E.A. Feigenbaum and J.Feldman feds,). Computers and Thought. The Journal of Nervous and Mental Diseases, vol. 140, No 6, June 1965, p. 468^70.
** D.E. Smith. History of Mathematics. Boston, Ginn, 1925, vol. II, p. 284,
*** A, Newell, J, Shaw and H.Simon, Chess-Playing Program and the Problem of Company, p.60.
24
провозгласили: "Мы составили программу, играющую в шахматы"*. На основе этого заявления Саймон пересмотрел сделанное им ранее предсказание:
" В одной из наших публикаций мы предсказывали, что не пройдет и десяти лет, как ЭЦВМ откроет и докажет важную математическую теорему. Исходя из опыта нашей работы с эвристиками в логике и шахматах, мы готовь/ добавить к этому дополнительное предсказание: понадобится всего лишь незначительное развитие возможностей уже существующей программы для того, чтобы достичь необходимого для такого рода моделирования увеличения ее мощности в решении задач" **.
Доверчивость читателей и энтузиазм Саймона были столь велики, что одних только заверений Ньюэлла, Шоу и Саймона, касающихся их все еще не отлаженной программы, оказалось достаточно, чтобы шахматная машина была запущена на орбиту научной мифологии. В 1959 г. Н.Винер, развивая утверждение Саймона об умении программы "хорошо разыгрывать дебюты", сообщил Институту философии Нью-Йоркского университета, что "машины, играющие в шахматы, типа тех, которые существуют уже сегодня, будут отвечать на ходы мастера ходами, которые рекомендуются для таких позиций в учебниках; на этом уровне машина сможет продолжать игру вплоть до определенного момента в миттельшпиле"***. На том же симпозиуме М. Скрайвен перешел от расплывчатых заверений типа "машины теперь играют в шахматы" к более сильному утверждению о том, что "способности машины уже позволяют ей вести хорошую игру"****.
На самом же деле в нескольких зарегистрированных играх программа Ньюэлла, Шоу и Саймона играла слабо, хотя и по правилам, а в официальной схватке в октябре 1960 г. она проиграла на 35 ходу десятилетнему начинающему шахматисту. Этот факт, однако, не имеет отношения к делу.
В то время как программа Ньюэлла, Шоу и Саймона терпела поражение в плохо сыгранных ею пяти-шести партиях, а порожденная теми же авторами мифическая программа успешно противостояла шахматным мастерам вплоть до миттельшпиля, сами авторы хранили молчание. Когда же года три спустя они вновь обрели дар речи, то сообщили не о трудностях и разочарованиях, а скорее наоборот: как бы продолжая прерванное изложение мифа, в статье, опубликованной в журнале "Behavioral Science", Саймон
* A. Newell, J.Shaw and H. Siтоn, - The Processes of Creative Thinking, The RAND Corporation, P-1320, September 16, 1958, p, 6,
** ibld., p. 78.
*** N.Wiener. The Brain and the Mashine (Summary).-In: Dimensions e, 1961, p. 110,
**** Scriven, The Complete Robot: A Prolegomena to Androidologyp.122
25
объявил о создании программы, которая гложет играть "высокотворческие" шахматные эндшпили, включающие "комбинации, не уступающие по сложности любым из тех, которые вошли в историю шахмат"*. Тот факт, что программа ограничивается только рассмотрением эндшпилей, в которых можно непрерывно шаховать противника, что значительно сокращает перебор вариантов, лишь упоминается, но не подчеркивается. Искусственно создается впечатление, что такие же простые эвристики достаточны для ведения игры на уровне мастера даже в миттельшпиле**. Таким образом, у читателя создается впечатление, что та часть предсказаний, которая касается шахмат, почти реализована. С такими достижениями можно хоть сегодня претендовать на титул чемпиона мира по шахматам. И действительно, один из специалистов по вычислительным машинам назвал прогноз Г.Саймона, рассчитанный на десять лет, "консервативным"***. Другой ученый - Ф. Грюнбергер из корпорации RAND - намекнул, что титула чемпиона мира недостаточно и что следует стремиться к созданию "программы, которая играла бы лучше любого шахматиста"****. Эта новая волна тумана наводит на мысль о загадочном звере из французской легенды, который мог дышать только дымом, им же извергаемым.
А действительность, прихрамывая, плетется позади этих впечатляющих заверений. Замешательство, вызванное моей попыткой привлечь внимание исследователей в области "искусственного интеллекта" к несоответствию между их энтузиазмом и по-
* Н. A. Simоn and P.A. Simon. Trail and Error Search in Solving Difficult Problems: Evidence from The Game of Chess,- Behavioral Science vol. 7 1962, October, p. 429.
** Например, в резюме к работе Г. Саймона и П. Саймона 1см. предыдущее примечание) даже не упоминается, что речь идет о форсированных матах; авторы просто заключают, что "в этой работе делается попытка до какой-то степени рассеять мифический туман, окутывающий игру в шахматы; мы показали, что успешное решение задач основывается не на чудесном даре воспоминания и озарения, а на некоторой эвристической "программе", обладающей высоким уровнем избирательности" (р. 425) , А в заключении к самой статье делается ничем не оправданное обобщение: "Из приведенных данных следует совершенно определенный вывод: мастерам шахматной игры удается находить те или иные комбинации не потому, что они быстрее думают или лучше запоминают, чем другие люди, а потому, что их программы реализуют мощные эвристики выбора" (р. 429). Если к приведенным данным отнестись честно, то из них в лучшем случае следует, что этот вывод применим лишь к некоторым конкретным ситуациям эндшпиля,
*** См,: Р, Армер, О возможностях кибернетических систем22. - В кн.: М. Таубе. Вычислительные машины и здравый смысл- Миф о думающих машинах, 1964, с. 181.
**** F.Grunberger, Benchmarks in Artificial Intelligence.-The RAND Corporation, P-2586, 1962, June, p. 6.
26
лученными результатами, в конце концов привело к появлению более или менее компетентной программы. "Мак Хэк" - программа, написанная Р. Гринблатом, -действительно победила автора этих строк*, типичного шахматиста-любителя, и приняла участие в нескольких турнирах, где выиграла некоторое количество партий. Этот скромный успех возродил былые надежды и претензии. С.Пейперт, второе по рангу лицо в реализации программы разработки роботов в Массачусетсом технологическом институте, выступил в защиту предсказания Саймона, заявив, что "в качестве формулировки ближайших целей, которые исследователи в данной области считают достижимыми, оно вполне разумно"**. А на первой странице октябрьского выпуска "Science Journal" за 1968 г. Д.Мичи, возглавляющий исследования в области "искусственного интеллекта" в Англии, писал: "Сегодня машины могут играть в шахматы на уровне чемпионов"***. Однако, как сказал при обсуждении первых шахматных про* грамм шахматный мастер А. де Гроот, "машины все еще очень слабо играют в шахматы, и у меня мало надежд на существенное улучшение их игры в будущем". Другой шахматист, Э.Херст, обсуждая на страницах журнала "Psychology Today" шахматную программу, составленную в Массачусетском технологическом институте, добавляет, что, хотя "замечание де Гроота было сделано в 1964 г., результаты, полученные "Мак Хэк" на последнем турнире, не изменили бы его мнения"****. То же можно сказать и о положении дел в настоящее время. Программа Грин-блата постепенно усовершенствовалась; однако она достигла, по-
* Ликование, охватившее "машинные" круги в связи с сообщением об этом новом успехе, который якобы подтверждает обоснованность предшествующих заявлений о возможностях ЭВМ, нашло отзвук в книге А. Тофлера "Грядущий шок" (А. Тоffler, Future Schock, New York, Random House, 1971, p. 187). По словам этого автора, я будто бы утверждал, что ни одна вычислительная машина никогда не сможет играть в шахматы даже на любительском уровне. Если взять эту цитату в контексте, то станет ясно, что автор искажает смысл сказанного мною. Мое утверждение сводилось просто к объективной констатации уровня развития программирования шахмат на тот момент (1965 г.), когда оно было выдвинуто: "В соответствии с оценкой, даваемой Ньюэллом, Шоу и Саймоном программам Лос-Аламосской группы исследователей, группы исследовательского центра фирмы IBM и их собственной, "все три программы играют приблизительно на одном уровне (посредственном), затрачивая при этом приблизительно одно и то же машинное время". Однако ни одна шахматная программа не в состоянии вести игру даже на уровне любителя, в то время как до мирового чемпионата по шахматам осталось только два года".
** S. Рарert\ 9th RAND Symposium, 1966, November 7, p, 116.
*** D. Miсhie. Machines that Play and PJan.-"Science Journal/' vol. 4-. 1968, No. 10, October, p. 83.
**** E. Hearst. Psychology Across the Chessboard.-Psychology Today 1967, June, p. 32.
27
видимому, некоторой точки "насыщения". За прошедшие два года она проиграла все партии в турнирах, в которых принимала участие, и больше о ней не упоминалось. Вскоре мы увидим, что, учитывая ограниченные возможности вычислительных машин, именно этого и следовало ожидать.
К чести Р. Гринблата следует сказать, что, даже когда его "Мак Хэк" находилась в зените славы, он избегал предсказаний; что же касается прогнозов Саймона и вопроса об участии ЭВМ в борьбе за шахматную корону, то заметим только, что десять лет давно прошли, а вычислительная машина в лучшем случае в состоянии претендовать в шахматах на категорию С23, то есть любительскую категорию*.
Надеюсь, что этот беглый обзор положения дел в данной области и его сопоставление с обоими предсказаниями Салопа прояснили существующую ситуацию. Очень важно с самого начала отдавать себе отчет в том, что, несмотря на всякого рода предсказания, сообщении в печати, демонстрации кинофильмов и т.д., "искусственный интеллект" все еще остается обещанием, а не свершившимся фактом. Только при этом условии мы можем начать исследование реального положения дел и будущих перспектив, касающихся "искусственного интеллекта” на достаточно изначальном уровне.
В области "искусственного интеллекта" существует множество делений и подразделений, но самые важные работы можно сгруппировать в следующие четыре направления: программирование игр, автоматический перевод, решение задач24 ц распознавание образов. Какого уровня достигли исследователи в программировании игр, мы уже видели. Ниже мы займемся более детальным анализом остальных трех направлений. Основной тезис, развиваемый мною в части I, сводится к тому, что в области "искусственного интеллекта" ход событий следует одной и той же схеме: первоначальный впечатляющий успех быстро сменяется неожиданными трудностями. Эта схема присутствует во всех четырех областях, реализуясь в два этапа, каждый из которых
* Третье предсказание - о том, что большинство психологических теорий примут форму программ для ЭВМ, - действительно до некоторой степени осуществилось, хотя в психологии до сих пор имеется немало "чистых бихевиористов”. Однако действительно важным является не решение тех или иных задач, пусть даже весьма значительных (например, составление программ игры в шахматы на уровне мастера или доказательство нетривиальных теорем), а то, представляет ли реализация некоторого предсказании фактический шаг вперед. Так, неясно, насколько плодотворным а психологии оказывается переход от "поведенческих" моделей к моделям машинным. Этот вопрос достаточно сложен и требует подробного обсуждения (см. гл. 4).
28
длится приблизительно пять лет. С 1957 по 1962 г. (гл. 1) в основном велись работы по моделированию познавательных процессов, заключавшиеся в использовании эвристического программирования для машинного воспроизведения человеческого поведения; при этом предпринимались попытки имитации тех мыслительных переходов, которыми человек фактически пользуется. На втором этапе (гл. 2) центром тяжести стало изучение процессов переработки семантической информации. Здесь термин "искусственный интеллект" приобрел более узкий смысл, чем тот, который я в него вкладывал в предшествующем изложении.
ИИ {я буду использовать такое сокращение для обозначения этого более узкого смысла} представляет собой попытку моделирования разумного поведения человека с помощью таких методов программирования, которые не имеют или почти не имеют сходства с мыслительными процессами человека. Трудности, с которыми мы сталкиваемся при таком подходе, уже начали проявляться. Остальные главы части I касаются вопроса о том, какова основная причина всех этих, казалось бы не связанных между собой, неудач.
Однако все практические трудности и провалы ни в коей мере не приводят в отчаяние самих исследователей: создается впечатление, что их оптимизм растет с каждым новым разочарованием. Поэтому мы вынуждены заняться вопросом о том, какие предпосылки заложены в столь стойком к постоянным неудачам оптимизме, В части II предпринимается попытка выявить четыре допущения, четыре глубоко укоренившихся предрассудка, которые мешают видеть всю серьезность создавшегося безвыходного положения и прояснить путаницу понятий, порождаемую этими предрассудками.
Эти предрассудки столь глубоко укоренились в нашем сознании, что кажется, будто единственной альтернативой дли" них может быть обскурантистское отрицание всякой возможности точной науки о человеческом поведении. В части III мы попытаемся отвести это опасение (в той мере, в какой его можно вообще отвести), предлагая некоторую альтернативу упомянутым традиционным допущениям; последняя основывается на идеях, выдвинутых теми мыслителями XX столетия, в работах которых имплицитно содержится критика "искусственного интеллекта", - идеях, которые до сих пор не рассматривались под таким углом зрения.
На этой основе в заключение становится возможным выявление основных характеристик "искусственного разума" и указание его возможностей и его ограничений. Это в свою очередь создает базу для разграничения различных форм разумного поведения и оценки, в какой степени каждая из них может быть предметом программирования - как с практической точки зре-
29
ния, так и в принципе.
В некотором ограниченном круге вопросов ИИ может - и, по всей вероятности, будет - иметь практическую ценность, несмотря на те ограничения, которые, как я попытаюсь показать в дальнейшем, являются фундаментальными. (Я ограничиваюсь рассмотрением только ИИ, ибо все еще неясно, может пи то наивное моделирование человеческого процесса познания - в том виде, в каком оно имеет место сегодня, - иметь вообще какую бы то ни было ценность, кроме, может быть, той, что оно служит нагляднейшим доказательством того факта, что человек, демонстрирующий разумное поведение, обрабатывает информацию не так, как это делает эвристически запрограммированная ЭЦВМ.) Устройства специального назначения могут заменять человека при выполнении некоторых задач, например в исследованиях других планет; при этом они не обязательно должны действовать так же, как человек, и проявлять свойственную человеку гибкость. Неверно говорить, что исследования в этой области не имеют смысла, хотя следует заметить, что определенное философское осмысление вопроса и здесь способствовало бы выработке более трезвого взгляда на то, чего можно и чего нельзя ожидать от такого рода устройств.
30
нового слова, иногда достаточно просто указать пальцем на обозначаемый этим словом предмет. Блаженный Августин в своей "Исповеди" и А.Тьюринг в своей статье о "машинном интеллекте" полагают, что именно таким способом мы обучаем детей языку. Однако Л.Витгенштейн замечает, что просто указав пальцем, например, на стол и сказав слово "коричневый", мы тем самым еще не дадим знать ребенку, что именно имеется в виду:. цвет, размер или форма стола, тип объекта или его собственное имя. Если же ребенок уже владеет языком, то ему можно сказать, что имеется в виду именно цвет. Ну, а с чего начать, если ребенок еще совсем не понимает языка? Витгенштейн считает, что для этого ребенок должен быть погружен в своего рода "жизненную среду", в которой он разделяет по крайней мере некоторые из целей и интересов своего учителя; при этом каждодневная деятельность ребенка помогает ему устанавливать соответствия между употребляемыми словами и тем, что они обозначают. Коль скоро это так, то чему же можно научить машину? Именно этот вопрос ставится в одной из немногих серьезных и критически окрашенных работ, вышедших из-под пера исследователей "искусственного интеллекта", . Э.Сэмюэль, составивший известную шашечную программу, утверждает, что машина не может считаться разумной, поскольку она в состоянии делать только то, что ей предписано программой. М.Минский не принимает этого положения, ибо, по его мнению, достижения наших машин могут оказаться неожиданными для нас самих. Сэмюэль, как никто иной, знает об этом, поскольку его собственная шашечная программа его обыграла. Скорее всего, он имеет в виду другое: только запрограммировав машину соответствующим образом, можно вложить в нее способность выигрывать; программирование же в корне отличается от процесса обучения ребенка игре в шашки. Доводы Сэмюэля отклоняются М. Скрайвеном, который утверждает, что новые стратегии «"закладываются" программистом в вычислительную машину... точно в том же метафорическом смысле, в каком мы говорим о "закладывании" в ребенка необходимые для его дальнейшей жизни знаний»*. Однако Сэмюэлю, устоявшему против давления со стороны своих коллег, не следует поддаваться наступлению философов. Информация действительно "закладывается" в машину, но способом, совершенно отличным от процесса обучения детей. Мы только что видели, что этому процессу не дано и, как мы увидим в гл. 6, не может быть дано точное определение. Наши попытки объяснить обучаемому какое-либо выражение всегда происходят в определенном контексте, помогающем усвоить или уточнить его смысл. Обучение в * М. Scriven. Primary Philosophy. New York, McGraw-Hill 1966 p. 186. 56 отличие от запоминания и заучивания с необходимостью предполагает своего рода оценивание. Вот что пишет по этому поводу Л. Витгенштейн: "Может ли кто-нибудь быть учителем в этом процессе? Конечно. Время от времени он дает ученику нужный намек... Именно в этом заключаются преподавание и обучение в данном случае... На этом уровне человек усваивает не какой-то технический навык, а учится верному взгляду на вещи. Правила здесь также существуют, но они не образуют системы и применять их надлежащим образом могут только опытные люди; как это не похоже на правила, по которым производятся вычисления!"* Вот эта-то способность улавливать смысл в конкретном контексте и характеризует настоящее обучение; как только дети начинают с этим справляться, они постоянно удивляют нас, преподнося нам сюрприз за сюрпризом. Из всего сказанного относительно существенной роли контекста и неоднозначности в процессе использования естественного языка становится понятным, почему работа в области машинного перевода приостановилась на этапе создания машинного словаря. Как мы видели, способность научения языку предполагает ту же сложную комбинацию сугубо человеческих форм "процесса переработки информации", которая необходима для его понимания. Вопрос о том, как с помощью научения обойти трудности, с которыми неизбежно сталкивается эта область исследований, остается открытым. Метод проб и ошибок или отделение существенного от несущественного? В моделировании решения задач также встречаются два типа функционирования мышления: один, элементарный и допускающий разложение на составные части, объясняет удачное начало исследований в данной области; другой, более сложный и включающий в себя феномен "инсайта", оказался недоступным для "пошаговых" программ типа программы "Общего решателя задач" Саймона. При решении элементарных задач наиболее эффективен простой перебор всех возможных комбинаций, продолжающийся до тех пор, пока не подвернется нужное решение. Такой поиск с помощью метода проб и ошибок являет собой еще один пример "силового приема" типа сплошного просчитывания в шахматах. Но как и при моделировании игр, возможности * L. Wittgenstein. Philosophical Investigations. Oxford, Eng, D- Black-well, 1953, p. 227. Здесь Л. Витгенштейн имеет в виду приобретение способности судить о проявлениях чувств, однако его утверждение имеет и более общий смысл. 57 машины и здесь вскоре оказываются исчерпанными. При моделировании решения задач необходимо найти какой-то систематический метод сужения зоны поиска, который не позволял бы тратить время на проверку неперспективных альтернатив. Именно на этом этапе в человеческом мышлении начинает действовать механизм "инсайта" - "озарения", интуиции, в то время как математики-программисты впадают в глубокое уныние. Допустим, что задача сформулирована просто, то есть совершенно детерминистским образом, так что нам известна исходная ситуация, мы представляем себе искомое заключительное состояние и располагаем набором простых, специально заданных операторов для перехода от одного состояния к другому (иными словами, пусть мы имеем дело с тем, что Саймон назвал "простой формальной задачей"). Тогда созданный Саймоном "Общий решатель задач", произведя перебор значительного числа возможностей, будет сближать "начало" и "конец" до тех пор, пока задача не окажется решенной. Мы имеем, таким образом, удачный вариант применения анализа в терминах "средств и целей". Но даже в таком простом случае возникает масса трудностей. Если сравнить этапы машинного решения задачи на основе программы GPS, выданные на печать, с записью словесного отчета испытуемого о том, как он решал ту же самую задачу, то мы обнаружим, что ЭВМ совершала шаги (формальный поиск), которым нет соответствия в протоколе эксперимента. Как же объясняет Саймон факт отсутствия в отчете испытуемого этих шагов? С методологической точки зрения весьма сомнительно: "многое, связанное с задачей, не было высказано субъектом в явном виде (или даже не было им осознано)"*. Еще более необоснованным выглядит предположение Саймона о том, что эти невербализованные операции столь же элементарны, как и те, которые нашли явное выражение в протоколе опыта. А между тем некоторые подробности, упомянутые в работе Ньюэлла и Саймона "GPS - программа, моделирующая процесс человеческого мышления", наводят на мысль о том, что эти глубоко упрятанные операции вообще не имеют ничего общего с операциями, производимыми машиной согласно программе GPS. В одном из экспериментов Саймона испытуемым предлагались задачи, относящиеся к формальной логике; при этом испытуемых снабжали перечнем правил преобразования символических выражений; их просили устно комментировать каждый шаг поиска решения. Не будем излагать правил преобразования; для нас существенно другое; в определенном месте протокола субъект говорит, что он применяет правило (А- В D А) и правило * А. Ньюэлл и Г. Саймон. GPS - программа, моделирующая процесс человеческого мышления. - В кн.; Вычислительные машины и мышление, с. 295. 58 (А-ВЭВ) к конъюнкции ( IRVHPt-(RVQ). По этому поводу Ньюэлл и Саймон замечают: " Субъект использовал обе формы правила 8 совместно, по крайней мере если судить по его рассуждениям, GPS же рассматривает каждую форму правила 8 отдельным пунктом. Возможно, что субъект действует так бессознательно и просто выдает два результата одновременно"*. Не менее вероятно, однако, что испытуемый уловил симметричность конъюнкции относительно преобразования, производи-мого данным правилом, и действительно применил сразу обе его формы. Даже сами Ньюэлл и Саймон признают, что было бы предпочтительнее, если бы GPS применила обе формы правила в одном пункте. Только в этом случае их программа могла бы послужить основой для создания психологической теории, описывающей этапы рассуждений испытуемого. Однако они благоразумно воздерживаются от попыток составить программу, которая могла бы определять, в каких случаях следует применять обе формы правила сразу, а в каких - нет. Составление такой программы (что отнюдь не устранило бы описанного выше несоответствия машинного и человеческого подходов) потребовало бы дополнительных сведений о действиях субъекта - сведений, не нашедших отражения в протоколе эксперимента,- и тем самым привело бы к увеличению расхождений между отчетом испытуемого и программой. Таким образом, будучи не в состоянии избежать этих расхождений и не пытаясь даже понять их смысл, Ньюэлл и Саймон просто отмахиваются от них, считая, что имеют здесь дело с "примером параллельно протекающих процессов"**. Однако в другом приводимом Ньюэллом и Саймоном случае расхождений уже нельзя отделаться такой оговоркой. Так, в одном из протоколов мы читаем: "Собственно говоря, мне следовало бы применить правило 6 лишь к левой части уравнения. Итак, надо применить правило 6, но только к левой части". Саймон пишет: "Здесь есть сильное расхождение со схемой действий GPS... И субъект и GPS нашли, что именно правило 6 подходит для изменения знаков. Здесь GPS просто применила правило к текущему выражению, в то время как испытуемый вернулся назад и исправил предшествующее применение. В программе мы не найдем чего-либо, что соответствовало бы этому * Там же, с. 296. ** См. там же, с. 297. Произвольный характер этого объяснения ad hoc ясен из контекста. Более того, отвечая на соответствующий вопрос во время своей Мэллоновской лекции в Массачусетсом технологическом институте s 1968 г., Саймон сказал по этому поводу, что, по его мнению, параллельно протекающие процессы не играют никакой роли в познании и что, насколько он помнит, он никогда этого не утверждал» 59 действию. Наиболее непосредственное объяснение состоит в том, что применение правила 6 в обратном направлении рассматривается субъектом как уничтожение правила 6, примененного ранее"*. И действительно, это объяснение напрашивается прежде всего, однако Ньюэлл и Саймон, по-видимому, не осознают, что этот отход от схемы действий машины, не объяснимый ссылкой на параллельно протекающие процессы, чреват для их теории таким же крушением, которое потерпела теория Птолемея, когда обнаружилось, что действительные траектории планет ей не соответствуют. Все дело в том, что здесь имеет место какая-то иная форма мышления, отличная от простого поиска! Ньюэлл и Саймон понимают суть проблемы, ибо замечают: "Здесь речь идет о механизме (а может быть, и о целом комплексе механизмов), который отсутствует у GPS"**. Но, подобно древним астрономам, они пытаются спасти свою теорию, добавляя к ней пару-другую эпициклов. Они по-прежнему полагают-без достаточных на то оснований, -что в основе подобного механизма лежат просто более изощренные методы поиска и что если дать GPS возможность "постоянно немного оглядываться назад, на свои предыдущие действия"***, то все будет в порядке. Ньюэлл и Саймон не отдают себе отчета в том, что, представляя разумное поведение как результат применения эвристических правил, они вынуждены принять малоправдоподобную точку зрения, согласно которой намерение субъекта провести анализ предшествующей части решения должно быть результатом в высшей степени избирательной процедуры проверки. В противном случае возникнет необходимость на каждом этапе решения проверять все предыдущие шаги, что безнадежно утяжелит программу. С научной точки зрения более продуктивным было бы произвести дальнейший анализ тех пяти случаев расхождений, о которых говорится в статье Ньюэлла и Саймона, с тем чтобы определить, не используется ли в данном случае человеком какая-либо другая форма "информационных процессов". Так, гештальтпсихолог М.Вертгеймер в своей классической работе "Продуктивное мышление" отмечает, что представление о решении задач как о последовательности проб и ошибок исключает из рассмотрения важнейший аспект процесса решения задач, а именно то "схватывание" ее существенной структуры, которое он называет "инсайтом"****. При выполнении этой операции человек отвлекается от поверхности задачи и видит ее основу - то что М.Вертгеймер * Там же, с. 298-299. **Там же, с. 300, *** Там же. **** M.Wertheimer. Productive Thinking, New York, Harper and Bros., 1945, p. 202. 60 называет "глубинной структурой"; именно она дает ему возможность организовать необходимые для отыскания решения шаги. Может показаться, что эта гештальтистская концепция в корне противоречит операционистским воззрениям сторонников "искусственного интеллекта", однако М. Минский, правда в других выражениях, делает следующее признание: "Способность решения трудной задачи зависит от умения либо разделить ее на несколько подзадач меньшей трудности, либо преобразовать ее в менее сложную задачу. Для того чтобы не делать этого наугад, требуется некоторое понимание ситуации. Человек должен уметь логически обосновать или просто догадаться о последствиях той или иной формулировки задачи, с тем чтобы суметь построить более простые модели проблемной ситуации. Эти модели должны иметь достаточно богатую структуру; тогда, по всей вероятности, найденные для них решения удастся расширить до решения исходной задачи"*. Поскольку при решении сложных задач человек, как правило, прибегает к помощи "инсайта" - интуиции - и поскольку то, о чем говорит М.Минский, никогда не было доведено до уровня программы, нет ничего удивительного в том, что в работе Ньюэлла и Саймона такого рода интуитивная перестройка структуры задачи тайком производится самими программистами. В работе "Процесс творческого мышления" Ньюэлл, Шоу и Саймон для объяснения тех характеристик отчета испытуемого, которые не укладываются в рамки простого анализа в терминах "средств и целей", вводят так называемые проектирующие эвристики ("эвристики планирования"). "Мы разработали программу... описывающую метод, с помощью которого некоторые испытуемые решают логические задачи исчисления О. Мура. Чтобы объяснить, в чем состоит введенное нами понятие "планирования", проще всего, пожалуй, описать эту программу. Исходя из чисто практических соображений, все двенадцать операторов, входящих в эту логическую систему, можно разбить на два класса; операторы одного из них мы будем называть "существенными", второго - "несущественными". Будем считать оператор существенным, если его применение к выражению "сильно" изменит вид этого выражения (примером может служить переход от PVP к Р). Несущественные операторы "слабо" меняют выражение (таков, например, переход от PVQиQVP).Kaк мы уже сказали, различие между существенными и несущественными операторами носит чисто прагматический характер. Из двенадцати операторов рассматриваемого исчисления восемь мы отнесли к классу существенных, а четыре - к классу несущественных... Далее, если нам дано некоторое выражение, то мы можем выделить из него только такие характеристики, которые связаны с существенными изменениями. Например, из выражения PVQ мы можем получить выражение (PG), в котором порядок следования символов можно не принимать во внимание. Очевидно, если к полученному выражению применить несу- * М.Мinsky. Descriptive Languages and Problem Solving,- In: Semantic Information Processing, p. 421 61 щественный оператор, то оно не изменится, в то время как применение существенного оператора может привести к его изменению. Теперь мы можем установить некоторое соответствие между исходными выражениями и операторами, с одной стороны, и производными выражениями и существенными операторами - с другой. При этом исходной задаче преобразования выражения а в выражение b будет соответствовать новая задача - задача преобразования выражения b' в выражении b (где а' и b'извлекаются из выражений а и b соответственно). Предположим теперь, что мы решили эту новую задачу и что последовательность выражений, ведущая к решению, есть а', с', d',... b' . Тогда мы можем вернуться к исходной постановке проблемы и заняться решением новых задач - преобразованием выражения а в с, с в d и т. д. Таким образом, решение задачи в пространстве проектирования дает нам некоторый план решения исходной задачи"*. Комментарии, как говорится, излишни. Остается только подчеркнуть, что описание самой программы начинается с параграфа 2. Классификация операторов на существенные и несущественные, то есть та операция, которую Вертгеймер называет "нахождением глубинной структуры" или "инсайтом", выполняется программистами еще до начала самого программирования. Подобная "ловкость рук" прошла незамеченной для Дж. Миллера, Е. Галантера и К. Прибрама, если судить по их книге "Планы и структура поведения" (1960), которая представляет собой попытку создания психологической теории, разработанной под влиянием работ А,Ньюэлла, Дж.Шоу и Г.Саймона. Дж.Миллер и др. для начала приводят слова Дж.Пойа, прекрасно отдающего себе отчет в том, какую важную роль играет интуиция в решении задач; "В своей известной работе "Как решать задачу",.. Пойа различает... [следующие] фазы эвристических процессов. Во-первых, мы должны понять задачу. Мы должны ясно представить то, что дано, в каких условиях это дано и то неизвестное, которое мы ищем. Во-вторых, мы должны составить план, который приведет нас к решению и свяжет данное с неизвестным"**. Затем Миллер, Галантер и Прибрам сводят к минимуму значение первой фазы; попросту говоря, они решают не обращать внимания на этот этап: "Очевидно, что второй из этих этапов самый трудный. Первый этап, который мы уже описали в главе XI, сводится к созданию четкого образа ситуации, необходимого для того, чтобы найти способ решения этой задачи, Это, конечно, необходимо, но, обсуждая четко сформулированные задачи, мы принимаем, что это уже выполнено" **. Тем не менее вся эта психологическая теория решения задач немногого будет стоить, если в машинную модель не удастся * A.Newell, J.Shaw , H.Simоп. The Processes of Creative Think-jng35,~The RAND Corporation, P-132GH 1958, September 16, p. 43-44. ** Дж. Миллер, Е. Галантер и К, Прибрам. Планы и структура поведении 36. М., 1965, с. 197. *** Там же. 62 ввести этот первый этап. Поэтому нет ничего удивительного в том, что где-то страниц через десять, принимая и оправдывая анализ в терминах "средств и целей" Саймона, Миллер и его соавторы с облегчением ссылаются на "метод планирования"* Саймона, по-видимому, имея в виду те самые абзацы, которые мы только что обсуждали: "Вторая общая система эвристической логики, использованная Ньюэллом, Шоу и Саймоном, состоит в пренебрежении рядом деталей задачи. Обычно это упрощает задачу, и эта упрощенная задача может быть решена с помощью знакомого нам плана. План, используемый для решения простых задач, затем применяется как стратегия при решении исходных сложных проблем. Например, при решении задач пропозиционального исчисления машина может игнорировать различия между логическими связями и порядок символов"**. Но, как мы видели, не машина игнорирует эти решения, а сами Ньюэлл, Шоу и Саймон. Говорить в данном случае об эвристиках - значит просто вводить читателя в заблуждение, поскольку никому еще не удавалось сформулировать правила, по которым производится этот предварительный выбор, а также показать, что на этом требующем интуиции этапе человек вообще следует каким бы то ни было правилам. Таким образом, выясняется, что никакой машинноориентированной теории для этого фундаментального первого этапа решения задач, состоящего в разделении существенного и несущественного, не существует. Только исследователи, столь уверенные в собственной правоте, как Миллер и его соавторы, могли оставить без внимания тот факт, что "метод планирования" Саймона с его предварительной обработкой исходного материала не столько приводит к решению проблемы машинного моделирования, сколько ставит ее. Именно способность человека отделять существенное от несущественного в каждой конкретной задаче объясняет наличие расхождений между отчетом испытуемого, решающего задачу, и результатом работы GPS. Мы уже указывали на то, что испытуемый применяет обе формы правила 8 вместе вследствие того, что уже на этой начальной стадии он осознает равноправие обоих членов конъюнкции. Аналогичным образом вследствие того, что он постиг существенную функцию, которая заключена в правиле 6, субъект в состоянии заметить, что повторное применение этого правила просто нейтрализует предыдущее применение. Как замечает М.Вертгеймер: "Этот процесс (структурирования задачи.- Х.Д.) не исчерпывается рассмотрением данных ее частей и их преобразованиями. Он происходит на основе того материала, который по своей структуре адекватен задаче, но выбирается из прошлого опыта"***. * Там же, с. 214. ** Там же, с. 209-210 (курсив мой.- *** М. Wertheimеr. Productive Thinking, p. 195. 63 Поскольку игра есть одна из форм решения задач, вполне возможно, что этот процесс имеет место в шахматах. Как следует из цитаты Э. Херста, это действительно так. "В результате своего исследования де Гроот приходит к выводу, что различия в силе игры в гораздо меньшей степени зависят от способности просчитывания, чем от умения "концептуально видеть задачу"- По всей вероятности, гроссмейстер превосходит мастера в умении выделять наиболее существенные особенности позиции, а не в общем числе ходов, которые он в состоянии рассмотреть. Несколько неожиданным для де Гроота оказался тот факт, что при выборе конкретного хода гроссмейстеры исследуют не больше возникающих при этом вариантов, чем более слабые игроки или мастера (в среднем от двух до четырех начальных ходов на позицию). Нельзя также сказать, что они просматривают эти варианты на большую глубину (обычно максимум на шесть-семь ходов вперед} -Гроссмейстер каким-то образом способен сразу "увидать" суть задачи, в то время как более слабый игрок постигает ее с трудом или вообще не постигает, даже если анализирует столько же вариантов и видит на столько же ходов вперед, что и гроссмейстер"*. Как мы видели, М. Минский уже в 1961 г. ясно осознавал важность этих проблем. Единственное, на что он надеялся,- это на то, что удастся изобрести такую планирующую программу, в которой обычный эвристический поиск будет использоваться на более высоком уровне. "Когда мы настаиваем на применении "рассуждения", мы ни в коей мере не предлагаем отказаться от нашего основного замысла и ввести некую интеллектуальную процедуру. Программа, управляющая поиском, будет не чем иным, как еще одной эвристической программой. Почти наверняка в нее будут входить в основном только объекты и процессы того же типа, что и в программы первого уровня"**. Но такая планирующая программа со своей стороны потребовала бы разделения операторов на существенные и несущественные. Если сам программист не проведет на каком-то этапе такого разделения, то он будет вынужден бесконечно наращивать планирующие программы, так как для каждой из них потребуется программа более высокого уровня, чтобы формализовать соответствующую ей задачу с плохой структурой. Именно здесь, при переходе от простых форм "информационных процессов" к сложным. Минский делает обычный в таких случаях ход - вводит обучение. " Проблема подбора способа дедукции полезных заключений из большого массива высказываний (то есть проблема соотнесения различных методов с различными типами задач) ставит новую задачу поиска. Логическое исследование должно проводиться только по тем данным, которые * Е.Неаrst. Psychology Across the Chessboard,- Psychology Today, 1967, June, p. 32. ** M.Minsky,Descriptive Languages and Problem Solving.- In: Semantic Information Processing, p. 420. 64 вероятнее всего имеют отношение к текущей задаче. Малоправдоподобно, чтобы эта функция отбора была полностью задана с самого начала. Она должна совершенствоваться по мере накопления данных в ходе эксперимента"*. Однако до сих пор никто даже не попытался гипотетически описать, каким образом машина могла бы осуществлять эту операцию отбора или как следует ее запрограммировать, чтобы она могла научиться этому, поскольку иначе никакое обучение на основе прошлого опыта невозможно. Оценивая работы, выполненные после выхода в свет труда "Вычислительные машины и мышление", Э.Фейгенбаум отмечает бросающееся в глаза отсутствие обучающихся программ: "До сих пор в области ИИ значение машинного обучения для решения проблем осознавалось весьма слабо. Единственную, по существу, за много лет заслуживающую упоминания работу представляет известная шашечная программа Сэмюэля и использованная в ней процедура обучения, (Большой интерес в свое время вызвала предложенная Ньюэллом, Шоу и Саймоном система обучения GPS , однако она осталась нереализованной.) Как это ни удивительно, и в наши дни ситуация остается прежней"**. Такая задержка развития удивительна только для тех, кто, подобно Фейгенбауму, не осознает, что способность к различению существенного и несущественного является чисто человеческой формой "процесса переработки информации", необходимой для обучения и решения задач; она не воспроизводится методами машинного поиска, которые эффективны только после того, как такое разделение произведено. Именно эта функция интеллекта преграждает путь дальнейшему прогрессу в области решения задач. Более того, представление, что проблема планирования может быть решена изолированно и что возможно разделение операторов на существенные и несущественные - наподобие готовых блоков, которые остается только рассортировать,- является представлением чисто иллюзорным, возникшим под влиянием искусственных- ad hoc- приемов решения задач и простых случаев (например, относящихся к области логики); легко поддаться искушению и уверовать в то, что те или иные операторы существенны или несущественны сами по себе. Возникает взгляд, что, поскольку операторы таковы, на нашу долю остается лишь установление эвристического правила для их сортировки. Однако обычно (нередко даже в логике) существенность операторов находится в зависимости от контекста прагматического характера, * Ibid., p. 123. ** Э.Фейгенбаум. Искусственный интеллект: темы исследования во втором десятилетии развития. - Кибернетический сборник, Новая серия, вып. 10, М., 1973, с. 18437. 65 Ньюэлл, Шоу и Саймон откровенно признают, что они вынуждены прибегать к предварительной обработке исходного материала, использующей интуицию. В связи с этим у них, казалось бы, нет ни малейшего основания утверждать, что при решении задач человеком тот тип поведения, который не очень ясно называют сообразительностью, интуицией, проникающим в суть дела "озарением", в действительности является результатом рассудочного применения тех или иных эвристик, служащих для сужения пространства поиска решения. Наоборот, их работа с GPS показала, что до тех пор, пока не будет произведена предварительная структуризация задачи, всякий поиск усложнен настолько, что его и поиском-то не назовешь. Шутки ради заметим, что исследования в области моделирования процессов познания сами являют прекрасный пример, так сказать, разумного поведения по программе GPS, когда она предоставлена самой себе. Здесь мы также сталкиваемся с чем-то вроде залатывания дыр и подшивания кусочков с помощью приемов ad hoc - поведением, характерным для человека, завороженного поверхностной структурой задачи; это своего рода карабканье на дерево в надежде добраться до Луны. Может быть, именно потому, что в "моделировании процесса познания" интуиция не в чести, некоторые исследователи в этой области ошибочно приняли поведение GPS за разумное. Списочная организация признаков или осмысленная группировка объектов? Вычислительная машина распознает любой образ только на основе заданного перечня специфических признаков. При этом возникает проблема экспоненциального роста,- проблема, которую человек способен обойти, потому что идет каким-то другим путем. Следовательно, при моделировании распознавания даже простых образов может потребоваться обращение ко всем рассмотренным нами выше основным формам "переработки информации" человеком. И если исследователям в области "искусственного интеллекта" удалось, используя машинные методы, добиться некоторых успехов в простых случаях, то такие сложные образования, как художественные стили или лица людей, обладающие весьма расплывчатыми чертами сходства и различия, по-видимому, требуют для их узнавания своеобразной комбинации процессов, происходящих на периферии сознания, феномена допустимой неоднозначности и "инсайта" - всего того, что недоступно цифровой вычислительной машине. Неудивительно поэтому, что работа по распознаванию образов довольно поздно началась и довольно быстро притормозилась. 66 В гл. 1 мы отметили, что слабая сторона существующих в настоящее время программ по распознаванию образов (за исключением, возможно, программы Л.Юра и Ч.Фосслера, возможности операторов которой - она распознает всего пять букв - еще недостаточно проверены) заключается в том, что они не в состоянии сами вырабатывать операторы выбора. Теперь, однако, мы покажем, что такая постановка вопроса основывается на предпосылках, таящих в себе более глубокие и более сложные проблемы. "Инсайт", Первый признак, указывающий на то, что распознавание образов человеком и ЭЦВМ различается коренным образом, состоит в том, что человек (и животные) - в отличие от машины - справляется с изменениями в ориентации и размерах изображений, его неполнотой, искажениями, зашумленностью фона. В пору возникновения направления "искусственного интеллекта" специалисты, разрабатывавшие программы распознавания, сначала старались нормализовать изображение, а потом проверяли, как оно идентифицируется с образами некоторого множества. Однако человек при распознавании объектов, по-видимому, пренебрегает изменениями их размеров и ориентации; пропусками в изображении фигур и т. п. Хотя некоторые константы восприятия действительно подвергаются определенной нормализации (кажущиеся размеры и яркость варьируют в меньшей степени, чем соответствующие изменения сигнала, достигающего сетчатки глаза), не вызывает сомнения, что мы не нуждаемся в полностью нормализованном и "сглаженном" изображении, поскольку, воспринимая изображение искаженным, неполным, большим или маленьким и т.д., мы можем в то же время узнать его. В программах более позднего времени нормализации изображения нет - в них используются мощные операторы, выделяющие отличительные характеристики образов и в то же время нечувствительные к искажению и шумам. Однако маловероятно, чтобы в процессе распознавания человек применял такого рода искусственные приемы. Как выяснилось, в тех особых случаях, когда человек может выразить словами то, на что он обращает внимание, он пользуется не мощными операторами, которые позволяют справляться с размазанными изображениями и шумом, а скорее набором идеальных характеристик, к которым каждый конкретный распознаваемый объект может только приближаться. Мы узнаем искаженные образы не потому, что они попадают в рамки, определяемые более широким и более искусно заданным набором признаков, а вследствие того, что образы эти обладают теми же простыми свойствами, что и образы неискаженные,- вместе с некоторыми случайными чертами. Аналогичным образом мы не проверяем наличие шума, с тем чтобы потом его отбросить, а 67 просто игнорируем его, считая несущественным*. И здесь мы опять сталкиваемся со способностью человека к различению существенного и несущественного. Периферийное сознание. Для того чтобы определить, с каким из множества уже проанализированных образов предъявляемый объект имеет наибольшее сходство, был предложен способ последовательной проверки наличия у него определенных признаков из некоторого их набора (метод дерева решения). Другой часто встречающийся метод (он реализован в программе О.Сэлфриджа "Пандемониум") состоит в использовании вероятностей присутствия признаков (из заданного их множества) - Оба эти метода с несомненностью предполагают, что человек, подобно механическому распознающему устройству, обязательно классифицирует образы в терминах четко заданного списка признаков. О.Сэлфридж и У.Ниссер не сомневаются в том, что "человек, выделяющий какой-либо образ из совокупности раздражителей, по существу, уже провел классификацию всех возможных входных сигналов"**. В обзоре работ по распознаванию образов И. Хант придерживается того же мнения: "Распознавание образов, так же как и формирование понятий, включает в себя научение правилам классификации"***. Однако в тех случаях, когда образ хоть сколько-нибудь сложен и достаточно сходен с большим числом других образов - в результате чего для его распознавания требуется большое число признаков, -возникает угроза экспоненциального роста. Таким образом, предположение, что всякое распознающее устройство, будь то человек или машина, работает по аналитическому принципу, выделяет отдельные черты объекта, ведет к предположению, что должны существовать определенные критические признаки, которые делают распознавание осуществимым; все дело в том, чтобы их отыскать либо запрограммировать ЭЦВМ так, чтобы она сама их находила. Тем самым нас склоняют к поиску своего рода эвристик восприятия, "мощных" операторов, которых пока еще никому не удалось обнаружить. Как шахматист не в состоянии объяснить программистам, каким образом он * Каковы бы ни были процессы переработки информации, которые осуществляет мозг человека для выделения образов, этому, несомненно, способствует организация рецепторов. Но даже если бы удалось так сконструировать рецептивный вход вычислительной машины, чтобы она осуществляла перцептивное выделение объекта (отделение фигуры от фона), то такого рода селективные рецепторы потребовали бы введения стадии аналоговой обработки информации, чего исследователи в области "искусственного интеллекта" стараются избегать. ** О. G.Selfridge, U. Nеisser. Pattern Recognition by Machine.-ln: Computers and Thought, p, 238. *** E.Hunt. Computer Simulation: Artificial Intelligence Studies and Their Relevance to Psychology .-In: Annyal Review of Psychology, P.R.Farns-worth (ed.),vol. 19, Palo Alto (Calif.), 1968, p. 145. 68 находит кратчайший путь к решению, так и, как отмечают Сэлфридж и Ниссер, в случае распознавания образов "очень часто принцип классификации остается неизвестным даже (самому распознающему.-ХД)". Тем не менее Сэлфридж и Ниссер, подобно Ньюэллу и Саймону, исходят из предпосылки, что испытуемый подсознательно производит поиск в лабиринте -е данном случае просматривает список признаков. При этом они вынуждены заключить, что подобный принцип классификации "слишком сложен для точного описания"*. Однако поиск, основанный на таком списке, чрезвычайно затруднителен, по крайней мере для человека - последний для принятия того или иного решения в состоянии исследовать последовательно (или параллельно) далеко не все релевантные признаки; многие признаки, определяющие исход распознавания, вообще никогда не рассматриваются в явном виде, но оказывают свое влияние, оставаясь на периферии сознания. Если в шахматах мы начинаем с общего "чувства ситуации" и только на заключительном этапе анализа переходим к просчитыванию, то в процессе восприятия мы вообще никогда не обращаемся к каким бы то ни было четким признакам. Как правило, мы распознаем сходство предмета с другими предметами, не отдавая себе отчета в том, что он является примером предметов данного типа или элементом некоторого класса предметов, задаваемого набором специфических признаков. Анализируя различия между перцептивным и понятийным сознанием, А.Гурвич пишет: " Воспринимаемые предметы являются нам вместе с задающими их родовыми характеристиками... Но - и это крайне важно - воспринимать объект некоторого рода - совсем не значит понимать, что этот предмет является представителем или частным случаем предметов того или иного типа"**, Иногда, разумеется, можно выделить определяющие характеристики в явном виде; ((Первый шаг в становлении понятийного сознания состоит е акте расчленения предмета, воспринимаемого в его типичности. Образующие предмет родовые признаки, которые до этого имманентно в нем присутствовали и были слиты с предметом, теперь отделяются, освобождаются от него. Выраженные в явной форме, эти признаки могут восприниматься сами по себе..- В результате такого расчленения родовые признаки превращаются в объект генерализации. В этой своей новой сущности они противостоят тому предмету восприятия, от которого только что отделились и который теперь превратился в пример или частный случай,,. [Таким образом, неявные ориентиры.- Х.Д. ] могут быть выделены и превращены * O.G.Selfridge, U.Neisser. Pattern Recognition by Machine.- In: Computers and Thought, p. 238. ** A.Gurwitsch. On the Conceptual Consciousness.-In: The Modeling of Mind, p, 203. 69 в объект [специфический признак, который мы осознаем. - Х.Д.] в то время как ранее они только способствовали образованию другого объекта [образа. - Х.Д. ], находясь, так сказать, на "немых ролях"*. Это движение от перцептивного сознания к понятийному (говоря словами Паскаля, от перцептивного склада ума к математическому) не обязательно означает шаг вперед, А. Гельб и К.Голдштейн исследовали нескольких человек, страдающих афазией, которые утратили способность перцептивного распознавания. Для такого больного всякое распознавание превращается в задачу классификации. Подобно цифровой вычислительной машине, больному приходится обращаться к тестовым наборам признаков и поисковым процедурам. Некоторые из больных афазией могут узнать геометрическую фигуру, например треугольник, только проверяя соответствующие признаки, то есть подсчитав число ее сторон, после чего делается вывод: "Треугольник имеет три стороны. Следовательно, это треугольник"**. Такое понятийное, концептуальное распознавание требует много времени и очень неуклюже: жертвы подобного нарушения деятельности мозга абсолютно не приспособлены к повседневной жизни. Очевидно, в распознавании образов переход от неявного перцептивного разбиения на группы к точной понятийной классификации- даже на завершающей стадии, как это имеет место в шахматах,- обычно невыгоден. Тот факт, что для того, чтобы распознать некоторый образ, нам не нужно концептуализировать признаки или четко формулировать свойства, присущие нескольким экземплярам данного объекта, указывает на отличие человеческих способов распознавания от машинных, при которых распознавание происходит только на явном концептуальном уровне, в терминах принадлежности предметов к определенным классам. Уменьшение неоднозначности, основанное на учете контекста. В рассмотренных до сих пор случаях признаки, определяющие принадлежность элемента некоторому классу, могли всегда быть представлены, по крайней мере в принципе, в явной форме, хотя, как правило, для практического использования в распознавании они слишком многочисленны, В некоторых случаях, однако, формализация признаков невозможна даже в принципе. Для того чтобы разобраться в этом вопросе, мы должны сначала убедиться в несостоятельности мнения, разделяемого в равной степени как "традиционными" философами, так и исследователями в области "искусственного интеллекта", согласно которому распознавание образов всегда можно представить себе как своего рода класси- * Ibid., р 204-205. ** М. Мerleau-Ponty. Phenomenology of Perception, London, R, and K.Paul, 1962, p. 128 ff. 70 фикацию. В этом слишком поспешном заключении объединяются без разбора три разных типа узнавания, ни один из которых не обладает теми характеристиками, которых требуют от него философы и цифровые вычислительные машины. Во-первых, существует тип узнавания или распознавания, который А. Гурвич называет "родоотносящим". С помощью узнавания такого типа мы можем сказать, например, что данный предмет есть карандаш. Гурвич подчеркивает, что этот тип распознавания, хотя он и представлен в нечеткой форме, поддается уточнению в терминах списка признаков. Таким образом его, по-видимому, можно привести к виду, допускающему программирование. При этом, однако, Гурвич упускает из виду, что при распознавании такого типа отбор существенных признаков и использование некоторых из них в качестве основы узнавания определяются назначением, целью. Например, когда-то для человека, который хотел писать чернилами, было важно то, что гусиное перо, если его заточить, может быть пишущим инструментом. Однако после того, как появились металлические ручки, за ними сохранилось наименование перьев (но не карандашей), по-видимому в связи с тем, что для тех, кто стал ими пользоваться, решающим оказалось их свойство оставлять на бумаге знаки, которые нельзя стереть. Из этого можно было бы сделать вывод, что свойство оставлять нестираемые знаки является определяющим критерием для того, чтобы считать предмет пером, в то время как форма пера есть, говоря словами Л.Витгенштейна, только "симптом" - "явление, относительно которого опыт показал нам, что оно тем или иным образом сочетается с данным явлением, выступающим в качестве определяющего критерия". Можно попытаться даже встроить это различие между симптомом и критерием в нашу программу. Однако, по мнению Л.Витгенштейна, это различие характеризуется тем, что не является данным раз и навсегда, а изменяется вместе с изменением наших целей и знаний. "Если вас спросят, какое явление есть определяющий критерий, а какое - симптом, то практически вы почти всегда окажетесь не в состоянии ответить на этот вопрос - разве что возьмете ответ "с потолка". В одном случае, возможно, будет удобно при определении некоторого слова использовать в качестве критерия одно явление, однако в другом случае выяснится, что это же слово можно определить с помощью другого явления, которое в первом случае оказывается только симптомом. Врачи пользуются наименованиями заболеваний, не задумываясь над тем, какие явления следует считать определяющими критериями, а какие - симптомами, что совсем не обязательно ведет к прискорбному отсутствию ясности. * L.Wittgenstein. The Blue and Brown Books, p. 25 71 И в самом деле, это один из путей, на котором наши понятия становятся критериями, открытыми для применения при распознавании образов человеком, приобретая гибкость, которой так не хватает вычислительной машине, использующей фиксированный набор существенных признаков. Второй тип узнавания - это распознавание сходства. В узнавании этого типа, как и в феномене "ограничения"* при определении значений слов и предложений, решающую роль играет контекст. Благодаря контексту мы начинаем замечать те признаки сходства, которые впоследствии можем узнать в изолированном виде - как в случае фигур, допускающих двоякое толкование, таких, как утка-кролик Л.Витгенштейна; будучи окружена изображениями уток, она похожа на утку, а в окружении кроликов напоминает кролика. При других обстоятельствах контекст помогает нам обратить внимание на некоторые аспекты образа, как в знаменитом эксперименте В.И. Пудовкина38. "Однажды Пудовкин сделал крупным планом снимок Мозжухина, выражение лица которого было абсолютно бесстрастным, а затем смонтировал три отрывка, в каждом из которых кадры с Мозжухиным шли после следующих кадров: в первом случае - тарелки с супом, во втором - молодой женщины, лежащей в гробу, и, наконец, ребенка, играющего с плюшевым мишкой. И что же получилось? Создалось полное впечатление, что в каждом из этих кадров Мозжухин смотрит соответственно на тарелку, на женщину и на ребенка: на суп он глядит задумчиво, на женщину - с выражением горя, а на ребенка - улыбаясь. Зрители были поражены разнообразием его выразительных средств, хотя so всех трех случаях был использован один и тот же кадр, о котором если и можно что-то сказать, так только то, что он на редкость невыразителен" Вот поразительный пример того, как контекст определяет различие в восприятии определенного выражения лица в ситуации, когда никакие характеристики лица, воспроизводимого на экране, не могут объяснить этого различия. Нам могут возразить, что то выразительное, по мнению зрителей, лицо, которое они видели на экране, имело определенные черты - печальные глаза, например, или счастливую улыбку, которые и помогли зрителю узнать то или иное выражение. Но выражение части лица, например глаз человека, может зависеть от всего лица таким образом, что, если закрыть остальную часть лица, оно станет совсем иным. * Разумеется, это выглядит как "сужение смысла" или "снятие неоднозначности" только в глазах тек, кто подходит к этому вопросу с позиций вычислительной машины. Ниже мы убедимся, что человек структурирует ситуацию в терминах взаимозависимых значений, так что все остальные возможные значения слова или предложения ему даже не нужно исключать из рассмотрения. Они просто у него не возникают. ** Цит. по: М.Меrleau-Ponty. Sense and Non-Sense. Evanston, M Northwestern University Press, 1964, p. 54. 72 Более того, то или иное выражение глаз может подчеркнуть определенный изгиб носа, который остался бы незаметен на другом лице; нос в свою очередь может превратить улыбку в кривую усмешку, изменив при этом выражение глаз. По замечанию Л.Витгенштейна, "человеческий рот улыбается только на человеческом лице"*. В подобных случаях черты, необходимые для распознавания сходства (бегающий взгляд, насмешливая улыбка и т. д.), даже когда они носят вполне определенный характер, нельзя изолировать, то есть рассматривать нейтрально, вне контекста. Более того, как и в случае уточнения лингвистического смысла, контекст - в нашем примере человеческое лицо - не только определяет существенные для распознавания признаки, но и в свою очередь определяется ими. Выражение лица нельзя вывести из совокупности признаков, оно есть просто соотнесенность глаз, рта и т.д., подобно мелодии, которая, будучи составлена из отдельных нот, сама же и придает им специфические значения. При рассмотрении сходства, основанного на соотношениях такого рода, понятие узнавания в терминах изолированных признаков бессодержательно. Существует еще один тип сходства, при котором предметы, опознаваемые как принадлежащие одному и тому же классу, вообще не имеют каких-либо общих признаков - даже зависящих от контекста. В процессе изучения естественного языка Витгенштейн пришел к исследованию этого типа "неклассификационного" распознавания: "Мы сталкиваемся с очень сложной сетью перекрывающих друг друга и пересекающихся сходств. Иногда эти сходства носят общий характер, иногда касаются лишь деталей. Лучшим выражением такого рода сходств является "фамильное сходство"; моменты сходства, присущие членам одной семьи, такие, как осанка, черты лица, цвет глаз, походка, темперамент и т,д., пересекаются и перекрывают друг друга именно таким образом. ...Мы расширяем наше понятие... подобно тому как при прядении нити скручиваем между собой отдельные волокна пряжи"**. Фамильное сходство отличается от сходства членов одного и того же класса следующими весьма существенными моментами. Классы могут быть заданы в терминах признаков, даже если они не содержат ни одного элемента, в то время как фамильное сходство распознается только в терминах действительных или воображаемых примеров***. Более того, в то время как принад- * L. Wittgenstein. Phjlosophica! Investigations, p. 583. ** Ibid., p, 32. *** Поскольку типичность в отличие от принадлежности к классу зависит от сравнений отдельных примеров, сходство, определяющее тип, должно быть достаточно конкретным. Так, можно говорить о типичном индейце, но не о типичном человеке. 73 лежность к классу есть отношение типа "все или ничего"*, фамильное сходство образует целый спектр признаков, от "типичных" до "нетипичных". Нетипичного члена семьи, например, можно узнать, выстроив в ряд всех членов семьи, начиная с типичного ее представителя и кончая данным нетипичным. Аналогичным образом некоторые понятия, например "изящный", "аляповатый", "вульгарный", невозможно определить в терминах необходимых и достаточных условий; единственный способ дать о них представление- это продемонстрировать типичные случаи. Поскольку подобное распознавание членства в "семье" происходит не с помощью перечня признаков, а путем восприятия данного элемента в терминах близости его к некоторой парадигме (типичному элементу), постольку оно дает нам пример еще одного типа "открытости" и гибкости. Наконец, Витгенштейн идет еще дальше и утверждает, что в некоторых случаях распознавание может происходить при полном отсутствии общих признаков, даже перекрывающихся. Продолжая вышеприведенный отрывок, Витгенштейн говорит довольно туманно: «Если кто-нибудь скажет: "Существует нечто общее для всех этих конструкций, а именно дизъюнкция всех их общих свойств", то п отвечу, что это просто игра слов. С тем же успехом можно сказать: "Нечто проходит через всю нить, а именно непрерывное переплетение составляющих ее волокон")*. Возможно, что Витгенштейн говорит здесь о третьем типе распознавания, который он явно не отделяет от узнавания по сходству; мы могли бы назвать это распознаванием на основе подобия. Витгенштейн в своей интерпретации, по-видимому, имеет в * Интересная попытка перешагнуть через этот дискретный ("все или ничего") характер отношения принадлежности к классу была предпринята Л. Заде (см,, например, L. A. Zadeh. Fuzzy Sets.-"Information and Control". Vol. 8, 1965, № 3, June). Однако в работе Заде (самой по себе интересной) классы все еще определяются в терминах конкретных признаков, просто при определении отношения принадлежности к классу допускается различная степень этой принадлежности. "Расплывчатое множество есть класс объектов, степени принадлежности которых этому классу образуют континуум" (р. 338). Более того, в том смысле, в каком употребляет это понятие Заде, расплывчатость сама по себе является расплывчатым понятием. В своем понятии расплывчатости Заде сваливает в одну кучу пять различных аспектов распознавания образов, а именно, аспекты, относящиеся к нечеткости границ, к зависимости от контекста, цели, субъективной оценки и к фамильному сходству. В результате совершенно непонятно, какой же аспект распознавания поддается формализации при помощи понятия расплывчатости (и поддается ли вообще хоть один) 39. ** L. Wittgenstein. Philosophical Investigations, p. 32. 74 виду не просто необозримый характер соответствующей дизъюнкции, обусловленный тем, что в процессе распознавания используется очень много перекрывающих друг друга признаков, в силу чего ею нельзя оперировать. Последовательно продолжая ход его рассуждений, уместно заключить, что не только каждый из признаков, упоминаемых им при рассмотрении фамильного сходства - осанка, цвет глаз, походка и т. д.,- не совпадает полностью у любых двух членов семьи, но что сами эти признаки в свою очередь представляют собой сеть пересекающихся подобий. Продолжая ту же аналогию, можно сказать, что каждое волокно состоит из волокон, со всеми вытекающими отсюда последствиями. Таким образом, любые два члена семьи могут иметь фамильное сходство и в то же время не иметь никаких идентичных признаков. В анализе Витгенштейна подобие является исходным понятием, несводимым к списку или дизъюнкции идентичных по характеру, жестко определенных черт, как того требует "машинное мышление"*, . Для тех, кто может опознать члена "семьи", не нужно умения перечислять какие бы то ни было точно совпадающие признаки, общие хотя бы для двух ее членов - не говоря уже о том, что нет основания полагать, что такие признаки вообще существуют. Действительно, формализация фамильного сходства в терминах точного подобия признаков привела бы к тому, что оно утратило бы свойство "открытости" для новых случаев,- свойство, которое составляет наиболее яркое проявление феномена узнавания этого типа. Независимо от уже построенного дизъюнктивного списка признаков в "семью" всегда можно ввести новый член, признаки которого будут подобны признакам других ее членов, но в то же время не совпадут точно с какими-либо признаками последних; и тем не менее в некоторых ситуациях этот член можно будет распознать как принадлежащий к той же "семье", что и остальные. Этот сложный, но очень часто встречающийся тип распознавания использует особую комбинацию всех трех вышеописанных форм "переработки информации": периферийное сознание, "инсайт" и обращение к контексту. Начнем с того, что этот процесс протекает в скрытой форме. В нем используется информация, которая остается, так сказать, на краю сферы сознания. Для того чтобы понять, какую роль играет в нем интуиция, мы должны прежде всего выделить различии между "родоотносящим" и "типоотносящим" узнаванием, хотя у А. Гурвича оба эти понятия * Этот анализ получил дальнейшую разработку у Р. Бамбру (R. Bambrough. Universal and Family Resemblances). 75 взаимозаменимы. Согласно Гурвичу, родоотносящее распознавание зависит от скрытых ориентиров, которые всегда можно представить в явной форме. Распознавание типоотносящее - в том смысле, в каком мы до сих пор использовали это понятие,- зависит от подобий, которые не могут быть объективированы. Следовательно, распознавание типичного в отличие от распознавания родового требует интуитивного упорядочения относительно некоторой парадигмы. Парадигма выполняет свои функции постольку, поскольку является самым отчетливым проявлением того, что, по существу, делает все элементы элементами именно данной группы. Наконец, распознавание в терминах близости к парадигме есть не что иное, как форма обращения к контексту. Л.Витгенштейн отмечает, что "осмысленное представление - это именно такое понимание, которое заключается в улавливании связей"*. Следуя Витгенштейну, мы называли эту комбинацию периферийного сознания, "инсайта" и зависимости от контекста "осмысленным разбиением на группы - осмысленной группировкой". Эта форма процесса "переработки информации" человеком не менее важна, чем те три основные формы обработки информации, которые входят в нее как составные части. Расположим в порядке возрастания трудности те условия, при которых человек в состоянии узнавать объекты. 1) Распознаваемый объект может быть повернут, неполон, искажен, сопровождаться шумами, помехами. 2)Признаки, необходимые для узнавания, могут быть столь "тонки и многочисленны", что даже если бы их и можно было формализовать, то все равно по мере добавления новых подлежащих узнаванию объектов с их признаками дерево поиска стало бы чрезвычайно громоздким. 3)Признаки могут зависеть как от внешнего, так и от внутреннего контекста, поэтому их бесконтекстная спецификация может оказаться невозможной. 4)Возможно отсутствие общих признаков при наличии "сложной сети перекрывающихся подобий", которая может служить для выделения все новых и новых вариаций. Следовательно, всякая система, претендующая на адекватность человеческому распознаванию, должна быть в состоянии: 1)для данного конкретного объекта отличать существенные признаки от несущественных; 2)использовать неявные ориентиры, хранящиеся на периферия сознания; 3)учитывать контекст; * Ibid, p. 49. 76 4) воспринимать индивидуальное как типичное, то есть определять отношение индивидуального к некоторой парадигме. Поскольку распознавание образов даже умеренной сложности может потребовать использования всех четырех форм процесса "переработки информации" человеком, исследования в области машинного распознавания объектов не продвинулись дальше многотрудного узнавания простых изображений типа печатных букв разных шрифтов и цифр почтового кода. Но общепризнанно, что до тех пор, пока не произойдет существенного сдвига в работах по распознаванию образов, невозможен дальнейший прогресс в области моделирования игр, автоматического перевода и машинного решения задач. Заключение Итак, мы выяснили, что основная проблема, стоящая перед теми, кто пытается использовать ЭЦВМ для моделирования разумного поведения человека, заключается в необходимости представления каждой альтернативы в четкой форме. При моделировании игр экспоненциальный рост дерева альтернатив требует ограничения числа прослеживаемых путей; в сложных играх, таких, как шахматы, существующие в настоящее время программы не в состоянии выбирать наиболее многообещающие ходы. В проблематике решения задач вопрос упирается не только в то, как вести избирательный поиск по дереву явно заданных альтернатив, но и в то, как структурировать задачу, обеспечив тем самым возможность начала процесса поиска. В области автоматического перевода в связи с тончайшими нюансами, характерными для естественного языка, возникают неясности уже на уровне самих элементов, подлежащих обработке. В распознавании образов безнадежно переплетаются все три вышеупомянутые проблемы; кроме того, дело усложняется тем, что типичность и подобие, по-видимому, являются неотъемлемыми составляющими восприятия. Все эти трудности и явились причиной того, что через пять лет после начала работы над "моделированием процесса познания" в этой области наступило затишье40. Ни одно из предсказаний Саймона не сбылось. Два первых предсказания, касающиеся умения машин играть в шахматы и доказывать математические теоремы, своим провалом поставили под сомнение и третье его предсказание, касающееся психологической теории поведения человека. Несмотря на доверчивость и рвение, с которыми психологи взялись за дело, за протекшие десять лет психологические теории в своем большинстве не приняли форму программ для вычислительных машин. 77 Вместо обещанных триумфов отчетливо проступил общий контур развития: удачное моделирование простых механических форм процесса переработки информации, связанные с этим радужные надежды и, наконец, их крушение при столкновении с более сложными формами поведения. Предсказания Саймона оказались просто еще одним примером явления, которое Бар-Хиллел назвал "обманчивостью первого удачного шага"*. Однако сам Саймон не пришел к такому отрезвляющему выводу. В своем последнем предсказании, сделанном в 1965 г., он заявил, что "не более чем через 20 лет машины смогут выполнять ту же работу, которая под силу человеку"**. Часть II нашей книги посвящена обсуждению причин столь непоколебимого оптимизма. Но сначала мы должны провести анализ работ в области "искусственного интеллекта", пришедшего на смену выдохшемуся "моделированию процесса познания"41 * Работа Э.Тофлера "Грядущий шок" представляет собой блестящую вариацию на ту же тему "первого шага" (см. гл. 2, с. 76). ** H.S imon. The Shape of Automation for Men and Management- New York, Harper and Row, 1965, p. 96. 78 К главе 2 |