Цифровой журнал «Компьютерра» № 218 - Коллектив Авторов

Читать онлайн Цифровой журнал «Компьютерра» № 218 - Коллектив Авторов

Шрифт:

Интервал:

Закладка:

Сделать

1 2 3 4 5 6 7 8 9 10 ... 15

Перейти на страницу:

Возможно, в этих случаях тоже помогло бы элементарное отматывание ИТ-истории на 10 лет назад, когда паразитов от софта было меньше. Зато и не было моральных ломок типа «Мы прекрасно знаем, что “Битрикс” — отстой, но у нас такой утверждённый поставщик и мы не можем его сменить никогда».

Отсюда понятно, чем хороши примеры родительских «летучих сообществ» вроде того, которое вокруг Жени Кац. Просто у родителей самая человеческая «целевая функция». А с ней и более чёткое определение других существ и их места в нашей жизни.

Сразу понимаешь, например, что интернет — это не люди. Это такой дикий океан. Каждый раз, когда мы говорим «новый сервис», в этом океане громко икает какая-то нечеловеческая тварь. Некоторые из этих тварей очень большие и яркие, и это искушает нас приписать им всякие волшебные свойства, которые мы обычно приписываем всему большому и яркому. Но на практике ни размер, ни цвет твари не означают, что она полезна для нас. Наоборот, многие из них умеют ловко и незаметно высасывать наши жизненные ресурсы — потому что именно так они выживают, именно такие способности развивает ИХ эволюция.

Хотя польза от них тоже бывает. Некоторые их части съедобны. Только надо знать, как их добыть и как приготовить. Да, иногда можно закусить и фейсбуком, если предварительно разбить ему голову и вырвать ядовитые зубы. Ничего особенного, на вкус как курица.

К оглавлению

О гнилых «моделях отношения к языку»

Александр Рудяков

Опубликовано 25 марта 2014

Я сейчас пишу книгу под рабочим названием «Лингвистика для компьютерщиков». Пишу для «реабилитации» лингвистики как науки, которой, во-первых, посвятили свою жизнь мои родители и которой — как потомственный профессор-лингвист — всю свою жизнь занимаюсь я; во-вторых, как науки, потенциально способной порождать не только мифы, но и знания, в высшей степени необходимые сегодняшнему миру и такой важной его составляющей, как информационные технологии…

Работая над книгой, я прочитал остроумную статью Лёхи Андреева «Вавилонский взлом...». Она понравилась мне прежде всего трезвым прагматическим подходом к языковедческому знанию, который, на первый и ортодоксальный взгляд, покажется слишком строгим, но, к моему сожалению, в принципе верен:

«Так зачем ждать, когда очередной ленивый гуманитарий откроет для себя компьютерную вирусологию и продаст её под другим названием как новую науку о языке? Дискуссия про государственный язык Украины зашла в очевидный тупик оттого, что прогнила сама модель отношения к языку (хотя жрецы с обеих сторон продолжают навязывать её со всей одержимостью). Давайте же подправим метафору».

Я довольно много писал именно о «моделях отношения к языку» и породил особое направление в науке о русском языке — георусистику, но здесь не об этом…

Речь о том, что Лёха Андреев уловил то, каким образом развивается языкознание, которое до сих пор не создало адекватной концепции естественного языка и потому ищет ответы на свои вопросы где угодно и в чем угодно. Каких только «лингвистик» у нас не было: лингвистики структурные, когнитивные, политические, религиозные, «незнаюещёкакие»… И, конечно, была и есть лингвистика компьютерная. Но оказалось, что использование компьютера тоже не панацея, что компьютерная лингвистика использует только то знание, которое уже есть в науке…

Всё это множество «инновационных» лингвистик о не изменило ситуацию: знание, порождаемое нашей наукой, имеет смысл только для внутринаучного использования и мало чем помогает представителям других наук. Каких именно? Да всех без исключения. Мы мало что можем дать школьным преподавателям и преподавателям русского как иностранного. Мы мало чем можем помочь переводчикам…

Мы мало что можем дать «информатикам», потому что лингвистика пасует всякий раз, когда речь заходит о моделировании понимания.

Почему? Потому что предпосылкой моделирования понимания является построение модели человеческого знания. Это фундаментальная проблема, без решения которой не может быть кардинального движения вперёд ни в робототехнике, ни в разработке искусственного интеллекта, ни в машинном переводе, ни в смысловых поисковых системах, ни во многих других областях инновационного знания.

Причины? Их, на мой взгляд, две.

Первая — устарели традиционные теории об устройстве языка. Они часто приобретают формы мифов, тормозящих развитие нового знания. Такие вещи нередко случаются в науке на стыке научных парадигм. Так, например, было у анатомов в XVI веке. На протяжении долгих четырнадцати столетий истиной в последней инстанции для всех анатомов считались труды Галена, жившего в Древнем Риме. Учёным эпохи Ренессанса понадобилась отчаянная смелость, чтобы, например, опровергнуть его утверждение о том, что сердце человека состоит всего из двух камер и что между этими камерами есть дырка. Благоговение перед авторитетом античного классика было настолько велико, что без малого полторы тысячи лет (!!!) учёные все как один подтверждали этот «факт». Полагалось верить не своим глазам, а, по сути дела, мифу — который, однако, был подтверждён великим авторитетом.

Вторая причина заключается в том, что даже если есть адекватная теория и действенная технология (а они есть, и я могу это доказать), создание модели человеческого знания задача крайне сложная и трудоёмкая. Точнее, «умоёмкая». По моим подсчётам, даже нашей команде, умеющей видеть «зазначье» (так я когда-то назвал для себя идеальную картину мира, таящуюся «за» знаковыми оболочками номинативных единиц) потребуется лет 5–6 для построения ядерной части картины мира человека.

Мне могут возразить и возражают, говоря: вы, дескать, лукавите, что знания описаны в словарях и энциклопедиях. В какой-то мере это так, но я имею в виду стройную систему, в которой каждое понятие имеет свои уникальные координаты и свои средства выражения…

Лучше и нагляднее всего — конкретный пример. Допустим, условный «кто-то» пытается передать из сферы лингвистики в сферу информатики всё, что мы знаем, например, о слове «стул».

Я думаю, что первым делом наш брат лингвист расскажет о грамматических свойствах «стула». К сожалению, это не уникальная характеристика. Что дальше? А дальше — ничего. Процитирует, что писали об этом слове И. И. Иванов, П. П. Петров или, что особенно важно для русистов, Джон Джонович Джонов. А если они о слове «стул» ничего не писали? Если столь любимая нами форма доказательства, как ссылка на авторитет, не сработает?

Тогда лингвист укажет, что у этого слова нет синонимов, антонимов, но есть то ли омоним, то ли второе значение (есть ещё одно слово с такой же формой и с ограниченной сферой употребления; вспомним повесть Бориса Полевого «Доктор Вера»: «Каков стол, таков и стул»)… Укажет, что оно принадлежит к группе слов «мебель», но не сможет дать список этой группы… Можно ещё сказать, что в словарях слово «стул» располагается между словами «стукотня» и «стульчак». Нужно отдавать себе отчёт, что в словаре слово расположено по случайному — алфавитному — принципу, как если бы в учебниках истории великих людей характеризовали по росту и весу, а не в зависимости от важности содеянного.

Нужно ли такого рода знание кому-нибудь, кроме самого лингвиста?

Далее займёмся значением слова «стул», а именно оно будет интересовать потребителей нашего ограниченного, а точнее, скудного лингвистического знания. В словарях оно определяется так: — 'предмет мебели — сиденье на ножках со спинкой, на одного человека' (Словарь Ожегова, далее — СО); — 'род мебели: предмет на четырёх ножках, без подлокотников, обычно со спинкой, предназначенный для сидения одного человека' (Словарь в 17 томах); — 'род мебели для сидения, снабжённый спинкой (для одного человека)' (Толковый словарь Ушакова, далее — ТСУ); — 'мебель для одиночного сидения'; — «это стул — на нем сидят» («Кошкин дом»)…

Там же, в словарях, мы найдём устойчивые словосочетания и несколько идиом.

Можно ли формализовать эти словарные толкования? Нет, нельзя. В них остались не выявленными многие важные признаки значения этого слова. Эти словарные формулировки не могут быть определением слова «стул», в том смысле, в каком я его пониманию: определение есть характеристика сущности объекта, содержащая правила обращения с объектом…

О механизме выявления различных признаков значения слова «стул» хорошо писал Л. В. Сахарный в книге «Как устроен наш язык». Так, по его словам, если мы скажем: «Стул — это предмет, на котором сидят», то это может быть не «стул» , а «табуретка» — 'род скамейки с квадратным или круглым сиденьем без спинки, употр. вместо стула' (ТСУ). Чтобы не быть табуреткой, стул должен быть со спинкой. Это — 'со спинкой' — отличительный (дифференциальный) признак языкового понятия 'стул'. Однако если мы ограничимся определением 'это предмет, на котором сидят, со спинкой', то это может быть не «стул», а «кресло»… Нужен ещё один отличительный признак, чтобы отграничить значение 'стул' от значения 'кресло'. И это — 'без подлокотников' и 'с подлокотниками'… Но и это ещё не все: если мы остановимся на 'предмете, на котором сидят со спинкой и без подлокотников', то рискуем перепутать «стул» и «скамейку»… Поэтому нужен ещё один признак, а именно — 'для одного человека'…