Автоматическая обработка речевой информации и ее лингвистические проблемы
1
Как это ни представляется парадоксальным, действительное положение таково, что по технике своей интеллектуальной работы современный человек находится на уровне, не намного превышающем уровень неандертальца. Он почти не использует никаких орудий и технических приспособлений в этой области своей деятельности и целиком полагается лишь на силу ума и памяти, которые отпустила ему природа. Правда, современный человек располагает письмом, значение которого можно поставить в один ряд с открытием колеса или рычага. Но за открытием колеса и рычага последовал длинный ряд других важных открытий, которые увеличили физические возможности человека до чудовищных размеров. Он может видеть уже в мельчайших подробностях, что собой представляет лунная поверхность, он может слышать слова, произнесенные на другом континенте Земли, и т.д. Находящиеся ныне в распоряжении человека силы почти не знают пределов и даже ставят под угрозу само его существование. А в области интеллектуальной человек дальше письма недалеко ушел и с поступательным движением прогресса стремится справиться посредством максимального развития отпущенных ему природных данных, не обращаясь к помощи каких-либо приспособлений, которые облегчили бы ему умственную деятельность и значительно увеличили ее мощь. Это прежде всего не экономично и совершенно не соответствует принципам, обеспечивающим развитие человеческого общества. Но значительно более важно то обстоятельство, что по некоторым параметрам умственной деятельности человека, например, по возможностям человеческой памяти мы стоим уже у предела, и если потенции развития здесь еще полностью не исчерпаны, то темпы этого развития таковы, что во многих случаях человеческий мозг уже не способен работать с нужной эффективностью: он не в состоянии держать в памяти и перерабатывать тот объем информации, который необходим ему для полноценного осуществления в обществе своих многообразных, и в первую очередь творческих, функций и даже для обеспечения своего существования. Таким образом, если не принять соответствующих мер, то человечество, по выражению одного американского электроника, работающего в области обработки информации, окажется в положении динозавра. Это доисторическое животное, как утверждают, вымерло потому, что его слабый мозг был не способен справиться с информацией, поступающей из меняющегося физического мира, и по этой причине оно не смогло обеспечить потребности и безопасность своего огромного тела.
Говоря о настоятельной необходимости исследовательской работы в области совершенствования техники умственной деятельности человека (или научной организации его интеллектуального труда), следует сделать одну существенную оговорку. В последнее время очень много и с излишней горячностью говорится о возникновении "думающих", самообучающихся и саморазмножающихся автоматов. И хотя создание подобного рода высоко совершенных машин в лучшем случае находится в далекой перспективе и еще абсолютно не ясны действительные рабочие потенции, параметры, а также и экономичность этих машин, появляются уже охотники признать за машиной универсальное превосходство над человеком и готовность передать ей верховные права определения не только объективно истинного и не истинного во всех теоретических и практических случаях приложения этого понятия, но и самой судьбы человека. О таких людях создатель кибернетики Н. Винер, не раз выражавший страх перед грядущей мощью "мыслящих" машин, в своем предсмертном интервью сказал, что эти люди решили пойти учиться уму у машины. Совершенно очевидно, что подобного рода заблаговременная капитуляция человека перед мощью "интеллектуальных" машин была бы равносильна капитуляции перед силой "физических" машин, которые, при всей своей совершенности и огромной, почти безграничной мощности, остаются все же во власти немощного по сравнению с ними человека и служат его созидательным целям. Если мы хотим установить, каковы действительные возможности и предпосылки для решения средствами современной науки и техники проблем повышения эффективности умственной деятельности человека, мы в первую очередь должны отрешиться от искусственно создаваемых вокруг этих проблем машинной мистики и научного авантюризма, не имеющих ничего общего с творческим научным поиском, в основе которого всегда лежит очень строгий и очень трезвый расчет.
В проблеме так называемых "думающих" машин существует основательная путаница понятий, в возникновении которой немалую долю вины несут всякого рода ультраэнтузиасты даже из среды вполне почтенных ученых, уверовавших в безграничные возможности кибернетики (следует также добавить, что границы кибернетики при этом трактуются весьма широко и в нее включаются многие неожиданные вещи, в том числе и лингвистика). Естественным образом одна крайность вызывает обратную крайность*, что, разумеется, мало способствует успеху работы.
* (Отличным примером обратной крайности может служить статья В. И. Абаева "Лингвистический модернизм как дегуманизация науки о языке" ("Вопросы языкознания", 1965, № 3). )
В 1964 г. вышла в русском переводе книга американского специалиста по счетно-решающим устройствам Мортимера Таубе "Вычислительные машины и здравый смысл" (с подзаголовком "Миф о думающих машинах"). Советские читатели (и автор предисловия акад. А. И. Берг) восприняли эту книгу с негативными выводами "за чистую монету", не учитывая той целеустановки, какую имеет эта книга и которую ее автор отнюдь не скрывает. А речь идет о том, чтобы отвлечь правительственные ассигнования от программы машинного перевода, в разработке которой ранее принимал участие и сам М. Таубе, на новую программу, в которой работает М. Таубе ныне. С этой целью он и собрал в кулак все отрицательные доводы против проблемы в целом и сместил акценты в тех вопросах, которыми следует задаваться при исследовании ее. Картина получилась впечатляющая. Но, к сожалению, акад. А. И. Берг не нашел ничего лучшего в качестве противопоставления выводам М. Таубе, как сослаться на работы О. Кулагиной, Т. Молошной, И. Мельчука и других советских исследователей в этой области, что не только не разбивает тезисов М. Таубе, а, наоборот, подкрепляет его утверждение о том, что "в литературе по машинному переводу, машинному обучению, автоматам и т. п. можно найти множество названий несуществующих машин, работа которых рассматривается и обсуждается так, как если бы они действительно существовали"*. Ведь при всех бесспорных положительных качествах работ указанных исследователей они не только не разрешили проблемы машинного перевода, но, напротив, доказали ограниченность и недостаточность тех методов, какими решалась эта проблема и у нас и за рубежом.
* (М. Таубе, Вычислительные машины и здравый смысл, М., 1964, стр. 123. )
Все же собранные М. Таубе негативные доводы (надо сказать, что большинство из них принадлежит отнюдь не ему самому) заслуживают того, чтобы отнестись к ним со всей внимательностью. Они помогают выбрать правильное направление на том трудном пути, который ожидает здесь исследователя.
Начинать надо с самого термина "думающие машины". Он крайне неудачен и лишь вводит в заблуждение. Возник он на основании довольно своеобразной "обратной" процедуры - не в результате приписывания машине человеческих способностей, а благодаря приписыванию человеку ограничений, свойственных машине. Эта процедура явно и неявно путает два чрезвычайно существенные положения. Во-первых, она не делает различия между аналогией и тождеством, что, кстати говоря, считал чрезвычайно важным делать уже один из создателей кибернетики - Нейман. Ведь когда мы говорим о "думающих машинах", мы волей или неволей идем здесь по линии отождествления деятельности человеческого мозга с "искусственным мозгом" - само это выражение приобрело уже все права гражданства. А это грубейшая логическая и практическая ошибка. "В современных кибернетических устройствах,- пишут в этой связи А. Берг и И. Новик,- успешно воспроизводятся некоторые формализуемые функции человеческой психики. Вместе с тем из сходства модели и моделируемого объекта в некоторых функциях нет оснований делать вывод о тождестве их поведения в целом"* (выделено мной.- В. 3.). Во-вторых (и это логически вытекает из первого), в проблеме технического оснащения интеллектуальной деятельности человека речь идет не о моделировании структуры человеческого мозга, а о моделировании отдельных его ("поддающихся формализаций") функций. Здесь, впрочем, даже и нельзя говорить о моделировании, так как в данном случае отношение машины к человеку фактически есть отношение дополнения и усиления, а не моделирования. Кроме того, функции человеческого мозга отнюдь не сводятся к мышлению. Это лишь одна из функций в сложной иерархии функций человеческого мозга. Мышление осуществляется в контексте других функций, которыми управляет человеческий мозг,- зрения, слуха, ощущения и пр. И то, что называют интуицией человека, видимо, строится на взаимодействии этих функций по правилам и законам, которые нам еще совершенно неизвестны. А "думающие" машины ориентируют лишь на одну функцию - мышление, да еще на самые элементарные формы этой функции, и говорят при этом о моделировании человеческого мозга.
* ( А. Берги И. Новик, Развитие познания и кибернетику "Коммунист", 1965, № 2, стр. 24. )
Во время пребывания в Советском Союзе известный американский специалист в области кибернетики и теории коммуникации К. Шеннон дал интервью*. Касаясь проблемы общения человека с машиной, он сказал: "Далеко не все трудности сводятся к решению лингвистических, логических или математических задач. Чтобы контакт был полным, машину необходимо снабдить какими-то органами, эквивалентными нашему глазу и уху. Иными словами, она должна научиться воспринимать зрительную и слуховую информацию непосредственно, а не в закодированном виде. Но это вопрос будущего... А ведь для того, чтобы машина стала "зрячей", нужно не только создать для нее органы зрения, но и научить ее сопоставлять информацию, полученную из внешнего мира, с той, которая заложена в машину. Иными словами, "увидев" какой-то объект, машина должна и "опознать". Такого рода устройства не только не существуют, но для них нет и сколько-нибудь реальной теории, опирающейся на более или менее прочную основу. Таким образом, "думающие" машины - во всяком случае в практически осуществимом их виде - это лишь технические усовершенствования, усиливающие возможности отдельных параметров умственной деятельности человека. Опыт показал, что, идя этим путем, можно достичь многого, так как машина способна и быстрее и точнее человека выполнять операции, которые доступны сведению к последовательности элементарных вычислительных шагов. Но деятельность этого порядка, конечно, далеко не равнозначна многофункциональной и творческой деятельности человеческого мозга, так как "язык мозга не есть язык математики" (Джон Нейман) и так как "мозг не действует по принципам "черно-белой логики" (А. Берг и И. Новик).
* ( См. "Литературную газету" от 22 мая 1965 г. )
Вполне трезвую позицию занимает в данной проблеме А. Л. Сэмюэль. Он пишет: "вычислительная машина, скажет вам любой программист,- это гигантский идиот и отнюдь не гигантские мозги! Когда вычислительную задачу дают человеку-ассистенту, ему говорят, что делать; когда же составляют программу для вычислительной машины, приходится говорить ей, как делать задачу"*. Следовательно, человек как инициатор, как носитель творческого начала всегда впереди, и это обстоятельство создает парадокс, который остается неразрешимым. "Чтобы сделать машины, которые казались бы более находчивыми, чем человек, человек сам должен быть более находчивым, чем машина. По-видимому, для того чтобы сообщить машине искусство быть разумной, требуется разум (или хотя бы понимание) более высокого порядка, чем для того, чтобы дублировать разум, который машина должна лишь имитировать"**.
* (А. Л. Сэмюэль, Искусственный разум: прогресс и проблемы. Приложение к книге М. Таубе "Вычислительные машины и здравый смысл" (М., 1964), стр. 134. )
** (Там же, стр. 144. )
Из всего сказанного мы имеем все основания сделать следующие выводы. На вопрос, возможно ли современными средствами создание искусственного мозга ("думающей" машины), тождественного человеческому мозгу, может быть лишь отрицательный ответ. Но это не означает, что все же не делаются практические попытки (теоретически заранее осужденные на неудачу) решения задач, исходящих из предпосылки положительного ответа на данный вопрос. Чтобы далеко не идти за примерами, обратимся к проблеме машинного перевода.
Ведь совершенно очевидно, что полноценный перевод художественных произведений относится к области интеллектуальной деятельности многофункционального характера*. Известно, что даже человеку с отличным знанием иностранного языка далеко не всегда удаются более или менее адекватные по своим художественным достоинствам переводы - для этого надо обладать, помимо специальных навыков, творческим даром воссоздания оригинала средствами иного языка**. И тем не менее энтузиасты машинного перевода выступали с широковещательными заявлениями по поводу того, что в ближайшее же время будут переводиться не только любые прозаические художественные произведения (и в доказательство приводился абзац из "Братьев Карамазовых" Достоевского, переведенный машиной на английский,- разумеется, с обязательным постредактированием), но также и поэзия. Разве подобного рода заявления логически не предполагают положительного ответа на сформулированный выше вопрос?
* (Ср. высказывание Дж. Миллера, Е. Галантера и К. Прибрам: "Перевод является многомерным, и кто может сказать, насколько лучше Должен быть один параметр, чтобы уравновесить низкий уровень какого-либо другого параметра?" ("План и структура поведения", M.s 1945, стр. 72). )
** ( Собрание самых разительных примеров весьма неожиданных переводов можно найти в книге К. Чуковского "Высокое искусство" М., 1941. )
А в действительности получалось вот что. Полковник Вернон Уолтерс, переводчик при президенте Эйзенхауэре, рассказал, как этому последнему были продемонстрированы- первые опыты машинного перевода (на машине с оперативной памятью 1500 слов). Эйзенхауэр для пробы задал для перевода на русский язык фразу: Out of sight, out of mind, т. e. "С глаз долой - из сердца вон" (буквально: "Вне видимости - вне сознания"). Машина выдала: "Невидимый идиот". Тогда попросили дать менее идиоматическую фразу. Эйзенхауэр предложил: The spirit is willing, but the flesh is weak, т. e. "Дух силен, но плоть слаба". Машина выдала: "Водка держится хорошо, но мясо испортилось" (дело в том, что английское spirit означает и "дух" и "спирт")*.
* (Эти факты приводятся в статье: John Kouwenhoven, The Trouble with Translation, "Harper's magazine", 1962, August. )
Разумеется, не все переводы получаются столь несуразные. Можно привести много примеров безусловно удачных переводов - научных и технических текстов. Но все же наметилась довольно четкая граница возможностей машины, и это начало находить свое выражение в ряде существенных обстоятельств и фактов. Одним из них - достаточно наглядным является и упоминавшаяся выше книга М. Таубе. Не менее знаменательным является и разочарование во всей программе машинного перевода (об этом см. ниже).
Это приводит нас к другому выводу относительно проблемы технического оснащения интеллектуальной деятельности человека. Вопрос при ее решении должен ставиться по-иному - более скромно и более реалистично. Возможно что-либо предпринять в отношении облегчения интеллектуальной деятельности человека посредством "машинного" усиления отдельных ее параметров или функций? На этот вопрос мы с полной уверенностью можем ответить положительно. И именно в этом направлении должна проводиться вся работа в этой области, которой следует отказаться от I рекламных метафор весьма дурного вкуса*.
* (См. рецензию П. Г арвинана кн.: У. В a r-H i 11 е 1, Language and Information: Selected Essays on Their Theory and Application (London, 1964). Рецензия помещена в журнале "American Documentation", vol. 16, N 2, April, 1965, p. 127.
Немало отрезвляющих чрезмерный энтузиазм мыслей содержится в последней работе Норберта Винера ("God and Golem", 1964). Говоря о широком применении математического аппарата, "ставшем модным и в общественных науках", он указывает, что "общественные науки представляют собой испытательную среду, мало пригодную для проверки идей кибернетики" (стр. 225). В обоснование этого вывода он обращается к области экономики и пишет: "экономическая игра - это такая игра, правила которой должны периодически подвергаться существенному пересмотру, скажем, каждые десять лет, при этом она еще имеет неудобное сходство с игрой в крокет из "Алисы в стране чудес"... В этих обстоятельствах безнадежно добиваться слишком точных определений величин, вступающих в игру. Приписывать таким неопределенным по самой своей сути величинам какую-то особую точность бесполезно и нечестно, и, каков бы ни был предлог, применение точных формул к этим слишком вольно определяемым величинам есть не что иное, как обман и пустая трата времени" (стр. 224).
Ограничение в постановке задач автоматизации (и машинизации) интеллектуальных видов деятельности человека Н. Винер видит в невозможности полного устранения человека: "Предоставьте же человеку и машине присущие им сферы действий: человеку - человеческое, вычислительной машине - машинное. В этом и должна, по-видимому, заключаться разумная линия поведения при организации совместных действий людей и машин" (стр. 220). Цит. по отрывку из книги Н. Винера, помещенного под названием "Творец и робот" в журнале "Новый мир" (1965, № 12). )
Итак, каковы же здесь возможности и какое отношение к описанным проблемам имеет лингвистика? Для ответа на эти вопросы надо сначала определить, что такое язык - предмет лингвистики и как этот предмет изучается в лингвистике.
Понятие языка трактуется в современной науке чрезвычайно многообразно и широко, но здесь и в дальнейшем будет разуметься так называемый естественный язык, посредством которого осуществляется обычное общение людей в человеческом обществе. Современная лингвистика делает весьма существенное различие между языком и речью. Выше (раздел "Язык и речь") уже оказалось необходимым коснуться этого разграничения и сделать из него некоторые выводы, но здесь пока мы от этого отмысливаемся и будем трактовать язык и речь как единство. В рабочем порядке мы будем исходить из того, что использование языка в целях общения воплощается в формах устной и письменной речи.
Всякий национальный язык - это гигантская энциклопедия знаний, хранилище сведений, накопленных народом за весь период своего исторического существования. Чтобы жить в человеческом обществе, каждый должен овладеть известной частью этих фиксированных в языке сведений, при этом объем этой части определяется сферой общественной деятельности человека - чем шире сфера его деятельности, тем большую часть языка он должен изучить. Но как бы ни была широка сфера деятельности человека, изучение языка в целом сверх его возможностей. Во-первых, естественный язык не конечная величина, в количественном отношении он не' имеет определенных границ. В нем постоянно возникают (и, конечно, отмирают) не только отдельные слова, но и их сочетания, имеющие смысловую цельность. Дело усложняется еще тем, что язык обладает двоякой протяженностью -в прошлое и настоящее (диахрония и синхрония). Считать ли, например, для современного языкового сознания отмершими такие слова, как реляция (т. е. докладная записка), авантюрьерка, сатисфакция, которые ныне не употребляются, но присутствуют в литературных произведениях, знание которых полагается обязательным для каждого образованного человека? А это далеко не единственная неясность,возникшая в связи с двухмерностью языка. Во-вторых, национальный язык не представляет единства. Он - чрезвычайно сложная иерархия субъязыков - профессиональных, научных, социальных, стилистических и пр.,- с одного на другой из которых мы свободно переходим (или переводим) в зависимости от ситуации и потребности речи. То, что весьма условно называется общенациональным или литературным языком, есть не что иное, как совокупность своеобразных национальных лингвистических универсалий. Они-то и подлежат в первую очередь усвоению, когда человек овладевает минимально необходимой частью лингвистической энциклопедии знаний.
Вместе с тем овладение какой-либо отраслью науки или техники требует возможно более полного знания языка (точнее, субъязыка) данной отрасли, так как в ее языке фиксируется вся система ее понятий.
Если национальный язык в целом представляет собой "открытую" систему в том отношении, что он находится в постоянном видоизменении, и сама эта "открытость" представляет необходимую предпосылку выполнения им своих функций в меняющемся мире, то отдельные субъязыки, составляющие его иерархию, могут носить "закрытый" характер или во всяком случае практически рассматриваться как "закрытые" системы. Такая "закрытость" образуется в результате "недоверия" к языку или, точнее, в связи с очень осторожным отношением к нему, когда всякая двусмысленность или неточность может послужить причиной больших бедствий. "Закрытость" системы в свою очередь обусловливает ее стабильность. В качестве примера субъязыков, обладающих качествами "закрытости" и стабильности, можно привести язык военных уставов и команд или язык железнодорожных эксплуатационных правил. Недаром в этих областях очень широко используются всякого рода знаки, которые, сравнительно с естественным языком, в данном случае обладают тем преимуществом, что абсолютно однозначны и тем самым не могут породить гибельных недоразумений.
Качества закрытости и стабильности подобного рода субъязыков делают их первыми объектами изучения с точки зрения тех целей, которые ставятся задачами совершенствования техники умственной деятельности человека. Только после того как удастся совладеть с ними, можно будет перейти к более широкой и значительно более сложной области изучения в данном аспекте таких динамических и "открытых" систем, какими являются национальные языки. И здесь первым объектом исследования, очевидно, будут их универсалии.
После всего сказанного становится ясным отношение естественного языка и лингвистики к проблеме повышения эффективности умственной деятельности человека в отдельных ее параметрах. Язык - всеобъемлющее хранилище информации и универсальное средство ее передачи. Если будет можно научить машину понимать естественный язык и запоминать содержащуюся в ней информацию, то можно будет передать ей ту работу, которая выполняется человеческой памятью, но не только передать ей эту работу, а и значительно увеличить объем памяти и, далее, не только довести объем памяти до грандиозных размеров, но и заставить машину делать над введенной в ее память информацией на первых порах простые, а затем более сложные операции, т. е. осуществлять силлогизирование, обрабатывать информацию под определенным углом зрения и выдавать по требованию человека полученные при этом результаты.
В целом это грандиозная задача, которая на первый взгляд может быть отнесена к числу тех, которые охарактеризованы выше как научный авантюризм. Но она, конечно, подразделяется на множество последовательных этапов, некоторые из которых уже решены, а другие - на повестке дня сегодняшнего научного исследования. Обратимся для наглядности к примеру.
Всем понятно, что в современной войне точность и быстрота учета и расчета факторов боевой операции есть обязательная предпосылка успеха самой операции. Именно поэтому современные войска оснащаются ЭВМ. Какую работу они выполняют? В первую очередь они используются в штабной работе, где происходит планирование боевых операций. По данным иностранных источников, приведенных в книге полковника В. С. Синяка*, дело представляется следующим образом:
* (В. С. Синяк, Военное применение ЭВМ, М., 1963, стр. 34. 196 )
"Наиболее трудоемкими процессами работы штаба считаются:
добывание, сбор и обработка разведывательных данных; кодирование и передача при помощи технических средств связи информации о противнике и о своих войсках в вышестоящие штабы;
нанесение на карты обстановки;
подготовка расчетных документов (справок), необходимых для принятия решения, количественно характеризующих свои войска и войска противника; выработка решения;
оформление решения на картах в виде боевых приказов и распоряжений;
шифрование и кодирование боевых документов и передача их по техническим средствам связи.
Отсюда заключают, что нужно автоматизировать следующие процессы: разведку, наблюдение за действием оружия и войск на земле и в воздухе; связь, шифрование и кодирование, обработку информации в штабе, подготовку вспомогательных расчетных документов и оформление боевой документации".
Как видно из этого перечисления отдельных процессов, связанных с планированием и управлением боевых операций, они предполагают автоматическую обработку информации двоякого порядка:
1) числовой и технической (графической и пр.) и
2) речевой, т. е. заключенной в словах и предложениях. Только информация второго рода, неизбежно присутствующая в каждом боевом документе и с наибольшим трудом подвергающаяся автоматической обработке, является областью работы лингвиста. При решении тех задач, которые при этом ставятся перед ним, ему приходится иметь дело с многообразными и часто весьма сложными лингвистическими проблемами. Вот некоторые из них, как они предположительно рисуются лингвисту с точки зрения последовательности своего разрешения.
Каждое боевое подразделение - батальон, полк, дивизия, армия, фронт - обладают своими языками, каждый из которых обусловливается объемом и характером тактических задач и имеющимся в его распоряжении оружием. Чем крупнее войсковое подразделение, тем сложнее язык. Каждый язык приходится разрабатывать отдельно, но вместе с тем учитывать взаимопонимаемость языков, образующих иерархию, в соответствии с которой язык более мелкого подразделения входит составной частью в язык более крупного подразделения.
Каждое войсковое подразделение снаряжается ЭВМ разной мощности. Ведь совершенно очевидно, что ни батальон, ни полк, при их большой мобильности, не могут таскать за собой ЭВМ типа современной "Сетуни" или "Стрелы". Отсюда возникает необходимость предварительного определения основных параметров (объем памяти, быстрота действия, ее надежность и пр.) ЭВМ, потребной для данного подразделения, ее рентабельности и возможности инженерного решения всей задачи. Иными словами, лингвист должен представить наиболее простую (и вместе с тем исчерпывающую) программу автоматической обработки языка данного подразделения, а инженер должен сказать, может ли он создать машину, которая по своей компактности и рабочим характеристикам способна была бы удовлетворить условиям боевых действий данного подразделения.
Если этот вопрос решается положительно (а он может решаться не однозначным образом применительно к автоматической обработке речевой информации разной сложности), приступают уже к конструктивной работе. Она также может проводиться двояким образом.
В одном случае мы имеем дело с письменным текстом. Быстрота автоматической обработки речевой информации в ее письменном виде лимитируется быстротой перепечатки ее. При вводе информации в ЭВМ она по заданному алгоритму автоматически кодируется и рассылается по разным адресам, т. е. по разным ячейкам машины, в соответствии с характером информации: например, сведения о численности противника-в одну группу ячеек, сведения о характере огня противника - в другую, о его действиях - в третью и т. д. Осуществление уже этой работы требует сложной лингвистической работы на разных уровнях языка - статистической обработки возможно большего количества военной документации, максимального "ужимания" языка (компрессии), однако не за счет его удобопонятности, составления алгоритма работы. По требованию машина может выдать хранящуюся в ее памяти и расклассифицированную указанным образом информацию. Но такого рода кодировочно-информационные машины, хотя и выполняют полезную работу, представляют собой лишь один из этапов автоматизации штабной работы.
Следующий этап воплощается в информационно-логических машинах, которые способны осуществлять силлогизирование, т. е. подвергать информацию обработке в соответствии с заданными программами. Это как раз и есть то, что принято называть "думающими" машинами, и они могут быть, конечно, разной сложности. В идеальном виде (если прибегать к достаточно смелым метафорам, которые ныне модно использовать в науке) должно получиться нечто вроде "автоматического генерала", способного выполнять за человека определенную часть штабной работы.
В другом случае мы имеем дело с устной речевой информацией. Введение информации в машину здесь происходит прямо с голоса, и это, конечно, значительно ускоряет ее автоматическую обработку, осуществляемую в дальнейшем таким же образом, как и при обработке речевой информации в ее письменном виде. Тут "разговор" человека с машиной принимает фактически те же формы, которые имеют место при разговоре человека с человеком. Распознавание машинной устной речи - чрезвычайно трудная проблема, и недаром над ней работает много исследовательских организаций. Она решается преимущественно в инженерном плане, в то время как основные ее трудности носят как раз лингвистический характер и без лингвиста никак не могут быть разрешены. Вот лишь некоторые конкретные задачи, которые в этом случае необходимо разрешить и которые в пределах досягаемости современной науки.
Обычная человеческая речь представляет собой поток звуков, прерываемый иногда паузами. Слушающий вычленяет из сплошного речевого потока отдельные слова, ориентируясь на их значения. Но в распоряжении машины нет такого средства, т. е. понимания значения, и ее работа осуществляется прямо противоположным образом - в нее вводится некоторая комбинация речевых звуков, из которых состоит конкретное слово, и этой комбинации по заданной для машины программе приписывается определенное значение. Следовательно, первое, что необходимо сделать при работе машины с голоса,- это научить ее членить сплошной речевой поток на отдельные слова.
С тем чтобы разрешить эту задачу хотя бы в первом приближении, можно пойти на значительное ее упрощение. Резко ограничивается количество слов для машинного распознавания, и каждое слово при произнесении отделяется друг от друга паузами. Считается, что если машина будет способна распознавать 10 цифр, будет достигнуто уже многое. Посредством цифрового кодирования с голоса можно будет ввести всю совокупность речевой информации, составляющей язык данного войскового подразделения.
Но и эта скромная задача решается не так просто и допускает несколько путей разрешения. Об этом будет сказано ниже, при рассмотрении некоторых конкретных задач прикладной лингвистики, лишь вскользь упоминавшихся в этом примере.
2
К числу уже решенных этапов относится введение в память машины информации посредством двоичного кода. Однако этот процесс очень трудоемок и осуществляется вручную - с помощью перфокарт, перфолент или магнитных лент. Перфорирование повторяет работу машинистки и тем самым нарушает принцип экономии, связанный с автоматизацией процесса. К тому же оно не отвечает условиям рентабельности: подсчитано при исследованиях в области машинного перевода, что одна первичная операция по перфорированию одного слова обходится дороже, чем перевод его с одного языка на другой квалифицированным переводчиком-человеком*.
* (См. ясное и квалифицированное описание этой операции (с приведением стоимости машинного времени в США) в статье: S. Lamb The Degital Computer as an Aid in Linguistics. "Language", vol. 37 (1961), № 3, part 1.)
В связи с указанными обстоятельствами, а также в силу других направлений своего использования возникла проблема автоматического (или объективного) распознавания речи. В конечном счете она должна привести к созданию звукозаписывающих машин, т. е. таких, которые автоматически переводят устную речь в печатные слова, или же к созданию устройств, автоматически осуществляющих бинарное кодирование устной речи для ввода содержащейся в ней информации в память машины. В последнем случае будет достигнута полная автоматизация вводной операции, что значительно убыстрит автоматическую обработку информации, а в ряде случаев этот момент является решающим.
На первый взгляд эта проблема кажется если не полностью, то преимущественно инженерной. И действительно, без инженера она не может быть решена. Но точно так же она не может быть решена и без лингвиста, так как в ней предварительно должны быть выяснены весьма существенные лингвистические вопросы, прежде чем она сможет быть сформулирована для инженерного решения. Коснемся некоторых из этих лингвистических вопросов, не вдаваясь, разумеется, в слишком специальные детали.
Как уже указывалось, устная речь в проблеме автоматического ее распознавания изучается как передатчик семантической информации, которая запечатлена в языке и которая обычно именуется "значением". Именно поэтому автоматическое распознавание должно быть направлено на отождествление в речевом потоке "значащих" элементов, подлежащих затем механическому репродуцированию. Но, как показывают исследования, в звуковой речи только небольшая доля содержащейся в ней информации указывает на "значение", и эта семантическая информация тесно переплетается с такими прагматическими и избыточными с точки зрения "значения" информационными элементами, как указание на социальное и локальное происхождение говорящего, его половую и общеобразовательную принадлежность, состояние здоровья и эмоциональную настроенность и пр. Иногда эта дополнительная, избыточная информация может полностью поглотить семантическую. В подтверждение сказанного можно привести такой простой пример. Вы сидите дома, закрыв на замок дверь, слышите стук в дверь и спрашиваете: "Кто там?" В ответ получаете: "Я"- С чисто семантической точки зрения ответ абсолютно идиотский, так как не дает ответа на ваш вопрос, под это "я" можно подставить любого человека. Представьте, что вместо устного ответа стучавший в дверь просунул бы бумажку, на которой бы было напечатано (не написано знакомой рукой) "я". В этом случае было бы совсем не ясно, кто такой этот "я". Но когда это слово произносится, мы по всей дополнительной информации, содержащейся в голосе отвечающего и в условиях его появления, легко идентифицируем его и таким образом получаем исчерпывающий ответ на свой вопрос.
Устная речь есть лишь компонент сложной структуры коммуникативного поведения человека и широко взаимодействует с другими ее компонентами -с интонацией (просодической системой языка и голосовыми средствами эмоционального выражения), с жестом, с мимикой и во многом с речевой ситуацией (вне языковой контекст). Самое сложное при этом заключается в том, что все эти вне семантические компоненты коммуникативного поведения человека, как показывает разобранный пример, в устной речи могут быть легко переведены (перекодированы) в семантические.
Письменная речь не знает таких взаимодействий, однако у нее есть свои, хотя и не столь разнообразные и важные, как у устной речи, виды. Семантическую информацию, содержащуюся в письменной речи в более чистом виде, также окружают прагматические, избыточные элементы, обусловленные, например, графическими возможностями. Речь при этом идет не о взаимодействии письма с рисунком или чертежом (этот вид связи, конечно, также должен быть изучен; он в какой-то мере аналогичен вне языковому контексту устной речи, сравни так называемые комиксы), а о собственно графических элементах, имеющих прямое отношение к письму. Здесь даже начертание отдельных букв или сочетание шрифтов может служить носителем прагматической вне семантической информации. Хорошим примером использования прагматических возможностей графики может служить "рубленая" строка Маяковского. Когда он располагает свой стих "лесенкой":
Я
земной шар
чуть не весь
обошел,-
и жизнь
хороша,
и жить
хорошо -
в действие вступают дополнительные прагматические элементы, которые пропадают, если такой стих расположить традиционным образом:
Я земной шар чуть не весь обошел,-
И жизнь хороша, и жить хорошо.
Можно утверждать, что в некоторых ранних стихах Маяковского графическая прагматика перекодируется в семантическую информацию таким же образом, как это происходит в устной речи, хотя набор средств и алгоритм перекодировки при этом совершенно отличны. Так, возьмем стихотворение:
Угрюмый дождь скосил глаза,
А за
решеткой
четкой
железной мысли проводов - перина.
И на нее
встающих звёзд легко оперлись ноги,
Но гибель фонарей, царей
в короне газа, для глаза сделала больней
враждующий букет бульварных проституток.
Это стихотворение едва ли можно было бы понять во всей полноте его смысловой информации и поэтической структуры вне его графического оформления.
Таким образом оказывается, что устная и письменная речь - это не одно и то же, это особые системы, функционирующие по своим законам*. Общим у них является семантическая информация, но необходимо учитывать, что она выступает в контексте различных прагматических элементов, способных к тому же перекодироваться в семантическую информацию. К этому следует добавить, что объем и характер прагматических элементов, взаимодействующих с семантической информацией, не являются постоянными: они видоизменяются в зависимости от типа речи, стоит только сопоставить повышенно-эмоциональную речь с продуманной речью научной лекции.
* ( Йозеф Вахек следующим образом определяет различие устной и письменной речи: "Устная норма языка есть система фонетически манифестируемых языковых элементов, функция которых заключается в реакции на данный стимул (как правило, безотлагательный) динамическим образом, т. е. мгновенно и непосредственно, выражая не только чисто коммуникативный, но и эмоциональный аспект пользования языком.
Письменная норма языка есть система графически манифестируемых языковых элементов, функция которых заключается в реакции на данный стимул (как правило, не безотлагательный) статическим образом, т. е. сохраняющимся и легкообозримым, сосредоточиваясь при этом преимущественно на чисто коммуникативном аспекте пользования языком". Josef Vac he k, Two Chapters on Written English, "Brno Studies in English", vol. 1, Prague, 1939, p. 12.)
Задача лингвиста в данном случае состоит в том, чтобы изучить все описанные явления (к сожалению, следует отметить, что они почти совсем не подвергались внимательному лингвистическому анализу) и создать систему приемов для выделения "чистой" семантической информации из обоих видов речи, а также определить (и, по возможности, формализовать) правила перекодировки в них прагматической информации в семантическую. Только совокупность всех этих сведений даст возможность сведения информации, содержащейся в устной и письменной речи (конечно, с общим смысловым содержанием), к единому семантическому потенциалу. Важно также установить алгоритм перевода прагматической информации из одного вида речи в другой. Наличие его очевидно. Так, приведенное выше стихотворение Маяковского ("Угрюмый дождь скосил глаза...") в устном чтении и, следовательно, с помощью прагматических средств устной речи может получить ясное выражение своего смыслового содержания и стихотворной структуры. Вспомним в этой связи жалобы первых читателей Маяковского на непонятность его поэзии, которая, однако, становилась тотчас понятной в устном авторском исполнении. Это объясняется просто: Маяковскому, как автору, был ясен алгоритм (разумеется, не научно осознанный) перевода прагматических средств (и их связи с семантическим содержанием стихов) одного вида речи в другой. Этот алгоритм, впрочем, не всегда был и остается ясным другим исполнителям стихов Маяковского. Однако каждый человек, умеющий читать вслух письменный текст, владеет такого рода в большей или меньшей степени разработанным алгоритмом и очень легко им пользуется. Но то, что просто для человека, весьма сложно для машины.
Если сужать рассматриваемую задачу до звукового аспекта*, то мы здесь сталкиваемся с задачей, аналогичной той, которая возникает при чтении текста, написанного от руки. Видимо, не существует двух абсолютно одинаковых почерков и все они обладают различной степенью удобочитаемости. Но как бы они ни видоизменялись, мы улавливаем в них стандартный набор букв и из них составляем слова. В произношении фонемы также подвергаются видоизменению, причем одна группа этих видоизменений носит закономерный характер, обусловленный качеством соседних фонем,- это так называемые аллофоны (в письме также можно выделить аллографы), а другая группа - незакономерный, индивидуальный характер, переходящий уже в область прагматических явлений. Но машина должна уловить в речи различных людей используемый в данном языке набор фонем, каждая из которых характеризуется пучком определенных дифференциальных признаков, и не только составить из них слово, но и перевести его в печатные знаки.
* (Программа исследований в области машинного распознавания речи с помощью методики "Анализ посредством синтеза" дается в работе: М. Hale and К. Stevens, Sprech Recognition: A. Model and a Program for Research. В кн.: "The Structure of Language", New Jersey, 1964.)
Так возникает новая трудность: говорим мы фонемами, а пишем буквами. А система правил пользования буквами (орфография) - всегда большая или меньшая историческая условность. Между фонемами и буквами нет однозначного соответствия, некоторые виды письменности (идеографическая) вообще никак не соотносятся с фонемическим строем устной речи. Кроме того, в орфографию входят и правила отделения слов друг от друга, правила пунктуации, правила употребления заглавных букв, абзацы и пр.
Правда, можно облегчить работу машины и поступать так, как мы поступаем при диктовке машинистке - указываем ей абзацы ("печатать с красной строки"), знаки препинания. Можно даже паузами отделять слова друг от друга., А дальше?
Дальнейшее членение, направленное на облегчение работы машины, сталкивается с трудностями, связанными как с условностью орфографических правил, так и с произносительным механизмом человека.
Английское wreathe - "свивать" произносится как [ri: ə], французское agneau - "ягненок" - как [anQ]. В этих и подобных им многочисленных случаях "пишется одно, а произносится совсем другое". Каким же образом тогда проводить' диктовку - по произносительным единицам (фонемам) или по графическим (буквам)? Но чисто по-фонемный диктант просто невозможен, так как речевой аппарат человека не способен произносить фонемы (особенно согласные) изолированно - он всегда произносит их с некоторой добавкой, пазвуком. А побуквенный диктант находится в полном противоречии с задачей автоматического распознавания устной речи и фактически "снимает" всю проблему.
Правда, при пофонемном диктанте достигнуты уже некоторые успехи: удается отождествлять некоторые наиболее отчетливые акустические характеристики фонем, такие, как фрикативный компонент в некоторых согласных или голосовой компонент в некоторых гласных. Автоматическому отождествлению поддаются уже отдельные группы фонем (преимущественно согласных) и даже слогоделение. Следует ожидать и дальнейших успехов в этом направлении. Однако такой путь - навстречу существующим возможностям машины - не способ разрешения проблемы.
Сама постановка проблемы автоматического распознавания устной речи предполагает обратное направление - возможности машины следует подтянуть до такого уровня, чтобы она справлялась с живой речью, произносимой нормальным образом и в обычном темпе.
Впрочем, можно избрать еще один облегченный путь. Можно установить набор легко распознаваемых машиной комплексов речевых звуков и затем приписать им определенное значение, которое машина будет фиксировать письменно., Более того, пользуясь такой методикой, возможно ориентировать машину на запись реальных слов естественного языка, например тех же десяти цифр. Но этот способ обладает весьма ограниченными возможностями и пригоден лишь для письменной фиксации незначительного числа звуковых комплексов. В своем первом варианте (условные звуковые комплексы, которым произвольно приписываются значения) он отрывается от естественного языка. В своем втором варианте (ориентация на некоторое число реальных слов) он резко ограничивает рабочие возможности машинного распознавания речи, так как нарушает то, что А. Мартине называет принципом экономии или законом второго членения речи, в соответствии с которым через посредство ограниченного числа звуковых типов (фонем) оказывается возможным создать почти неограниченное количество слов. Волей-неволей поэтому приходится возвращаться к методике, построенной на анализе речевого потока, к членению его на некоторое число элементарных "кирпичиков", из которых представляется возможным составить любое слово (а также и все другие) данного языка.
Тут возникает новая проблема. Допустим, что проблема графической записи устной речи окажется решенной. Скорее всего это будет запись, ориентированная не на орфографические нормы, а следующая принципам фонетической транскрипции. Мы будем получать записи вроде следующей:
нас' эв' ьр' ьд' йкъмстайтад' инбкънагольив' иэршын' ьса - сна-если машина будет менее лингвистически искушенной и более склонной принять принципы, пропагандируемые энтузиастами упрощения русской орфографии, приблизительно такой вид:
насеверъд йкъмстайтад инокънаголывиршинъсасна.
Примерно таким образом писали в старину: например, старославянское письмо было слитным, редко использовало заглавные буквы и знаки препинания да еще допускало частые сокращения, отмечаемые титлами. И тем не менее такое письмо все же понимали, так как при расшифровке речевого потока и его письменной фиксации в руках человека есть такое средство, как "значение". Сделав некоторое усилие, мы также сможем понять, что за приведенными последовательностями знаков скрывается более знакомое нам написание - "На севере диком стоит одиноко на голой вершине сосна".
Но машина лишена понимания, она не различает "значений". А с другой стороны, именно "значения" или семантическую информацию намереваемся мы вводить в память машины, чтобы она сберегла ее, обработала под определенным углом зрения и затем выдала по требованию человека.
Так возникает проблема деления речевого потока на дискретные единицы, наделенные семантической информацией (морфемы). Фактически эта проблема состоит из двух ступеней: в нахождении границ, проходящих между отдельными дискретными отрезками в фонетическом потоке речи, и затем в нахождении в пределах этих дискретных отрезков признаков тех элементов (фонем), из которых и строятся значащие элементы (морфемы и слова). В данном случае осуществляется, следовательно, переход с фонетического уровня на фонематический (см. выше).
При попытках решения данной проблемы, к изучению которой только-только приступили и которая рассматривается с точки зрения задач первой ее ступени, стремятся использовать разные точки опоры. Во-первых, те прерывы, которые наблюдаются в естественном потоке речи. Они обусловливаются дыхательными возможностями человека, и ритм их человек стремится согласовать с логической структурой фразы, в письме отмечаемой пунктуацией. Однако эти прерывы, сами по себе являющиеся производными от двух факторов - физиологического и логического, являются достаточно неверной основой для разрешения задачи: их логическая целенаправленность очень часто перечеркивается потребностями эмоционального выражения. Во-вторых, привлекается интонация (просодические средства речи). В качестве резервных факторов данного поиска можно рассматривать законы окончаний слов (т. е. возможность и невозможность определенных комбинаций фонем на исходе слова, так же как его просодическая характеристика), а также явления стыка слов (junctures), требующие, однако, своего дальнейшего лингвистического и акустического изучения.
Описанные направления поисков решения данной проблемы основываются на пофонемном анализе речевого потока, которому ныне уделяется преимущественное внимание. Но уже из приведенного краткого обзора становится ясным, что стратегия пофонемного автоматического отождествления связана с большими трудностями и очень сложна. Поэтому возникает вопрос, не экономичнее ли с точки зрения исследовательской процедуры обратиться к более крупным единицам - слогам и морфемам. Рассмотрим вкратце преимущества послогового и поморфемного отождествления.
В послоговой стратегии прежде всего нужно определить понятие слога. Здесь следует отмыслиться от традиционного его определения, помимо всего прочего довольно неясного. С точки зрения целей прикладной лингвистики слогами надо считать набор повторяющихся и обладающих достаточно четкой акустической "отграниченностью" звукосочетаний (звуковых последовательностей), через посредство которых можно исчерпывающе описать словарь данного языка. Само собой разумеется, что этот набор можно установить лишь эмпирически, помимо заранее принятых установок (вроде обязательного наличия гласного элемента). Весьма трудоемкую работу по определению набора слогов для данного языка (видимо, количество их будет колебаться в пределах 3000-5000) можно полностью передоверить машине. К числу преимуществ послоговой стратегии автоматического отождествления речи (по сравнению с пофонемной) следует отнести следующие:
достаточно отчетливые акустические признаки слогоделения;
сравнительно ограниченную вариантность (или возможность их редукции);
значительно меньшие возможности сочетаемости. Поскольку такая сочетаемость допустима в пределах ограниченного списка и к тому же еще подчинена закономерностям данного языка, в терминах фонетических слогов значительно проще дать описание дескриптивных структур морфем и слов. Омофония может быть устранена на основе дескриптивных структур более высокого порядка, т. е. уже на морфемном уровне;
фонематическая идентификация фонетического слова ввиду его относительной стабильности и сложного состава, дающего возможность установления достаточно четких акустических признаков, менее сложна. Кроме того, к фонетическим слогам, не обладающим достаточно четко выраженными признаками для фонетической их идентификации или произнесенным настолько неясно, что они не улавливаются воспринимающим механизмом, значительно легче применима процедура поиска его по контексту, аналогичная "процедуре отсутствующего слова", которая применяется в машинном переводе тогда, когда в словаре машины отсутствует данное слово. В заключение следует отметить, что в тех случаях, когда не имеются в виду цели создания звукозаписывающей машины и автоматическая идентификация речи ставит своей задачей введение семантической информации в машину, можно миновать стадию письменной фиксации слогов - в данном случае гораздо практичнее выражать их непосредственно в бинарном коде. Совершенно очевидно, что это проще сделать в отношении слова как дескриптивной слоговой структуры, чем слова как дескриптивной фонематической структуры. Алфавит фонетических слогов, вводимый в память машины для последующей идентификации морфем, будет менее обширен*.
* (Предпочтение послоговой стратегии отдает и коллектив авторов книги "Речь, артикуляция и восприятие" (М.-Л. 1965). См., в частности, заключительную главу)
В этом случае практически придется иметь дело не с безграничностью языка в целом, а с некоторым "закрытым" языком, ориентированным на данный участок работы и введенным в память машины. Определенная последовательность слогов будет выступать здесь в качестве адресного индекса, "выуживающего" из памяти машины соответствующие слова. Неудобство этого принципа заключается, однако, в том, что словоформы придется трактовать как отдельные слова. При ограниченной памяти машины это значительно сужает язык. Впрочем, в "закрытых" языках указанного типа словоформы обычно стандартны и набор их довольно ограничен.
Автоматическое распознавание устной речи - только первый и в известной мере лишь предварительный этап в решении тех больших задач, которые ставит перед собой прикладная лингвистика. Если уже этот первый этап сопряжен с преодолением огромных трудностей, то еще больше сложностей возникает при обращении к последующим этапам, которые естественным образом распадаются на две группы: 1) машинный перевод и 2) обработка одноязычной семантической информации. В первом случае исследователь имеет дело с двумя или несколькими языками, а во втором-лишь с одним. Во второй группе выделились в самостоятельные проблемы: автоматизация поиска информации (выдачи информации по запросу), автоматическая индексация документов и автоматическое аннотирование документов (слово "документ" следует понимать здесь в широком смысле - это может быть и патент, и договор, и научная работа, и газетная статья, и пр.). Все эти направления работы по своим конечным целям уже непосредственно приближаются к задачам совершенствования техники интеллектуальной деятельности человека. Все они имеют дело со смысловым содержанием и "значениями", заключенными в словах, грамматических формах и предложениях естественных языков.
Из всех перечисленных проблем наибольшей известностью пользуется проблема машинного (автоматического) перевода. Иногда даже к ней сводят всю прикладную лингвистику. Ей специально посвящено несколько журналов* в разных странах, для рассмотрения ее собирались международные конференции и симпозиумы**, создавались мощные научные коллективы*** и даже организовывались учебные центры для подготовки специалистов в данной области. А проблема остается еще нерешенной. Более того, в послед нее время стали раздаваться голоса о невозможности разрешения полностью автоматизированного (без пред- или постредактирования текста человеком) и квалифицированного машинного перевода, и притом со стороны весьма авторитетных ученых, стимулировавших возникновение самой проблемы****.
* ("Mechanical Translation" (США); "Mathematical Linguistics and Automatic Translation" (США); "La traduction automatique" (Франция); "American Documentation" (США); в Советском Союзе выходили непериодические издания: "Машинный перевод и прикладная лингвистика" (изд. 1-го МГПИИЯ) и "Лингвистические исследования по машинному переводу" (изд-во ВИНИТИ, М.). Раздел "Машинный перевод" есть также в сборниках "Научно-техническая информация" (Москва). )
** (См., например, "Proceedings of the International Conference or Machine Translation of Languages and Applied Language Analysis", London, 1962; Automatic Translation of Languages. "Proceedings of the International Conference on Information Processing", UNESCO, Paris - Munich - London, 1960.)
*** (Отчеты о деятельности этих коллективов (или обзор результатов их деятельности) содержатся в ежегодных "Research in Machine Translation" и в отчетах специального подкомитета комитета по науке и астронавтике в палате представителей Конгресса США. Research on Mechanical Translation, Washington, 1960.)
**** (См.: Y. Вar-Hillel, A Demonstration of the Nonfeasibility of Fully Automatic High Quality Translation, "Advances in Computers", vol. 1, 1960; его же, The Present Status of Automatic Translation of Languages, там же; его же, Decision Procedures for Structure in Natural Languages, "Report of the State of Machine Translation in the United States and Great Britain", Appendix III, Jerusalem, 1959. Популярная статья с изложением его точки зрения, которую Бар-Хиллел написал для литературного приложения к лондонской газете "Таймс", напечатана в русском переводе в "Научных докладах высшей школы. Филологические науки" (1962, № 2) ("Будущее машинного перевода"). )
Проблема машинного перевода была пробным камнем исследований в области прикладной лингвистики. Она преподала некоторые уроки, полезные для последующей работы.
Несколько перефразируя известные слова Бисмарка, по ее поводу можно сказать, что энтузиазм - дар божий, но не следует им злоупотреблять.
Не следует сразу замахиваться на решение проблемы во всем ее объеме. Ее надо решать в пределах "закрытых" и стандартизованных языков. Последнее возможно сделать уже имеющимися средствами.
Значение проблемы машинного перевода далее не следует сводить лишь к практическому ее решению. В значительной степени она важна не столько практическим решением вопроса, сколько побочными своими (также и существенными теоретическими) выводами. Именно в силу этого последнего обстоятельства она значительно шире своего наименования и включает также иные цели приложения к естественному языку формального аппарата.
Нельзя приступать к инженерно-техническому решению данной проблемы до тех пор, пока она не будет решена лингвистически. Естественный язык - предмет изучения лингвистики, и поэтому первое слово должно принадлежать в подобных случаях лингвистам. Это - элементарное требование, но оно не выполняется. И виновны в этом главным образом сами лингвисты, с легкостью передоверившие свою работу математикам, логикам и инженерам. Совершенно бесспорно, что решение проблемы машинного перевода в значительной степени не достигнуто еще до сих пор потому, что она не была подготовлена лингвистически.
Процесс перевода состоит в том, что наделенная определенным смыслом последовательность единиц одного языка заменяется последовательностью единиц другого языка, передающих тот же смысл. При машинном переводе сначала необходимо автоматизировать процесс опознавания смысла в исходном языке, а затем уже передавать команду для выражения этого смысла средствами другого языка. Чтобы автоматически выполнить перевод, для первого его этапа необходимо располагать программой распознавания, а для второго этапа - программой команд.
При создании программы распознавания опираются на структурные особенности языка в том их виде, в каком они запечатлены в письме, так как пока речь идет лишь о письменном, а не устном переводе. Машина считывает текст букву за буквой, отмечает пространства между отдельными их группами, пунктуационные знаки и специальные символы. Введенные в машину последовательности графических элементов должны затем получить морфемное распознавание, т. е., иными словами, программа должна установить, носителями какого смыслового элемента является данная комбинация букв, отделенная от другой чистыми пространствами.
Чтобы подобная идентификация осуществлялась успешно, необходимо максимально приблизить программу к двум наборам уровней естественного языка: к уровням организации и к уровням интеграции. Уровни организации - выбор и схема расположения последовательности единиц - представлены в программе машинным словарем и алгоритмом перевода. Алгоритм имеет двоякую задачу: из ряда возможных словарных эквивалентов он должен выбрать тот, который пригоден для данного подлежащего переводу предложения, но он также должен в случае необходимости обеспечить перестановку последовательности единиц другого языка, чтобы в соответствии с его особенностями правильно передать смысл предложения. Таким образом, алгоритм должен быть способен распознавать синтаксические и иные условия, при соблюдении которых лишь возможны выбор и определение схемы расположения единиц. Для того чтобы такое распознавание было эффективным, нужно учитывать уровни интеграции языка - слитные единицы различных порядков сложности. Они идентифицируются по своим границам и по своим функциям*.
* (См. статью: P. Garvin, A linguist's view of language - data processing. В кн.: "Natural Language and the Computer", ed. by P. Garvin, New York, 1963. )
В машинном переводе приходится иметь дело с буквами (графически представляющими речевые звуки), грамматическими средствами языка и синтаксисом. "Последовательности звуков или букв,- пишет Д. Хейз,- указывают, какие формы встречаются в тексте. Грамматические средства указывают, какие синтаксические отношения существуют между встречающимися формами. А слова и синтаксические отношения в тексте указывают на его значение. Концепция синтаксической структуры может быть формализована... а грамматические средства языка инвентаризованы. Но когда мы от синтаксической теории переходим к семантике, мы оказываемся перед глухой стеной: мы на сегодняшний день не располагаем никаким адекватным истолкованием семантической структуры"*.
* (D. Hays, Research Procedures in Machine Translation. Указанная выше книга, стр. 192. )
В машинном переводе (как и в переводе вообще) в конечном счете речь идет о выражении средствами разных языков единого значения. Возможно ли это? Да и существуют ли такие "единые значения", образующие разноязычные синонимы?* На первый взгляд подобные вопросы кажутся праздными - ведь существует же бесконечное количество художественных и научных переводов, которыми мы каждодневно пользуемся; точно так же есть и устные переводчики, вполне справляющиеся с задачей обеспечения взаимопонимания у людей, которые не имеют общего языка. Однако при более внимательном рассмотрении все оказывается значительно сложнее. И традиционное определение синонимии, под которое, по сути дела, следует подвести изучение такого рода явлений, мало способствует решению возникающих в связи с ними вопросов.
* (У. Вайнрайх в связи с данным вопросом пишет: "Для тех, кто относится серьезно к семантическим описаниям, даже самые распространенные и самые "общие" слова, строго говоря, несравнимы. Разве мы можем сказать, что во всех языках есть слово глаз, если в одном языке соответствующее слово означает также "зрение", в другом - также "середина", в третьем - также "могущество" и т. д.? И если даже мы обнаружим параллелизм в моделях полисемии, условия их контекстуального поведения бесспорно будут различаться от языка к языку" (U. Wеinrеiсh, On the Semantic Structure of Language. Universals of Language, Cambridge, Mass., 1963). Собственно, основная трудность в глоттохронологии заключается как раз в невозможности составить список общих для всех языков слов. См. по этому поводу: В. А. 3вегинцев, Лингвистическое датирование методом глоттохронологии (лексико-статистики), "Новое в лингвистике", вып. I, М., 1960.)
Интересно отметить, что аналогичные проблемы возникают и в том случае, когда исследователю приходится иметь дело с одним языком. Как указывалось выше, в данном случае исследование сводится к трем конкретным проблемам: автоматизации поиска информации, автоматической индексации и автоматическому аннотированию. От машинного перевода все они отличаются тем, что осуществляют не только передачу информации (это также имеет отношение к ним), но и их оценку соответственно определенным релевантным критериям. А эта оценка в свою очередь предполагает сравнение элементов в терминах данных релевантных критериев.
Подобного рода сравнение может осуществляться на основе систематической классификации, в рамках которой и избираются единицы для своего сравнения.
Все виды обработки одноязычной информации имеют общие и частные особенности. Общим для них является то, что все они ориентированы на обработку семантической информации естественных языков. Частные особенности обусловливаются характером выполняемой при этом конкретной работы.
В проблеме автоматического поиска информации на входе машины находится запрос информации. Этот запрос может носить различные формы. Он может быть представлен в некотором стандартизованном языке или обработан вручную человеком. В последнем (да и частично и в первом случае) нарушается сам принцип автоматизации процесса. Но запрос может быть представлен и на естественном языке. Тогда, до того как он будет введен в машину, он должен будет подвергнут соответствующей автоматической обработке, чтобы получить формы стандартизованного языка, или кода. Задача машины заключается в том, чтобы отобрать информацию, соответствующую запросу, и представить ее на выходе. Классификационная система, используемая для заложения информации в память машины, во многом напоминает систему индексов, применяемую в библиотеках. Зная индекс той отрасли знаний, которая нас интересует, мы по систематическим каталогам легко находим те книги, которые имеются по данной отрасли знаний в библиотеке.
Подобную же работу должны выполнять информационные машины (и выполняют ее, поскольку они уже существуют), специализирующиеся в определенной области (так как объем их памяти еще не настолько велик, чтобы сделать их универсальными), но вместе с тем и выдающие более детализированную информацию. Система индексов, как правило, пока готовится человеком вручную. Таким образом, фактически автоматизируются лишь поисковые операции в пределах памяти,машины. Но индексация также может быть автоматизирована, однако это уже другая проблема*.
* (Краткое и ясное изложение проблем, связанных с автоматическим поиском информации, так же как и с автоматической индексацией, см. в статье: Dor R. Swanson, The Formulation of the Retrieval Problem. В кн.: "Natural Language and the Computer", New York, 1963. )
Автоматическая индексация информации, или определение ее "адреса", в том случае, если запрос осуществляется на естественном языке, предполагает обработку самого этого языка. При этом опять-таки речь должна идти не о языке вообще, а о "закрытом" языке документов определенного типа (например, патентов, соглашений, договоров, постановлений и пр.). При этом индексация может быть многоадресной, т. е. производиться под разными углами зрения. Так, если мы имеем дело с торговыми соглашениями, то они могут классифицироваться по странам, по фирмам, по товарам, по денежному выражению и т. д. Совершенно очевидно, что чем больше адресов оказывается необходимым находить в документе, тем сложнее задача его автоматической индексации. Не менее очевидно и другое - обработка естественного языка в задачах его индексации для заложения в память машины должна осуществляться ради семантической информации, запечатленной в данном языке, и с точки зрения этой семантической информации.
Автоматическое аннотирование до известной степени напоминает автоматическую индексацию, но, разумеется, значительно сложнее ее. При этой операции на входе находится документ на естественном языке. Машина должна распознать предмет, о котором идет речь в документе, и дать на выходе краткое резюме. Хотя такое резюме, конечно, может иметь только фактологический и отнюдь не оценочный характер, значение семантического фактора приобретает здесь еще большую важность. Машины этого типа, выполняющие более сложные операции, обычно именуют информационно-логическими.
Так же как и при машинном переводе, у всех видов обработки одноязычной семантической информации можно выделить два этапа: распознавание и команды на выполнение заданной операции. Все перечисленные проблемы рассматриваемого типа сближаются в том отношении, что фактически предъявляют одинаковые требования к созданию программы распознавания, но значительно отличаются друг от друга своими программами команд.
Программа команд при автоматическом поиске информации (при условии, что на входе будет запрос, сформулированный на естественном языке) будет включать и команды для перевода естественного языка в поисковый язык, используемый при операции поиска.
При автоматической индексации программа команд будет состоять из команд, посредством которых осуществляется ввод в память частей документа по определенным группам ячеек, соответствующих индексам. На основе этих индексов (адресов) и будет затем выдаваться информация при ее запросе.
При автоматическом аннотировании программа команд должна будет состоять главным образом из набора классификационных признаков, действующих на бинарном принципе. В приложение к конкретному предложению они должны на выходе давать сведения о наличии или отсутствии данного признака в данном предложении. Полученная таким образом аннотация будет носить довольно элементарный характер, но для обработки документов некоторого типа она оказывается достаточной. Кроме того, это только начало весьма перспективной проблемы.
Составление программ команд - в основном задача вне- лингвистическая. Может быть, поэтому оно уже теперь допускает достаточно определенное формулирование для своего разрешения. Критическим местом во всех этих проблемах является то, которое лежит на совести лингвистов,- опознание значения для целей сравнительной оценки,что, как указывалось выше, составляет основу для решения всех проблем. В идеале программа распознавания должна быть способна выполнять две операции: распознавать в документе, написанном на естественном языке, отдельные семантически значимые единицы (слова и словосочетания идиоматического типа) и выносить решение на основе критерия сравнимости относительно каждого семантически значимого элемента, выделенного в документе. Если первое из данных требований может быть в той или иной степени удовлетворено процедурой, применяемой в машинном переводе при распознавании идиом*, то со вторым дело обстоит гораздо сложнее. Для его удовлетворения словарь машины должен включать, помимо грамматического кода, также и семантический код, причем такого рода, чтобы было возможно производить сравнение и оценку семантически значимых единиц, т. е., по сути говоря, того, что известно в лингвистике под именем значений.
* (Об этом см. статью: P. Gаrvin, Syntax in Machine Translation. В кн.: "Natural Language and the Computer", New York, 1963. )
Таким образом нужно располагать классификационной системой значений, построенной на таксономическом принципе, надо иметь ясное представление о природе синонимии (собственно, она должна лежать в основе сравнения семантических единиц) и, наконец,- самое главное! - надо знать, что же такое значение.
Делались и делаются многократные попытки в этом направлении. Одни основываются на дистрибуционном принципе, наиболее последовательно изложенном З. Хэррисом. Он исходит из того, что слова с одинаковым значением должны встречаться в тождественном контексте (иметь тождественную дистрибуцию). Отсюда следует, что слова с разными значениями имеют определенную, но различную дистрибуцию. Таким образом, значения слов не столько определяются, сколько разграничиваются через дистрибуцию слов*. Д. Хейз объединяет этот метод с предметно-лингвистическим**, многократно излагавшимся в советской лингвистической и философской литературе, но, очевидно, непригодным для целей прикладной лингвистики. П. Гарвин также говорит о ценности дистрибуционного принципа, но предлагает пополнить его методом перефразировки. Этот метод по замыслу должен привести к выделению своеобразных архизначений или семантических инвариантов*** и несколько напоминает "семантический анализ" П. Циффа, опирающийся на понятие семантической регулярности (нечто вроде семантического эталона) и семантического отклонения****.
** (D. Hays, Research Procedures in Machine Translation, "Natural Language and the Computer", New York, 1963.)
*** (P. Garvin, A Linguist's View of Language-data Processing. В KH.:"Natural Language and the Computer",New York, 1963, pp.124-125. )
**** (P. Ziff, Semantic Analysis, New York, 1960. )
Но, видимо, наиболее перспективным является метод, основанный на понятии моносемы, о которой говорилось в первой части настоящей книги. При этом следует учесть два момента. Во-первых, необходимо уточнить и детализировать этот метод применительно к описанным задачам автоматической обработки речевой информации* (пока понятие моносемы имеет лишь общетеоретическое формулирование). Во-вторых, иметь в виду, что использование моносемной методики сулит успехи пока лишь в пределах "закрытых" и ограниченных по набору моносем специальных языков.
* (Этой задаче частично посвящены две работы А. Е. Кибрика - "Автоматическая проблематика гетерологического кодирования" и "Лингвистические вопросы автоматического кодирования". Сб. "Теоретические проблемы прикладной лингвистики" (М., 1965).)
Наконец, еще одно обстоятельство. Как явствует из описания лингвистической стороны проблем автоматической обработки речевой информации, они предполагают обращение к логико-математическим методам. Надо, однако, иметь ясное представление о рабочих возможностях этих методов. Этому посвящен следующий раздел.