Созвездия слов представляют собой вселенную, и даже крупный писатель использует только часть ее. Сравним, в словаре языка А. С. Пушкина только 21 тысяча слов. Не каждый человек активно использует все слова. Однако довольно часто возникает потребность получать полную информацию о лексической системе в том или ином аспекте. И вот здесь-то человек должен неизбежно обращаться к более емкой памяти машины. Она способна дать более полное представление о словарном составе русского языка, о его структуре: в научных целях, при составлении словарей, при узнавании новой информации и т. п. Здесь-то и возникает новое научное представление о лексической системе языка в целом, т. е. на помощь человеку пришла созданная его же гением ЭВМ.
Поэтому не надо носить все слова с собой. Человек нашел в ЭВМ хорошего друга, который будет все помнить, держать в памяти слова, вынимать слова при необходимости, знать образные слова, то, что написал писатель, подбирать нужные, помогать делать упраж-нения и многое другое. Если человек будет дружить с ЭВМ, вдумчиво подходить к вычислительной технике, то она ускорит процесс работы, но, конечно, думать все равно придется, ведь от этого нас техника не избавит. Об этом так и говорится в шуточном стихотворении В. Викторова «Но думать - придется...»:
Когда-то рубили
слова топором,
потом выводили
гусиным пером.
Менялись эпохи,
менялись чернила,
и «вечная» ручка
весь мир полонила.
Но можно ли вечной
назваться без риска?
И «шарику» вскоре
сдалась «самописка».
Чтоб те же слова
не строчить многократно,
стучит человек
на машинке печатной.
Вот чудо-машина
уже создается!
Сама твою мысль
на бумаге представит.
Но думать - придется!
Но думать - придется!
От этого техника нас не избавит.
Да, думать придется, создавая новое в науке и в повседневной практике, используя самые современные методы исследований. Ведь вычислительная техника используется в самых различных областях нашей жизни, и без нее не обходится ни одна отрасль народного хозяйства. И конечно, соединение науки и техники будет представлять особый интерес для нас с вами, дорогой читатель, так как оно расширит сложившееся представление о языке как о чем-то гуманитарном и соединит такие важные понятия, как «лингвистика» и «вычислительная техника».
ЭВМ и стихи
Читая книжку, мы с вами убедились, что наиболее сложной системой в языке является лексика, что количество слов значительно превышает количество звуков (фонем), грамматических форм и конструкций. Для того чтобы получить полное представление о лексике, необходимо обладать хорошей памятью, а для того чтобы решать многие важные вопросы, связанные с изучением лексики, нахождением и выбором нужных слов, нужна мгновенная скорость. Вот тогда и приходят на помощь электронно-вычислительные машины. Самый простой пример - это составление словарей. Данные о словах получают из художественной литературы, из журналов, газет, записей живой речи и т. п. И все эти материалы нужно обсчитать, разбить по значениям, употреблению, выяснить их частотность и т. д. И конечно, здесь без компьютера не обойтись. Ведь в докомпьютерную эпоху лингвистическая обработка текстов длилась годами, десятилетиями. А теперь ЭВМ дает необходимую информацию в течение дня или недели в зависимости от сложности составленной программы.
Ю. Н. Караулов в связи с этим говорит, что автоматизация лингвистических исследований, создание машинного фонда (банков данных) русского языка, который будет подготовлен с помощью ЭВМ, явится современной надежной исследовательской базой и многократно усилит наши возможности исследования русского языка. Речь при этом идет не только о разработке практики переводов с одного языка на другой с помощью электронно-вычислительных машин, но и о подготовке и издании словарей с помощью ЭВМ. Ручной труд составителей словарей и по сбору конкретных фактов языка, и по обработке собранного материала мало продуктивен. Если же мы привлечем для этого вычислительную технику, то сможем значительно большего достичь в деле составления словарей и повысить эффективность этой работы. Представьте, сколько нам нужно словарей для народного образования, для того, чтобы удовлетворить культурные потребности населения! А ЭВМ позволяет резко сократить сроки создания словарей. Ведь современные ЭВМ способны за секунду выполнить миллионы операций, в то время как человек на это тратит огромное количество времени.
В предыдущих главах мы с вами говорили об устройстве слова, их системных отношениях, о хранении слов в памяти одного человека, целых поколений, и о том, что для хранения информации существуют словари, книги, которые находятся в библиотеках в миллионах и миллионах томов. Из этих книг мы можем выбрать необходимые нам сведения в нужное время. С появлением ЭВМ слова стали храниться уже в памяти машины в миллионах знаков. Основным инвентарем, который фиксирует определенные знания для ЭВМ (составление словарей, лингвистические исследования, перевод текстов и т. п.), стала словарная единица, потому что она составляет основную базу описания естественного языка и является элементом лексической системы, которая позволяет точно и полно установить структуру лексико-семантической системы языка. Она позволяет выявить отношения между элементами и подсистемами, т. е. лексика, ее различные виды и единицы, ее отношения (синонимия, антонимия, семантические группы, классы, семантические поля и др.) необходимы для применения в ЭВМ, для составления банков лексикографических, лингвистических и др. Таким образом, ЭВМ может держать в своей памяти самые различные смысловые отношения слов, их значения, их сочетаемость, стилистическую характеристику, употребление и т. п. Если человек задаст все эти параметры, то найдет в ЭВМ своего верного и надежного помощника, который сможет решать непосильные для человека задачи.
Развитие вычислительной техники и информационных систем предполагает и дальше развивать информационно-поисковый массив автоматизированного банка данных, который является основным хранилищем знаний ЭВМ. Уже сейчас из банков данных можно извлекать информацию на любые расстояния. Например, сейчас в мире накоплено более 100 миллионов документов. И информационно-поисковая система, построенная на основе телевидения, телефона, спутников связи может в любой момент «выдать» на дисплей необходимую информацию. В Институте научной информации общественных наук (ИНИОН) в Москве хранится 12 миллионов единиц по общественным наукам и научные сведения из 1 000 журналов. И если возникает необходимость в какой-то информации, то по каналам связи могут подключаться любые страны и наши республики. В будущем к ЭВМ будут подключать и библиотеки.
Появление ЭВМ считается одним из выдающихся научно-технических достижений человечества, а хранимая в них информация имеет для человечества значение не меньшее, чем появление книгопечатания.
Проблемы лингвистики становятся одними из самых важных и сложных в мире. Интерес к ним возрос в связи с использованием ЭВМ в лингвистике. Ярким примером того, что может сделать машина и что так трудно для человека, служит проблема лингвистических исследований. Например, машина легко подсчитает, сколько раз встречаются в тексте одинаковые слова или сколько рифм в поэме. ЭВМ может найти все формы с определенной сочетаемостью, или все синонимы, или антонимы, или найти семантическое поле. Так, с помощью ЭВМ был проведен анализ бессмертной поэмы Шота Руставели «Витязь в тигровой шкуре». «Специалисты центра научной информации по общественным наукам Академии наук Грузии ввели в память машины строфы поэмы, разработали текстовую поисковую систему. В результате оказалось, например, что в поэме, где 43 400 слов, ни одна рифма не повторяется.
Теперь у лингвистов появился новый инструмент для исследований. С помощью ЭВМ можно проследить закономерности развития языка, установить подлинность текста» (Труд.- 1986. - 8 мая), т.е. с появлением ЭВМ скорость обработки данных возросла в миллионы, миллиарды раз. Конечно, нельзя обольщаться, что дисплей полностью заменит книгу, что надо только нажать кнопку - и перед вами появится нужный материал, успевай только «переваривать» его. Самое главное в том, что на современном этапе знаний необходимо сочетать традиционные формы работы с книгой с последними достижениями науки и техники - с компьютерами, которые служат мощным средством усиления и расширения наших возможностей.
А вот еще одна задача: как работать с терминологией? Ведь термин - это как бы результат соприкосновения языка, науки и техники, поэтому-то терминология объединяет все области профессиональной деятельности человеческого общества. Вследствие этого возникает в языке огромное количество терминов. В химии их насчитывается несколько миллионов, огромное количество терминов в физике, астрономии, биологии, космонавтике, материаловедении, экономике и информатике. И здесь встает проблема упорядочения и систематизации терминов в виде словарей и приведение их в определенный порядок на языках народов СССР, централизация информации и «выдача» ее на любые расстояния. Конечно, здесь без современных суперкомпьютеров не обойтись. Вот и приходят на помощь современные суперЭВМ, производительность которых уже исчисляется сотнями миллионов, миллиардами операций в секунду.
В науке, в повседневной практике есть много задач, для решения которых необходимо выполнять громадные объемы вычислений, и притом в более или менее приемлемые сроки. Сюда же можно отнести и перевод текстов. Ведь текст - это не что иное, как определенная комбинация слов. Одно море слов надо перенести в другое море слов. В современном мире рынок перевода неуклонно расширяется. По данным ЮНЕСКО (Организация Объединенных Наций по вопросам образования, науки и культуры), в мире проживает 4 миллиарда 500 миллионов человек и говорят они на 3000 языках. Появляется около 550 тысяч названий разных работ. Из этого количества 120 тысяч на английском и 60 тысяч на русском, 50 тысяч на немецком, 30 тысяч на французском, испанском и японском, примерно 10 тысяч на итальянском, голландском, шведском, польском, венгерском, чешском, корейском языках. И вот, чтобы преодолеть языковой барьер, чтобы понять друг друга при общении, нужны сотни тысяч переводчиков.
Разнообразие и актуальность языков в мире увеличивается и в связи с выходом на мировую арену развивающихся и освободившихся от колониального гнета стран. В настоящее время увеличивается число коммуникаций, связанных с СЭВ. Расширяется коммуникация за счет телевидения, телефона, транспорта, различных средств связи, путешествий и т. п. В результате этого в мире резко возросла проблема языковых барьеров. Вот поэтому и создаются для координации работы в мире и в СССР единые центры перевода. И здесь на помощь приходит автоматизация машинного перевода, который в несколько раз увеличивает продуктивность переводов научно-технических текстов. Впереди большая и сложная работа по обработке ЭВМ художественных текстов. Но это уже связано с будущим, с созданием нового поколения ЭВМ с интеллектуальными банками данных. Над ними сейчас идет кропотливая работа.
Союз лингвистики и электроники может в самом ближайшем будущем значительно ускорить и изучение иностранных языков. Сейчас уже создано новейшее видеоэлектронное оборудование, предназначенное для изучения иностранных языков. Например, можно за 2-3 часа с помощью компьютера познакомиться с грамматикой арабского, японского, китайского и других языков, а также усвоить лексический минимум, необходимый для ведения несложной беседы на незнакомом языке.
ЭВМ открывает доступ к огромным знаниям, помогает нам быстро найти необходимую информацию и тем самым ускоряет путь решения поставленной нами задачи.
Привлечение ЭВМ к обработке информации во многом расширяет возможности языка, язык становится той основой, на которой организуется диалог между человеком и ЭВМ. «В эпоху научно-технической революции, - говорит профессор Р. Г. Пиотровский в своей книге «Текст, машина, человек», - язык значительно расширил свои коммуникативно-общественные функции. Продолжая оставаться важнейшим орудием общения между людьми, естественный язык становится той основой, на которой организуется диалог между человеком и ЭВМ. Опыт построения и работы современных автоматизированных систем управления, а также систем сбора, хранения и переработки научно-технической информации говорит о том, что в ближайшем будущем естественный язык и его разновидности станут основным средством передачи информации в коммуникационных системах «человек - машина - человек». Разрабатываются и создаются специальные информационные языки для компьютеров. Все это, бесспорно, требует и перестройки самого человека, его мышления. Акад. Г. И. Марчук говорит, что «сегодняшнее поколение должно приучаться к новому мышлению компьютерной эпохи. Ведь уже сейчас ЭВМ помогает учителям. Но этого мало: в школе, в профессионально-техническом училище, в техникуме, в институте надо учить юношей и девушек умению обращаться с ЭВМ, пониманию всех ее возможностей и принципов работы. Эта задача во многом психологическая: человек должен во всех отношениях быть готовым к диалогу с машиной».
Впереди необозримые просторы для новых достижений. Это и подключение ЭВМ к библиотекам, и перевод художественной литературы, и автоматы-переводчики, и компактные словари, и редакторы, и многое многое другое, что сможет сделать ЭВМ со словом. Горизонты созвездий слов и ЭВМ поистине космические. ЭВМ стала надежным помощником человека в его деятельности, но, конечно, надо всегда помнить и о роли самого исследователя, потому что только труд, каждодневная работа - это прямой путь к познанию истины.