Языкознание Новости Библиотека Энциклопедия Карта проектов О сайте

Пользовательского поиска



05.03.2012

Google Books активно эксплуатируется исследователями частотности языковых явлений

На молчаливых книжных страницах идёт яростная борьба: социальные, технические, политические перемены рождают новые слова и значения, вытесняя устаревшие.

Молчаливые книжные страницы хранят в себе отпечаток развития языка
Молчаливые книжные страницы хранят в себе отпечаток развития языка

Международная группа учёных провела анализ частотности употребления более 10 млн слов английского, испанского и иврита в период с 1800 по 2008 год с помощью проекта Ngram, который основан на материале цифровой библиотеки Google Books, охватывающей 5 млн книг на семи языках (около 4% всех напечатанных).

На конференции Американского физического общества руководитель группы Джоэл Тененбаум из Бостонского университета (США) — тот самый, которого судили за «нелегальное» размещение музыки в Интернете, — рассказал о главном выводе. Исчезновение слов из активного запаса языка совпадает с началом эпохи современной печати. Эта тенденция усилилась со стандартизацией методов книгопечатания, а затем — технологий компьютерной вёрстки и проверки орфографии. Вместе с опечатками из тезауруса вылетели менее популярные синонимы. Язык стал более унифицированным.

Вместе с тем обнаружена тенденция к упрощению лексем. Например, в течение нескольких лет после изобретения рентгена в английском языке шла борьба между словами «roentgenogram», «radiogram» и «X-ray». Разумеется, победило последнее — и его конкуренты оказались вне активного запаса. «Каждое слово стремится монополизировать значение», — подчеркнул г-н Тененбаум.

Вот ещё любопытный пример. Примерно до 1939 года в английском языке Первая мировая война звалась Великой (The Great War). Это обозначение выпало из оборота, как только стало понятно, что в действительности это была вовсе не та война, которая, как говорится, должна была положить конец всем войнам.

Любопытно было бы узнать, происходит ли аналогичный процесс не только со словами, но и с выражениями.

Следует отметить, что это далеко не единственное исследование, проведённое за последнее время на материале крупнейшей в мире цифровой библиотеки, обладающей к тому же возможностью поиска. Так, Цзяньбо Гао из Государственного университета им. братьев Райт (США) и его коллеги воспользовались Google Books, дабы сравнить частотность употребления слов, описывающих природные катаклизмы (землетрясения, ураганы и др.) и социальные явления (например, войны, безработицу).

Особенно их интересовала математическая величина под названием экспонента Хёрста, которая описывает вероятность повторения события на основании исторических данных. Можно сказать, этот параметр позволяет судить о том, как прошлое влияет на будущее посредством «памяти» о тех или иных событиях.

Так вот, выяснилось, что у языка долгая память на природные катаклизмы и короткая — на события общественной жизни. И это, кстати, означает, что различные смыслы регулируются языком по-разному. С другой стороны, возможно, дело вовсе не в языке, а во внешних факторах (культурных запретах, цензуре и т. п.), которые оказывают воздействие на распространение информации о социальных явлениях.

Дмитрий Целиков


Источники:

  1. www.science.compulenta.ru




Рейтинг@Mail.ru
© Манакова Наталья Александровна - подборка материалов, оцифровка, статьи; Злыгостев Алексей оформление, разработка ПО 2001-2017.
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://genling.ru 'GenLing.ru - Общее языкознание'