Языкознание Новости Библиотека Энциклопедия Карта проектов О сайте

Пользовательского поиска



28.07.2012

Ученые определили время 'совершеннолетия' английского языка

Лингвисты проследили за эволюцией самых часто употребляемых фраз в книгах на английском языке и установили, что на рубеже между восемнадцатым и девятнадцатым столетием список таких фраз стабилизировался, и печатный язык, по словам ученых, "достиг совершеннолетия".

Падение разброса частоты употребления популярных  фраз  (n-grams), состоящих из разного количества слов
Падение разброса частоты употребления популярных фраз (n-grams), состоящих из разного количества слов

Работа основана на корпусе текстов, полученном компанией Google в процессе оцифровки книг. Он охватывает около пяти миллионов произведений, написанных начиная с 1520 года по настоящее время.

Ученые анализировали, как список самых часто встречающихся в текстах фраз меняется от года к году. Оказалось, что наиболее древние тексты сильнее всего отличаются друг от друга. Например, десятка самых часто встречающихся фраз в книгах, изданных в 1600 году, могла совершенно не совпадать с такой же десяткой из книг 1610 года.

Однако, на рубеже восемнадцатого и девятнадцатого столетий в употреблении фраз произошла достаточно резкая стабилизация. Ученые объясняют это процессами самоорганизации, которые выражаются в возрастании предпочтительного связывания лексем друг с другом. Условно говоря, слова, которые часто употребляются вместе, со временем образуют устойчивое словосочетание (что можно наблюдать и для других явлений - рreferential attachment).

Самыми часто употребляемыми фразами в английском языке за последние 50 лет стали такие словосочетания как "the end of the" (в конце), "at the same time" (в то же время; вместе с тем), и "the United States of America" (Соединенные Штаты Америки).

Ранее другая группа ученых при помощи того же проекта Google обнаружила словарное сокращение языков. Авторы работали с текстами не только на английском, но и на испанском языке и иврите. Они установили, что большое количество появляющихся в последнее время новых слов не способно компенсировать исчезающие лексемы и в целом все три исследованных языка становятся беднее.


Источники:

  1. www.lenta.ru




Рейтинг@Mail.ru
© Манакова Наталья Александровна - подборка материалов, оцифровка, статьи; Злыгостев Алексей оформление, разработка ПО 2001-2017.
При копировании материалов проекта обязательно ставить ссылку на страницу источник:
http://genling.ru 'GenLing.ru - Общее языкознание'