Человеческий мозг очень часто сравнивают с вычислительной машиной. Но машина эта действует не по строго заданной программе жестких алгоритмов. Ведь мы живем в постоянно меняющейся среде, никто не в состоянии учесть все случаи, ситуации, изменения, которые могут произойти в окружающем нас мире. Наше поведение, управляемое мозгом, носит вероятностный характер. Мы строим в уме своеобразную модель будущего, опираясь на наш прошлый опыт и на те пробы и прощупывания, которые условно обозначаются как ориентировочные реакции.
Порой мы делаем это сознательно: вычисляем вероятность того или иного события и принимаем соответствующее решение. Чаще же всего мы делаем это подсознательно, "прикидывая" вероятности, хотя и не выраженные в точных числах, избирая стратегию поведения в соответствии с этими вероятностями, и делаем определенные "ходы", хотя не имеем ни малейшего представления о математической теории игр, моделирующей поведение. Как выразился один из корифеев советской физиологии, профессор Н. А. Бернштейн, в любой фазе, намечая пути дальнейших действий, "мозг в состоянии лишь наметить для предстоящего момента своего рода таблицу вероятностей возможных исходов".
Скорее всего, как вероятностная машина работает наш мозг и тогда, когда он воспринимает человеческую речь. Ведь восприятие ее идет на фоне самых различных "помех": мы можем неточно произнести тот или иной звук, "проглотить" слог, опустить связку, употребить многозначное слово, упростить синтаксическую конструкцию в устной речи. Все эти помехи при декодировании, восприятии речи мозгом ликвидируются, причем очень быстро.
Математическая лингвистика находит, что язык имеет свои четкие статистические параметры, частотные характеристики того или иного стиля, употребления падежа, слова, грамматической конструкции... Может быть, подобного рода вероятности существуют не только объективно, в текстах, но и субъективно? То есть своеобразная и уникальная вычислительная машина - мозг - имеет свою собственную вероятностную модель языка? И согласно этой модели происходит восприятие и порождение речи?
Проверкой этой гипотезы занимались многие ученые в нашей стране и за рубежом. И вот какие интересные результаты были получены ими...
Возьмем русский язык. С помощью вычислительной техники составлен частотный словарь русского языка, на основании которого мы можем судить об употребительности того или иного слова. Из этого словаря была взята выборка в сто слов, имеющих разную частоту употребления. Затем тридцать человек разного возраста, профессии и уровня образования рассортировали эти слова по семи категориям - в зависимости от того, как часто в их языковой практике они встречаются (никогда - очень редко - скорее редко, чем часто - не очень редко, но и не часто - скорее часто, чем редко - весьма часто - на каждом шагу).
Обработка результатов эксперимента показала, что в основном частоты субъективные, хранящиеся в мозгу носителей языка (в данном случае русского, но подобного же рода опыты были проведены и по другим языкам), совпадают с частотами объективными, полученными в результате статистической обработки текстов на ЭВМ.
Правда, были некоторые расхождения. Касались они прежде всего общеупотребительных, бытовых слов, таких, как туфли, зонтик, пакет и т. п. По данным частотных словарей, слова эти очень редкие. А по субъективным оценкам - скорее частые, чем редкие... В чем тут дело? Очевидно, в том, что при оценке слов этого типа участники эксперимента опирались не на частоту самого слова, а на частоту встречаемости предмета, этим словом обозначаемого. Предметы вроде туфель, зонтика и т. п. в нашем быту встречаются очень часто, а слова, их обозначающие, - редко.
Например, проанализировав частотный словарь французского языка, составленный на базе полутора миллионов слов, ученые обнаружили, что там не оказалось таких обиходных слов, как зубы или ножницы. В частотном словаре русского языка, составленном на базе миллиона слов, нет таких житейских слов, как расческа. Анализ устной речи свидетельствует, что и в ней слова типа туфли или ножницы не являются частыми. А дальнейшие эксперименты психолингвистов показали, что расхождение между объективными и субъективными частотами приходится, как правило, именно на эти обиходные слова - мы склонны завышать их частоту, ибо предметы употребляются в быту очень часто (чего нельзя сказать о самих словах!).
Кто же более прав - объективные частотные словари или наша языковая интуиция, считающая обиходные слова частыми, а не редкими? По данным подсчетов по текстам в устной или письменной речи, обиходные слова всегда попадают в число редких. Однако в нашем представлении они являются частыми. И, как отмечает в своей монографии "Вероятность элементов текста и речевое поведение" Р. М. Фрумкина, субъективные оценки частоты, "по-видимому, лучше отражают вероятностную организацию словаря в речевых механизмах испытуемых, чем данные подсчетов по текстам". И в этом смысле являются более сильным прогнозирующим фактором, чем "объективная" оценка частоты, полученная с помощью статистической обработки текстов на ЭВМ.