К сожалению, помимо многотомного "Словаря языка Пушкина" мы имеем лишь частотный словарь "Стихов о Прекрасной Даме" Блока, да два словаря, о которых только что шла речь выше. Вероятно, в недалеком будущем у исследователей будет достаточное число таких словарей. И тогда можно будет сопоставлять творчество различных поэтов одной эпохи (например, Блока и Брюсова, Маяковского и Хлебникова, Пастернака и Есенина, Мандельштама и Цветаевой, Багрицкого и Уткина), проводить сопоставление различных сборников и поэм одного и того же поэта (скажем, сопоставить "Сестру мою жизнь" не только с "Камнем" Мандельштама, но и с другими произведениями самого Пастернака - "Волнами", "Темами и вариациями", "Спекторским" и т. д.).
Не только на основании частотных словарей получаем мы возможность сделать доказательным то, что чувствуем лишь интуитивно, подсознательно. Методы статистики все шире проникают в литературоведение, поэтику, стилистику. С их помощью исследователи могут давать характеристику стилей различных авторов не только качественную, но и количественную.
Так, уже простой подсчет среднего количества слов в предложении позволяет характеризовать стиль того или иного писателя с помощью чисел. Как пишет советский математик Р. Л. Добрушин, "можно сказать: А. Н. Толстой предпочитает более длинные фразы, а А. И. Куприн - более короткие". А можно сказать и так: "Среднее число слов в фразе в произведении Толстого "Сестры" равно 11,9, а среднее число слов в фразе в произведении Куприна "Поединок" - 9,5". Разница будет примерно такая же, как если в одном случае ограничиться утверждением, что производство угля в Советском Союзе больше, чем в Англии, а в другом - привести конкретные цифры. Каждому ясна большая доказательность утверждения во втором случае".
Первую попытку применить статистику в литературоведении сделал почетный академик Н. А. Морозов, известный деятель "Народной воли", более четверти века проведший в одиночном заключении в Шлиссельбургской крепости. Правда, методика исследования его была несовершенна, что и отмечал крупнейший русский математик А. А. Марков сразу после выхода работы Морозова "Лингвистические спектры". "Только значительное расширение поля исследования (подсчет не пяти тысяч, а сотен тысяч знаков) может придать заключениям некоторую степень основательности, если только границы итогов различных писателей окажутся резко отделенными, а не обнаружится другое весьма вероятное обстоятельство, что итоги всех писателей будут колебаться около среднего числа, подчиняясь общим законам языка",- писал Марков в "Известиях Академии наук" в 1915 году.
Действительно, подсчеты показывают, что стиль отдельных писателей можно характеризовать статистически, употребление отдельных частей речи, типов предложений и т. д. подчиняется определенной вероятностной закономерности.
Приведем несколько примеров. На пятьсот знаменательных слов у Куприна приходится семьдесят семь глаголов, у Пушкина - сто десять, у Чехова - сто двадцать семь. В прозе Симонова на пятьсот слов приходится сто семьдесят существительных, сорок девять прилагательных, семьдесят три местоимения, сто одиннадцать глаголов. У Шолохова соответственно двести шестнадцать существительных, семьдесят семь прилагательных, тридцать девять местоимений, семьдесят семь глаголов.
Еще более характерны числа, говорящие о соотношениях между частями речи у того или иного автора. "Лермонтов видит и изображает мир, действительность в большем разнообразии качественных характеристик, признаков, чем это делает Пушкин: в среднем у Лермонтова 39 имен существительных из каждых 100 получают признаки прилагательных, а у Пушкина таких существительных всего 25; значит, речь и мышление Пушкина предметнее, Лермонтова - "качественнее". О сходной особенности речи и мышления двух авторов говорит и соотношение "наречие - глагол": в среднем у Лермонтова на 100 глаголов приходится 42 наречия, а у Пушкина - всего 26; а это означает, что речь и мышление Лермонтова активнее окрашивают воспринимаемые процессы, чем это делают речь и мышление Пушкина. Интересно и то, что соотношение "существительное - глагол" и "глагол - существительное и прилагательное" оказываются у Пушкина и Лермонтова статистически равными, что позволяет опровергать гипотезу об особой глагольности речевого стиля Пушкина",- пишет Б. Н. Головин в книге "Язык и статистика".
А вот какие интересные данные были получены после подсчета названий цветов у разных авторов в их прозе и стихах. В стихах об Америке Маяковского на тысячу слов текста приходится восемь цветообозначений, а в прозе, говорящей о той же Америке,- только два слова на тысячу. В военной лирике Симонова названия цветов употребляются в восемь раз чаще, чем в его же рассказах военных лет.