Израильские исследователи разработали ПО для анализа текста Библии.
Краеугольный камень христианской и иудейской религии — вера в то, что истинным автором Ветхого завета (Танаха) является Бог или по крайней мере пророки, писавшие под диктовку свыше. Целый ряд исследований, однако, давно показал не только то, что авторов было много, но и что пользовались они для выражения воли Всевышнего поразительно разными стилями.
В целом учёные делят текст на две большие части: одна из них написана священниками, а другая — нет. Они тесно переплетены, и вопрос о том, к какой ветви относится тот или иной стих, та или иная глава, по-прежнему стоит довольно остро.
Анализ Пятикнижия (Торы), проведённый с помощью нового ПО, тоже показал наличие двух частей. Результаты на 90% совпали с данными академических исследований — правда, на работу, потребовавшую от людей многих лет, у компьютера ушло несколько минут, отмечает Моше Коппель из Университета Бар-Илана.
Места, в которых программа разошлась с учёными, представляют, конечно же, наибольший интерес. Например, первая глава Бытия считается «священнической», но машина не нашла этому подтверждения. Предполагается, что книга Исайи имеет двух авторов, причём второй принимает эстафету в 39-й главе. ПО согласилось с гипотезой о двух авторах, но увидело руку второго уже в гл. 33.
Прекрасно справилась машина и с более сложной задачей: учёные перемешали текст из книг Иезекииля и Иеремии, и компьютер почти идеально разобрался в головоломке.
В основе программы — распознавание повторяющихся наборов слов и синонимов. Например, один библейский автор называет посох «makel», а другой — «mateh».
Это не первое достижение г-на Коппеля. В 2003 году он принимал участие в разработке ПО, которое в четырёх случаях из пяти угадало половую принадлежность автора текста: выяснилось, что женщины предпочитают говорить о людях, а мужчины — о вещах.
Результаты исследования были представлены на конференции Ассоциации по вычислительной лингвистике.