Создана программа, выявляющая нечестные рецензии

Р В РІР‚СљР В РЎвЂўР РЋР вЂљР В Р’В° Р В Р вЂ Р В Р’ВР В Р вЂ¦Р В РўвЂР В РЎвЂўР В Р вЂ¦Р В Р’ВµР В Р’В·Р В РЎвЂР В РЎвЂ Р РЋР С“Р В РЎвЂќР РЋР вЂљР РЋРІР‚в„–Р В Р вЂ Р В Р’В°Р В Р’В»Р В Р’В° Р В РЎвЂўР РЋРІР‚РЋР В Р’ВµР В Р вЂ¦Р РЋР Р‰ Р В Р’В±Р В РЎвЂўР В Р’В»Р РЋР Р‰Р РЋРІвЂљВ¬Р РЋРЎвЂњР РЋР вЂ№ Р В РЎвЂ Р РЋРІР‚РЋР РЋР вЂљР В Р’ВµР В Р’В·Р В Р вЂ Р РЋРІР‚в„–Р РЋРІР‚РЋР В Р’В°Р В РІвЂћвЂ“Р В Р вЂ¦Р В РЎвЂў Р В РўвЂР РЋР вЂљР В Р’ВµР В Р вЂ Р В Р вЂ¦Р РЋР вЂ№Р РЋР вЂ№ Р вЂ™Р’В«Р В РЎвЂ”Р В РЎвЂР РЋР вЂљР В Р’В°Р В РЎВР В РЎвЂР В РўвЂР РЋРЎвЂњР вЂ™Р’В»

Р В РІР‚в„ў Р РЋРІР‚В¦Р В РЎвЂўР В РўвЂР В Р’Вµ Р РЋР РЉР В РЎвЂќР РЋР С“Р В РЎвЂ”Р В Р’ВµР В РўвЂР В РЎвЂР РЋРІР‚В Р В РЎвЂР В РЎвЂ Р В Р вЂ Р В РІР‚СљР В РЎвЂР В РЎВР В Р’В°Р В Р’В»Р В Р’В°Р В РЎвЂ Р РЋРЎвЂњР РЋРІР‚РЋР В Р’ВµР В Р вЂ¦Р РЋРІР‚в„–Р В Р’Вµ Р В РЎвЂўР В Р’В±Р В Р вЂ¦Р В Р’В°Р РЋР вЂљР РЋРЎвЂњР В Р’В¶Р В РЎвЂР В Р’В»Р В РЎвЂ Р РЋРЎвЂњР В Р вЂ¦Р В РЎвЂР В РЎвЂќР В Р’В°Р В Р’В»Р РЋР Р‰Р В Р вЂ¦Р РЋРІР‚в„–Р В Р’Вµ Р В РЎвЂќР В Р’В°Р В РЎВР В Р’ВµР В Р вЂ¦Р В Р вЂ¦Р РЋРІР‚в„–Р В Р’Вµ Р РЋРІР‚С›Р В РЎвЂР В РЎвЂ“Р РЋРЎвЂњР РЋР вЂљР РЋРІР‚в„– Р В Р вЂ¦Р В Р’ВµР В РЎвЂР В Р’В·Р В Р вЂ Р В Р’ВµР РЋР С“Р РЋРІР‚С™Р В Р вЂ¦Р В РЎвЂўР В РЎвЂ“Р В РЎвЂў Р В РЎвЂ”Р РЋР вЂљР В РЎвЂўР В РЎвЂР РЋР С“Р РЋРІР‚В¦Р В РЎвЂўР В Р’В¶Р В РўвЂР В Р’ВµР В Р вЂ¦Р В РЎвЂР РЋР РЏ

Р В РЎв„ўР РЋРІР‚С™Р В РЎвЂў Р В РЎвЂ”Р В РЎвЂўР РЋР С“Р РЋРІР‚С™Р РЋР вЂљР В РЎвЂўР В РЎвЂР В Р’В» Р В РЎвЂќР В РЎвЂўР В РЎВР В РЎвЂ”Р В Р’В»Р В Р’ВµР В РЎвЂќР РЋР С“ Р В РІР‚СљР РЋРІР‚ВР В Р’В±Р В Р’ВµР В РЎвЂќР В Р’В»Р В РЎвЂ-Р В РЎС›Р В Р’ВµР В РЎвЂ”Р В Р’Вµ?

Р В РІР‚СњР РЋР вЂљР В Р’ВµР В Р вЂ Р В Р вЂ¦Р В Р’ВµР В РІвЂћвЂ“Р РЋРІвЂљВ¬Р В Р’ВµР В РЎВР РЋРЎвЂњ Р В РЎвЂќР В РЎвЂўР В Р’В»Р В РЎвЂўР В РўвЂР В Р’ВµР В Р’В·Р В Р вЂ¦Р В РЎвЂўР В РЎВР РЋРЎвЂњ Р РЋР С“Р РЋР вЂљР РЋРЎвЂњР В Р’В±Р РЋРЎвЂњ Р В Р’В±Р В РЎвЂўР В Р’В»Р В Р’ВµР В Р’Вµ Р РЋР С“Р В Р’ВµР В РЎВР В РЎвЂ Р РЋРІР‚С™Р РЋРІР‚в„–Р РЋР С“Р РЋР РЏР РЋРІР‚РЋ Р В Р’В»Р В Р’ВµР РЋРІР‚С™

Р В РІР‚в„ўР В Р’В°Р В Р’В» Р В РЎвЂ™Р В РўвЂР РЋР вЂљР В РЎвЂР В Р’В°Р В Р вЂ¦Р В Р’В° Р В Р вЂ Р В РІР‚в„ўР В Р’ВµР В Р’В»Р В РЎвЂР В РЎвЂќР В РЎвЂўР В Р’В±Р РЋР вЂљР В РЎвЂР РЋРІР‚С™Р В Р’В°Р В Р вЂ¦Р В РЎвЂР В РЎвЂ Р В РЎвЂР В Р’В»Р В РЎвЂ Р В Р’В Р В РЎвЂР В РЎВР РЋР С“Р В РЎвЂќР В Р’В°Р РЋР РЏ Р РЋР С“Р РЋРІР‚С™Р В Р’ВµР В Р вЂ¦Р В Р’В°

Р В РІР‚С”Р В РЎвЂР В РўвЂР В Р’В°Р РЋР вЂљР РЋРІР‚в„– Р В РЎвЂ”Р В РЎвЂўР В РЎВР В РЎвЂўР В РЎвЂ“Р В Р’В»Р В РЎвЂ Р В Р вЂ¦Р В Р’В°Р В РІвЂћвЂ“Р РЋРІР‚С™Р В РЎвЂ Р В Р вЂ Р В РўвЂР В Р’В¶Р РЋРЎвЂњР В Р вЂ¦Р В РЎвЂ“Р В Р’В»Р РЋР РЏР РЋРІР‚В¦ Р В РЎв„ўР В Р’В°Р В РЎВР В Р’В±Р В РЎвЂўР В РўвЂР В Р’В¶Р В РЎвЂ Р В РўвЂР РЋР вЂљР В Р’ВµР В Р вЂ Р В Р вЂ¦Р В РЎвЂР В Р’Вµ Р РЋРІР‚В¦Р РЋР вЂљР В Р’В°Р В РЎВР РЋРІР‚в„–

15 Р В РЎВР В РЎвЂР РЋРІР‚С›Р В РЎвЂўР В Р вЂ Р В РЎвЂў Р В Р Р‹Р РЋР вЂљР В Р’ВµР В РўвЂР В Р вЂ¦Р В Р’ВµР В Р вЂ Р В Р’ВµР В РЎвЂќР В РЎвЂўР В Р вЂ Р РЋР Р‰Р В Р’Вµ, Р В РЎвЂќР В РЎвЂўР РЋРІР‚С™Р В РЎвЂўР РЋР вЂљР РЋРІР‚в„–Р В Р’Вµ Р В Р вЂ Р РЋР С“Р В Р’Вµ Р В РЎвЂ”Р РЋР вЂљР В РЎвЂР В Р вЂ Р РЋРІР‚в„–Р В РЎвЂќР В Р’В»Р В РЎвЂ Р РЋР С“Р РЋРІР‚РЋР В РЎвЂР РЋРІР‚С™Р В Р’В°Р РЋРІР‚С™Р РЋР Р‰ Р В РЎвЂ”Р РЋР вЂљР В Р’В°Р В Р вЂ Р В РўвЂР В РЎвЂўР В РІвЂћвЂ“

Создана программа, выявляющая нечестные рецензии

Методика, опробованная на обзорах чикагских отелей, основана на анализе структуры и стиля текстов. Лживые рецензии в целом напоминают беллетристику.

Группа исследователей из Корнеллского университета (США) под руководством профессора компьютерных наук Клэр Карди и специалиста по теории коммуникации Джеффа Хэнкока представила программу-прототип, способную с высокой долей вероятности отсеивать очень часто встречающиеся в Сети ложные рецензии, обзоры и отзывы на продукты и услуги (то, что называется «opinion spam»).

По просьбе учёных 20 студентов университета написали намеренно лживые позитивные отзывы о 20 чикагских отелях. Затем продукты любительского PR были смешаны с верифицированными правдивыми рецензиями и отданы на просмотр ещё трём добровольцам. Последние в определении «джинсы» показали результат, не отличающийся от случайного; более того, мнения о том, какие именно отзывы не были правдивыми, не совпадали.

Люди подвержены ошибкам: многие будут верить, что читают правду, пока не убедятся в обратном («презумпция правдивости»). Завзятые скептики займут противоположную позицию; и те и другие по проницательности уступают машине. Программа способна провести анализ множества текстов и показать, что в правдивых рецензиях чаще встречаются слова, имеющие отношение к предмету. В случае с отелями это «ванная», «заселение» или «цена». Необъективные рецензии «беллетристичнее»; они изобилуют «общеконтекстуальными» словами и словосочетаниями вроде «бизнес-трип», «каникулы» или «ваш муж». Честные и нечестные рецензенты по-разному используют ключевые слова, относящиеся к человеческому поведению и личной жизни, употребляют разное количество пунктуационных знаков и длинных слов. А ещё выяснилось, что правдивые обозреватели используют больше существительных, а лжецы излишне налегают на глаголы.

Исследователи создали несколько аналитических программ; лучшие результаты (89,8% обнаруженного вранья) показала та, которая в первую очередь вычленяла в текстах ключевые слова, а также фиксировала, как некоторые слова соединялись в словосочетания.

Учёные оговариваются, что программа-прототип применима только для отелей (и, возможно, лишь для чикагских). Направления дальнейшей работы — анализ ресторанной критики и клиентских отзывов, а также создание методик отсеивания ложных негативных обзоров. После этого можно будет заниматься обзорами потребительских товаров.

Как говорят исследователи, программное обеспечение, выделяющее не соответствующие действительности отзывы, полезно и при эффективности ниже 90%: оно может выполнять роль «первого фильтра» на соответствующих сайтах-агрегаторах. Если у продукта/услуги значительно больше подозрительных откликов, чем у других, их можно пометить для дальнейшей тщательной проверки.

Николай Третьяков

Источники: