Ученые создали алгоритм, позволяющий установить авторство текстов

Ученые создали алгоритм, позволяющий установить авторство текстов
  Фото ТАСС и А. Шлыков
Математики из Санкт-Петербургского государственного университета и компьютерного факультета израильского колледжа ОРТ Брауде создали алгоритм, позволяющий исследовать литературные тексты и определять их авторство. Ученые опробовали свой метод на книгах нескольких всемирных авторов – Айзека Азимова, Джона Толкиена, Джона Голсуорси и других и сумели получить точное описание всех особенностей их стиля.

Алгоритм подтвердил известную информацию о том, что роман Толкиена «Сильмариллион» написан двумя людьми – после смерти писателя эту вещь дописывал его сын. А вот эпопею «Властелин колец» Джон Рональд Руэл создал полностью сам.

Создатели нового метода уверены, что он сможет помочь установить авторство книг в тех случаях, когда в этом есть сомнения.

Разработку ученых комментирует для ИА FederalCity писательница Татьяна  Алексеева-Минасян:


- Лично я отношусь к попыткам «измерить алгеброй гармонию» скептично. Безусловно, математика может очень многое, в том числе и в такой далекой от точных наук области, как литература или искусство. Существует, например, такое понятие, как частотный анализ текста, который проводят, когда исследуется зашифрованный текст или текст на неизвестном языке. Этот метод позволяет определить, является ли написанное осмысленным текстом или просто набором символов. Именно благодаря ему ученые, например, установили, что осмысленным текстом является известнейший зашифрованный средневековый документ под названием «Манускрипт Войнича».

Однако когда речь идет о гуманитарных областях, математика все-таки не всесильна. Различные виды анализа текста, направленные на то, чтобы определить его авторство, могут дать только приблизительный результат, показать, кому литературное произведение принадлежит с наибольшей вероятностью. Наибольшей, но не стопроцентной. Потому что один и тот же писатель может писать разные произведения очень по-разному, используя разные слова, выражения и знаки препинания. Это может зависеть от его возраста, от настроения в данный момент, от того, в каком жанре он пишет, и еще от множества факторов, которые невозможно предусмотреть.

Расскажу забавную историю. Когда я узнала о методе анализа текста, который показал, что «Тихий Дон» Михаила Шолохова якобы писали два человека, я поставила эксперимент на себе. Проанализировала этим методом два своих романа, написанные с разницей в несколько лет. Результат был однозначным: анализ показал, что эти две книги написаны разными людьми... Думаю, этим все сказано.