Stylometry analysis of Russian texts using pre-trained language models

Abstract

Частным случаем задач анализа естественного языка (NLP) является атрибуция авторства, т.е. исследоание с целью установления автора текста или получения каких-либо сведений об авторе. Развитие данного направления, вкупе со стилометрическими приёмами, оказывает огромное влияние на различные области. Данная работа представляет из себя реализацию методов атрибуции авторства на корпусе художественных текстов русских авторов.
A special case of natural language processing (NLP) problems is attribution of authorship, i.e. research in order to identify the author of the text or to obtain any information about the author. The development of this direction, coupled with stylometric techniques, has a huge impact on various areas. This work is the implementation of methods of attribution of authorship on the corpus of literary texts by Russian authors.

Description

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By