Рецензия на ВКР Коротковой Елизаветы Алексеевны на тему «АВТОМАТИЧЕСКОЕ ВЫДЕЛЕНИЕ НОВОСТНЫХ СООБЩЕНИЙ В СОЦИАЛЬНЫХ СЕТЯХ С ПОМОЩЬЮ ПРОГРАММЫ WEKA» Выпускная квалификационная работа Елизаветы Алексеевны Коротковой посвящена интересной теме: автоматической обработке текстов социальных сетей (в форме твитов). Правда, не очень понятно, насколько актуально/необходимо выделять новостные сообщения из таких текстов, при наличии изобилия новостных порталов (твиты которых собственно были источником новостных сообщений) и общей статистики, полученной в результате исследования, что это скорее периферийный тип сообщений в подобном формате. Очевидно, понимая это, Елизавета Алексеевна несколько иначе сформулировала цель исследования в своей работе: «сравнительный анализ различных моделей формального признакового описания русскоязычных текстов для выделения новостных сообщений в социальных сетях из общего массива сообщений» (с. 4). Хотя не очень понятно, но гораздо более значимо. В рамках этого неясного целеполагания Елизавета Алексеевна очень квалифицированно выполняет поставленные в работе задачи: рассматривает принципы машинного обучения и выявляет набор текстовых признаков. которые могут быть использованы для дихотомического разграничения новостных и личных твитов. Они обозначаются как структурные (наличие хэштегов и ссылок на авторов/сайты), морфологические (наличие глаголов и имен собственных) и векторные (векторная модель вхождения слов/термов в тексты). Елизавета Алексеевна проводит эксперименты по разграничению типов текстов с использованием программы WEKA для каждого из признаков по отдельности и в комбинации. Результаты каждого из экспериментов оцениваются показателями точности, полноты и F меры. Использование всех признаков, естественно, дает наилучшие результаты. В процессе работы с программой WEKA Елизавета Алексеевна преодолевает ряд трудностей, поскольку в ней не предусмотрена работа с кириллицей, что может быть использовано в дальнейшем при обращении к данной программе. Построение текста, представление материала, иллюстративный материал в виде диаграмм и таблиц показывают высокий уровень квалификации Е.А.Коротковой. Единственное, чего не хватает в работе, представления того, каким образом выделяются используемые признаки, насколько они масштабируемы, т.е. будут аналогично действенны при увеличении количества рассматриваемых текстов и при изменении характера противопоставления текстов. Не затрагивается вопрос об особенностях написания слов в твитах (наличие орфографических ошибок и специального искажения облика слов). Указанные замечания носят, безусловно, дискуссионный характер и нисколько не снижают ценности выполненной работы, которая соответствует всем требованиям, предъявляемым к работам такого типа, и заслуживает высокой оценки. По результатам ВКР Елизавете Алексеевне Коротковой следует присудить звание бакалавр по направлению «Лингвистика», программе «Прикладная, экспериментальная и математическая лингвистика». Доцент каф. математической лингвистики, к.ф.н И.В.Азарова