Рецензия на выпускную квалификационную работу бакалавра студента 441 группы Гарипова Эмиля Ильдаровича Задача определения эмоциональной окраски текстов в настоящее время актуальна для провайдеров контента в сети Интернет. Её решение позволяет показать конкретному пользователю наиболее подходящий для него контент. Распространённый вариант постановки такой задачи – определить, является ли текст положительно или отрицательно окрашенным. Данная задача усложняется в связи с краткостью большинства пользовательских текстовых сообщений. Ярким примером является социальная сеть Twitter, в которой сообщение ограничено сверху 140 символами. В своей работе Эмиль Ильдарович сравнивает два широко используемых и хорошо себя зарекомендовавших в других областях способа решения задачи классификации – метод опорных векторов и наивный байесовский классификатор. В качестве обучающего и тестового наборов данных используется публично доступный корпус текстов социальной сети Twitter. Этот набор данных заранее размечен по эмоциональной окраске. Множество твитов из набора данных на начальном этапе преобразуется в вектора высокой размерности, причём Эмиль Ильдарович предлагает несколько вариантов таких преобразований. Для проведения вычислительных экспериментов и анализа их результатов Эмиль Ильдарович выбирает метрики, адекватные поставленной задаче и позволяющие сравнить результаты работы классификаторов между собой и с результатами, полученными ранее и описанными в научной литературе. Сами вычислительные эксперименты также корректно организованы. Использованный инструментарий – язык программирования Python и пакет sklearn - соответствуют поставленной задаче. К сожалению, данная работа не лишена недостатков. Прежде всего, в ней нет упоминания о классификации с помощью нейросетей глубокого обучения, которые в ряде задач показывают стабильно более высокие результаты классификации, чем метод опорных векторов. На этапе препроцессинга не используется стемминг, хотя для данной задачи и особенно для русского языка его использование представляется логичным решением. В тексте работы также допущено несколько орфографических ошибок. Считаю, что выполненная работа заслуживает оценки «хорошо». Рецензент: старший преподаватель кафедры системного программирования СПбГУ Сартасов С.Ю.