ОТЗЫВ РЕЦЕНЗЕНТА на выпускную квалификационную работу бакалавра “ Извлечение мнений и объектов мнений из сообщений социальных систем” студента IV курса факультета прикладной математики и процессов управления Кокачева Виктора Алексеевича В выпускной квалификационной работе бакалавра перед Кокачевым В.А. заявлена реализация системы, выполняющей сентимент-анализ. В рамках работы системы сначала устанавливается тематическая категория (ремонт или продажи), к которой относится пост, затем определяется его тональность. Тема актуальная, в текущее время задача сентимент-анализа находит широкое применение при мониторинге данных сети Интернет. Работа включает в себя обзор предметной области, описание подходов в области, процесс разработки своих словарей и схем категорий, тестирование и анализ полученных результатов. Среди плюсов работы выделим ее актуальность и приведенные несколько графиков оценки качества использования предложенного словаря. Из недостатком перечисли следующие. 1. Автор не корректно использует и определяет ряд понятий понятия. В частности автор пишет "2) Нормализация – процесс приведения лексем к канонической форме. Используется для того, чтобы устранить небольшие различия между лексемами, которые считаются эквивалентными. В качестве примеров нормализации можно привести удаление дополнительных символов (например, дефисов) или приведение всех лексем к единому регистру (например, «КВН» → «квн»)." После этого отдельно вводится понятие лемматизации как отдельного этапа, хотя лемматизация и есть нормализация. 2. Автор вводит отдельные утверждения, требующие обоснования, при этом какие-либо пояснения и ссылки отсутствуют. Например, "При использовании словарного подхода к сентимент-анализу большую роль имеют заранее построенные вспомогательные массивы данных. К первому типу таких массивов относятся категории начальных объектов" 3. В работе не приводятся и не перечисляются объектные категории, использованные автором. Даже не приводится их число ! Автор ограничивается перечисление двух категорий в приложении. Почему? 4. Автор пишет о просмотре выборок документов для составления объектных категорий и тонального словаря, но ни слова н сказано об объеме рассмотренных выборок. 5. Автор приводит пример тематических категорий и выносит его в приложение. Категорий всего две и каждая из них включает в себя порядка 20 слов, причем среди этих слов много повторов одного слова в разных формах. Не ясно, является ли этот список ключевых слов для категорий полным? Если нет, то не ясно, почему в приложении автор не мог привести их полностью. 6. Описание технологии word2vec сводится к одному абзацу. 7. В работе встречаются и другие недостатки, аналогичные выше перечисленным. Пояснительная записка достаточно тяжело читается в силу недостаточного объема приведённых данных (о полученных словарях, коллекциях и т.д.). Считаю, что выпускная работа, при хорошей защите, может заслуживать оценку «хорошо». Рецензент к.т.н., ассистент МОЭВМ, ЛЭТИ Ходырев И.А.