РЕЦЕНЗИЯ на выпускную квалификационную работу студента IV курса бакалавриата факультета Прикладной математики – процессов управления ФГБОУ ВПО «Санкт-Петербургский государственный университет» Стригулина Кирилла Анатольевича «Анализ тональности высказываний в Twitter» Выпускная квалификационная работа Стригулина Кирилла Анатольевича посвящена проблеме определения тональности русскоязычных высказываний пользователей в социальной сети Twitter. Тематика работы является актуальной. Рецензируемая работа состоит из введения, постановки задачи, трех глав и заключения. Во введении говорится о цели работы – анализ тональности отзывов в социальной сети Twitter для определения репутации компаний, при этом отсутствует обзор литературы по данной предметной области. Далее идет постановка задачи, которая, согласно написанному, состоит в построении классификатора, минимизирующего математическое ожидание штрафа по распределению π. Однако, приведенная формула в работе больше не используется, о каких-либо штрафах и распределениях речь не идет. В итоге поставленная задача не решена. Первая глава посвящена обзору задач и методов машинного обучения, видам предварительной обработки данных, способам анализа тональности текстов. При этом обзор проведен поверхностно, без ссылок на источники, содержит ошибки. Например, на стр. 16 сказано: «Признаки, которые попадают в промежуток между плоскостями являются опорными», что является неверным. А также на стр. 17 добавлено « ... сложность затрудняет четкое понимание, как именно он (алгоритм) работает ... ». Вторая глава называется «Исследования» и состоит всего из 2 страниц! Однако, как таковые исследования отсутствуют, приведены данные с сайта конференции www.dialog-21.ru. Далее предлагается использовать некоторую F-меру без достаточного основания и объяснения, не говоря уже о строгом математическом доказательстве. Третья глава названа автором «Программная реализация», однако не приводится ни алгоритма, ни кода программы, т.е. программная реализация отсутствует. Глава очень мала по объему – 3 страницы, содержит только общие описания выполненных действий без детального объяснения. Остается неясным следующее: каким образом была осуществлена выгрузка твитов из базы данных и их предварительная обработка, каким образом было выполнено представление высказываний в виде n-грамм, с какой целью было осуществлено уменьшение размерности матрицы и почему для оценки выбрана именно F1-мера и т.д. Абсолютно непонятно, что было в действительности сделано автором. Более того, в заключении говорится о сравнении «результатов теоретических исследований и экспериментальных результатов», что на самом деле отсутствует. Также в тексте допущены орфографические, стилистические и пунктуационные ошибки, список литературы не оформлен должным образом. Объем работы крайне мал. На самом деле задача, заявленная в параграфе «Постановка задачи» не решена. На основании вышесказанного, считаю, что выпускная квалификационная работа бакалавра Стригулина Кирилла Анатольевича «Анализ тональности высказываний в Twitter» заслуживает оценки «неудовлетворительно». Рецензент: к.ф.-м.н., доцент кафедры теории управления Захаров А.О. РЕЦЕНЗИЯ на выпускную квалификационную работу студента IV курса бакалавриата факультета Прикладной математики – процессов управления ФГБОУ ВО «Санкт-Петербургский государственный университет» Стригулина Кирилла Анатольевича Анализ тональности высказываний в Twitter Предъявленный мне для рецензирования текст выпускной работы Кирилла Анатольевича размещен на 32-х страницах: по одной на титул, введение, обзор литературы, выводы, заключение и список литературы; первая глава занимает 13 страниц, 2-я глава – 2-е страницы, третья – 6 страниц. Есть приложение, содержащее 3 страницы кодов программы. Текст иллюстрирован рисунками, таблицами и диаграммами. Пышно выглядит постановка задачи на стр.5, но «целью данной работы является проведение анализа тональности отзывов в социальной сети Twitter для определения репутации компаний» и для достижения этой цели автор решал, видимо, более скромные задачи без покушения на основательный математический аппарат. Обзор литературы посвящен первым пяти работам из 13-ти, приведенным в списке литературы. Эта пятерка источников появилась в печати с 2011 года по 2016 год, при этом далее по тексту есть ссылки на работу [3], остальные 4-е упоминаются только в обзоре. Впрочем, список литературы содержит источники, на которые автор не ссылается нигде ([10]–[13]). Возможно, эти работы послужили просто для вдохновения автора. В первой главе приведен обзор некоторых методов машинного обучения, способам предварительной обработки данных и анализа тональности высказываний. На стр.10 (4-я сверху) читаем «данные должны мыть очищены от загрязненных данных» (почти «быть или не быть»). Короткая 2-я глава описывает исследования, опубликованные на сайте конференции [8]. В 3-й главе Кирилл Анатольевич рассказывает о том, как он с помощью своей программы собирается сравнивать два метода машинного обучения: наивного байесовского классификатора и метода опорных векторов по мере F1 на основе 8643 обучающих и 19773 тестовых высказываний об операторах сотовой связи. Семь рисунков с одинаковыми названиями «результаты» (рис.8 – рис.14) должны убедить читателей, что метод опорных векторов с линейным ядром лучше такого же метода с полиномиальным ядром, а этот последний лучше наивного байесовского классификатора. В заключении на стр.28 не очень-то ясен смысл последнего предложения. Возможно, в своем выступлении на защите Кирилл Анатольевич больше расскажет о кодах, размещенных на стр.30—32. Считаю, что выпускная квалификационная работа бакалавра Стригулина Кирилла Анатольевича «Анализ тональности высказываний в Twitter» удовлетворяет требованиям, предъявляемым к выпускным квалификационным работам бакалавров, и заслуживает оценки от «удовлетворительно» до «хорошо». Рецензент: доцент, к.ф.-м.н. Н.С.Едаменко