ОТЗЫВ на выпускную квалификационную работу Башарина Егора Валерьевича «Контекстная обработка данных социальных сетей» В квалификационной работе Егора Башарина исследуется проблема контекстной обработки данных социальных сетей. Проблема интересна и актуальна ввиду масштабного распространения влияния таких сетей. В качестве исходных данных в работе используются публикации из сообществ социальной сети VKontakte. Для контекстной обработки данных применялся подход основанный на тематическом моделировании. В рамках работы выполнено следующее. Проведен анализ социальных сетей, среди которых выбрана социальная сеть VKontakte. Описан порядок загрузки данных из социальной сети с использованием API VKontakte. Поставлена задача предварительной обработки текстовых данных, для решения которой реализован программный модуль. В ходе решения последней задачи были проведены эксперименты с несколькими морфологическими анализаторами, из которых выбран наиболее подходящий. Проведен сравнительный анализ двух вероятностных тематических моделей pLSA и LDA. Для исследований аргументированно выбрана модель LDA. Реализован программный модуль, задачей которого было построение тематической модели с использованием сэмплирования Гиббса. В ходе экспериментов было показано влияние параметров обучения модели на ее качество. Для измерения качества модели применялись перплексия и когерентность. Для оценки обобщающей способности построенной тематической модели использовано несколько вариантов разбиения коллекции на обучающую и тестовую выборки. Среди построенных моделей с разными параметрами была выбрана модель с наилучшими показателями. Для результатов данной модели был проведён экспертный анализ, в результате которого сделан вывод, что построенная модель хорошо себя показала при определении тематик. Полученная тематическая модель представлена в работе. Работа хорошо представлена и оформлена. Структура выпускной квалификационной работы чёткая и ясная, текст понятный и хорошо структурированный. Работа оформлена аккуратно с соблюдением необходимых норм. Поставленные в работе задачи выполнены. В рамках работы реализовано несколько собственных программных модулей, приводится полное описание экспериментов с ними. По итогам проверки текста работы на плагиат, выявленный уровень заимствований составляет 8%, в которые входят отдельные распространенные в области фразы и названия. На основании последнего Егор допускается к защите. Из недостатков работы можно отметить следующие: 1) в ходе экспериментов не были рассмотрены некоторые оценки качества модели, описанные в работе: характеристики ядер тем; 2) не были рассмотрены возможности автоматизации настройки параметров алгоритма. Несмотря на указанные недостатки, в своей работе Егор иллюстрирует как хорошее понимание темы исследования, так и должный уровень умения проводить самостоятельные исследования. Считаю, что выпускная квалификационная работа заслуживает оценки «отлично», а сам Егор присвоения степени бакалавра по направлению «Прикладная математика и информатика». Настоящим рекомендую Егора Башарина в магистратуру.