В работе представлен обзор и тестирование нескольких методов предсказания скрытых ссылок в социальном графе. В работе были применены приёмы, общие для задачи классификации, а так же приёмы, специфичные для конкретного набора данных (построение признаков на основе “близости” связей). Для тестирования алгоритмов были использованы общедоступные данные, опубликованные для участников SNAHackathon 2016. Автор свёл задачу к бинарной классификации, где объектами классификации были пары пользователей (u, v), то есть нужно было предсказать наличие/отсутствие связи между u и v. Метрика — AUC-ROC. Признаки основывались на: - личных данных пользователей: разность возраста u и v, а так же совпадение/несовпадение пола, страны, города и локации, из которой пользователь заходил в сеть чаще всего; степени схожести множеств: количество общих друзей, коэффициент Жаккара, коэффициент Адамик-Адара; - значении Personalized PageRank; - основе видов связей между пользователями. Алгоритмы реализованы на языке Python, были использованы библиотеки для научных вычислений SciPy, NumPy. библиотеки scikit-learn и XGBoost. Лучший результат показали модели на основе XGBoost, а признаки, основанные на видах связи между пользователями, дали существенный прирост качества. Работа является завершенной квалификационной работой на актуальную тему. Сформулированные в работе цели исследования выполнены. В качестве недостатков, можно отметить следующее. Отсутствует обзор существующих алгоритмов в этой области и сравнение результатов с уже опубликованными методами, а в списке литературы присутствует только одна статья на данную тему. Таким образом нельзя сделать выводы о новизне полученных результатов. Тем не менее работа демонстрирует, что автор имеет определенные знания и навыки в области решения задач машинного обучения и анализа данных. Несмотря на озвученные недостатки считаю, что выпускная квалификационная работа Хажояна А. В. заслуживает оценки отлично. Рецензент: к.ф-м.н., аналитик-исследователь Amadeus Сокол Марина Михайловна