Рецензия на выпускную квалификационную работу ФилинаИльиВладимировича «Построение характеристического вектора клик веб-графа и его применение для анализа структуры сайтов» Работа ФилинаИ.В. относится к достаточно новому и интенсивно развивающемуся направлению компьютерных наук – вебометрическим исследованиям. Актуальность задач вебометрических исследований связана с развитием, укрупнением и усложнением сети Интернет. Помимо разрастания самой структуры сети Интернет, разрастается и усложняется структуры её составляющих – веб-сайтов. Именно структура веб-сайтов академического подмножества сайтов и их характеристики были выбрана в качестве темы для исследований. Работа состоит из введения, пяти глав и списка литературы. Во введении автор рассматривает одну из моделей веб-пространства, которая была разработана в 1999м году и определяет понятие веб-графа. В первой главе автор вводит понятие характеристического вектора клик веб-графа, рассматривает понятие клика графа и делает небольшой экскурс в историю этого термина. Вторая глава посвящена краулеру, который был разработан автором. Описаны алгоритм работы краулера и алгоритм нормализации полученных ссылок. В третьей главе подробно разобрана программа поиска клик, приведены фрагменты кода на псевдоязыке и разобраны алгоритмы её работы. В четвертой главе автор приводит результаты сканирования и анализирует зависимость времени сканирования от количества страниц. Затем строятся вектора клик графов. Пятая глава посвящена кластеризации, описан выбранный алгоритм для кластеризации k-means. Описаны результаты экспериментов по кластеризации характеристических векторов клик веб-графов. Приведен анализ результатов. В целом работа оставляет двойственное впечатление. С одной стороны, автор проделал довольно большую работу-самостоятельно разработал 2 программных комплекса, провел полный цикл исследований, проанализировал полученные результаты. Но смущает некоторая незаконченность практически всех направлений, подача материала довольно сумбурная, оформление страдает, программный код неряшлив, формулы в тексте . Но несмотря на замечания работа достойная. Автор не боится выдвигать гипотезы, опровергать их и получать довольно интересные результаты при этом. Так хотелось бы отметить довольно интересный пусть и очевидный результат сканирования – иногда скорость краулинга зависит не только от количества страниц на сайте, но и от скорости ответа сервера, причем скорость ответа может быть решающей и менять время сканирования на порядки. Учитывая вышесказанное, работа Филина И.В. заслуживает оценки «хорошо». Рецензент, Старший программист ООО "Искусство Управления Данными" Чернобровкин Д.И.