Отзыв на выпускную квалификационную работу бакалавра Чурикова Никиты Сергеевича "Предсказание атрибутов документов в системе документооборота" Тема данной выпускной работы была поставлена компанией Digital Design и связана с реальным заказом, выполняемым данной компанией в интересах правительства Мурманской области. Суть поставленной задачи состоит в применении методов машинного обучения для построения рекомендаций сотрудников, которым следует поручить выполнение того или иного задания, и для построения оценки времени выполнения задания. Хотя для решения указанных задач использовались известные методы машинного обучения и их имплементации, представленные в известных библиотеках машинного обучения, основные проблемы, решаемые в данной работе, сосредоточены вокруг анализа данных и их подготовки, преобразования, необходимых для успешного применения выбранных методов. Из текста работы видно, сколько времени и сил было посвящено этой проблематике - об этом свидетельствуют многочисленные таблицы и графики. Важные задачи, рассматриваемые в этой связи, это задача понижения размерности и задача балансировки тренировочных данных. Задача понижения размерности возникает в связи с тем, что большая часть атрибутов объектов, на которых происходит обучение классификаторов, являются категориальными с большим числом возможных значений. Стандартные способы перехода к представлению таких объектов в виде векторов вещественного пространства приводят к пространству очень большой размерности, что способствует низкой точности решения задачи классификации или регрессии. Используемые в работе методы понижения размерности позволили повысить эту точность. Задача балансировки связана с тем, что имеющиеся данные естественным образом разбиваются на классы различных размеров. При построении тренировочного множества это необходимо учитывать, добиваясь сбалансированного представления объектов разных классов. Никита Чуриков справился с поставленными перед ним задачами. Работая в тесном контакте с сотрудниками компании Digital Design, он сумел разобраться в сложной структуре имеющихся данных, провести их разведочный анализ, выбрать наиболее подходящие методы машинного обучения. Все архитектурные решения при разработке прототипа системы сопровождались масштабными экспериментами, и на каждом шаге принимались обоснованные решения. Насколько мне известно, и компания Digital Design, и заказчик - правительство Мурманской области, довольны полученными результатами. Полагаю, что выпускная квалификационная работа бакалавра Чурикова Никиты Сергеевича заслуживает оценку "отлично". Научный руководитель, к.ф.-м.н., доцент Добрынин В. Ю.