Отзыв на выпускную квалификационную работу бакалавра Илямаковой Натальи Юрьевны Исследование методов машинного обучения для автоматического реферирования документов Тема работы была сформулирована компанией Digital Design. Конечно, это не новая и активно исследуемая задача, но ее выбор крупной коммерческой компанией говорит об актуальности данной проблемы и о том, что она все еще далека от решения. Наталья проанализировала известные подходы к задаче построения рефератов и выбрала один из достаточно очевидных – реферат формируется из предложений наибольшего веса, вес предложения равен весу входящих в него слов. Для вычисления весов слов использован уже менее очевидный, но, тем не менее, известный подход – вес слова зависит от тематики документа и вычисляется как взаимная информация для пары случайных величин, определяемых вероятностями появления данного слова или тематики в случайно выбранном документе. Относительно новым, видимо, является использование одного из методов машинного обучения без учителя - метода кластеризации Information Bottleneck (IB) и использование кластеров вместо классов/тем при вычислении весов слов. На этом пути возникает ряд вопросов, требующих своего решения: выбор параметра бета при реализации метода IB, сравнения данного метода кластеризации с другими стандартными методами кластеризации применительно к задаче реферирования, модификация стандартного метода реферирования с учетом возможности оценить принадлежность реферируемого документа к нескольким различным кластерам (мягкая кластеризация, обеспечиваемая методом IB). В ходе выполнения выпускной работы все упомянутые (и многие другие) вопросы были успешно решены. Работа написана хорошо, приведены количественные оценки качества рефератов, построенных как предложенным методом, так и одним из известных методов, приведен большой список литературы. Полагаю, что выпускная работа Илямаковой Натальи Юрьевны может быть оценена оценкой «отлично». Научный руководитель к.ф.-м.н., доцент Добрынин В.Ю.