Работа Ильи Шенбина "Обучение распределенных представлений слов на основе символов" относится к важной области современной обработки естественного языка: обучению распределённых представлений слов на основе букв, из которых они состоят. Успешная реализация таких представлений позволила бы обобщать представления слов на слова с опечатками, окказионализмы, просто редкие слова, которые не встречались в обучающей выборке и т.д., а также, что особенно важно для русского языка, учитывать морфологию. Основной темой работы стала задача предсказания вектора представления слова из word2vec на основе последовательности его букв -- это базовая задача представлений на основе символов, и выбор её представляется очень разумным. С одной стороны, это хорошо определённая задача, для которой легко получить обучающую выборку, с другой, -- очень трудная для удовлетворительного решения. Для решения этой задачи в работе был разработан ряд моделей, сочетающих основные конструкции рекуррентных сетей с картами внимания -- современным развитием идеи . Разработанная автором архитектура модели является новой и впервые применялась для решения задачи предсказания векторных представлений слов. Практические результаты работы убедительно показывают преимущества разработанной автором модели над ранее известными. Интересно, что карты внимания в результате действительно обучаются результатам, показывающим морфологию слов. Более того, в работе полученная модель применяется и к английскому языку, к задаче распознавания именованных сущностей в классическом датасете CHEMDNER -- и там тоже получены улучшения по сравнению с ранее известными моделями. Практические результаты работы также содержат подробный анализ гиперпараметров модели, что всегда важно в обучении глубоких сетей. Изложение работы также соответствует самым высоким стандартам. Обзорная часть достаточно подробна и содержит ссылки на самые последние результаты. Иллюстрации разработаны самим Ильёй и удачно отражают архитектуру разных использованных в работе моделей. Работа написана хорошим языком и содержит очень мало опечаток (что, к сожалению, сегодня большая редкость). Я имел возможность сотрудничать с Ильёй Шенбиным в период его работы над магистерской диссертацией и могу подтвердить, что Илья блестяще владеет материалом, как с теоретической, так и с практической стороны, работа выполнена абсолютно самостоятельно, и все идеи, в ней реализованные, принадлежат тоже лично Илье. На основании вышеизложенного считаю, что И.И. Шенбин безусловно заслуживает присуждения звания магистра, а его работа "Обучение распределенных представлений слов на основе символов" столь же безусловно заслуживает оценки "отлично".