Отзыв на выпускную квалификационную работу Мороза Егора Романовича «Распознавание изображений математических выражений» . Работа Мороза Е.Р. посвящена решению задачи распознавания изображений математических выражений и преобразования их в код на языке разметки LaTex. Решение этой позволяет существенно упростить процедуру подготовки научных статей математической направленности. Предлагаемое решение основано на обработке таких изображений с использованием методов машинного обучения. В работе проводится анализ существующих решений и отмечается, что принципы ее решения схожи с принципами машинного перевода. Такие системы переводят входную последовательность так называемых токенов на одном языке в последовательность токенов другого языка. Среди анализируемых систем наиболее хорошие результаты показывают нейронные сети основанные на архитектуре Transformer. Именно эта архитектура и была выбрана для решения поставленной задачи. В работе рассматриваются также различные вариации этой архитектуры и предлагается использовать в кодировщике гибридную архитектуру Vision Transformer для извлечения признаков и кодирования изображения. Сама процедура получения разметки, соответствующей изображению, осуществляется с помощью известного декодера, построенного по архитектуре с механизмами внимания. Для обучения предлагаемой сети автор использует известный датасет pix2latex, представляющий собой набор пар - изображение и соответствующую изображению разметку на LaTeX. При обучении, качестве функции потерь, используется перекрестная энтропия. Качество перевода изображения в разметку оценивалось с помощью метрики BLEU, которая обычно используется для оценки перевода с одного языка на другой. Исследуемая модель сети реализована на языке Python c помощью соответствующих библиотек для машинного обучения. Экспериментальная проверка проводилась на датасете im2latex-100k, предназначенном для оценки качества работы различных методов преобразования изображения в разметку LaTex. Результаты тестирования показали, предлагаемая автором модель имеет несколько лучшие показатели качества по сравнению с известными моделями. В ходе работы Мороз Е.Р. показал глубокие знания в области обработки изображений и систем машинного перевода с помощью нейронных сетей, хорошую теоретическую подготовку, а также умение применять на практике современные вычислительные технологии. Считаю, что выпускная квалификационная работа Мороза Е.Р. заслуживает оценки «Отлично». Руководитель, Доцент кафедры КММС, к.т.н. В.М. Гришкин