Работа Ашихминой А. С. посвящена алгоритмам анализа семантической согласованности текста деловых документов для решения задачи поиска различных аномалий в содержимом. С целью тестирования алгоритмов автором была сформирована тестовая коллекция, где в некоторые документы были добавлены «мусорные» параграфы. Задача свелась к построению бинарного классификатора, который должен предсказывать является ли блок текста согласованным по смыслу с окружающим текстом. Всего рассмотрено 4 подхода: стандартная тематическая модель по параграфам (LDA), использование векторного представления слов, построение собственной тематической модели и явная аннотация параграфов по тематической модели. В первых трех случаях окружающим параграфам (контексту) и параграфу со спорным содержимым сопоставлялся вектор, который использовался для обучения стандартных алгоритмов машинного обучения. В четвертом случае считалась вероятность перехода от одной темы к другой. Для предложенных алгоритмов посчитаны метрики качества — точность и полнота. Работа Ашихминой А. С. посвящена актуальной теме, неплохо оформлена, в ней присутствуют оригинальные решения, поставленные цели выполнены. Среди недостатков можно выделить следующие: • хотелось бы более полный обзор существующих решений; • недостаточно мотивирован выбор алгоритмов машинного обучения на втором этапе; • результаты представлены только по синтетической коллекции. Тем не менее перечисленные недостатки не снижают ценности работы. Считаю, что работа заслуживает оценки «отлично». Рекомендую Ашихмину А. С. к поступлению в магистратуру.