ОТЗЫВ на выпускную квалификационную работу Васильева Павла Сергеевича «Распознавание типов изображений документов» Работа Васильева П.С. задаче распознавания типов изображений документов. Эта задача особенно актуальна при переводе архивов бумажных документов в электронную форму путем их сканирования. Для создания полноценного электронного архива все единицы его хранения должны быть типизированы. При этом типизация изображений документов осуществляется с применением распознающих систем. Важным этапом создания системы классификатора является извлечение тренировочной и тестовой выборок из всего массива изображений, и их разметка по типам. Этот процесс достаточно трудоемкий и осуществляется «вручную». Целью работы являлась предварительная кластеризация изображений документов с целью выявления их типов. Основная идея этой процедуры найти наиболее близкие по некоторой метрике изображения и сформировать предварительно размеченные наборы длля обучения и проверки классификатора. Для достижения поставленной цели автором предлагается описывать изображение документа вектором признаков, а затем кластеризовать изображения в пространстве признаков. В качестве вектора признаков предлагается использовать морфологический спектр, а кластеризацию осуществить с помощью применения локально чувствительного (LSH) хеширования. Автор предложил модификацию метода кластеризации k-means. Суть модификации заключается в том, что на каждой итерации метода вместо перебора всех точек, подсчёта для них расстояния и выбора ближайших используется одна макрооперация поиска по хешу. При этом время, затрачиваемое на кластеризацию, существенно уменьшается. В работе приведены экспериментальные результаты обработки различных типов изображений документов, показавшие адекватность подобного подхода. К сожалению, в работе не приведена структура и описание реализации соответствующего программного обеспечения разработанного автором, хотя такое программное обеспечение на C++ было продемонстрировано в ходе работы над данным проектом. Следует отметить, что работа была выполнена достаточно самостоятельно. В ходе работы автор показал умение разбираться в методах обработки изображений, методах хеширования и кластеризации. Считаю, что квалификационная работа Васильева П.С. заслуживает оценки “Отлично”, а ее автор может быть рекомендован для поступления в магистратуру. Научный руководитель доцент кафедры КММС факультета ПМ-ПУ к.т.н. В.М. Гришкин