Санкт-Петербургский Государственный Университет Математико-механический факультет Кафедра системного программирования Отзыв научного руководителя на выпускную квалификационную работу студента 444 группы Алиева Мирзы Современная автоматизированная дактилоскопия является одной из наиболее развитых областей биометрической науки. Об успешности используемых алгоритмов может говорить реализация в Индии общегосударственной системы идентификации человека вместо использования традиционных паспортов. Ввиду гигантского объёма исходных данных в этом и подобном ему проекте на первый план выходит задача кластеризации базы отпечатков и точного определения принадлежности тестируемого отпечатка к кластеру. Работа Мирзы состоит из двух частей: выбора алгоритма кластеризации отпечатков и использования нейронной сети глубокого обучения для построения классификатора отпечатков по полученным кластерам. В качестве исходных данных используется база отпечатков FVC 2002, по изображениям которой строится поле ориентаций папиллярных линий и результат его преобразования с помощью метода главных компонент. Данный выбор адекватен поставленной задаче и используется в исследованиях на сходную тему. На первом этапе Мирза рассматривает существующие алгоритмы кластеризации и делает обоснованный выбор двух алгоритмов кластеризации – K-Means и иерархического. Важной и актуальной для данной предметной областью деталью каждого из них является варьируемость числа кластеров, на которые тот или иной алгоритм делит исходное множество отпечатков. Распределение отпечатков по кластерам оказывается в обоих случаях достаточно равномерным, причём этот показатель несколько лучше в случае иерархического алгоритма. Далее Мирза предлагает архитектуру сети глубокого обучения, методику обучения и проводит эксперименты по нахождению оптимального числа и типа слоёв для каждого из видов исходных данных и алгоритмов кластеризации. Демонстрируется высокая скорость обучения нейронной сети без переобучения, после чего проводятся эксперименты по оценке качества кластеризации. Для этого используются общепринятые в научной литературе метрики. Согласно полученным результатам предлагаемый алгоритм кластеризации отпечатков не является на сегодняшний момент самым лучшим, о чём Мирза открыто пишет в своей работе. Вместе с тем продемонстрированная алгоритмом высокая скорость обучения позволяет использовать его в качестве основы для дальнейших исследований. К недостаткам работы можно отнести недостаточное количество проведённых экспериментов, что объясняется небольшим доступным набором тестовых данных с одной стороны. Тем не менее методологически данные эксперименты проведены верно. Работа не содержит неправомерных заимствований. Среди личных качеств Мирзы как исследователя хочется отметить самостоятельность при принятии решений, ответственность, методичность и высокую работоспособность. Выполненная работа заслуживает оценки «отлично», а Мирзе рекомендуется продолжить обучение в магистратуре. Научный руководитель: старший преподаватель кафедры системного программирования СПбГУ Сартасов С.Ю.