ОТЗЫВ НАУЧНОГО РУКОВОДИТЕЛЯ на выпускную квалификационную работу студента 4 курса кафедры системного программирования СПбГУ Шалымова Романа Сергеевича, обучающегося по направлению 010500 (02.03.03) (математическое обеспечение и администрирование информационных систем) Тема выпускной квалификационной работы: Разработка файловой системы с поддержкой дедупликации данных Перед студентом была поставлена задача реализовать файловую систему для ОС Linux с поддержкой дедупликации хранимых данных на уровне кластеров «на лету». Дедупликация должна происходить в процессе выполнения операций чтения и записи файла. Так как на диске не хранится двух кластеров данных с одинаковым содержимым, то файлы занимают на диске меньше места, чем в файловой системе без дедупликации. Это приводит к существенно более выгодному использованию дискового пространства. Наибольшую выгоду такая файловая система способна показать при хранении нескольких копий больших бинарных файлов: дисков виртуальных машин. В отличие от аналогов для поддержки дедупликации не нужна специальная операция по поиску копий кластеров, которая выполнялась бы периодически, а значит работу сервера виртуальных машин не придется останавливать. В ходе работы студент изучил работу файловых систем, в которых сделаны шаги в сторону дедупликации, например работу btrfs. Студентом были разработаны структуры данных для хранения файлов, совместимые с драйверной моделью ОС Linux. Также был разработан алгоритм дедупликации на основе подсчета контрольных сумм кластеров. Реализованная файловая система показала неплохую скорость работы. При записи идеально дедуплицируемых данных (все кластеры одинаковы) она в полтора раза превзошла по скорости распространенную файловую систему ext4, при записи плохо дедуплицируемых данных (кластеры с произвольным содержимым) она сработала менее чем в 2 раза медленнее, чем ext4. Были также проведены тесты консистентности данных: по скопированным данным были подсчитаны контрольные суммы, которые совпали с контрольными суммами файлов в ext4. Полученные результаты являются многообещающими и в будущем могут быть улучшены, файловая система может быть внедрена в облачных сервисах, что принесет существенную выгоду их владельцам. В процессе работы студент Р.С.Шалымов активно взаимодействовал с научным руководителем, вёл самостоятельную работу. Все результаты были получены в срок. В ходе работы студент получил много опыта и навыков, показал себя как добросовестный и вдумчивый исследователь, внимательный, поэтому заслуживает оценки «отлично». Терехов Андрей Николаевич, доктор физико-математических наук, профессор каф. Системного программирования СПбГУ. Дата: 26 мая 2016 г Подпись: __________________________