Выпускная квалификационная работа Щербининой Арины Александровны «Вычисление сходства русских текстов на основе синтаксических структур» является интересным новаторским подходом к проблеме сопоставления текстов, которая важна в настоящее время как для выявления плагиата в текстах, так и для задач автоматического анализа содержания текстов. Предложенный подход позволяет выйти за рамки векторов лексических единиц и устанавливает соотношение линейных синтаксических структур в сочетании с их лексическим наполнением при их реализации в виде разнообразных вариантов их введения в структуру предложения. Кроме того, метод позволяет использовать отношение деривационной транспозиции между лексемами путем использования отношений деривационной синонимии из компьютерного словаря RussNet. При выполнении выпускной квалификационной работы Арина Александровна решила ряд задач, которые демонстрируют высокий уровень владения как лингвистическими методами, так и методами компьютерной лингвистики. В лингвистическом плане реализовано структурное представление текстов школьных изложений при сопоставлении с оригинальным текстом, что было в дальнейшем использовано в качестве базы для выделения элементов линейной синтаксический структуры (чанков – элементов синтагм), для выявления эквивалентных способов видоизменения выделенных фрагментов (их перестройки, перифразирования) и подбора коэффициентов для «весомости» тех или иных способов видоизменения синтаксических структур. Для автоматической обработки текстов Арина Александровна разработала комплекс программ, позволяющих выделять в структуре предложения «топологические поля» – отрезки линейной синтаксической структуры, в которых наблюдается повышенный уровень вариативности элементарных составляющих (чанков). При этом используется корректировка результатов морфоанализатора pymorphy2, построенная на базе линейных триграмм из прецедентной совокупности однозначно размеченных текстов. Для верификации результатов, полученных в процедурах автоматического вычисления сходства новостных текстов, Арина Александровна использовала «золотой стандарт» – оценки 6 носителей русского языка сходства/различия новостных текстов. Результаты сопоставления показывают адекватность предлагаемого метода. Работа Арины Александровны показывает высокий уровень квалификации автора в области лингвистического анализа текста, навыков адаптации компьютерных процедур и методов для конкретных прикладных задач, умения оценить результаты компьютерных приложений. Это самостоятельное законченное исследование, удовлетворяющее всем требованиям к работам такого уровня.