САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕСРИТЕТ ФИЛОЛОГИЧЕСКИЙ ФАКУЛЬТЕТ образовательная программа магистратуры "Прикладная, экспериментальная и математическая лингвистика" РЕЦЕНЗИЯ на выпускную квалификационную работу студента Пивоваровой Светланы Сергеевны, выполненной на тему «Методика извлечения кандидатов для многоязычного (англо-франко-русского) терминологического словаря» Актуальность ВКР, новизна Разработка методов автоматического извлечения терминологии относится к числу важных направлений современной компьютерной лингвистики. При этом в связи со всё возрастающим объемом специальной литературы и необходимостью ее перевода на большое количество языков необходима стандартизация при передаче терминологических слов и словосочетаний. Таким образом, задача по созданию методики выделения терминов-кандидатов для многоязычного словаря представляется актуальной и соответствующей требованиям времени. В рецензируемой работе впервые описывается алгоритм выделения терминов-кандидатов и их переводных эквивалентов из многоязычного параллельного корпуса текстов. Также впервые разрабатывается система переводных соответствий между схемами построения терминов, представленных в виде морфосинтаксических шаблонов, в английском, французском и русском языках. Оценка содержания работы Во введении рецензируемой работы С.С. Пивоварова убедительно обосновывает необходимость разработки методики выделения терминов-кандидатов для многоязычного (англо-франко-русского) терминологического словаря на основе многоязычного параллельного корпуса текстов, заявленную как цель исследования. В дальнейшем тексте работы сформулированная цель полностью достигается, а все связанные с ней задачи последовательно получают свое решение. В первой главе С.С. Пивоварова демонстрирует эрудицию в области как традиционной, так и компьютерной лингвистики, всесторонне освещая понятия термина и термина-кандидата, а также существующие методы выделения последних на базе корпусов текстов. Помимо этого, автор приводит исчерпывающее обоснование выбора меры log-likelihood как инструмента выделения терминологических сочетаний из числа частотных биграмм. Вторая глава посвящена описанию оригинальной методики извлечения терминов-кандидатов для многоязычного терминологического словаря, разработанной автором исследования. Здесь С.С. Пивоварова умело использует статистический метод для формирования набора морфосинтаксических шаблонов, лежащего в основе разработанного алгоритма, а также сопоставительный метод для выявления переводных соответствий между шаблонами, характеризующими структуру терминов каждого из трех исследуемых языков, и их эквивалентами в двух других. В заключительной части главы автор скрупулезно описывает собственный алгоритм выделения переводных терминов-кандидатов из многоязычного корпуса текстов, работа по подготовке которого также целиком была выполнена С.С. Пивоваровой. Третья глава представляет собой описание эксперимента, направленного на тестирование разработанной автором методики. Вывод о релевантности выделенных в результате эксперимента списков терминов-кандидатов на трех языках делается на основании обращения к терминологическим словарям и базам данных; автору удается продемонстрировать, что точность выделения однословных терминов и терминологических биграмм достаточно высока, чтобы алгоритм мог считаться надежным. Заключение работы гармонично обобщает ее основные положения и подводит итоги исследования. Список литературы насчитывает 65 наименований, в том числе 36 на английском языке, что, безусловно, можно считать достаточным для освещения проблематики, связанной с данным исследованием. Положительные стороны ВКР Работа привлекает стройностью композиции и внутренней логикой. Все методологические решения автора четко обоснованы, алгоритмы и методики снабжены подробным описанием. Изложение отличается последовательностью, каждая из глав заканчивается выводами, обобщающими ее содержание. Рецензируемая ВКР дает представление о проделанной автором огромной работе, которая, помимо проработки теоретических вопросов, разработки методики извлечения терминов-кандидатов и ее тестирования, включила в себя также создание трехъязычного англо-франко-русского корпуса гуманитарных текстов, представляющего самостоятельную ценность. При анализе результатов проведенного эксперимента особо ценно то, что автор не ограничивается констатацией факта о высокой точности выделения терминов на основании числовых данных, а проводит полноценную содержательную интерпретацию полученных списков и сопоставлений, в частности, проведя анализ нерелевантных кандидатов, получаемых при использовании алгоритма, и выделив несколько различных типов ошибок с указанием их причин. Практическое значение работы Значимость данного исследования не ограничивается разработанной методикой выделения терминов-кандидатов, представляющей безусловную ценность и способной выступать в качестве инструмента для создания и пополнения терминологических словарей и баз данных. Практическое применение способен иметь также и подготовленный автором параллельный корпус, который может быть использован в научной, так и в учебной сфере. Полученные автором лингвистические данные о соответствиях между английскими, французскими и русскими терминами и терминологическими шаблонами могут стать материалом в курсах, проблематика которых связана с терминоведением и переводоведением. Недостатки и замечания по ВКР Замечания по рецензируемой работе не носят принципиального характера, их стоит рассматривать скорее как предложения на усмотрение автора ВКР. • В перечне литературы научные статьи и монографии объединены в единый список со справочными ресурсами (словарями и базами данных), с помощью которых производилась оценка качества разработанного алгоритма. Ввиду специфической функции этих источников в исследовании, возможно, имело смысл оформить их в отдельный список. • На с. 41 приводится описание вспомогательного анализа с целью определения порога статистической значимости для биграмм, однако эта часть исследования не проиллюстрирована (к примеру, при помощи таблицы) ни в основном тексте ВКР, ни в ее приложениях. Возможно, иллюстрация к данному фрагменту могла бы еще больше повысить наглядность работы. • Аналогичным образом можно было привести в качестве одного из приложений к работе исходный код упомянутой на с. 39 программы выделения кандидатов в термины и установления для них переводных соответствий. Рекомендуемая оценка ВКР "отлично с отличием" Рецензент: Филиппов Андрей Константинович, к. филол. н., ассистент, кафедра математической лингвистики филологического факультета СПбГУ «27» мая 2016 г. _________________ (подпись)