ПРАВИТЕЛЬСТВО РОСССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» ФАКУЛЬТЕТ ИСКУССТВ Кафедра информационных систем в искусстве и гуманитарных науках ОТЗЫВ НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ студентки бакалавриата Крутченко Ольги Витальевны Направление 230700 «Прикладная информатика» Тема выпускной квалификационной работы: «РЕАЛИЗАЦИИ ПРОЦЕДУР КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ОТ ЖАНРОВЫХ И СТИЛЕВЫХ ХАРАКТЕРИСТИК ТЕКСТА» Ольгу Витальевну Крутченко я знаю с первого курса бакалавриата, очень активно работает над дипломным проектом два года, начиная с третьего курса (особенно, начиная с моего курса по выбору «Эксперимент в лингвистике: от постановки к интерпретации») два последних года бакалавриата . За эти два года было сделано очень много. Учитывая то, что Оля начала свое образование на математико-механическом факультете, у нее есть существенная часть базового образования, необходимого для Computer Science and Artificial Intelligence как необходимых составляющих вычислительной и/или компьютерной лингвистик, особенно в зарубежном понимании и в современном отечественном варианте. Цель данной работы – выявить зависимость реализации процедур контекстной предсказуемости от жанровых и стилевых характеристик текста (типа и подтипа текста), простроить модель-прототип, позволяющую предсказывать элементы текста, обозначить особенности этой модели для текстов разных жанров и функциональных стилей. Работа Ольги Витальевны Крутченко чрезвычайно актуальна для самых разных за-дач: от сравнительно простых лингвистических технологий до интеллектуальных систем понимания и порождения текста. Для достижения поставленной цели Оля решила следующие задачи: • выбрать и обосновать методы исследования; • написать модульную программу, реализующую вычисления контекстной информации и предсказательную силу для каждого элемента текста; • построить модели для художественных и научных текстов; • оценить эффективность статистически и с помощью эксперимента с информантами (cloze-test). В работы был произведен анализ различных методов исследования контекстной предсказуемости и выбраны метрики, оптимальные для решения задач текущего этапа, а также рассмотрены варианты скрытых марковских процессов, исследование которых планируется на этапе магистерской диссертации. Ольга Крутченко провела вычислительный эксперимент на основе корпусов науч-ных и художественных текстов и оценку работоспособности разных вариантов модели, учитывающих разные вероятностные метрики (энтропия, surprisal («удивительность»), условная вероятность, меры связанности (Dice, MI, t-score), а также chunks (связанные це-почки слов на основе метрики Dice). Важным компонентом работы Ольги явилась оценка работоспособности модели в разных вариантах на основе статистических методов, а главное – экспериментов с ин-формантами. Таким образом, уже на этапе бакалаврской работы были построены модели текстов, произведена оценка работоспособности модели по выбранным признакам контекстной предсказуемости. Полученные результаты и написанная программа могут применяться для дальнейших исследований в области автоматической обработки текстов. Работу планируется продолжать в магистратуре и, надеюсь, в аспирантуре. Ольга Крутченко умеет ставить перед собой задачи и творчески подходить к их решению; она умеет работать в коллективе. Ольга обладает жаждой знаний, и очевиден высокий темп приобретения ею лингвистических знаний в области теории лингвистики, Computer Science, NLP, Computational Linguistics, Corpus Linguistics, Text Mining, Text Analysis. Все те годы, что Ольга Крутченко работает со мной, она поражает меня темпами своего профессионального роста. Ольга превосходно справляется с задачами программно-го воплощения своих алгоритмических решений. Кроме бакалаврского исследования Ольга Крутченко является участником темпла-на по теме «Квантитативные лингвистические параметры определения стилевых характеристик и предметной области текстов» (рук. Е.В.Ягунова, 2014-2016) и уже с прошлого 2015 года успешно решала задачи проекта. О. В. Крутченко решила все задачи своей дипломной работы в полном объеме, она разработала полноценную многоплановую методику и сделала её программную реализацию. Поставленные и частично решенные задачи могут явиться базовыми для будущей магистерской и, надеюсь, кандидатской диссертаций. Апробация работы прошла на заседании секции "Компьютерная лингвистика" Ежегодного научно-практического семинара "Новые информационные технологии в автоматизированных системах" (Институт прикладной математики им. М.В. Келдыша РАН, МИЭМ ВШЭ, Московский государственный технический университет им. Н.Э. Баумана). По материалам семинара опубликована статья Крутченко О.В. Классификация ключевых слов для описания новостных кластеров // Новые информационные технологии в автоматизированных системах: материалы девятнадцатого научно-практического семинара. – М.: ИПМ им. М.В. Келдыша, 2016 (соавторы Мартина В.С., Соколова Д.Ю., Флуд Д.В.), статья индексируема в базе РИНЦ. Как научный руководитель я очень высоко оцениваю дипломную выпускную квалификационную работу бакалавра О. В. Крутченко. Еще выше я оцениваю научный потенциал Ольги Витальевны, и я очень надеюсь на то, что она продолжит под моим научным руководством как работу на будущими магистерской и кандидатской диссертациями, так и работу в рамках университетских проектов. Считаю, что выпускная работа Крутченко О.В. соответствует не только уровню бакалаврской работы, но даже и уровню магистерской диссертации. Ольга безусловно заслуживает оценки «ОТЛИЧНО», а сама Ольгу Витальевна Крутченко – присуждения ей степени баклавра. Научный руководитель: Е.В.Ягунова 27/05/2016