РЕЦЕНЗИЯ НА ВЫПУСКНУЮ КВАЛИФИКАЦИОННУЮ РАБОТУ студентки бакалавриата Крутченко Ольги Витальевны Направление 230700 «Прикладная информатика» САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА На тему "Зависимость реализации процедур контекстной предсказуемости от жанровых и стилевых характеристик текста" Работа Крутченко О.В. посвящена исследованию методов выделения связанных многословных конструкций в текстах на русском языке. Поставленная задача является актуальной, так как ее результаты используются в таких областях, как выделение терминов из специализированных текстов, выделение многословных имен собственных, ключевых фраз и словосочетаний, в ряде других задач. Точное выделение многословных конструкций позволяет повысить качество решения перечисленных алгоритмов, но до сих пор данная задача не была решена полностью. Для исследования использовался ряд известных мер определения близости слов в словосочетании, например, t-score, MI, Dice, surprisal и некоторые другие. Для обработки выбранных корпусов использовались такие программные средства и библиотеки, как NLTK и PyMorphy, а окончательный расчет статистических параметров велся с использованием языка программирования Python. Полученные результаты показывают хорошее владение инструментами, навыками в области программирования, а также высокий уровень теоретической подготовки. Проверка результатов проводилась с использованием методики cloze-tests. С одной стороны, полученные результаты позволяют говорить о том, что для общей лексики методика показала свою практическую применимость и значимость. С другой стороны, подбор информантов следовало бы проводить среди специалистов, знакомых с терминологией предметной области. В этом случае точность угадываний специальных терминов могла оказаться выше. Помимо этого, в работе имеется ряд ошибок и неточностей. Так, например, не обосновывается вид формулы энтропии, отличающейся в различных публикациях в зависимости от поставленных задач. Работа содержит определенное количество орфографических и синтаксических ошибок (так, на стр. 11 присутствуют и те, и другие), некоторые из которых попали в названия разделов (см. п. 1.2.6). Несмотря на это работа написана живым и понятным языком, а ошибки не влияют на качество восприятия результатов. Считаю, что выпускная работа Крутченко О.В. соответствует не только уровню бакалаврской работы, но и уровню магистерской диссертации, она заслуживает оценки «ОТЛИЧНО», а сама Крутченко О.В. – присуждения ей степени баклавра.