О Т З Ы В на магистерскую диссертацию ЛукинаНикиты Сергеевича «Выявление информации о конфликтных ситуациях в новостных текстах (на базе семантического описания RussNet)» Магистерская диссертация Н. C. Лукина посвящена выявлению информации о конфликтных ситуациях в новостных текстах на базе семантического описания RussNet. Актуальность данной работы обусловлена активным развитием технологий извлечения информации и их широким применением в области информационного поиска. Новизна работы заключается в применении фреймового и валентностно-актантного описания глаголов описывающих конфликтные ситуации, потенциально совместимого с RussNetи YARN. Работа состоит из введения, двух глав: (одной теоретической, одной практической), заключения, списка литературы и приложения. В первой главе Н. C. Лукин подробно рассматривает различные подходы к семантическому анализу языка, помимо классических идей В. Порцига, Л. Теньера, также уделяет внимание также и ряду современных публикаций, развивающих в технологическом ключе идеи Ч.Филмора и М. Минского. Вторая глава посвящена описанию практической части работы, в которой автор описывает два эксперимента с разными корпусами текстов: первый из которых основан на публикациях в популярных СМИ, а второй на статьях русского сегмента интернет-энциклопедии Wikipedia. Первый эксперимент автор признает неудачным, а на материале второго проводит дальнейшее исследование – извлекает из текстов глаголы при помощи разработанного в компании Яндекс парсера Tomita, сортирует их по частотности и отбирает 20 использующихся для описания конфликтных ситуаций. Отобранные глаголы группируются по синсетам (приведены в приложении 1), снабжаются валентностно-актантным описанием (приведено в тексте работы) и анализом структуры фреймов (приложение 2). В работе предлагается интересный подход к описанию конфликтных ситуаций с точки зрения организованных в структуру фреймов, описывающих микроситуации, которые позволяют составить представление о макроситуации. В таком подходе видится перспектива перехода на уровень анализа целого текста. К сожалению, работа имеет ряд недостатков, которые необходимо упомянуть в рецензии. Сформулированное во введении определение конфликтных ситуаций [стр. 4] во второй главе сужается до понятия вооруженных конфликтов без дополнительного пояснения. Также автор отказывается от использования корпуса новостных текстов, ссылаясь на отсутствие в них описания самого хода военных действий и называя корпус нерепрезентативным. Автор говорит о нерепрезентативности корпуса новостных текстов, выбранного на первом шаге исследования, а также называет репрезентативным второй корпус, собранный из 30 статей русской википедии, не аргументируя ни первое, ни второе утверждение и не поясняя, о какой генеральной совокупности идет речь. Таким образом реальная тема работы оказывается несколько уже заявленной в названии. Дополнительно можно отметить некоторую неаккуратность в оформлении цитат, не всегда очевидны границы цитаты, некоторые работы цитируются опосредованно: «Тарланов, ссылаясь на Трира»[стр 8], «Бретцельс, ссылаясь на Караулова» [стр. 13]. Некоторые упоминаемые работы не приведены в списке литературы, в частности ни одной работы регулярно упоминаемого в работе В.Порцига в источниках не указано. В примере в пункте 1.3.1, наряду с агентом и инструментом, единственный раз упоминаются такие типы семантических ролей как “намерение” и “эффект”, не входящие в предложенную на странице 22 (п 1.2.3) классификацию семантических ролей. Достаточно спорным выглядит утверждение автора о том, что фрейм защиты диссертации в зависимости от выбора точки отсчета (комиссия/студент) будет “кардинальным образом отличаться” (стр 28, п 1.3.1). Если исходить из имплицитно используемой далее в работе интерпретации термина “фрейм” как единицы представления извлеченной из текста информации, логично предполагать, что методика описания должна выбираться таким образом, чтобы конечные фреймовые описания ситуации должны максимальным образом совпадать, по крайней мере, при описании регламентированных процедур, ядром которых является вербальная коммуникация. В работе и приложениях не приведен общий список материалов и выходных данных, использованных в корпусе текстов, а приводится лишь неполный список тем, не снабженный ссылками и датами фиксации состояния, использованного в исследовании. Несмотря на указанные недочеты и пожелания к автору, можно сказать, что исследование представляет собой интересную работу на актуальную современную тему. Диссертация заслуживает положительной оценки. 30.05.2016 разработчик ПО ООО «Яндекс», магистр лингвистики Каравашкин Михаил Oлегович