Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/12795
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorМалафеев Алексей Юрьевичru_RU
dc.contributor.authorРощина Наталия Юрьевнаru_RU
dc.contributor.authorRoshchina Nataliiaen_GB
dc.contributor.editorМитрофанова Ольга Александровнаru_RU
dc.contributor.editorMitrofanova Olga Аleksаndrovnаen_GB
dc.date.accessioned2018-07-26T15:18:55Z-
dc.date.available2018-07-26T15:18:55Z-
dc.date.issued2018
dc.identifier.other058481en_GB
dc.identifier.urihttp://hdl.handle.net/11701/12795-
dc.description.abstractВыпускная квалификационная работа посвящена оценке эффективности методов дистрибутивной семантики при распознавании парафразов в русскоязычных текстах. Теоретической основой исследования является анализ механизмов перефразирования и подходов к автоматической идентификации парафразов. Практическое содержание исследования состоит в проведении и обработке результатов серии экспериментов по оценке семантической близости пар новостных заголовков на материале русскоязычного корпуса Paraphraser. Векторные представления заголовков получены с помощью алгоритмов семейства word2vec (CBOW, Skip-gram). Для каждой языковой модели подобраны пороговые значения, разделяющие парафразы и не-парафразы, вычислена погрешность и проведён анализ допущенных ошибок.ru_RU
dc.description.abstractThe master thesis is devoted to the evaluation of distributive semantic methods for paraphrase recognition. Theoretical background of our project implies the study of paraphrasing techniques and approaches to automatic identification of paraphrases. Practical content of research deals with a series of experiments aimed at measuring semantic similarity of news headlines pairs from Paraphraser corpus. We used word2vec models (CBOW, Skip-gram) in order to obtain distributed vector representations of target phrases. For each model we defined the threshold value which separates paraphrases and non-paraphrases, we calculated precision, recall and F-measure. Error analysis was also performed.en_GB
dc.language.isoru
dc.subjectраспознавание парафразовru_RU
dc.subjectдистрибутивная семантикаru_RU
dc.subjectword2vecru_RU
dc.subjectновостные заголовкиru_RU
dc.subjectрусский языкru_RU
dc.subjectparaphrase recognitionen_GB
dc.subjectdistributional semanticsen_GB
dc.subjectword2vecen_GB
dc.subjectnews headlinesen_GB
dc.subjectRussian languageen_GB
dc.titleAutomatic paraphrases recognition in the text corpus of Russian languageen_GB
dc.title.alternativeАвтоматическое распознавание парафразов в русскоязычном корпусе текстовru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
VKR_Roshchina.rtfArticle7,15 MBRTFПросмотреть/Открыть
reviewSV_otzyv_NatashaRoshhina.docReviewSV36,5 kBMicrosoft WordПросмотреть/Открыть
reviewSV_Roshhina_Recenziya.PDFReviewRev3,4 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.