Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/7360
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorЭйсмонт Полина Михайловнаru_RU
dc.contributor.authorЮшина Татьяна Андреевнаru_RU
dc.contributor.authorIushina Tatianaen_GB
dc.contributor.editorМитренина Ольга Владимировнаru_RU
dc.contributor.editorMitrenina Olga Vlаdimirovnаen_GB
dc.date.accessioned2017-09-29T13:22:32Z-
dc.date.available2017-09-29T13:22:32Z-
dc.date.issued2017
dc.identifier.other017284en_GB
dc.identifier.urihttp://hdl.handle.net/11701/7360-
dc.description.abstractВ работе рассматривается алгоритм автоматического составления тональных словарей, которые используются в процедурах анализа тональности. В исследовании был использован русскоязычный корпус текстов отзывов о банках. Основная идея подхода – оценка корреляции двух случайных событий: «слово содержится в отзыве» и «отзыв описывает недостатки/достоинства». Для оценки корреляции были построены таблицы сопряженности и применен критерия согласия Пирсона («Хи-квадрат»). Так, были получены словари тональных лексем (702 слова) и конструкций (400 словосочетаний). Удалось выделить как общеупотребительные тонально окрашенные слова и словосочетания (грубый, отвратительный, доброжелательный, потрясающе, неприятная ситуация, страшный сон), так и относящиеся к банковской сфере (ипотечный кредит, приличный кэшбэк, минимальный процент, банкомат зажевал (карту), огромная комиссия). В основе оценки качества работы алгоритма был использован метод кросс-валидации, показавший достаточно высокие результаты: полнота (67,4%) и точность (78,4%). Данный алгоритм в дальнейшем можно применить для автоматического составления предметно-ориентированных тональных словарей других предметных областей, а также его можно использовать для маркетинговых исследований банковских услуг.ru_RU
dc.description.abstractIn our thesis we discuss the method of the automatic construction of the sentiment lexicons used in opinion mining and sentiment analysis. In research we relied upon the Russian corpus of bank reviews. The main idea is the correlation evaluation of 2 random events “the word is in the review” and “the review is positive/negative”. For the correlation evaluation we used contingency tables and Pirson criterion. Thus, sentiment lexicons (702 sentiment lexemes and 400 constructions) were extracted. We received both common (грубый, отвратительный, доброжелательный, потрясающе, неприятная ситуация, страшный сон) and bank-specific sentiment lexemes and phrases (ипотечный кредит, приличный кэшбэк, минимальный процент, банкомат зажевал (карту), огромная комиссия). To evaluate the quality of the algorithm we calculate recall (67,4%) and precision (78,4%) using the method of cross-validation. In future the algorithm can be used for sentiment lexicon generating for other domains or for marketing analysis of bank services.en_GB
dc.language.isoru
dc.subjectанализ тональностиru_RU
dc.subjectтональный словарьru_RU
dc.subjectотзывы о банкахru_RU
dc.subjectsentiment analysisen_GB
dc.subjectsentiment lexiconen_GB
dc.subjectbank reviewsen_GB
dc.titleAutomatic generation of domain-specific sentiment dictionaries as illustrated by bank reviewsen_GB
dc.title.alternativeАвтоматическое пополнение предметно-ориентированных тональных словарей (на материале отзывов о банковских организациях)ru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
Diplom_final.pdfArticle1,12 MBAdobe PDFПросмотреть/Открыть
reviewSV_nauchkuk_jushina.pdfReviewSV193,99 kBAdobe PDFПросмотреть/Открыть
reviewSV_Skan_20170527_(2).pdfReviewRev1,36 MBAdobe PDFПросмотреть/Открыть
reviewSV_YUshina_T_A__mag_rec.pdfReviewRev2,14 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.