Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/7360
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Эйсмонт Полина Михайловна | ru_RU |
dc.contributor.author | Юшина Татьяна Андреевна | ru_RU |
dc.contributor.author | Iushina Tatiana | en_GB |
dc.contributor.editor | Митренина Ольга Владимировна | ru_RU |
dc.contributor.editor | Mitrenina Olga Vlаdimirovnа | en_GB |
dc.date.accessioned | 2017-09-29T13:22:32Z | - |
dc.date.available | 2017-09-29T13:22:32Z | - |
dc.date.issued | 2017 | |
dc.identifier.other | 017284 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/7360 | - |
dc.description.abstract | В работе рассматривается алгоритм автоматического составления тональных словарей, которые используются в процедурах анализа тональности. В исследовании был использован русскоязычный корпус текстов отзывов о банках. Основная идея подхода – оценка корреляции двух случайных событий: «слово содержится в отзыве» и «отзыв описывает недостатки/достоинства». Для оценки корреляции были построены таблицы сопряженности и применен критерия согласия Пирсона («Хи-квадрат»). Так, были получены словари тональных лексем (702 слова) и конструкций (400 словосочетаний). Удалось выделить как общеупотребительные тонально окрашенные слова и словосочетания (грубый, отвратительный, доброжелательный, потрясающе, неприятная ситуация, страшный сон), так и относящиеся к банковской сфере (ипотечный кредит, приличный кэшбэк, минимальный процент, банкомат зажевал (карту), огромная комиссия). В основе оценки качества работы алгоритма был использован метод кросс-валидации, показавший достаточно высокие результаты: полнота (67,4%) и точность (78,4%). Данный алгоритм в дальнейшем можно применить для автоматического составления предметно-ориентированных тональных словарей других предметных областей, а также его можно использовать для маркетинговых исследований банковских услуг. | ru_RU |
dc.description.abstract | In our thesis we discuss the method of the automatic construction of the sentiment lexicons used in opinion mining and sentiment analysis. In research we relied upon the Russian corpus of bank reviews. The main idea is the correlation evaluation of 2 random events “the word is in the review” and “the review is positive/negative”. For the correlation evaluation we used contingency tables and Pirson criterion. Thus, sentiment lexicons (702 sentiment lexemes and 400 constructions) were extracted. We received both common (грубый, отвратительный, доброжелательный, потрясающе, неприятная ситуация, страшный сон) and bank-specific sentiment lexemes and phrases (ипотечный кредит, приличный кэшбэк, минимальный процент, банкомат зажевал (карту), огромная комиссия). To evaluate the quality of the algorithm we calculate recall (67,4%) and precision (78,4%) using the method of cross-validation. In future the algorithm can be used for sentiment lexicon generating for other domains or for marketing analysis of bank services. | en_GB |
dc.language.iso | ru | |
dc.subject | анализ тональности | ru_RU |
dc.subject | тональный словарь | ru_RU |
dc.subject | отзывы о банках | ru_RU |
dc.subject | sentiment analysis | en_GB |
dc.subject | sentiment lexicon | en_GB |
dc.subject | bank reviews | en_GB |
dc.title | Automatic generation of domain-specific sentiment dictionaries as illustrated by bank reviews | en_GB |
dc.title.alternative | Автоматическое пополнение предметно-ориентированных тональных словарей (на материале отзывов о банковских организациях) | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Diplom_final.pdf | Article | 1,12 MB | Adobe PDF | Просмотреть/Открыть |
reviewSV_nauchkuk_jushina.pdf | ReviewSV | 193,99 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_Skan_20170527_(2).pdf | ReviewRev | 1,36 MB | Adobe PDF | Просмотреть/Открыть |
reviewSV_YUshina_T_A__mag_rec.pdf | ReviewRev | 2,14 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.