Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/4154
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorПопова Светлана Владимировнаru_RU
dc.contributor.authorЖуравлева Любовь Викторовнаru_RU
dc.contributor.authorZhuravleva Liuboven_GB
dc.contributor.editorмагистр С.В. Поповаru_RU
dc.contributor.editorS.V. Popovaen_GB
dc.date.accessioned2016-10-10T02:12:31Z-
dc.date.available2016-10-10T02:12:31Z-
dc.date.issued2016
dc.identifier.other011358en_GB
dc.identifier.urihttp://hdl.handle.net/11701/4154-
dc.description.abstractВ работе рассматривается проблема определения тональности отзывов пользователей о фильмах. Решение данной задачи имеет высокое прикладное значение, в частности может применяться к новостным статьям, блогам. Целью данной работы является исследование и разработка метода анализа тональности текстов. Для решения задачи анализа тональности отзывов пользователей в данной квалификационной работе использовалось два подхода – основанный на словаре и основанный на машинном обучении. Были разобраны разнообразные подходы, которые использовались для создания словаря сентиментов для других языков. За основу для создания собственного словаря сентиментов был взят словарь ключевых слов, составленных на основе коллекций отзывов о фотоаппаратах, книгах и фильмах. Полученный словарь сентиментов был расширен с помощью технологии word2vec от компании google. Для демонстрации подхода, основанного на машинном обучении был использован наивный байесовский классификатор. Экспериментальная часть работы была основана на использовании одной из основных русскоязычных коллекций отзывов о фильмах с портала imhoment.ru. Было произведено сравнение оценки качества работы двух подходов на 30 выборках, созданных на основе 7500 отзывов, не входящих в обучающую выборку для наивного байесовского классификатора. Исследование показало более высокую точность подхода, основанного на словаре.ru_RU
dc.description.abstractIn this paper the problem of determining the tone of reviews about movies users is considered. The solution of this problem has a high practical importance. In particular, it can be applied to news articles and blogs. The aim of this study is to investigate and develop a method for the analysis of texts tone. Two approaches of solving the problem of analysis of tonality of user`s reviews are used in this qualification paper. One of them is based on a dictionary and another on machine learning. While creating the dictionary sentiment for other languages the variety of approaches designed in this paper are used. The dictionary of keywords compiled on the basis of collections of reviews of cameras, books and movies, is taken as the basis for creating your own dictionary. The resulting sentiment dictionary is expanded with the help of google word2vec technology. Naive baesovsky qualifier is used to demonstrate an approach based on machine learning. The experimental part of the work is based on one of the main Russian-language collections of reviews of the movie from the portal imhoment.ru. A comparison was made for evaluating the performance of the two approaches in the 30 samples that are based on 7500 reviews outside the training set for the Naive Bayes classifier. The study showed a higher precision approach based on dictionary.en_GB
dc.language.isoru
dc.subjectсловарь сентиментовru_RU
dc.subjectанализ тональностиru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectword2vecen_GB
dc.subjectsentiment analysisen_GB
dc.subjectCBOWen_GB
dc.subjectmachine learningen_GB
dc.titleSentiment analysis of users reviewsen_GB
dc.title.alternativeАнализ тональности отзывов пользователейru_RU
Располагается в коллекциях:BACHELOR STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.