Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/25893
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Давыденко Александр Александрович | ru_RU |
dc.contributor.advisor | Davydenko Aleksandr Aleksandrovic | en_GB |
dc.contributor.author | Горожанкин Ярослав Павлович | ru_RU |
dc.contributor.author | Gorozankin Aroslav Pavlovic | en_GB |
dc.contributor.editor | Попова Светлана Владимировна | ru_RU |
dc.contributor.editor | Popova Svetlana Vladimirovna | en_GB |
dc.date.accessioned | 2021-03-24T15:08:29Z | - |
dc.date.available | 2021-03-24T15:08:29Z | - |
dc.date.issued | 2019 | |
dc.identifier.other | 047591 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/25893 | - |
dc.description.abstract | С появлением Web 2.0 различные платформы позволяют гражданам делится своим мнением на различные темы, но не на всех таких платформах пользователь может выставлять оценку какому-либо товару или произведению, что усложняет сбор статистических данных для анализа мнений. Анализ мнений направлен на определение полярности эмоций, а также на выделение мнения из текстов. В данной работе была поставлена цель: улучшение качества работы алгоритмов определения тональности для их практического внедрения. Задачами являлись: рассмотреть возможные подходы и алгоритмы к построению моделей классификации отзывов фильмов по трем классам эмоциональности: “негативные”, “нейтральные”, “позитивные”; собрать набор данных кинорецензий для тестирования моделей; сравнить различные способы обработки текстовых данных и их влияние на модель классификации; разработать Web-сайт для поиска необходимого фильма и рассмотрения отзывов о нем. Были рассмотрены различные подходы к обработке текстовых данных. Данные были предоставлены Российским семинаром по оценке методов информационного поиска, а также были собраны с портала Мегакритик. Способы обработки текстовых данных проверялись при использовании классификатора случайного леса. Удалось получить результаты улучшающие другие результаты, представленные в области. Разработанный алгоритм классификации внедрен в созданный в рамках дипломного проекта Web-сайт. Данный Web-сайт позволяет осуществлять поиск по фильмам и кроме результатов поиска, предоставляет статистическую информацию о “позитивных”, “негативных” и “нейтральных” отзывах о найденных фильмах. | ru_RU |
dc.description.abstract | With the advent of Web 2.0, various platforms allow citizens to share their opinions on various topics, but not on all such platforms users can rate any product, which complicates the collection of statistical data for sentiment analysis. The sentiment analysis is aimed at determining the polarity of emotions, as well as highlighting opinions from texts. In this paper, the goal was to improve the quality of the sentiment analysis algorithms for their practical implementation. The tasks were: to consider possible approaches and algorithms for building models of classification of film reviews into three classes of emotionality: “negative”, “neutral”, “positive”; collect a set of movie reference data for model testing; compare various methods of text data processing and their influence on the classification model; develop a Website to search for a movie and consideration of reviews about it. Different approaches to the processing of textual data were considered. The data was provided by the Russian Information Retrieval Evaluation Seminar, and were collected from the portal Megacritic. Ways to process textual data were tested using a random forest classifier. It was possible to obtain results that improve other results presented in the field. The developed classification algorithm is implemented in the Web-site created within the framework of the graduation project. This website allows you to search for movies and, in addition to search results, provides statistical information about “positive”, “negative” and “neutral” feedback about the films found. | en_GB |
dc.language.iso | ru | |
dc.subject | анализ тональности | ru_RU |
dc.subject | машинное обучение | ru_RU |
dc.subject | случайный лес | ru_RU |
dc.subject | РОМИП | ru_RU |
dc.subject | web-сайт | ru_RU |
dc.subject | sentiment analysis | en_GB |
dc.subject | machine learning | en_GB |
dc.subject | random forest | en_GB |
dc.subject | ROMIP | en_GB |
dc.subject | website | en_GB |
dc.title | Sentiment analysis system for movie review | en_GB |
dc.title.alternative | Разработка системы анализа мнений отзывов о фильмах | ru_RU |
Располагается в коллекциях: | BACHELOR STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Diplom.pdf | Article | 1,6 MB | Adobe PDF | Просмотреть/Открыть |
reviewSV_otzyv.pdf | ReviewSV | 44,64 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.