Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/25893
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorДавыденко Александр Александровичru_RU
dc.contributor.advisorDavydenko Aleksandr Aleksandrovicen_GB
dc.contributor.authorГорожанкин Ярослав Павловичru_RU
dc.contributor.authorGorozankin Aroslav Pavlovicen_GB
dc.contributor.editorПопова Светлана Владимировнаru_RU
dc.contributor.editorPopova Svetlana Vladimirovnaen_GB
dc.date.accessioned2021-03-24T15:08:29Z-
dc.date.available2021-03-24T15:08:29Z-
dc.date.issued2019
dc.identifier.other047591en_GB
dc.identifier.urihttp://hdl.handle.net/11701/25893-
dc.description.abstractС появлением Web 2.0 различные платформы позволяют гражданам делится своим мнением на различные темы, но не на всех таких платформах пользователь может выставлять оценку какому-либо товару или произведению, что усложняет сбор статистических данных для анализа мнений. Анализ мнений направлен на определение полярности эмоций, а также на выделение мнения из текстов. В данной работе была поставлена цель: улучшение качества работы алгоритмов определения тональности для их практического внедрения. Задачами являлись: рассмотреть возможные подходы и алгоритмы к построению моделей классификации отзывов фильмов по трем классам эмоциональности: “негативные”, “нейтральные”, “позитивные”; собрать набор данных кинорецензий для тестирования моделей; сравнить различные способы обработки текстовых данных и их влияние на модель классификации; разработать Web-сайт для поиска необходимого фильма и рассмотрения отзывов о нем. Были рассмотрены различные подходы к обработке текстовых данных. Данные были предоставлены Российским семинаром по оценке методов информационного поиска, а также были собраны с портала Мегакритик. Способы обработки текстовых данных проверялись при использовании классификатора случайного леса. Удалось получить результаты улучшающие другие результаты, представленные в области. Разработанный алгоритм классификации внедрен в созданный в рамках дипломного проекта Web-сайт. Данный Web-сайт позволяет осуществлять поиск по фильмам и кроме результатов поиска, предоставляет статистическую информацию о “позитивных”, “негативных” и “нейтральных” отзывах о найденных фильмах.ru_RU
dc.description.abstractWith the advent of Web 2.0, various platforms allow citizens to share their opinions on various topics, but not on all such platforms users can rate any product, which complicates the collection of statistical data for sentiment analysis. The sentiment analysis is aimed at determining the polarity of emotions, as well as highlighting opinions from texts. In this paper, the goal was to improve the quality of the sentiment analysis algorithms for their practical implementation. The tasks were: to consider possible approaches and algorithms for building models of classification of film reviews into three classes of emotionality: “negative”, “neutral”, “positive”; collect a set of movie reference data for model testing; compare various methods of text data processing and their influence on the classification model; develop a Website to search for a movie and consideration of reviews about it. Different approaches to the processing of textual data were considered. The data was provided by the Russian Information Retrieval Evaluation Seminar, and were collected from the portal Megacritic. Ways to process textual data were tested using a random forest classifier. It was possible to obtain results that improve other results presented in the field. The developed classification algorithm is implemented in the Web-site created within the framework of the graduation project. This website allows you to search for movies and, in addition to search results, provides statistical information about “positive”, “negative” and “neutral” feedback about the films found.en_GB
dc.language.isoru
dc.subjectанализ тональностиru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectслучайный лесru_RU
dc.subjectРОМИПru_RU
dc.subjectweb-сайтru_RU
dc.subjectsentiment analysisen_GB
dc.subjectmachine learningen_GB
dc.subjectrandom foresten_GB
dc.subjectROMIPen_GB
dc.subjectwebsiteen_GB
dc.titleSentiment analysis system for movie reviewen_GB
dc.title.alternativeРазработка системы анализа мнений отзывов о фильмахru_RU
Располагается в коллекциях:BACHELOR STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
Diplom.pdfArticle1,6 MBAdobe PDFПросмотреть/Открыть
reviewSV_otzyv.pdfReviewSV44,64 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.