Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/26499
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorДавыденко Александр Александровичru_RU
dc.contributor.advisorDavydenko Aleksandr Aleksandrovicen_GB
dc.contributor.authorШепелев Павел Леонидовичru_RU
dc.contributor.authorSepelev Pavel Leonidovicen_GB
dc.contributor.editorБлеканов Иван Станиславовичru_RU
dc.contributor.editorBlekanov Ivan Stanislavovicen_GB
dc.date.accessioned2021-03-24T15:50:59Z-
dc.date.available2021-03-24T15:50:59Z-
dc.date.issued2020
dc.identifier.other054714en_GB
dc.identifier.urihttp://hdl.handle.net/11701/26499-
dc.description.abstractРабота посвящена исследованию существующих методов анализа тональности русскоязычных текстов. Для исследования был собран корпус русскоязычных отзывов на рестораны. Каждый отзыв должен быть классифицирован как объект одного из трех классов: положительный, отрицательный или нейтральный. Рассмотрены различные способы предобработки текстов. В качестве признаков рассматривались различные комбинации n-грамм. Реализованы следующие алгоритмы машинного обучения: наивный байесовский классификатор, логистическая регрессия, AdaBoost классификатор, метод стохастического градиента и метод опорных векторов. Для решения проблемы несбалансированных классов данных использовался алгоритм SMOTE. После проверки на кросс-валидации лучшее качество классификации показал алгоритм логистическая регрессия. Качество классификации было улучшено с помощью добавления n-грамм и применения алгоритма SMOTE к обучающему множеству.ru_RU
dc.description.abstractThe work is devoted to the study of existing methods of sentiment analysis of Russian-language texts. For the study, a corpus of Russian-language restaurant reviews was collected. Each review should be classified as an object of one of three classes: positive, negative or neutral. Various ways of text preprocessing were considered. Various combinations of n-grams were considered as features. The following machine learning algorithms were implemented: naive bayes classifier, logistic regression, AdaBoost classifier, stochastic gradient method and support vector machine. To solve the problem of unbalanced data classes, SMOTE algorithm was used. After cross-validation, the best quality classification was shown by the logistic regression algorithm. Classification quality was improved by adding n-grams and applying SMOTE algorithm to the training set.en_GB
dc.language.isoru
dc.subjectанализ тональностиru_RU
dc.subjectсентимент анализru_RU
dc.subjectанализ мненийru_RU
dc.subjectтональность отзывовru_RU
dc.subjectотзывы пользователейru_RU
dc.subjectобработка текстаru_RU
dc.subjectобработка естественного языкаru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectsentiment analysisen_GB
dc.subjectopinion miningen_GB
dc.subjectsentiment of reviewsen_GB
dc.subjectcustomer reviewsen_GB
dc.subjecttext processingen_GB
dc.subjectnatural language processingen_GB
dc.subjectmachine learningen_GB
dc.titleSentiment analysis methods of restaurant customer reviewsen_GB
dc.title.alternativeМетоды анализа тональности отзывов пользователей ресторановru_RU
Располагается в коллекциях:BACHELOR STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
st054714.pdfArticle463,68 kBAdobe PDFПросмотреть/Открыть
reviewSV_Otzyv_Sepelev.pdfReviewSV83,22 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.