Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/45873
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorАникеев Игнат Владимировичru_RU
dc.contributor.advisorAnikeev Ignat Vladimirovicen_GB
dc.contributor.authorХадчукаев Асвад Тимуровичru_RU
dc.contributor.authorHadcukaev Asvad Timurovicen_GB
dc.contributor.editorЛевшун Дмитрий Сергеевичru_RU
dc.contributor.editorLevsun Dmitrij Sergeevicen_GB
dc.date.accessioned2024-07-25T11:48:06Z-
dc.date.available2024-07-25T11:48:06Z-
dc.date.issued2024
dc.identifier.other068420en_GB
dc.identifier.urihttp://hdl.handle.net/11701/45873-
dc.description.abstractВ этой магистерской диссертации был разработан сервис бизнес-аналитики для текстовых отзывов для VK Predict. Сервис состоит из пяти основных модулей: пользовательский интерфейс с использованием чат-бота Telegram, хранение данных, основанное на SQLite3, анализ сентимента на основе нейронной сети BERT, кластеризация текстов с использованием UMAP и HDBSCAN, улучшенная с помощью больших языковых моделей (LLMs), и аналитический модуль для визуализации. Модель анализа сентимента достигла F1-score 0.80 с использованием подхода на основе BERT. Для кластеризации текстов индекс согласованности (ARI) был улучшен с 0.25 до 0.35 по сравнению с базовой моделью. Кроме того, потенциальная ежемесячная прибыль от внедрения оценивается в размере 4.5 миллионов рублей с использованием подписочной модели оплаты. Данное исследование демонстрирует потенциал сочетания современных методов машинного обучения с удобными интерфейсами и продвинутыми языковыми моделями для создания сервиса бизнес-аналитики текстовых отзывов, обеспечивая доступность и интерпретируемость для широко-го круга специалистов.ru_RU
dc.description.abstractIn this master's thesis, a business analytics service for text reviews for VK Predict was developed. The service consists of five main modules: a user interface via a Telegram chatbot, data storage using SQLite3, sentiment analysis with a BERT-based deep neural network, text clustering using UMAP and HDBSCAN enhanced by Large Language Models (LLMs), and an analytics module for visualization. The sentiment analysis model achieved an F1 score of 0.80 with a BERT-based approach. For text clustering, the Adjusted Rand Index (ARI) was improved from 0.25 to 0.35 compared to the baseline using state-of-the-art embed-ding models such as e5-base. Furthermore, the potential monthly profit was calculated to be up to 4.5 million rubles using a subscription-based approach. This research demonstrates the potential of combining modern machine learning techniques with user-friendly interfaces and advanced language models to create a robust service for business analytics of textual user feedback, ensuring accessibility and interpretability for non-technical users.en_GB
dc.language.isoru
dc.subjectБизнес-аналитикаru_RU
dc.subjectТекстовые отзывыru_RU
dc.subjectАнализ тональности текстаru_RU
dc.subjectBERTru_RU
dc.subjectКластеризация текстовru_RU
dc.subjectБольшие языковые моделиru_RU
dc.subjectВизуализацияru_RU
dc.subjectМашинное обучениеru_RU
dc.subjectВКru_RU
dc.subjectBusiness Analyticsen_GB
dc.subjectText Reviewsen_GB
dc.subjectSentiment Analysisen_GB
dc.subjectBERTen_GB
dc.subjectText Clusteringen_GB
dc.subjectLarge Language Modelsen_GB
dc.subjectLLMen_GB
dc.subjectVisualizationen_GB
dc.subjectMachine Learningen_GB
dc.subjectVKen_GB
dc.titleService for Business Analytics of Textual User Feedback Based on Machine Learningen_GB
dc.title.alternativeСервис бизнес-аналитики текстовых отзывов пользователей на основе машинного обученияru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
VKR_final.docxArticle4,45 MBMicrosoft Word XMLПросмотреть/Открыть
reviewSV_LevsunDS_otzyv_naucnogo_rukovoditela.pdfReviewSV220,41 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.