Development of recommendation system based on extraction and analysis of custom interests

Чернобай Юлия Владимировна; Chernobai Iuliia

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/11643

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Ефремова Мария Игоревна	ru_RU
dc.contributor.author	Чернобай Юлия Владимировна	ru_RU
dc.contributor.author	Chernobai Iuliia	en_GB
dc.contributor.editor	Добрынин Владимир Юрьевич	ru_RU
dc.contributor.editor	Dobrynin Vladimir Iurevich	en_GB
dc.date.accessioned	2018-07-25T20:34:49Z	-
dc.date.available	2018-07-25T20:34:49Z	-
dc.date.issued	2017
dc.identifier.other	016362	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/11643	-
dc.description.abstract	Работа посвящена разработке рекомендательной системы методом фильтрации на основе содержания, которая позволяет автоматически извлекать интересы пользователя из написанных им текстов и составлять список рекомендаций документов с учетом анализа временных интересов и их семантической близости. В работе использовались данные с сайта livejournal.com, включавшие 87597 пользователей с 2042011 постами и 522243 уникальными ключевыми словами к ним. В ходе выполнения работы были изучены и построены политематические классификаторы Label Powerset, Classifier Chains и ML-knn, проведено сравнение и выбран наилучший, определены лучшие базисные классификаторы для методов Label Powerset и Classifier Chains, разработан и применен алгоритм выделения временных интересов, собран набор данных и подобраны параметры для обучения модели word2vec. Был разработан алгоритм построения рекомендательной системы, и проведено тестирование на 5000 пользователях, и с помощью парного t-теста Стьюдента статистически доказано улучшение качества рекомендаций при использовании информации о временных свойствах интересов и семантической близости между ними.	ru_RU
dc.description.abstract	This paper presents a method of development of recommender system using content-based filtering that allows automatically determine user’s interests and creates recommendation list of documents based on temporary interests and their semantic similarity. Research was conducted using a dataset from the livejournal.com website that included 87597 users with 2042011 posts and 522243 unique keywords. During the work following multi-label classifiers were built and compared: Label Powerset, Classifier Chains and ML-knn, and the best one was chosen. Also best basic classifiers for Label Powerset and Classifier Chains classifiers were determined, and an algorithm for temporary interests extraction was created and described. A dataset was constructed and parameters were found for training word2vec model. An algorithm of building a recommender system was created and described and a paired t-test on 5000 users was conducted to prove the increasing of recommendation quality while using the information of temporary interests and their semantic similarity.	en_GB
dc.language.iso	ru
dc.subject	рекомендательная система	ru_RU
dc.subject	фильтрация на основе содержания	ru_RU
dc.subject	политематическая классификация текста	ru_RU
dc.subject	recommender system	en_GB
dc.subject	content-based filtering	en_GB
dc.subject	multi-label text classification	en_GB
dc.title	Development of recommendation system based on extraction and analysis of custom interests	en_GB
dc.title.alternative	Разработка рекомендательной системы на основе извлечения и анализа интересов пользователей	ru_RU
Располагается в коллекциях:	MASTER'S STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
diplom_chernobay.pdf	Article	2,04 MB	Adobe PDF	Просмотреть/Открыть
reviewSV_CHernobaj_YU_V__mag_rec_1.jpg	ReviewRev	605,62 kB	JPEG	Просмотреть/Открыть
reviewSV_CHernobaj_YU_V__mag_rec_2.jpg	ReviewRev	605,5 kB	JPEG	Просмотреть/Открыть
reviewSV_st006729_Dobrynin_Vladimir_YUrevich_(supervisor)(Ru).txt	ReviewSV	4,02 kB	Text	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета