Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/11643
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorЕфремова Мария Игоревнаru_RU
dc.contributor.authorЧернобай Юлия Владимировнаru_RU
dc.contributor.authorChernobai Iuliiaen_GB
dc.contributor.editorДобрынин Владимир Юрьевичru_RU
dc.contributor.editorDobrynin Vladimir Iurevichen_GB
dc.date.accessioned2018-07-25T20:34:49Z-
dc.date.available2018-07-25T20:34:49Z-
dc.date.issued2017
dc.identifier.other016362en_GB
dc.identifier.urihttp://hdl.handle.net/11701/11643-
dc.description.abstractРабота посвящена разработке рекомендательной системы методом фильтрации на основе содержания, которая позволяет автоматически извлекать интересы пользователя из написанных им текстов и составлять список рекомендаций документов с учетом анализа временных интересов и их семантической близости. В работе использовались данные с сайта livejournal.com, включавшие 87597 пользователей с 2042011 постами и 522243 уникальными ключевыми словами к ним. В ходе выполнения работы были изучены и построены политематические классификаторы Label Powerset, Classifier Chains и ML-knn, проведено сравнение и выбран наилучший, определены лучшие базисные классификаторы для методов Label Powerset и Classifier Chains, разработан и применен алгоритм выделения временных интересов, собран набор данных и подобраны параметры для обучения модели word2vec. Был разработан алгоритм построения рекомендательной системы, и проведено тестирование на 5000 пользователях, и с помощью парного t-теста Стьюдента статистически доказано улучшение качества рекомендаций при использовании информации о временных свойствах интересов и семантической близости между ними.ru_RU
dc.description.abstractThis paper presents a method of development of recommender system using content-based filtering that allows automatically determine user’s interests and creates recommendation list of documents based on temporary interests and their semantic similarity. Research was conducted using a dataset from the livejournal.com website that included 87597 users with 2042011 posts and 522243 unique keywords. During the work following multi-label classifiers were built and compared: Label Powerset, Classifier Chains and ML-knn, and the best one was chosen. Also best basic classifiers for Label Powerset and Classifier Chains classifiers were determined, and an algorithm for temporary interests extraction was created and described. A dataset was constructed and parameters were found for training word2vec model. An algorithm of building a recommender system was created and described and a paired t-test on 5000 users was conducted to prove the increasing of recommendation quality while using the information of temporary interests and their semantic similarity.en_GB
dc.language.isoru
dc.subjectрекомендательная системаru_RU
dc.subjectфильтрация на основе содержанияru_RU
dc.subjectполитематическая классификация текстаru_RU
dc.subjectrecommender systemen_GB
dc.subjectcontent-based filteringen_GB
dc.subjectmulti-label text classificationen_GB
dc.titleDevelopment of recommendation system based on extraction and analysis of custom interestsen_GB
dc.title.alternativeРазработка рекомендательной системы на основе извлечения и анализа интересов пользователейru_RU
Располагается в коллекциях:MASTER'S STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.