Probabilistic modeling in document classification

Халиуллина Лия Рауфовна; Haliullina Lia Raufovna

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/26367

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Староверова Ксения Юрьевна	ru_RU
dc.contributor.advisor	Staroverova Ksenia Urevna	en_GB
dc.contributor.author	Халиуллина Лия Рауфовна	ru_RU
dc.contributor.author	Haliullina Lia Raufovna	en_GB
dc.contributor.editor	Буре Владимир Мансурович	ru_RU
dc.contributor.editor	Bure Vladimir Mansurovic	en_GB
dc.date.accessioned	2021-03-24T15:24:59Z	-
dc.date.available	2021-03-24T15:24:59Z	-
dc.date.issued	2020
dc.identifier.other	040367	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/26367	-
dc.description.abstract	В настоящее время большой популярностью пользуются различные статистические методы обработки текста, в частности, вероятностное тематическое моделирование. В данной работе рассматриваются модели, использующиеся в задачах классификации коллекций документов. Выделена проблема отсутствия готовой качественной обучающей выборки для множественной классификации. Предложено решение в виде создания обучающей выборки путем нечеткой кластеризации. Описан алгоритм построения модели классификации коллекции документов с обучением на выборке, созданной в результате предложенного решения.	ru_RU
dc.description.abstract	Currently, various statistical methods of text processing are very popular, especially, probabilistic topic modeling. In this paper, we consider the models used in the classification of document collection. The problem of the lack of a ready-made high-quality training sample for multiple classification is highlighted. A solution is proposed in the form of creating a training sample by soft clustering. An algorithm for constructing a classification model for a collection of documents with training on a sample created as a result of the proposed solution is described.	en_GB
dc.language.iso	ru
dc.subject	Классификация	ru_RU
dc.subject	вероятностная тематическая модель	ru_RU
dc.subject	нечеткая кластеризация	ru_RU
dc.subject	LDA	ru_RU
dc.subject	ARTM	ru_RU
dc.subject	регуляризаторы	ru_RU
dc.subject	Classification	en_GB
dc.subject	probabilistic topic model	en_GB
dc.subject	soft clustering	en_GB
dc.subject	LDA	en_GB
dc.subject	ARTM	en_GB
dc.subject	regularizers	en_GB
dc.title	Probabilistic modeling in document classification	en_GB
dc.title.alternative	Вероятностное моделирование в классификации коллекции документов	ru_RU
Располагается в коллекциях:	MASTER'S STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
Khaliullina_Liya.pdf	Article	1,07 MB	Adobe PDF	Просмотреть/Открыть
reviewSV_Recenzia_na_VKR_Lii_Haliullinoj.pdf	ReviewSV	221,2 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета