Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/26367
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorСтароверова Ксения Юрьевнаru_RU
dc.contributor.advisorStaroverova Ksenia Urevnaen_GB
dc.contributor.authorХалиуллина Лия Рауфовнаru_RU
dc.contributor.authorHaliullina Lia Raufovnaen_GB
dc.contributor.editorБуре Владимир Мансуровичru_RU
dc.contributor.editorBure Vladimir Mansurovicen_GB
dc.date.accessioned2021-03-24T15:24:59Z-
dc.date.available2021-03-24T15:24:59Z-
dc.date.issued2020
dc.identifier.other040367en_GB
dc.identifier.urihttp://hdl.handle.net/11701/26367-
dc.description.abstractВ настоящее время большой популярностью пользуются различные статистические методы обработки текста, в частности, вероятностное тематическое моделирование. В данной работе рассматриваются модели, использующиеся в задачах классификации коллекций документов. Выделена проблема отсутствия готовой качественной обучающей выборки для множественной классификации. Предложено решение в виде создания обучающей выборки путем нечеткой кластеризации. Описан алгоритм построения модели классификации коллекции документов с обучением на выборке, созданной в результате предложенного решения.ru_RU
dc.description.abstractCurrently, various statistical methods of text processing are very popular, especially, probabilistic topic modeling. In this paper, we consider the models used in the classification of document collection. The problem of the lack of a ready-made high-quality training sample for multiple classification is highlighted. A solution is proposed in the form of creating a training sample by soft clustering. An algorithm for constructing a classification model for a collection of documents with training on a sample created as a result of the proposed solution is described.en_GB
dc.language.isoru
dc.subjectКлассификацияru_RU
dc.subjectвероятностная тематическая модельru_RU
dc.subjectнечеткая кластеризацияru_RU
dc.subjectLDAru_RU
dc.subjectARTMru_RU
dc.subjectрегуляризаторыru_RU
dc.subjectClassificationen_GB
dc.subjectprobabilistic topic modelen_GB
dc.subjectsoft clusteringen_GB
dc.subjectLDAen_GB
dc.subjectARTMen_GB
dc.subjectregularizersen_GB
dc.titleProbabilistic modeling in document classificationen_GB
dc.title.alternativeВероятностное моделирование в классификации коллекции документовru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
Khaliullina_Liya.pdfArticle1,07 MBAdobe PDFПросмотреть/Открыть
reviewSV_Recenzia_na_VKR_Lii_Haliullinoj.pdfReviewSV221,2 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.