Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/26367
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Староверова Ксения Юрьевна | ru_RU |
dc.contributor.advisor | Staroverova Ksenia Urevna | en_GB |
dc.contributor.author | Халиуллина Лия Рауфовна | ru_RU |
dc.contributor.author | Haliullina Lia Raufovna | en_GB |
dc.contributor.editor | Буре Владимир Мансурович | ru_RU |
dc.contributor.editor | Bure Vladimir Mansurovic | en_GB |
dc.date.accessioned | 2021-03-24T15:24:59Z | - |
dc.date.available | 2021-03-24T15:24:59Z | - |
dc.date.issued | 2020 | |
dc.identifier.other | 040367 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/26367 | - |
dc.description.abstract | В настоящее время большой популярностью пользуются различные статистические методы обработки текста, в частности, вероятностное тематическое моделирование. В данной работе рассматриваются модели, использующиеся в задачах классификации коллекций документов. Выделена проблема отсутствия готовой качественной обучающей выборки для множественной классификации. Предложено решение в виде создания обучающей выборки путем нечеткой кластеризации. Описан алгоритм построения модели классификации коллекции документов с обучением на выборке, созданной в результате предложенного решения. | ru_RU |
dc.description.abstract | Currently, various statistical methods of text processing are very popular, especially, probabilistic topic modeling. In this paper, we consider the models used in the classification of document collection. The problem of the lack of a ready-made high-quality training sample for multiple classification is highlighted. A solution is proposed in the form of creating a training sample by soft clustering. An algorithm for constructing a classification model for a collection of documents with training on a sample created as a result of the proposed solution is described. | en_GB |
dc.language.iso | ru | |
dc.subject | Классификация | ru_RU |
dc.subject | вероятностная тематическая модель | ru_RU |
dc.subject | нечеткая кластеризация | ru_RU |
dc.subject | LDA | ru_RU |
dc.subject | ARTM | ru_RU |
dc.subject | регуляризаторы | ru_RU |
dc.subject | Classification | en_GB |
dc.subject | probabilistic topic model | en_GB |
dc.subject | soft clustering | en_GB |
dc.subject | LDA | en_GB |
dc.subject | ARTM | en_GB |
dc.subject | regularizers | en_GB |
dc.title | Probabilistic modeling in document classification | en_GB |
dc.title.alternative | Вероятностное моделирование в классификации коллекции документов | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Khaliullina_Liya.pdf | Article | 1,07 MB | Adobe PDF | Просмотреть/Открыть |
reviewSV_Recenzia_na_VKR_Lii_Haliullinoj.pdf | ReviewSV | 221,2 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.