Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/3976
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorДобрынин Владимир Юрьевичru_RU
dc.contributor.authorГорбатюк Анна Витальевнаru_RU
dc.contributor.authorGorbatiuk Annaen_GB
dc.contributor.editorкандидат физико-математических наук, доцент В.Ю. Добрынинru_RU
dc.contributor.editorCandidate of Physics and Mathematics, Associate Professor V.Iu. Dobryninen_GB
dc.date.accessioned2016-10-10T02:11:12Z-
dc.date.available2016-10-10T02:11:12Z-
dc.date.issued2016
dc.identifier.other010215en_GB
dc.identifier.urihttp://hdl.handle.net/11701/3976-
dc.description.abstractВ данной работе рассматривается применение алгоритма контекстной документной кластеризации для кластеризации ссылок и пользователей, которые посетили эти ссылки. В отличие от классического применения алгоритма для документов, в которых слова имеют определенный смысл, в данной работе будут рассматриваться документы, словами в которых будут идентификационные номера пользователей или ссылки, а значит контент страниц использоваться не будет. Подход основан на поиске узких контекстов, которые являются основой для создания кластеров. Вычисляя расстояние Йенсена-Шеннона можно определить принадлежность документа к кластеру. Такого рода кластеризация может быть полезной в задачах информационного поиска, связанных с анализом и поиском данных, web-рекламой.ru_RU
dc.description.abstractIn this work we consider contextual document clustering algorithm used for clustering of links and users who visited this links. In contrast to the classical application of the algorithm for documents, which contain words with certain meaning, in this work we consider documents, which contain unique identification numbers of users or links as words. It means that we do not use content of pages. This approach is based on searching of narrow contexts, which are bases for clusters. Calculating Jensen-Shannon divergence we can determine the identity of document for cluster. This clustering can be useful in such tasks of information retrieval as search and analysis of data and web-advertising tasks.en_GB
dc.language.isoru
dc.subjectКластеризацияru_RU
dc.subjectконтекстru_RU
dc.subjectдокументru_RU
dc.subjectсловоru_RU
dc.subjectаттракторru_RU
dc.subjectкластерru_RU
dc.subjectраспределениеru_RU
dc.subjectвероятностьru_RU
dc.subjectClusteringen_GB
dc.subjectcontexten_GB
dc.subjectdocumenten_GB
dc.subjectworden_GB
dc.subjectattractoren_GB
dc.subjectclusteren_GB
dc.subjectdistributionen_GB
dc.subjectprobabilityen_GB
dc.titleUsing contextual document clustering algorithm for clustering pages and users without using page contenten_GB
dc.title.alternativeИспользование алгоритма контекстной кластеризации документов для кластеризации страниц и посещающих их пользователей без использования контента страницru_RU
Располагается в коллекциях:BACHELOR STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.