Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/42281
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Шишов Илья Сергеевич | ru_RU |
dc.contributor.advisor | Sisov Ila Sergeevic | en_GB |
dc.contributor.author | Терова Валерия Евгеньевна | ru_RU |
dc.contributor.author | Terova Valeria Evgenevna | en_GB |
dc.contributor.editor | Авдюшенко Александр Юрьевич | ru_RU |
dc.contributor.editor | Avdusenko Aleksandr Urevic | en_GB |
dc.date.accessioned | 2023-07-26T12:03:28Z | - |
dc.date.available | 2023-07-26T12:03:28Z | - |
dc.date.issued | 2023 | |
dc.identifier.other | 080496 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/42281 | - |
dc.description.abstract | В данной работе рассмотрены задачи, связанные с обработкой большого графа знаний об организациях. В рамках первой задачи был разработан подход к обогащению сущностей атрибутами и связыванию информации о бизнесах из разных источников между собой. Для этого использовался подход компонент связности графа, которые обрабатывались независимо на разных узлах кластера. Во второй задаче была рассмотрена проблема автоматического подтверждения или отвержения гипотез о связи новых клиентов с контрагентами. Была поставлена задача бинарной классификации, рассмотрены различные модели и произведена оценка качества лучшей из них. В третьей задаче был рассмотрен вопрос выделения нетривиальных под-кластеров внутри компонент связности графа, для решения которого был использован метод вложения графов в многомерное векторное пространство, а также алгоритм кластеризации DBSCAN. | ru_RU |
dc.description.abstract | In this paper, we consider the tasks associated with the processing of a large graph of knowledge about organizations. As part of the first task, an approach was developed for enriching entities with attributes and linking information about businesses from different sources to each other. For this, the approach of graph connectivity components was used, which were processed independently at different nodes of the cluster. In the second task, the problem of automatic confirmation or rejection of hypotheses about the relationship of new customers with counterparties was considered. The task of binary classification was set, various models were considered and the quality of the best of them was assessed. In the third problem, the issue of identifying non-trivial sub-clusters within the connected components of a graph was considered, for which the method of embedding graphs in a multidimensional vector space was used, as well as the DBSCAN clustering algorithm. | en_GB |
dc.language.iso | ru | |
dc.subject | распознавание сущностей | ru_RU |
dc.subject | графы знаний | ru_RU |
dc.subject | entity resolution | en_GB |
dc.subject | knowledge graphs | en_GB |
dc.title | Entity resolution for knowledge graph of business entities | en_GB |
dc.title.alternative | Распознавание сущностей на графе знаний об организациях | ru_RU |
Располагается в коллекциях: | BACHELOR STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
st080496.pdf | Article | 3,67 MB | Adobe PDF | Просмотреть/Открыть |
reviewSV_Otzyv_naucnogo_rukovoditela_Terova_podpisannyj.pdf | ReviewSV | 113 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_st080496_Terova_Valeria_Evgenevna_(supervisor)(Ru).txt | ReviewSV | 6,33 kB | Text | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.