Entity resolution for knowledge graph of business entities

Терова Валерия Евгеньевна; Terova Valeria Evgenevna

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/42281

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Шишов Илья Сергеевич	ru_RU
dc.contributor.advisor	Sisov Ila Sergeevic	en_GB
dc.contributor.author	Терова Валерия Евгеньевна	ru_RU
dc.contributor.author	Terova Valeria Evgenevna	en_GB
dc.contributor.editor	Авдюшенко Александр Юрьевич	ru_RU
dc.contributor.editor	Avdusenko Aleksandr Urevic	en_GB
dc.date.accessioned	2023-07-26T12:03:28Z	-
dc.date.available	2023-07-26T12:03:28Z	-
dc.date.issued	2023
dc.identifier.other	080496	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/42281	-
dc.description.abstract	В данной работе рассмотрены задачи, связанные с обработкой большого графа знаний об организациях. В рамках первой задачи был разработан подход к обогащению сущностей атрибутами и связыванию информации о бизнесах из разных источников между собой. Для этого использовался подход компонент связности графа, которые обрабатывались независимо на разных узлах кластера. Во второй задаче была рассмотрена проблема автоматического подтверждения или отвержения гипотез о связи новых клиентов с контрагентами. Была поставлена задача бинарной классификации, рассмотрены различные модели и произведена оценка качества лучшей из них. В третьей задаче был рассмотрен вопрос выделения нетривиальных под-кластеров внутри компонент связности графа, для решения которого был использован метод вложения графов в многомерное векторное пространство, а также алгоритм кластеризации DBSCAN.	ru_RU
dc.description.abstract	In this paper, we consider the tasks associated with the processing of a large graph of knowledge about organizations. As part of the first task, an approach was developed for enriching entities with attributes and linking information about businesses from different sources to each other. For this, the approach of graph connectivity components was used, which were processed independently at different nodes of the cluster. In the second task, the problem of automatic confirmation or rejection of hypotheses about the relationship of new customers with counterparties was considered. The task of binary classification was set, various models were considered and the quality of the best of them was assessed. In the third problem, the issue of identifying non-trivial sub-clusters within the connected components of a graph was considered, for which the method of embedding graphs in a multidimensional vector space was used, as well as the DBSCAN clustering algorithm.	en_GB
dc.language.iso	ru
dc.subject	распознавание сущностей	ru_RU
dc.subject	графы знаний	ru_RU
dc.subject	entity resolution	en_GB
dc.subject	knowledge graphs	en_GB
dc.title	Entity resolution for knowledge graph of business entities	en_GB
dc.title.alternative	Распознавание сущностей на графе знаний об организациях	ru_RU
Располагается в коллекциях:	BACHELOR STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
st080496.pdf	Article	3,67 MB	Adobe PDF	Просмотреть/Открыть
reviewSV_Otzyv_naucnogo_rukovoditela_Terova_podpisannyj.pdf	ReviewSV	113 kB	Adobe PDF	Просмотреть/Открыть
reviewSV_st080496_Terova_Valeria_Evgenevna_(supervisor)(Ru).txt	ReviewSV	6,33 kB	Text	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета