Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/13590
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorКотов Александр Валерьевичru_RU
dc.contributor.authorКалина Алексей Игоревичru_RU
dc.contributor.authorKalina Alekseien_GB
dc.contributor.editorНовиков Борис Асеновичru_RU
dc.contributor.editorNovikov Boris Аsenovichen_GB
dc.date.accessioned2018-07-26T15:26:23Z-
dc.date.available2018-07-26T15:26:23Z-
dc.date.issued2018
dc.identifier.other040014en_GB
dc.identifier.urihttp://hdl.handle.net/11701/13590-
dc.description.abstractОценка качества данных является важной задачей при работе с большими объемами информации. В последние годы количество задач, связанных с использованием слабоструктурированных данных постоянно растет. Обработка таких данных представляет собой большую сложность, нежели данных, представленных в структурированном виде. Поэтому и так нетривиальная задача оценки качества данных становится еще более трудной. В этой работе предлагается подход к оценке качества данных, основанный на сопоставлении нескольких независимых источников. Метод позволяет оценивать качество с использованием различных критериев и метрик, учитывая типы данных и цели проводимой процедуры. Проведенные эксперименты демонстрируют высокую стабильность результатов применения метода.ru_RU
dc.description.abstractData quality assessment is an important activity when working with large volumes of information. In recent years, the number of tasks associated with the use of semistructured data is constantly growing. The processing of such data presents a greater complexity than the data presented in a structured form. Therefore, the nontrivial task of quality assessment becomes even more difficult. This paper proposes an approach to assess data quality, based on a matching of two independent sources. The method allows evaluating the quality using various dimensions and metrics, taking into account the types of data and the purpose of the procedure. The results of the experiments demonstrate the high stability of the method.en_GB
dc.language.isoru
dc.subjectкачество данныхru_RU
dc.subjectсопоставление источниковru_RU
dc.subjectслабоструктурированные данныеru_RU
dc.subjectdata qualityen_GB
dc.subjectsources matchingen_GB
dc.subjectsemi-structured dataen_GB
dc.titleQuality assessment of semi-structured data in matching of independent sourcesen_GB
dc.title.alternativeОценка качества слабоструктурированных данных при сопоставлении независимых источниковru_RU
Располагается в коллекциях:BACHELOR STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
441-Kalina-report.pdfArticle212,83 kBAdobe PDFПросмотреть/Открыть
reviewSV_2018-1-k.pdfReviewSV375,92 kBAdobe PDFПросмотреть/Открыть
reviewSV_recenziya.pdfReviewRev187,65 kBAdobe PDFПросмотреть/Открыть
reviewSV_st003579_Novikov_Boris_Asenovich_(supervisor)(Ru).txtReviewSV3,33 kBTextПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.