Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/13590
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Котов Александр Валерьевич | ru_RU |
dc.contributor.author | Калина Алексей Игоревич | ru_RU |
dc.contributor.author | Kalina Aleksei | en_GB |
dc.contributor.editor | Новиков Борис Асенович | ru_RU |
dc.contributor.editor | Novikov Boris Аsenovich | en_GB |
dc.date.accessioned | 2018-07-26T15:26:23Z | - |
dc.date.available | 2018-07-26T15:26:23Z | - |
dc.date.issued | 2018 | |
dc.identifier.other | 040014 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/13590 | - |
dc.description.abstract | Оценка качества данных является важной задачей при работе с большими объемами информации. В последние годы количество задач, связанных с использованием слабоструктурированных данных постоянно растет. Обработка таких данных представляет собой большую сложность, нежели данных, представленных в структурированном виде. Поэтому и так нетривиальная задача оценки качества данных становится еще более трудной. В этой работе предлагается подход к оценке качества данных, основанный на сопоставлении нескольких независимых источников. Метод позволяет оценивать качество с использованием различных критериев и метрик, учитывая типы данных и цели проводимой процедуры. Проведенные эксперименты демонстрируют высокую стабильность результатов применения метода. | ru_RU |
dc.description.abstract | Data quality assessment is an important activity when working with large volumes of information. In recent years, the number of tasks associated with the use of semistructured data is constantly growing. The processing of such data presents a greater complexity than the data presented in a structured form. Therefore, the nontrivial task of quality assessment becomes even more difficult. This paper proposes an approach to assess data quality, based on a matching of two independent sources. The method allows evaluating the quality using various dimensions and metrics, taking into account the types of data and the purpose of the procedure. The results of the experiments demonstrate the high stability of the method. | en_GB |
dc.language.iso | ru | |
dc.subject | качество данных | ru_RU |
dc.subject | сопоставление источников | ru_RU |
dc.subject | слабоструктурированные данные | ru_RU |
dc.subject | data quality | en_GB |
dc.subject | sources matching | en_GB |
dc.subject | semi-structured data | en_GB |
dc.title | Quality assessment of semi-structured data in matching of independent sources | en_GB |
dc.title.alternative | Оценка качества слабоструктурированных данных при сопоставлении независимых источников | ru_RU |
Располагается в коллекциях: | BACHELOR STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
441-Kalina-report.pdf | Article | 212,83 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_2018-1-k.pdf | ReviewSV | 375,92 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_recenziya.pdf | ReviewRev | 187,65 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_st003579_Novikov_Boris_Asenovich_(supervisor)(Ru).txt | ReviewSV | 3,33 kB | Text | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.