Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/42733
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorСмирнова Анна Николаевнаru_RU
dc.contributor.advisorSmirnova Anna Nikolaevnaen_GB
dc.contributor.authorЩукин Илья Вячеславовичru_RU
dc.contributor.authorSukin Ila Vaceslavovicen_GB
dc.contributor.editorМихайлова Елена Георгиевнаru_RU
dc.contributor.editorMihajlova Elena Georgievnaen_GB
dc.date.accessioned2023-07-26T12:44:44Z-
dc.date.available2023-07-26T12:44:44Z-
dc.date.issued2023
dc.identifier.other068314en_GB
dc.identifier.urihttp://hdl.handle.net/11701/42733-
dc.description.abstractОпределение семантических типов колонок в таблицах является важной задачей в области профилирования данных. На данный момент существующие решения не подходят для работы с данными, содержащими русския язык, а также отсутствует набор данных, который бы позволил обучить модель машинного обучения для решения этой задачи. В данной работе описаны: процесс подготовки данных, разработка модели машинного обучения, способной определять семантические типы колонок в русскоязычных табличных данных, а также процесс обучения и предложенные модификации.ru_RU
dc.description.abstractSemantic type detection for columnar data is an important task in the field of data profiling. Existing solutions are not suitable for data containing Russian language, and there is also a lack of datasets that allow training a machine learning model for this task. This work describes the process of data preparation, implementation of a machine learning model capable of determining semantic types of columns in tabular data, the training process, and proposed modifications.en_GB
dc.language.isoru
dc.subjectмашинное обучениеru_RU
dc.subjectпрофилирование данныхru_RU
dc.subjectглубокое обучениеru_RU
dc.subjectобработка естественного языкаru_RU
dc.subjectобогащение данныхru_RU
dc.subjectmachine learningen_GB
dc.subjectdata profilingen_GB
dc.subjectdeep learningen_GB
dc.subjectnatural language processingen_GB
dc.subjectdata enrichmenten_GB
dc.titleSemantic type detection in columnar data using machine learningen_GB
dc.title.alternativeОпределение семантического типа колонки в табличных данных с помощью методов машинного обученияru_RU
Располагается в коллекциях:BACHELOR STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
Shchukin_thesis.pdfArticle902,5 kBAdobe PDFПросмотреть/Открыть
reviewSV_st068314_Sukin_Ila_Vaceslavovic_(supervisor)(Ru).txtReviewSV3,82 kBTextПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.