Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/42733
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Смирнова Анна Николаевна | ru_RU |
dc.contributor.advisor | Smirnova Anna Nikolaevna | en_GB |
dc.contributor.author | Щукин Илья Вячеславович | ru_RU |
dc.contributor.author | Sukin Ila Vaceslavovic | en_GB |
dc.contributor.editor | Михайлова Елена Георгиевна | ru_RU |
dc.contributor.editor | Mihajlova Elena Georgievna | en_GB |
dc.date.accessioned | 2023-07-26T12:44:44Z | - |
dc.date.available | 2023-07-26T12:44:44Z | - |
dc.date.issued | 2023 | |
dc.identifier.other | 068314 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/42733 | - |
dc.description.abstract | Определение семантических типов колонок в таблицах является важной задачей в области профилирования данных. На данный момент существующие решения не подходят для работы с данными, содержащими русския язык, а также отсутствует набор данных, который бы позволил обучить модель машинного обучения для решения этой задачи. В данной работе описаны: процесс подготовки данных, разработка модели машинного обучения, способной определять семантические типы колонок в русскоязычных табличных данных, а также процесс обучения и предложенные модификации. | ru_RU |
dc.description.abstract | Semantic type detection for columnar data is an important task in the field of data profiling. Existing solutions are not suitable for data containing Russian language, and there is also a lack of datasets that allow training a machine learning model for this task. This work describes the process of data preparation, implementation of a machine learning model capable of determining semantic types of columns in tabular data, the training process, and proposed modifications. | en_GB |
dc.language.iso | ru | |
dc.subject | машинное обучение | ru_RU |
dc.subject | профилирование данных | ru_RU |
dc.subject | глубокое обучение | ru_RU |
dc.subject | обработка естественного языка | ru_RU |
dc.subject | обогащение данных | ru_RU |
dc.subject | machine learning | en_GB |
dc.subject | data profiling | en_GB |
dc.subject | deep learning | en_GB |
dc.subject | natural language processing | en_GB |
dc.subject | data enrichment | en_GB |
dc.title | Semantic type detection in columnar data using machine learning | en_GB |
dc.title.alternative | Определение семантического типа колонки в табличных данных с помощью методов машинного обучения | ru_RU |
Располагается в коллекциях: | BACHELOR STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Shchukin_thesis.pdf | Article | 902,5 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_st068314_Sukin_Ila_Vaceslavovic_(supervisor)(Ru).txt | ReviewSV | 3,82 kB | Text | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.