Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/46082
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Хамраева Шахло Мирджоновна | ru_RU |
dc.contributor.advisor | Hamraeva Sahlo Mirdzonovna | en_GB |
dc.contributor.author | Кортегосо Виссио Николас | ru_RU |
dc.contributor.author | Kortegoso Vissio Nikolas | en_GB |
dc.contributor.editor | Хохлова Мария Владимировна | ru_RU |
dc.contributor.editor | Hohlova Maria Vladimirovna | en_GB |
dc.date.accessioned | 2024-07-25T11:48:45Z | - |
dc.date.available | 2024-07-25T11:48:45Z | - |
dc.date.issued | 2024 | |
dc.identifier.other | 082534 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/46082 | - |
dc.description.abstract | Цель работы заключается в разработке морфологического анализатора для современного якутского языка, способного обрабатывать неизвестные слова и устранять неоднозначность в результатах анализа в контексте предложения. Якутский язык относится к агглютинативным языкам, которые образуют огромное количество словоформ от одного корня путем добавления множества суффиксов. Обширное разнообразие словоформ приводит к недостаточному представлению каждой формы даже в крупных корпусах, что затрудняет статистическую обработку языка. Для решения проблемы в работе было предложено разработать морфологический анализатор, основанный на правилах, для эффективного анализа разнообразных форм слов и обучения модели на морфологически размеченных данных с целью разрешения возникающей неоднозначности в их морфологической обработке. В ходе разработки анализатора были учтены особенности агглютинативной структуры якутского языка и способы их реализации в программном обеспечении. | ru_RU |
dc.description.abstract | The aim of this work is to develop a morphological analyzer for the modern Yakut language capable of handling unknown words and resolving ambiguity in analysis results within sentence contexts. Agglutinative languages, like Yakut, generate a wide range of word forms from a single root by adding numerous suffixes. The extensive variety of word forms leads to inadequate representation of each form even in sizable corpora, which hampers efforts in statistical language processing. To tackle this challenge, the proposal is to design a rule-based morphological analyzer for efficient analysis of diverse word forms and to train a model on morphologically annotated data to resolve ambiguity in their morphological processing. During the development of the analyzer, considerations were given to the peculiarities of the agglutinative structure of the Yakut language and methods for their implementation in the software. | en_GB |
dc.language.iso | ru | |
dc.subject | морфологический анализ | ru_RU |
dc.subject | основанный на правилах | ru_RU |
dc.subject | якутский язык | ru_RU |
dc.subject | разрешение морфологической неоднозначности | ru_RU |
dc.subject | morphological analysis | en_GB |
dc.subject | rule-based | en_GB |
dc.subject | Yakut language | en_GB |
dc.subject | morphological disambiguation | en_GB |
dc.title | Linguistic Foundations for the Construction of a Morphological Analyzer for Contemporary Yakut Language | en_GB |
dc.title.alternative | Лингвистические основы разработки морфологического анализатора для современного якутского языка | ru_RU |
Располагается в коллекциях: | DOCTORAL STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
kortegoso_vissio_naucnyj_doklad.odt | Article | 272,24 kB | OpenDocument Text | Просмотреть/Открыть |
reviewSV_Otzyv_NR_Kortegoso_Vissio.docx | ReviewSV | 24,57 kB | Microsoft Word XML | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.