Linguistic Foundations for the Construction of a Morphological Analyzer for Contemporary Yakut Language

Кортегосо Виссио Николас; Kortegoso Vissio Nikolas

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/46082

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Хамраева Шахло Мирджоновна	ru_RU
dc.contributor.advisor	Hamraeva Sahlo Mirdzonovna	en_GB
dc.contributor.author	Кортегосо Виссио Николас	ru_RU
dc.contributor.author	Kortegoso Vissio Nikolas	en_GB
dc.contributor.editor	Хохлова Мария Владимировна	ru_RU
dc.contributor.editor	Hohlova Maria Vladimirovna	en_GB
dc.date.accessioned	2024-07-25T11:48:45Z	-
dc.date.available	2024-07-25T11:48:45Z	-
dc.date.issued	2024
dc.identifier.other	082534	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/46082	-
dc.description.abstract	Цель работы заключается в разработке морфологического анализатора для современного якутского языка, способного обрабатывать неизвестные слова и устранять неоднозначность в результатах анализа в контексте предложения. Якутский язык относится к агглютинативным языкам, которые образуют огромное количество словоформ от одного корня путем добавления множества суффиксов. Обширное разнообразие словоформ приводит к недостаточному представлению каждой формы даже в крупных корпусах, что затрудняет статистическую обработку языка. Для решения проблемы в работе было предложено разработать морфологический анализатор, основанный на правилах, для эффективного анализа разнообразных форм слов и обучения модели на морфологически размеченных данных с целью разрешения возникающей неоднозначности в их морфологической обработке. В ходе разработки анализатора были учтены особенности агглютинативной структуры якутского языка и способы их реализации в программном обеспечении.	ru_RU
dc.description.abstract	The aim of this work is to develop a morphological analyzer for the modern Yakut language capable of handling unknown words and resolving ambiguity in analysis results within sentence contexts. Agglutinative languages, like Yakut, generate a wide range of word forms from a single root by adding numerous suffixes. The extensive variety of word forms leads to inadequate representation of each form even in sizable corpora, which hampers efforts in statistical language processing. To tackle this challenge, the proposal is to design a rule-based morphological analyzer for efficient analysis of diverse word forms and to train a model on morphologically annotated data to resolve ambiguity in their morphological processing. During the development of the analyzer, considerations were given to the peculiarities of the agglutinative structure of the Yakut language and methods for their implementation in the software.	en_GB
dc.language.iso	ru
dc.subject	морфологический анализ	ru_RU
dc.subject	основанный на правилах	ru_RU
dc.subject	якутский язык	ru_RU
dc.subject	разрешение морфологической неоднозначности	ru_RU
dc.subject	morphological analysis	en_GB
dc.subject	rule-based	en_GB
dc.subject	Yakut language	en_GB
dc.subject	morphological disambiguation	en_GB
dc.title	Linguistic Foundations for the Construction of a Morphological Analyzer for Contemporary Yakut Language	en_GB
dc.title.alternative	Лингвистические основы разработки морфологического анализатора для современного якутского языка	ru_RU
Располагается в коллекциях:	DOCTORAL STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
kortegoso_vissio_naucnyj_doklad.odt	Article	272,24 kB	OpenDocument Text	Просмотреть/Открыть
reviewSV_Otzyv_NR_Kortegoso_Vissio.docx	ReviewSV	24,57 kB	Microsoft Word XML	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета