Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/31389
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Von Waldenfels Ruprecht | ru_RU |
dc.contributor.advisor | Von Waldenfels Ruprecht | en_GB |
dc.contributor.author | Кортегосо Виссио Николас | ru_RU |
dc.contributor.author | Kortegoso Vissio Nikolas | en_GB |
dc.contributor.editor | Захаров Виктор Павлович | ru_RU |
dc.contributor.editor | Zaharov Viktor Pavlovic | en_GB |
dc.date.accessioned | 2021-07-31T19:27:53Z | - |
dc.date.available | 2021-07-31T19:27:53Z | - |
dc.date.issued | 2021 | |
dc.identifier.other | 082534 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/31389 | - |
dc.description.abstract | В данной работе исследуются общие морфологические и синтаксические черты современного суринамского языка (сранан-тонго). Целью исследования является разработка автоматической частеречной разметки (POS-теггера) для этого языка с использованием небольшого лексикона и минимальных обучающих данных. В работе рассмотрены теоретические вопросы, связанные с областью частеречной разметки, особенности существующих подходов, проблемы, возникающие при их использовании для малоресурсных языков, а также предложен способ преодоления этих ограничений для конкретного случая сранан-тонго. В практической части исследования даны описания разработанного теггера и эксперимента по проведению разметки. Методика проанализирована и оценена, высказаны предложения по дальнейшему развитию теггера. | ru_RU |
dc.description.abstract | This graduation qualification work examines the general morphological and syntactic features of modern Sranan Tongo. The aim of the research is to develop an automatic part-of-speech (POS) tagger for this language using a small lexicon and minimal training data. The work discusses theoretical issues related to the area of part-of-speech tagging, the characteristics of the existing approaches, the problems that arise when using them to tag low-resource languages, and a way to overcome these limitations for the specific case of Sranan Tongo. The practical part describes the proposed POS tagger and introduces an experiment to evaluate its performance. The experiment results are analyzed and suggestions are made for future development of the tagger. | en_GB |
dc.language.iso | ru | |
dc.subject | суринамский язык | ru_RU |
dc.subject | частеречная разметка | ru_RU |
dc.subject | POS-теггер | ru_RU |
dc.subject | стохастический POS-теггер | ru_RU |
dc.subject | АОТ | ru_RU |
dc.subject | Sranan Tongo | en_GB |
dc.subject | part-of-speech | en_GB |
dc.subject | POS tagging | en_GB |
dc.subject | stochastic | en_GB |
dc.subject | rule-based | en_GB |
dc.subject | NLP | en_GB |
dc.title | Partial Markup for Modern Surinamese (Sranan Tongo) | en_GB |
dc.title.alternative | Частеречная разметка для современного суринамского языка (сранан-тонго) | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Cortegoso_Vissio_VKR_magistratura.pdf | Article | 687,42 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_Zaharov_recenzia_Kortegoso_Vissio_2021.pdf | ReviewSV | 105,25 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.