Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/31377
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Füredi Mihály | ru_RU |
dc.contributor.advisor | Furedi Mihaly | en_GB |
dc.contributor.author | Эгервари Кристиан Эрик | ru_RU |
dc.contributor.author | Egervari Kristian Erik | en_GB |
dc.contributor.editor | Захаров Виктор Павлович | ru_RU |
dc.contributor.editor | Zaharov Viktor Pavlovic | en_GB |
dc.date.accessioned | 2021-07-31T19:27:51Z | - |
dc.date.available | 2021-07-31T19:27:51Z | - |
dc.date.issued | 2021 | |
dc.identifier.other | 082333 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/31377 | - |
dc.description.abstract | В представленном исследовании рассмотрена проблема выравнивания предложных конструкций в параллельном русско-венгерском корпусе. Цель исследования: разработка подходящего алгоритма для извлечения предложных конструкций из русскоязычной части корпуса и поиска их эквивалентов для перевода в венгерской части корпуса. Алгоритм, разработанный на языке Python, включает в себя автоматический анализ морфологических, грамматических и синтаксических характеристик текстов. В работе подняты теоретические вопросы, связанные с областью выравнивания текстов, рассмотрены особенности существующих подходов к задаче, приведено описание автоматических инструментов выравнивания и указаны сферы их применения, а также представлены морфосинтаксические особенности изучаемых языков. В практической части исследования подробно описан разработанный алгоритм и экспериментальный процесс выравнивания предложных конструкций. Авторский подход протестирован и оценен, кроме того, названы предположения по возможности усовершенствования и развития алгоритма. | ru_RU |
dc.description.abstract | The following master's thesis addresses the issue of parallel phrase alignment of Russian prepositional constructions and their Hungarian equivalents in parallel Russian-Hungarian corpora. The aim of this study is to develop an algorithm for extracting prepositional constructions from the Russian part of a Russian-Hungarian parallel corpus and to find their equivalents in the Hungarian part based on the morphological, grammatical and syntactic characteristics of the given languages. The paper describes the theoretical issues in the field of parallel text alignment along with the details of multiple existing approaches. In the theoretical part of the paper, an overview of automatic alignment tools are presented and their scopes of application are examined. The morphosyntactic features of Russian and Hungarian are also touched upon. In the practical part of the paper, we give the procedural description of our algorithm and present the results of our experiments. These results are analyzed and evaluated and further possibilities for development are discussed. | en_GB |
dc.language.iso | ru | |
dc.subject | автоматическое выравнивание параллельных текстов | ru_RU |
dc.subject | выравнивание предложных конструкций | ru_RU |
dc.subject | параллельные корпусы | ru_RU |
dc.subject | русско-венгерский параллельный корпус | ru_RU |
dc.subject | parallel text alignment | en_GB |
dc.subject | automatic alignment of prepositional constructions | en_GB |
dc.subject | parallel text corpora | en_GB |
dc.subject | Russian-Hungarian parallel corpora | en_GB |
dc.title | Parallel text alignment of prepositional phrases in Russian and their equivalents in Agglutinative languages | en_GB |
dc.title.alternative | Выравнивание русских предложных конструкций и их эквивалентов в агглютинативных языках при создании параллельных корпусов | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
st082333_Egervari_Kristian_VKR.pdf | Article | 282,97 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_Zaharov_recenzia_Egervari_2021.pdf | ReviewSV | 110,48 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.