Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/42918
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Толстунова Екатерина Викторовна | ru_RU |
dc.contributor.advisor | Tolstunova Ekaterina Viktorovna | en_GB |
dc.contributor.author | Пушкарев Антон Борисович | ru_RU |
dc.contributor.author | Puskarev Anton Borisovic | en_GB |
dc.contributor.editor | Скрелин Павел Анатольевич | ru_RU |
dc.contributor.editor | Skrelin Pavel Anatolevic | en_GB |
dc.date.accessioned | 2023-07-26T12:45:12Z | - |
dc.date.available | 2023-07-26T12:45:12Z | - |
dc.date.issued | 2023 | |
dc.identifier.other | 080154 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/42918 | - |
dc.description.abstract | Данная работа посвящена проблеме нормализации числительных и сокращений в системах синтеза речи по тексту на русском языке. В исследовании проведен анализ различных подходов к решению данной проблемы, включая использование глубокого обучения, которое требует значительных вычислительных ресурсов и временных затрат. В связи с этим предлагается комбинация формальных правил и статистического классификатора CRF, которая обеспечивает более надежное и ресурсо-эффективное решение. Предложенный метод демонстрирует приемлемую точность (86%) в предсказании грамматической формы числительных и сокращений, является более устойчивым к критическим ошибкам в определении основы, а также относительно прост в применении в реальной системе синтеза. Результаты исследования подтверждают эффективность предложенной системы и могут служить основой для дальнейших исследований в области нормализации текста и синтеза речи. | ru_RU |
dc.description.abstract | This work addresses the problem of normalizing numbers and abbreviations in Russian Text-to-Speech synthesis systems. The study analyzes existing approaches to solving this problem, including the use of deep learning, which requires significant computational resources and time investment. In this regard, a combination of hand-constructed rules and the data-driven Conditional Random Fields is proposed, providing a more reliable and resource-efficient solution. The proposed method demonstrates acceptable accuracy (86%) in predicting the grammatical form of numbers and abbreviations, while being robust to critical errors in verbalising the lemma. It is also straightforward to implement in real-world text-to-speech synthesis systems. The research findings confirm the effectiveness of the proposed system and provide a basis for further investigation in the field of speech synthesis. | en_GB |
dc.language.iso | ru | |
dc.subject | синтез речи | ru_RU |
dc.subject | нормализация текста | ru_RU |
dc.subject | русские числительные | ru_RU |
dc.subject | графические сокращения | ru_RU |
dc.subject | машинное обучение | ru_RU |
dc.subject | лингвистический анализ | ru_RU |
dc.subject | предсказание грамматической формы | ru_RU |
dc.subject | статистический классификатор | ru_RU |
dc.subject | условные случайные поля | ru_RU |
dc.subject | снятие неоднозначности | ru_RU |
dc.subject | speech synthesis | en_GB |
dc.subject | text normalization | en_GB |
dc.subject | Russian number names | en_GB |
dc.subject | abbreviations | en_GB |
dc.subject | grammatical form prediction | en_GB |
dc.subject | machine learning | en_GB |
dc.subject | statistical classifier | en_GB |
dc.subject | conditional random fields | en_GB |
dc.subject | disambiguation | en_GB |
dc.title | Processing of numbers and abbreviations for Russian Text-to-Speech synthesis | en_GB |
dc.title.alternative | Восстановление полных форм числительных и сокращений для задач синтеза русского текста | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
PuskarevVKR.docx | Article | 486,47 kB | Microsoft Word XML | Просмотреть/Открыть |
reviewSV_otzyv_puskarev.pdf | ReviewSV | 162,77 kB | Adobe PDF | Просмотреть/Открыть |
reviewSV_soglasie_dannye.pdf | ReviewSV | 169,1 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.