Processing of numbers and abbreviations for Russian Text-to-Speech synthesis

Пушкарев Антон Борисович; Puskarev Anton Borisovic

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/42918

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Толстунова Екатерина Викторовна	ru_RU
dc.contributor.advisor	Tolstunova Ekaterina Viktorovna	en_GB
dc.contributor.author	Пушкарев Антон Борисович	ru_RU
dc.contributor.author	Puskarev Anton Borisovic	en_GB
dc.contributor.editor	Скрелин Павел Анатольевич	ru_RU
dc.contributor.editor	Skrelin Pavel Anatolevic	en_GB
dc.date.accessioned	2023-07-26T12:45:12Z	-
dc.date.available	2023-07-26T12:45:12Z	-
dc.date.issued	2023
dc.identifier.other	080154	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/42918	-
dc.description.abstract	Данная работа посвящена проблеме нормализации числительных и сокращений в системах синтеза речи по тексту на русском языке. В исследовании проведен анализ различных подходов к решению данной проблемы, включая использование глубокого обучения, которое требует значительных вычислительных ресурсов и временных затрат. В связи с этим предлагается комбинация формальных правил и статистического классификатора CRF, которая обеспечивает более надежное и ресурсо-эффективное решение. Предложенный метод демонстрирует приемлемую точность (86%) в предсказании грамматической формы числительных и сокращений, является более устойчивым к критическим ошибкам в определении основы, а также относительно прост в применении в реальной системе синтеза. Результаты исследования подтверждают эффективность предложенной системы и могут служить основой для дальнейших исследований в области нормализации текста и синтеза речи.	ru_RU
dc.description.abstract	This work addresses the problem of normalizing numbers and abbreviations in Russian Text-to-Speech synthesis systems. The study analyzes existing approaches to solving this problem, including the use of deep learning, which requires significant computational resources and time investment. In this regard, a combination of hand-constructed rules and the data-driven Conditional Random Fields is proposed, providing a more reliable and resource-efficient solution. The proposed method demonstrates acceptable accuracy (86%) in predicting the grammatical form of numbers and abbreviations, while being robust to critical errors in verbalising the lemma. It is also straightforward to implement in real-world text-to-speech synthesis systems. The research findings confirm the effectiveness of the proposed system and provide a basis for further investigation in the field of speech synthesis.	en_GB
dc.language.iso	ru
dc.subject	синтез речи	ru_RU
dc.subject	нормализация текста	ru_RU
dc.subject	русские числительные	ru_RU
dc.subject	графические сокращения	ru_RU
dc.subject	машинное обучение	ru_RU
dc.subject	лингвистический анализ	ru_RU
dc.subject	предсказание грамматической формы	ru_RU
dc.subject	статистический классификатор	ru_RU
dc.subject	условные случайные поля	ru_RU
dc.subject	снятие неоднозначности	ru_RU
dc.subject	speech synthesis	en_GB
dc.subject	text normalization	en_GB
dc.subject	Russian number names	en_GB
dc.subject	abbreviations	en_GB
dc.subject	grammatical form prediction	en_GB
dc.subject	machine learning	en_GB
dc.subject	statistical classifier	en_GB
dc.subject	conditional random fields	en_GB
dc.subject	disambiguation	en_GB
dc.title	Processing of numbers and abbreviations for Russian Text-to-Speech synthesis	en_GB
dc.title.alternative	Восстановление полных форм числительных и сокращений для задач синтеза русского текста	ru_RU
Располагается в коллекциях:	MASTER'S STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
PuskarevVKR.docx	Article	486,47 kB	Microsoft Word XML	Просмотреть/Открыть
reviewSV_otzyv_puskarev.pdf	ReviewSV	162,77 kB	Adobe PDF	Просмотреть/Открыть
reviewSV_soglasie_dannye.pdf	ReviewSV	169,1 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета