Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/42918
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorТолстунова Екатерина Викторовнаru_RU
dc.contributor.advisorTolstunova Ekaterina Viktorovnaen_GB
dc.contributor.authorПушкарев Антон Борисовичru_RU
dc.contributor.authorPuskarev Anton Borisovicen_GB
dc.contributor.editorСкрелин Павел Анатольевичru_RU
dc.contributor.editorSkrelin Pavel Anatolevicen_GB
dc.date.accessioned2023-07-26T12:45:12Z-
dc.date.available2023-07-26T12:45:12Z-
dc.date.issued2023
dc.identifier.other080154en_GB
dc.identifier.urihttp://hdl.handle.net/11701/42918-
dc.description.abstractДанная работа посвящена проблеме нормализации числительных и сокращений в системах синтеза речи по тексту на русском языке. В исследовании проведен анализ различных подходов к решению данной проблемы, включая использование глубокого обучения, которое требует значительных вычислительных ресурсов и временных затрат. В связи с этим предлагается комбинация формальных правил и статистического классификатора CRF, которая обеспечивает более надежное и ресурсо-эффективное решение. Предложенный метод демонстрирует приемлемую точность (86%) в предсказании грамматической формы числительных и сокращений, является более устойчивым к критическим ошибкам в определении основы, а также относительно прост в применении в реальной системе синтеза. Результаты исследования подтверждают эффективность предложенной системы и могут служить основой для дальнейших исследований в области нормализации текста и синтеза речи.ru_RU
dc.description.abstractThis work addresses the problem of normalizing numbers and abbreviations in Russian Text-to-Speech synthesis systems. The study analyzes existing approaches to solving this problem, including the use of deep learning, which requires significant computational resources and time investment. In this regard, a combination of hand-constructed rules and the data-driven Conditional Random Fields is proposed, providing a more reliable and resource-efficient solution. The proposed method demonstrates acceptable accuracy (86%) in predicting the grammatical form of numbers and abbreviations, while being robust to critical errors in verbalising the lemma. It is also straightforward to implement in real-world text-to-speech synthesis systems. The research findings confirm the effectiveness of the proposed system and provide a basis for further investigation in the field of speech synthesis.en_GB
dc.language.isoru
dc.subjectсинтез речиru_RU
dc.subjectнормализация текстаru_RU
dc.subjectрусские числительныеru_RU
dc.subjectграфические сокращенияru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectлингвистический анализru_RU
dc.subjectпредсказание грамматической формыru_RU
dc.subjectстатистический классификаторru_RU
dc.subjectусловные случайные поляru_RU
dc.subjectснятие неоднозначностиru_RU
dc.subjectspeech synthesisen_GB
dc.subjecttext normalizationen_GB
dc.subjectRussian number namesen_GB
dc.subjectabbreviationsen_GB
dc.subjectgrammatical form predictionen_GB
dc.subjectmachine learningen_GB
dc.subjectstatistical classifieren_GB
dc.subjectconditional random fieldsen_GB
dc.subjectdisambiguationen_GB
dc.titleProcessing of numbers and abbreviations for Russian Text-to-Speech synthesisen_GB
dc.title.alternativeВосстановление полных форм числительных и сокращений для задач синтеза русского текстаru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
PuskarevVKR.docxArticle486,47 kBMicrosoft Word XMLПросмотреть/Открыть
reviewSV_otzyv_puskarev.pdfReviewSV162,77 kBAdobe PDFПросмотреть/Открыть
reviewSV_soglasie_dannye.pdfReviewSV169,1 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.