Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/30108
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorТаланов Андрей Олеговичru_RU
dc.contributor.advisorTalanov Andrej Olegovicen_GB
dc.contributor.authorМеньшикова Алла Павловнаru_RU
dc.contributor.authorMensikova Alla Pavlovnaen_GB
dc.contributor.editorКочаров Даниил Александровичru_RU
dc.contributor.editorKocarov Daniil Aleksandrovicen_GB
dc.date.accessioned2021-07-31T18:17:27Z-
dc.date.available2021-07-31T18:17:27Z-
dc.date.issued2021
dc.identifier.other048932en_GB
dc.identifier.urihttp://hdl.handle.net/11701/30108-
dc.description.abstractБлагодаря активным исследованиям в области комплексных систем синтеза речи в последнее время, синтезированная речь по своей естественности стала приближаться к человеческой. Однако было неоднократно показано, что использование лингвистических признаков в таких системах способствует дальнейшему улучшению качества синтеза. Интонационная аннотация также может быть применена для этой цели. По этой причине в данной работе исследуется метод предсказания интонационного оформления высказывания. На материале русского языка была разработана система, предсказывающая расположение интонационных центров и интонационные модели (в терминах системы интонационного описания Н. Б. Вольской). Были обучены дикторозависимые и дикторонезависимые BiLSTM модели, а также было изучено влияние различных признаков на работу системы: синтаксических, пунктуационных, морфологических. фонетических и эмбеддингов BERT. Дикторонезависимая система показала 90% F1-меры при предсказании расположении интонационных центров и 61% точности при предсказании интонационных моделей. Также была исследована эффективность дикторозависимых и меж-жанровых моделей.ru_RU
dc.description.abstractThanks to recent advances in End-to-End systems for Text-to-Speech synthesis, the level of naturalness of synthesized speech is now close to the human one. However, the use of linguistic features in such systems has been repeatedly demonstrated, as they significantly improve the synthesis of prosody. Among other features, predicted prosodic annotation can be also applied to this end. Thus, in this study, I explore the method of intonation pattern prediction from the text. Using the material of Russian, I attempt to predict the nucleus placement within an intonation phrase and classify it in terms of systems of Russian intonation description. Speaker-dependent and independent BiLSTM models are trained, and the influence of such features as syntactic relations, BERT embeddings, punctuation, POS tags, and phrase break indication is studied. The speaker-independent model shows 90% of F1-measure for nucleus placement and 61% of accuracy for intonation construction prediction. Performance of speaker-dependent and cross-genre models is also estimated.en_GB
dc.language.isoru
dc.subjectсинтез речиru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectинтонацияru_RU
dc.subjectобработка естественного языкаru_RU
dc.subjectspeech synthesisen_GB
dc.subjectmachine learningen_GB
dc.subjectprosodyen_GB
dc.subjectnatural language processingen_GB
dc.titlePrediction of phrase intonation for text-to-speech synthesisen_GB
dc.title.alternativeПредсказание интонационного оформления высказывания для синтеза речи по текстуru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
VKR_2021__1_.pdfArticle974,56 kBAdobe PDFПросмотреть/Открыть
reviewSV_Otzyv_naucnogo_rukovoditela_2021___MensikovaAP.pdfReviewSV1,67 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.