Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/13420
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorЩеголева Надежда Львовнаru_RU
dc.contributor.authorФедосеев Георгий Александровичru_RU
dc.contributor.authorFedoseev Georgiien_GB
dc.contributor.editorДегтярев Александр Борисовичru_RU
dc.contributor.editorDegtiarev Aleksandr Borisovichen_GB
dc.date.accessioned2018-07-26T15:25:57Z-
dc.date.available2018-07-26T15:25:57Z-
dc.date.issued2018
dc.identifier.other032080en_GB
dc.identifier.urihttp://hdl.handle.net/11701/13420-
dc.description.abstractНа сегодняшний день коммерческие системы распознавания русской речи достигли сравнимого с человеком уровня распознавания в 90-95%. В то же время, практически отсутствуют решения для русского языка с открытым исходным кодом на основе современных архитектур. Основная проблема заключается в отсутствии достаточно объемных открытых корпусов транскрибированной русской речи. В данной работе предложен метод автоматического создания корпусов объемом в несколько сотен часов речи и рассмотрен процесс создания системы распознавания речи на основе открытой реализации архитектуры DeepSpeech. Кроме того, в работе рассматривается применение построенной модели для создания системы поиска по речи в коллекции медиафайлов.ru_RU
dc.description.abstractTo date, commercial systems for recognizing Russian speech have achieved 90-95% accuracy which is comparable to human level. At the same time, there are practically no open source solutions for Russian speech recognition based on modern architectures. The main reason is the lack of large enough public datasets of transcribed Russian speech. This paper proposes a method for automatic dataset crawling, resulting in datasets containing several hundred hours of speech, and describes ASR system creation based on the open source implementation of DeepSpeech architecture. In addition, the paper considers the application of the implemented model to create a search system for speech in the collection of media files.en_GB
dc.language.isoru
dc.subjectраспознавание речиru_RU
dc.subjectкорпус речиru_RU
dc.subjectглубокая нейронная сетьru_RU
dc.subjectрекуррентная нейронная сетьru_RU
dc.subjectсистема поискаru_RU
dc.subjectspeech recognitionen_GB
dc.subjectspeech dataseten_GB
dc.subjectDNNen_GB
dc.subjectRNNen_GB
dc.subjectspeech searchen_GB
dc.titleDevelopment of speech recognition system for indexing and searching in a big collection of mediafilesen_GB
dc.title.alternativeРазработка системы распознавания речи для индексирования и поиска в большой коллекции медиафайловru_RU
Располагается в коллекциях:BACHELOR STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.