Automatic speech recognition based on visual information

Савченков Павел Александрович; Savchenkov Pavel

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/4159

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Михайлова Елена Георгиевна	ru_RU
dc.contributor.author	Савченков Павел Александрович	ru_RU
dc.contributor.author	Savchenkov Pavel	en_GB
dc.contributor.editor	Кандидат физико-математических наук Е.Г.Михайлова	ru_RU
dc.contributor.editor	Candidate of Physics and Mathematics E.G.Mikhailova	en_GB
dc.date.accessioned	2016-10-10T02:12:32Z	-
dc.date.available	2016-10-10T02:12:32Z	-
dc.date.issued	2016
dc.identifier.other	011380	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/4159	-
dc.description.abstract	Чаще всего системы распознавания речи работают с аудио-сигналом записи речи человека, переводя его в текстовые данные. В некоторых случаях удобнее использовать только видео-сигнал и визуальную информацию. Такие модели рассматриваются в рамках данной работы. В работе производится обзор существующих методов, применяемых в распознавании речи, и анализ их применимости при использовании визуальной информации. Предлагается подход к распознаванию последовательности сказанных слов из небольшого словаря на видео-записи.	ru_RU
dc.description.abstract	Automatic speech recognition system usually works with audio-signal of recorded human speech and decodes it into the text data. In some cases it’s more convenient to use only video-signal and visual information for recognition. These models are considered within this paper. The review of existing speech recognition methods and analysis of its adaptability in case of using visual information is considered. An approach of recognition of spoken words sequence from small dictionary on video is proposed.	en_GB
dc.language.iso	ru
dc.subject	распознавание речи	ru_RU
dc.subject	визуальные признаки	ru_RU
dc.subject	чтение по губам	ru_RU
dc.subject	глубокое обучение	ru_RU
dc.subject	speech recognition	en_GB
dc.subject	lip reading	en_GB
dc.subject	deep learning	en_GB
dc.subject	long short-term memory	en_GB
dc.title	Automatic speech recognition based on visual information	en_GB
dc.title.alternative	Автоматическое распознавание речи на основе визуальной информации	ru_RU
Располагается в коллекциях:	BACHELOR STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
savchenkov_thesis.pdf	Article	1,85 MB	Adobe PDF	Просмотреть/Открыть
reviewSV_st007740_Mixajlova_Elena_Georgievna_(supervisor)(Ru).txt	ReviewSV	2,5 kB	Text	Просмотреть/Открыть
reviewSV_st007740_Mixajlova_Elena_Georgievna_(reviewer)(Ru).txt	ReviewRev	3,55 kB	Text	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета