Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/4159
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Михайлова Елена Георгиевна | ru_RU |
dc.contributor.author | Савченков Павел Александрович | ru_RU |
dc.contributor.author | Savchenkov Pavel | en_GB |
dc.contributor.editor | Кандидат физико-математических наук Е.Г.Михайлова | ru_RU |
dc.contributor.editor | Candidate of Physics and Mathematics E.G.Mikhailova | en_GB |
dc.date.accessioned | 2016-10-10T02:12:32Z | - |
dc.date.available | 2016-10-10T02:12:32Z | - |
dc.date.issued | 2016 | |
dc.identifier.other | 011380 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/4159 | - |
dc.description.abstract | Чаще всего системы распознавания речи работают с аудио-сигналом записи речи человека, переводя его в текстовые данные. В некоторых случаях удобнее использовать только видео-сигнал и визуальную информацию. Такие модели рассматриваются в рамках данной работы. В работе производится обзор существующих методов, применяемых в распознавании речи, и анализ их применимости при использовании визуальной информации. Предлагается подход к распознаванию последовательности сказанных слов из небольшого словаря на видео-записи. | ru_RU |
dc.description.abstract | Automatic speech recognition system usually works with audio-signal of recorded human speech and decodes it into the text data. In some cases it’s more convenient to use only video-signal and visual information for recognition. These models are considered within this paper. The review of existing speech recognition methods and analysis of its adaptability in case of using visual information is considered. An approach of recognition of spoken words sequence from small dictionary on video is proposed. | en_GB |
dc.language.iso | ru | |
dc.subject | распознавание речи | ru_RU |
dc.subject | визуальные признаки | ru_RU |
dc.subject | чтение по губам | ru_RU |
dc.subject | глубокое обучение | ru_RU |
dc.subject | speech recognition | en_GB |
dc.subject | lip reading | en_GB |
dc.subject | deep learning | en_GB |
dc.subject | long short-term memory | en_GB |
dc.title | Automatic speech recognition based on visual information | en_GB |
dc.title.alternative | Автоматическое распознавание речи на основе визуальной информации | ru_RU |
Располагается в коллекциях: | BACHELOR STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
savchenkov_thesis.pdf | Article | 1,85 MB | Adobe PDF | Просмотреть/Открыть |
reviewSV_st007740_Mixajlova_Elena_Georgievna_(supervisor)(Ru).txt | ReviewSV | 2,5 kB | Text | Просмотреть/Открыть |
reviewSV_st007740_Mixajlova_Elena_Georgievna_(reviewer)(Ru).txt | ReviewRev | 3,55 kB | Text | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.