Leitura labial em vídeos com a utilização de aprendizado profundo

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorOliveira, Claiton de-
Autor(es): dc.contributorOliveira, Claiton de-
Autor(es): dc.contributorCorrêa, Cléber Gimenez-
Autor(es): dc.contributorSanches, Silvio Ricardo Rodrigues-
Autor(es): dc.creatorResende, Gustavo Silva-
Data de aceite: dc.date.accessioned2025-08-29T13:07:11Z-
Data de disponibilização: dc.date.available2025-08-29T13:07:11Z-
Data de envio: dc.date.issued2025-08-01-
Data de envio: dc.date.issued2025-08-01-
Data de envio: dc.date.issued2022-12-13-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/37697-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1107676-
Descrição: dc.descriptionIn recent years, the evolution and popularization of machine learning techniques have allowed sophisticated automated lip reading algorithms to be proposed. To accompany such algorithms, datasets composed of images prepared for this purpose were created, which may contain images related to letters, digits, words or phrases spoken by one or more speakers. Thus, the present work shows the construction of a dataset composed of images related to words being spoken by a single speaker. In addition, deep learning models based on convolutional neural networks was also used to perform automated lip reading on this dataset reaching up to 90.28% accuracy.-
Descrição: dc.descriptionNos últimos anos a evolução e popularização das técnicas de aprendizado de máquina permitiram com que algoritmos sofisticados de leitura labial automatizada fossem propostos. Para acompanhar tais algoritmos, datasets compostos por imagens preparadas para este fim foram criados, podendo conter imagens relacionadas a letras, dígitos, palavras ou frases ditas por um ou mais falantes. Com isso, o presente trabalho apresenta a construção de um dataset composto por imagens relacionadas a palavras sendo ditas por um único falante. Além disso, também foram utilizados modelos de aprendizado profundo baseados em redes neurais convolucionais para realizar leitura labial automatizada sobre esse dataset atingindo até 90,28% de acurácia.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCornelio Procopio-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia da Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightsAttribution-NonCommercial-ShareAlike 4.0 International-
Direitos: dc.rightshttp://creativecommons.org/licenses/by-nc-sa/4.0/-
Palavras-chave: dc.subjectSurdos - Meios de comunicação-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectAprendizado profundo-
Palavras-chave: dc.subjectRedes Neurais (Computação)-
Palavras-chave: dc.subjectDeaf - Means of communication-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectDeep learning (Machine learning)-
Palavras-chave: dc.subjectNeural networks (Computer science)-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleLeitura labial em vídeos com a utilização de aprendizado profundo-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.