Ferramentas e técnicas para reconhecimento e transcrição de voz em texto

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPassos, Diego Gimenez-
Autor(es): dc.contributorSeixas, Flávio-
Autor(es): dc.contributorPassos, Fernanda Gonçalves de Oliveira-
Autor(es): dc.creatorMoreira, Guilherme Macedo-
Data de aceite: dc.date.accessioned2024-07-11T17:38:32Z-
Data de disponibilização: dc.date.available2024-07-11T17:38:32Z-
Data de envio: dc.date.issued2023-09-22-
Data de envio: dc.date.issued2023-09-22-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/30546-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/754454-
Descrição: dc.descriptionA representação textual nos vídeos é algo imprescindíıvel para a acessibilidade de conteúdos audiovisuais, não só para deficientes auditivos, mas para estrangeiros, ou demais pessoas com dificuldades de compreender o idioma do vídeo. O CEDERJ, consórcio formado por diversas instituições públicas, responsável por oferecer cursos de graduação a distância gratuitos e acessíveis em diversas áreas de conhecimento, proporciona uma maior acessibilidade de pessoas ao ensino superior, tornando possível levar o aprendizado de conteúdos dados pelas instituições para bem longe do espaço das instituições, tornando a distância não mais um empecilho ao acesso à educação de qualidade. Embora os materiais do curso estejam livremente disponíveis no formato de videoaulas, o conteúdo não é acessível a deficientes auditivos. Este trabalho tem como propósito desenvolver e analisar o uso de uma ferramenta computacional para a legendagem automática de vídeos com base na API de reconhecimento de discursos da Google, a API Google Cloud Speech. A ferramenta foi aplicada às videoaulas do curso de Tecnologia em Sistemas de Computação do CEDERJ a fim de estudar uma opção para melhorar a acessibilidade de pessoas com deficiência auditiva. Ao final, avaliou-se a qualidade das legendas geradas pelo programa, obtendo-se resultados satisfatórios em alguns casos, com uma taxa de acerto na identificação das palavras maior que 93% . No entanto, foi identificada a necessidade de uma correção da legendas posteriormente ao uso da ferramenta automática, a fim de obter uma assertividade mais próxima de 100%-
Descrição: dc.descriptionThe textual representation in videos is essential for the accessibility of audiovisual content, not only for the hearing impaired, but also for foreigners, and people with difficulties in understanding the language of the video. The CEDERJ consortium, formed by several public institutions, is responsible to provide distance learning courses in several areas, bringing knowledge beyond the physical location of the institutions. Although the course materials are freely available in video format, content is not accessible for hearing impaired. This work aimed to develop and analyze the use of a computational tool for an automated video caption based on a speech recognition API from Google, the Google Cloud Speech API. The tool was applied to CEDERJ’s Technology in Computational Systems video classes in order to study an option to improve the accessibility of hearing impaired people. An evaluation of the subtitles generated by the program has been made, and the program performance was satisfactory in some cases, with a hit rate greater than 93%. However, we also identified a need to correct the subtitle after the use of the automatic tool, in order to obtain an assertiveness closer to 100%-
Descrição: dc.description31 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectLegenda automática-
Palavras-chave: dc.subjectAPI de reconhecimento de discurso-
Palavras-chave: dc.subjectAPI Google Cloud Speech-
Palavras-chave: dc.subjectAcessibilidade-
Palavras-chave: dc.subjectEstenotipia-
Palavras-chave: dc.subjectSurdo-
Palavras-chave: dc.subjectCentro de Educação Superior à Distância do Estado do Rio de Janeiro-
Palavras-chave: dc.subjectLegendagem automática de vídeos-
Palavras-chave: dc.subjectAcessibilidade digital-
Palavras-chave: dc.subjectAuto Caption-
Palavras-chave: dc.subjectSpeech Recognition API-
Palavras-chave: dc.subjectAccessibility-
Palavras-chave: dc.subjectStenotype-
Título: dc.titleFerramentas e técnicas para reconhecimento e transcrição de voz em texto-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.