Aprendizado profundo para pós-edição de saídas de sistemas de reconhecimento automático de fala

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorAikes Junior, Jorge-
Autor(es): dc.contributorCandido Junior, Arnaldo-
Autor(es): dc.contributorGavioli, Alan-
Autor(es): dc.contributorPessini, Evando Carlos-
Autor(es): dc.contributorAikes Junior, Jorge-
Autor(es): dc.creatorOliveira, Lucas-
Data de aceite: dc.date.accessioned2025-08-29T12:46:13Z-
Data de disponibilização: dc.date.available2025-08-29T12:46:13Z-
Data de envio: dc.date.issued2023-07-03-
Data de envio: dc.date.issued2023-07-03-
Data de envio: dc.date.issued2022-11-20-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/31652-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1101538-
Descrição: dc.descriptionThrough the use of Artificial Neural Networks it is possible to perform voice recognition ofautomatically, allowing the conversion of speeches into text. This artifact is present on various devices, such as cell phones, smartphones and personal assistants, in addition to being widely used. Artificial Neural Networks have a number of nodes that are organized into layers, which are divided into input layer, hidden layer and output layer. These nodes represent neurons and intensify information processing. In this work, the construction of an artificial neural network that had with the aim of improving the output of an automatic recognition system of voice Applied in audios, which resulted as output a database containing phrases of Brazilian Portuguese. To fulfill the proposed objective Current Neural Networks of the Long Short-Term Memory type were used, as they present as a differential the have memory, that is, to carry, during the training process, information past at previous times and make use of this information to determine new values. Experiments were performed using databases that came from systems of automatic voice recognition in order to improve the network so that it can fulfill the purpose of being able tocorrect the sentences in the correct way. Then the construction of the final network was carriedout, changing the methodology used until then and obtaining better results.-
Descrição: dc.descriptionAtravés do uso de Redes Neurais Artificiais é possível realizar o reconhecimento de voz de forma automática, possibilitando a conversão de falas em texto. Esse artifício está presente em diversos dispositivos, como celulares inteligentes e assistentes pessoais, além de ser amplamente utilizado. Redes Neurais Artificiais possuem uma quantidade de nós que estão organizados em camadas, as quais estão divididas entre camada de entrada, camada oculta e camada de saída. Esses nós representam os neurônios e realizam o processamento da informação. Neste trabalho foi realizada a construção de uma rede neural artificial que tinha como objetivo realizar o aprimoramento da saída de um sistema de reconhecimento automático de voz aplicado em áudios, o qual resultou como saída uma base de dados contendo frases do Português Brasileiro. Para cumprir o objetivo proposto Redes Neurais Recorrentes do tipo Long Short-Term Memory foram utilizadas, pois apresentam como diferencial o fator de possuírem memória, ou seja, de carregarem, durante o processo de treinamento, informações passadas em momentos anteriores e fazerem uso dessas informações para determinar novos valores. Experimentos foram realizados utilizando bases de dados que vieram de sistemas de reconhecimento automático de voz com o objetivo de aprimorar a rede para que ela possa cumprir o propósito de ser capaz de corrigir as frases da maneira correta. Em seguida foi realizada a construção da rede final, alterando a metodologia utilizada até então e obtendo resultados melhores.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherMedianeira-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherCiência da Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectRedes neurais (Computação)-
Palavras-chave: dc.subjectReconhecimento automático da voz-
Palavras-chave: dc.subjectGerenciamento de memória (Computação)-
Palavras-chave: dc.subjectNeural networks (Computer science)-
Palavras-chave: dc.subjectAutomatic speech recognition-
Palavras-chave: dc.subjectMemory Management (Computer science)-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleAprendizado profundo para pós-edição de saídas de sistemas de reconhecimento automático de fala-
Título: dc.titleDeep learning for post-editing of automatic speech recognition system outputs-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.