Reconhecimento automático de locutor utilizando modelo de misturas gaussianas treinado pelo algoritmo de maximização da expectativa

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorNakano, Alberto Yoshihiro-
Autor(es): dc.contributorMartins, Jefferson Gustavo-
Autor(es): dc.contributorJeronymo, Daniel Cavalcanti-
Autor(es): dc.contributorNakano, Alberto Yoshihiro-
Autor(es): dc.creatorSilva, Helio Rodrigues da-
Autor(es): dc.creatorDourado, Juliano Rodrigues-
Data de aceite: dc.date.accessioned2022-02-21T21:48:30Z-
Data de disponibilização: dc.date.available2022-02-21T21:48:30Z-
Data de envio: dc.date.issued2021-01-17-
Data de envio: dc.date.issued2021-01-17-
Data de envio: dc.date.issued2018-06-27-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/23878-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/660993-
Descrição: dc.descriptionDeveloping systems that can recognize or identify individuals has becoming a growing need in applications that require verification and grant of human identity. There are several systems that use biometrics to recognize a certain individual, among them, automatic speech recognition that uses speech as recognition data. In this work, Mel Frequency Cepstral Coefficients were extracted to model speakers using statistical tools. For the modeling of the vocal tract of an individual, the Gaussian Mixture Model (GMM) was used. The parameters of the GMM model were adapted or trained by the Expectation Maximization algorithm (EM). Thus 40 models of 40 speakers were created and then tested. Speaker recognition is promising for many practical ap-plications, including tasks that can facilitate, speed up and improve identity verification processes.-
Descrição: dc.descriptionDesenvolver sistemas que possam reconhecer ou identificar indivíduos vem se tornando uma necessidade cada vez maior em aplicações que exigem a verificação e a garantia da identidade humana. Há vários sistemas que utilizam a biometria para reconhecer um determinado indivíduo, dentre estes, o reconhecimento automático de locutor que utiliza a fala como dado de reconhecimento. Neste trabalho, os parâmetros acústicos mel-cepstrais foram extraídos para modelagem de locutores por meio de ferramentas estatísticas. Para realizar a modelagem do trato vocal de um indivíduo, utilizou-se o modelo de misturas gaussianas (GMM, do inglês Gaussian Mixture Model). Os parâmetros do modelo GMM foram adaptados ou treinados pelo algoritmo de maximização da expectativa (EM, do inglês Expectation Maximization). Sendo assim, foram criados 40 modelos dos 40 locutores na etapa de treinamento e em seguida testados. Os testes realizados forneceram os resultados de máxima verossimilhança para a construção de matrizes de classificação. Por fim, em diversas aplicações práticas o reconhecimento de locutor se mostra promissor, compreendendo tarefas que possam vir a facilitar, agilizar e melhorar processos de verificação de identidade.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherToledo-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia Eletrônica-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectReconhecimento automático da voz-
Palavras-chave: dc.subjectTelecomunicações - Sistemas de comutação-
Palavras-chave: dc.subjectSistemas de processamento da fala-
Palavras-chave: dc.subjectAutomatic speech recognition-
Palavras-chave: dc.subjectTelecommunication - Switching systems-
Palavras-chave: dc.subjectSpeech processing systems-
Palavras-chave: dc.subjectCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA-
Título: dc.titleReconhecimento automático de locutor utilizando modelo de misturas gaussianas treinado pelo algoritmo de maximização da expectativa-
Título: dc.titleAutomatic speaker recognition using Gaussian mixture model trained by the expectation maximization algorithm-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.