Desenvolvimento de um sistema de verificação de locutor, usando modelos ocultos de Markov, unindo a técnica MFCC com parâmetros extraídos do sinal glotal

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorFerreira, Edson Luiz Cataldo-
Autor(es): dc.contributorSilva, João Marcos Meirelles da-
Autor(es): dc.contributorMatos, Leni Joaquim de-
Autor(es): dc.contributorPestre Filho, René-
Autor(es): dc.contributorFerreira, Tadeu Nagashima-
Autor(es): dc.creatorSchueler, Carla Floretino-
Autor(es): dc.creatorSilveira, Filipe Moreira da-
Data de aceite: dc.date.accessioned2024-07-11T18:24:13Z-
Data de disponibilização: dc.date.available2024-07-11T18:24:13Z-
Data de envio: dc.date.issued2018-01-09-
Data de envio: dc.date.issued2018-01-09-
Data de envio: dc.date.issued2018-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/5445-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/769855-
Descrição: dc.descriptionA voz é um fenômeno físico resultante da propagação do fluxo de ar, proveniente dos pulmões, através da glote e do trato vocal, com posterior irradiação pela boca. A particularidade dos órgãos envolvidos no processo de geração da voz torna a fala um sinal biométrico, permitindo seu uso para verificação de locutor e, consequentemente, uma chave de acesso em ambientes restritos ou de dados privados, por exemplo. Este trabalho de conclusão de curso apresenta o desenvolvimento de uma ferramenta para verificação de locutor, unindo duas diferentes técnicas para extrair características de sinais de voz: os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients - MFCCs) e os parâmetros calculados a partir do sinal glotal, que é um sinal de pressão obtido imediatamente após a passagem do ar pelas cordas vocais. O uso de características extraídas do sinal glotal é a grande novidade e a principal contribuição deste trabalho. O sinal glotal foi obtido por um processo de filtragem inversa. Todos os parâmetros extraídos são usados como entradas de Modelos Ocultos de Markov (HMMs), que é uma ferramenta matemática para construir o modelo estocástico associado ao locutor. Os resultados mostram significativas melhoras na verificação de locutor quando comparados com os obtidos considerando apenas MFCCs, levando à conclusão de que os parâmetros extraídos do sinal glotal fornecem importantes informações sobre a identidade da voz-
Descrição: dc.descriptionVoice is a physical phenomenon resulting from the airflow propagation, coming from the lungs, through the glottis and the vocal tract, with posterior radiation by the mouth. The uniqueness of the organs involved in the voice generation process makes the speech a biometrical signal allowing its use to speaker verification and, consequently, as an access key to restrict environment or private data, for example. This undergraduate final work presents the development of a tool for speaker verification, by joining two different techniques to extract features from the voice signals: the Mel Frequency Cepstrum Coefficients (MFCCs) and the parameters calculated from the glottal signal, which is an acoustic pressure signal quasi-periodic obtained immediately after the air passing through the vocal folds. The use of the features extracted from the glottal signal is the great novelty and also the main contribution of this work. The glottal signal was obtained by an inverse filtering process and all the parameters extracted are used as entries of Hidden Markov Models (HMMs), which is a mathematical tool used to develop the stochastic model associated to the speaker. The results show significant improvement on the performance of the speaker verification system when compared with the ones obtained when only MFCCs are considered, leading to the conclusion that the features extracted from the glottal signal provide important information about the voice identity-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Federal Fluminense-
Publicador: dc.publisherNiterói-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectModelos escondidos de Markov-
Palavras-chave: dc.subjectSinal glotal-
Palavras-chave: dc.subjectMFCC-
Palavras-chave: dc.subjectProdução da voz-
Palavras-chave: dc.subjectSinal Glotal-
Palavras-chave: dc.subjectModelo Markoviano-
Palavras-chave: dc.subjectVoz-
Palavras-chave: dc.subjectSpeaker verification-
Palavras-chave: dc.subjectHidden Markov Models-
Palavras-chave: dc.subjectGlottal signal-
Palavras-chave: dc.subjectVoice production-
Título: dc.titleDesenvolvimento de um sistema de verificação de locutor, usando modelos ocultos de Markov, unindo a técnica MFCC com parâmetros extraídos do sinal glotal-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.