Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Ferreira, Edson Luiz Cataldo | - |
Autor(es): dc.contributor | Silva, João Marcos Meirelles da | - |
Autor(es): dc.contributor | Matos, Leni Joaquim de | - |
Autor(es): dc.contributor | Pestre Filho, René | - |
Autor(es): dc.contributor | Ferreira, Tadeu Nagashima | - |
Autor(es): dc.creator | Schueler, Carla Floretino | - |
Autor(es): dc.creator | Silveira, Filipe Moreira da | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:24:13Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:24:13Z | - |
Data de envio: dc.date.issued | 2018-01-09 | - |
Data de envio: dc.date.issued | 2018-01-09 | - |
Data de envio: dc.date.issued | 2018 | - |
Fonte completa do material: dc.identifier | https://app.uff.br/riuff/handle/1/5445 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/769855 | - |
Descrição: dc.description | A voz é um fenômeno físico resultante da propagação do fluxo de ar, proveniente dos pulmões, através da glote e do trato vocal, com posterior irradiação pela boca. A particularidade dos órgãos envolvidos no processo de geração da voz torna a fala um sinal biométrico, permitindo seu uso para verificação de locutor e, consequentemente, uma chave de acesso em ambientes restritos ou de dados privados, por exemplo. Este trabalho de conclusão de curso apresenta o desenvolvimento de uma ferramenta para verificação de locutor, unindo duas diferentes técnicas para extrair características de sinais de voz: os coeficientes cepstrais de frequência Mel (Mel Frequency Cepstrum Coefficients - MFCCs) e os parâmetros calculados a partir do sinal glotal, que é um sinal de pressão obtido imediatamente após a passagem do ar pelas cordas vocais. O uso de características extraídas do sinal glotal é a grande novidade e a principal contribuição deste trabalho. O sinal glotal foi obtido por um processo de filtragem inversa. Todos os parâmetros extraídos são usados como entradas de Modelos Ocultos de Markov (HMMs), que é uma ferramenta matemática para construir o modelo estocástico associado ao locutor. Os resultados mostram significativas melhoras na verificação de locutor quando comparados com os obtidos considerando apenas MFCCs, levando à conclusão de que os parâmetros extraídos do sinal glotal fornecem importantes informações sobre a identidade da voz | - |
Descrição: dc.description | Voice is a physical phenomenon resulting from the airflow propagation, coming from the lungs, through the glottis and the vocal tract, with posterior radiation by the mouth. The uniqueness of the organs involved in the voice generation process makes the speech a biometrical signal allowing its use to speaker verification and, consequently, as an access key to restrict environment or private data, for example. This undergraduate final work presents the development of a tool for speaker verification, by joining two different techniques to extract features from the voice signals: the Mel Frequency Cepstrum Coefficients (MFCCs) and the parameters calculated from the glottal signal, which is an acoustic pressure signal quasi-periodic obtained immediately after the air passing through the vocal folds. The use of the features extracted from the glottal signal is the great novelty and also the main contribution of this work. The glottal signal was obtained by an inverse filtering process and all the parameters extracted are used as entries of Hidden Markov Models (HMMs), which is a mathematical tool used to develop the stochastic model associated to the speaker. The results show significant improvement on the performance of the speaker verification system when compared with the ones obtained when only MFCCs are considered, leading to the conclusion that the features extracted from the glottal signal provide important information about the voice identity | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Federal Fluminense | - |
Publicador: dc.publisher | Niterói | - |
Direitos: dc.rights | openAccess | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Modelos escondidos de Markov | - |
Palavras-chave: dc.subject | Sinal glotal | - |
Palavras-chave: dc.subject | MFCC | - |
Palavras-chave: dc.subject | Produção da voz | - |
Palavras-chave: dc.subject | Sinal Glotal | - |
Palavras-chave: dc.subject | Modelo Markoviano | - |
Palavras-chave: dc.subject | Voz | - |
Palavras-chave: dc.subject | Speaker verification | - |
Palavras-chave: dc.subject | Hidden Markov Models | - |
Palavras-chave: dc.subject | Glottal signal | - |
Palavras-chave: dc.subject | Voice production | - |
Título: dc.title | Desenvolvimento de um sistema de verificação de locutor, usando modelos ocultos de Markov, unindo a técnica MFCC com parâmetros extraídos do sinal glotal | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: