Reconhecimento de locutor em ambientes ruidosos: uma comparação entre os métodos de extração de características MFCC e ZCPA

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorFerreira, Edson Luiz Cataldo-
Autor(es): dc.contributor http://lattes.cnpq.br/5170756020561542-
Autor(es): dc.contributorCarvalho, Murilo Bresciani de-
Autor(es): dc.contributorhttp://lattes.cnpq.br/9879634744752250-
Autor(es): dc.contributorFerreira, Tadeu Nagashima-
Autor(es): dc.contributorhttp://lattes.cnpq.br/3756829511114463-
Autor(es): dc.contributorhttp://lattes.cnpq.br/6254976376717969-
Autor(es): dc.creatorSilva, Keren Ribeiro Falcão da-
Data de aceite: dc.date.accessioned2024-07-11T18:12:39Z-
Data de disponibilização: dc.date.available2024-07-11T18:12:39Z-
Data de envio: dc.date.issued2023-07-21-
Data de envio: dc.date.issued2023-07-21-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/29447-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/765830-
Descrição: dc.descriptionA comunicação por meio da voz é amplamente reconhecida como uma forma inerente e poderosa de interação humana. Por ser algo tão particular e individual para cada indivı́duo, a voz tem sido utilizada em diversas aplicações, em particular para a autenticação de usuários por máquinas. Neste trabalho foram comparadas as respostas de reconhecimento de locutor em ambientes ruidosos, utilizando dois métodos de extração de caracterı́sticas da voz, Mel Frequency Cepstral Coefficients (MFCC) e Zero Crossing with Peak Amplitude (ZCPA), em sistemas baseados em redes neurais recorrentes, em especial com células Long Short-Term Memory (LSTM). Os resultados obtidos indicaram que a abordagem baseada em ZCPA demonstrou robustez diante de ruı́dos, permitindo distinção entre o locutor e os impostores mesmo com nı́veis moderados de ruı́do, em oposição à técnica baseada em MFCC, que não conseguiu distinguir o locutor com ruı́dos moderados-
Descrição: dc.descriptionCommunication through voice is widely recognized as an inherent and powerful form of human interaction. Due to its unique and individual nature for each individual, voice has been applied in various domains, particularly for user authentication by machines. In this study, we compared speaker recognition responses in noisy environments using two voice feature extraction methods: Mel Frequency Cepstral Coefficients (MFCC) and Zero Crossing with Peak Amplitude (ZCPA), implemented in systems based on recurrent neural networks, specifically with Long Short-Term Memory (LSTM) cells. The results indicated that the ZCPA-based approach demonstrated robustness in noisy conditions, enabling distinction between the speaker and impostors even with moderate noise levels, in contrast to the MFCC-based technique, which failed to differentiate the speaker in the presence of moderate noise.-
Descrição: dc.description98 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectMFCC-
Palavras-chave: dc.subjectZCPA-
Palavras-chave: dc.subjectLSTM-
Palavras-chave: dc.subjectReconhecimento de locutor-
Palavras-chave: dc.subjectRedes neurais-
Palavras-chave: dc.subjectAmbientes ruidosos-
Palavras-chave: dc.subjectRede neural-
Palavras-chave: dc.subjectRuído-
Palavras-chave: dc.subjectVoz-
Palavras-chave: dc.subjectSpeaker recognition-
Palavras-chave: dc.subjectNeural networks-
Palavras-chave: dc.subjectNoisy environments-
Título: dc.titleReconhecimento de locutor em ambientes ruidosos: uma comparação entre os métodos de extração de características MFCC e ZCPA-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.