Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Universidad Industrial de Santander | - |
Autor(es): dc.contributor | Universidade Estadual Paulista (UNESP) | - |
Autor(es): dc.creator | Vasquez-Serrano, P. | - |
Autor(es): dc.creator | Reyes-Moreno, J. | - |
Autor(es): dc.creator | Guido, Rodrigo Capobianco | - |
Autor(es): dc.creator | Sepúlveda-Sepúlveda, Alexander | - |
Data de aceite: dc.date.accessioned | 2025-08-21T21:44:27Z | - |
Data de disponibilização: dc.date.available | 2025-08-21T21:44:27Z | - |
Data de envio: dc.date.issued | 2025-04-29 | - |
Data de envio: dc.date.issued | 2022-12-31 | - |
Fonte completa do material: dc.identifier | http://dx.doi.org/10.1016/j.jvoice.2023.05.012 | - |
Fonte completa do material: dc.identifier | https://hdl.handle.net/11449/298915 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/11449/298915 | - |
Descrição: dc.description | On the one hand, the relationship between formant frequencies and vocal tract length (VTL) has been intensively studied over the years. On the other hand, the connection involving mel-frequency cepstral coefficients (MFCCs), which concisely codify the overall shape of a speaker's spectral envelope with just a few cepstral coefficients, and VTL has only been modestly analyzed, being worth of further investigation. Thus, based on different statistical models, this article explores the advantages and disadvantages of the latter approach, which is relatively novel, in contrast to the former which arises from more traditional studies. Additionally, VTL is assumed to be a static and inherent characteristic of speakers, that is, a single length parameter is frequently estimated per speaker. By contrast, in this paper we consider VTL estimation from a dynamic perspective using modern real-time Magnetic Resonance Imaging (rtMRI) to measure VTL in parallel with audio signals. To support the experiments, data obtained from USC-TIMIT magnetic resonance videos were used, allowing for the 2D real-time analysis of articulators in motion. As a result, we observed that the performance of MFCCs in case of speaker-dependent modeling is higher, however, in case of cross-speaker modeling, which uses different speakers’ data for training and evaluating, its performance is not significantly different of that obtained with formants. In complement, we note that the estimation based on MFCCs is robust, with an acceptable computational time complexity, coherent with the traditional approach. | - |
Descrição: dc.description | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) | - |
Descrição: dc.description | Escuela de Ing. Eléctrica Electrónica y de Telecomunicaciones (E3T) Universidad Industrial de Santander | - |
Descrição: dc.description | Instituto de Biociências Letras e Ciências Exatas Unesp – Univ Estadual Paulista (São Paulo State University), Rua Cristóvão Colombo 2265, Jd Nazareth, SP | - |
Descrição: dc.description | Instituto de Biociências Letras e Ciências Exatas Unesp – Univ Estadual Paulista (São Paulo State University), Rua Cristóvão Colombo 2265, Jd Nazareth, SP | - |
Idioma: dc.language | en | - |
Relação: dc.relation | Journal of Voice | - |
???dc.source???: dc.source | Scopus | - |
Palavras-chave: dc.subject | Acoustic-to-articulatory inversion | - |
Palavras-chave: dc.subject | Formants | - |
Palavras-chave: dc.subject | MFCCs | - |
Palavras-chave: dc.subject | Vocal tract length | - |
Título: dc.title | MFCC Parameters of the Speech Signal: An Alternative to Formant-Based Instantaneous Vocal Tract Length Estimation | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositório Institucional - Unesp |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: