Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Universidade de São Paulo (USP) | - |
Autor(es): dc.contributor | Universidade Estadual Paulista (UNESP) | - |
Autor(es): dc.creator | Lima, Rodrigo | - |
Autor(es): dc.creator | Leal, Sidney E. | - |
Autor(es): dc.creator | Junior, Arnaldo Candido | - |
Autor(es): dc.creator | Aluísio, Sandra M. | - |
Data de aceite: dc.date.accessioned | 2025-08-21T16:09:07Z | - |
Data de disponibilização: dc.date.available | 2025-08-21T16:09:07Z | - |
Data de envio: dc.date.issued | 2025-04-29 | - |
Data de envio: dc.date.issued | 2024-12-31 | - |
Fonte completa do material: dc.identifier | http://dx.doi.org/10.1007/978-3-031-79029-4_3 | - |
Fonte completa do material: dc.identifier | https://hdl.handle.net/11449/306172 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/11449/306172 | - |
Descrição: dc.description | We present a freely available spontaneous speech corpus for the Brazilian Portuguese language and report preliminary automatic speech recognition (ASR) results, using both the Wav2Vec2-XLSR-53 and Distil-Whisper models fine-tuned and trained on our corpus. The NURC-SP Audio Corpus comprises 401 different speakers (204 females, 197 males) with a total of 239.30 h of transcribed audio recordings. To the best of our knowledge, this is the first large Paulistano accented spontaneous speech corpus dedicated to the ASR task in Portuguese. We first present the design and development procedures of the NURC-SP Audio Corpus, and then describe four ASR experiments in detail. The experiments demonstrated promising results for the applicability of the corpus for ASR. Specifically, we fine-tuned two versions of Wav2Vec2-XLSR-53 model, trained a Distil-Whisper model using our dataset with labels determined by Whisper Large-V3 model, and fine-tuned this Distil-Whisper model with our corpus. Our best results were the Distil-Whisper fine-tuned over NURC-SP Audio Corpus with a WER of 24.22% followed by a fine-tuned versions of Wav2Vec2-XLSR-53 model with a WER of 33.73%, that is almost 10% point worse than Distil-Whisper’s. To enable experiment reproducibility, we share the NURC-SP Audio Corpus dataset, pre-trained models, and training recipes in Hugging-Face and Github repositories. | - |
Descrição: dc.description | Ministério da Ciência, Tecnologia e Inovação | - |
Descrição: dc.description | University of São Paulo, SP | - |
Descrição: dc.description | Universidade Estadual Paulista, SP | - |
Descrição: dc.description | Universidade Estadual Paulista, SP | - |
Formato: dc.format | 33-47 | - |
Idioma: dc.language | en | - |
Relação: dc.relation | Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) | - |
???dc.source???: dc.source | Scopus | - |
Palavras-chave: dc.subject | Automatic speech recognition evaluation | - |
Palavras-chave: dc.subject | Brazilian Portuguese | - |
Palavras-chave: dc.subject | Public speech corpora | - |
Palavras-chave: dc.subject | Spontaneous speech | - |
Título: dc.title | A Large Dataset of Spontaneous Speech with the Accent Spoken in São Paulo for Automatic Speech Recognition Evaluation | - |
Tipo de arquivo: dc.type | aula digital | - |
Aparece nas coleções: | Repositório Institucional - Unesp |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: