Seleção de atributos e aprendizagem de máquina na detecção e classificação de patologias da laringe

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorScalassara, Paulo Rogerio-
Autor(es): dc.contributorhttps://orcid.org/0000-0001-7169-954X-
Autor(es): dc.contributorhttps://lattes.cnpq.br/5016119298122922-
Autor(es): dc.contributorCastoldi, Marcelo Favoretto-
Autor(es): dc.contributorhttps://lattes.cnpq.br/6178029384175205-
Autor(es): dc.contributorScalassara, Paulo Rogerio-
Autor(es): dc.contributorhttps://lattes.cnpq.br/5016119298122922-
Autor(es): dc.contributorGuido, Rodrigo Capobianco-
Autor(es): dc.contributorhttps://orcid.org/0000-0002-0924-8024-
Autor(es): dc.contributorhttp://lattes.cnpq.br/6542086226808067-
Autor(es): dc.contributorSouza, Wesley Angelino de-
Autor(es): dc.contributorhttps://lattes.cnpq.br/8594457321079718-
Autor(es): dc.creatorPignelli, Rogerio-
Data de aceite: dc.date.accessioned2025-08-29T13:24:58Z-
Data de disponibilização: dc.date.available2025-08-29T13:24:58Z-
Data de envio: dc.date.issued2025-08-26-
Data de envio: dc.date.issued2025-08-26-
Data de envio: dc.date.issued2025-08-05-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/38020-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1112881-
Descrição: dc.descriptionVoice disorders affect millions of people worldwide, compromising communication abilities and often indicating underlying pathologies. The rapid diagnosis of these disorders is crucial for improving patient quality of life. Traditional methods based on visual inspection via laryngoscopy and subjective evaluations by healthcare professionals require significant resources and time. Consequently, speech processing and machine learning techniques have been applied to assist in the pre-diagnosis of laryngeal disorders with the intent of reducing the amount of invasive procedures when not strictly required. In this work, we investigate three distinct approaches. Initially, we employ feature extraction through Wavelet-Packet decomposition for the identification of Reinke’s edema, comparing the performance of SVM and MLP algorithms. Next, optimization algorithms are applied to determine the ideal number of layers and neurons per layer in the MLP, aiming to enhance the identification of Reinke’s edema. Finally, a methodology for interpretability in voice disorder classification is proposed through the careful selection of features, with the objective of identifying the most significant contributors for discriminating among multiple pathologies. Wavelet-packet features with SVM delivered 100% accuracy in the identification of Reinke’s edema with a similar performance achieved by a PSO-optimized MLP. By applying feature reduction and explainability methods, we found 16 features that resulted in F1-score of 0.62 in the most demanding cross-database analysis. Shimmer and the second coefficient of MFCC were the most relevant features for the detection of voice disorders, aligning with clinical threshold and reinforcing the relevance of the selected features.-
Descrição: dc.descriptionCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)-
Descrição: dc.descriptionDistúrbios vocais afetam milhões de pessoas globalmente, comprometendo a capacidade de comunicação e, frequentemente, indicando patologias subjacentes. O diagnóstico rápido desses distúrbios é crucial para a melhoria das condições dos pacientes. Os métodos tradicionais, baseados em inspeções visuais com laringoscopia e avaliações subjetivas dos profissionais de saúde, demandam elevados recursos e tempo. Em virtude disso, técnicas de processamento de fala e aprendizado de máquina têm sido empregadas para auxiliar no pré-diagnóstico de distúrbios da laringe com o objetivo de reduzir a quantidade de procedimentos invasivos quando não são estritamente necessários. Este trabalho investiga três abordagens distintas. Na primeira abordagem, utiliza-se a extração de atributos por meio da decomposição Wavelet-Packet para a identificação do edema de Reinke, comparando o desempenho dos algoritmos SVM e MLP. Na segunda abordagem, são aplicados algoritmos de otimização para determinar a quantidade ideal de camadas e neurônios por camada na MLP, visando aprimorar a identificação do edema de Reinke. Na terceira abordagem, propõe-se uma metodologia de interpretabilidade para a classificação de distúrbios vocais através da seleção criteriosa de atributos, com o objetivo de identificar os principais contribuintes para a discriminação de distúrbios vocais entre diferentes bancos de dados. A segunda abordagem é uma consequência da primeira, e a terceira é uma expansão do tópico da pesquisa sem ter uma conexão direta com as duas primeiras abordagens. Os atributos baseados em wavelet-packet, aliados ao SVM, alcançaram 100% de acurácia na identificação do edema de Reinke, seguido pelo resultado do MLP otimizado por PSO. Após aplicar técnicas de redução de atributos e interpretabilidade, foi selecionado um conjunto de 16 atributos que obteve F1-score de 0,62 no cenário mais desafiador entre bancos de dados. Shimmer e o segundo coeficiente MFCC surgiram como os atributos mais relevantes para a detecção de distúrbios vocais, em conformidade com limiares clínicos, reforçando a importância dos atributos escolhidos.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languageen-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCornelio Procopio-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherPrograma de Pós-Graduação em Engenharia Elétrica-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectPatologia-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectFala-
Palavras-chave: dc.subjectPathology-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectSpeech-
Palavras-chave: dc.subjectCNPQ::CIENCIAS SOCIAIS APLICADAS-
Palavras-chave: dc.subjectEngenharia Elétrica-
Título: dc.titleSeleção de atributos e aprendizagem de máquina na detecção e classificação de patologias da laringe-
Título: dc.titleFeature selection and machine learning in the detection and classification of voice disorders-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.