Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Borges, Helyane Bronoski | - |
Autor(es): dc.contributor | https://orcid.org/0000-0002-9153-3819 | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/8340106221427112 | - |
Autor(es): dc.contributor | Borges, Helyane Bronoski | - |
Autor(es): dc.contributor | https://orcid.org/0000-0002-9153-3819 | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/8340106221427112 | - |
Autor(es): dc.contributor | Souza, Bruno Feres de | - |
Autor(es): dc.contributor | https://orcid.org/0000-0003-1997-4983 | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/4112635495117258 | - |
Autor(es): dc.contributor | Matos, Simone Nasser | - |
Autor(es): dc.contributor | https://orcid.org/0000-0002-5362-2343 | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/2608583610949216 | - |
Autor(es): dc.creator | Vieira, Raimundo Osvaldo | - |
Data de aceite: dc.date.accessioned | 2025-08-29T13:15:06Z | - |
Data de disponibilização: dc.date.available | 2025-08-29T13:15:06Z | - |
Data de envio: dc.date.issued | 2022-10-16 | - |
Data de envio: dc.date.issued | 2022-10-16 | - |
Data de envio: dc.date.issued | 2022-07-07 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/29933 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1109951 | - |
Descrição: dc.description | Hierarchical multi-label classification problems usually need to deal with datasets that have a large number of attributes and labels, which can negatively interfere with the performance of the classifier. The application of dimensionality reduction methods can provide a significant improvement in the performance of classifiers. Feature selection is one of the dimensionality reduction methods in databases and comprises choosing the most relevant attributes from the originals. Three main approaches to feature selection can be used: filter, wrapper and embedded. In particular, the filter approach makes the selection based only on the characteristics of the data itself and independently of the training algorithm. In the context of hierarchical multi-label classification, some feature selection methods have been proposed. These methods make use of consolidated techniques in contexts of flat classification and single-label classification, showing good results. In this sense, this work investigated the applicability of the Fisher Score measure for the feature selection in hierarchical multi-label classification scenarios and proposed a method for this task using the filter approach. The FSF-HMC method consists of evaluating the attributes from the individual calculation of the Fisher Score. This calculation has been adapted to consider the class hierarchy. The attributes evaluated with a score above the average Fisher Score calculated for all attributes are selected to compose the reduced dataset that will be used to evaluate the classifier. To validate the proposed method, experiments were performed with 10 Gene Ontology databases. These experiments consisted of evaluating the performance of two multi-label hierarchical classifiers, Clus-HMC and MHC-CNN, in terms of the AUPRC measure, with a comparison of the results produced from the original datasets and the reduced datasets. The results of the experiments demonstrate that there was a gain in terms of the percentage of reduction in the number of attributes over the original data and that the performance of the classifiers was statistically equivalent for the original and reduced datasets. | - |
Descrição: dc.description | Problemas de classificação hierárquica multirrótulo normalmente precisam lidar com conjuntos de dados que possuem grande número de atributos e rótulos, o que pode interferir de forma negativa no desempenho do classificador. A aplicação de métodos de redução de dimensionalidade pode prover uma melhora significativa no desempenho dos classificadores. A seleção de atributos é um dos métodos de redução de dimensionalidade em bases de dados e compreende a escolha dos atributos mais relevantes a partir dos originais. Três abordagens principais para a seleção de atributos podem ser utilizadas: filtro, wrapper e embutida. De modo particular, a abordagem filtro faz a seleção baseado apenas nas características dos próprios dados e de maneira independente do algoritmo de treinamento. No contexto da classificação hierárquica multirrótulo, alguns métodos de seleção de atributos têm sido propostos. Estes métodos fazem uso de técnicas consolidadas em contextos de classificação plana e classificação monorrótulo, apresentando bons resultados. Neste sentido, este trabalho verificou a aplicabilidade da medida Fisher Score para a seleção de atributos em cenários de classificação hierárquica multirrótulo e propôs um método para esta tarefa utilizando a abordagem filtro. O método FSF-HMC consiste em avaliar os atributos a partir do cálculo individual do Fisher Score. Este cálculo foi adaptado para considerar a hierarquia de classes. Os atributos avaliados com pontuação acima do valor médio de Fisher Score apurado para todos os atributos são selecionados para compor o conjunto de dados reduzido que será utilizado para avaliação do classificador. Para validação do método proposto foram realizados experimentos com 10 bases de dados da Gene Ontology. Tais experimentos consistiram em avaliar o desempenho de dois classificadores hierárquicos multirrótulo, Clus-HMC e MHC-CNN, em termos da medida AUPRC, sendo realizada uma comparação dos resultados produzidos a partir dos conjuntos de dados originais e dos conjuntos de dados reduzidos. Os resultados dos experimentos demonstram que houve um ganho em termos do percentual de redução do número de atributos sobre os dados originais e que o desempenho dos classificadores foi estatisticamente equivalente para os conjuntos de dados originais e reduzidos. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Ponta Grossa | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Programa de Pós-Graduação em Ciência da Computação | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Direitos: dc.rights | http://creativecommons.org/licenses/by-nc-sa/4.0/ | - |
Palavras-chave: dc.subject | Classificação | - |
Palavras-chave: dc.subject | Análise dimensional | - |
Palavras-chave: dc.subject | Banco de dados | - |
Palavras-chave: dc.subject | Classification | - |
Palavras-chave: dc.subject | Dimensional analysis | - |
Palavras-chave: dc.subject | Data bases | - |
Palavras-chave: dc.subject | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | - |
Palavras-chave: dc.subject | Engenharia/Tecnologia/Gestão | - |
Título: dc.title | Um método para seleção de atributos em bases de dados de classificação hierárquica multirrótulo | - |
Título: dc.title | A method for feature selection on databases of hierarchical multilabel classification | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: