Comparativo visual e analítico de algoritmos de redução de dimensionalidade

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCasanova, Dalcimar-
Autor(es): dc.contributorCasanova, Dalcimar-
Autor(es): dc.contributorSouthier, Luiz Fernando Puttow-
Autor(es): dc.contributorDal Molin, Viviane-
Autor(es): dc.creatorYokoyama, Matheus Felipin-
Data de aceite: dc.date.accessioned2025-08-29T13:38:32Z-
Data de disponibilização: dc.date.available2025-08-29T13:38:32Z-
Data de envio: dc.date.issued2023-07-06-
Data de envio: dc.date.issued2023-07-06-
Data de envio: dc.date.issued2023-06-22-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/31683-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1116797-
Descrição: dc.descriptionHigh-dimensional data often pose challenges in terms of visualization and utilization in classification algorithms. Processing such data can be time-consuming and computationally demanding. However, there exist low-dimensional datasets that exhibit structures utilized in the field known as Manifold Learning. To study the structures of the data, as well as reduce the input for classifiers, optimize processing time, and decrease data complexity, dimensionality reduction algorithms are employed. In this work, a selection of algorithms including PCA, MDS, Isomap, LLE, Random Trees, t-SNE, and Autoencoder were used to identify the approach that best represented the information visually, while assessing whether the nature of the data was affected by distortions occurring during the dimensionality reduction process. Synthetic datasets such as Swiss Roll, S Curve, and Hello, as well as real datasets like MNIST and Iris, were utilized to apply these dimensionality reduction algorithms. The results of this study showed that, based on Kruskal Stress metric, the algorithms exhibited distortions, except for PCA on the Hello dataset. In terms of visual comparison, for Swiss Roll, S Curve, Hello, and Iris datasets, PCA and MDS algorithms yielded better interpretability, whereas t-SNE achieved superior results for MNIST, contrasting with other algorithms for both datasets.-
Descrição: dc.descriptionDados de alta dimensionalidade geralmente apresentam desafios quando se tratam de visualização e utilização em algoritmos de classificação. O processamento dos dados pode ser demorado e exigir grande poder computacional. Todavia, existem dados de baixa dimensionalidade que possuem estruturas utilizadas no campo conhecido como Manifold Learning. Para estudar as estruturas dos dados, bem como reduzir a entrada para classificadores, otimizar o tempo de processamento e diminuir a complexidade dos dados, existem algoritmos de redução de dimensionalidade. Neste trabalho, utilizou-se uma seleção de algoritmos como PCA, MDS, Isomap, LLE, Random Trees, t-SNE e Autoencoder para identificar a abordagem que melhor representava as informações de forma visual, verificando se a natureza dos dados era afetada por distorções que ocorriam no processo de redução de dimensionalidade e avaliou-se a qualidade dos resultados de acordo com a métrica Estresse de Kruskal. Para isso, fez-se o uso das bases de dados sintéticas como Rolo Suíço, Curva S, Hello, e bases reais como MNIST e Iris. Realizou-se a aplicação das mesmas nos algoritmos de redução de dimensionalidade. Os resultados deste trabalho demonstraram que, de acordo com o Estresse de Kruskal, os algoritmos obtiveram uma distorção, exceto PCA para a base Hello. Quanto à comparação visual, para as bases Rolo Suíço, Curva S, Hello e Iris, os algoritmos PCA e MDS resultaram em uma melhor visualização interpretativa, enquanto para MNIST, o t-SNE obteve esse resultado, diferentemente dos demais algoritmos para ambas as bases.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherPato Branco-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Informática-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by-sa/4.0/-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectEstresse ocupacional-
Palavras-chave: dc.subjectAlgoritmos-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectJob stress-
Palavras-chave: dc.subjectAlgorithms-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleComparativo visual e analítico de algoritmos de redução de dimensionalidade-
Título: dc.titleVisual and analytical comparison of dimensionality reduction algorithms-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.