Comparação de tempo e resultado de algoritmos de agrupamento utilizando diferentes distâncias e bases de dados

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRodrigues, Érick Oliveira-
Autor(es): dc.contributorPegorini, Vinicius-
Autor(es): dc.contributorMarin, Luciene de Oliveira-
Autor(es): dc.contributorSouthier, Luiz Fernando Puttow-
Autor(es): dc.creatorCousseau, Gustavo-
Data de aceite: dc.date.accessioned2025-08-29T12:03:13Z-
Data de disponibilização: dc.date.available2025-08-29T12:03:13Z-
Data de envio: dc.date.issued2023-07-06-
Data de envio: dc.date.issued2023-07-06-
Data de envio: dc.date.issued2023-06-20-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/31682-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1088108-
Descrição: dc.descriptionThis work is a research analysis of unsupervised machine learning algorithms DBSCAN, K-Means and Mean-Shift using Canberra, Chebyshev, Euclidean, Minkowski and Rodrigues distances with some databases from the UCI repository. It aims to compare the average time that each algorithm takes to process eleven databases with ten different distances. In addition, compare the clusters obtained by DBSCAN and Mean-Shift in relation to K-Means. The results show that when using the number and positions of the clusters obtained in DBSCAN as inputs for K-Means and those obtained in Mean-Shift as inputs for K-means, derive from different clusters but with some equality. However, the equality is higher with the combination of Mean-Shift and K-means results. The lowest time averages were obtained by the K-Means algorithm and the highest by the Mean-Shift algorithm. And overall, the Chebyshev distance was responsible for the lowest time averages in 3 of the 4 methods. For these results, it is necessary to choose the appropriate input parameters to generate a considerable number of clusters in the DBSCAN and Mean-Shift algorithms.-
Descrição: dc.descriptionEsse trabalho é uma pesquisa de análise dos algoritmos de aprendizado de máquina não supervisionados DBSCAN, K-Means e Mean-Shift utilizando as distâncias Canberra, Chebyshev, Euclidiana, Minkowski e Rodrigues com algumas bases de dados que estão contidas no repositório da UCI. Tem como objetivo, comparar a média dos tempos que cada algoritmo demora para processar onze bases de dados com dez distâncias diferentes. Ainda, comparar os agrupamentos obtidos pelo DBSCAN e Mean-Shift em relação ao K-means. Os resultados mostram que ao utilizar a quantidade e as posições dos agrupamentos obtidos no DBSCAN como entradas para o K-Means e os obtidos no Mean-Shift como entradas para o K-Means, derivam de agrupamentos diferentes mas com alguma igualdade entre os agrupamentos. No entanto, a igualdade é maior com a combinação dos resultados do Mean-Shift com o K-Means. As menores médias de tempo foram obtidas pelo algoritmo K-Means e as maiores pelo algoritmo Mean-Shift. E no geral, a distância Chebyshev foi responsável pelas menores médias de tempo em 3 dos 4 métodos. Para esses resultados, é necessário a escolha dos parâmetros de entrada adequados para gerar um número considerável de agrupamentos nos algoritmos DBSCAN e Mean-Shift.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherPato Branco-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Informática-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectAlgorítmos computacionais-
Palavras-chave: dc.subjectAnálise por agrupamento-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectComputer algorithms-
Palavras-chave: dc.subjectCluster analysis-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleComparação de tempo e resultado de algoritmos de agrupamento utilizando diferentes distâncias e bases de dados-
Título: dc.titleTime and result comparison of clustering algorithms using several distances and databases-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.