QuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPola, Ives Renê Venturini-
Autor(es): dc.contributorPola, Fernanda Paula Barbosa-
Autor(es): dc.contributorPola, Ives Renê Venturini-
Autor(es): dc.contributorPola, Fernanda Paula Barbosa-
Autor(es): dc.contributorCasanova, Dalcimar-
Autor(es): dc.contributorCavalcanti, Pablo Gautério-
Autor(es): dc.creatorPilar, João Victor do-
Data de aceite: dc.date.accessioned2022-02-21T21:54:45Z-
Data de disponibilização: dc.date.available2022-02-21T21:54:45Z-
Data de envio: dc.date.issued2020-11-17-
Data de envio: dc.date.issued2020-11-17-
Data de envio: dc.date.issued2018-12-06-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/14612-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/663483-
Descrição: dc.descriptionThe class identification task for spatial databases can be achieved by clustering algorithms. However, it requires a domain knowledge to determine some input parameters to discover clusters and the improvement of its efficiency on large databases remains a challenge. Modern applications also deal with complex data and the comparison mechanisms are based on similarity predicates, which demands a new front of clustering algorithms. Complex data are usually immersed in metric spaces where distance functions are employed to express the similarity. Clustering becomes a difficult task due to the need of performing distance calculations. Density-based are one of the most interesting approaches to find clusters in metric spaces and have the advantage of finding clusters without the need of specifying the number of clusters to find. Although some suggested using indexes to speed up neighbor queries, they still process the entire space of elements calculating distances before finding clusters. In this paper we propose a new technique to separate clusters by using pivots selected at the border of the data space. Multiple pivots partition the data space into candidate clusters based on the desired density level, later all candidates are fused generating a good separation of clusters. Our technique can also be used prior to any existing clustering technique for a performance speed up. Therefore, we performed experiments by using one density clustering algorithm from literature and the results showed that our technique reduced the cost of the clustering process.-
Descrição: dc.descriptionA tarefa de identificação de classes para bancos de dados pode ser obtida por algoritmos de agrupamento. No entanto, é necessário um conhecimento de domínio para determinar alguns parâmetros de entrada para descobrir clusters e a melhoria de sua eficiência em grandes bancos de dados continua sendo um desafio. Aplicações modernas também lidam com dados complexos e os mecanismos de comparação são baseados em predicados de similaridade, o que exige uma nova frente de algoritmos de clustering. Dados complexos são geralmente imersos em espaços métricos onde funções de distância são empregadas para expressar a similaridade. O clustering se torna uma tarefa difícil devido à necessidade de realizar cálculos de distância. Algoritmos baseados em densidade são uma das abordagens para encontrar clusters em espaços métricos e têm a vantagem de encontrar clusters sem a necessidade de especificar o número de clusters a serem encontrados. Neste trabalho, propomos uma nova técnica para separar clusters usando pivôs selecionados na borda do espaço de dados. Vários pivôs particionam o espaço de dados em clusters candidatos com base no nível de densidade desejado, depois todos os candidatos são fundidos gerando uma boa separação de clusters. Nossa técnica também pode ser usada antes de qualquer técnica de agrupamento existente para realizar uma pré-filtragem.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherPato Branco-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Informática-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsembargoedAccess-
Palavras-chave: dc.subjectInstrumentos de medição - Densidade-
Palavras-chave: dc.subjectEspaços métricos-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Palavras-chave: dc.subjectMeasuring instruments - Density-
Palavras-chave: dc.subjectMetric spaces-
Palavras-chave: dc.subjectData mining-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::BANCO DE DADOS-
Título: dc.titleQuickDBC: uma separação rápida de clusters baseada em densidade para espaços métricos-
Título: dc.titleQuickDBC: Quick density-based clustering separation for metric spaces-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.