Explorando técnicas de redução de base de dados na mineração de padrões sequênciais

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCarvalho, Alexandre Plastino de-
Autor(es): dc.contributorCPF:30090875322-
Autor(es): dc.contributorhttp://lattes.cnpq.br/4985266524417261-
Autor(es): dc.contributorZadrozny, Bianca-
Autor(es): dc.contributorCPF:33280712222-
Autor(es): dc.contributorhttp://lattes.cnpq.br/1058528453390010-
Autor(es): dc.contributorTraina Junior, Caetano-
Autor(es): dc.contributorCPF:34320900722-
Autor(es): dc.contributorhttp://lattes.cnpq.br/5118629875846648-
Autor(es): dc.creatorBarbosa, Ciro Bastos-
Data de aceite: dc.date.accessioned2024-07-11T17:28:21Z-
Data de disponibilização: dc.date.available2024-07-11T17:28:21Z-
Data de envio: dc.date.issued2021-03-10-
Data de envio: dc.date.issued2008-03-05-
Data de envio: dc.date.issued2021-03-10-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/17106-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/750980-
Descrição: dc.descriptionDuring the last ten years, many algorithms have been proposed to mine sequential patterns. Some of them are based on the Apriori algorithm, developed to iteratively mine frequent itemsets, for example the GSP algorithm. Results obtained from experiments using these category of algorithms have shown that the candidate support count phase spends a huge part of the execution time. In this work, aiming at reducing the computational cost of multiple database scans and the computational effort to count the support of the candidate sequences, typical of iterative algorithms for the problem of mining sequential patterns, we propose the progressive reduction of the database during the execution of the algorithm. Therefore, fewer transactions are read at each iteration and the computational cost of counting the support of each candidate is reduced. Results obtained from evaluating different combinations of databases and minimum supports have shown that the database pruning techniques, adopted by the proposed algorithm GSP2P, significantly reduce the total execution time of the GSP2 algorithm (implementation of GSP), which does not use pruning mechanisms. In this same work, aiming at validating the use of the proposed database pruning techniques and extending their applications, the techniques were applied to the problem of constraint-based sequential patterns mining. Results obtained from evaluating different combinations of databases and constraint selectivity values have shown that the database pruning techniques, adopted by the proposed algorithm GSP2P-F, significantly reduce the total execution time of the GSP2-F algorithm, which does not use pruning mechanisms.-
Descrição: dc.descriptionAo longo dos últimos dez anos, estratégias para extração de padrões seqüenciais vêm sendo desenvolvidas e aprimoradas. Algumas delas têm como base o algoritmo iterativo Apriori, desenvolvido para a extração de conjuntos freqüentes, como por exemplo a estratégia GSP. Experimentos computacionais realizados nesta categoria de estratégias indicam que a etapa de identificação das seqüências freqüentes (padrões seqüenciais), ou seja, a fase de contagem do suporte das seqüências candidatas consome grande parte do tempo total de execução. Sendo assim, nesta dissertação, com o objetivo de reduzir o custo de diversas leituras da base de dados e o esforço computacional da fase de contagem de seqüências candidatas, típicos dos algoritmos iterativos de extração de padrões seqüenciais, propõe-se a redução progressiva da base de dados ao longo da execução das iterações. Desta forma, menos transações são lidas a cada iteração e menor passa a ser o custo computacional para a obtenção do suporte de cada seqüência candidata. Os resultados avaliados, a partir de diferentes combinações de bases de dados e suportes mínimos, mostraram que as técnicas de redução de base implementadas no algoritmo proposto GSP2P reduzem significativamente o tempo de execução total do algoritmo sem poda de base GSP2 (implementação do GSP). Neste mesmo trabalho, com o objetivo de validar o uso das técnicas propostas e estender as suas aplicações, as técnicas de redução de base foram aplicadas ao problema de extração de padrões seqüenciais baseada em restrições. Os resultados avaliados, a partir de diferentes combinações de bases de dados e valores de seletividade das restrições, mostraram que as técnicas de redução de base implementadas no algoritmo proposto GSP2P-F reduzem significativamente o tempo de execução total do algoritmo sem poda de base GSP2-F.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherPrograma de Pós-Graduação em Computação-
Publicador: dc.publisherComputação-
Direitos: dc.rightsAcesso Aberto-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectCiência da computação-
Palavras-chave: dc.subjectAlgoritmo-
Palavras-chave: dc.subjectOtimização combinatória-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO-
Título: dc.titleExplorando técnicas de redução de base de dados na mineração de padrões sequênciais-
Tipo de arquivo: dc.typeDissertação-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.