Extração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorSteiner, Maria Teresinha Arns, 1957--
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia-
Autor(es): dc.creatorPavanelli, Genival-
Data de aceite: dc.date.accessioned2019-08-22T00:15:57Z-
Data de disponibilização: dc.date.available2019-08-22T00:15:57Z-
Data de envio: dc.date.issued2014-09-30-
Data de envio: dc.date.issued2014-09-30-
Data de envio: dc.date.issued2014-
Fonte completa do material: dc.identifierhttp://hdl.handle.net/1884/36129-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/36129-
Descrição: dc.descriptionOrientadora : Prof. Dr. Maria Teresinha Arns Steiner-
Descrição: dc.descriptionTese (doutorado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa: Curitiba, 28/05/2014-
Descrição: dc.descriptionInclui referências-
Descrição: dc.descriptionResumo: O processo de gestão do conhecimento nas mais diversas áreas – seja em indústrias, hospitais, escolas, bancos, dentre outros – exige constante atenção à multiplicidade de decisões a serem tomadas acerca de suas atividades. Para a tomada de decisões, faz-se necessária a utilização de técnicas científicas que lhes garantam a máxima acurácia. O presente trabalho faz o uso de ferramentas matemáticas que cumpram a finalidade de extração de conhecimento de base de dados. O objetivo é a proposição de uma nova meta-heurística, baseada no procedimento GRASP (Greedy Randomized Adaptive Search Procedure) como ferramenta de Data Mining (DM), no contexto do processo denominado Knowledge Discovery in Databases (KDD) para a tarefa de extração de regras de classificação em bases de dados. Assim, a metodologia aqui proposta possui três grandes blocos segundo o processo KDD: pré-processamento dos dados, no qual todos os atributos previsores são codificados de maneira a corresponder a uma ou mais coordenadas binárias; aplicação da meta-heurística propriamente dita para extração de regras de classificação; construção do classificador, momento em que as regras extraídas são ordenadas segundo critérios baseados no "fator de suporte" e na "confiança". A fim de validar esta proposta, a metodologia foi implementada e aplicada a sete bases de dados distintas, com um número variável de instâncias, de atributos e de classes. Os resultados obtidos apresentam elevada precisão preditiva, atingindo, por exemplo, 98% de acurácia para a base de dados zoo, 97% para a base íris e 94% para a base wine. Buscando ratificar os resultados obtidos, foram estabelecidas comparações entre a meta-heurística aqui proposta e os algoritmos BFTree, RepTree e J4.8, todos de árvore de decisão. A partir destas comparações, observa-se que em seis das sete bases analisadas a proposta implementada é superior, em termos de acurácia, aos algoritmos de árvore de decisão utilizados. Desta forma, conclui-se que a meta-heurística proposta atende os pré-requisitos para a tarefa de extração de conhecimento de base de dados.-
Descrição: dc.descriptionAbstract: The process of knowledge management in several areas – existing in industries, hospitals, schools, banks, among others - requires constant attention to the multiplicity of decisions to be made about their activities. In order to make decisions, it is necessary to use scientific techniques that will ensure their maximum accuracy. This study makes use of mathematical tools that meet the purpose of extracting knowledge from a database. The aim is to propose a new metaheuristic based on GRASP (Greedy Randomized Adaptive Search Procedure) procedure as a tool of Data Mining (DM) within the context of the process called Knowledge Discovery in Databases (KDD) for the task of extracting classification rules in databases. Thus, the methodology proposed herein has three large blocks according to the KDD process: data pre-processing, in which all predictor attributes are encoded to correspond to one or more binary coordinates; application of the metaheuristic itself for extracting classification rules; construction of the classifier, when the extracted rules are ordered in accordance with criteria based on "support factor" and "trust." In order to validate this proposal, the methodology has been implemented and applied to seven different databases, with a variable number of instances, attributes and classes. The results show high predictive accuracy, reaching, for example, 98% accuracy in the zoo database, 97% for the iris base and 94% for the wine base. Seeking to ratify the results, comparisons between the metaheuristic proposed herein and BFTree, RepTree and J4.8 decision tree algorithms were established. Based on these comparisons, it is observed that in six out of seven analyzed bases the implemented proposal is superior, in terms of accuracy, to the used decision tree algorithms. In this way, it is concluded that the meta-heuristic proposed meets the prerequisites for the task of extracting knowledge from a database.-
Formato: dc.format130f. : il. algumas color., grafs., tabs.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Relação: dc.relationDisponível em formato digital-
Palavras-chave: dc.subjectTeses-
Palavras-chave: dc.subjectAnálise numérica-
Título: dc.titleExtração de regras de classificação de bases de dados por meio de procedimentos meta-heurísticos baseados em GRASP-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.