Um estudo exploratório sobre a criação de modelos de predição cruzada de defeitos apoiada por uma medida de correlação

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRé, Reginaldo-
Autor(es): dc.contributorRé, Reginaldo-
Autor(es): dc.contributorGonçalves, Diego Bertolini-
Autor(es): dc.contributorWiese, Igor Scaliante-
Autor(es): dc.creatorPaula, Samuel de-
Data de aceite: dc.date.accessioned2022-02-21T22:25:08Z-
Data de disponibilização: dc.date.available2022-02-21T22:25:08Z-
Data de envio: dc.date.issued2020-11-08-
Data de envio: dc.date.issued2020-11-08-
Data de envio: dc.date.issued2016-06-23-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/6024-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/674680-
Descrição: dc.descriptionDefect prediction in software is a difficult task, especially when the target project is in early stage of development, because in this stage the project does not have historical data that can be used to train a prediction model. In this case, it is necessary to find projects that matches to the target project in order to use their historical data. This aproach is named cross-project prediction. This work aims to analyze an alternative method to clustering the projects. Our proposal is to group prediction models so that they can share their sets of training data. The groups were created by clustering algorithm called Basic Sequential Algorithmic Scheme (BSAS), using a measure of correlation known as Matthews Correlation Coefficient (MCC) to compute similarity models. When grouped, the training data models results to a single training set, giving rise to models cross-project prediction. The results obtained by analyzing the MCC values computed by prediction models indicate that the created models have low predictive performance, while the indicators used in similar studies indicate models with good performance. Therefore, we can concluded that the MCC correlation measure is a more robust measure of performance than other prediction models, and it contributes to the reduction of the class imbalance problem.-
Descrição: dc.descriptionPredizer defeitos em software é uma tarefa difícil, principalmente quando o projeto alvo está em fase inicial de desenvolvimento, pois nessa fase o projeto não possui uma base de dados histórica consolidada que possa ser utilizada para treinar um modelo de predição. Neste caso, é preciso encontrar projetos semelhantes ao projeto alvo para que, a partir de seus dados históricos, modelos de predição possam ser elaborados, essa técnica recebe o nome de predição cruzada de defeitos. Esse trabalho tem como objetivo analisar uma forma alternativa para o agrupamento de projetos. A proposta consiste em agrupar modelos de predição de forma que possam compartilhar seus conjuntos de dados de treinamento. Os agrupamentos foram criados pelo algoritmo de clusterização BSAS (do inglês, Basic Sequential Algorithmic Scheme), utilizando uma medida de correlação denominada MCC (do inglês, Matthews correlation coefficient) para cálculo de semelhança dos modelos. Uma vez agrupados, os dados de treinamento dos modelos podem formar um único conjunto de treinamento, dando origem a modelos de predição cruzada de defeitos. Os resultados obtidos através da análise dos valores de MCC obtidos pelos modelos de predição indicam que os modelos criados possuem baixo desempenho preditivo enquanto que os indicadores utilizados em trabalhos semelhantes indicam modelos com bom desempenho. Portanto, conclui-se que, a medida de correlação MCC é uma medida de desempenho mais robusta que as demais para análise de modelos de predição e que ela contribui para a redução do problema de desbalanceamento de classes.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCampo Mourao-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Computação-
Publicador: dc.publisherCiência da Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectFalhas de sistemas de computação-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectSoftware - Validação-
Palavras-chave: dc.subjectComputer system failures-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectComputer software - Validation-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleUm estudo exploratório sobre a criação de modelos de predição cruzada de defeitos apoiada por uma medida de correlação-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.