Avaliação de técnicas de classificação para dados desbalanceados

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorOliveira, Luiz Eduardo Gomes de, 1995--
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data-
Autor(es): dc.creatorDella-Justina, Hellen Mathei-
Data de aceite: dc.date.accessioned2025-09-01T11:26:39Z-
Data de disponibilização: dc.date.available2025-09-01T11:26:39Z-
Data de envio: dc.date.issued2023-12-26-
Data de envio: dc.date.issued2023-12-26-
Data de envio: dc.date.issued2022-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/85885-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/85885-
Descrição: dc.descriptionOrientador: Prof. Dr. Luiz Eduardo Soares de Oliveira-
Descrição: dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Data-
Descrição: dc.descriptionInclui referências-
Descrição: dc.descriptionResumo: Um conjunto de dados desbalanceado ocorre quando há diferença no número de amostras em diferentes classes. A fase de aprendizagem para a predição do modelo pode ser afetada em caso de dados desbalanceados. Então, neste estudo, foram aplicadas técnicas de oversampling e undesampling para lidar com dados desbalanceados. Os resultados mostraram um melhor desempenho do modelo Random Forest e das técnicas de oversampling para as métricas acurácia e precisão, um melhor desempenho das técnicas de oversampling para a métrica F1 e um melhor desempenho das técnicas de undersampling para as métricas recall e área sob a curva ROC-
Descrição: dc.descriptionAbstract: An imbalanced data occurs when there is a difference between the distribution of classes within a dataset. Machine learning models can be influenced by imbalanced datasets. So, in this study, it was applied the oversampling and undersampling techniques to deal with imbalanced data. The results show a better model performance for Random Forest and oversampling techniques for accuracy and precision metrics, a better oversampling performance for F1 metric, and a better undersampling performance for recall and ROC curve metrics-
Formato: dc.format1 recurso online : PDF.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectProbabilidades - Processamento de dados-
Título: dc.titleAvaliação de técnicas de classificação para dados desbalanceados-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.