Comparação de modelos de aprendizado de máquina para a predição de churn

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorGarde, Ivan Aritz Aldaya-
Autor(es): dc.contributorUniversidade Estadual Paulista (UNESP)-
Autor(es): dc.creatorMiamoto, Eduardo Yukio-
Data de aceite: dc.date.accessioned2025-08-21T16:28:18Z-
Data de disponibilização: dc.date.available2025-08-21T16:28:18Z-
Data de envio: dc.date.issued2024-12-15-
Data de envio: dc.date.issued2024-12-15-
Data de envio: dc.date.issued2024-12-02-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/11449/259107-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/11449/259107-
Descrição: dc.descriptionEste trabalho analisa e compara três algoritmos de aprendizado de máquina — árvore de decisão, floresta aleatória e LightGBM — com o objetivo de prever o churn de vendedores em um marketplace de e-commerce. O estudo utilizou um conjunto de dados real de transações para avaliar a capacidade preditiva dos modelos, considerando o desafio do desbalanceamento das classes. Para garantir a robustez dos resultados, a métrica AUC (Área Sob a Curva) foi adotada, evitando distorções comuns em dados desbalanceados. A pesquisa explorou a influência de diferentes volumes de dados na performance dos algoritmos, com testes realizados tanto na base de dados inicialmente analisada quanto em uma base expandida. Os melhores modelos foram selecionados com base em suas configurações de hiperparâmetros e avaliados em três amostras: treino, teste e fora do tempo (out of time OOT). O estudo conclui que a base expandida melhora o desempenho do LightGBM, enquanto o aumento de dados não altera significativamente os resultados dos outros modelos. Este trabalho fornece insights relevantes para estratégias de retenção em plataformas de e-commerce.-
Descrição: dc.descriptionThis study analyzes and compares three machine learning algorithms—decision tree, random forest, and LightGBM—with the objective of predicting vendor churn in an e-commerce marketplace. The research utilized real transaction data to evaluate the predictive capabilities of these models, considering the challenges posed by class imbalance. To ensure robust results, the AUC (Area Under the Curve) metric was adopted, avoiding common distortions in imbalanced data. The study explored the influence of different data volumes on algorithm performance, with tests conducted on both the initially analyzed and an expanded dataset. The top-performing models were selected based on their hyperparameter configurations and evaluated across three samples: training, testing, and out-of-time (OOT). The study concludes that the expanded dataset significantly enhances the LightGBM’s performance, while data increase does not substantially alter the results of the other models. This research offers valuable insights for retention strategies in e-commerce platforms.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Estadual Paulista (UNESP)-
Direitos: dc.rightsinfo:eu-repo/semantics/openAccess-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectÁrvores de decisão-
Palavras-chave: dc.subjectComércio eletrônico-
Título: dc.titleComparação de modelos de aprendizado de máquina para a predição de churn-
Título: dc.titleComparison of machine learning models for churn prediction-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Unesp

Não existem arquivos associados a este item.