Predição de evasão estudantil usando aprendizado de máquina

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMantovani, Rafael Gomes-
Autor(es): dc.contributorVismara, Edgar de Souza-
Autor(es): dc.contributorCarvalho, Luiz Fernando-
Autor(es): dc.contributorMantovani, Rafael Gomes-
Autor(es): dc.creatorParra, Pedro Mian-
Data de aceite: dc.date.accessioned2025-08-29T12:43:29Z-
Data de disponibilização: dc.date.available2025-08-29T12:43:29Z-
Data de envio: dc.date.issued2025-07-09-
Data de envio: dc.date.issued2025-07-09-
Data de envio: dc.date.issued2024-12-18-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/37398-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1100715-
Descrição: dc.descriptionIn recent years, dropout rates in Higher Education have intensified, causing negative impacts on students and institutions, particularly in the public sector, which suffers significant financial losses. Various factors contribute to this phenomenon, such as learning difficulties, inadequate course structures, and a lack of financial resources. This study proposes using Machine Learning (ML) algorithms to predict and identify behavioral patterns of students at risk of dropping out. For this purpose, experiments were conducted using data extracted from the academic system of the Federal Technological University of Paraná (UTFPR), Dois Vizinhos campus. The data were properly anonymized and pre-processed to ensure that sensitive information could not be accessed by the predictive models. Experiments were conducted with different predictive tasks, exploring the completeness of the records extracted from the university’s system. Additionally, four "interpretable" algorithms were explored, which provide rules or structures that allow managers to understand predictions and make informed management decisions. The experimental results showed that the best-performing algorithm was Random Forest, achieving the highest average F1-Score across all experiments, with a maximum value of 0.99. This result was obtained using the dataset containing only the latest student records from the academic system, considering a binary classification between “Regular vs. Dropout“ students, with attribute thresholds of 0.05 for constants and 0.8 for correlations. Although the results are promising, they still lack the inclusion of socioeconomic variables, which limits the system’s ability to understand the causes of dropout fully-
Descrição: dc.descriptionNos últimos anos, a evasão no Ensino Superior tem se intensificado, gerando impactos negativos tanto para os estudantes quanto para as instituições, especialmente no setor público, que sofre perdas financeiras significativas. Diversos fatores contribuem para esse fenômeno, como dificuldades de aprendizado, estrutura inadequada dos cursos e a falta de recursos financeiros. O presente estudo propõe utilizar algoritmos de Aprendizado de Máquina (AM) para prever e identificar padrões comportamentais de estudantes com risco de evasão. Para isso, foram realizados experimentos com dados extraídos do sistema acadêmico da Universidade Tecnológica Federal do Paraná (UTFPR), campus Dois Vizinhos. Os dados foram devidamente anonimizados e pré-processados, para que informações sensíveis não fossem acessadas pelos modelos preditivos. Foram realizados experimentos com diferentes tarefas preditivas explorando toda a completude dos registros extraídos do sistema da universidade. Explorou-se também quatro algoritmos "interpretáveis", que retornam regras das estruturas que permitem os gestores entenderem as predições e tomarem decisões de gestão. Os resultados experimentais mostraram que o melhor algoritmo avaliado foi o Random Forest, com melhor valor médio de F1-Score em todos os experimentos, e atingindo o valor máximo de 0,99 considerando o dataset com apenas os últimos registros dos alunos no sistema acadêmico, na classificação binária entre alunos “Regulares vs Desistentes” com limiares de atributos constantes de 0,05 e correlacionados de 0,8. Embora os resultados sejam promissores, eles ainda carecem da inclusão de variáveis socioeconômicas, o que limita a capacidade do sistema em compreender plenamente as causas da evasão.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherApucarana-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by-nc-sa/4.0/-
Palavras-chave: dc.subjectEvasão universitária-
Palavras-chave: dc.subjectAprendizado do computador-
Palavras-chave: dc.subjectEstudantes universitários-
Palavras-chave: dc.subjectCollege dropouts-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectCollege students-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titlePredição de evasão estudantil usando aprendizado de máquina-
Título: dc.titleStudent dropout prediction using machine learning-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.