
Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
| Metadados | Descrição | Idioma |
|---|---|---|
| Autor(es): dc.contributor | Guimaraes, Paulo Henrique Sales | - |
| Autor(es): dc.contributor | Pereira, Geraldo Magela da Cruz | - |
| Autor(es): dc.contributor | Oliveira, Anderson Castro Soares de | - |
| Autor(es): dc.contributor | Paixão, Crysttian Arantes | - |
| Autor(es): dc.creator | Macário, Noé Osório | - |
| Data de aceite: dc.date.accessioned | 2026-02-09T11:18:34Z | - |
| Data de disponibilização: dc.date.available | 2026-02-09T11:18:34Z | - |
| Data de envio: dc.date.issued | 2025-04-10 | - |
| Data de envio: dc.date.issued | 2025-04-10 | - |
| Data de envio: dc.date.issued | 2025-04-10 | - |
| Data de envio: dc.date.issued | 2025-02-20 | - |
| Fonte completa do material: dc.identifier | https://repositorio.ufla.br/handle/1/59902 | - |
| Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1138116 | - |
| Descrição: dc.description | The present work evaluates the performance of different models of machine learning (ML) in the prediction of Diabetes, a chronic condition of great relevance for the public health. Using the VIGITEL (2023) data, which include more than 21 thousand observations, a full pre- processing process was carried out, which evolved selection of variables, balancing of groups, treatment of missing values and data standardization. The analyzed programs were Decision Trees, Random Forests, Naive Bayes, Artificial Neural Nets and XGBoost. The evaluation of the performance of the models was held on the basis of metrics such as sensibility and area under the ROC curve, fundamental to identify positive cases and make an efficient discrimination of the groups. The XGBoost model stood out as the most efficient, presenting the better metrics of sensibility, specificity and area under a ROC curve in almost all approaches (considered all the variables, MIC- Maximal Information Coefficient and PCA - Principal Component Analysis), either for balanced data either unbalanced, which shows its predictive superior capacity. Contrarily, the model of Decision Tree had the worst performance, highlighting its limitations when applied to unbalanced data. The results strengthen the potential of learning machine in the earlier detection of chronic diseases, such as Diabetes, underlining its relevance to master medical diagnostics, optimize costs and give crucial support for clinical interventions more efficient. | - |
| Descrição: dc.description | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | - |
| Descrição: dc.description | O presente trabalho avalia o desempenho de diferentes modelos de aprendizado de máquina (AM) na predição de Diabetes, uma condição crônica de grande relevância para a saúde pública. Utilizando dados do VIGITEL 2023, que incluem mais de 21 mil observações, foi realizado um processo de pré-processamento completo, que envolveu seleção de variáveis, balanceamento de classes, tratamento de valores ausentes e padronização dos dados. Os algoritmos analisados foram Árvores de Decisão, Florestas Aleatórias, Naive Bayes, Redes Neurais Artificiais e XGBoost. A avaliação do desempenho dos modelos foi conduzida com base em métricas como sensibilidade e área sob a curva ROC, fundamentais para a identificação de casos positivos e para uma discriminação eficiente entre as classes. O modelo XGBoost se destacou como o mais eficaz, apresentando as melhores métricas de sensibilidade, especificidade e área sob a curva ROC em quase todas as abordagens (considerando todas as variáveis, MIC - Maximal Information Coefficient e PCA - Principal Component Analysis), tanto para dados balanceados quanto desbalanceados, o que evidencia sua superior capacidade preditiva. Em contraste, o modelo de Árvore de Decisão obteve o pior desempenho, destacando suas limitações quando aplicado a dados desbalanceados. Os resultados reforçam o potencial do aprendizado de máquina na detecção precoce de doenças crônicas, como o Diabetes, sublinhando sua relevância para aprimorar diagnósticos médicos, otimizar custos e fornecer suporte crucial para intervenções clínicas mais eficazes. | - |
| Formato: dc.format | application/pdf | - |
| Formato: dc.format | application/pdf | - |
| Idioma: dc.language | pt_BR | - |
| Publicador: dc.publisher | Universidade Federal de Lavras | - |
| Publicador: dc.publisher | Programa de Pós-Graduação em Estatística e Experimentação Agropecuária | - |
| Publicador: dc.publisher | UFLA | - |
| Publicador: dc.publisher | brasil | - |
| Publicador: dc.publisher | Instituto de Ciências Exatas e Tecnológicas – ICET | - |
| Direitos: dc.rights | Attribution 4.0 International | - |
| Direitos: dc.rights | Attribution 4.0 International | - |
| Direitos: dc.rights | acesso aberto | - |
| Direitos: dc.rights | http://creativecommons.org/licenses/by/4.0/ | - |
| Direitos: dc.rights | http://creativecommons.org/licenses/by/4.0/ | - |
| Palavras-chave: dc.subject | Vigitel | - |
| Palavras-chave: dc.subject | Aprendizado de Máquina | - |
| Palavras-chave: dc.subject | Machine learning | - |
| Palavras-chave: dc.subject | Predição de Diabetes | - |
| Palavras-chave: dc.subject | Prediction of Diabetes | - |
| Palavras-chave: dc.subject | Estatística | - |
| Título: dc.title | Avaliação de modelos de aprendizado de máquina para predição do diabetes mellitus | - |
| Título: dc.title | Evaluation of machine learning models for predicting diabetes mellitus | - |
| Tipo de arquivo: dc.type | dissertação | - |
| Aparece nas coleções: | Repositório Institucional da Universidade Federal de Lavras (RIUFLA) | |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: