Estudo e comparação de técnicas de aprendizado de máquina para classificação em dados tabulares incompletos no contexto médico

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRibas, Lucas Correia-
Autor(es): dc.contributorUniversidade Estadual Paulista (UNESP)-
Autor(es): dc.creatorSantos, Bianca Aissa-
Data de aceite: dc.date.accessioned2025-08-21T18:19:59Z-
Data de disponibilização: dc.date.available2025-08-21T18:19:59Z-
Data de envio: dc.date.issued2025-06-25-
Data de envio: dc.date.issued2025-06-02-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/11449/311397-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/11449/311397-
Descrição: dc.descriptionNas bases de dados reais, encontrar dados ausentes é um problema frequente, e ocorre quando valores de variáveis interessantes não estão disponíveis para todos os sujeitos da amostra, impactando negativamente o universo da pesquisa clínica, visto que pode levar a conclusões enviesadas. Esta monografia realiza um estudo comparativo entre técnicas de imputação de valores ausentes e algoritmos de classificação aplicados a dados tabulares. O objetivo é identificar combinações eficazes para lidar com conjuntos de dados médicos complexos e incompletos, com foco em sua aplicabilidade prática. Para esta monografia, foram selecionados dois conjuntos de dados relacionados à recorrência do câncer de mama em mulheres e outro conjunto relativo ao diagnóstico de apendicite em crianças e jovens de 0 até 18 anos. As etapas de pré-processamento incluíram a imputação de dados ausentes e a seleção de atributos, utilizando abordagens estatísticas e de aprendizado de máquina, seguidas pela aplicação de algoritmos de classificação supervisionada. Os melhores desempenhos preditivos foram obtidos pela combinação de técnicas de imputação interativa com o modelo Random Forest, que se destacou pela acurácia e sensibilidade tanto nos diagnósticos de apendicite quanto na identificação da recorrência do câncer de mama.-
Descrição: dc.descriptionIn real-world datasets, missing data is a frequent issue, occurring when values of relevant variables are unavailable for some subjects in the sample. This can negatively impact clinical research, as it may lead to biased conclusions. This monograph presents a comparative study of missing data imputation techniques and classification algorithms applied to tabular data. The goal is to identify effective combinations for handling complex and incomplete medical datasets, with an emphasis on practical applicability. For this study, two datasets were selected: one related to breast cancer recurrence in women, and another concerning the diagnosis of appendicitis in children and adolescents aged 0 to 18 years. The preprocessing steps included missing data imputation and feature selection, using both statistical and machine learning approaches, followed by the application of supervised classification algorithms. The best predictive performances were achieved through the combination of iterative imputation techniques with the Random Forest model, which stood out for its accuracy and sensitivity in both the diagnosis of appendicitis and the identification of breast cancer recurrence.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Estadual Paulista (UNESP)-
Direitos: dc.rightsinfo:eu-repo/semantics/openAccess-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectDados ausentes-
Palavras-chave: dc.subjectTécnicas de imputação-
Palavras-chave: dc.subjectAlgoritmos de classificação-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectImputation-
Palavras-chave: dc.subjectMissing data-
Título: dc.titleEstudo e comparação de técnicas de aprendizado de máquina para classificação em dados tabulares incompletos no contexto médico-
Título: dc.titleComparative study of machine learning techniques for classification of incomplete tabular data in the medical domain-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Unesp

Não existem arquivos associados a este item.