Uso de técnicas de ciência dos dados para análise do impacto de dados demográficos na gravidade do câncer em pacientes no Brasil

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCerqueira, Fábio Ribeiro-
Autor(es): dc.contributorSacco, Wagner Figueiredo-
Autor(es): dc.contributorGuizze, Carmen Lucia Campos-
Autor(es): dc.creatorSilva, Vitor Lopes Gama da-
Data de aceite: dc.date.accessioned2025-08-21T20:13:22Z-
Data de disponibilização: dc.date.available2025-08-21T20:13:22Z-
Data de envio: dc.date.issued2025-07-22-
Data de envio: dc.date.issued2025-07-22-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/39393-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1056995-
Descrição: dc.descriptionEste trabalho realiza uma análise exploratória de dados demográficos de pacientes de câncer no Brasil com o intuito de identificar as variáveis que mais impactam na gravidade da doença. Além disto, esses dados são utilizados para construir um modelo de aprendizado de máquina para prever a extensão da doença. A análise utiliza dados do Registro de Câncer de Base Populacional (RCBP) e fundamenta-se no uso de técnicas de ciência dos dados para aplicar conceitos de estatística e aprendizado de máquina para se atingir os objetivos colocados. Das variáveis analisadas, as que mais impactaram na gravidade da doença foram, em ordem crescente de importância, endereço, sexo, profissão, idade, sendo esta última discrepante com relação ao restante, pois teve uma influência sigficativamente maior. O modelo para predição da gravidade da doença foi construído com a abordagem Random Forest, que obteve o melhor desempenho entre os algoritmos de classificação testados, atingindo 82% de acurácia e uma área sob a curva ROC de 0,89-
Descrição: dc.descriptionThis work carries out an exploratory analysis of demographic data of cancer patients in Brazil with the aim of identifying the variables that most impact the severity of the disease. Additionally, this data is used to build a machine learning model to predict the extent of the disease. The analysis uses data from the Population-Based Cancer Registry (RCBP) and is based on data science techniques to apply statistical and machine learning concepts to achieve the proposed objectives. Of the variables analyzed, those that had the greatest impact on the severity of the disease were, in increasing order of importance, address, sex, profession, age, the latter being discrepant in relation to the others, as it had a significantly greater influence. The disease severity prediction model was built using the Random Forest approach, which achieved the best performance among the classification algorithms tested, reaching 82% accuracy and an area under the ROC curve of 0.89-
Descrição: dc.description53 f.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectCâncer-
Palavras-chave: dc.subjectCiência dos dados-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectAnálise exploratória-
Palavras-chave: dc.subjectModelo preditivo-
Palavras-chave: dc.subjectOncologia-
Palavras-chave: dc.subjectSistemas de coleta automática de dados-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectCâncer-
Palavras-chave: dc.subjectData science-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectExploratory analysis-
Palavras-chave: dc.subjectPredictive model-
Título: dc.titleUso de técnicas de ciência dos dados para análise do impacto de dados demográficos na gravidade do câncer em pacientes no Brasil-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.