Uma análise exploratória de dados e a construção de modelos preditivos de machine learning no cálculo de risco de subscrição de uma seguradora

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCerqueira, Fabio Ribeiro-
Autor(es): dc.contributorIgnacio, Aníbal Alberto Vilcapoma-
Autor(es): dc.contributorMartin, Mateus Pereira-
Autor(es): dc.creatorOliveira, Carolyna Marques de-
Data de aceite: dc.date.accessioned2024-07-11T18:46:26Z-
Data de disponibilização: dc.date.available2024-07-11T18:46:26Z-
Data de envio: dc.date.issued2023-03-24-
Data de envio: dc.date.issued2023-03-24-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/28330-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/777272-
Descrição: dc.descriptionA globalização trouxe consigo o constante crescimento do cenário competitivo, fazendo com que as empresas precisassem buscar pela incessante inovação e por oportunidade de melhores resultados. O avanço da tecnologia está revolucionando a forma de lidar com a comunicação e o armazenamento de dados, trazendo a possibilidade de medir e quantificar ações, tomada de decisões e resultados empresariais. Neste sentido, o presente trabalho teve como objetivo identificar as variáveis que podem influenciar no cálculo de risco de sinistro em uma grande empresa de seguro de vida e previdência nacional. A partir dos dados obtidos dos segurados, foi realizado um estudo embasado na ciência de dados para identificar a probabilidade de resultados futuros de possíveis sinistros, utilizando para isso, dados históricos da empresa para estudar através da análise exploratória de dados (AED), as relações entre os dados levantados e a ocorrência de sinistro. Em um segundo momento, foram construídos modelos de classificação utilizando algoritmos de aprendizagem de máquina, para prever a ocorrência de sinistro para o produto Diária de Incapacidade Temporária. O trabalho aborda conceitos de aprendizagem de máquina, dando ênfase no estudo dos modelos de classificação, incluindo o entendimento dos métodos de classificação bayesiana, árvore de decisão, redes neurais, Support Vector Machines, K-Nearest Neighbours e Random Forest. A construção dos modelos preditivos de aprendizagem de máquina no conjunto de dados obteve um melhor resultado para o método de Redes Neurais Artificias com uma acurácia de 67,3% e precisão de 67,7% para a possibilidade de ocorrer sinistro. Vale ainda ressaltar que, todos os classificadores utilizados obtiveram acurácia maior que 64%, com exceção apenas do Support Vector Machines, que obteve acurácia de 54%. Embora as métricas citadas não tenham apontado um percentual mais expressivo, como esperávamos inicialmente, a análise exploratória realizada e os resultados preliminares poderão ser de grande utilidade para trabalhos de extensão sob o mesmo tema no futuro-
Descrição: dc.descriptionGlobalization has brought with it the constant growth of the competitive landscape, making it necessary for companies to search for incessant innovation and opportunities for better results. The advance of technology is revolutionizing the way of dealing with communication and data storage, bringing the possibility of measuring and quantifying actions, decision making, and business results. In this vein, this project aimed to identify the variables that can influence the calculation of claim risk in a large national life insurance and pension company. Using the data obtained from the policyholders, a study based on data science was carried out to identify the probability of future results of possible claims, using the company's historical data to study, through an exploratory data analysis (AED), the relationship between the data collected and the occurrence of claims. In a second step, classification models were built using machine learning algorithms to predict the occurrence of claims for the Daily Incapacity Allowance product. This work discusses machine learning concepts, emphasizing the study of classification models, including the understanding of Bayesian classification methods, decision trees, neurais networks, Support Vector Machines, K-Nearest Neighbours and Randon Forest. The results for the data set presented better result for the Artificial Neural Networks method with an accuracy of 67.3% and precision of 67.7% for the possibility of claim occurring. It is also noteworthy that all classifiers used obtained accuracy greater than 64%, with the exception of Support Vector Machines, which obtained accuracy of 54%. Although the metrics mentioned did not indicate a more expressive percentage, as we initially expected, the exploratory analysis performed and the preliminary results may be of great use for extension works on the same theme in the future-
Descrição: dc.description69 f.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectSeguro de vida-
Palavras-chave: dc.subjectCálculo de risco-
Palavras-chave: dc.subjectSinistro-
Palavras-chave: dc.subjectCiência de dados-
Palavras-chave: dc.subjectAnálise exploratória de dados-
Palavras-chave: dc.subjectAprendizagem de máquina-
Palavras-chave: dc.subjectRedes neurais artificiais-
Palavras-chave: dc.subjectProcessamento de dados-
Palavras-chave: dc.subjectAprendizagem de máquina-
Palavras-chave: dc.subjectSeguro-
Palavras-chave: dc.subjectLife insurance-
Palavras-chave: dc.subjectRisk calculation-
Palavras-chave: dc.subjectInsurance claims-
Palavras-chave: dc.subjectData science-
Palavras-chave: dc.subjectExploratory data analysis-
Palavras-chave: dc.subjectMachine learning-
Palavras-chave: dc.subjectArtificial neural networks-
Título: dc.titleUma análise exploratória de dados e a construção de modelos preditivos de machine learning no cálculo de risco de subscrição de uma seguradora-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.