Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Alves, Marco Antonio Zanata, 1984- | - |
Autor(es): dc.contributor | Oliveira, Luiz Eduardo Soares de, 1971- | - |
Autor(es): dc.contributor | Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data | - |
Autor(es): dc.creator | Paul, Adriano de Castro Benatto | - |
Data de aceite: dc.date.accessioned | 2025-09-01T11:46:50Z | - |
Data de disponibilização: dc.date.available | 2025-09-01T11:46:50Z | - |
Data de envio: dc.date.issued | 2024-02-07 | - |
Data de envio: dc.date.issued | 2024-02-07 | - |
Data de envio: dc.date.issued | 2019 | - |
Fonte completa do material: dc.identifier | https://hdl.handle.net/1884/71002 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/1884/71002 | - |
Descrição: dc.description | Orientador : Prof. Marco Antonio Zanata Alves | - |
Descrição: dc.description | Coorientador : Prof. Luiz Eduardo Soares de Oliveira | - |
Descrição: dc.description | Monografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Data. | - |
Descrição: dc.description | Inclui referências : p. 9-10. | - |
Descrição: dc.description | Resumo : Apenas no Brasil, estima-se que os prejuízos causados por fraude em transações eletrônicas com cartão de crédito sejam da ordem de 7 bilhões de reais ao ano. Para evitar este tipo de fraude, são utilizados modelos estatísticos e de aprendizagem de máquina para detectar padrões e negar transações fraudulentas antes que sejam finalizadas, evitando assim os prejuízos decorrentes desta prática. Neste contexto, este trabalho apresenta a aplicação de técnicas para visualizar dados, detectar fraudes e avaliar modelos de aprendizado de máquina em uma base aberta e anonimizada de dados transacionais de cartão de crédito. Para visualização dos dados é utilizada a técnica t-SNE (t-Distributed Stochastic Neighbor Embedding), para detecção dos eventos de fraude são utilizados três métodos distintos: KNN (K-Nearest Neighbors), Random Forest e Gradient Boosting. Como métricas de avaliação destes modelos utilizou-se da precisão, revocação e F-score, além de uma breve análise de outros indicadores relevantes no mercado que também devem ser considerados para a escolha de um modelo de detecção de fraudes. Nossos resultados mostram o modelo de Random Forest com o melhor desempenho entre os métodos avaliados, classificando corretamente 99% das transações fraudulentas, incorrendo em falsos positivos em aproximadamente um terço das classificações de fraude. | - |
Descrição: dc.description | Abstract : In Brazil alone, it is estimated that the losses caused by fraud in electronic credit card transactions are in the order of 7 billion BRL per year. To prevent this type of fraud, statistical and machine learning models are used to detect patterns and deny fraudulent transactions before they are confirmed, avoiding the resulting losses from this practice. In this context, this work presents the application of techniques to visualize data, detect fraud and evaluate machine learning models on an open and anonymous database of transactional credit card data. For data visualization, the t-SNE (t-Distributed Stochastic Neighbor Embedding) technique is used; to detect fraud events, three different methods are used: KNN (K-Nearest Neighbors), Random Forest and Gradient Boosting. As for the metrics to evaluate these models, precision, recall and F-score were used, in addition to a brief analysis in terms of other relevant market indicators, which should also be considered when choosing an assertive fraud detection model. Our results show the Random Forest model with the best performance among the evaluated methods,correctly classifying 99% of fraudulent transactions, while incurring in false positives in approximately one third of the fraud classifications. | - |
Formato: dc.format | 1 recurso online : PDF. | - |
Formato: dc.format | application/pdf | - |
Formato: dc.format | application/pdf | - |
Palavras-chave: dc.subject | Fraude | - |
Palavras-chave: dc.subject | Cartões de crédito | - |
Palavras-chave: dc.subject | Aprendizado do computador | - |
Título: dc.title | Avaliação de Métodos de Machine Learning na detecção de fraude em dados transacionais de cartão de crédito | - |
Aparece nas coleções: | Repositório Institucional - Rede Paraná Acervo |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: