Aplicação do método de Gradient Boosting

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorYaginuma, Karina Yuriko-
Autor(es): dc.contributorYaginuma, Karina Yuriko-
Autor(es): dc.contributorPinto, Douglas Rodrigues-
Autor(es): dc.contributorKubrusly, Jessica Quintanilha-
Autor(es): dc.contributorYaginuma, Karina Yuriko-
Autor(es): dc.creatorSpolador, Rodolfo Hauret-
Data de aceite: dc.date.accessioned2024-07-11T18:17:35Z-
Data de disponibilização: dc.date.available2024-07-11T18:17:35Z-
Data de envio: dc.date.issued2022-06-23-
Data de envio: dc.date.issued2022-06-23-
Data de envio: dc.date.issued2021-05-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/25319-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/767614-
Descrição: dc.descriptionDevido ao aumento exponencial da quantidade de dados, os custos mais baixos deprocessamento computacional e uma maior acessibilidade no armazenamento de dados, as técnicas de aprendizado de máquinas tornaram-se mais atrativas. O aprendizado de máquina é um método de análise de dados que automatiza o desenvolvimento de modelos e permite a criação de modelos preditores, que auxiliam na tomada de decisões, reduzindo assim possíveis riscos. Os modelos de previsão de aprendizado de máquinas podem utilizar de regressões, árvores de classificação, entre outros. Neste trabalho é estudado o modelo supervisionado de Gradient Boosting que é baseado em árvores de classificação, ele constrói o modelo em etapas, como outros métodos de boosting, e os generaliza, permitindo a otimização de uma função de perda diferenciável arbitrária. Este método e o método de Regressão Logística serão aplicados em um conjunto de dados rotulados, afim de compará-los. Os resultados obtidos foram diferentes em ambos os métodos, nos dados de treino o modelo de Gradient Boosting apresentou maiores valores de AUC do que o modelo de Regressão Logística, entretanto este padrão não se manteve na base de teste. O melhor modelo de Gradient Boosting ajustado apresentou uma acurácia de 0.5685, este modelo apresentou métricas de sensibilidade (0.652) e especificidade (0.4063) não muito discrepantes, indicando que ele acerta bem ambas as características, enquanto que o melhor modelo de Regressão Logística foi o modelo com uma acurácia de 0.6054, sensibilidade (0.81) e especificidade (0.2084). Apesar do modelo de Regressão Logística apresentar maior acurácia, considerou-se que o Gradient Boosting apresentou melhor desempenho, visto que ele acertou as duas características da variável resposta de forma mais consistente.-
Descrição: dc.description63 f.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Federal Fluminense-
Publicador: dc.publisherNiterói-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/br/-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectAprendizado de Máquina-
Palavras-chave: dc.subjectGradient Boosting-
Palavras-chave: dc.subjectRegressão Logística-
Palavras-chave: dc.subjectClassificação-
Palavras-chave: dc.subjectEstatística-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectRegressão logística-
Título: dc.titleAplicação do método de Gradient Boosting-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.