Estudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorCosta, Kelton Augusto Pontara da-
Autor(es): dc.creatorGrassmann, Ana Clara de Castro-
Data de aceite: dc.date.accessioned2025-08-21T17:17:00Z-
Data de disponibilização: dc.date.available2025-08-21T17:17:00Z-
Data de envio: dc.date.issued2024-07-12-
Data de envio: dc.date.issued2024-07-12-
Data de envio: dc.date.issued2024-06-21-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/11449/256518-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/11449/256518-
Descrição: dc.descriptionEste projeto estuda como os LLMs baseados na arquitetura Transformer funcionam e a possibilidade de ajustar estes modelos para que possam utilizar apenas o corpo de mensagens de e-mail para classificá-las entre spam ou ham. Os modelos estudados foram o BERT, Gemma e Phi. Todos passaram pelas etapas de quantização, fine-tuning com um conjunto de dados reais e avaliação com métricas comumente utilizadas em problemas de classificação binária. O modelo Gemma apresenta resultados superiores a 99% de acurácia na detecção de spam, destacando-se como o melhor entre os modelos comparados.-
Descrição: dc.descriptionThis project studies how LLMs based on the transformer architecture operate and the possibility of adjusting these models to use only the body of email messages to classify them as spam or ham. The models studied were BERT, Gemma, and Phi. All of them underwent quantization stages, fine-tuning with a real dataset, and evaluation with metrics commonly used in binary classification problems. The Gemma model achieves over 99% accuracy in detecting spam, standing out as the best among the compared models.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Estadual Paulista (UNESP)-
Direitos: dc.rightsinfo:eu-repo/semantics/restrictedAccess-
Palavras-chave: dc.subjectSpam (Mensagens eletrônicas)-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectDetecção de spam-
Palavras-chave: dc.subjectLLMs-
Palavras-chave: dc.subjectClassificação binária-
Palavras-chave: dc.subjectSpam detection-
Palavras-chave: dc.subjectFine-tuning-
Palavras-chave: dc.subjectBinary classification-
Título: dc.titleEstudo e comparação de performance de grandes modelos de linguagem na tarefa de detecção de spam-
Título: dc.titleStudy and comparison of performance of large models language in the spam detection task-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositório Institucional - Unesp

Não existem arquivos associados a este item.