Detecção de discurso de ódio uma abordagem baseada em aprendizado profundo

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorSilva, Leila Weitzel Coelho da-
Autor(es): dc.contributorhttp://lattes.cnpq.br/./2768655384552211-
Autor(es): dc.contributorGomes, Janaína Sant'Anna Gomide-
Autor(es): dc.contributorOliveira, Laura Emmanuella Alves Dos Santos Santana De-
Autor(es): dc.contributorVianna, Dalessandro Soares-
Autor(es): dc.contributorhttp://lattes.cnpq.br/./4873901371931398-
Autor(es): dc.creatorDaroz, Thalessa Hungerbühler-
Autor(es): dc.creatorCunha, Luan Pereira-
Data de aceite: dc.date.accessioned2025-01-03T11:42:37Z-
Data de disponibilização: dc.date.available2025-01-03T11:42:37Z-
Data de envio: dc.date.issued2024-07-25-
Data de envio: dc.date.issued2024-07-25-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/33679-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/920261-
Descrição: dc.descriptionAs mídias sociais constituem um espaço aberto, não apresentam barreiras ao seu acesso. Tornou-se uma forma dos indivíduos expressarem raiva, medo, felicidade, ódio, esperança, amor e tristeza sem se sentirem constrangidos. Um desses fenômenos negativos observados é a propagação do discurso de ódio online (cyber hate). Assim, este trabalho visa detectar discursos de ódio/ofensivo na língua portuguesa. Para atingir esse objetivo, foram analisadas diferentes configurações, hiperparâmetros e técnicas de Aprendizado Profundo. Construímos uma base de dados a partir de tuítes (pequenas postagens) coletados da plataforma Twitter. Depois tratamos a base e a utilizamos como entrada nos modelos de Aprendizado Profundo CNN, LSTM e Bi-LSTM. Também submetemos a base bruta e tratada aos baselines Naive Bayes e SNN. Como contribuição, foram produzidas três bases de dados no idioma Português-BR, e os seguintes dicionários, também em Português: um de termos ofensivos, um de termos obscenos e um de termos informais utilizados na internet, definimos e validamos o pipeline para identificação do discurso de ódio nos modelos estudados para as bases desenvolvidas. Além disso, a pesquisa evidenciou que independente dos classificadores selecionados (Bi-LSTM, CNN e LTSM) o desempenho obtido foi praticamente o mesmo para as bases de dados avaliadas, significando que não se faz necessário um intenso pré-processamento. Deve-se ressaltar que todos os recursos estão disponíveis no GitHub sob demanda em https://github.com/LuanPCunha/TCC-
Descrição: dc.descriptionSocial media constitute an open space, they do not present barriers to their access. It has become a way for individuals to express anger, fear, happiness, hate, hope, love and sadness without feeling embarrassed. One of these negative phenomena observed is the spread of online hate speech (cyber hate). Thus, this work aims to detect hate/offensive speech in Portuguese. To achieve this goal, different configurations, hyperparameters and Deep Learning techniques were analyzed. We built a database from tweets (small posts) collected from the Twitter platform. Then we treat the base and use it as input in the Deep Learning models CNN, LSTM and Bi-LSTM. We also submitted the raw and treated base to the Naive Bayes and SNN baselines. As a contribution, three databases were produced in the Portuguese-BR language, and the following dictionaries, also in Portuguese: one with offensive terms, one with obscene terms and one with informal terms used on the internet, we defined and validated the pipeline for identifying hate speech in the aforementioned models for the three databases. In addition, the research showed that regardless of the selected classifiers (Bi-LSTM, CNN and LTSM) the performance obtained was practically the same for the evaluated databases, meaning that intense pre-processing is not necessary. It should be noted that all features are available on GitHub on demand at https://github.com/LuanPCunha/TCC-
Descrição: dc.description140 p.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectDiscurso de ódio-
Palavras-chave: dc.subjectAprendizado profundo-
Palavras-chave: dc.subjectTwiter-
Palavras-chave: dc.subjectMídia social-
Palavras-chave: dc.subjectHate speech-
Palavras-chave: dc.subjectDeep Learning-
Palavras-chave: dc.subjectTwitter-
Título: dc.titleDetecção de discurso de ódio uma abordagem baseada em aprendizado profundo-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.