Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Marana, Aparecido Nilceu | - |
Autor(es): dc.contributor | Universidade Estadual Paulista (UNESP) | - |
Autor(es): dc.creator | Frediani, João Otávio Rodrigues Ferreira | - |
Data de aceite: dc.date.accessioned | 2025-08-21T19:01:38Z | - |
Data de disponibilização: dc.date.available | 2025-08-21T19:01:38Z | - |
Data de envio: dc.date.issued | 2024-12-01 | - |
Data de envio: dc.date.issued | 2024-12-01 | - |
Data de envio: dc.date.issued | 2024-08-28 | - |
Fonte completa do material: dc.identifier | https://hdl.handle.net/11449/258472 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/11449/258472 | - |
Descrição: dc.description | Discurso de ódio refere-se ao discurso ofensivo direcionado a um grupo ou indivíduo com base em características inerentes, como, por exemplo, raça, religião ou gênero. Já é reconhecido que discurso de ódio pode causar danos a longo prazo e criar problemas severos para a sociedade. O uso massivo da Internet intensificou a propagação deste tipo de discurso, permitindo que este chegue a muitas pessoas rapidamente, por isso, governos e empresas começaram uma batalha para combater sua propagação. Este combate é desafiador devido a quantidade de dados publicados na Internet, que torna a análise humana impossível, levando a necessidade de automatizar a detecção de discurso de ódio. Apesar das dificuldades encontradas, como o caráter implícito de alguns discursos, muitos trabalhos foram realizados em anos recentes para a detecção de discurso de ódio na língua inglesa. Para a língua portuguesa, a ausência de grandes conjuntos de dados rotulados torna o desafio ainda maior. Visando mitigar este problema, este trabalho investigou três estratégias de aprendizado de máquina que supostamente permitem a transferência de aprendizado em modelos de processamento de linguagem natural (PLN) desenvolvidos para detectar discurso de ódio em textos escritos em português. Foram utilizados os modelos Bertimbau Base, Bertimbau Large em BERT, e exploradas três estratégias de transferência de aprendizado entre os idiomas inglês-português e espanhol-português: (i) a transferência de aprendizado de uma tarefa fonte para uma tarefa alvo distinta; (ii) a estratégia zero-shot learning e (iii) a estratégia few-shot learning. Experimentos realizados sobre conjuntos de dados disponíveis na literatura mostraram que a tarefa fonte escolhida (detecção de linguagem ofensiva) não gerou conhecimento relevante suficiente para melhorar a performance dos modelos de PLN na tarefa alvo deste trabalho (detecção de discurso de ódio). Eles mostraram também que o conhecimento se generalizou de maneira mais eficiente com a estratégia de few-shot learning do que com zero-shot learning, em especial entre os idiomas inglês e português. Por fim, um experimento adicional mostrou que técnicas de reamostragem dos dados, podem levar a uma melhoria no desempenho dos modelos de PLN, em particular quanto às métricas precisão, revocação e pontuação F1, quando as classes dos conjuntos de dados são desbalanceadas, como ocorre com os conjuntos de dados utilizados neste trabalho. | - |
Descrição: dc.description | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | - |
Descrição: dc.description | Capes: 001 | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Estadual Paulista (UNESP) | - |
Direitos: dc.rights | info:eu-repo/semantics/openAccess | - |
Palavras-chave: dc.subject | BERT | - |
Palavras-chave: dc.subject | Discurso de ódio | - |
Palavras-chave: dc.subject | Processamentod e linguagem natural | - |
Palavras-chave: dc.subject | Transferência de aprendizado | - |
Palavras-chave: dc.subject | Hate speech | - |
Palavras-chave: dc.subject | Natural language processing | - |
Palavras-chave: dc.subject | Transfer learning | - |
Título: dc.title | Detecção de discurso de ódio na lingua portuguesa utilizando transferência de aprendizagem | - |
Título: dc.title | Hate Speech detection in portuguese using transfer learning | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositório Institucional - Unesp |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: