Avaliação de abordagens baseadas em deep learning para a identificação de fake news

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorViterbo Filho, José-
Autor(es): dc.contributorAndrade, Eduardo de Oliveira-
Autor(es): dc.contributorCarvalho, Aline Marins Paes-
Autor(es): dc.contributorVasconcelos, Leonardo Pio-
Autor(es): dc.creatorMartins, Phelipe Gonçalves-
Data de aceite: dc.date.accessioned2024-07-11T18:22:48Z-
Data de disponibilização: dc.date.available2024-07-11T18:22:48Z-
Data de envio: dc.date.issued2022-07-26-
Data de envio: dc.date.issued2022-07-26-
Data de envio: dc.date.issued2018-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/25836-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/769370-
Descrição: dc.descriptionNos últimos anos, um fenômeno social tem ganhado destaque no mundo todo, por seu alcance e rápida divulgação entre as pessoas: são as chamadas fake news. Este tipo de notícia já demonstrou em diversas situações a capacidade que possui de causar impactos negativos a sociedade. Dessa forma, diversos estudos têm sido realizados para que se ache alguma solução viável para combater diretamente tal fenômeno. Recentemente, o uso de técnicas de Aprendizado de Máquina tem se mostrado uma alternativa interessante para apontar se uma dada notícia é falsa ou não. Contudo, devido a uma grande quantidade de algoritmos existentes nesta subárea de inteligência artificial, é importante que testes sejam realizados para que se verifique quais destes são mais apropriados para esta tarefa. Este trabalho segue uma abordagem experimental e exploratória, no intuito de avaliar qual método de abordagem tradicional (Multinomial Naive Bayes e Support Vector Machines) e de Deep Learning (Convolutional Neural Network e Long Short-Term Memory) possuem a melhor performance. Além disso, verificar qual método dentre esses dois produz melhores resultados na identificação de fake news. utilizando os parâmetros ideais e três bases de dados. As mesmas contendo mil, dez mil e cem mil notícias classificadas como ‘FAKE’ e ‘REAL’. Após diversos testes, verificou-se que CNN possui a melhor performance em todas as bases de dados, destacando-se a acurácia de 97,09% e 98,39% para as de dez mil e cem mil notícias, respectivamente. Ainda, SVM demonstrou níveis de precisão abaixo das CNN, porém muito interessantes, com valores maiores ou iguais a 90% desde que se use Term frequency-inverse document frequency. LSTM demonstrou que vale a pena ser utilizada somente com a base de dados contendo cem mil notícias com acurácia de 96,59%. Já para MNB, constatou-se que não vale a pena ser utilizado para a resolução do problema proposto.-
Descrição: dc.descriptionIn recent years, a social phenomenon has been prominent worldwide, because of its reach and fast dissemination among people: they are called fake news. This type of news has already demonstrated in several situations the capacity it has of causing negative impacts to society. In this way, several studies have been carried out to find some viable solution to directly combat this phenomenon. Recently, the use of Aprendizado de Máquina techniques has been an interesting alternative to point out whether a given news is fake or not. However, due to a large number of algorithms in this artificial intelligence subarea, it is important that tests are performed to determine which of these are most appropriate for this task. This work follows an experimental and exploratory approach, in order to evaluate which traditional approach method (Multinomial Naive Bayes and Support Vector Machines) has better performance, which method of Deep Learning approach (Convolutional Neural Network and Long Short-Term Memory), which is a Aprendizado de Máquina subarea that is on the rise, also has better performance and which method among these two produces better results in the identification of fake news, using the ideal parameters and three databases containing one thousand, ten thousand and one hundred thousand news classified as 'FAKE' and 'REAL'. After several tests, it was verified that CNN has the best performance in all the databases, highlighting the accuracy of 97.09% and 98.39% for the ten thousand and one hundred thousand news, respectively. Still, SVM demonstrated accuracy levels below CNN, but very interesting, with values greater than or equal to 90% since the use of the term frequency-inverse document frequency. LSTM has shown that it is worth using only with the database containing one hundred thousand news with accuracy of 96.59%. As for MNB, it was found that it is not worth being used to solve the problem proposed.-
Descrição: dc.description76 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectAprendizado de Máquina-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectInteligência artificial-
Palavras-chave: dc.subjectFake news-
Palavras-chave: dc.subjectMultinomia l Naive Bayes-
Palavras-chave: dc.subjectSupport Vector Machine-
Palavras-chave: dc.subjectConvolutional Neural Network-
Palavras-chave: dc.subjectLong ShortTerm Memory-
Título: dc.titleAvaliação de abordagens baseadas em deep learning para a identificação de fake news-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.