Clusterização e análise de tweets com foco em postagens relacionadas às ações da Petrobrás

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorSantos, Bruno Samways dos-
Autor(es): dc.contributorSantos, Bruno Samways dos-
Autor(es): dc.contributorLima, Rafael Henrique Palma-
Autor(es): dc.contributorRibas, Carlos Alberto-
Autor(es): dc.creatorMurato, Demetrius Milton-
Data de aceite: dc.date.accessioned2022-08-04T20:16:53Z-
Data de disponibilização: dc.date.available2022-08-04T20:16:53Z-
Data de envio: dc.date.issued2022-03-08-
Data de envio: dc.date.issued2022-03-08-
Data de envio: dc.date.issued2021-11-28-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/27571-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/705983-
Descrição: dc.descriptionBrasil, Bolsa e Balcão (B3), responsible for R$6.45 trillion in transactions in 2020, directly and indirectly contributes to the increase of information disseminated by social media, impacting the stock market. Because there is a large amount, investors cannot analyze them, so having an artifice that contributes to the grouping of news related to the same subject can contribute to the performance of investors. Given this scenario, the present work used unsupervised machine learning to group posts collected from Twitter related to Petrobras' stocks. Originating from data collection through synchronization with the Twitter API platform, preprocessing was performed based on text mining techniques, application of BagofWords (BoW) and Term FrequencyInverse Document Frequency (TF) IDF) to define the most recurrent terms and the weight of each post until grouping is carried out. In this case, for comparison, a direct grouping of the matrix obtained by TFIDF and another grouping after resizing the weight matrix by the Main Component Analysis (PCA) was performed. In order to confront and facilitate the visualization of the main differences, scatter plots and word clouds were created for each grouping. The results obtained showed that performing grouping in a matrix resized by the Principal Component Analysis has a better performance for the separation of related texts, contributing to its interpretation.-
Descrição: dc.descriptionA Brasil, Bolsa e Balcão (B3), responsável por R$6,45 trilhões de reais movimentados no ano de 2020, contribui diretamente e indiretamente para o aumento das informações disseminadas pelas mídias sociais, impactando o mercado acionário. Por ser em grande quantidade, os investidores não conseguem analisá-las, então, ter um artifício que colabora para o agrupamento de notícias ligadas ao um mesmo assunto, pode contribuir para o desempenho dos investidores. Diante deste cenário, o presente trabalho utilizou o aprendizado de máquina não supervisionado para agrupar posts coletados do Twitter relacionados às ações da Petrobrás. Originando-se da coleta de dados por meio da sincronização com a plataforma Twitter API, foi realizado o pré-processamento baseado em técnicas de mineração de texto, aplicação de Bag-of-Words (BoW) e Term Frequency Inverse Document Frequency (TFIDF) para definir os termos mais recorrentes e o peso de cada post até a realização do agrupamento. Neste caso, para comparação, foi realizado um agrupamento direto da matriz obtida por TFIDF e outro agrupamento após redimensionamento da matriz de pesos pelo Principal Component Analysis (PCA). Afim de confrontar e facilitar a visualização das principais diferenças, foram criados gráficos de dispersão e nuvens de palavras para cada agrupamento. Os resultados obtidos mostraram que realizar agrupamento em uma matriz redimensionada pelo Principal Component Analysis tem um melhor desempenho para a separação de textos relacionados entre si, contribuindo para a sua interpretação.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherLondrina-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia de Produção-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Palavras-chave: dc.subjectAnálise por agrupamento-
Palavras-chave: dc.subjectIndústria petrolífera-
Palavras-chave: dc.subjectData mining-
Palavras-chave: dc.subjectCluster analysis-
Palavras-chave: dc.subjectPetroleum, Industry and trade-
Palavras-chave: dc.subjectCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO-
Título: dc.titleClusterização e análise de tweets com foco em postagens relacionadas às ações da Petrobrás-
Título: dc.titleClusterization and analysis of tweets focusing on posts releted to petobras stocks-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.