
Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
| Metadados | Descrição | Idioma |
|---|---|---|
| Autor(es): dc.contributor | Schmitke, Luiz Rafael | - |
| Autor(es): dc.contributor | Schmitke, Luiz Rafael | - |
| Autor(es): dc.contributor | Almeida, Simone de | - |
| Autor(es): dc.contributor | Borges, André Pinz | - |
| Autor(es): dc.creator | Dias, Andrey Naligatski | - |
| Data de aceite: dc.date.accessioned | 2025-08-29T12:45:49Z | - |
| Data de disponibilização: dc.date.available | 2025-08-29T12:45:49Z | - |
| Data de envio: dc.date.issued | 2025-07-02 | - |
| Data de envio: dc.date.issued | 2025-07-02 | - |
| Data de envio: dc.date.issued | 2024-05-16 | - |
| Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/37310 | - |
| Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1101414 | - |
| Descrição: dc.description | The advancement of the internet and the increase in the number of users in recent years have led to a considerable rise in the amount of available data. This data has become extremely valuable for large global companies, which use it as the basis for Machine Learning algorithms. These algorithms are employed in analyzing their target audience's opinions regarding the brand and products, as well as in various activities on their platforms, such as search engine operations, product recommendations, spam filtering, and targeted advertising, among others. The main objective of this study is to compare different multi-label classification algorithms that use problem transformation techniques, including Binary Relevance, Classifier Chains, Random k-Labelsets, and Label Powerset. These algorithms are applied to three sentiment datasets: the first is a dataset with tweets containing 6179 entries in English and 11 unbalanced labels, the second with 5131 comments about depression on a subreddit and 8 balanced labels, and the third with 30,000 comments from various subtopics on Reddit and 27 unbalanced labels. The purpose is to apply metrics such as accuracy, precision, recall, f1-score, and precision at K for each algorithm, determining their performance under varied conditions, implementing these algorithms using the Python programming language and the Scikit-Multilearn library. When comparing the results, it is noted that the Binary Relevance algorithm performs superiorly compared to the others when trained on a dataset with balanced labels, standing out mainly in precision with an approximate result of 75% and in precision at K with 69%. On the other hand, the Classifier Chains algorithm shows consistent performance across all datasets, notably with its precision of 76%. Despite a significant drop in performance on an unbalanced dataset, the Random k-Labelsets and Label Powerset algorithms demonstrate better performance, particularly standing out in accuracy with results close to 31% for both and in recall with around 22% for both again. | - |
| Descrição: dc.description | O avanço da internet e o aumento do número de usuários nos últimos anos têm gerado um considerável aumento na quantidade de dados disponíveis. Esses dados se tornaram extremamente valiosos para grandes empresas globais, que os utilizam como base para algoritmos de Aprendizado de Máquina. Esses algoritmos são empregados tanto na análise das opiniões de seu público-alvo em relação à marca e aos produtos quanto em diversas atividades em suas plataformas, como operações de mecanismos de busca, recomendações de produtos, filtragem de spam e publicidade direcionada, entre outras. O principal objetivo deste estudo é comparar diferentes algoritmos de classificação multirrótulos que utilizam técnicas de transformação de problemas, incluindo Binary Relevance, Classifier Chains, Random k-Labelsets e Label Powerset. Esses algoritmos são aplicados a três bases de dados contendo sentimentos, sendo a primeira uma base de dados com tweets contendo 6179 dados em língua inglesa e 11 rótulos desbalanceados, a segunda com 5131 comentários a respeito de depressão em um subreddit e 8 rótulos balanceados, e uma terceira com 30000 comentários de subtópicos variados do Reddit e 27 rótulos desbalanceados. O propósito é aplicar métricas como Accuracy, Precision, Recall, F1-score e Precision at K para cada algoritmo, determinando seu desempenho em condições variadas, implementando tais algoritmos utilizando a linguagem de programação Python, com a biblioteca Scikit-Multilearn. Ao comparar os resultados, nota-se que o algoritmo Binary Relevance apresenta desempenho superior em relação aos demais quando treinado em um conjunto de dados com rótulos balanceados, destacando-se principalmente em Precision com um resultado aproximado de 75% e em Precision at K com 69%. Por outro lado, o algoritmo Classifier Chains apresenta desempenho consistente em todos os conjuntos de dados, notadamente pela sua Precision de 76%. Apesar de ter uma queda significativa de desempenho em um conjunto de dados desbalanceado, os algoritmos Random kLabelsets e Label Powerset demonstram um desempenho melhor, destacando-se especialmente em accuracy com resultados próximos de 31% em ambos, e em recall com cerca de 22% para ambos novamente. | - |
| Formato: dc.format | application/pdf | - |
| Idioma: dc.language | pt_BR | - |
| Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
| Publicador: dc.publisher | Ponta Grossa | - |
| Publicador: dc.publisher | Brasil | - |
| Publicador: dc.publisher | Departamento Acadêmico de Informática | - |
| Publicador: dc.publisher | Ciência da Computação | - |
| Publicador: dc.publisher | UTFPR | - |
| Direitos: dc.rights | openAccess | - |
| Direitos: dc.rights | http://creativecommons.org/licenses/by-sa/4.0/ | - |
| Palavras-chave: dc.subject | Aprendizado do computador | - |
| Palavras-chave: dc.subject | Inteligência artificial | - |
| Palavras-chave: dc.subject | Classificação | - |
| Palavras-chave: dc.subject | Emoções | - |
| Palavras-chave: dc.subject | Machine learning | - |
| Palavras-chave: dc.subject | Artificial intelligence | - |
| Palavras-chave: dc.subject | Classification | - |
| Palavras-chave: dc.subject | Emotions | - |
| Palavras-chave: dc.subject | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | - |
| Título: dc.title | Comparando algoritimos multirrótulos aplicados em mineração de sentimentos | - |
| Título: dc.title | Comparing multilabels algorithms applied in sentiment mining | - |
| Tipo de arquivo: dc.type | livro digital | - |
| Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT | |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: