
Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
| Metadados | Descrição | Idioma |
|---|---|---|
| Autor(es): dc.contributor | Ferreira, Danton Diego | - |
| Autor(es): dc.contributor | Ferreira, Danton Diego | - |
| Autor(es): dc.contributor | Barbosa, Bruno Henrique Groenner | - |
| Autor(es): dc.contributor | Pereira, Denilson Alves | - |
| Autor(es): dc.contributor | Cardoso, Paula Christina Figueira | - |
| Autor(es): dc.contributor | Vitor, Giovani Bernardes | - |
| Autor(es): dc.creator | Ferreira Neto, José Carlos | - |
| Data de aceite: dc.date.accessioned | 2026-02-09T12:09:09Z | - |
| Data de disponibilização: dc.date.available | 2026-02-09T12:09:09Z | - |
| Data de envio: dc.date.issued | 2024-01-29 | - |
| Data de envio: dc.date.issued | 2024-01-29 | - |
| Data de envio: dc.date.issued | 2024-01-28 | - |
| Data de envio: dc.date.issued | 2023-12-07 | - |
| Fonte completa do material: dc.identifier | https://repositorio.ufla.br/handle/1/58857 | - |
| Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1155446 | - |
| Descrição: dc.description | The identification and extraction of aspects are essential in text analysis for discerning opinions and emotions. However, there is a gap in applying these techniques to Portuguese. This work aims to adapt approaches originally developed for English to this language in the TV and ReLi datasets. The goal of this work is to evaluate the application of language models for aspect extraction in Portuguese in the context of TV device reviews and literary reviews in the TV and ReLi datasets. To achieve this goal, models based on the BERT architecture were employed, both in the pre-trained form for general domains (BERTimbau) and for specific domains (BERTtv and BERTreli). Additionally, a double embedding technique was implemented, combining general and specific domain models. Large Language Models (LLMs) were also evaluated, including variants of GPT-3 via the OpenAI API and a variant of LLaMa, Cabrita, which is trained for the Portuguese language. To optimize hardware resource demand, efficient fine-tuning techniques such as LoRA (Low-Rank Adaptation) for BERTimbau and QLoRa (Quantized Low-Rank Adaptation) for Cabrita were applied. The results showed that the BERTimbau model adjusted with LoRA was superior in both datasets, achieving F1 scores of 0.846 for the TV dataset and 0.615 for ReLi. In contrast, the Cabrita model showed inferior performance, with less favorable results for both datasets, 0.68 for TV and 0.46 for ReLi. This study, therefore, offers a valuable contribution to research in aspect extraction in Portuguese, demonstrating the feasibility and effectiveness of adapting and optimizing techniques and models originally developed for other languages. | - |
| Descrição: dc.description | A identificação e extração de aspectos é essencial na análise de textos para discernir opiniões e emoções. Contudo, há uma lacuna na aplicação dessas técnicas ao português. Este trabalho visa adaptar abordagens originalmente desenvolvidas para o inglês a este idioma no conjuntos de dados TV e ReLi. O objetivo deste trabalho consiste em avaliar a aplicação de modelos de linguagem para extração de aspectos na língua portuguesa no contexto de revisões de aparelhos de TV e resenhas literárias nos conjuntos de dado TV e ReLi. Para alcançar este objetivo, modelos baseados na arquitetura BERT foram empregados, tanto na forma pré-treinada para domínios gerais (BERTimbau) quanto para domínios específicos (BERTtv e BERTreli). Além disso, uma técnica de duplo embedding foi implementada, combinando modelos de domínio geral e específico. Também foram avaliados Modelos de Linguagem de Larga Escala (Large Language Models - LLM), incluindo variantes do GPT-3 via API da OpenAI e uma variante do LLaMa, Cabrita, que é trei- nada para a língua portuguesa. Para otimizar a demanda por recursos de hardware, técnicas de ajuste fino eficiente, como LoRA (Low-Rank Adaptation) para o BERTimbau e QLoRa (Quantized Low-Rank Adaptation) para o Cabrita, foram aplicadas. Os resultados demonstraram que o modelo BERTimbau ajustado com LoRa se mostrou superior nos dois conjuntos de dados, alcançando F1 scores de 0.846 para o conjunto TV e 0.615 para o ReLi. Em contraste, o modelo Cabrita apresentou desempenho inferior, com resultados menos favoráveis para ambos os conjuntos de dados, 0.68 para o TV e 0.46 para o ReLi. Este estudo, portanto, oferece uma contribuição valiosa para a pesquisa em extração de aspectos em língua portuguesa, demonstrando a viabilidade e eficácia de adaptar e otimizar técnicas e modelos desenvolvidos originalmente para outros idiomas. | - |
| Formato: dc.format | application/pdf | - |
| Idioma: dc.language | pt_BR | - |
| Publicador: dc.publisher | Universidade Federal de Lavras | - |
| Publicador: dc.publisher | Programa de Pós-graduação em Engenharia de Sistemas e Automação | - |
| Publicador: dc.publisher | UFLA | - |
| Publicador: dc.publisher | brasil | - |
| Publicador: dc.publisher | Departamento de Engenharia | - |
| Direitos: dc.rights | Attribution 4.0 International | - |
| Direitos: dc.rights | Attribution 4.0 International | - |
| Direitos: dc.rights | acesso aberto | - |
| Direitos: dc.rights | http://creativecommons.org/licenses/by/4.0/ | - |
| Direitos: dc.rights | http://creativecommons.org/licenses/by/4.0/ | - |
| Palavras-chave: dc.subject | Processamento de linguagem natural | - |
| Palavras-chave: dc.subject | Extração de aspectos | - |
| Palavras-chave: dc.subject | BERT | - |
| Palavras-chave: dc.subject | Modelos de linguagem | - |
| Palavras-chave: dc.subject | Natural language processing | - |
| Palavras-chave: dc.subject | Aspect extraction | - |
| Palavras-chave: dc.subject | Bidirectional Encoder Representations from Transformers | - |
| Palavras-chave: dc.subject | Language models | - |
| Palavras-chave: dc.subject | Ciência da Computação | - |
| Título: dc.title | Desenvolvimento de modelos de linguagem para extração de aspectos em língua portuguesa | - |
| Título: dc.title | Development of language models for aspect extraction in portuguese | - |
| Tipo de arquivo: dc.type | dissertação | - |
| Aparece nas coleções: | Repositório Institucional da Universidade Federal de Lavras (RIUFLA) | |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: