Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Paetzold, Gustavo Henrique | - |
Autor(es): dc.contributor | Paetzold, Gustavo Henrique | - |
Autor(es): dc.contributor | Jeronymo, Daniel Cavalcanti | - |
Autor(es): dc.contributor | Spanhol, Fabio Alexandre | - |
Autor(es): dc.creator | Berwanger, Giordano Pydd | - |
Data de aceite: dc.date.accessioned | 2025-08-29T12:07:14Z | - |
Data de disponibilização: dc.date.available | 2025-08-29T12:07:14Z | - |
Data de envio: dc.date.issued | 2025-04-29 | - |
Data de envio: dc.date.issued | 2025-04-29 | - |
Data de envio: dc.date.issued | 2022-06-15 | - |
Fonte completa do material: dc.identifier | http://repositorio.utfpr.edu.br/jspui/handle/1/36692 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/1089382 | - |
Descrição: dc.description | Due to the abundant amount of information that we have available on the Internet, finding ways to synthesize content to obtain just the core, or central theme of a document, is essential to assist in the processing of large volumes of data. Automatic summarization consists of the task of automatically generating condensed versions of source texts called summaries, which are texts expressed in reduced form, keeping only the necessary parts without losing the meaning or the original context of the text. Despite being an existing research field since the mid-1990s, it is a topic in the Natural Language Processing area that is still under development. Even with substantial advances made in this area in English, the scarcity of studies and efforts for research and development of multidocument summarizers with an emphasis on Portuguese are aspects that motivate the present work. The quality of automatically generated summaries still has a long way to go when compared to those written manually by humans, as they can be more objective and informative, better condensing the information in the final document. With the rise of Transformers models and their excellent results, in recent years their use in various NLP tasks, including document summarization, has grown a lot. Today, there are still few works specifically focused on document summarization using such models, but the application of Transformers models makes it possible to develop abstract summarizers that learn from the contextual relationships between words, thus generating even better, more accurate and well-structured summarizers. The present work aims to explore the use of Transformers models applied to the multi-document summarization task in Portuguese and to investigate the behavior and the results obtained when using some tools and techniques of textual simplification and summarization. | - |
Descrição: dc.description | Em decorrência da quantia abundante de informações que temos disponível na Internet, encontrar formas de sintetizar conteúdos para obter apenas o cerne, ou tema central de um documento é essencial para auxiliar no processamento de grandes volumes de dados. A sumarização automática consiste na tarefa de gerar automaticamente versões condensadas de textos fontes denominadas sumários, que são textos expressos em forma reduzida mantendo apenas as partes mais fundamentais sem perder o sentido nem o contexto original do texto. Apesar de ser uma área de pesquisa existente desde meados de 1990, é um tema da área de Processamento de Linguagem Natural ainda em desenvolvimento. Mesmo com avanços substanciais realizados nessa área na língua inglesa, a escassez de estudos e esforços para pesquisa e desenvolvimento de sumarizadores multi-documento com ênfase na língua portuguesa são aspectos que motivam o presente trabalho. A qualidade dos sumários gerados automaticamente ainda tem muito a evoluir quando comparados com os escritos manualmente por humanos, já que estes conseguem ser mais objetivos e informativos, condensando melhor a informação no documento final. Com a ascensão dos modelos Transformers e seus excelentes resultados, nos últimos anos tem crescido muito a sua utilização em várias tarefas de PLN, inclusive a sumarização de documentos. Hoje ainda são poucos os trabalhos voltados especificamente para a sumarização de documentos utilizando tais modelos, mas a aplicação dos modelos Transformers possibilitam o desenvolvimento de sumarizadores abstrativos que aprendem com as relações contextuais entre as palavras, gerando assim, sumarizadores ainda melhores, mais precisos e bem estruturados. O presente trabalho visa explorar o uso de modelos Transformers aplicados a tarefa de sumarização multi-documento na língua portuguesa e investigar seu desempenho na tarefa. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Universidade Tecnológica Federal do Paraná | - |
Publicador: dc.publisher | Toledo | - |
Publicador: dc.publisher | Brasil | - |
Publicador: dc.publisher | Engenharia de Computação | - |
Publicador: dc.publisher | UTFPR | - |
Direitos: dc.rights | openAccess | - |
Direitos: dc.rights | https://creativecommons.org/licenses/by/4.0/ | - |
Palavras-chave: dc.subject | Gestão do conhecimento | - |
Palavras-chave: dc.subject | Processamento eletrônico de dados | - |
Palavras-chave: dc.subject | Knowledge management | - |
Palavras-chave: dc.subject | Electronic data processing | - |
Palavras-chave: dc.subject | CNPQ::ENGENHARIAS | - |
Título: dc.title | Sumarização multi-documento para o português com modelos transformer | - |
Título: dc.title | Multi-document summarization for portuguese with transformer models | - |
Tipo de arquivo: dc.type | livro digital | - |
Aparece nas coleções: | Repositorio Institucional da UTFPR - RIUT |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: