Sumarização multi-documento para o português com modelos transformer

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPaetzold, Gustavo Henrique-
Autor(es): dc.contributorPaetzold, Gustavo Henrique-
Autor(es): dc.contributorJeronymo, Daniel Cavalcanti-
Autor(es): dc.contributorSpanhol, Fabio Alexandre-
Autor(es): dc.creatorBerwanger, Giordano Pydd-
Data de aceite: dc.date.accessioned2025-08-29T12:07:14Z-
Data de disponibilização: dc.date.available2025-08-29T12:07:14Z-
Data de envio: dc.date.issued2025-04-29-
Data de envio: dc.date.issued2025-04-29-
Data de envio: dc.date.issued2022-06-15-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/36692-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1089382-
Descrição: dc.descriptionDue to the abundant amount of information that we have available on the Internet, finding ways to synthesize content to obtain just the core, or central theme of a document, is essential to assist in the processing of large volumes of data. Automatic summarization consists of the task of automatically generating condensed versions of source texts called summaries, which are texts expressed in reduced form, keeping only the necessary parts without losing the meaning or the original context of the text. Despite being an existing research field since the mid-1990s, it is a topic in the Natural Language Processing area that is still under development. Even with substantial advances made in this area in English, the scarcity of studies and efforts for research and development of multidocument summarizers with an emphasis on Portuguese are aspects that motivate the present work. The quality of automatically generated summaries still has a long way to go when compared to those written manually by humans, as they can be more objective and informative, better condensing the information in the final document. With the rise of Transformers models and their excellent results, in recent years their use in various NLP tasks, including document summarization, has grown a lot. Today, there are still few works specifically focused on document summarization using such models, but the application of Transformers models makes it possible to develop abstract summarizers that learn from the contextual relationships between words, thus generating even better, more accurate and well-structured summarizers. The present work aims to explore the use of Transformers models applied to the multi-document summarization task in Portuguese and to investigate the behavior and the results obtained when using some tools and techniques of textual simplification and summarization.-
Descrição: dc.descriptionEm decorrência da quantia abundante de informações que temos disponível na Internet, encontrar formas de sintetizar conteúdos para obter apenas o cerne, ou tema central de um documento é essencial para auxiliar no processamento de grandes volumes de dados. A sumarização automática consiste na tarefa de gerar automaticamente versões condensadas de textos fontes denominadas sumários, que são textos expressos em forma reduzida mantendo apenas as partes mais fundamentais sem perder o sentido nem o contexto original do texto. Apesar de ser uma área de pesquisa existente desde meados de 1990, é um tema da área de Processamento de Linguagem Natural ainda em desenvolvimento. Mesmo com avanços substanciais realizados nessa área na língua inglesa, a escassez de estudos e esforços para pesquisa e desenvolvimento de sumarizadores multi-documento com ênfase na língua portuguesa são aspectos que motivam o presente trabalho. A qualidade dos sumários gerados automaticamente ainda tem muito a evoluir quando comparados com os escritos manualmente por humanos, já que estes conseguem ser mais objetivos e informativos, condensando melhor a informação no documento final. Com a ascensão dos modelos Transformers e seus excelentes resultados, nos últimos anos tem crescido muito a sua utilização em várias tarefas de PLN, inclusive a sumarização de documentos. Hoje ainda são poucos os trabalhos voltados especificamente para a sumarização de documentos utilizando tais modelos, mas a aplicação dos modelos Transformers possibilitam o desenvolvimento de sumarizadores abstrativos que aprendem com as relações contextuais entre as palavras, gerando assim, sumarizadores ainda melhores, mais precisos e bem estruturados. O presente trabalho visa explorar o uso de modelos Transformers aplicados a tarefa de sumarização multi-documento na língua portuguesa e investigar seu desempenho na tarefa.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherToledo-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttps://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectGestão do conhecimento-
Palavras-chave: dc.subjectProcessamento eletrônico de dados-
Palavras-chave: dc.subjectKnowledge management-
Palavras-chave: dc.subjectElectronic data processing-
Palavras-chave: dc.subjectCNPQ::ENGENHARIAS-
Título: dc.titleSumarização multi-documento para o português com modelos transformer-
Título: dc.titleMulti-document summarization for portuguese with transformer models-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.