Propostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMarcondes, Carlos Henrique-
Autor(es): dc.creatorBarçante, Eduardo-
Data de aceite: dc.date.accessioned2024-07-11T17:28:52Z-
Data de disponibilização: dc.date.available2024-07-11T17:28:52Z-
Data de envio: dc.date.issued2019-08-02-
Data de envio: dc.date.issued2019-08-02-
Data de envio: dc.date.issued2011-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/10669-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/751161-
Descrição: dc.descriptionEm domínios interdisciplinares como Comunicação-Informação em Saúde, o surgimento da Web vem trazendo uma crescente oferta de documentos digitais diversos, como artigos científicos, notícias, legislação, manuais, normas, etc., de interesse.potencial. Dada a grande quantidade e a dispersão destes documentos por diferentes fontes, seu tratamento automático com vistas ao reuso e recontextualização segundo os interesses e semânticas de um domínio específico é de grande interesse. Esta pesquisa teve como objetivo investigar, a capacidade de identificar e analisar métodos de extrair automaticamente semânticas específicas a partir de textos digitais com objetivo de reutilizá-los para outros fins diferente dos quais estes foram inicialmente produzidos. Para tanto, foram levantados e classificados artigos científicos buscando responder as seguintes questões: Em que conjunto de dados textuais o método descrito no artigo foi aplicado? e como foi especificada a semântica a ser buscada no conjunto de dados textuais?. Após a análise, para cada texto identificado no levantamento emergiram as seguintes classes de métodos: Mineração de textos, Anotação Semântica, Análise Semântica, Análise em Linguagem Natural e Tratamento Estatístico de textos. Apresenta-se uma relação sistemática onde são descritas as características gerais de cada método, da classe formada por ele, e os artigos que compõe cada classe são discutidos e comentados. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados na Web com vistas a seu reuso e recontextualização.-
Descrição: dc.descriptionInter-disciplinary fields such as Communication and Health Information, the emergence of the Web has brought an increasing availability of digital documents as diverse as scientific articles, news, legislation, manuals, standards, etc.., of potential interest. Given the large number and dispersion of these documents from different sources, their automatic treatment in order to reuse and recontextualization in the interests and semantics of a specific domain is of great interest. This study aimed to investigate the ability to identify and analyze methods for automatically extracting specific semantics from digital texts in order to reuse them for other purposes than that which they were first produced. It had been collected and classified papers seeking to answer the following questions: Which set of textual data with the method described in the article was applied? and semantics as specified was to be sought in the set of textual data?. After the analysis, for each text identified in the survey yielded the following classes of methods: Text mining, Semantic Annotation, Semantic Analysis, Natural Language Analysis and Statistical Treatment of texts. It presents a systematic relationship which describes the general characteristics of each method, the class formed by him, and items that compose each class are discussed and commented. It is hoped that the research will support proposals for systems of automatic processing of texts published on the Web with a view to their reuse and re-contextualization.-
Descrição: dc.description100f.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectRecuperação de informação-
Palavras-chave: dc.subjectMineração de dados-
Palavras-chave: dc.subjectInterface de busca-
Palavras-chave: dc.subjectDocumento digital-
Palavras-chave: dc.subjectDocumento eletrônico-
Palavras-chave: dc.subjectRecuperação da informação-
Palavras-chave: dc.subjectInterface de usuário (Sistema de computador)-
Palavras-chave: dc.subjectWeb semântica-
Palavras-chave: dc.subjectInformation Retrieval-
Palavras-chave: dc.subjectDatamining-
Palavras-chave: dc.subjectSearch Interface-
Palavras-chave: dc.subjectDigital document-
Título: dc.titlePropostas e metodologias de processamento automático de documentos textuais digitais: uma análise da literatura-
Tipo de arquivo: dc.typeDissertação-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.