Mineração de dados tabulares em arquivos pdf: uma abordagem para a área farmacêutica

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMantuan, Altobelli de Brito-
Autor(es): dc.contributorRezende, Marianne Grilo-
Autor(es): dc.contributorSouza, Kauê Francisco Corrêa de Souza e-
Autor(es): dc.creatorOliveira, Igor Wagner Silva de-
Autor(es): dc.creatorNascimento, Laís Silva dos Santos-
Data de aceite: dc.date.accessioned2024-07-11T18:08:55Z-
Data de disponibilização: dc.date.available2024-07-11T18:08:55Z-
Data de envio: dc.date.issued2023-09-29-
Data de envio: dc.date.issued2023-09-29-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/30675-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/764523-
Descrição: dc.descriptionAs técnicas de descoberta de conhecimento a partir de informações contidas em textos tem tido significativa aplicação devido à quantidade de dados científicos gerados na forma textual. Técnicas de mineração de texto vêm sendo amplamente utilizadas, com o intuito de extrair informações a partir de dados não estruturados. Na área farmacêutica, o grande volume de produção textual devido aos avanços nas pesquisas científicas torna a obtenção de dados relevantes de forma manual pelos pesquisadores um processo maçante e pouco eficiente, tornando o uso de técnicas de mineração uma ferramenta indispensável. Este trabalho propõe a implementação de um algoritmo para mineração com o objetivo de extrair informações de tabelas encontradas em artigos científicos, utilizando para tal bibliotecas dentro da linguagem python. São também apresentados os conceitos fundamentais da mineração de texto e as etapas necessárias para este processo, incluindo a metodologia usada na elaboração do algoritmo proposto. Com a utilização deste algoritmo foi possível obter resultados satisfatórios, discutidos ao fim do trabalho-
Descrição: dc.descriptionKnowledge discovery techniques based on information contained in texts has had a significant application due to the increasing amount of scientific data available in textual form. Text mining techniques have been widely used in order to extract information from unstructured data. In the pharmaceutical area, the large volume of text production due to advances in scientific research makes manual gathering of relevant data a hard,tedious and somewhat inefficient process, thus making the use of mining techniques an essential tool. This study proposes the implementation of an algorithm for mining in order to extract information from tables found in scientific papers through python libraries. The fundamental concepts of text mining and the necessary steps for this process, including the methodology used to elaborate the proposed algorithm, are presented. By using this algorithm it was possible to obtain satisfying results, which are discussed at the end of the study-
Descrição: dc.description55 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectMineração de texto-
Palavras-chave: dc.subjectDescoberta de conhecimento-
Palavras-chave: dc.subjectExtração de informação-
Palavras-chave: dc.subjectMineração de texto-
Palavras-chave: dc.subjectFarmácia-
Palavras-chave: dc.subjectAlgoritmo-
Palavras-chave: dc.subjectPython (Linguagem de programação de computador)-
Palavras-chave: dc.subjectText mining-
Palavras-chave: dc.subjectKnowledge discovery-
Palavras-chave: dc.subjectInformation extraction-
Título: dc.titleMineração de dados tabulares em arquivos pdf: uma abordagem para a área farmacêutica-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.