Extração de dados em artigos científicos utilizando web scraping na base de dados do sciencedirect

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMantuan, Altobelli de Brito-
Autor(es): dc.contributorDamasceno, Nilson Luís-
Autor(es): dc.creatorMarwell, Mateus Pereira-
Autor(es): dc.creatorSantos, Vanessa Chastinet Batista-
Data de aceite: dc.date.accessioned2024-07-11T17:30:22Z-
Data de disponibilização: dc.date.available2024-07-11T17:30:22Z-
Data de envio: dc.date.issued2023-10-24-
Data de envio: dc.date.issued2023-10-24-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/30947-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/751673-
Descrição: dc.descriptionEste presente trabalho teve o propósito de dissertar e desenvolver um programa para extração de dados utilizando ferramentas de web scraping, tendo como alvo a extração de dados brutos de artigos científicos dadas as palavras-chaves de interesse. Dentro desse contexto, o sistema deste projeto foi desenvolvido utilizando a linguagem Python que, a partir de palavras-chaves que o usuário informar, irá fazer as buscas nas bases de dados do ScienceDirect. Após esses metadados serem retornados na forma bruta, eles serão importados para um banco de dados não relacional, o utilizado neste projeto foi o MongoDB. Após o término da implementação, foram feitos testes no sistema e foram retornados um total de 80.000 artigos científicos, isto é, 20.000 artigos para cada uma das seguintes doenças: Obesity, COVID-19, HIV e Diabetes. Durante a execução dos testes o acesso ao servidor da API do ScienceDirect se manteve estável. A implementação deste trabalho foi feita em colaboração com o laboratório de farmácia da UFRJ-
Descrição: dc.description44 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectWeb scraping-
Palavras-chave: dc.subjectAPI-
Palavras-chave: dc.subjectScienceDirect-
Palavras-chave: dc.subjectExtração automática de dados-
Palavras-chave: dc.subjectPython (Linguagem de programação de computador)-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Palavras-chave: dc.subjectBase de dados-
Título: dc.titleExtração de dados em artigos científicos utilizando web scraping na base de dados do sciencedirect-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.