Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Mantuan, Altobelli de Brito | - |
Autor(es): dc.contributor | Damasceno, Nilson Luís | - |
Autor(es): dc.creator | Marwell, Mateus Pereira | - |
Autor(es): dc.creator | Santos, Vanessa Chastinet Batista | - |
Data de aceite: dc.date.accessioned | 2024-07-11T17:30:22Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T17:30:22Z | - |
Data de envio: dc.date.issued | 2023-10-24 | - |
Data de envio: dc.date.issued | 2023-10-24 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/30947 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/751673 | - |
Descrição: dc.description | Este presente trabalho teve o propósito de dissertar e desenvolver um programa para extração de dados utilizando ferramentas de web scraping, tendo como alvo a extração de dados brutos de artigos científicos dadas as palavras-chaves de interesse. Dentro desse contexto, o sistema deste projeto foi desenvolvido utilizando a linguagem Python que, a partir de palavras-chaves que o usuário informar, irá fazer as buscas nas bases de dados do ScienceDirect. Após esses metadados serem retornados na forma bruta, eles serão importados para um banco de dados não relacional, o utilizado neste projeto foi o MongoDB. Após o término da implementação, foram feitos testes no sistema e foram retornados um total de 80.000 artigos científicos, isto é, 20.000 artigos para cada uma das seguintes doenças: Obesity, COVID-19, HIV e Diabetes. Durante a execução dos testes o acesso ao servidor da API do ScienceDirect se manteve estável. A implementação deste trabalho foi feita em colaboração com o laboratório de farmácia da UFRJ | - |
Descrição: dc.description | 44 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Web scraping | - |
Palavras-chave: dc.subject | API | - |
Palavras-chave: dc.subject | ScienceDirect | - |
Palavras-chave: dc.subject | Extração automática de dados | - |
Palavras-chave: dc.subject | Python (Linguagem de programação de computador) | - |
Palavras-chave: dc.subject | Mineração de dados (Computação) | - |
Palavras-chave: dc.subject | Base de dados | - |
Título: dc.title | Extração de dados em artigos científicos utilizando web scraping na base de dados do sciencedirect | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: