QScrapper2.0: web scraping de dados do quora referentes à medicamentos para HIV

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMantuan, Altobelli de Brito-
Autor(es): dc.contributorSousa, Leandro Soares de-
Autor(es): dc.creatorRamos, Mayk Caldas-
Autor(es): dc.creatorBichara, Pedro Henrique Ribeiro-
Data de aceite: dc.date.accessioned2024-07-11T18:32:48Z-
Data de disponibilização: dc.date.available2024-07-11T18:32:48Z-
Data de envio: dc.date.issued2023-12-10-
Data de envio: dc.date.issued2023-12-10-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/31405-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/772626-
Descrição: dc.descriptionA coleta dos dados é a primeira etapa de um projeto baseado em dados. No campo farmacêutico, muitas vezes é necessario o entendimento sobre o impacto que um medicamento, já existente ou em desenvolvimento, tem em um determinado grupo. Informações de cunho geral sobre esses medicamentos podem ser obtidas em grupos de discussão expalhados por toda a internet. Redes sociais são uma fonta de informação em constante e exponencial crescimento. O web scraping é uma técnica desenvolvida a fim de obter dados relacionados a um determinado tema de uma página da web. Esses dados devem ser, posteriormente, tratados por especialistas uma vez que a internet é uma fonte insegura de informação. O presente trabalho se propõe a desenvolver uma ferramenta para extração de dados da plataforma Quora à partir de palavras chaves pré-selecionadas. O QScraper é desenvolvido utilizando o scrapy, um framework python para web scraping e os dados são armazenados em um bando de dados MongoDB. Foram obtidos 2617 perguntas, 1213 respostas, 67 tópicos, 3698 postagens e 2361 espaços com a utilização de 43 palavras-chave relacionadas à medicamentos contra HIV-
Descrição: dc.descriptionData gathering is the first step in a data-driven project. In the pharmaceutical field, it is often needed to study the impact that a medicine, already commercially produced or in development, may cause in a specific group of people. General information about these drugs can be obtained in online discussion groups. Social networks are a evergrowing source of information. Web scraping is a tool developed aiming to extract data concerning a specific topic from a web page. Usually, these data need to be processed since the internet is not a safe source of information. The current study has as objective the development of a tool for data extraction from Quora, a question-answer portal, based on pre-defined queries. QScraper was developed using scrapy, a python framework for web scraping, and the obtained data was stored using a MongoDB data bank. We obtained 2617 questions, 1213 answers, 67 topics, 3698 posts e 2361 spaces upon search using 43 query words related to HIV drugs-
Descrição: dc.description59 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectWeb scrapping-
Palavras-chave: dc.subjectQuora-
Palavras-chave: dc.subjectHIV-
Palavras-chave: dc.subjectScrapy-
Palavras-chave: dc.subjectPython-
Palavras-chave: dc.subjectPython (Linguagem de programação de computador)-
Palavras-chave: dc.subjectHIV-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Título: dc.titleQScrapper2.0: web scraping de dados do quora referentes à medicamentos para HIV-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.