Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Mantuan, Altobelli de Brito | - |
Autor(es): dc.contributor | Sousa, Leandro Soares de | - |
Autor(es): dc.creator | Ramos, Mayk Caldas | - |
Autor(es): dc.creator | Bichara, Pedro Henrique Ribeiro | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:32:48Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:32:48Z | - |
Data de envio: dc.date.issued | 2023-12-10 | - |
Data de envio: dc.date.issued | 2023-12-10 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/31405 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/772626 | - |
Descrição: dc.description | A coleta dos dados é a primeira etapa de um projeto baseado em dados. No campo farmacêutico, muitas vezes é necessario o entendimento sobre o impacto que um medicamento, já existente ou em desenvolvimento, tem em um determinado grupo. Informações de cunho geral sobre esses medicamentos podem ser obtidas em grupos de discussão expalhados por toda a internet. Redes sociais são uma fonta de informação em constante e exponencial crescimento. O web scraping é uma técnica desenvolvida a fim de obter dados relacionados a um determinado tema de uma página da web. Esses dados devem ser, posteriormente, tratados por especialistas uma vez que a internet é uma fonte insegura de informação. O presente trabalho se propõe a desenvolver uma ferramenta para extração de dados da plataforma Quora à partir de palavras chaves pré-selecionadas. O QScraper é desenvolvido utilizando o scrapy, um framework python para web scraping e os dados são armazenados em um bando de dados MongoDB. Foram obtidos 2617 perguntas, 1213 respostas, 67 tópicos, 3698 postagens e 2361 espaços com a utilização de 43 palavras-chave relacionadas à medicamentos contra HIV | - |
Descrição: dc.description | Data gathering is the first step in a data-driven project. In the pharmaceutical field, it is often needed to study the impact that a medicine, already commercially produced or in development, may cause in a specific group of people. General information about these drugs can be obtained in online discussion groups. Social networks are a evergrowing source of information. Web scraping is a tool developed aiming to extract data concerning a specific topic from a web page. Usually, these data need to be processed since the internet is not a safe source of information. The current study has as objective the development of a tool for data extraction from Quora, a question-answer portal, based on pre-defined queries. QScraper was developed using scrapy, a python framework for web scraping, and the obtained data was stored using a MongoDB data bank. We obtained 2617 questions, 1213 answers, 67 topics, 3698 posts e 2361 spaces upon search using 43 query words related to HIV drugs | - |
Descrição: dc.description | 59 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Web scrapping | - |
Palavras-chave: dc.subject | Quora | - |
Palavras-chave: dc.subject | HIV | - |
Palavras-chave: dc.subject | Scrapy | - |
Palavras-chave: dc.subject | Python | - |
Palavras-chave: dc.subject | Python (Linguagem de programação de computador) | - |
Palavras-chave: dc.subject | HIV | - |
Palavras-chave: dc.subject | Mineração de dados (Computação) | - |
Título: dc.title | QScrapper2.0: web scraping de dados do quora referentes à medicamentos para HIV | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: