Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Mantuan, Altobelli de Brito | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/5002413550846760 | - |
Autor(es): dc.contributor | Sousa, Eduardo Vera | - |
Autor(es): dc.contributor | http://lattes.cnpq.br/1344911587821750 | - |
Autor(es): dc.contributor | Resende, Marianne Grilo | - |
Autor(es): dc.creator | Dernier, Miquéias Santos da Silva | - |
Autor(es): dc.creator | Zanovelli, Vinicius Gonçalves | - |
Data de aceite: dc.date.accessioned | 2024-07-11T17:42:15Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T17:42:15Z | - |
Data de envio: dc.date.issued | 2023-10-22 | - |
Data de envio: dc.date.issued | 2023-10-22 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/30900 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/755747 | - |
Descrição: dc.description | A internet é uma fonte virtualmente inesgotável de informações e que desempenha um papel cada vez mais relevante no auxílio à tomada de decisões. Obter um dado preciso em um tempo razoável e mantê-lo atualizado, sem grande esforço, pode ser um fator determinante para o sucesso de um projeto, negócio ou pesquisa. Atualmente, existem tecnologias e ferramentas que possibilitam a extração automática e seletiva (mineração) de dados da internet, atividade conhecida como web scraping, de forma simples e rápida através de pequenos softwares criados com poucas linhas de código. Neste trabalho apresentamos a implementação de três robôs de mineração, para três respectivas fontes específicas de dados, relevantes à pesquisa farmacêutica. Para elaboração deste projeto, uma reunião foi feita com um pesquisador farmacêutico especialista que contribuiu para a definição dos requisitos desta demanda e das três fontes de dados das quais as informações pertinentes são extraídas. Ainda com a participação do especialista farmacêutico, foram realizados testes com o sistema desenvolvido para a validação dos resultados obtidos considerando a abrangência da coleta automática, a precisão dos dados coletados e o tempo de processamento necessário para cada uma das fontes de dados definidas | - |
Descrição: dc.description | The Internet is a virtually-inexhaustible source of information that plays an increasingly important role in aiding decision-making. Obtaining accurate data within a reasonable time frame and effortless keeping these data up to date can be a determining factor in the success of a project, business or research. Nowadays, there are technologies and tools that make automatic and selective internet data extraction (data-mining or "web scraping") possible, simply and quickly, through developing small software using only a few lines of code. In this paper, we present the implementation of three data-mining robots for three respective and specific data sources, all relevant to pharmaceutical research. To develop this project, a meeting was held with a specialist pharmaceutical researcher who contributed to the definitions regarding this demand's requirements and the definition of the three data sources from which the information is extracted. Yet supported by the pharmaceutical specialist, the developed system was tested to validate the observed results taking into consideration the comprehensiveness of the automatic data gathering, the accuracy of the collected data and the processing time for each one of the defined data sources | - |
Descrição: dc.description | 78 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Web scraping | - |
Palavras-chave: dc.subject | Mineração de dados | - |
Palavras-chave: dc.subject | Extração automática de dados | - |
Palavras-chave: dc.subject | Pesquisa farmacêutica | - |
Palavras-chave: dc.subject | Mineração de dados (Computação) | - |
Palavras-chave: dc.subject | Pesquisa farmacológica | - |
Palavras-chave: dc.subject | Desenvolvimento de software | - |
Palavras-chave: dc.subject | Data-mining | - |
Palavras-chave: dc.subject | Automatic data extraction | - |
Palavras-chave: dc.subject | Software project | - |
Palavras-chave: dc.subject | Pharmaceutical research | - |
Título: dc.title | Web scraping: uma solução para coleta de informações na área farmacêutica | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: