Web Scraping, um caso de uso para coletar metadados de artígos científicos publicados na biblioteca digital da IEEE

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorViterbo Filho, José-
Autor(es): dc.contributorSilva, Érica Mourão da-
Autor(es): dc.contributorSilva, Mônica da-
Autor(es): dc.creatorTavares, Frederico-
Autor(es): dc.creatorCunha, Letícia Mello-
Data de aceite: dc.date.accessioned2024-07-11T17:50:53Z-
Data de disponibilização: dc.date.available2024-07-11T17:50:53Z-
Data de envio: dc.date.issued2021-12-22-
Data de envio: dc.date.issued2021-12-22-
Data de envio: dc.date.issued2020-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/24056-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/758721-
Descrição: dc.descriptionIndexação é uma identificação de um documento para que ele consiga ser acessado quando desejado. Web Crawling é o processo responsável por varrer a internet extraindo todos os metadados para indexação, diferentemente do Web Scraping que é uma forma automatizada de entrar em um determinado site e extrair informações do mesmo. Por meio de processos automatizados, implementados utilizando um robô, o Web Scraping exporta dados de um site para um banco de dados ou uma planilha local para posterior recuperação e análise das informações extraídas. Devido à grande quantidade de dados de um site, esse processo facilita o armazenamento dos mesmos em um banco por possibilitar o acesso à grandes volumes de dados simultaneamente. O enfoque deste trabalho foi, através de um caso de uso, utilizar os benefícios do Web Scraping para chegar a uma solução viável para a indexação de artigos científicos. Para isso, foi desenvolvido um scraper que coleta metadados de artigos científicos e seus autores publicados na biblioteca IEEE Xplore e exporta os dados coletados para duas planilhas de formato CSV. Vamos abordar os conceitos de sociedade científica, indexação, Web Scraping e suas principais bibliotecas e ferramentas. O resultado deste trabalho oferece uma análise dos testes e resultados obtidos do scraper desenvolvido buscando a viabilidade de indexar as informações coletadas.-
Descrição: dc.descriptionIndexing is an identification of a document so that it can be accessed when desired. Web Crawling is the process responsible for scanning the internet, extracting all metadata for indexing, unlike Web Scraping, which is an automated way to enter a given website and extract information from it. Through automated processes, implemented using a robot, Web Scraping exports data from a website to a database or a local spreadsheet for later retrieval and analysis of the extracted information. Due to the large amount of data on a website, this process facilitates the storage of data in a bank as it allows access to large volumes of data simultaneously. The focus of this work was, through a use case, to use the benefits of Web Scraping to arrive at a viable solution for the indexing of scientific articles. For this, a scraper was developed that collects metadata from scientific articles and their authors published in the IEEE Xplore library and exports the collected data to two spreadsheets of CSV format. We will address the concepts of scientific society, indexing, Web Scraping and its main libraries and tools. The result of this work offers an analysis of the tests and results obtained from the scraper developed looking for the feasibility of indexing the information collected.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Federal Fluminense-
Publicador: dc.publisherNiterói-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectWeb scraping-
Palavras-chave: dc.subjectIndexação-
Palavras-chave: dc.subjectAutomatização-
Palavras-chave: dc.subjectMetadado-
Palavras-chave: dc.subjectSistema de informação-
Palavras-chave: dc.subjectBiblioteca digital-
Palavras-chave: dc.subjectIndexing-
Palavras-chave: dc.subjectAutomation-
Título: dc.titleWeb Scraping, um caso de uso para coletar metadados de artígos científicos publicados na biblioteca digital da IEEE-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.