Plataformas de web scraping em ambiente de computação em nuvem : uma perspectiva prática

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorBona, Luis Carlos Erpen de-
Autor(es): dc.contributorUniversidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data-
Autor(es): dc.creatorRibeiro, Gabriel Yuri Silva-
Data de aceite: dc.date.accessioned2025-09-01T13:45:52Z-
Data de disponibilização: dc.date.available2025-09-01T13:45:52Z-
Data de envio: dc.date.issued2024-02-07-
Data de envio: dc.date.issued2024-02-07-
Data de envio: dc.date.issued2021-
Fonte completa do material: dc.identifierhttps://hdl.handle.net/1884/79923-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/1884/79923-
Descrição: dc.descriptionOrientador: Luis C. E. Bona-
Descrição: dc.descriptionMonografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science & Big Data.-
Descrição: dc.descriptionInclui referências-
Descrição: dc.descriptionResumo: Este trabalho tem como enfoque apresentar uma solução de engenharia de dados para o problema de scraping de dados web de maneira sistêmica e orquestrada, utilizando de uma infraestrutura hospedada em nuvem e declarada como código, bem como um pipeline de integração contínua e deploy contínuo para operacionalizar a adição de novos recursos e funções. Desta forma, um website com informações de partidas competitivas do jogo Counter Strike: Global Offensive foi escolhido como fonte de dados, que forneceu arquivos de partidas que foram tratados até a criação de tabelas em um data warehouse. Por fim, uma breve proposta de utilização dos dados é apresentada-
Descrição: dc.descriptionAbstract: This work focuses on presenting a data engineering solution to the problem of web data scraping in a systemic and orchestrated way, using a cloud-hosted infrastructure and declared as code, as well as a continuous integration pipeline and continuous deployment to smoothen the addition of new features and functions. In this way, a website with information from competitive matches of the game Counter Strike: Global Offensive was chosen as a source of data, which provided match-related files to be then processed to the creation of tables in a data warehouse. Finally, a brief proposal for the use of the data is presented-
Formato: dc.format1 recurso online : PDF.-
Formato: dc.formatapplication/pdf-
Formato: dc.formatapplication/pdf-
Palavras-chave: dc.subjectComputação em nuvem-
Palavras-chave: dc.subjectColeta de dados-
Título: dc.titlePlataformas de web scraping em ambiente de computação em nuvem : uma perspectiva prática-
Aparece nas coleções:Repositório Institucional - Rede Paraná Acervo

Não existem arquivos associados a este item.