Processo de desenvolvimento de uma feature store a partir de dados de web scraping

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorGritti, Marcos Cesar-
Autor(es): dc.contributorBerardi, Rita Cristina Galarraga-
Autor(es): dc.contributorGritti, Marcos Cesar-
Autor(es): dc.contributorBerardi, Rita Cristina Galarraga-
Autor(es): dc.contributorRosa, Marcelo de Oliveira-
Autor(es): dc.creatorSilva, Pedro Augutos de Lima e-
Data de aceite: dc.date.accessioned2025-08-29T12:27:51Z-
Data de disponibilização: dc.date.available2025-08-29T12:27:51Z-
Data de envio: dc.date.issued2024-11-20-
Data de envio: dc.date.issued2024-11-20-
Data de envio: dc.date.issued2023-03-14-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/35499-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1095809-
Descrição: dc.descriptionWith the growth of the electronic games industry and the dependence on data for decision making, the work seeks to present a data transformation process until it is significantly safe and ready for analysis or to be acquired by an machine model learning . As an example, let’s use event data from Counter Strike championship matches. This process consists of an web scraping step, where it was necessary to develop an script in Python to standardize the process, and another data transformation step using the Spark processing engine, since the amount of extracted data was considerably large. The result is an feature store, which is a set of data about the statistics of professional players in championships with prizes above 100 thousand dollars.-
Descrição: dc.descriptionCom o crescimento da indústria de jogos eletrônicos e a dependência de dados para as tomadas de decisões, o trabalho busca apresentar um processo transformação dos dados até estar significativamente estruturado e pronto para a análise ou para ser consumido por um modelo de machine learning. Como exemplo, vamos utilizar dados de eventos de partidas de campeonatos de Counter Strike. Esse processo é composto por uma etapa de web scraping, onde foi necessário desenvolver um script em Python para padronizar o processo, e outra etapa de transformação dos dados utilizando o motor de processamento Spark, uma vez que a quantidade de dados extraídos foi consideravelmente grande. O resultado é uma feature store, onde é um conjunto de dados sobre as estatísticas dos jogadores profissionais em campeonatos com premiações acima de 100 mil dólares.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherCuritiba-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherCiência de Dados e suas Aplicações-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Palavras-chave: dc.subjectSistemas de coleta automática de dados-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Palavras-chave: dc.subjectArmazenamento de dados-
Palavras-chave: dc.subjectProcessamento eletrônico de dados-
Palavras-chave: dc.subjectPython (Linguagem de programação de computador)-
Palavras-chave: dc.subjectEstruturas de dados (Computação)-
Palavras-chave: dc.subjectAutomatic data collection systems-
Palavras-chave: dc.subjectData mining-
Palavras-chave: dc.subjectData Warehousing-
Palavras-chave: dc.subjectElectronic data processing-
Palavras-chave: dc.subjectPython (Computer program language)-
Palavras-chave: dc.subjectData structures (Computer science)-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA-
Título: dc.titleProcesso de desenvolvimento de uma feature store a partir de dados de web scraping-
Título: dc.titleFeature store development process-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.