Scraping e construção de base de dados financeiros aplicados ao mercado de ações do Brasil

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorOliveira, Daniel Cardoso Moraes de-
Autor(es): dc.creatorFerreira, Geison Leonino de Souza-
Data de aceite: dc.date.accessioned2024-07-11T18:21:32Z-
Data de disponibilização: dc.date.available2024-07-11T18:21:32Z-
Data de envio: dc.date.issued2024-03-01-
Data de envio: dc.date.issued2024-03-01-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/32519-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/768982-
Descrição: dc.descriptionO artigo aborda as técnicas de scraping e construção de um banco de dados no contexto do mercado de ações brasileiro. Partiu-se da identificação do problema que as bases gratuitas de fontes secundárias disponíveis não atendem plenamente as regras e prazos locais. Assim, optou-se pela construção de uma base a partir das fontes primárias como a B3 e CVM. Usou-se estratégias de ETL para fazer as extrações, transformações e cargas. Para as extrações, levantou-se a localização das informações disponíveis, analisou -se como integrá-las e construiu-se os algoritmos de scraping. Para as transformações, levantou-se as legislações pertinentes e construiu-se os algoritmos para dar os tratamentos adequados. Para a carga, desenhou-se dois bancos de dados, um temporário tipo data lake e o banco de dados final, alimentado pelos algoritmos de carga. De sta forma, foi possível manter um banco de dados de atualização automatizada. O resultado foi uma base de dados integrada com demonstrações financeiras e cotações de 2012 a 2021, com um total de 415 empresas, totalizando 512 códigos de negociação, agregando os dados de cadastro, setores e referenciando-os pelo ISIN.-
Descrição: dc.descriptionThis article discusses the scraping and construction of a database techniques in the Brazilian Stock Market context. The problem identified is the free secondary available databases don’t meet fully the local rules and deadlines. So was chosen the construction of a database from primary sources, such as B3 and CVM. By using ETL strategies to do the extractions, transformations , and load. For the extractions, the localization of the available information was identified, analyzed how to integrate them, and scraping algorithms were constructed. For the transformations, the relevant legislation was considered and the algorithms responsible to give the right treatments wase constructed. For the loading, two databases were designed, the first like data lake and the n the final database, input by the loading algorithms. In this way was possible to maintain an automated update database. The result was an integrated database containing financial statements and quotations from 2012 to 2021, with 415 companies, totaling 512 tickers codes, and that aggregate registration and sectors data, referencing the m by the ISIN.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectBanco de dados-
Palavras-chave: dc.subjectMineração de dados-
Palavras-chave: dc.subjectRaspagem de dados-
Palavras-chave: dc.subjectBanco de dados-
Palavras-chave: dc.subjectÍndice de mercado de ações-
Palavras-chave: dc.subjectBrasil-
Palavras-chave: dc.subjectDatabases-
Palavras-chave: dc.subjectData mining-
Palavras-chave: dc.subjectScraping-
Título: dc.titleScraping e construção de base de dados financeiros aplicados ao mercado de ações do Brasil-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.