Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Oliveira, Daniel Cardoso Moraes de | - |
Autor(es): dc.creator | Ferreira, Geison Leonino de Souza | - |
Data de aceite: dc.date.accessioned | 2024-07-11T18:21:32Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T18:21:32Z | - |
Data de envio: dc.date.issued | 2024-03-01 | - |
Data de envio: dc.date.issued | 2024-03-01 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/32519 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/768982 | - |
Descrição: dc.description | O artigo aborda as técnicas de scraping e construção de um banco de dados no contexto do mercado de ações brasileiro. Partiu-se da identificação do problema que as bases gratuitas de fontes secundárias disponíveis não atendem plenamente as regras e prazos locais. Assim, optou-se pela construção de uma base a partir das fontes primárias como a B3 e CVM. Usou-se estratégias de ETL para fazer as extrações, transformações e cargas. Para as extrações, levantou-se a localização das informações disponíveis, analisou -se como integrá-las e construiu-se os algoritmos de scraping. Para as transformações, levantou-se as legislações pertinentes e construiu-se os algoritmos para dar os tratamentos adequados. Para a carga, desenhou-se dois bancos de dados, um temporário tipo data lake e o banco de dados final, alimentado pelos algoritmos de carga. De sta forma, foi possível manter um banco de dados de atualização automatizada. O resultado foi uma base de dados integrada com demonstrações financeiras e cotações de 2012 a 2021, com um total de 415 empresas, totalizando 512 códigos de negociação, agregando os dados de cadastro, setores e referenciando-os pelo ISIN. | - |
Descrição: dc.description | This article discusses the scraping and construction of a database techniques in the Brazilian Stock Market context. The problem identified is the free secondary available databases don’t meet fully the local rules and deadlines. So was chosen the construction of a database from primary sources, such as B3 and CVM. By using ETL strategies to do the extractions, transformations , and load. For the extractions, the localization of the available information was identified, analyzed how to integrate them, and scraping algorithms were constructed. For the transformations, the relevant legislation was considered and the algorithms responsible to give the right treatments wase constructed. For the loading, two databases were designed, the first like data lake and the n the final database, input by the loading algorithms. In this way was possible to maintain an automated update database. The result was an integrated database containing financial statements and quotations from 2012 to 2021, with 415 companies, totaling 512 tickers codes, and that aggregate registration and sectors data, referencing the m by the ISIN. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Banco de dados | - |
Palavras-chave: dc.subject | Mineração de dados | - |
Palavras-chave: dc.subject | Raspagem de dados | - |
Palavras-chave: dc.subject | Banco de dados | - |
Palavras-chave: dc.subject | Índice de mercado de ações | - |
Palavras-chave: dc.subject | Brasil | - |
Palavras-chave: dc.subject | Databases | - |
Palavras-chave: dc.subject | Data mining | - |
Palavras-chave: dc.subject | Scraping | - |
Título: dc.title | Scraping e construção de base de dados financeiros aplicados ao mercado de ações do Brasil | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: