
Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
| Metadados | Descrição | Idioma |
|---|---|---|
| Autor(es): dc.contributor | Grégio, André Ricardo Abed, 1983- | - |
| Autor(es): dc.contributor | Universidade Federal do Paraná. Setor de Ciências Exatas. Curso de Especialização em Data Science & Big Data | - |
| Autor(es): dc.creator | Toledo, Matheus Allan | - |
| Data de aceite: dc.date.accessioned | 2025-09-01T11:58:37Z | - |
| Data de disponibilização: dc.date.available | 2025-09-01T11:58:37Z | - |
| Data de envio: dc.date.issued | 2023-12-26 | - |
| Data de envio: dc.date.issued | 2023-12-26 | - |
| Data de envio: dc.date.issued | 2022 | - |
| Fonte completa do material: dc.identifier | https://hdl.handle.net/1884/85884 | - |
| Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/1884/85884 | - |
| Descrição: dc.description | Orientador: Prof. André Ricardo Abed Grégio | - |
| Descrição: dc.description | Artigo apresentado como Trabalho de Conclusão de Curso | - |
| Descrição: dc.description | Monografia (especialização) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Especialização em Data Science e Big Data | - |
| Descrição: dc.description | Inclui referências | - |
| Descrição: dc.description | Resumo: A utilização de arquivos CSV (Comma-Separated Values) é uma prática comum em muitos campos da ciência devido à sua simplicidade e facilidade de manipulação. No entanto, a leitura de arquivos CSV pode ser um desafio significativo devido a uma série de problemas comuns que surgem durante o processo. Esta monografia analisa os desafios comuns enfrentados ao ler arquivos CSV e apresenta estratégias para solucioná-los. Os desafios incluem a diversidade de encodings utilizados nos arquivos, a leitura de arquivos grandes e a inconsistência de cabeçalhos e dados. Para resolver esses problemas, são discutidas técnicas como detecção e leitura correta com encodings, abordagens eficientes para a leitura de arquivos grandes emétodos para lidar com dados inconsistentes, como valores nulos, mudanças no nome de colunas e perda de colunas. O objetivo é fornecer aos leitores um conjunto de estratégias eficazes e eficientes para enfrentar esses desafios ao lidar com arquivos CSV. | - |
| Descrição: dc.description | Abstract: The use of CSV (Comma-Separated Values) files is a common practice in many fields of science and industry, due to their simplicity and ease of manipulation. However, reading CSV files can be a significant challenge due to a series of common problems that arise during the process. This monograph examines the common challenges faced when reading CSV files and presents strategies to address them. These challenges include the diversity of encodings used in the files, reading very large files, and data inconsistency. To address these problems, techniques such as detecting and correctly converting encodings, efficient approaches for reading large files, and methods for handling inconsistent data such as null values, column name changes, and column loss are discussed. The aim is to provide readers with a set of effective and efficient strategies to tackle these challenges when dealing with CSV files. | - |
| Formato: dc.format | 1 recurso online : PDF. | - |
| Formato: dc.format | application/pdf | - |
| Formato: dc.format | application/pdf | - |
| Palavras-chave: dc.subject | Mineração de dados (Computação) | - |
| Título: dc.title | Abordagens e estratégias para superar desafios na exploração de dados : um estudo de caso | - |
| Aparece nas coleções: | Repositório Institucional - Rede Paraná Acervo | |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: