Atenção: Todas as denúncias são sigilosas e sua identidade será preservada.
Os campos nome e e-mail são de preenchimento opcional
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Pinto, Douglas Rodrigues | - |
Autor(es): dc.contributor | Pinto, Douglas Rodrigues | - |
Autor(es): dc.contributor | Kubrusly, Jessica Quintanilha | - |
Autor(es): dc.contributor | Yaginuma, Karina Yuriko | - |
Autor(es): dc.contributor | Pinto, Douglas Rodrigues | - |
Autor(es): dc.creator | Santos, Daniel dos | - |
Data de aceite: dc.date.accessioned | 2024-07-11T17:44:31Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T17:44:31Z | - |
Data de envio: dc.date.issued | 2022-07-25 | - |
Data de envio: dc.date.issued | 2022-07-25 | - |
Data de envio: dc.date.issued | 2020 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/25818 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/756566 | - |
Descrição: dc.description | Este trabalho apresenta o Apache Spark, ferramenta que utiliza computação distribuída para tratar dados com grandes dimensões. Serão mostradas diversas funcionalidades do Spark dentro da linguagem de programação R, através do pacote SparkR. Por fim, utiliza-se todo o conhecimento apresentado para tratar um conjunto de dados sobre carros usados e treinar um modelo de árvore de decisão para predizer o valor dos carros. Apesar do modelo treinado não ser satisfatório, foi possível observar diversas dificuldades em utilizar os SparkR para realizar esse tipo de análise. | - |
Descrição: dc.description | 72 f. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Publicador: dc.publisher | Niterói | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Apache Spark | - |
Palavras-chave: dc.subject | Big data | - |
Palavras-chave: dc.subject | R | - |
Palavras-chave: dc.subject | Computação distribuída | - |
Palavras-chave: dc.subject | MapReduce | - |
Palavras-chave: dc.subject | Estatística | - |
Palavras-chave: dc.subject | Mineração de texto | - |
Palavras-chave: dc.subject | Tecnologia da informação | - |
Palavras-chave: dc.subject | R (Linguagem de programação de computador) | - |
Título: dc.title | Análise de dados de alta dimensão utilizando Apache Spark com R | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: