Análise de dados de alta dimensão utilizando Apache Spark com R

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPinto, Douglas Rodrigues-
Autor(es): dc.contributorPinto, Douglas Rodrigues-
Autor(es): dc.contributorKubrusly, Jessica Quintanilha-
Autor(es): dc.contributorYaginuma, Karina Yuriko-
Autor(es): dc.contributorPinto, Douglas Rodrigues-
Autor(es): dc.creatorSantos, Daniel dos-
Data de aceite: dc.date.accessioned2024-07-11T17:44:31Z-
Data de disponibilização: dc.date.available2024-07-11T17:44:31Z-
Data de envio: dc.date.issued2022-07-25-
Data de envio: dc.date.issued2022-07-25-
Data de envio: dc.date.issued2020-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/25818-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/756566-
Descrição: dc.descriptionEste trabalho apresenta o Apache Spark, ferramenta que utiliza computação distribuída para tratar dados com grandes dimensões. Serão mostradas diversas funcionalidades do Spark dentro da linguagem de programação R, através do pacote SparkR. Por fim, utiliza-se todo o conhecimento apresentado para tratar um conjunto de dados sobre carros usados e treinar um modelo de árvore de decisão para predizer o valor dos carros. Apesar do modelo treinado não ser satisfatório, foi possível observar diversas dificuldades em utilizar os SparkR para realizar esse tipo de análise.-
Descrição: dc.description72 f.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherNiterói-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectApache Spark-
Palavras-chave: dc.subjectBig data-
Palavras-chave: dc.subjectR-
Palavras-chave: dc.subjectComputação distribuída-
Palavras-chave: dc.subjectMapReduce-
Palavras-chave: dc.subjectEstatística-
Palavras-chave: dc.subjectMineração de texto-
Palavras-chave: dc.subjectTecnologia da informação-
Palavras-chave: dc.subjectR (Linguagem de programação de computador)-
Título: dc.titleAnálise de dados de alta dimensão utilizando Apache Spark com R-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.