Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorPassos, Fernanda G. O.-
Autor(es): dc.contributorPassos, Diego-
Autor(es): dc.contributorNascimento, Aline-
Autor(es): dc.creatorSantos, Leonardo Brito dos-
Autor(es): dc.creatorJorge, Renan Henrique Azevedo-
Data de aceite: dc.date.accessioned2024-07-11T17:58:26Z-
Data de disponibilização: dc.date.available2024-07-11T17:58:26Z-
Data de envio: dc.date.issued2023-09-26-
Data de envio: dc.date.issued2023-09-26-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/30592-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/761158-
Descrição: dc.descriptionCada vez mais se ouve falar no conceito de Big Data, isso esta acontecendo devido ao constante crescimento de dados gerados no meio digital. Por conta do aumento de interesse sobre Big Data surgiram varias ferramentas que auxiliam no processamento de dados em larga escala, utilizando paralelismo como forma de acelerar a entrega dos resultados, isso possibilita o processamento em tempo real, sendo assim, decisões críticas podem ser tomadas com maior antecedência. Neste trabalho de conclusão de curso, temos como objetivo estudar duas dessas ferramentas utilizadas para projetos de Big Data, o Hadoop MapReduce e o Apache Spark, onde serão apontadas as características de cada uma comparando as duas por meio do experimento de classificação de gêneros musicais, utilizando características extraídas do áudio a partir das prévias fornecidas pelo serviço de streaming Spotify. No nosso conjunto de dados, foram coletadas, aproximadamente, 400 mil musicas, distribuídas entre os 5 gêneros musicais mais populares: rock, pop, clássica, eletrônica e jazz. Através dos experimentos realizados constatou-se que a ferramenta Apache Spark obteve resultados superiores comparado com o Hadoop MapReduce em relação ao tempo de execução e a acurácia. A partir dos resultados também foi possível enxergar estudos futuros dessas ferramentas, utilizando novas formas de processamento e ambientes de execução-
Descrição: dc.descriptionMore and more we hear about the concept of Big Data, this is happening due to the constant growth of data generated in the digital environment. Due to increased interest on Big Data, several tools have emerged to help large scale data processing, using parallelism as a way of accelerating results delivery, and enabling real time processing, because of that critical decision can be taken in advance. In this dissertation, we aim to study two tools used for Big Data projects, the Hadoop MapReduce and the Apache Spark, we will point out the main characteristics of each tool, comparing both by a musical genre classification experiment, using characteristics extracted from the audio provided by the streaming service Spotify. On our dataset were collected approximately 400 thousand songs, distributed on the five most popular music genres: rock, pop, classic, electronic and jazz. Through the experiments that were made we verified that the tool Apache Spark have obtained better results than Hadoop MapReduce in relation to the execution time and acuracy of the classification. From the results it was also possible to see future studies of these tools, using new forms of processing and execution environments-
Descrição: dc.description49 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectBig Data-
Palavras-chave: dc.subjectClassificação de gêneros musicais-
Palavras-chave: dc.subjectHadoop MapReduce-
Palavras-chave: dc.subjectSpark-
Palavras-chave: dc.subjectBig Data-
Palavras-chave: dc.subjectProcessamento de dados (Computação)-
Palavras-chave: dc.subjectGênero musical-
Palavras-chave: dc.subjectMusical genre classification-
Título: dc.titleUm estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.