Atenção:
O eduCAPES é um repositório de objetos educacionais, não sendo responsável por materiais de terceiros submetidos na plataforma. O usuário assume ampla e total responsabilidade quanto à originalidade, à titularidade e ao conteúdo, citações de obras consultadas, referências e outros elementos que fazem parte do material que deseja submeter. Recomendamos que se reporte diretamente ao(s) autor(es), indicando qual parte do material foi considerada imprópria (cite página e parágrafo) e justificando sua denúncia.
Caso seja o autor original de algum material publicado indevidamente ou sem autorização, será necessário que se identifique informando nome completo, CPF e data de nascimento. Caso possua uma decisão judicial para retirada do material, solicitamos que informe o link de acesso ao documento, bem como quaisquer dados necessários ao acesso, no campo abaixo.
Todas as denúncias são sigilosas e sua identidade será preservada. Os campos nome e e-mail são de preenchimento opcional. Porém, ao deixar de informar seu e-mail, um possível retorno será inviabilizado e/ou sua denúncia poderá ser desconsiderada no caso de necessitar de informações complementares.
Metadados | Descrição | Idioma |
---|---|---|
Autor(es): dc.contributor | Passos, Fernanda G. O. | - |
Autor(es): dc.contributor | Passos, Diego | - |
Autor(es): dc.contributor | Nascimento, Aline | - |
Autor(es): dc.creator | Santos, Leonardo Brito dos | - |
Autor(es): dc.creator | Jorge, Renan Henrique Azevedo | - |
Data de aceite: dc.date.accessioned | 2024-07-11T17:58:26Z | - |
Data de disponibilização: dc.date.available | 2024-07-11T17:58:26Z | - |
Data de envio: dc.date.issued | 2023-09-26 | - |
Data de envio: dc.date.issued | 2023-09-26 | - |
Fonte completa do material: dc.identifier | http://app.uff.br/riuff/handle/1/30592 | - |
Fonte: dc.identifier.uri | http://educapes.capes.gov.br/handle/capes/761158 | - |
Descrição: dc.description | Cada vez mais se ouve falar no conceito de Big Data, isso esta acontecendo devido ao constante crescimento de dados gerados no meio digital. Por conta do aumento de interesse sobre Big Data surgiram varias ferramentas que auxiliam no processamento de dados em larga escala, utilizando paralelismo como forma de acelerar a entrega dos resultados, isso possibilita o processamento em tempo real, sendo assim, decisões críticas podem ser tomadas com maior antecedência. Neste trabalho de conclusão de curso, temos como objetivo estudar duas dessas ferramentas utilizadas para projetos de Big Data, o Hadoop MapReduce e o Apache Spark, onde serão apontadas as características de cada uma comparando as duas por meio do experimento de classificação de gêneros musicais, utilizando características extraídas do áudio a partir das prévias fornecidas pelo serviço de streaming Spotify. No nosso conjunto de dados, foram coletadas, aproximadamente, 400 mil musicas, distribuídas entre os 5 gêneros musicais mais populares: rock, pop, clássica, eletrônica e jazz. Através dos experimentos realizados constatou-se que a ferramenta Apache Spark obteve resultados superiores comparado com o Hadoop MapReduce em relação ao tempo de execução e a acurácia. A partir dos resultados também foi possível enxergar estudos futuros dessas ferramentas, utilizando novas formas de processamento e ambientes de execução | - |
Descrição: dc.description | More and more we hear about the concept of Big Data, this is happening due to the constant growth of data generated in the digital environment. Due to increased interest on Big Data, several tools have emerged to help large scale data processing, using parallelism as a way of accelerating results delivery, and enabling real time processing, because of that critical decision can be taken in advance. In this dissertation, we aim to study two tools used for Big Data projects, the Hadoop MapReduce and the Apache Spark, we will point out the main characteristics of each tool, comparing both by a musical genre classification experiment, using characteristics extracted from the audio provided by the streaming service Spotify. On our dataset were collected approximately 400 thousand songs, distributed on the five most popular music genres: rock, pop, classic, electronic and jazz. Through the experiments that were made we verified that the tool Apache Spark have obtained better results than Hadoop MapReduce in relation to the execution time and acuracy of the classification. From the results it was also possible to see future studies of these tools, using new forms of processing and execution environments | - |
Descrição: dc.description | 49 p. | - |
Formato: dc.format | application/pdf | - |
Idioma: dc.language | pt_BR | - |
Direitos: dc.rights | Open Access | - |
Direitos: dc.rights | CC-BY-SA | - |
Palavras-chave: dc.subject | Big Data | - |
Palavras-chave: dc.subject | Classificação de gêneros musicais | - |
Palavras-chave: dc.subject | Hadoop MapReduce | - |
Palavras-chave: dc.subject | Spark | - |
Palavras-chave: dc.subject | Big Data | - |
Palavras-chave: dc.subject | Processamento de dados (Computação) | - |
Palavras-chave: dc.subject | Gênero musical | - |
Palavras-chave: dc.subject | Musical genre classification | - |
Título: dc.title | Um estudo de ferramentas de Big Data para a análise da classificação de gêneros musicais | - |
Tipo de arquivo: dc.type | Trabalho de conclusão de curso | - |
Aparece nas coleções: | Repositório Institucional da Universidade Federal Fluminense - RiUFF |
O Portal eduCAPES é oferecido ao usuário, condicionado à aceitação dos termos, condições e avisos contidos aqui e sem modificações. A CAPES poderá modificar o conteúdo ou formato deste site ou acabar com a sua operação ou suas ferramentas a seu critério único e sem aviso prévio. Ao acessar este portal, você, usuário pessoa física ou jurídica, se declara compreender e aceitar as condições aqui estabelecidas, da seguinte forma: