Aprimorando o desempenho da rede através da agregação de links em um ambiente de cluster Spark

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorRista, Luís Cassiano Goularte-
Autor(es): dc.contributorRista, Luís Cassiano Goularte-
Autor(es): dc.contributorFavarim, Fábio-
Autor(es): dc.contributorCasanova, Dalcimar-
Autor(es): dc.creatorBarros, Vinicius Cerqueira-
Data de aceite: dc.date.accessioned2025-08-29T12:31:36Z-
Data de disponibilização: dc.date.available2025-08-29T12:31:36Z-
Data de envio: dc.date.issued2025-03-12-
Data de envio: dc.date.issued2025-03-12-
Data de envio: dc.date.issued2025-02-11-
Fonte completa do material: dc.identifierhttp://repositorio.utfpr.edu.br/jspui/handle/1/36064-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/1097007-
Descrição: dc.descriptionCommunication among nodes in distributed processing clusters can become a significant bottleneck when executing large-scale workloads. This study investigates the application of the Multipath TCP (MPTCP) protocol to optimize communication in Apache Spark clusters, leveraging multiple network paths to increase data transfer rates and reduce latency. Furthermore, the impact of MPTCP has been analyzed on the execution of the FP-Growth algorithm for frequent pattern mining in large datasets. The proposed approach involves comparative experiments between conventional TCP and MPTCP, evaluating metrics such as data transfer rate, latency, and execution time. The results demonstrate that integrating MPTCP into Apache Spark can significantly enhance communication efficiency between cluster nodes, reducing bottlenecks and optimizing distributed processing performance.-
Descrição: dc.descriptionA comunicação entre nós em clusters de processamento distribuído pode representar um gargalo significativo na execução de cargas de trabalho em larga escala. Este trabalho investiga a aplicação do protocolo Multipath TCP (MPTCP) para otimizar a comunicação em clusters Apache Spark, explorando múltiplos caminhos de rede para aumentar a taxa de transferência e reduzir a latência. Além disso, foi analisado o impacto do MPTCP na execução do algoritmo FPGrowth para mineração de padrões frequentes em grandes volumes de dados. A abordagem proposta envolve experimentos comparativos entre o TCP convencional e o MPTCP, avaliando métricas como taxa de transferência, latência e tempo de execução. Os resultados demonstram que a integração do MPTCP ao Apache Spark pode melhorar significativamente a eficiência da comunicação entre os nós do cluster, reduzindo gargalos e otimizando o desempenho do processamento distribuído.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Tecnológica Federal do Paraná-
Publicador: dc.publisherPato Branco-
Publicador: dc.publisherBrasil-
Publicador: dc.publisherDepartamento Acadêmico de Informática-
Publicador: dc.publisherEngenharia de Computação-
Publicador: dc.publisherUTFPR-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by/4.0/-
Palavras-chave: dc.subjectBig data-
Palavras-chave: dc.subjectMineração de dados (Computação)-
Palavras-chave: dc.subjectAlgorítmos computacionais-
Palavras-chave: dc.subjectProcessamento eletrônico de dados - Processamento distribuído-
Palavras-chave: dc.subjectData mining-
Palavras-chave: dc.subjectComputer algorithms-
Palavras-chave: dc.subjectElectronic data processing - Distributed processing-
Palavras-chave: dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO-
Título: dc.titleAprimorando o desempenho da rede através da agregação de links em um ambiente de cluster Spark-
Título: dc.titleImproving network performance through link aggregation in a Spark cluster environment-
Tipo de arquivo: dc.typelivro digital-
Aparece nas coleções:Repositorio Institucional da UTFPR - RIUT

Não existem arquivos associados a este item.