Detecção de intrusão em rede por aprendizado de máquina distribuído

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMattos, Diogo Menezes Ferrazani-
Autor(es): dc.contributorMoraes, Igor Monteiro-
Autor(es): dc.contributorBastos, Ian Vilar-
Autor(es): dc.contributorCunha Neto, Helio do Nascimento-
Autor(es): dc.creatorPereira, Lucas Fauster Leite-
Data de aceite: dc.date.accessioned2024-07-11T17:27:02Z-
Data de disponibilização: dc.date.available2024-07-11T17:27:02Z-
Data de envio: dc.date.issued2023-02-23-
Data de envio: dc.date.issued2023-02-23-
Fonte completa do material: dc.identifierhttp://app.uff.br/riuff/handle/1/27941-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/750537-
Descrição: dc.descriptionOs Sistemas de Detecção de Intrusão são utilizados em redes para monitoramento de fluxos de dados a fim de detectar e conter ataques cibernéticos. O aprendizado de máquina surge como uma solução para a detecção de intrusão devido à sua capacidade de reconhecer padrões nos dados com eficiência. Sistemas de aprendizado de máquina, que detêm o armazenamento dos dados centralizado, têm que se responsabilizar pela segurança desses dados de acordo com a LGPD e, também, precisam lidar com todo o processamento dos dados. O aprendizado de máquina distribuído propõe uma solução para o treinamento de modelos de forma colaborativa, em que cada participante compartilha apenas o modelo treinado localmente, mantendo os dados locais em seus dispositivos. Este trabalho propõe um Sistema de Aprendizado de Máquina para Detecção de Intrusão Distribuído com Topologia de Comunicação Ponto-a-Ponto, utilizando um modelo compartilhado de Árvore de Decisão, em que as árvores compartilhadas compõem uma Floresta de Decisão Distribuída. O trabalho simula e compara a proposta com um Sistema de Detecção de Intrusão Distribuído com Topologia de Comunicação de Servidor de Parâmetros, utilizando como modelo de aprendizado de máquina uma rede neural. As simulações realizadas mostram que o modelo de Floresta de Decisão Distribuída apresenta a mediana da acurácia em 79% em apenas uma rodada. O modelo de Rede Neural atingiu mediana de acurácia de 86% com a mesma quantidade de dados, porém em 10 rodadas de treinamento. Foram utilizados 6GB de dados do fluxo de uma rede de telecomunicações real para o treinamento dos modelos. O resultado mostra que o modelo de Floresta de Decisão Distribuída dispõe de menor sobrecarga de processamento e maior privacidade sobre os dados para alcançar desempenho comparável à rede neural federada.-
Descrição: dc.descriptionIntrusion Detection Systems are used in networks to monitor data flows to detect and contain cyber attacks. Machine learning emerges as a solution for intrusion detection due to its ability to recognize patterns in data efficiently. However, machine learning systems, which hold centralized data storage, have to be responsible for the security of this data according to the LGPD and also need to handle all data processing. Distributed machine learning proposes a solution for training models collaboratively, in which each participant shares only the locally trained model, keeping the local data on their devices. In this work, we propose a Distributed Machine Learning System for Intrusion Detection with Peer-to-Peer Communication Topology using a shared Decision Tree model, in which the shared trees compose a Distributed Decision Forest. The work simulates and compares the proposal with a Distributed Machine Learning System for Intrusion Detection with Parameter Server Communication Topology, using a Neural Network as a machine learning model. The simulations show that the Distributed Decision Forest model reached a median accuracy of 79% in just one training round. The Neural Network model achieved a median accuracy of 86% with the same amount of data but in 10 training rounds. Models’ training accounts with over 6GB of flow data from a real-world telecommunications network operator. The result shows that the Distributed Decision Forest model has less processing overhead and greater data privacy to achieve performance comparable to the federated neural network-
Descrição: dc.description54 p.-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Direitos: dc.rightsOpen Access-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectML-
Palavras-chave: dc.subjectSistemas distribuídos-
Palavras-chave: dc.subjectIDS-
Palavras-chave: dc.subjectLGPD-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectSegurança de dados on-line-
Palavras-chave: dc.subjectProcessamento de dados (Computação)-
Palavras-chave: dc.subjectDistributed Systems-
Título: dc.titleDetecção de intrusão em rede por aprendizado de máquina distribuído-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.