Análise estatística sobre o conjunto de dados de segurança de redes KDD-99 para o desenvolvimento de um sistema de segurança usando aprendizado de máquina

Registro completo de metadados
MetadadosDescriçãoIdioma
Autor(es): dc.contributorMattos, Diogo Menezes Ferrazani-
Autor(es): dc.contributorMedeiros, Dianne Scherly Varela de-
Autor(es): dc.contributorMoraes, Igor Monteiro-
Autor(es): dc.creatorSilva, João Vitor Valle-
Data de aceite: dc.date.accessioned2024-07-11T18:38:04Z-
Data de disponibilização: dc.date.available2024-07-11T18:38:04Z-
Data de envio: dc.date.issued2020-12-07-
Data de envio: dc.date.issued2020-12-07-
Data de envio: dc.date.issued2019-
Fonte completa do material: dc.identifierhttps://app.uff.br/riuff/handle/1/16224-
Fonte: dc.identifier.urihttp://educapes.capes.gov.br/handle/capes/774368-
Descrição: dc.descriptionAbordagens baseadas em anomalia para detectar intrusões em redes carecem de avaliações precisas, comparações e aplicações devido à escassez de conjuntos de dados adequados. Consequentemente, pesquisadores recorrem a conjuntos de dados defeituosos que não possuem relação com dados de redes reais nem fornecem conhecimento sobre problemas relacionados a redes, tais como o DARPA 1998 e suas variantes KDD-99 e NSL-KDD 99. Este trabalho propõe um estudo estatístico sobre as variáveis do conjunto de dados NSL- KDD e conclui que tanto o NSL-KDD 99 quanto o KDD-99 não são adequados para serem utilizados como parâmetro de comparação para criação de novos Sistemas de Detecção de Intrusões. Esses conjuntos de dados introduzem viés nos modelos classificatórios, dado que as variáveis estão altamente correlacionadas entre si e com a classe alvo. A abordagem proposta analisa a correlação entre as variáveis do conjunto ao invés de buscar por valores redundantes ou desbalanceamento dos dados. Os resultados são suportados por cinco técnicas de aprendizado de máquina treinadas para discriminar ataques de tráfego normal. Os resultados mostram que classificação enviesada ocorre, pois existe uma alta correlação entre as variáveis e a classe-alvo-
Descrição: dc.descriptionAnomaly-based approaches for detecting network intrusions suffer from accurate evaluation, comparison, and deployment due to the scarcity of adequate datasets. Consequently, researchers resort to suboptimal datasets that no longer relate to a real-world network nor provide insights for current network issues, such as the DARPA’98 dataset and its variants KDD-99 and NSL-KDD 99. In this work, we propose a statistical study over the NSL-KDD 99 features, and we conclude that NSL-KDD 99 and the old KDD-99 should not be used as a benchmark for creating novel anomaly-based approaches intrusion detection systems because they introduce a biased classification, since features are higly correlated. The proposed approach analyzes the correlation among features instead of checking for redundant values or the imbalance of data. Our results are paired with the performance of five machine learning techniques trained to discriminate attack from normal traffic. We show that biased classification occurs because there was a high correlation between features and classes-
Formato: dc.formatapplication/pdf-
Idioma: dc.languagept_BR-
Publicador: dc.publisherUniversidade Federal Fluminense-
Publicador: dc.publisherNiterói, RJ-
Direitos: dc.rightsopenAccess-
Direitos: dc.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/br/-
Direitos: dc.rightsCC-BY-SA-
Palavras-chave: dc.subjectSistemas de detecção de intrusão-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectKDD-99-
Palavras-chave: dc.subjectTelecomunicação-
Palavras-chave: dc.subjectSegurança de dados on-line-
Palavras-chave: dc.subjectAprendizado de máquina-
Palavras-chave: dc.subjectAnálise estatística-
Palavras-chave: dc.subjectNetwork security-
Palavras-chave: dc.subjectIntrusion detection systems-
Palavras-chave: dc.subjectMachine learning-
Título: dc.titleAnálise estatística sobre o conjunto de dados de segurança de redes KDD-99 para o desenvolvimento de um sistema de segurança usando aprendizado de máquina-
Tipo de arquivo: dc.typeTrabalho de conclusão de curso-
Aparece nas coleções:Repositório Institucional da Universidade Federal Fluminense - RiUFF

Não existem arquivos associados a este item.