周杰迪
东南大学网络空间安全学院
摘要(Abstract):
网络流量数据是网络安全监测、入侵检测系统训练、网络性能优化与网络行为分析的核心基础资源。真实流量采集面临隐私合规约束、数据分布不均衡、攻击样本稀缺、场景复现困难等现实问题,传统基于统计模型、流量回放与规则脚本的流量生成方法难以刻画真实网络的复杂分布、时序依赖与动态行为,生成样本真实性差、泛化能力弱,无法满足高精度网络仿真与安全验证需求。生成对抗网络(GAN)凭借无监督对抗学习机制,能够从海量真实流量中隐式学习高维特征分布,生成兼具统计一致性、时序合理性与行为真实性的合成流量,为解决网络数据稀缺与隐私约束问题提供了新型技术路径。本文围绕基于GAN的网络流量生成技术展开系统性研究,梳理网络流量生成的研究背景与技术瓶颈,阐述GAN基本原理与主流变体架构,分析网络流量统计特征与时序特征的表征方式;设计面向流级与包级流量的GAN生成模型,优化生成器与判别器结构、损失函数与多目标优化策略,构建包含数据预处理、特征编码、合法性校验的完整生成流程;在公开数据集上开展对比实验,从分布相似度、特征保真度、实用有效性等维度评估生成质量,验证所提模型相较于传统方法与经典GAN变体的性能优势。研究结果表明,改进GAN架构能够有效还原真实流量的多维统计特性与时序演进规律,生成流量可直接用于入侵检测模型训练、网络靶场环境构建与安全设备测试,为网络空间安全研究与网络工程实践提供高质量数据支撑与可复用技术方案。
关键词(KeyWords):
生成对抗网络;网络流量生成;流量特征学习;数据增强;网络安全
参考文献(References):
[1] Goodfellow I, Pouget-Abadie J, Mirza M, et al. Generative Adversarial Networks[J]. Advances in Neural Information Processing Systems, 2014, 27: 2672-2680.
[2] Arjovsky M, Chintala S, Bottou L. Wasserstein GAN[J]. arXiv preprint arXiv:1701.07875, 2017.
[3] Gulrajani I, Ahmed F, Arjovsky M, et al. Improved Training of Wasserstein GANs[J]. Advances in Neural Information Processing Systems, 2017, 30: 5767-5777.
[4]王超,李涛,陈兴蜀.基于生成对抗网络的网络流量生成技术研究综述[J].计算机应用研究,2022,39(5):1281-1288.