引用格式:康未,李維皓,劉桐菊.基于生成對抗神經網絡的流量生成方法研究[J].網絡安全與數據治理,2024,43(6):33-41.
引言
隨著計算機和網絡技術的發展,網絡環境變得日益復雜[1],網絡攻擊事件頻發,使得網絡的安全性測試和評估尤為重要。在網絡攻擊方式不斷演變之下,人工智能的發展使得網絡的攻擊和防御進入了一種新的態勢[2],導致傳統的測試方法無法應對當前的需求。在此背景之下,亟需一種能夠模擬真實場景的流量生成工具,以評估網絡性能、檢測網絡潛在的風險和優化應用程序,防止網絡攻擊事件的發生。
現有網絡流量生成器主要分為[3]:最大吞吐量生成器,以恒定或最大的速率生成網絡流量,常用于網絡帶寬的測試,例如 Iperf2[4];回放生成器,重放之前捕獲的網絡流量,如 TCPReplay[5];隨機模型生成器,利用隨機模型來模擬網絡流量的特征,如 Harpoon[6];腳本生成器,允許用戶編寫復雜的邏輯,動態地修改數據包內容,可以生成任意類型的數據包,如 Moongen[7]和 Scapy[8];特定場景生成器,對特定應用程序實現的流量生成器,高度定制化,很難在其他環境繼續使用。其中只有隨機模型生成器和腳本生成器具有更多的靈活性,能夠在不同的維度模擬網絡流量,不過這需要用戶首先對采集到的數據設定一個統計模型,或者利用統計方法估計一個模型。因此如果設定的隨機分布不正確,或者流量數據的模型是未知的,那么生成流量就會不準確甚至失敗。
深度神經網絡在擬合隨機模型上有著天然的優勢,可以利用在真實網絡中采集的流量數據,擬合對應數據的統計分布。而生成對抗神經網絡 (Generative Adversarial Networks,GAN)[9]已經在很多領域被廣泛應用,如圖像[10]、音頻[11]、視頻[12]等。通過對現有網絡流量生成方法的研究,基于統計的流量生成方法如圖1所示,首先在真實網絡中采集一段數據,然后提取需要生成的網絡流量的特征;將數據經過預處理,得到神經網絡的輸入數據,使用一種或多種統計模型進行擬合訓練,利用擬合后的模型生成網絡流量在另一個時間段的特征;最后再將生成特征組合成的流量,發送到模擬的網絡環境中,用以測試網絡環境,或者研究網絡用戶的行為。
本文詳細內容請下載:
http://m.viuna.cn/resource/share/2000006045
作者信息:
康未,李維皓,劉桐菊
(華北計算機系統工程研究所,北京100083)