摘 要: 提出了一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量識別方法。根據(jù)實(shí)際網(wǎng)絡(luò)中的流量數(shù)據(jù),建立了一個基于RBF神經(jīng)網(wǎng)絡(luò)的流量識別模型。先介紹了RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)及學(xué)習(xí)算法,針對RBF神經(jīng)網(wǎng)絡(luò)在隱節(jié)點(diǎn)過多的情況下算法過于復(fù)雜的缺點(diǎn),采用了優(yōu)化的算法計(jì)算隱含層節(jié)點(diǎn)。仿真實(shí)驗(yàn)證明,該模型具有較好的準(zhǔn)確率、低復(fù)雜度、高識別效果和良好的自適應(yīng)性。
關(guān)鍵詞: RBF神經(jīng)網(wǎng)絡(luò);流量識別;流量分類
隨著互聯(lián)網(wǎng)業(yè)務(wù)量的急劇增長,網(wǎng)絡(luò)性能和服務(wù)質(zhì)量方面的問題日益突出。在網(wǎng)絡(luò)資源有限的情況下,建立網(wǎng)絡(luò)流量模型,識別網(wǎng)絡(luò)流量,及時作出控制或者調(diào)整,將會極大提高網(wǎng)絡(luò)性能和服務(wù)質(zhì)量。尤其是隨著近年來互聯(lián)網(wǎng)技術(shù)的發(fā)展,網(wǎng)絡(luò)主要流量已經(jīng)由傳統(tǒng)的FTP、TELNET和HTTP向P2P和IM服務(wù)轉(zhuǎn)變。傳統(tǒng)的網(wǎng)絡(luò)流量識別方法已經(jīng)不能滿足當(dāng)前網(wǎng)絡(luò)發(fā)展的需求。
神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)關(guān)系具有良好的逼近能力,所以本文提出了一種基于RBF函數(shù)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量模型。RBF神經(jīng)網(wǎng)絡(luò)為局部神經(jīng)網(wǎng)絡(luò)模型,計(jì)算速度快、實(shí)時性好,相對于傳統(tǒng)的線性流量模型具有更高的逼近能力和良好的自適應(yīng)性,并可克服基于BP神經(jīng)網(wǎng)絡(luò)的流量模型訓(xùn)練時間長及計(jì)算復(fù)雜度高的不足。
1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及學(xué)習(xí)算法
1.1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
RBF神經(jīng)網(wǎng)絡(luò)是20世紀(jì)80年代由MOODY J和DARKEN C提出的一種神經(jīng)網(wǎng)絡(luò)模型,是具有單隱層的前饋網(wǎng)絡(luò),屬于局部逼近網(wǎng)絡(luò),已證明能以任意精度逼近任一連續(xù)函數(shù)。RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示。
網(wǎng)絡(luò)由輸入層、徑向基函數(shù)隱含層、輸出層三層構(gòu)成。低維空間非線性可分的問題總可以映射到一個高維空間,使其在此高維空間中為線性可分[1]。RBF的輸出單元部分構(gòu)成一個單層感知機(jī),只要合理選擇隱單元數(shù)(高維空間的維數(shù))和作用函數(shù),就可以把原來的問題映射為一個線性可分問題[2]。RBF網(wǎng)絡(luò)中輸入到隱含層的映射是非線性的,而隱含層到輸出的映射是線性的。隱含層的節(jié)點(diǎn)數(shù)與實(shí)際問題的要求有直接的關(guān)聯(lián),過多的節(jié)點(diǎn)數(shù)會導(dǎo)致學(xué)習(xí)時間過長和低容錯率,所以必須優(yōu)化隱含層的節(jié)點(diǎn)數(shù)。隱含層的節(jié)點(diǎn)數(shù)可以采用式(1)計(jì)算:
2 識別過程
流量識別過程分為四個部分:數(shù)據(jù)獲取過程、數(shù)據(jù)預(yù)處理過程、數(shù)據(jù)訓(xùn)練過程和測試數(shù)據(jù)分類過程。重點(diǎn)在于建立一個RBF神經(jīng)網(wǎng)絡(luò)模型對網(wǎng)絡(luò)流量進(jìn)行分類。
(1)數(shù)據(jù)獲取過程是通過數(shù)據(jù)獲取模塊提取網(wǎng)絡(luò)連接記錄和分析特征,以選擇合適的網(wǎng)絡(luò)特征屬性作為原始的輸入值。選擇一組最合適的特征子集作為RBF神經(jīng)網(wǎng)絡(luò)的原始輸入值。
(2)數(shù)據(jù)預(yù)處理過程是將特征子集映射到[-1,1]的范圍[4]。
(3)數(shù)據(jù)訓(xùn)練過程是將經(jīng)過預(yù)處理后的網(wǎng)絡(luò)流量特征子集作為RBF神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練集。
(4)根據(jù)RBF神經(jīng)網(wǎng)絡(luò)的輸出對網(wǎng)絡(luò)流量進(jìn)行分類。
3 試驗(yàn)與分析
本文選用流量文庫http://newsfeed.ntcu.net/中給出的兩組實(shí)際數(shù)據(jù)進(jìn)行實(shí)驗(yàn),兩組數(shù)據(jù)分別如表1、表2所示。
RBF網(wǎng)絡(luò)在數(shù)據(jù)一中采用248個輸入層節(jié)點(diǎn)、262個隱含層節(jié)點(diǎn)和11個輸出層節(jié)點(diǎn)的結(jié)構(gòu);在數(shù)據(jù)二中采用248個輸入節(jié)點(diǎn)、260個隱含層節(jié)點(diǎn)和8個輸出層節(jié)點(diǎn)的結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果如表3所示。
本文提出了一種基于RBF神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量識別方法。通過測試兩組開發(fā)的網(wǎng)絡(luò)流量數(shù)據(jù)集,證明該方法具有較高的準(zhǔn)確度、低復(fù)雜性和良好的自適應(yīng)性。
參考文獻(xiàn)
[1] Shi Zhongzhi.Neural Network[M].Beijing:Higher Education Press,2009.
[2] COVER T M.Geometrical and statistical properties of system of linear inequalities with applications in pattern recognition[J].IEEE Transactions on Electronic Computer,1965(14):326-334.
[3] Fei Sike Technology R&D Center.Matlab Application[M]. Beijing:Electronic Industry Press,2005.
[4] MOORE A W,ZUEV D.Discriminators for use in flow-based classification[A].Intel Research,Cambridge,2005.
[5] 王俊松.基于Elman神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量建模及預(yù)測[J].計(jì)算機(jī)工程,2009(9):190-191.