0.引言
在智能小區的安防系統中,人臉識別技術的應用,提高了安防報警系統的安全可靠性。人臉識別技術因其具有非接觸性、特征提取方便、防偽性能高等優勢得到廣泛的應用。人臉識別技術綜合了計算機、通信、光學、電子、機械等多學科技術,在控制領域和智能建筑領域有著廣闊的應用前景 。本文研究了基于聚類算法判別人臉圖像的方法,達到應用于智能小區門禁系統和樓宇門禁系統的實際應用要求,如圖1所示。
圖1 智能門禁報警系統的結構圖
基于圖像分塊進行人臉識別時,隨著分塊數目的增多,子圖像保留的奇異值個數、維數的控制,以及子圖像權重的賦值等問題,若只依靠主觀經驗來決定,則缺乏客觀依據。徑向基函數(RBF-Radial Basis FunctiON)網絡是一種性能良好的前饋型三層神經網絡,具有全局逼近性質和最佳逼近性能,訓練方法快速易行,RBF 函數還具有局部響應的生物合理性。在隱含層中心確定的情況下,RBF網絡只需對隱含層至輸出層的單層權值學習修正,比多層感知器具有更快的收斂速度。利用 YALE人臉數據庫,通過RBF網絡對奇異值個數、子圖像數目、特征值數量、聚類因數 、聚類個數、 因數的測試結果,為人臉圖像的識別提供客觀地指導。
利用相關參數的仿真實驗結果,為進一步研究子圖像賦值情況,提高人臉識別的速度和精確度提供了有效的幫助和參數支持。
1.聚類算法的初始化
RBF神經網絡可描述為:
式中,w(k,i)為隱含層第i個節點與輸出層第k個輸出節點的連接權值。
隱含層聚類的初始化過程如下。
(1)在每個類別收斂于一個聚類中心的假設前提下,將隱含層的節點數初始設定為輸出層的節點數,即u=s,再根據RBF神經網絡的訓練情況具體調整。
(2)隱含層第k個神經元的中心Ck為 k 類特征矢量的均值。
(3)計算從均值Ck到屬于類別k的最遠點kfarP的歐氏距離。
(4)計算各個j聚類中心到k聚類中心的距離。再根據dmin(k,l)和dk,dl的關系,對以下幾種情況進行判斷。
情況(a):若滿足的條件,則表明類別k與其他類別l無重疊。
情況(b):若滿足的條件,則表明類別k與其他類別l有重疊,需要進一步考慮以下情況 。
(i)當滿足的條件時,則表明兩個類別雖有重疊,但是互相不包含。
(ii)當滿足的條件時,則表明類別k包含于其他類別之中,可能導致RBF神經網絡分類錯誤。
(5)按照以下分離原則對每類樣本進行判別并細分。
(i)包含規則:若滿足,則表明類別k包含于類別l之中,類別l應被進一步細分為兩個聚類。
(ii)正確歸類規則:若類別k包含許多其他類別l的數據,則需要將類別k進一步細分為兩個聚類。
重復上述步驟,直至選定的全部人臉圖像的訓練樣本都被處理為止,整個RBF神經網絡的結構隨之確定。
2.RBF神經網絡的參數調整
定義誤差函數為:
其中,lky和lkt表示在輸出層ky節點上對應第l個訓練樣本的實際輸出值和理想輸出值。通過線性最小二乘法求解最佳連接權值*W。
RBF神經網絡的訓練收斂性能,如圖2的實例所示。圖2為RBF神經網絡誤差輸出曲線圖,圖中的橫軸表示RBF神經網絡訓練的迭代次數,縱軸表示RBF神經網絡實際誤差的輸出值,即訓練迭代一次新網絡的輸出值與原先網絡按誤差函數公式(2)計算得到的結果。實驗條件為在Yale數據庫中,選取15個類別的人臉圖像,每個類別選取11張人臉圖像作為訓練樣本,提取每個人臉圖像的特征值數量為90,對應于網絡的訓練集為一個165×90的矩陣時,得到RBF神經網絡訓練的誤差函數輸出情況。在具體實驗中,設定RBF神經網絡停止參數訓練調整的條件為:當前一次系統輸出誤差值與當前系統輸出誤差值的變化量相差小于0.01時,RBF神經網絡停止參數訓練調整。圖2表明,RBF 神經網絡的誤差輸出值下降得很快,在迭代過程不到15次的情況下,誤差曲線就進入系統誤差值輸出相差較小的范圍內,收斂速度較快。
圖2 RBF網絡誤差輸出曲線圖
3.聚類算法的仿真實驗
參數設定值的不同,將對基于聚類算法的人臉圖像識別的結果產生影響,例如對子圖像劃分的個數、子圖像奇異值向量保留的個數、聚類因數α、γ因數的選取等。對不同參數初始化時設定不同的數值,將得到的實驗結果進行對比和綜合分析,進而確定包括輸入層、輸出層、隱含層節點數目及其核函數的選取等在內的合理的RBF神經網絡結構,確定包括貝葉斯分類器的權值分配、閾值選取等在內的合適融合策略,以便進行深入的研究。
實驗中,訓練樣本為Yale人臉庫中的每人前6張照片,共90張,測試樣本為每人的后5張照片,共75張。樣本完整訓練誤差容限為1,訓練最大次數為120。
(1)在γ因數取為0.8、子圖像的數目為32塊、保留子圖像的奇異值個數為10的條件下,測試不同聚類因數α取值、不同聚類個數(即RBF神經網絡隱含節點個數)情況下的識別率。如圖3中data1所示。
圖3 不同參數下的識別結果
實驗結果表明,隨著聚類因數α的增大,聚類個數也在增多,當α>3.0以后,識別率趨于穩定。而且,在RBF神經網絡中隱含層節點數增多的情況下,會加大RBF神經網絡的計算負擔。因此,最終選擇聚類因數α=3.5,來進一步研究子圖像權重的賦值。
(2)在聚類因數α取為3.5、子圖像的數目為32塊、保留子圖像的奇異值個數為10的條件下,測試不同γ因數情況下的識別率,如圖3中data2所示(data2與data3重合)。實驗結果表明,在γ因數逐漸增大的情況下,識別率隨之逐漸提高并趨于穩定。因此,最終選擇γ=0.8,來進一步研究子圖像權重的賦值。
(3)在聚類因數α取為3.5、γ因數取為0.8、子圖像的數目為32塊的條件下,測試每個子圖像保留不同奇異值個數時識別率的情況,如圖3中data3所示。實驗結果表明,在子圖像的奇異值個數增加的情況下,識別率的有所增加并趨于穩定。最終選擇保留子圖像的奇異值個數為10,來進一步研究子圖像權重的賦值。
(4)在聚類因數α取為3.5、γ因數取為0.8的條件下,測試保留不同奇異值特征個數時識別率的情況。如圖3中data4所示,其中,每個子圖像保留奇異值的個數×子圖像數目=每幅圖像的奇異值特征個數。
實驗結果表明,人臉圖像劃分的子圖像數目較多的情況下,識別率較高,而且當子圖像的數目達到32塊時,識別率已經趨于穩定狀態。人臉圖像劃分的子圖像數目不宜過多,這樣會使每幅人臉圖像的奇異值特征個數過大,進而增加RBF神經網絡的計算負擔。最終選擇子圖像的數目為32塊的情況,來進一步研究子圖像權重的賦值。
4.仿真實驗結果分析
基于上述仿真實驗數據進行參數設定,在人臉識別仿真系統中測試情況如圖4所示。
圖4 人臉識別仿真系統
根據實驗結果確定聚類因數 α=3.5、γ=0.8、保留子圖像的奇異值個數為10。人臉圖像的子圖像數目對應于RBF神經網絡輸入空間的維數r,樣本庫中的人臉圖像類別數對應于輸出空間的維數s,每類人臉圖像樣本的子圖像的特征空間數目對應隱含層節點數u,根據上述實驗結果調整u不超過120。對人臉圖像進行分塊,在樣本數量很大、維數很高的情況下,有效地減少了計算量。但是,子圖像數目不宜過多,否則增加神經網絡計算負擔,識別率也會有所下降。
5.結語
本文研究了基于聚類算法的人臉識別方法。根據人臉圖像劃分子圖像的數目和所選定的訓練或測試人臉圖像的類別數的情況,確定RBF神經網絡的輸入層、輸出層的節點數;根據RBF神經網絡的訓練識別效果,通過調整中間隱含層節點數、核函數及其中心點和寬度,通過基于聚類算法的人臉識別仿真實驗,具體量化了中間隱含層節點數與子圖像的對應關系、每幅子圖像中奇異值向量的保留個數、聚類因數的選取等各項參數,為進一步根據各個子圖像權值的合理分配,提高人臉識別的識別精度和良好的識別速度提供了有效的參數支持。