摘 要: 從數學上分析了弧矩在數字圖像縮放時的變化規律,得出通過組合矩的方法無法改善其縮放不變性的結論,并指出了改善其縮放不變性的兩種方法。仿真結果證明了本文所提出的結論的正確性和方法的可行性。
關鍵詞: Hu矩;數字圖像;縮放不變性;分辨率
基于Hu矩在模擬圖像中具有圖像平移、旋轉、縮放不變性的特點[1],其作為識別的特征量已廣泛應用于模式識別以及跟蹤等許多模擬圖像分析領域[2]。但Hu矩在數字圖像中并不具有縮放不變性,不適合應用于數字圖像分析[3], 因此,通過改造Hu矩使其能同時應用于數/模圖像領域的分析,成為許多研究人員的共同目標[3-6]。
目前,大部分對Hu矩的改造主要集中在組合矩方面[3-6],但實際上組合矩的數學理論基礎存在一定的問題,因為其所使用的x′=kx和y′=ky兩個公式在數字圖像縮放時并不成立,因此,使用這兩個公式推導出的組合矩并不能有效地改善數字圖像中Hu矩的縮放不變性。從數學角度推導出Hu矩在數字圖像縮放時的變化規律是找到改善其縮放不變性的基礎,這也是本文研究的重點。通過對其變化規律的研究,本文得出了兩種改善其縮放不變性的方法。實驗證實了這兩種方法的可行性,同時顯示了Hu矩在識別系統中的應用效果優于Zemike[7]和krawtchouk[8]矩。
1 Hu矩簡介
設連續情況下二維圖像函數為f(x,y),則它的p+q階幾何矩和中心矩分別定義為:
假設a=1,由圖1(a)、(c)可以看出,在n/k為整數、m=0或m/k為整數時,ε的值隨著n、m的增加而減少。由圖1(a)、(b)、(d)可知,若n/k、m/k為非整數,則ε變化比較不規律,ε值取決于n/k、m/k的取整策略以及n、m、k的大小,同時由圖1(b)、(d)可知,如果同時按比例增大m、n值,可減少ε值。因為正常情況下,m、n、k為任意取值,ε的變化很難找到規律。因此,在不增大n的前提下,通過矩不變量的組合(組合矩)來減少ε值的方式不具可行性。因為組合矩只是通過Hu矩的組合來構造新的不變量,而Hu矩在數字圖像縮放時的變化規律不一致。因此減少ε值的方法只有兩種:一是在滿足一定分辨率的前提下使圖像縮放時圖像邊緣像素點的坐標值與縮放系數的乘積為整數;二是使圖像的分辨率足夠高。
3 仿真分析
對Hu矩在數字圖像縮放時的變化規律進行分析,在提出了使Hu矩對數字圖像縮放具有不變性的相關方法后,利用Matlab軟件對本文方法的可行性進行了仿真驗證。圖2為用于Hu矩縮放不變性特性分析的四幅圖像。圖3的曲線反映了圖2(a)、(b)、(c)、(d)四幅圖像在不同縮放系數下,Hn(k)值的變化規律:鉆石實線反映了在條件1(較低像素下,但n/k、m/k為整數)時Hn(k)的值變化規律,圖像原始分辨率為400×400,圓虛線反映了在條件2(n/k為非整數時,圖像分辨率較低)時Hn(k)值的變化規律,圖像原始分辨率為400×400,方塊點虛線反映了在條件3(n/k為非整數但圖像具有較高的分辨率)時Hn(k)值的變化規律,圖像原始分辨率為1 200×1 200。Hn(k)=0.4n+(Mn(k)-Mn(k=1))/Mn(k=1),其中,k是縮放系數,Mn是Hu矩不變量。仿真結果顯示,鉆石實線的波動最小,因此條件1下Hu矩具有最好的不變性。但是現實的縮放很難達到條件1的要求,方塊虛線顯示提高分辨率可以很好地改善Hu矩的縮放不變性。同時本文也具體對圖像的分辨率與識別率的關系進行了分析,圖4顯示了字母G的識別率與分辨率的關系,識別分別基于Hu矩、Z矩、K矩不變量,不變量之間的歐氏距離作為識別時的分類依據[9]。圖4顯示分辨率越高,識別率越高,而且Hu矩具有最好的識別效果。
本文提出了兩種使Hu矩在數字圖像縮放時具有不變性的方法,仿真結果證明了本方法的可行性。同時仿真也顯示在較高像素條件下,Hu矩具有比Z、K矩更優的應用效果,因此,Hu矩非常適合應用于具有高圖像分辨率的數字圖像識別系統。
參考文獻
[1] HU M K. Visual pattern recognition by moment invariants[J].IRE Transactions on Information Theory, 1962, 8(2): 179-187.
[2] MERCIMEK M, GULEZ K, MUMCU T V. Real object recognition using moment invariants[J]. Sadhana-Academy Proceedings in Engineering Sciences, 2005, 30(6): 765-775.
[3] LIU J, LIU Y C, YAN C X. Feature extraction technique based on the perceptive invariability[C]. Fifth International Conference on Fuzzy Systems and Knowledge Discovery, 2008: 551-554.
[4] 徐學強,汪渤,賀鵬.統一Hu矩及在電視圖像目標識別中的應用[J].計算機工程與應用,2006,42(29):213-215.
[5] 杜亞娟,潘泉,張洪才.一種新的不變矩特征在圖像識別中的應用[J].系統工程與電子技術,1999,21(10):71-74.
[6] 邵澤明,朱劍英.RSTC不變矩圖像特征點匹配新方法[J].華南理工大學學報(自然科學版),2008,36(8):37-40.
[7] SHUTLER J D, NIXON M S. Zernike velocity moments for description and recognition of moving shapes[J]. Image and Vision Computer, 2001, 24(4): 343-356.
[8] ZHANG L, XIAO W W, JI Z. Local affine transform invariant image watermarking by Krawtchouk moment invariants[J]. IET Information Security, 2007, 1(3): 95-107.
[9] POTOCNIK B. Assessment of region-based noment invariants for object recognition[C]. 48th International Symposium ELMAR-2006 on Multimedia Signal Processing and Communications, 2006: 27-32.