??? 摘?要: 在線簽名鑒定是身份認證" title="身份認證">身份認證技術中的一種有效方法。本文簡要回顧了基于在線手寫簽名的身份認證技術" title="認證技術">認證技術的研究背景及發展歷程;重點對近年簽名鑒定技術的研究進展進行綜述并對各種方法予以評價;總結了現存的研究困難并分析了應用前景和發展方向。
??? 關鍵詞: 簽名鑒定? 動態時間規整? 隱馬爾可夫模型? 神經網絡? 小波變換
?
??? 信息技術的飛速發展在給人們日常生活帶來極大便利的同時,也使網絡安全問題受到前所未有的挑戰。因此,實時準確的個人身份認證十分重要。傳統的身份認證基于密碼、IC卡等方式,有其固有不足:密碼可能被竊取、遺忘,IC卡可能遺失、被盜等;而基于人體生物特征" title="生物特征">生物特征的身份認證方式由于可以從根本上解決上述缺點而得到越來越多的應用?;谏锾卣鞯纳矸菡J證技術是指利用人體所固有的生理或行為特征之間的差異,通過計算機來鑒定身份的技術。常用的生理特征有指紋、虹膜、臉像等;常用的行為特征有簽名、步態等。與傳統鑒定方式相比,生物識別具有防偽性良好、易攜帶、不易遺失或遺忘等優點。
??? 簽名作為人的一種行為特征,與其它生物特征相比,具有非侵犯性、易為人所接受等特點。隨之產生的簽名鑒定(也稱簽名驗證)技術在模式識別、信息處理領域都屬前沿課題。簽名鑒定分為離線簽名鑒定和在線簽名鑒定兩種。前者是通過掃描儀、攝像機等輸入設備,將原始的手寫簽名輸入到計算機里,然后進行分析與鑒定;后者是通過手寫板實時采集書寫人的簽名信息,除了可以采集簽名位置等靜態信息,還可以記錄書寫時的速度、運筆壓力、握筆傾斜度等動態信息。顯然,較離線簽名鑒定而言,在線簽名鑒定可利用的信息量更多,不易偽造,同時難度也更大。
1 在線手寫簽名驗證系統
1.1 算法流程
??? 典型的在線手寫簽名驗證系統包括四個主要的技術環節,其算法流程如圖1所示。首先是簽名信息的數據獲取,就是經輸入設備采集實時的手寫簽名信息后輸入計算機。然后是預處理,過程包括去噪、歸一化等操作,目的是將采集到的數據變成適宜于進行特征提取" title="特征提取">特征提取的形式。下一步特征提取,從預處理后的數據中提取出能充分反映各人書寫風格,同時又相對穩定的特征。最后是特征匹配和判決,即采用某種判別規則,將提取的特征信息與標準簽名樣本進行匹配,得出鑒別結果。該過程是一對一的匹配過程,即驗證輸入簽名人的身份是否屬實。
?
1.2? 系統結構
??? 出于網絡安全與高效率的考慮,在線簽名鑒定系統的設計一般采用C/S結構來實現基于網絡的異地鑒定,信息采集端應與驗證端分離,信息存儲和傳輸必須是在加密機制基礎上實現,系統結構如圖2所示。當需要認證時,用戶在配備手寫板的網絡終端簽名,客戶端獲得有效信息并作預處理與特征提取操作后,將所得信息序列經通訊模塊加密后通過互聯網傳輸給服務器,進而完成相應的解密、在數據庫中的ID檢索及匹配判決,并將鑒定結果返回給客戶端。這種信息采集模塊與驗證模塊分離成C/S的特性及在開放的網絡環境下傳輸簽名特征信息的方式,極大增強了整個認證系統架構的安全性與靈活性。
?
2? 特征提取與匹配方法
??? 在線簽名驗證系統的性能如何,主要取決于特征提取方法和分類器設計的好壞,而這一切都由算法的優劣所決定。早期研究較多的方法有基于結構特征的方法和基于相關匹配的方法等。目前,鑒別方法主要有兩個研究方向:一個是特征函數法,就是包含所有簽名采樣點的時間序列被看成重要的特征信息,因而被測簽名將和模板簽名進行相應時間序列間的匹配比較,具體應用的方法包括動態時間規整算法、簽名分段算法、點-點匹配方法等等;另一個是特征參數法,是采用一系列的特征值構成特征向量,這些特征值一般人為選取以試圖表征簽名的特性,它們由原始數據通過某種運算得到,并帶有一定的簽名特征信息,具體應用的方法包括隱馬爾可夫模型、基于神經網絡的方法和小波變換" title="小波變換">小波變換方法等。
2.1 動態時間規整(DTW)
??? 動態時間規整是一種非線性優化方法,具有概念簡單、算法魯棒的優點,早期廣泛應用于語音識別中。對于DTW而言,既使測試序列模式與參考序列模式的時間尺度不能完全一致,只要時間次序約束存在,它仍能較好地完成測試序列和參考序列之間的模式匹配。由于任何人簽名都有一定的波動性,所以沒有辦法對簽名數據一對一地進行匹配,由此用到該動態規劃方法。
??? 如圖3所示,假設有兩特征信號人R={r(i)|1≤i≤m}和T={t(j)|1≤j≤n},R為模板特征信號的總幀數,m為參考幀的時序標號,T為用來測試的特征信號的總幀數,n為測試幀的時序標號。而R、T間的時間變化關系可由時間規整函數F={f(k)|≤k≤kf}來表示,其中f(k)=(r(k),t(k)),代表在作k次特征匹配時,T中第t(k)幀與A中第r(k)幀比較。設d(f(k))表示將模板中的第j幀與測試序列的第幀進行匹配的局部匹配距離。
?
??? D(R,T)作為模板A與測試信號B的匹配路徑,其算式如下:
???
??? 其中u(k)為匹配點f(k)匹配距離的加權系數。
??? 此算法的關鍵就是求解該函數,具體實現可用動態規劃的方法。設(r(k),t(k)) (即f(k))為規整路徑上的一點,則下一點可取為(r(k+1),t(k)) r(k),t(k+1)) r(k+1),t(k+1)),這將由點r(k),t(k)到這三點的距離確定,取距離最小者為下一點。利用此方法,可從起始點遞歸求出規整路徑,同時也可求出D(R,T)。
??? 文獻[5]提出一種非線性局部尋優時間彎曲校正方法,不僅實現了對信息序列不同局部的非等強度校正,而且很好地保持了序列的單調性和連續性,試驗的正確率為96%。
2.2? 簽名筆劃分段和點-點匹配方法
??? 該方法先對簽名進行分段,然后從簽名筆劃中提取新的特征,接著每一對相應筆段中的點經由點-點的映射算法得到最后的匹配映射結果,具體實現方法可參考文獻[6]。文獻[7]基于對簽名圖像結構復雜性均衡分解的思想,提出了一種基于骨架的簽名分段算法。該方法首先對簽名進行骨架提取,然后依據結構復雜度均衡的原則,對骨架進行分段,最后把所得的骨架分段復原成原始簽名中的分段。具體算法為:
??? (1)從整個簽名圖像的骨架中提取出并記下所有的交叉點和端點;
??? (2)從上到下,從左到右搜索第1個端點;
??? (3)從該端點開始沿骨架進行步進,按方向碼(用來描述圖像的邊沿骨架等圖像特征)計算前進中的復雜度。若復雜度達到1個給定的閾值后,即把剛走過的全部點作為一個分段,抹去剛走過的除交叉點之外的點,直到抹去骨架中所有的點。經實驗,該算法既達到了把簽名的整體復雜度均衡局部化的目的,又基本上保持了真實簽名分段在數量上和結構上的穩定性,降低了各種由于外部因素引起的類內特性之間的差別,突出了類間特性的表現。
2.3 隱馬爾可夫模型(HMM)
??? HMM作為信號的一種統計模型,目前廣泛應用于模式識別、圖像處理的各個領域。HMM是一個由兩種機理構成的隨機過程:一個機理是內在的有限狀態Markov鏈,體現為用具有有限狀態數的Markov鏈來模擬簽名信號統計特征變化的隱含的隨機過程,另一個是一系列隨機函數所組成的集合,體現為與Markov鏈的每一個狀態相關聯的觀測序列的隨機過程。設有觀察序列Q=Q1Q2…QN和狀態集S={s1,s2,…,sN},一個有n個狀態的隱馬爾可夫模型λ可以表示(π,A,B),其中π為初始狀態概率矢量;A={aij}為狀態轉移概率矩陣,其中aij=P{qt+1=sj|qt=st},1≤i,j≤N;B={bj(Qt)}為觀察符號概率分布,若B有M個觀察值{v1,v2…,vM},則bj(Qt)=P{Qt=vk|qt=sj},1≤j≤N,1≤k≤M。
??? HMM的使用涉及到訓練和分類兩個階段,訓練階段包括指定一個HMM的隱藏狀態數,并且優化相應的狀態轉換和輸出概率以便于產生的輸出符號與在特定的運動類別之內所觀察到的圖像特征相匹配。匹配階段涉及到一個特定的HMM可能產生相應于所觀察圖像特征的測試符號序列的概率計算。利用HMM進行簽名驗證同樣由兩個階段組成,即利用訓練樣本估計HMM模型參數和利用HMM評價測試簽名。這兩個過程目前都有成熟的算法,HMM參數的估計可用Baum-Welch參數估計算法或Segmental K-means算法;對測試樣本的評價,可以用Forward-Backward迭代算法估計簽名滿足模型的概率,或用Viterbi最優狀態搜索算法計算簽名過程經過的最優狀態。因此,利用HMM模型的關鍵在于HMM類型的選擇和一些參數的選擇以及閾值的估計[8]。
2.4 基于小波變換的方法
??? 小波變換是國際上公認的最新頻率分析工具,由于其“自適應性”和“數學顯微鏡性質”而成為許多學科共同關注的焦點,在信號處理中起著至關重要的作用。目前小波技術在簽名驗證的特征提取上用得較多。文獻[9]則采用以高斯函數的二階導數作為小波基的小波變換技術來進行拐點提取,然后以該方法為基礎,進行不同簽名之間拐點序列的匹配;最后再利用提取的拐點來對簽名進行分段和段-段對應處理。文獻[10]采用離散小波變換來分解簽名的參數特征,特征提取用到自適應算法,匹配則選擇動態規劃方法,初步試驗取得較好的效果。
?? ?另外,在當前的計算機視覺和模式識別中取得成功應用的Gabor變換也和小波變換一樣,具有頻率和方向選擇性,在近年的簽名驗證研究中引起眾多學者的重視。但Gabor變換和小波變換都有著運算量太大的缺點。
2.5 基于神經網絡的方法
??? 神經網絡是一個非常實用的分類工具,具有適應性,能夠實現非線性的分類問題,近十年來有很多學者將此方法用于簽名驗證中。該方法的優勢在于避免了復雜的特征提取工作,可以通過自學習獲得其他方法難以實現的關于簽名鑒定的規律和規則的隱形表達。因為簽名的特征信息數量巨大而簽名的訓練樣本數很少,所以神經網絡的節點數不能太大,否則網絡將不能訓練。
??? 文獻[11]從簽名識判的不確定性出發,提出了將Bayes網絡與前饋神經網絡相結合的概率神經網絡模型。它的第一層是輸入層,其傳遞函數是線性的;第二層是隱層,該層單元的狀態函數是概率密度;第三層是累加層,如果輸出結果表示分類,那么,該層便是將屬于某類的概率累計,從而得到輸入樣本屬于該類的最大可能性。該網絡具有訓練時間短和能產生Bayes后驗概率的輸出的特點。
2.6? 其他方法
??? 其他方法還有很多,每種方法各有其優缺點,如AR模型、紋理分析、決策樹等。例如紋理分析方法多用于僅擁有靜態信息的離線簽名驗證中,但筆者認為,倘若能將書寫速度、運筆壓力等動態信息轉化為圖像中的靜態表示,也就是對動態信息作靜態化映射表示,那么也可用于在線簽名鑒定。經試驗,可將運筆壓力的等級設為256級,對應為圖像像素的灰度變化256級,其后進行圖像紋理分析。此方法的實際應用有待深入研究。文獻[12]將物理學中的數據場思想引入簽名鑒別中,把簽名所形成的四個時序序列(壓力、壓力變化率、速度和加速度)點作為場中的數據點來看待,形成四類數據場,再從場中提取特征,很有新意。
??? 目前,國內有很多企業參與了簽名鑒定技術的研發,但大多數是引進國外簽名驗證模塊進行系統集成,只有少數企業擁有自己的算法,并且產品價格高,性能不穩定。相比之下,國外的簽名鑒定技術從數據采集系統到處理、識別算法都比較成熟。許多公司都有專門的機構從事該項技術的研發與應用,包括IBM、Cyber-SIGN、美國智通、日本富士通等,其中美國智通公司在此領域的研究獨樹一幟。
??? 鑒于目前的研究狀況,筆者認為采用單一方法的生物身份鑒別技術因其局限性終將遭淘汰,未來的發展方向將是多種方法用于簽名特征進行數據融合,以及基于多生物特征信息融合的身份認證,目前已有研究表明利用簽名和指紋結合、簽名和語音結合等方法進行身份認證能顯著地提高鑒別的準確性。另外,結合生物特征與數字簽名、數字水印的網絡商務系統也將紛紛出臺。如何進一步改進識別算法,降低系統的誤判率,同時縮短識別時間,建立人類書寫動力學模型等,這些都是身份認證技術應該追求的目標。
參考文獻
1 張敏貴,潘泉,張洪才. 多生物特征識別[J].信息與控制,?2002,31(6):524~528
2 Richard O. Duda, Peter E. Hart, Duda G. Stork . Pattern? Classification[M] . John Wiley&Sons,Inc.,2001
3 Rejean Plamondon .On-line signature verification:how many?countries are in the race[J]. IEEE,1989
4 Ronny Martens,Luc Claesen.On-line signature verification by?dynamic time warping[J] .IEEE,1996
5 邱德紅.基于全程信息和時間彎曲校正的簽名認證[J].?華中科技大學學報,2002,30(2):108-110
6? 張 葵,金先級,裴先登.基于函數參量的手寫簽名比較方法[J].小型微型計算機系統,1999,20(6):414~417
7? 伍小明,陳懿新.基于骨架的一種簽名分段算法[J] .中山大學學報, 2000,39(1):13~17
8 沈 峰,楊 飛,袁余良.動態手寫簽名驗證技術概述[J] .計算機科學,2003,30(3):92~95
9 蔡洪濱.一種基于小波變換提取拐點的手寫簽名認證方法[J].中國圖象圖形學報,2003,8(3):262~265
10? Nakanishi, N.Nishiguchi, Y.Itoh.On-Line signature verification method utilizing feature extraction based on DWT[J],IEEE,2003
11 金 涌,柳 健.手寫簽名的概率神經網絡識判模型[J].華中理工大學學報,1999,27(5):11~13
12 陳罡,李德毅.數據場思想及其在聯機簽名鑒別中的應用[J].計算機工程與應用,2003,4:123~134