摘 要: 設計并實現了一種基于title="DSP" target="_blank">DSP平臺的title="PDF417">PDF417條碼快速解碼終端。該終端能對攝像頭采集的含有PDF417條碼的圖像進行復雜背景下條碼區域提取、條碼畸變校正等條碼圖像預處理,實現了復雜背景和不均勻光照條件下條碼的全方位快速讀取。
關鍵詞: PDF417;解碼終端;圖像處理
PDF417條碼具有信息容量大、編碼范圍廣、檢錯糾錯能力強等特點,已在許多領域得到應用。然而,由于對條碼圖像要求較高,國內現有的PDF417技術商用化程度不高。實際使用中,PDF417條碼的識別率、解碼的正確率和解碼的實時性等方面都有很大的提升空間。
本文介紹的解碼終端采用專用條碼攝像頭采集條碼圖像,在基于TMS320C6713的DSP平臺上實現了PDF417條碼的準確、快速讀取。
1 PDF417條碼概述
PDF417是一種堆疊式二維條形碼。組成條碼的每一個符號字符代表編碼集中的一個碼字,并且均由4條4空共17個單位模塊構成。圖1給出了PDF417條碼結構圖[1]。條碼由多層一維條碼從上至下堆疊而成,每一層都可分為靜區、起始符、行指示符、信息碼字、結束符幾個部分。條碼每層具有相同的起始符與結束符,對應的條空序列分別為81111113和711311121。
條碼采用文本、字節和數字三種數據壓縮模式將原始數據轉換為0~928的碼字。三種壓縮模式分別對不用類型的數據具有較高的壓縮率,三者之間用模式轉換與模式鎖存進行靈活的轉換。
PDF417采用Reed-Solomon碼對條碼數據進行檢錯與糾錯,最高級別含有512個糾錯碼字,可復原條碼50%的碼字。
2 硬件平臺
系統的硬件架構如圖2所示。系統硬件主要包含圖像處理和圖像采集兩個模塊。
2.1 圖像處理模塊
系統的圖像處理模塊采用DSP外配SDRAM的方式實現圖像的快速處理。DSP芯片選取TI公司的高性能32位浮點處理芯片TMS320C6713B;SDRAM芯片為Micron公司的MT48LC32M8A2,其存儲空間為256 MB。C6713芯片的高速浮點處理能力保證了條空寬度確定的速度與準確性。系統工作過程中,SDRAM的作用為:緩存圖像數據;存放圖像運算的中間變量;作為系統的堆棧空間和常量及表的存放空間。
2.2 圖像采集模塊
視頻數據采集模塊由條碼采集攝像頭、FPGA和乒乓RAM 3個部分組成。攝像頭采用Microscan公司的條碼圖像采集專用激光攝像頭QUADRUS MINI Imager。由于TMS320C6713B芯片無video port接口,不能直接和攝像頭進行邏輯連接,因而采用ALTERA公司的EP1C6作為控制核心,將Camera采集的視頻信號流以幀為單位保存到高速SRAM中,并在合適的時機將SRAM總線切換給DSP以供運算處理。乒乓RAM以FPGA和DSP之間的通信接口RAM而存在,解決了DSP和攝像頭連接的問題。另外,該模塊還為攝像頭配備LED補光系統以改善采集圖像的質量。
3 軟件設計
解碼終端軟件的設計強調提升條碼識別率、解碼正確率和系統實時性3個指標,主要包含二值化、區域定位、精確定位、條碼分層等模塊。圖3為系統軟件架構。
3.1 不均勻光照條件下的圖像二值化
條碼圖像二值化要考慮不均勻光照的影響以及系統實時性解碼的要求。本文改進了Bernsen算法[3],成功地去除了不均勻光照的影響。該算法處理步驟如下:
(1)用大津法取得粗閾值為T。掃描整個f(x,y)灰度圖像,如果f(x,y)>T+a,則b(x,y)=255;如果f(x,y)<T+a,則b(x,y)=0。其中a為Bernsen算法的處理區間寬度,取值范圍15~30,b(x,y)為二值化后圖像。
(2)對發生光照不均勻最嚴重的區域,即落在區間T-a<f(x,y)<T+a的點進行處理,取w為閾值計算窗口,計算方法如下:
如果T3>a,則取T2為閾值;否則,取T4為閾值,對區間內的點進行二值化。
Bernsen算法只用T2作為閾值對區間內點進行二值化,忽略了全局閾值的作用,而改進的算法采用雙閾值對不均勻光照的區域進行二值化處理,減少了偽影現象。該算法是全局閾值算法和局部閾值算法的結合,同時兼顧了處理效果和時間復雜度。
3.2 條碼的區域定位
條碼的區域定位計算較為復雜,因此算法的選擇需要兼顧處理速度和處理效果。本文采用了基于連通域的區域定位算法[2],算法包括條碼方向提取、條碼區域連接和連通域標記3個步驟。圖4給出了區域定位算法框圖。
條碼方向的提取決定了膨脹運算所使用的結構體。由于對圖像直接進行膨脹運算很容易受噪聲的影響,算法首先將圖像區域分為水平、垂直、45°和135° 4種大致方向,而后提取條碼的方向并根據條碼不同的方向使用4種不同的膨脹結構體。這樣有效防止了與條碼接近的其他文字等背景由于使用各向同性的結構體進行膨脹運算而連接到條碼中。方向提取先得到圖像橫向和縱向的梯度信息,而后以適當的閾值對得到的梯度圖二值化并進行比較。認為含有較多邊界信息的圖指示的方向為條碼的走向。如果兩圖邊界的差值在一定范圍內,則用同樣的方法檢測45°和135°兩個方向。
膨脹算法將條碼連成一個緊密的連通區域,之后要進行連通域的標記以定位條碼區域。算法包含3個步驟:
(1)如果當前點A是前景點并且其前一點未被標記,則認為A是一個連通域的外輪廓點;跟蹤這個外輪廓,并將所有外輪廓點都標記為與A屬于相同的連通域。
(2)如果當前點A下方的點是背景點且A的前一點已被標記,則認為A是連通域內輪廓點;跟蹤這個內輪廓,并將所有內輪廓點都標記為與A屬于相同的連通域。
(3)如果前景點A的前一點已被標記且不屬于情況1和2,則將A標記為與其前一點屬于相同的連通域。
邊界的跟蹤是通過搜索像素點8臨域實現的,用順時針排布的1~7分別代表8臨域點,搜索方向更新公式為:
系統采用的連通域標記法舍棄了傳統的二次標記方式,而采用跟蹤連通域外輪廓的方法,只需要對圖像進行一次掃描,因此具有更快的速度。
3.3 條碼的精確定位
本文提出時間復雜度較低的邊緣跟蹤算法,精確定位了條碼的4個頂點,為條碼傾斜和幾何形變的校正提供條件。圖5給出了精確定位算法流程圖。
以搜索左上角頂點為例。系統用參考點數組記錄搜索到的條碼起始符或結束符的邊緣走向,步進點數組沿起始結束符黑色邊界方向逐點步進。若步進過程中某一時刻,步進點數組與參考點數組夾角超過45°,說明步進點數組已步進到條碼邊緣,則將步進點數組中心點位置確定為條碼的左上頂點。用類似的方法搜索,可得到條碼的其他3個頂點。
條碼的4個頂點確定以后,再經過旋轉變換、錯切變換和透視變換,將幾何形變的不規則四邊形條碼校正為矩形條碼。條碼的旋轉使終端的解碼不再局限于水平和垂直的條碼,實現了PDF417的全方位解碼。
3.4 條碼分層及碼字讀取
PDF417是堆疊式條形碼,需要確定條碼的層次以進行逐行碼字的讀取。確定條碼層次的步驟如下:
(1)用Sobel邊緣檢測算子作用于圖像,提取圖像邊界。
(2)將得到的分層界限進行水平投影,記錄投影點數目p(i)。
(3)隔行差分。按照dif(i)=p(i)-p(i-2)計算第i行的投影差分值。若當前行投影差分值大于零,而其下一行差分值小于零,則認為該行為分層界限。
(4)偽邊界去除。將投影高度小于投影峰值1/4的邊界去除,以消除由噪聲產生的偽邊界。
得到條碼的層邊界后,系統采用層內投影并判斷投影高度的方法來讀取每層條碼的條空信息。實踐證明該方法具有較高的正確率。
用條空的寬度除以單位模塊的寬度得到條碼的條空寬度序列,如:81111113….31111334….711311121。單位模塊寬度求解方法為:
其中,Wm為單位模塊寬度,Wl為層寬,n為一層條空總數。
最終譯碼采用查表的方式將條空序列轉換為碼字序列。碼字序列經過檢錯與糾錯后,按照3種壓縮模式編碼的反方向進行譯碼,最終得到PDF417條碼的原始數據。
4 實驗結果
對采集到的28 000幅、分辨率為320×480的圖像進行測試。測試結果表明,本終端對PDF417條碼的識別率可達99.76%,識別碼解碼正確率為100%,解碼速度達10次/s以上,具有國內領先的技術水平。
參考文獻
[1] ISO/IEC 15438.Information technology-Automatic identification and data capture techniques-PDF417 bar code symbology specification[S],2006.
[2] CHEN Yang,YANG Zhao Xuan,BAI Zhuo Fu.Simultaneous Real-time segmentation of diversified barcode symbols in complex background[A].First international conference on intelligent networks and intelligent systems[C].2008.
[3] 陳丹,張峰,賀貴明.一種改進的文本圖像二值化算法[J]. 計算機工程,2003,29(13):85-86.