文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200363
中文引用格式: 劉欣,李衛龍,張燦明. 基于邊窗濾波和擴張卷積的礦井行人檢測[J].電子技術應用,2020,46(10):42-46,50.
英文引用格式: Liu Xin,Li Weilong,Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique,2020,46(10):42-46,50.
0 引言
數字化礦山是實現智能化、現代化煤炭生產的重要基礎,對于煤炭產業的可持續發展有著極為重要的意義。采礦自動化、運輸智能化、管理信息化是實現數字化礦山的三項關鍵技術[1]。實現這些技術的前提是構建智能感知系統,而礦井行人檢測系統是實現井下智能調度、安全監測等技術的先決條件[2]。
近些年來,深度學習技術在多個計算機視覺領域迅猛發展[3],并在多個任務上獲得了優異的性能,例如人臉檢測[4]、物體分揀[5]、缺陷檢測[6]。具體到行人檢測任務上,R-CNN[7]率先將深度學習技術應用在目標檢測任務。在此基礎上,Faster R-CNN[8]改進候選框選擇機制,完備端對端檢測框架。2019年,來自Google Brain的TAN M等研究人員[9]提出了基于自動網絡尋優技術的EfficientNet,該模型通過動態調整網絡的深度、寬度和分辨率,尋找最優的模型設計,在圖像分類、目標檢測等多個領域獲得先進表現。
圖像在構建和傳輸過程中,常因為外界干擾而導致質量退化。常見的解決方案是采用濾波方法對圖像做去噪處理[10]。濾波算法可分成兩類:線性濾波和非線性濾波。常見的線性濾波包括盒子濾波、高斯濾波;非線性濾波包括中值濾波、雙邊濾波等。在深度學習算法中,濾波算法常用于圖像預處理、特征提取、邊緣獲取等。尤其是對于邊緣檢測,濾波算法基于研究人員對于圖像的先驗知識,充分地提取圖像的邊緣信息,實現對興趣區域的精準定位分割[11]。傳統濾波算法受限于濾波核結構和運算機理,雖然可以抑制噪聲,但同時會造成邊緣信息丟失,對檢測模型產生負面影響。近些年來,大量的保邊濾波算法被提出,用于保留的更多的邊緣信息,例如全變分濾波算法[12]、加權最小二乘濾波[13]和導向濾波[14]等。
對于礦井環境,構建行人檢測模型需要考慮多個特定的環境因素,包括監控設備所處環境光線不足、粉塵點多,且捕獲圖像存在較多干擾信號等硬件設備上的不利因素,又要考慮對多目標、不同尺度的行人目標實現準確檢測的要求。針對這些難點,本文從視頻圖像的處理和檢測模型的改進兩個角度出發,采用邊窗濾波抑制視頻圖像的干擾信號,在模型網絡中引入擴張卷積處理多尺度目標。實驗證明模型在礦井數據集上取得了優異的檢測性能。本文的主要貢獻如下:針對礦井環境存在的多樣不利因素,采用邊窗濾波抑制視頻圖像的干擾信號,為行人檢測模型提供優質的輸入圖像;采用先進的EfficientNet作為網絡主干,用于提取輸入圖像的特征,并在網絡主干中引入擴張卷積,增大特征的感受野,促使網絡在多尺度目標上獲得更為優異的檢測性能。
本文詳細內容請下載:http://m.viuna.cn/resource/share/2000003018
作者信息:
劉 欣,李衛龍,張燦明
(安徽省煤炭科學研究院,安徽 合肥230001)