俞一云,何良華
(同濟大學 電子與信息工程學院,上海 201804)
摘要:提出了利用卷積神經網絡(CNN)對兒童注意缺陷與多動癥(ADHD)的功能性核磁共振圖像(fMRI)進行特征分析,從而對ADHD患者進行判別分析。針對ADHD-200全球競賽的三個數據庫的fMRI數據,首先利用快速傅里葉變換將數據從時域轉換到頻域,并利用Fisher線性判別方法選擇有效的頻率信息,然后利用改進的卷積神經網絡對選擇頻域數據進行特征學習,自動提取出有效的特征并進行分類。實驗結果表明,提出的方法有助于ADHD患者的判別,為基于fMRI數據的ADHD研究提供了新的手段。
關鍵詞:卷積神經網絡;兒童注意缺陷與多動癥;線性判別;分類
中圖分類號:TP18文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.04.016
引用格式:俞一云,何良華.基于卷積神經網絡的ADHD的判別分析[J].微型機與應用,2017,36(4):53-55,58.
0引言
兒童注意缺陷與多動癥(ADHD)是一種兒童時期十分常見的神經性發育性障礙疾病,通常表現為注意力不集中、多動等[1]。目前,國內外ADHD患者越來越多,很大程度上影響了患者的學習與生活,因此ADHD的研究受到了家長、老師以及社會的廣泛關注。傳統的ADHD的診斷依靠于專業醫生對臨床數據(腦電圖和注意變量檢測等)、患者行為、心理測試等復雜信息的長時間分析。近年來,由于功能性核磁共振成像技術(fMRI)的不斷發展,憑借其非侵入性、無輻射等特征被用于腦認知的研究。目前,盡管受到可用的數據來源限制,大量學者仍然投身ADHD的fMRI數據的分析[24],并且基于不同的fMRI數據的特征參數已經被提取用于ADHD的分類,如功能連接、低頻振幅等特征。
2011年,美國1000 Functional Connectomes Project 項目組共享了豐富的數據庫,并組織了全球ADHD的分類大賽,期望通過比賽來發現診斷ADHD患者的方法和檢測ADHD的生物因子。比賽的優勝者利用fMRI數據和個人特征信息取得了61.3%準確率[5],表明了利用機器學習和神經影像學相結合的方法對ADHD進行研究具有廣泛的應用前景。此后,基于fMRI數據的ADHD判別研究變得更加積極、活躍,并且產生了一系列算法。
卷積神經網絡作為一種非常重要的深度學習方法,能夠從低級特征中學習到可區分性、更加抽象、有意義的高級特征,具有局部感受域、權值共享、下采樣等特點,使得該學習網絡對圖像的平移、旋轉、傾斜、縮放等具有高度不變性。另外,該網絡結構將特征提取和分類過程結合到一個全局優化過程中,憑借其有效提取特征和分類的優勢在圖像識別與分類領域取得了廣泛應用,如物體識別[6]、人類行為認知[7]、語音識別[8]和車輛檢測[9]等。
本文所有的研究數據均來自ADHD200國際比賽數據庫,利用卷積神經網絡實現對ADHD的fMRI的特征學習與提取,并對ADHD進行判別分析,為實際臨床診斷提供有價值意義的參考。所有實驗結果表明,基于深度學習的ADHD核磁共振成像數據判別分析思路可行,結果有效,為基于fMRI的ADHD研究提供了新的方向。
1實驗數據及預處理
ADHD的fMRI數據是腦活動的3D圖像的時間序列,大小為49×58×47×T,其中49×58×47是腦體素的空間維度,T代表一個腦體素的時間維度,具有高維度、高冗余、大數據的特點。考慮到對fMRI數據的時域信息比較難提取出有用的信息,而且頻率特征比時間特征更易于觀察,因此本文采用快速傅里葉變換將時域信息轉換到頻域信息,利用頻率特征在一定程度上能夠反映腦部信號的振動的特點,使得提取的振動信息更能體現腦部活動。
圖1卷積神經網絡的結構圖經過快速傅里葉變換的數據仍然保持4D結構,直接對其進行分析計算復雜度太高,為此,提出了利用Fisher線性判別分析方法來對數據進行特征選擇,達到降維降冗余的特點。其中,Fisher線性判別分析方法是一種有效的模式識別方法,它的目標是最大化兩類之間的差異R,使得類間的散布矩陣SE最大,同時保證類內的散布矩陣SW最小,其類間比類內的計算方式為:
基于此原理,對每個腦體素的所有頻率信息進行類間比類內計算并進行排序,選擇R值相對大的n個頻率,并重構成n個頻率的49×58×47×1的信息,作為卷積神經網絡的輸入,在本文中n=5。
2改進的卷積神經網絡
卷積神經網絡是具有多層隱藏層的神經網絡結構,這種深度學習網絡具有更好的學習特征的能力,能夠從初級特征中學習出高級特征,從而更利于可視化或分類,因此本文利用ADHD的fMRI頻率表達特征作為原始輸入,構建了基于卷積神經網絡的深度學習網絡來對fMRI數據進行分析學習,從而實現對ADHD的判別。
2.1卷積神經網絡的結構
由于fMRI數據的三維立體空間,采用傳統的2D卷積神經網絡會丟失特征信息,因此本文采用3D卷積神經網絡。另外,不同腦體素之間的相互作用也是腦活動的重要信息,因此需要對整個3D的腦體素活動進行分析,而不是單獨對一個腦體素或一個腦區進行分析,通過連續卷積和下采樣操作,提取有效的特征,并對提取出來的特征進行分類。
本文提出的卷積神經網絡從傳統的2D卷積神經網絡發展而來,增加了網絡模型維度和深度,共由8層構成,分別是1層輸入層、3層卷積層、3層下采樣層和1層輸出層的結構,如圖1所示。
對于給定的大小為49×58×47的fMRI數據,分別取大小為4×7×4、4×5×3、5×6×5的卷積矩陣和大小為2×2×2的下采樣矩陣迭代進行卷積和下采樣操作,在S6層(下采樣層)得到8個大小為3×3×3的特征圖,并重構成一維特征向量,與最后的輸出層進行全連接操作,得到預測值。
其中,在卷積層,利用局部域連接和權值共享的優勢,減少了學習模型的訓練參數,降低計算復雜度。
令Xj為第i個特征圖,Wji是卷積層中第i個特征圖與前面輸入層第j個特征圖間連接的卷積矩陣,J是前面層的輸入特征圖的數量。因此,卷積層的第i個特征圖Ci可表示為:
Ci=sigmoid(∑Jj=1(Wji·Xj)+bi)通過對卷積的結果加偏置b,并進行sigmoid激活函數計算,得到卷積層的特征圖,并作為后面的下采樣層的特征輸入。
在下采樣層,對前一層(卷積層)的每一個特征圖進行均值下采樣操作(下采樣的大小是222),得到與前面卷積層相同數量的特征圖,并且減低了特征向量維度和分辨率。這種卷積和下采樣相結合的方式使得學習模型實現對位移、縮放、形變的高度不變性。
在輸出層,對下采樣層S6的輸出進行重構,生成一維向量(F)作為輸出層的輸入,并利用sigmoid激活函數和權值W、偏置B,計算出預測值h。
h=sigmoid(W*F+B)
2.2卷積神經網絡的算法
本文的卷積神經網絡算法主要由多次迭代的前向傳播和反向傳播學習的兩個階段構成。前向傳播是從輸入層到輸出層的逐層特征學習,經過迭代地卷積和下采樣操作,并在輸出層通過激活函數sigmoid函數,得出分類結果。反向傳播是從輸出層到第一個卷積層的BP算法實現,通過計算損失函數Fcost和殘值以及利用梯度下降方法來更新參數,從而對卷積神經網絡的整個學習參數進行調節。
考慮到是針對ADHD患者和正常人兩類進行分類,本文從學習更高的可區分性差異特征出發,利用Fisher線性判別分析方法的思想,提高ADHD患者和正常人之間的類間與類內的比值,從而提高ADHD的識別率。通過在輸出層的傳統的損失函數Fcost計算中引入Fisher線性判別分析方法的類間比類內的比值能量函數,而從優化特征的學習。令樣本數量為n,樣本的實際標簽為y,預測值為h,傳統的損失值Icost計算如下:
其中,α為學習率,SW、SB為預測值的類內距離值和類間距離值,hpos、hneg分別為真實標簽為positive和negative的樣本預測值,Mean函數為樣本均值的函數。
本文提出的損失函數實現了誤差最小化,也使得同類樣本間的特征差異更小,不同類間的特征差異更大,因此當卷積神經網絡的反向傳播采用損失函數Fnew時,并針對此損失函數進行每層的殘值計算和梯度下降學習,從而使模型學習的不同類別的特征間的差異更大,促進樣本預測值逐漸往樣本的真實標簽偏向。
3實驗結果及分析
本文研究的fMRI數據全部來自于ADHD-200全球競賽中的三個數據庫:NYU數據庫、OHSU數據庫、NeuroImage數據庫,分別來自于紐約大學、俄勒岡健康與科學大學和Donders研究所。數據分別如表1所示。表1數據庫分布情況樣本分類NYUNeuroImageOHSU訓練集正常人982343ADHD1182536測試集正常人121428ADHD29116
本文將ADHD一類稱為正類(positive),正常人一類稱為負類(negative),并利用提出的卷積神經網絡對三個公開數據庫進行測試實驗,與ADHD200全球比賽的優勝隊的成績從準確率(Accuracy)、敏感度(Sensitivity)、特異度(Specificity)和J_statistic四個指標來進行對比分析(如表2所示),可以發現本文提出的方法在準確率上有很大的提升。
4結論
本文利用傅里葉變換和Fisher線性判別分析方法對fMRI數據進行預處理,并利用改進的卷積神經網絡進行數據分析與特征提取,從而實現對ADHD的分析與判別。該方法與ADHD200的優勝隊相比,在大多數ADHD200國際數據庫的準確率上獲得了很大的提高。在以后的研究中,將嘗試對本文提出的卷積神經網絡繼續改進,以期望得到更好的識別效果。
參考文獻
[1] JOHNSTONE S. Computer gaming and ADHD: potential positive influences on behavior[Opinion][J]. IEEE Technology and Society Magazine, 2013, 32(1): 20-22.
[2] Wang Xunheng, Jiao Yun, Lu Zuhong. Discriminative analysis of restingstate brain functional connectivity patterns of attentiondeficit hyperactivity disorder using kernel principal component analysis[C]. 2011 Eighth International Conference on Fuzzy Systems and Knowledge Discovery(FSKD), IEEE, 2011: 1938-1941.
[3] WOLF R C, PLICHTA M M, SAMBATARO F, et al. Regional brain activation changes and abnormal functional connectivity of the ventrolateral prefrontal cortex during working memory processing in adults with attentiondeficit/hyperactivity disorder[J]. Human Brain Mapping, 2009, 30(7): 2252-2266.
[4] Zang Yufeng, He Yong, Zhu Chaozhe, et al. Altered baseline brain activity in children with ADHD revealed by restingstate functional MRI[J]. Brain and Development, 2007, 29(2): 8391.
[5] MILHAM M P, FAIR D, MENNES M, et al. The ADHD200 consortium: a model to advance the translational potential of neuroimaging in clinical neuroscience[J]. Frontiers in Systems Neuroscience, 2012(6): 62.
[6] Liang Ming, Hu Xiaolin. Recurrent convolutional neural network for object recognition[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015: 3367-3375.
[7] Ji Shuiwang, Xu Wei, Yang Ming, et al. 3D convolutional neural networks for human action recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(1): 221-231.
[8] ABDELHAMID O, MOHAMED A R, Jiang Hui, et al. Convolutional neural networks for speech recognition[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2014, 22(10): 1533-1545.