文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.191066
中文引用格式: 程起澤,陳澤華,張雲欽,等. 基于CNN-LSTM的太陽能光伏組件故障診斷研究[J].電子技術應用,2020,46(4):66-70.
英文引用格式: Cheng Qize,Chen Zehua,Zhang Yunqin,et al. Research on fault diagnosis of solar photovoltaic module based on CNN-LSTM[J]. Application of Electronic Technique,2020,46(4):66-70.
0 引言
光伏電站建設在人跡罕至的野外,準確定位問題支路位置與故障類型對進一步提高光伏發電系統的運行效率及降低發電成本具有重要意義[1]。
近年來,國內外學者對光伏組件發電系統采用建模的方法,對組件運行時采集到的圖像采用圖像分析的方法,針對某種特定故障進行診斷。當前針對光伏組件故障診斷主要分為圖像方法、物理方法、數學方法以及智能方法幾大類別。前者主要有紅外圖像診斷法[2-4]、多傳感器法[5-7]、參數估算法[8-10]、時域反射分析法[11]等,后者有基于神經網絡的診斷方法[12-13]。
對于能源公司下的多個大型光伏電站,其建設時期不同,采購的設備規格種類存在很大差異,數據精準度不夠,數學方法很難適用于大型電站。同時因為電站經常建設在環境條件惡劣的野外,這對于獲得光伏組件紅外圖像造成困難。近些年來,集成了最大功率跟蹤(Maximum Power Point Tracking,MPPT)[14]的組串式光伏逆變器使用廣泛,但由于經濟因素,大型和超大型電站使用的還是集中式光伏逆變器,不能監控到組件的運行情況,這對數據采集造成很大困難。基于成本考慮,公司很難再為投入使用的光伏電站更新多種傳感器設備。
針對數據采集設備有限的大型光伏電站,本文提出了一種基于CNN-LSTM的深度學習診斷模型,僅需要使用電站采集到的海量歷史支路電流數據及其故障維修記錄來訓練模型,在電站運行時使用訓練好的模型就可以診斷出故障支路,在電站原有設備基礎上完成診斷。
1 故障定義與數據處理
1.1 光伏陣列布局
本文以山西某光伏電站為研究對象,該電站光伏陣列由60個區組成,每個區包含兩個逆變器,每個逆變器下有7個匯流箱,每個匯流箱下包括15條支路,每條支路由21塊電池板串聯構成。數據采集設備可精確采集到每一支路的電流數據。通常,故障會發生在電池板上、電池板背后的接線盒中、數據傳輸線路以及電站的數據采集系統中。圖1為該電站光伏陣列布局示意圖。
1.2 光伏組件故障定義
光伏發電受天氣因素影響極大,數據波動極大。現有數據采集設備雖可以采集到電壓、輻照強度、區域溫度、濕度等多種數據,但一個采集設備收集的是多個區域的數據,覆蓋面太廣,無法精確定位到實際發生故障的支路。
傳統的光伏組件故障診斷通常是從組件故障類型出發,針對一種或某幾種故障,去尋找數據的變化與這些故障的關聯規則,如果關聯規則不明顯,往往需要增添額外的數據采集設備。傳統方法可以檢測到的故障類型有限,且需要在原有數據采集設備的基礎上增添額外的設備來收集數據。本文與之相反,是從采集到的歷史數據及其數據表現入手,依據在這些數據上曾經發生過的故障進行分析,從而實現對運行中的組件進行診斷。
根據現場實際發生過的光伏組件故障及故障產生時采集到的電流數據,本文將組件故障定義為5類:
(1)突發性故障:其故障發生原因為光伏組件板面燒穿或者板后接線盒部位熔斷而導致的組件突然停止運行,需要立即處理此故障以避免發生危險。該故障電流數據表現為在運行過程中電流值突降到零后不再變化。
(2)通信故障:其發生的原因為信道傳輸線路存在問題,需要對通信設備進行檢修維護。該故障電流數據多表現為無規律變化,或者存在明顯脫離一般常識的電流值。
(3)更換組件:表示正常運行中的支路當天進行過修理或者人工的斷電檢測,該支路組件會根據其逐塊小塊光伏模塊人工檢測的結果決定是否更換其中的問題模塊。電流數據的表現為在同一匯流箱下某條異常支路的電流曲線從零值恢復到正常發電。
(4)持平故障:其故障原因為電池板未啟動或其通信傳輸的設備未啟動,可根據監控系統排查。持平故障的數據表現一般分為兩種,一種表現為電流值持平在零值,另一種表現為持平在任意電流值。
(5)老化故障:故障產生原因為設備老化造成的發電效率下降,可根據實際老化情況及電站電池板儲量決定是否更換。其數據表現為電流值隨著天數的增加呈現持續降低趨勢,嚴重時同一匯流箱下故障支路運行時電流值比同匯流箱下其他支路電流低0.5 A及以上,但仍在發電。其中,第1和2類故障為組件運行時需要優先處理的故障,如圖2所示;第3、4和5類為次重要故障,可根據電站調度暫緩處理,如圖3所示。
1.3 數據處理
為解決實際采集到的數據類型少的問題,并且充分利用真實的電流歷史數據,本文根據電站光伏陣列布局的特點,設計針對該陣列的特征提取算法,以獲取支路運行時正常組件與異常組件之間的差異。
1.3.1 數據降采樣
原始支路電流數據按天(24 h)獲取,采樣頻率為1 s。將每天以秒為單位的支路電流數據降采樣為以分為單位,采樣區間為[8:00,18:00],即一天600個采樣點。將單個匯流箱下的15條支路作為一個分組處理單元。
1.3.2 特征提取
在每一個處理單元上定義特征提取組、橫向特征與縱向特征,之后對每一采樣點數據進行橫向特征與縱向特征的提取,并結合歷史臺賬信息制作標簽數據集。
定義1 特征提取組:定義15條支路相同時刻采樣點的電流值為特征提取組,每天600個采樣點作為時間步長,用向量(600,15)表示。每天每個匯流箱下可獲得600個間隔為1 min的特征提取組。
定義2 橫向特征:計算每一特征提取組的電流平均值mean、最大值max、方差var、最小值min與標準差std作為橫向特征,用向量(600,5)表示。
橫向特征用以表示某一時刻,該匯流箱下支路電流的統計特性。在提取橫向特征時,需清洗掉大幅度偏離正常值的電流值,補以0值代替。
定義3 縱向特征:使用一階差分定義電流曲線縱向特征,即電流每一時間步后一采樣點與前一采樣點的差值,其計算公式如下:
其中,Δt=1 s。縱向特征表示支路電流一天內隨時間與太陽輻照變化的變化率,用向量(600×15,1)表示。
1.3.3 標準數據集
將每一個處理單元每條支路電流的每個采樣點的橫向、縱向特征與該支路這一采樣點的降采樣電流值組合起來,得到這一時間步下輸入模型的電流數據。將每天每個處理單元每條支路電流的橫向、縱向特征與該支路電流經過維度變換,共同組成支路電流標準數據集。用向量(600×15,7)表示。所有歷史數據將以相同格式進入標準數據集,它們將作為CNN-LSTM的訓練集。圖4為具體的數據準備過程。
2 CNN-LSTM模型
2.1 CNN模型
LECUN Y L[15]于1989年提出的卷積神經網絡(CNN)是一種包含卷積操作與神經網絡結構的深層前饋型神經網絡。近幾年隨著CNN及其擴展模型在圖像領域的成功應用,CNN在深度學習中的地位越來越重要。
通常的CNN模型包含3個主要部分:卷積層、池化層、全連接層。每一個卷積層中會有多個卷積核,其計算公式如下:
2.2 LSTM模型
長短期記憶模型(LSTM)[16]是一種帶有記憶功能的神經網絡,是循環神經網絡(Recurrent Neural Network,RNN)的一種變種,通過門遞歸單元來控制信息的流動與操作,LSTM對時序型數據的處理具有極為優秀的表現,現被廣泛應用于機器翻譯[17]、自然語言處理[18]等領域。
LSTM模型通過特殊的三門結構,解決了傳統RNN中的梯度消失問題,使LSTM模型可以更好地對更長、更復雜的時間序列數據進行訓練與學習。
2.3 構建CNN-LSTM檢測模型
傳統的LSTM模型處理時序數據效果良好,但是其結構的復雜性致使模型訓練開銷非常大。待學習數據設置的時間步長越大,進行學習訓練需要花費的時間越多。
針對電流數據縱向特征復雜、橫向特征稀疏的問題,本文在傳統的LSTM模型前先使用CNN對數據集進行處理,以提取低維的深層次特征。用CNN將橫向電流特征進一步提取升維,將縱向時間維度上的特征進行提取降維,再使用LSTM模型進行訓練時就可以達到降低整個模型訓練時間開銷的同時提升整個模型的精確度與準確度的效果,并且通過不同網絡的組合使模型變為深度網絡,增強了模型的非線性,避免了訓練過程中過擬合現象的發生。
具體的模型構建如下:根據歷史數據及故障類型構建標簽數據集。訓練數據集為三維數據集(N,600,7),其中N表示檢測的支路。訓練數據集首先進入一個兩層的卷積模型進一步提取特征和降低數據維度,得到向量(N,150,64),向量(N,150,64)再進入一個三層的長短期記憶模型進行訓練,訓練學習后的數據(N,64)再進入一個全連接層后得到待診斷支路標簽(N,1)。訓練完成后使用測試數據集對模型進行驗證,根據結果反饋對模型進行調整。表1為模型中每層的具體參數。
3 實驗驗證
現有光伏組件故障診斷實驗驗證方式多為搭建仿真平臺及搭建小型發電板測試,然而在實際生產過程中,影響電池板發電的因素有環境溫度、海拔高度、太陽能輻照強度、電池板放置角度影響的散射光和直射光照到電池板上量的多少、電池板的背板溫度、風向、空氣的純凈程度、云層高低、電池板型號造成的轉換效率差異等。單純的仿真實驗無法完全真實表現出電池板現場實際的運行狀態。
3.1 實驗數據來源
本文使用的數據集來自山西某光伏電站的實時生產數據,數據中包含了上述復雜因素。針對本文提出的診斷方法,使用山西某光伏電站2018年1月~10月3個區的數據進行訓練和測試。以2個區的數據做訓練,1個區的數據用作測試集。訓練集共計28個區數據,420條支路,10個月(304天),總計127 680條數據;測試數據共計14個區,210條支路,304天,總計63 840條數據。
3.2 實驗環境
實驗環境為Ubuntu 16.04.2,采用3塊NVIDIA的 K40顯卡,TensorFlow-GPU 1.4.1,訓練迭代次數均為5 000次,模型參數調優使用多層網格搜索,保證實驗使用的損失函數相同。為進行對比實驗,本文分別使用深度學習方法BP模型、CNN模型、Autoencoder模型、Encoder-LSTM、LSTM模型、Bi-LSTM模型、CNN-LSTM模型進行對比實驗,實驗采用相同的實驗環境及迭代次數。其中,BP、CNN為傳統網絡,LSTM為時序性網絡,Autoencoder為解決傳統LSTM訓練緩慢的自編碼網絡模型。
3.3 實驗結果及分析
從表2結果分析,CNN-LSTM模型結果最令人滿意,并且其訓練效率大大優于其他模型。相比于傳統BP、Autoencoder、CNN這些直接利用電流數值特征進行學習而忽略電流時序特性的網絡,CNN-LSTM的網絡結構充分利用了光伏發電與輻照強度呈正相關的時序性特點,將電流隨時間變化而變化的特性引入模型中進行學習訓練;與LSTM、Bi-LSTM、Encoder-LSTM這些只考慮電流時序性的網絡結構相比,CNN-LSTM的網絡結構充分利用了CNN模型的升降維功能,解決了數據特征類型少的問題;與Autoencoder網絡相比,CNN-LSTM的網絡結構在對縱向特征進行降維的同時最大程度地保留了電流的時序特性,解決了LSTM模型訓練時間過長的問題,綜合優化了模型的特征選擇與訓練時間,最終達到了良好的效果。
訓練結束時,模型損失函數值降到0.032 1,正確率達到93%,損失函數為均方對數損失Msle,激活函數為ReLU,優化器為Adam。使用測試數據集進行測試后,準確率達到92%。同時根據能源公司要求,對公司隨機提供的兩周兩個匯流箱下電流數據進行測試,準確率達到95%。模型效果達到預期,且效果大大優于其他模型所能達到的效果。
4 結論
本文提出了一種基于CNN-LSTM的光伏組件診斷方法:
(1)從光伏組件運行時采集到的現場支路電流數據及其歷史故障記錄出發,并結合實際生產中對不同故障類型處理的緊急程度作為對光伏組件故障進行分類的依據,提出了一種新的故障分類方法。
(2)提出了一種根據不同光伏陣列的布局而設計的特征提取算法,用以表示理想發電狀態,來解決實際生產中可獲取到的數據種類單一的問題。
(3)在進入LSTM模型訓練前,使用CNN網絡對數據進行處理。利用CNN網絡的升降維功能進一步解決了實際獲取到的數據種類少的問題,并且在最大程度保留電流時序特性的基礎上,對縱向特征進行降維,減少了模型訓練時間,解決了大訓練集使用LSTM模型訓練緩慢的問題。
本方法2019年在電站現場進行測試,運行速度快且診斷效果良好,在得到模型后在實際使用中省去花費大量時間的訓練過程,可以在實際電站故障診斷中較好地投入使用,不需要額外再在電站中增添設備,可直接接入生產監控系統,診斷速度快,符合大型電站的日常使用需要。
參考文獻
[1] 胡義華,陳昊,徐瑞東.基于電壓掃描的光伏陣列故障診斷策略[J].中國電機工程學報,2010(S1):185-191.
[2] 王培珍,鄭詩程.基于紅外圖像的太陽能光伏陣列故障分析[J].太陽能學報,2010,31(2):197-201.
[3] LI W C,TSAI D M.Automatic saw-mark detection in multicrystalline solar wafer images[J].Solar Energy Materials & Solar Cells,2011,95(8):2206-2220.
[4] Li Chunlai,Zong Xianshuang,GUDAKE.A survey of online fault diagnosis for PV module based on BP neural network[C].2016 International Conference on Smart City and Systems Engineering(ICSCSE).IEEE,2016: 2094-2100.
[5] Tang Jianeng,Zhu Yongqiang,Wang Wenshan.Fault diagnosis method and simulation analysis for photovoltaic array[C].International Conference on Electrical & Control Engineering.IEEE,2011:1569-1573.
[6] 王歡,徐小力.一種新型光伏陣列在線故障檢測方法研究[J].儀器儀表學報,2015,36(12):2765-2772.
[7] 王元章,李智華,吳春華.一種四參數的光伏組件在線故障診斷方法[J].中國電機工程學報,2014,34(13):2078-2087.
[8] 張程熠,唐雅潔,李永杰,等.適用于小樣本的神經網絡光伏預測方法[J].電力自動化設備,2017,37(1):101-106,111.
[9] HU Y,GAO B,SONG X,et al.Photovoltaic fault detection using a parameter based model[J].Solar Energy,2013,96:96-102.
[10] 楊宏超,程若發,呂彩艷,等.光伏組件內部參數辨識與輸出特性研究[J].電子技術應用,2018,44(1):125-128.
[11] 王元章,吳春華,周笛青,等.基于BP神經網絡的光伏陣列在線故障診斷[J].電網技術,2013,37(8):2094-2100.
[12] AKRAM M N,LOTFIFARD S.Modeling and health monitoring of DC side of photovoltaic array[J].IEEE Transactions on Sustainable Energy,2015,6(4):1-9.
[13] 焦李成,楊淑媛,劉芳,等.神經網絡七十年:回顧與展望[J].計算機學報,2016,39(8):1697-1716.
[14] 傅敏,嵇保健,黃勝明.低輸入紋波光伏微型逆變器的研究[J].電子技術應用,2017,43(5):143-146.
[15] LECUN Y L,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.
[16] HOCHREITER S , SCHMIDHUBER J.Long short-term memory[J].Neural Computation, 1997,9(8):1735-1780.
[17] GHOSH S,VINYALS O,STROPE B,et al.Contextual LSTM(CLSTM) models for large scale NLP tasks[J].arXiv:1602.06291v2[cs.CL],2016.
[18] Wu Haoyin,Chen Jin,Fan Kai.Research on speech feature extraction and recognition model based on SVM[J].Journal of Wuhan University of Technology,2014(2):316-319.
作者信息:
程起澤1,陳澤華1,張雲欽1,蔣文杰2,劉曉峰1,沈 亮2
(1.太原理工大學 大數據學院,山西 太原 030001;2.晉能清潔能源有限公司,山西 太原 030001)