發布時間:2022-03-15所屬分類:電工職稱論文瀏覽:1次
摘 要: 摘 要:隨著局部放電檢測技術和大數據技術的推廣,變電站現場氣體絕緣組合電器(GIS)的局部放電檢測數據不僅數量龐大,而且數據來源復雜,因此傳統的局部放電模式識別方法已難以滿足需求。鑒于此,提出了一種基于深度卷積網絡的局部放電大數據模式識別方法,構建了應用
摘 要:隨著局部放電檢測技術和大數據技術的推廣,變電站現場氣體絕緣組合電器(GIS)的局部放電檢測數據不僅數量龐大,而且數據來源復雜,因此傳統的局部放電模式識別方法已難以滿足需求。鑒于此,提出了一種基于深度卷積網絡的局部放電大數據模式識別方法,構建了應用于局部放電模式識別的深層卷積網絡模型,同時應用深度自編碼器對模型參數進行初始化,利用多層卷積神經網絡提取局部放電大數據的深層特征以提高復雜數據源下的識別正確率。通過真型 GIS 模型實驗、變電站現場帶電檢測和典型干擾實驗獲取了大量局部放電檢測數據,組成復雜數據源的測試樣本,并對所提方法進行了實驗分析。實驗結果表明:與傳統的模式識別方法相比,新所提的方法在處理復雜數據源樣本任務中識別正確率更高,且識別正確率提高值隨樣本數據的增加而增大,更適合于大數據平臺的工程應用需求。
關鍵詞:GIS;大數據;模式識別;深度卷積網絡;局部放電
0 引言
氣體絕緣組合電器(GIS)在當前電力系統中已得到大量應用,其設備的絕緣狀態與電網安全息息相關[1]。局部放電是有效反映電力設備內部絕緣缺陷的主要特征之一,對 GIS 設備進行局部放電檢測可有效獲取設備的絕緣狀況,從而及時消除隱患,避免重大事故的發生[2-3]。因此當前 GIS 局部放電檢測技術得到了大力推廣,針對 GIS 的現場局部放電檢測數據也呈海量增長的趨勢。由于 GIS 設備現場運行環境復雜多樣,變電站現場的局部放電檢測數據中不可避免地包含各種類型的干擾信號,與實驗檢測信號存在較大差異[4-5]。另外,由于當前的局部放電檢測設備多種多樣,不同的檢測設備在現場檢測的局部放電數據也有所區別,因此,針對大數據情況下的局部放電模式識別,傳統的分析方法已經難以滿足需求。
當前國內外學者針對局部放電的模式識別做了大量研究,但研究的重點在局部放電信號的特征提取上。在模式識別方面,當前已有的研究主要應用了實驗室實驗數據,而較少的考慮到現場檢測數據的復雜性[6-9]。此外,文獻[10]探討了局部放電大數據的并行局部放電譜相位圖(PRPD)分析與模式識別,該文將云計算技術應用于解決海量局部放電信號的特征提取與類型識別問題,但該文的重點在于海量局部放電數據的并行化計算方法,并未針對現場大數據的復雜來源下局部放電模式識別方法進行研究。
由于深度學習(DL)在大數據特征提取、數據降維等方面表現出顯著優勢,目前已被廣泛應用于圖像處理、語音識別等領域[11-14]。深度學習網絡具有自主從海量數據中學習特征信息的特性,與傳統人工特征選擇方法相比,其更有利于提取數據內在信息。其中,由于深度卷積網絡(CNN)在圖像識別領域取得的優異表現,尤其在大圖像處理上的優勢,其在當前應用最為廣泛,是近年來深度學習領域的研究熱點[15-17]。GIS 局部放電檢測分析中常用的 PRPD 圖譜和脈沖序列相位圖譜(PRPS)的數據,本質上均為尺寸較大的二維矩陣,與數字圖像的數據格式具有一定的相似性。此外,由于現場條件的影響,該矩陣中的數據也會出現相位偏移、幅值大小不一等情況,而深度卷積網絡具有對于輸入樣本的平移、縮放、扭曲不變性。綜上所述,本文提出一種基于深度卷積網絡的局部放電大數據模式識別方法。以 CNN 為基礎模型,利用自編碼網絡對樣本數據進無監督預訓練,獲取卷積層初始參數。通過卷積、池化及反向傳播操作,達到識別參數最優化。通過提取多源局部放電大數據特征映射,有效提高復雜場景海量局部放電數據的模式識別準確率。
1 深度卷積網絡
1.1 CNN 的網絡結構
卷積神經網絡與全連接的神經網絡在網絡結構上存在著較大的不同。卷積神經網絡包含輸入層、卷積層、池化層、全連接層、輸出層[18]。深度卷積網絡一般由卷積層和池化層交替組成一個多層的深度結構,然后通過一個或多個全連接層,最后在輸出層通過一個分類器將結果輸出,如圖 1 所示。圖中,C1、C2 代表卷積層 1、2;S1、S2 代表池化層 1、2。
由圖 1 可見,卷積層由多個二維卷積核組成,每個卷積核均可視為參數可訓練學習的濾波器,輸入樣本數據通過卷積運算提取得到多個特征,一般稱為特征子圖。局部感受野方法使卷積層中的每一個特征子圖只與前一層的部分特征圖連接[19-20]。卷積階段利用權值共享減少了權值數量,降低了網絡模型的復雜度。同時池化階段利用圖像局部相關性原理對特征圖進行子抽樣,在保留有效信息的同時減少數據處理量。通過逐層卷積及池化,逐級提取隱藏在數據中的特征信息。
2 基于 CNN 的局部放電模式識別方法
在大數據的平臺下局部放電檢測數據有豐富的來源,包括設備的在線監測系統、帶電檢測巡檢、設備的離線測試、模擬實驗等,不同的檢測系統,其傳感器的性能、采集裝置性能和數據表示方法也有所區別。因此,大數據平臺下對局部放電進行模式識別,首先針對各種數據來源對數據進行歸一化處理。局部放電的 PRPS 圖譜表達了局部放電數據按照相位統計的局部放電脈沖幅值和脈沖個數的分布特征。該類型的數據可由一個二維矩陣表示,其矩陣的兩個維度分別代表相位和周期,矩陣的數值代表局部放電脈沖的幅值。不同來源的數據主要在相位分辨率和幅值分辨率上會有所區別。假設以 1° 為相位分辨率,則相位維度的尺寸為 360,以 5°為相位分辨率,則相位維度的尺寸為 72。將高相位精度的數據映射為低相位精度數據時,可以直接將高相位精度的數據按照較低的相位精度對相應的相位區間內數據求和。將低相位精度的數據映射為高相位精度的數據時,本文采用乘積最大的優化原則,將低相位精度的數值拆分插值于高相位精度對應的相位區間內。針對幅值,本文按照其動態范圍進行線性歸一化,對于無法獲取動態范圍的數據,按照樣本的最大值和最小值進行線性歸一化,如式(3)
本文采用改進型經典卷積神經網絡 LeNet-5 結構[21],包含 1 個輸入層、2 個卷積層,2 個對應的池化層、2 個全連接層和 1 個輸出分類層。輸入層本文采用 PRPS 格式數據,將數據的維度歸一化為 72×50,數據的幅值按式(3)進行歸一化。其中第 1 卷積層有 6 個 3×3 尺寸的卷積核,第 2 卷積層有 36 個 3×3 尺寸的卷積核,激活函數采用 Sigmoid 函數。池化層的參數分別為 2 和 11,采用最大池化操作。第 1 個全連接層的神經元個數為 36,第 2 個全連接層的神經元個數為 25。輸出選用適應于非線性多分類問題的 Softmax 分類器,用于識別 6 種模式。
為了提高深度卷積網絡的訓練效率和識別效果,本文首先利用自編碼器對樣本集數據進無監督預訓練,以獲取樣本集的初步特征,并利用訓練所提取的特征對上述的卷積神經網絡中的卷積層進行初始化。自編碼器是一種將輸入信號從目標表達中重構出來的神經網絡,利用自編碼網絡對樣本數據進行無監督訓練,其隱層學習得到的即為樣本數據的特征[22]。此項操作可在卷積神經網絡的訓練中應用更少的迭代次數來獲取更優的識別效果。基于深度卷積網絡的復雜數據源下局部放電模式識別框架如圖 2 所示。
具體實現步驟如下:
1)對訓練樣本集數據進行歸一化處理。
2)構建自編碼器模型,利用訓練樣本集數據,對自編碼器進行無監督訓練。
3)構建深度卷積網絡模型,并利用自編碼器所得的模型參數初始化卷積網絡的卷積層參數。
4)利用訓練樣本集數據對深度卷積網絡進行訓練。計算樣本數據的輸出,計算輸出與樣本標簽的誤差 σ,利用反向傳播(BP)算法和隨機梯度下降法對網絡參數進行迭代更新,得到識別模型最優化參數。
5)對待測試數據進行歸一化,輸入參數訓練好的深度卷積網絡模型,得到模式識別結果。
3 復雜數據源樣本集的獲取
本文通過局部放電模擬實驗、變電站現場局部放電檢測和典型局部放電干擾實驗 3 種方式,使用數字局部放電檢測儀、示波器、便攜式局部放電檢測儀等多種儀器獲取局部放電數據,組成復雜數據源的樣本集。實驗及變電站現場檢測中主要儀器的型號及其關鍵參數如表 1 所示。
3.1 局部放電模擬實驗
設計了 5 種典型的局部放電模型,并利用 GIS 真型實驗平臺進行實驗。實驗模型與實驗接線分別見圖 3 和圖 4。
模擬實驗中針對 5 種缺陷類型分別利用表 1 所示的儀器采集樣本數據,測得的典型 PRPS 數據經過歸一化后見圖 5。圖中,幅值為式(3)中的歸一化幅值 yR,周期共 50 個,每周期為 20 ms。
3.2 變電站現場檢測
通過對某省電力公司的 110~500 kV 多座變電站進行的局部放電帶電檢測工作,積累了大量的現場檢測數據,包含設備正常的檢測數據和經解體驗證的有缺陷設備檢測數據。圖 6 為一例典型懸浮放電缺陷案例的 PRPS 格式檢測數據。
3.3 典型干擾數據
為了獲取典型干擾信號的放電特征,本文通過實驗采集了典型手機干擾、電鉆干擾、對講機干擾、節能燈干擾、電機干擾、微波硫燈干擾等干擾信號,并在變電站現場采集了雷達干擾、電子圍欄干擾等干擾信號,圖 7 所示為部分典型干擾的 PRPS 格式檢測數據。
4 識別實驗結果與對比分析
識別實驗平臺配置為酷睿 i7 處理器 3.9 GHz,內存為 16 G,代碼采用 Matlab 實現。使用檢測數據中的 PRPS 格式數據進行實驗,識別目標為 6 類,分別為懸浮電極放電、電暈放電、自由金屬微粒放電、絕緣氣隙放電、沿面放電、干擾。按照不同訓練樣本集大小和不同迭代次數,分別考察了本文模型與基于統計特征的徑向基函數支持向量機 (SVM)、BP 神經網絡(BPNN)的識別效果對比。采用的統計特征參數由局部放電幅值與次數在整個工頻周期和工頻正負半周的偏斜度 Sk、陡峭度 Ku、不對稱度Q和互相關系數Cc等16個特征參數組成,詳細計算見文獻[3]。本文采用混淆矩陣考察各個算法的識別效果,混淆矩陣中黑色單元為每類識別正確樣本個數及其占總樣本的比例,白色單元為該類識別錯誤樣本個數及其占總樣本的比例,條紋狀單元包含總樣本的平均識別正確率和識別錯誤率,灰色單元為每類的召回率和精確度。
4.1 不同訓練樣本集大小
從樣本集中隨機挑選了 1 000 數據組成樣本總體,將其中 800 條數據進行訓練,200 條數據進行測試,迭代次數為 200 次,利用本文模型對訓練數據和測試數據進行模式識別,識別結果的混淆矩陣見圖 8。
由圖 8 可見,經過 200 次迭代后,該 CNN 模圖8 CNN在800訓練樣本下的訓練數據和測試數據的混淆矩陣 Fig.8 Confusion matrix of traindata and testdata from CNN with 800 train samples 型對于 800 條訓練數據達 100%的平均正確率,對于 200 條測試數據,該算法在 6 類上的識別平均正確率達到 89.7%,其中兩類絕緣類缺陷(氣隙放電和沿面放電)數據正確率較低。而其余懸浮電極放電、電暈放電、微粒放電和干擾均具有很好的效果。分析其原因,現場檢測的 GIS 絕緣類局部放電,一般發生在盆式絕緣子或母線支撐絕緣子上,部分案例中絕緣子已經產生裂紋,因此其放電數據中可能包含了沿面放電和絕緣內部放電兩種放電類型,與實驗中單一的放電類型有較大的不同,難以歸為具體的某一類放電類型,因此 CNN 模型對氣隙放電和沿面放電的識別結果有所降低。
對比使用 RBF 核函數的 SVM 和 BPNN 在本樣本集測試數據上的識別效果見圖 9。
在復雜數據來源的情況下,SVM 和 BPNN 方法的平均識別正確率分別為 79.3%和 72.4%。尤其在微粒放電類型的檢測上,識別率較低,另外氣隙放電的識別率也較低。由此可見,深度網絡可以提取出更優于一般統計特征的深層特征,因此可獲取更好的分類效果。
本文來源于:《高電壓技術》為國內外唯一集中、全面地反映當前高電壓技術領域科技信息的專業技術刊物,本刊報道內容包括高壓設備、輸電線路、系統暫態、測試工程、電磁、城網供電、電力電子等及生態環保生物醫療等邊緣、交叉學科。既有基礎理論研究也有工程實踐應用。本刊讀者對象為電力系統生產、建設、運行、管理部門及相關產業科研、設計、制造單位的領導、科技人員、大專院校師生及其他相關工程技術人員。
考察 3 種算法的計算時間。訓練階段,CNN 模型用時最長,為 15.63 min,SVM 方法和 BPNN 方法分別為 13.95 min 和 11.17 min。但對 200 條測試數據集的識別結果計算,CNN 模型用時最短,為 4.1 s,而 SVM 方法和 BPNN 方法總體用時分別為 13.6 s 和 11.8 s。分析其原因,由于傳統基于統計特征的識別方法首先需要進行對原始數據提取特征值的操作,而深度網絡模型前向計算過程本身即為特征提取過程。在工程應用中,模型的訓練計算一般較少進行,更多為對數據的識別計算,因此整體上看,CNN 模型在計算時間上對傳統基于統計特征的識別方法仍然具有優勢。下一步的研究中考慮應用圖形處理器(GPU)平臺和并行計算的方法進一步降低 CNN 模型的訓練和計算時間。
逐步減小訓練樣本集為 400、200、100,按照不同的訓練樣本集大小,考察 3 種算法的識別效果變化,可得到圖 10 所示的結果。
訓練樣本集大小為 400 時,CNN 的識別平均正確率為 86%,比 SVM 的識別平均正確率高 11.7%,比 BPNN 的識別平均正確率高 15.6%;當訓練樣本集減少到 200 時,CNN 的識別平均正確率已經比另外兩種方法識別結果的提高效果顯著降低;而當訓練樣本數量降低至 100 時,CNN 的識別平均正確率與傳統方法已區別不大,甚至有所降低。
4.2 不同訓練樣本數據來源
當只使用 200 條實驗室實驗數據進行訓練檢測時,本文模型與 SVM 和 BPNN 算法的識別效果對比如表 2 所示。
當向訓練樣本中再加入 200 條現場檢測數據,即訓練樣本中同時包含50%的實驗數據和50%的現場檢測數據時,3 種模型的識別效果如表 3 所示。
由表 3 可見,加入現場檢測數據后,深度卷積網絡的識別率下降了 8.9%,仍可達到 80%以上,而 SVM 和 BPNN 的識別率分別下降了 17%和 20.4%。分析其原因,CNN 模型識別正確率下降的主要原因是由于氣隙放電和沿面放電兩類絕緣類放電缺陷的識別正確率下降引起,如前所述,現場的部分絕緣類放電缺陷數據可能同時包含氣隙和沿面兩種放電類型,因此較難歸類;SVM 和 BPNN 模型除了氣隙放電和沿面放電的識別正確率下降,微粒放電的識別正確率下降嚴重,現場的微粒放電全部識別為干擾,導致總體平均識別正確率下降嚴重。因此,在樣本數據特征比較復雜的情況下,本文提出的模型較傳統方法具有更好的泛化性能。
5 結論
針對大數據平臺下復雜來源局部放電數據的模式識別問題,本文提出一種基于深度卷積網絡的局部放電模式識別方法,并通過實驗室典型缺陷模擬實驗,變電站現場帶電檢測和干擾實驗等獲取了復雜數據源的局部放電數據樣本,將本文提出的方法與傳統的識別方法進行了對比分析:
1)深度學習可以自主從數據中學習特征,通過深層網絡的構建,可以提取比傳統統計參數更豐富的信息。在訓練樣本集為 200 時,深度卷積網絡相比基于統計特征的 SVM 和 BPNN 算法的識別平均正確率開始有所提升,隨著樣本數據擴大豐富,識別正確率提高值進一步增大。
2)在單一數據源樣本集和混合數據源樣本集的對比實驗中,本文所提的方法相比傳統的識別方法識別正確率提高值在 10%以上,表現出更好的泛化能力,更加適用于大數據平臺的應用。
3)相比基于統計特征的 SVM 和 BPNN 算法,本文所提方法在模型訓練上用時較長,在識別結果計算上用時較短,計算時間整體上仍具有一定優勢,下一步研究考慮應用 GPU 平臺和并行計算方法進一步降低 CNN 方法的訓練和計算時間。——論文作者:宋 輝 1 ,代杰杰 2 ,張衛東 3 ,畢 凱 3 ,盛戈皞 1 ,江秀臣 1
參考文獻 References
[1] 王先培,肖 偉,胡明宇,等. 基于 SF6分解產物融合判斷的 GIS 絕緣裂化趨勢劃分[J]. 高電壓技術,2016,42(6):1834-1840. WANG Xianpei, XIAO Wei, HU Mingyu, et al. GIS insulation deterioration trend division based on SF6 decomposition products fusion judgment[J]. High Voltage Engineering, 2016, 42(6): 1834-1840.
[2] 李金忠,張喬根,李 原,等. 油紙絕緣局部放電脈沖參數統計分析與老化狀態診斷技術[J]. 高電壓技術,2015,41(11):3821-3829. LI Jinzhong, ZHANG Qiaogen, LI Yuan, et al. Statistical analysis of pulse parameters and diagnose of aging state based on partial discharge in paper-oil insulation[J]. High Voltage Engineering, 2015, 41(11): 3821-3829.
[3] 黃 亮,唐 炬,凌 超,等. 基于多特征信息融合技術的局部放電模式識別研究[J]. 高電壓技術,2015,41(3):947-955. HUANG Liang, TANG Ju, LING Chao, et al. Pattern recognition for partial discharge based on multi-feature fusion technology[J]. High Voltage Engineering, 2015, 41(3): 947-955.
[4] 侯慧娟,盛戈皞,姜文娟,等. 基于信號模型參數辨識的變電站局部放電電磁波信號重構[J]. 高電壓技術,2015,41(1):209-216. HOU Huijuan, SHENG Gehao, JIANG Wenjuan, et al. Signal reconstruction for partial discharge electromagnetic wave in substation based on signal model parameters identification[J]. High Voltage Engineering, 2015, 41(1): 209-216.
[5] 葉海峰,錢 勇,王紅斌,等. 開關柜表面暫態地電壓信號頻譜特征[J]. 高電壓技術,2015,41(11):3849-3857. YE Haifeng, QIAN Yong, WANG Hongbin, et al. Spectrum characteristics of transient earth voltages aroused by partial discharge in switchgear[J]. High Voltage Engineering, 2015, 41(11): 3849-3857.
[6] 張曉星,舒 娜,徐曉剛,等. 基于三維譜圖混沌特征的 GIS 局部放電識別[J]. 電工技術學報,2015,30(1):249-254. ZHANG Xiaoxing, SHU Na, XU Xiaogang, et al. GIS partial discharge recognition based on chaos features of the three-dimensional spectra[J]. Transactions of China Electrotechnical Society, 2015, 30(1): 249-254.
[7] 律方成,金 虎,王子建,等. 基于主成分分析和多分類相關向量機的 GIS 局部放電模式識別[J]. 電工技術學報,2015,30(6): 225-231. LÜ Fangcheng, JIN Hu, WANG Zijian, et al. GIS partial discharge pattern recognition based on principal component analysis and milticlass relevance vector machine[J]. Transactions of China Electrotechnical Society, 2015, 30(6): 225-231.
SCISSCIAHCI