風電遇上數(shù)據(jù)科學家 | 一種異常檢測的方法
風電機組運行工況復雜多變,機組狀態(tài)監(jiān)測數(shù)據(jù)量大、來源多且雜,現(xiàn)有的異常檢測方法面對如此海量的數(shù)據(jù)很難保證預測的精度并進行快速處理。
天澤智云資深數(shù)據(jù)科學家謝鵬從全新視角出發(fā),以溫度數(shù)據(jù)進行故障預測為例,呈現(xiàn)新的建模方法。
數(shù)據(jù)科學家
21世紀“最性感職業(yè)”之一
他們懂數(shù)據(jù)、懂算法、懂軟件
懂行業(yè)專業(yè)知識、懂市場應用、懂決策分析
具備過人的溝通協(xié)調(diào)能力
也具備超高的設計能力
……
他們練就十八般武藝
解決各種可見不可見的問題
一、數(shù)據(jù)科學處理問題的思路
我們處理問題的一般思路是,首先根據(jù)問題的需求提出假設/理論,發(fā)現(xiàn)并構建出特征,之后基于假設和特征構建模型將其轉(zhuǎn)化為數(shù)學問題,最后通過測試、優(yōu)化模型,實現(xiàn)算法來進行工程上的部署。
其中,特征是指可以抽象化問題的一些表征,特征有來自于表征的,比如基于機理的、基于統(tǒng)計的以及基于圖形的等。
有的故障、失效的機理并沒有研究清楚,這種情況下我們需要通過實驗研究建立統(tǒng)計模型,比如隊列(Cohort)/案例對照(Case-control)研究、生存分析等。
二、聚焦到風電領域如何應用
聚焦到傳統(tǒng)風電數(shù)據(jù)分析領域,經(jīng)常從其變量間的關系,尤其是以功率曲線為基礎的圖形入手進行分析。風機的控制為工程師設定的具有固定邏輯的算法,具有特定的規(guī)律性,所以很多機組中的異常都會在功率曲線中有所體現(xiàn)。
除風功率曲線外,轉(zhuǎn)速、槳葉角、對風角、葉尖速比等都是我們經(jīng)常用來觀察的變量。
實際工作中,我們研究的故障在這些變量間兩兩關系并不能觀察到異常。
對于沒有任何表征的模型,我們有以下兩個思路:識別特定故障發(fā)生前模式及識別特定故障發(fā)生時模式。
從方法角度,這兩者均屬于模式識別,我們希望通過建立可以描述故障發(fā)生前或者故障發(fā)生時的特征,利用機械工程上的方法、信號處理的方法、統(tǒng)計學方法以及機器學習的方法構建一個或多個可以識別一種或多種故障模式的模型。
路徑1:識別特定故障發(fā)生前模式
在此,我們先來探討一下故障發(fā)生前是否有征兆?對于這個問題,天澤智云幾位數(shù)據(jù)科學家發(fā)表了自己的看法。
A博士:故障發(fā)生前不會有任何表征。
B博士:用戶想要避免的失效一般都為故障非常嚴重的失效狀態(tài),所以有時把早期故障預測也簡稱為故障預測。
C博士:故障和失效沒有準確定義,一般說的有沒有表征只是指能不能監(jiān)測到數(shù)據(jù),但故障的演進是一直存在的。
D博士:故障既然被稱之為故障,證明故障已經(jīng)表征出來了。而故障表現(xiàn)出來需要經(jīng)歷一定的時間,各個內(nèi)在已經(jīng)磨耗到一定的階段才能表現(xiàn)出來。
經(jīng)過討論,我們認為在故障發(fā)生之前,會存在很多因素影響一個部件的壽命(稱之為危險因素),比如空氣的酸堿度、沙塵、惡劣的環(huán)境溫度、共振載荷會對葉片材料壽命造成顯著的危害,通過對這些因素進行受控實驗或者長時的隊列/案例研究可以通過統(tǒng)計模型描述其剩余壽命。
在故障完全發(fā)生前,進行壽命預測是一種可行的方法,但是這種方法需要的實驗、數(shù)據(jù)、時間的代價都很大。
對于部件來說,其故障發(fā)生前沒有明確的表征,因此我們著重研究故障早期的表征。
路徑2:識別故障發(fā)生早期的表征
Q:我們有什么數(shù)據(jù)?
SCADA數(shù)據(jù),秒級/分鐘級
無故障標簽/無準確故障產(chǎn)生時間
有限傳感器測點,大多數(shù)為溫度測點數(shù)據(jù)
能獲取的數(shù)據(jù)可能并不滿足對特定故障模式的建模。
Q:在這種情況下如何做故障預測?
有限數(shù)據(jù),尤其是沒有標簽數(shù)據(jù)的情況下,對特定故障模式建模難以實現(xiàn)。退而求其次,我們對部件進行異常檢測。對此,我們提出一個理論:
定義什么是異常:
偏離正常就是異常
如何描述正常:
用正常狀態(tài)的物理過程來定義
如何測量對正常的偏離
有了正常狀態(tài)的定義之后,用數(shù)學上或者其他方法來描述對正常的偏離:使用分類模型,或者使用距離來度量
以上是我們從以前的研究中總結的研究方法。研究發(fā)現(xiàn),熱傳導和溫度是物理系統(tǒng)的最基本的變量,基于熱力學第一定律,可以建立溫度變化和風機輸出功率或轉(zhuǎn)速的變量關系。如果風機在大部件失效的狀態(tài)下,這種線性關系就會遭到破壞,從而服從不同于正常狀態(tài)下的溫度分布情況。在很多情況下,溫度關系的變化是部件失效的一種直接表征。如下圖研究中表示油溫溫升分布與齒輪箱失效的關系。
基于以上,我們認為可以將溫度、溫升作為建模的依據(jù),將溫度、溫升分布的改變作為故障發(fā)生(早期)的表征。
當然,通常做異常檢測我們有很多可以用的其他統(tǒng)計和機器學習模型,比如使用PCA-T2/SPE、SOM-MQE、Isolation Forest等方法進行建模。在本例中,我們關注于特定溫度的異常檢測,呈現(xiàn)另外的建模方法。
三、建模的思路是什么
對于軸承,我們認為發(fā)電機前后軸承溫度存在一定差異并在正常情況下保持動態(tài)的穩(wěn)態(tài),熱傳導的過程需要時間并且逐漸變化。由于發(fā)電機軸承失效或故障導致這種穩(wěn)態(tài)的破壞,并將體現(xiàn)在基線的偏離上。我們用以下幾種方式定義基線。
定義基線方式1:
我們用一種函數(shù)關系來描述一種溫度量,建立模型來預測溫度,比如建立油溫的模型對溫度進行預測。將預測的溫度作為基線,如果預測的數(shù)據(jù)和實際獲得的數(shù)據(jù)相差很大,我們認為偏離正常狀態(tài)。
我們可以使用回歸模型來擬合,比如ANN、SVR、ANFIS,這很多情況下我們觀察的變量具備一定的時間序列上的關聯(lián),則可以使用NARX/LSTM模型。之后使用距離(比如MD)度量一段時間內(nèi)預測值與實際值的差異,使用單機組無故障數(shù)據(jù)訓練建立基線。
這種方法存在一種缺陷:對實際值的擬合的模型精度會放大后續(xù)建模的誤差
定義基線方式2:用直方圖描述分布
我們認為在健康情況下,溫升存在特定的分布。描述一種分布最常用的圖形是直方圖。從數(shù)學的角度看,直方圖是一種離散化數(shù)據(jù)進行統(tǒng)計的方法。
直方圖這種方法雖然簡單,但是在很多領域都有著廣泛的用途。
比如:
xgboost - 其中應用到直方圖算法,用于高效地生成候選的分割點,運算非???/p>
方向梯度直方圖(HOG) – 機器視覺領域的特征方法
使用離散化權重的方法優(yōu)化深度學習性能等
在實際應用到工業(yè)場景中,對數(shù)據(jù)離散化的參數(shù)需要根據(jù)其業(yè)務屬性來約束。
直方圖方法的變種
使用直方圖方法可以獲得對變量的特征向量,這種方法通常可以描述數(shù)據(jù)的分布。但是在很多情況中,數(shù)據(jù)的噪聲,尤其是傳感器的測量誤差,會淹沒異常模式的表征。為提高信噪比,我們采用一種來自被自然語言處理(NLP)領域廣泛使用的加權方法TF-IDF。
獲得特征向量后,有了基線及實時數(shù)據(jù)特征矩陣后,我們可以使用歐式距離來描述實時數(shù)據(jù)與基線特征向量的距離。當然,我們也可以應用其他的模型,比如可以進行聚類。
TF-IDF訓練案例
案例:變槳電機溫度的異常檢測。
我們以三個變槳電機編組為三組,計算三組特征向量與基線的距離。
下圖為正常的變槳電機溫度狀態(tài)。
下圖為異常的變槳電機溫度狀態(tài)。
在所應用到的各種案例中,該方法對各部件溫度的異常檢測具備良好的準確性(>90%)。
定義基線方式3:符號化的特征表示
使用直方圖或者是TF-IDF,其中的一個重要的步驟是對連續(xù)數(shù)據(jù)的離散化。離散化可以看成一種對信號中的信號進行平滑的過程,損失了一定的信息換取更高的信噪比。
在獲得離散化的數(shù)據(jù)后,使用固定維度對原始數(shù)據(jù)進行重新表達。在自然語言處理中,這種技術稱為詞的分布式表示(Distributional Representation)。
我們繼續(xù)把這種離散化的連續(xù)數(shù)據(jù)視為“符號”,這種處理在很多領域都有應用,比如在信號處理領域的SAX方法。使用NLP的方法,比如word2vec來訓練這些“詞”或“文檔”的向量。同樣,我們利用訓練的基線向量來進行異常檢測或其他任務。
高維數(shù)據(jù)中,我們可以拓展這種方法到更多的故障模式的學習中。
四、結 語
在這里,我們提出了一種對于連續(xù)數(shù)據(jù)的符號化的特征表示的方法用于異常檢測,作為常規(guī)異常檢測技術的補充。
這種方法使用對連續(xù)數(shù)據(jù)離散化處理,使之符號化,進而尋找符號映射到數(shù)學空間的表達。在文章的例子中,“符號”表示了一種兩種變量間的統(tǒng)計關系,并且,在這種方法中,我們認為這些“符號”和詞語在語料庫中一樣,具有穩(wěn)定的統(tǒng)計分布。這種方法之所以可以用于異常檢測,在于從物理模型上,該“符號”表達了我們關注量的物理關系。
更多精彩內(nèi)容歡迎關注我們:天澤智云CyberInsight(微信ID:CPS-China)
提交
駿業(yè)日新 大展宏圖 | 天澤智云上海分公司成長記
在智能化落地過程中我們學到了什么?
工業(yè)智能技術在軌道交通領域的應用實踐分享
基于GenPro的工業(yè)智能建模案例分享
工業(yè)智能為軌道交通安全高效運營保駕護航 天澤智云與您相約RT FORUM