工控網(wǎng)首頁
>

應(yīng)用設(shè)計(jì)

>

五個(gè)數(shù)字說清工業(yè)大數(shù)據(jù)

五個(gè)數(shù)字說清工業(yè)大數(shù)據(jù)

2019/3/26 10:03:04

要理解工業(yè)大數(shù)據(jù),筆者認(rèn)為,可以從下面幾個(gè)數(shù)字入手。

一個(gè)目標(biāo)

一個(gè)目標(biāo)就是提升智能化的水平。很多專業(yè)人士談到大數(shù)據(jù),往往局限于各種數(shù)據(jù)的分析及其算法。如果視野僅僅局限于這個(gè)層次,那么,就難以看到大的機(jī)會。

在筆者看來,大數(shù)據(jù)時(shí)代的機(jī)會就在于促進(jìn)智能化水平的提高、帶領(lǐng)工業(yè)界進(jìn)入智能時(shí)代。換句話說:如果不與各種智能化工作聯(lián)系起來,就可能會失去大數(shù)據(jù)時(shí)代的機(jī)會。

要認(rèn)識這種機(jī)會,就需要正確把握智能化的含義。什么是智能化?智能化就是通過數(shù)字化和網(wǎng)絡(luò)技術(shù)提升信息獲取或決策的能力。而決策的主體可以是機(jī)器,也可以是人。我們知道,大數(shù)據(jù)促進(jìn)了機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,推動了新一代人工智能(AI)的發(fā)展。但智能化的內(nèi)涵應(yīng)該遠(yuǎn)大于人工智能(AI)。只有認(rèn)識到這一點(diǎn),才能看到更多的機(jī)會和可能。

某種意義上講,智能化就是人機(jī)工作界面的改變,是借助ICT技術(shù)(信息通信技術(shù))實(shí)現(xiàn)業(yè)務(wù)活動方式的創(chuàng)新。在信息獲取、知識獲取、決策、執(zhí)行等環(huán)節(jié),我們都可以采取新的工作方式。比如,在信息獲取方面,當(dāng)數(shù)據(jù)太多太散時(shí),可以讓機(jī)器去查找信息;數(shù)據(jù)組織得好時(shí),就可以讓人去查找信息。還比如,在知識獲取方面,可以用人機(jī)協(xié)同的方式獲取知識,也可以讓機(jī)器自行去獲取知識。

可以說,在智能化方面,我們要有想象力,不要局限于從數(shù)據(jù)中發(fā)現(xiàn)知識。比如,實(shí)現(xiàn)機(jī)器“用”知識推動設(shè)備智能化,或直接為人類提供可用的知識?,F(xiàn)在,知識的人類用戶可以是工程師,也可以是消費(fèi)者。因此,工業(yè)大數(shù)據(jù)技術(shù)落地的前提常常是具體業(yè)務(wù)牽引,即所謂“先有需求,再找方法”。

一個(gè)基礎(chǔ)

一個(gè)基礎(chǔ)就是數(shù)據(jù)的完整性。無論是工業(yè)產(chǎn)品還是車間、工廠,工業(yè)對象往往被看成一個(gè)復(fù)雜的系統(tǒng)。當(dāng)我們用數(shù)據(jù)來表征系統(tǒng)時(shí),數(shù)據(jù)的完整性和相關(guān)性都特別重要。畢竟不完整的數(shù)據(jù)和不相關(guān)的數(shù)據(jù)可能會得出錯(cuò)誤的分析結(jié)論,而工業(yè)對象都追求高度的可靠性,對錯(cuò)誤的容忍度很低。

寶鋼老專家王洪水先生認(rèn)為:用數(shù)據(jù)記錄生產(chǎn)過程時(shí),“要向錄像機(jī)錄像一樣”把數(shù)據(jù)收集起來,不要有斷點(diǎn)。這是實(shí)踐中行之有效、正確的指導(dǎo)思想。

筆者還見過有人在研究鋼鐵材料成分與力學(xué)性能之間的關(guān)系時(shí),把包括微合金鋼在內(nèi)的多種鋼種混在一起,卻只考慮了C、Si、Mn、S、P等所謂的“5大元素”。這時(shí)得到的結(jié)論自然就是錯(cuò)的。

過去記錄數(shù)據(jù)時(shí),由于存儲成本高,往往“挑重要的記錄”,導(dǎo)致記錄的信息碎片化。現(xiàn)在數(shù)據(jù)存儲成本低,可以記錄的數(shù)據(jù)多了,但是,若數(shù)據(jù)之間的關(guān)聯(lián)性沒有被記錄下來,則數(shù)據(jù)照樣是沒有價(jià)值的。

二次應(yīng)用

在多數(shù)業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)在業(yè)務(wù)活動中產(chǎn)生,業(yè)務(wù)活動結(jié)束后,數(shù)據(jù)也就基本沒用了。而大數(shù)據(jù)的重要用途往往發(fā)生在業(yè)務(wù)場景結(jié)束之后,故而稱之為二次應(yīng)用。二次應(yīng)用的價(jià)值在于:用過去產(chǎn)生的數(shù)據(jù)讓現(xiàn)在的業(yè)務(wù)活動做得更好。

大數(shù)據(jù)的一個(gè)重要用途是促進(jìn)企業(yè)的轉(zhuǎn)型升級、業(yè)務(wù)活動的創(chuàng)新。然而,創(chuàng)新的成功邏輯往往是“先做成、后做好”。強(qiáng)調(diào)二次應(yīng)用,指的是把大數(shù)據(jù)應(yīng)用于“做好”的優(yōu)化階段。

在筆者看來,大數(shù)據(jù)對如何“做成”業(yè)務(wù)是沒有責(zé)任的。因?yàn)闆]有“先做成”的業(yè)務(wù)邏輯,大數(shù)據(jù)也就沒有辦法落地。強(qiáng)調(diào)這一點(diǎn)的原因是:把兩個(gè)困難混在一起,可能就做不成事了?!白龀伞钡臉I(yè)務(wù)邏輯必須單獨(dú)考慮、提前考慮,大數(shù)據(jù)只是讓業(yè)務(wù)“做得更好”而已。

而“做好”則包括多個(gè)方面,如質(zhì)量更好、速度更快、成本更優(yōu),而不僅僅是決策質(zhì)量更好。比如,重用知識和信息可以使人們做事的速度更快、成本更低。對于“做好”,不要一味地強(qiáng)調(diào)“決策質(zhì)量更優(yōu)”,如果僅僅局限于決策質(zhì)量,則可能會失去很多創(chuàng)新機(jī)會。

兩種承載

大數(shù)據(jù)是數(shù)據(jù)(Data),也必須是信息(Information)。兩者的差別在于:數(shù)據(jù)之間有了聯(lián)系才能構(gòu)成信息。強(qiáng)調(diào)這個(gè)觀點(diǎn)的目的在于:不要碎片化地收集數(shù)據(jù),而是去收集有聯(lián)系的數(shù)據(jù)、收集數(shù)據(jù)之間的聯(lián)系,且最好是完整的信息,而不是破碎的信息。

大數(shù)據(jù)不僅可以用來承載信息,而且可以用來承載知識,也就是把知識提煉出來,用大數(shù)據(jù)來承載。從工業(yè)上看,工業(yè)產(chǎn)品的設(shè)計(jì)數(shù)據(jù)和工業(yè)設(shè)備的狀態(tài)、標(biāo)準(zhǔn)等知識都可以用數(shù)據(jù)來表示。在某些個(gè)性化需求比較多的場景下,這些數(shù)據(jù)的量是相當(dāng)大的。上海有一家企業(yè),每天處理這類數(shù)據(jù)所花的電費(fèi)就有10萬元。

總之,不論承載什么,都要以便于應(yīng)用為目的,不要總想著“從數(shù)據(jù)提取知識”這一件事、一個(gè)環(huán)節(jié),而是要以具體的應(yīng)用為牽引,根據(jù)具體需求,以終為始地建立大數(shù)據(jù)基礎(chǔ)。

三個(gè)優(yōu)勢

大數(shù)據(jù)的不同之處是什么?筆者將其歸結(jié)為三個(gè)優(yōu)勢。正是這三個(gè)優(yōu)勢讓我們便于從大數(shù)據(jù)中獲得知識。

筆者把第一個(gè)優(yōu)勢稱為“不必糾結(jié)于因果”。這種說法區(qū)別于“是相關(guān),不是因果”,以及“工業(yè)大數(shù)據(jù)必須具備因果關(guān)系”。這種觀點(diǎn)的意思是:從大數(shù)據(jù)中提煉的工業(yè)知識,要以因果關(guān)系的存在為基礎(chǔ),但不必按照機(jī)理邏輯去計(jì)算。比如,我們可以從數(shù)據(jù)中得到某個(gè)最優(yōu)參數(shù),但不必從理論上推導(dǎo)出來為什么最優(yōu)。不糾結(jié)于因果,可以讓知識的獲取變得簡單。在這個(gè)基礎(chǔ)上,大數(shù)據(jù)可以獲得靠譜的“感性知識”“經(jīng)驗(yàn)知識”,讓知識的種類大大拓展。這是大數(shù)據(jù)促進(jìn)圖像識別等技術(shù)發(fā)展的原因之一。

第二個(gè)優(yōu)勢是“樣本=全體”。從應(yīng)用的角度看,數(shù)據(jù)的優(yōu)勢不在“多”,而在“全”。“多”只會增加計(jì)算機(jī)處理的復(fù)雜性,而“全”則保證了知識的存在性。當(dāng)數(shù)據(jù)能夠覆蓋所有場景時(shí),“新問題”就變成了“老問題”,這時(shí)我們就可以從歷史中得到所需要的經(jīng)驗(yàn)和知識。

第三個(gè)優(yōu)勢是“混雜性”。這個(gè)優(yōu)勢可以讓我們從多個(gè)角度印證知識,提高知識的可靠性,但其前提是確保大數(shù)據(jù)記錄的完整性。

由此可以看出,三個(gè)優(yōu)勢的本質(zhì)都落腳在“知識的優(yōu)勢”上。

大數(shù)據(jù)的優(yōu)勢與人的作用

工業(yè)大數(shù)據(jù)并不是天生存在的,而是要人去創(chuàng)造的。比如,“樣本=全體”的內(nèi)涵是借鑒過去的經(jīng)驗(yàn)。然而,“世界上沒有兩片完全一樣的葉子”。從這個(gè)角度看,其實(shí)每個(gè)問題都是獨(dú)特的,“樣本=全體”的理念在應(yīng)用時(shí)必然涉及個(gè)性與共性的關(guān)系問題。借鑒過往經(jīng)驗(yàn)的前提是對問題抽象、歸納、總結(jié)的結(jié)果——但這往往是人類才能做的事情,至少是人類告訴計(jì)算機(jī)該怎么做。而且,大數(shù)據(jù)記錄的數(shù)據(jù)畢竟屬于過去,因此,在應(yīng)用于未來時(shí),必須有辦法來提高其可靠性。

再如,“不糾結(jié)于因果”的前提是以因果關(guān)系的存在為基礎(chǔ),只是不必按照因果邏輯去推導(dǎo)、計(jì)算。但是,因果關(guān)系是具有專業(yè)知識的人用專業(yè)領(lǐng)域知識“保證”的,而不能指望數(shù)據(jù)分析算法能“保證”。

工業(yè)界經(jīng)常遇到的問題是:數(shù)據(jù)常常來自某個(gè)“工作點(diǎn)”附近,數(shù)據(jù)量大而相似度高、干擾相對強(qiáng)而信息含量相對低。這種現(xiàn)象會使得分析結(jié)果的可靠度降低。筆者認(rèn)為,解決這個(gè)問題,可以把生產(chǎn)數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)結(jié)合起來,把“大數(shù)據(jù)”與“小數(shù)據(jù)”結(jié)合起來,而不是局限于生產(chǎn)數(shù)據(jù)本身。

來源:互聯(lián)網(wǎng)

審核編輯(
王靜
)
投訴建議

提交

查看更多評論
其他資訊

查看更多

派拓網(wǎng)絡(luò)被Forrester評為XDR領(lǐng)域領(lǐng)導(dǎo)者

智能工控,存儲強(qiáng)基 | ??低晭砭手黝}演講

展會|Lubeworks路博流體供料系統(tǒng)精彩亮相AMTS展會

中國聯(lián)通首個(gè)量子通信產(chǎn)品“量子密信”亮相!

國家重大裝備企業(yè)齊聚高交會 中國科技第一展11月深圳舉行