1. 工業製造大數據分析
工業製造大數據分析
大數據不僅僅是大量的數據的堆積。大數據的重要屬性之一,是人們設法收集並弄清楚不斷變化的數據類型。如果只是大量採集同一類型的數據,再大的數據量都不能稱之為大數據。
如何實現智能製造是大家都關心的問題。從哈佛商學院的邁克爾·波特到賓夕法尼亞大學沃頓商學院,有一個普遍的共識,即數字化轉型是智能製造實現的途徑。重要的是,這個共識也來自於眾多的世界級製造業企業與企業家們。
這一共識是基於無數技術趨勢的融合,例如,物聯網、賽博系統(CPS)、工業物聯網、移動技術、人工智慧、雲計算、虛擬/虛擬增強現實(VR/AR),以及大數據分析等。我們一定要保持清醒,不要簡單地認為有了這些技術,未來五年就是製造業的黃金時期。道理很簡單,這個新製造業文化的變革進程是相當復雜和艱難的,沒有行業、企業與用戶的融合推進,無法實現這次變革。數字化轉型不僅僅意味著企業簡單的數字化,而是把數字作為智能製造的核心驅動力,利用數據去整合產業鏈和價值鏈。
自工業革命以來,為了改進運營,製造商一直以來都在有意地採集並存儲數據。隨著時間的推移,數據在製造業分析的需求將越來越大。然而在過去的許多年間,利用數據的根本動因並沒有改變,數據的復雜性增強,數據轉化為情報的能力越來越大。
2012年高德納給出大數據定義,其中特別強調大數據是多樣化信息資產,不僅關注實際數據,更關注大數據處理方法。數據量大小本身並不是判斷大數據價值的核心指標,而數據的實時性和多元性對大數據的定義和價值更具直接的影響。
在討論工業大數據分析的時候,我注意到兩種不同的觀點:
第一種觀點認為,製造業向來都有大數據。幾十年來我們的企業一直在通過歷史記錄、MES、ERP、EAM等各種應用系統採集數據。在部分產業鏈環節,特別在市場營銷方面,大數據算是一個新的熱詞。
第二種觀點認為,從工業大數據角度看,製造業是一個尚未打開的市場或剛剛開啟的市場。存在大量不同類型的數據,但如今它們還未被應用到分析之中。
考慮到這些觀點,面對任何新的市場提法,包括名詞解釋、定義或分析框架,我們始終都應該保持適當的懷疑精神。這里我更多傾向於第二個觀點。我們的製造業的確有「大量數據」,但這並不是我們大多數人從市場上所理解的「大數據」涵義。在搞清楚工業大數據分析之前,我們應該如何定義製造業的大數據?這里可以通過大數據的三個特性,進一步了解大數據的特性。
數據來源
工業大數據的主要來源有兩個,第一是智能設備。普適計算有很大的空間,現代工人可以帶一個普適感應器等設備來參加生產和管理。所以工業數據源是280億左右大量設備之間的關聯,這個是我們未來需要去採集的數據源之一。
第二個數據來源於人類軌跡產生的數據,包括在現代工業製造鏈中,從采購、生產、物流與銷售內部流程以及外部互聯網信息等。通過行為軌跡數據與設備數據的結合,大數據可以幫助我們實現對客戶的分析和挖掘,它的應用場景包括了實時核心交易、服務、後台服務等。
數據關系
數據必須要放到相應的環境中分析,才能了解數據之間的關系。譬如,每一款新機型在交付給航空公司之前都會接受一系列殘酷的飛行測試。極端天氣測試就是測試之一。該測試的目的是為了確保飛機的發動機、材料和控制系統能在極端天氣條件下正常運行。
問題的處理關鍵在於找到可能產生問題的根源,消除已知錯誤,並確保解決方案的可靠有效。一旦找到並確定了根本原因,同時具備了可接受的應急措施,就可把問題當成一個已知錯誤來處理。問題調查的過程一定需要收集所有可用、與事件相關的信息,以確定並消除引起事件和問題的根本原因。數據採集與分析必須要事件/問題發生的環境數據結合。
數據價值
對於數字化轉型,大數據不僅要關注實際數據量的多少,最重要的是關注大數據的處理方法在特定場合的應用,讓數據產生巨大的創新價值。如果離開了收益考慮或投資回報(ROI)的設計,一味尋求大數據,則大數據分析既無法落地也無法為企業創造價值。
工業大數據分析的定義
發動機是飛機的心臟,也是關乎航空安全,生命安全的重中之重。為了實時監控發動機的狀況,現代民航大多安裝了飛機發動機健康管理系統。通過感測器、發射系統、信號接收系統、信號分析系統等方式採集到的數據,會經由飛機通信定址與報告系統,通過甚高頻或者衛星通信傳輸出來,這就是為何GE的發動機監控系統每天會獲取超過1PB數據的原因。
生產執行系統(MES)與飛機發動機健康管理系統如出一轍。我們可以從工廠的生產中,實時採集到海量的流程變數、測量結果等數據。基於大量數據集而生成的報表,或是基礎統計的分析並不足以稱為製造業的大數據分析。
數據類型的多樣性是工業大數據分析的重要屬性
大數據不僅僅是大量的數據的堆積。大數據的重要屬性之一,是人們設法收集並弄清楚不斷變化的數據類型。如果只是大量採集同一類型的數據,再大的數據量都不能稱之為大數據。
例如,生產環境中收集的時間序列模擬流程變數,數據的類型是單一的,很容易建立索引,即使存在千千萬萬,也不足以成為大數據。
數據必須包括高度可變性和種類多樣性。製造工廠中存在無數的大數據應用,但並不包括簡單地分類和展示一連串的流程測量結果,對這些工作,基本的統計展現就可以完成。一些大數據的資料庫或數據湖的構成部分也是文本信息、圖像數據、地理或地質信息和非結構信息,例如,通過社交媒體或其他協作平台獲得的數據類型。
製造業信息結構概括起來分為兩層,一個是管理層,一個是自動化層。從經營管理、生產執行與控制三個緯度來實現決策支持、管理、生產執行、過程式控制制以及設備的連接與感測。製造業中大數據分析是指利用通用的數據模型,將管理層與自動化層的結構性系統數據與非結構性數據結合,進而通過先進的分析工具發現新的洞見。
大數據分析對企業生產智能的意義
製造業創新的核心就是要依託大量的前沿科技。先進的技術是創新的手段。在新技術的支持下,可以通過一體化的製造運作管理系統MOM將企業管理應用系統,例如ERP、EAM等系統與工業自動化的相關系統整合為一體。在一體化製造運作管理的基礎上,我們可以實現集IT+MOM+MES+BI的一體化製造企業信息系統解決方案。
從兩化融合的角度來看,信息系統供應商要從企業的主信息系統提供商(MIV,MainInformation systems Vendor )定位來做好規劃、標准、功能設計、實施策略的統一性工作。協助企業做好風險控制,降低投資,降低操作維護成本,實現企業信息系統全集成。
特別需要注意的是,企業管理信息平台被普遍認為是製造企業管理的集成和儀錶板工具。許多供應商既大量投資其與ERP和自動化系統專有的集成,也投資開放式集成,還投資儀錶板和移動技術,希望隨時隨地為需要正確信息的決策者提供衡量標准。
製造業大數據分析的三種途徑
途徑一,利用開放技術與平台,將任何系統的數據移動到任何其他地方。
製造運作管理系統建設項目是系統工程,不僅僅是一套我們理解的傳統軟體系統,更多的是項目執行和服務的平台。這需要在項目管理與製造企業的策略「客戶服務」上,體現出製造企業的綜合管理能力與軟實力。
整個平台要從前期、工程實施以及售後服務這三個大的階段來架構。在前期規劃中,要重視標准、設計與實施,特別是與管理一體化的信息系統形成統一的對接。有了前期統一規劃的制定,工程實施的環節可把行業的經驗、集成能力、實施能力、軟體開發能力等融合。特別需要在組織上建立和形成超級團隊的制度。而持續服務、長期經營,將物聯網應用融入與「軟體+雲服務」的互聯網+戰略是後續服務的考慮重點。
在製造業大數據分析工作中,必須要加強通過物聯網科技的應用對後續持續服務的支撐作業。通過工業物聯網,實現的及時響應客戶、物聯網軟硬體系統定期巡檢、提供應急備件、提供易耗品、完善應用等功能來加強和鎖定與企業的供應鏈企業之間的長期合作。通過管理平台與物聯網數據,可以持續為客戶提供有價值的服務。
途徑二,投資工廠內外系統架構堆棧中能夠處理結構性和非結構性數據的數據模型。
新技術是創新革命的核心,其中很重要一個特點就是集成,即製造運作管理系統MOM與ERP、EAM、OA、商業分析的集成,包括一鍵登錄、界面集成、消息推送、工作流集成、主數據、應用集成匯流排與平台。
由於這些系統之間主數據全部統一,所有系統之間的數據交互依靠應用系統匯流排進行數據交互,整合了跨系統的業務流程、工作流、服務流程等之後即實現無縫集成和分析。對於企業管理者來說,一鍵登錄後,可以根據不同的崗位,個性化制定並且顯示與管理最相關的必要信息。這就是互聯網所帶給我們的分享思路。
途徑三,通過時間序列、圖像、視頻、機器學習、地理空間、預測模型、優化、模擬和統計過程式控制制等先進的分析工具與製造業企業內的大數據平台結合分析,從而洞見尚未顯現的情況。通過感測器、感應器、傳輸網路和應用軟體等物聯網數據,與管理應用軟體結合起來,將是今後製造業大數據分析的一大方向。
培養企業內部大數據分析專家
作為一個行業,我們需要有機地發展行業特定的大數據分析工具集,這樣才能讓現在的行業專家,從足夠的數據科學中實現數字化轉型。為了推動轉型,我們需要一大批優秀的企業利用這種方法,並向其他人或同行證明其價值。
2. 製造業大數據的「冷」思考
製造業大數據的「冷」思考?
當前,大數據作為新一代信息技術的關鍵,逐漸成為新一輪產業革命的核心。製造業邁入了大數據時代,2012年,GE公司率先明確了「工業大數據」的概念。在製造業,產品的全生命周期從市場規劃、設計、製造、銷售、維護等過程都會產生大量的結構化和非結構化數據,形成了製造業大數據,而這些數據符合大數據的三「V」的特徵:規模性、多樣性以及高速性。除此以外,製造業大數據還具多源異構、多尺度、不確定、高雜訊等特徵。因此,研究和應用製造大數據更具有挑戰性。 主要體現在製造大數據的存儲、管理、分析和展示方面。如何充分挖掘工廠中數據的價值,通過對製造大數據進行分析,提升數字化工廠運行效率,已成為制約數字化工廠向智慧工廠發展的瓶頸!
然而,大數據給我們帶來的思考:在製造業能用嗎?解決什麼問題?製造業大數據到底在哪些領域可以發揮它的作用?
首先,能用否?大數據已經成為解決現實世界問題的方法。要解決現實世界的問題,第一種方法就是科學實驗,通過實驗的方法來發現現實世界的一些規律和解決和問題; 第二種就是通過理論分析和推導方法;第三種就是科學計算,模擬模擬成為第三種解決問題的範式;數據科學成為第四種解決問題的範式,這個就是由美國圖靈獎的獲得者,他出了一本書《第四種範式》,目前現在國外數據科學是一門非常熱門的學科,它是一門綜合交叉的學科。
大數據方法帶來了思維上的變化,主要是從三個方面來看的:
從因果到關聯,更強調事物之間的相關性而非因果性。
從局部到全體,採用全體數據進行分析,而不是隨機樣本。
從精確到混雜,通過數據保證解的優異性,不再一味追求精確的演算法。
既然大數據已經成為解決問題的方法,那能用它。
因此,從數字化工廠向智能化工廠轉化的過程中面對著海量的數據,需要尋找它們相互之間的聯系和隱藏規律,實現透明化的目標。
最後,在哪裡用?大數據它給製造業提供的是一種全方位的全程式的一種服務,在產品全生命周期階段,從設計到製造、從使用到維護、直到維修階段,產生的正向數據以及逆向數據,這些數據都能全方位的使用。
在產品的設計中,傳統的設計師,基於經驗靈感和經驗,揣度消費者的需求喜好,設計產品。在大數據時代,設計師通過對用戶行為和需求大數據進行分析,精準量化客戶需求,指導設計過程。
在製造階段,大數據技術可以幫助實現生產過程異常發現、產品質量和生產調度優化等方面。以生產異常發現為例,傳統的基於降維手段的異常發現方法,容易破壞信息完整性,不利於設備異常的發現。在大數據模式下,基於製造數據的分析對關鍵參數進行提取,然後通過聚類分析手段發現設備異常模式,在此基礎上對設備控制優化。大數據也能幫助提高產品的質量控制,大家來自製造業可能知道SPC控制的是整個過程的單個參數,但是單個參數在正常范圍,為什麼還會出現一些質量問題?可能每個參數均處於臨界狀態,綜合產生會產生一些質量問題,所以在這個過程中,傳統就是數據的篩選、參數分析,這個過程介入了人工的分析來進行質量的預測,數據篩選過程淘汰了許多有效的數據資源,參數分析過程經常存在人工經驗判斷,使得預測模型對整個產品加工過程信息的描述殘缺不全,不能發現產品質量問題的深層次原因(如誤差累積)。 因此在大數據模式下,根據產品的加工工藝過程,對產品質量相關數據按層次進行組織,利用多隱藏層的神經網路深度學習加工過程中產品質量數據的相互作用機理,從而對產品質量問題進行全面、深層次描述。大數據能提升大規模生產調度的全局性能,大家知道為什麼我們企業生產調度一直會出現問題,我們做的計劃好好地趕不上變化。因為所做的計劃,是在一個理想狀態下考慮約束做的計劃。我自己做生產優化調度做了20多年,一直在尋找一種最優的解決方案,研究智能方法,例如:遺傳演算法、螞蟻演算法等。但隨著工藝的復雜、環境的復雜、工藝的規模,整個問題規模越來越大的時候,它已經是一個很難解決的問題。傳統的智能調度方法難以求解大規模的調度問題,基於規則和瓶頸的方法在大規模問題中又很難得到全局優化解;大數據帶來了新思路,他採用全局的數據之間的關聯關系,從而形成全局的調度方案,能夠解決大規模生產中的全局調度問題。
大數據能為產品的運營維護服務,很典型的案例就是GE的案例,建立一個平台,為航空發動機的監控、運行監測、故障診斷提供一個全方位的服務。在產品的運行和維護過程中,大數據模式一改傳統方法被動的運維模式,通過採集和分析智能設備的感測器數據,進行大數據分析,主動進行產品的安全監測、故障診斷,優化產品的運行過程。大數據應用過程中需要的是什麼呢,首先需要的是能夠採集到數據,也就是需要產品是一個智能化的產品,所以 在智能製造中,首先要有智能化的產品,安裝感測器,能夠實時的傳遞數據,這為後面的運行、維護服務提供了依據。
大數據不只是關於數據,而是採用傳統及新的分析方法來分析所有數據。針對大數據分析的結果採取行動來提升業務才是最重要。隨著大數據技術的不斷地發展,國內外已對大數據在製造領域中的應用進行了一些開拓性的研究,代表性的有GE工業互聯網解決方案、Smart Factory計劃,SAP HANA平台和Invensys數據分析平台,並已在農夫山泉、百事飲料等公司應用。三一重工利用大數據技術通過對地理位置數據的關聯分析發現泵車主油缸故障與沿海地區杭深高鐵建設的強相關性,確定了沿海地區的鹽霧環境和水質是導致油缸密封體腐蝕的主要原因。日本小松公司通過對挖掘機安裝感測器與GPS定位系統,從而實時監控車輛運行情況,並通過大數據分析,對未來挖掘機市場的需求進行預測從而調整生產、對用戶的使用習慣進行分析與建議從而降低油耗。
以上的一些工業案例成為製造業大數據的先驅,然後,目前絕大多數製造業大數據的應用沒能形成系統化的思路和方案,缺乏理論體系的支撐。 針對國內在製造業大數據應用基礎研究上的空白,我團隊2014年申請了國家自然科學基金重點項目「大數據驅動的智能車間運行分析與決策方法研究」,並得到了資助。目前,圍繞車間製造大數據之間的耦合作用機理、車間性能的演化規律、車間運行過程的調控機制三個基礎科學問題進行科學研究,來探索我們的大數據在我們的智能製造車間的運行情況。解決問題的思路是是一切都在用數據來說話,利用大數據來解決工程問題的科學研究思路是: 一切數據說話。首先數據化:將設備狀態參數、計劃執行情況等運行參數,以及質量、交貨期等性能指標數據化;然後分析這些數據之間的關聯關系,用數據挖掘的方法預測交貨准時率、產品合格率等車間性能的演化規律;從演化規律中,發現質量指標中某數據異常,找到影響該異常數據的關鍵參數,最後對關鍵數據進行控制,保證交貨期和產品質量。為了實現大數據應用,我們提出了大數據驅動的智慧工廠,它是生產車間、物聯網、雲端、移動互聯的有機融合。利用物聯網技術,使得車間生產過程、物流及之後的銷售、服務過程具備感知能力;全生命周期內產生的各種製造數據保存到雲端;藉助大數據處理與分析技術,依託雲計算平台,幫助分析數字工廠運行過程,提供決策支持,並通過移動互聯方式展現。目前我們在晶圓製造的車間和發動機裝配車間,開展了一系列的工作。
最後,我認為:實現以數據感知、數據處理分析、製造過程決策與支持、數據可視化技術為核心的智慧工廠已經成為趨勢,大數據產業鏈及技術體系逐漸成熟,大數據必將加速數字工廠向智慧工廠的轉型。