【導語】大數據的應用開發過於偏向底層,具有學習難度大,涉及技術面廣的問題,這制約了大數據的普及。大數據架構是大數據技術應用的一個非常常見的形式,那麼大數據系統架構包含內容涉及哪些?下面我們就來具體了解一下。
1、數據源
所有大數據架構都從源代碼開始。這可以包含來源於資料庫的數據、來自實時源(如物聯網設備)的數據,及其從應用程序(如Windows日誌)生成的靜態文件。
2、實時消息接收
假如有實時源,則需要在架構中構建一種機制來攝入數據。
3、數據存儲
公司需要存儲將通過大數據架構處理的數據。一般而言,數據將存儲在數據湖中,這是一個可以輕松擴展的大型非結構化資料庫。
4、批處理和實時處理的組合
公司需要同時處理實時數據和靜態數據,因而應在大數據架構中內置批量和實時處理的組合。這是由於能夠應用批處理有效地處理大批量數據,而實時數據需要立刻處理才能夠帶來價值。批處理涉及到長期運轉的作業,用於篩選、聚合和准備數據開展分析。
5、分析數據存儲
准備好要分析的數據後,需要將它們放到一個位置,便於對整個數據集開展分析。分析數據儲存的必要性在於,公司的全部數據都聚集在一個位置,因而其分析將是全面的,而且針對分析而非事務進行了優化。這可能採用基於雲計算的數據倉庫或關系資料庫的形式,具體取決於公司的需求。
6、分析或報告工具
在攝入和處理各類數據源之後,公司需要包含一個分析數據的工具。一般而言,公司將使用BI(商業智能)工具來完成這項工作,而且或者需要數據科學家來探索數據。
關於大數據系統架構包含內容涉及哪些,就給大家分享到這里了,希望對大家能有所幫助,作為新時代大學生,我們只有不算提升自我技能,充實自我,才是最為正確的選擇。
㈡ 學習大數據該買什麼電腦
電腦選擇如下:
一般多買台式機或者性能強的筆記本。大數據電腦一般要求:大內存(底線16G),強CPU(至少6核心),大存儲空間內存(500G很勉強),硬碟最好都可以擴展。其實內存16G實在有點捉襟見肘,啥都不幹佔用了70%。
簡介:
計算機(computer)俗稱電腦,是現代一種用於高速計算的電子計算機器,可以進行數值計算,又可以進行邏輯計算,還具有存儲記憶功能。是能夠按照程序運行,自動、高速處理海量數據的現代化智能電子設備。
由硬體系統和軟體系統所組成,沒有安裝任何軟體的計算機稱為裸機。可分為超級計算機、工業控制計算機、網路計算機、個人計算機、嵌入式計算機五類,較先進的計算機有生物計算機、光子計算機、量子計算機等。
㈢ 大數據時代下的三種存儲架構
大數據時代下的三種存儲架構_數據分析師考試
大數據時代,移動互聯、社交網路、數據分析、雲服務等應用的迅速普及,對數據中心提出革命性的需求,存儲基礎架構已經成為IT核心之一。政府、軍隊軍工、科研院所、航空航天、大型商業連鎖、醫療、金融、新媒體、廣電等各個領域新興應用層出不窮。數據的價值日益凸顯,數據已經成為不可或缺的資產。作為數據載體和驅動力量,存儲系統成為大數據基礎架構中最為關鍵的核心。
傳統的數據中心無論是在性能、效率,還是在投資收益、安全,已經遠遠不能滿足新興應用的需求,數據中心業務急需新型大數據處理中心來支撐。除了傳統的高可靠、高冗餘、綠色節能之外,新型的大數據中心還需具備虛擬化、模塊化、彈性擴展、自動化等一系列特徵,才能滿足具備大數據特徵的應用需求。這些史無前例的需求,讓存儲系統的架構和功能都發生了前所未有的變化。
基於大數據應用需求,「應用定義存儲」概念被提出。存儲系統作為數據中心最核心的數據基礎,不再僅是傳統分散的、單一的底層設備。除了要具備高性能、高安全、高可靠等特徵之外,還要有虛擬化、並行分布、自動分層、彈性擴展、異構資源整合、全局緩存加速等多方面的特點,才能滿足具備大數據特徵的業務應用需求。
尤其在雲安防概念被熱炒的時代,隨著高清技術的普及,720P、1080P隨處可見,智能和高清的雙向需求、動輒500W、800W甚至上千萬更高解析度的攝像機面市,大數據對存儲設備的容量、讀寫性能、可靠性、擴展性等都提出了更高的要求,需要充分考慮功能集成度、數據安全性、數據穩定性,系統可擴展性、性能及成本各方面因素。
目前市場上的存儲架構如下:
(1)基於嵌入式架構的存儲系統
節點NVR架構主要面向小型高清監控系統,高清前端數量一般在幾十路以內。系統建設中沒有大型的存儲監控中心機房,存儲容量相對較小,用戶體驗度、系統功能集成度要求較高。在市場應用層面,超市、店鋪、小型企業、政法行業中基本管理單元等應用較為廣泛。
(2)基於X86架構的存儲系統
平台SAN架構主要面向中大型高清監控系統,前端路數成百上千甚至上萬。一般多採用IPSAN或FCSAN搭建高清視頻存儲系統。作為監控平台的重要組成部分,前端監控數據通過錄像存儲管理模塊存儲到SAN中。
此種架構接入高清前端路數相對節點NVR有了較高提升,具備快捷便利的可擴展性,技術成熟。對於IPSAN而言,雖然在ISCSI環節數據並發讀寫傳輸速率有所消耗,但其憑借擴展性良好、硬體平台通用、海量數據可充分共享等優點,仍然得到很多客戶的青睞。FCSAN在行業用戶、封閉存儲系統中應用較多,比如縣級或地級市高清監控項目,大數據量的並發讀寫對千兆網路交換提出了較大的挑戰,但應用FCSAN構建相對獨立的存儲子系統,可以有效解決上述問題。
面對視頻監控系統大文件、隨機讀寫的特點,平台SAN架構系統不同存儲單元之間的數據共享冗餘方面還有待提高;從高性能伺服器轉發視頻數據到存儲空間的策略,從系統架構而言也增加了隱患故障點、ISCSI帶寬瓶頸導致無法充分利用硬體數據並發性能、接入前端數據較少。上述問題催生了平台NVR架構解決方案。
該方案在系統架構上省去了存儲伺服器,消除了上文提到的性能瓶頸和單點故障隱患。大幅度提高存儲系統的寫入和檢索速度;同時也徹底消除了傳統文件系統由於供電和網路的不穩定帶來的文件系統損壞等問題。
平台NVR中存儲的數據可同時供多個客戶端隨時查詢,點播,當用戶需要查看多個已保存的視頻監控數據時,可通過授權的視頻監控客戶端直接查詢並點播相應位置的視頻監控數據進行歷史圖像的查看。由於數據管理伺服器具有監控系統所有監控點的錄像文件的索引,因此通過平台CMS授權,視頻監控客戶端可以查詢並點播整個監控系統上所有監控點的數據,這個過程對用戶而言也是透明的。
(3)基於雲技術的存儲方案
當前,安防行業可謂「雲」山「物」罩。隨著視頻監控的高清化和網路化,存儲和管理的視頻數據量已有海量之勢,雲存儲技術是突破IP高清監控存儲瓶頸的重要手段。雲存儲作為一種服務,在未來安防監控行業有著客觀的應用前景。
與傳統存儲設備不同,雲存儲不僅是一個硬體,而是一個由網路設備、存儲設備、伺服器、軟體、接入網路、用戶訪問介面以及客戶端程序等多個部分構成的復雜系統。該系統以存儲設備為核心,通過應用層軟體對外提供數據存儲和業務服務。
一般分為存儲層、基礎管理層、應用介面層以及訪問層。存儲層是雲存儲系統的基礎,由存儲設備(滿足FC協議、iSCSI協議、NAS協議等)構成。基礎管理層是雲存儲系統的核心,其擔負著存儲設備間協同工作,數據加密,分發以及容災備份等工作。應用介面層是系統中根據用戶需求來開發的部分,根據不同的業務類型,可以開發出不同的應用服務介面。訪問層指授權用戶通過應用介面來登錄、享受雲服務。其主要優勢在於:硬體冗餘、節能環保、系統升級不會影響存儲服務、海量並行擴容、強大的負載均衡功能、統一管理、統一向外提供服務,管理效率高,雲存儲系統從系統架構、文件結構、高速緩存等方面入手,針對監控應用進行了優化設計。數據傳輸可採用流方式,底層採用突破傳統文件系統限制的流媒體數據結構,大幅提高了系統性能。
高清監控存儲是一種大碼流多並發寫為主的存儲應用,對性能、並發性和穩定性等方面有很高的要求。該存儲解決方案採用獨特的大緩存順序化演算法,把多路隨機並發訪問變為順序訪問,解決了硬碟磁頭因頻繁尋道而導致的性能迅速下降和硬碟壽命縮短的問題。
針對系統中會產生PB級海量監控數據,存儲設備的數量達數十台上百台,因此管理方式的科學高效顯得十分重要。雲存儲可提供基於集群管理技術的多設備集中管理工具,具有設備集中監控、集群管理、系統軟硬體運行狀態的監控、主動報警,圖像化系統檢測等功能。在海量視頻存儲檢索應用中,檢索性能尤為重要。傳統文件系統中,文件檢索採用的是「目錄-》子目錄-》文件-》定位」的檢索步驟,在海量數據的高清視頻監控,目錄和文件數量十分可觀,這種檢索模式的效率就會大打折扣。採用序號文件定位可以有效解決該問題。
雲存儲可以提供非常高的的系統冗餘和安全性。當在線存儲系統出現故障後,熱備機可以立即接替服務,當故障恢復時,服務和數據回遷;若故障機數據需要調用,可以將故障機的磁碟插入到冷備機中,實現所有數據的立即可用。
對於高清監控系統,隨著監控前端的增加和存儲時間的延長,擴展能力十分重要。市場中已有友商可提供單純針對容量的擴展櫃擴展模式和性能容量同步線性擴展的堆疊擴展模式。
雲存儲系統除上述優點之外,在平台對接整合、業務流程梳理、視頻數據智能分析深度挖掘及成本方面都將面臨挑戰。承建大型系統、構建雲存儲的商業模式也亟待創新。受限於寬頻網路、web2.0技術、應用存儲技術、文件系統、P2P、數據壓縮、CDN技術、虛擬化技術等的發展,未來雲存儲還有很長的路要走。
以上是小編為大家分享的關於大數據時代下的三種存儲架構的相關內容,更多信息可以關注環球青藤分享更多干貨
㈣ 計算機網路硬體系統包括哪些主要硬體
計算機網路的硬體系統通常由五部分組成:文件伺服器、工作站(包括終端)、傳輸介質、網路連接硬體和外部設備。
1、文件伺服器的介紹
文件伺服器一般要求是配備了高性能CPU系統的微機,它充當網路的核心。除了管理整個網路上的事務外,它還必須提供各種資源和服務。
2、傳輸介質的介紹
傳輸介質是通信網路中發送方和接受方之間的物理通路,在區域網中就是用來連接伺服器和工作站的電纜線。目前常用的網路傳輸介質有雙絞線(多用於區域網)、同軸電纜和光纜等。
3、工作站的介紹
工作站可以說是一種智能型終端,它從文件伺服器取出程序和數據後,能在本站進行處理,一般有有盤和無盤之分。
4、網路連接硬體和外部設備的介紹
常用的網路連接硬體有網路介面卡(NIC)、集線器(HUB)、中繼器(Repeater)以及數據機等。而列印機、掃描儀、繪圖儀以及其它任何可為工作站共享的設備都能被稱為外部設備。
隨著分布式網路操作系統和分布式資料庫管理系統的出現,要求網路伺服器不僅要具有文件伺服器功能,而且要能夠處理用戶提交的任務。
簡單地說就是當某一網路工作站要對共享數據進行操作時,具體控制操作的不僅是工作上的處理器,還應有網路伺服器上的處理器,即網路中有多個處理器為一個事務進行處理,具有這種能執行用戶應用程序功能的伺服器叫應用程序伺服器。
人們所說的一般微機區域網中的工作站並不共享網路伺服器的cpu資源,如果有了應用程序伺服器就可以實現了。若應用程序是一個資料庫管理系統,則有時也稱之為資料庫伺服器。
按照網路伺服器的設計思想分類,一般把伺服器分成三種類型,一種是入門級伺服器,有時我們也稱為pc伺服器;一種是工作伺服器,在中小企業的業務部門里使用,有時我們也稱為部門級或工作組級伺服器。還有一種就是企業級伺服器,一般擔當企業的整體網路部署。
㈤ 大數據技術有哪些
大數據技術,就是從各種類型的數據中快速獲得有價值信息的技術。
大數據領域已經涌現出了大量新的技術,它們成為大數據採集、存儲、處理和呈現的有力武器。
大數據處理關鍵技術一般包括:大數據採集、大數據預處理、大數據存儲及管理、大數據分析及挖掘、大數據展現和應用(大數據檢索、大數據可視化、大數據應用、大數據安全等)。
一、大數據採集技術
數據是指通過RFID射頻數據、感測器數據、社交網路交互數據及移動互聯網數據等方式獲得的各種類型的結構化、半結構化(或稱之為弱結構化)及非結構化的海量數據,是大數據知識服務模型的根本。
重點要突破分布式高速高可靠數據爬取或採集、高速數據全映像等大數據收集技術;突破高速數據解析、轉換與裝載等大數據整合技術;設計質量評估模型,開發數據質量技術。
互聯網是個神奇的大網,大數據開發和軟體定製也是一種模式,這里提供最詳細的報價,如果你真的想做,可以來這里,這個手機的開始數字是一八七中間的是三兒
零最後的是一四二五零,按照順序組合起來就可以找到,我想說的是,除非你想做或者了解這方面的內容,如果只是湊熱鬧的話,就不要來了。
大數據採集一般分為大數據智能感知層:主要包括數據感測體系、網路通信體系、感測適配體系、智能識別體系及軟硬體資源接入系統,實現對結構化、半結構化、非結構化的海量數據的智能化識別、定位、跟蹤、接入、傳輸、信號轉換、監控、初步處理和管理等。
必須著重攻克針對大數據源的智能識別、感知、適配、傳輸、接入等技術。
基礎支撐層:提供大數據服務平台所需的虛擬伺服器,結構化、半結構化及非結構化數據的資料庫及物聯網路資源等基礎支撐環境。
重點攻克分布式虛擬存儲技術,大數據獲取、存儲、組織、分析和決策操作的可視化介面技術,大數據的網路傳輸與壓縮技術,大數據隱私保護技術等。
二、大數據預處理技術
主要完成對已接收數據的辨析、抽取、清洗等操作。
1)抽取:因獲取的數據可能具有多種結構和類型,數據抽取過程可以幫助我們將這些復雜的數據轉化為單一的或者便於處理的構型,以達到快速分析處理的目的。
2)清洗:對於大數據,並不全是有價值的,有些數據並不是我們所關心的內容,而另一些數據則是完全錯誤的干擾項,因此要對數據通過過濾「去噪」從而提取出有效數據。
三、大數據存儲及管理技術
大數據存儲與管理要用存儲器把採集到的數據存儲起來,建立相應的資料庫,並進行管理和調用。
重點解決復雜結構化、半結構化和非結構化大數據管理與處理技術。
主要解決大數據的可存儲、可表示、可處理、可靠性及有效傳輸等幾個關鍵問題。
開發可靠的分布式文件系統(DFS)、能效優化的存儲、計算融入存儲、大數據的去冗餘及高效低成本的大數據存儲技術;突破分布式非關系型大數據管理與處理技術,異構數據的數據融合技術,數據組織技術,研究大數據建模技術;突破大數據索引技術;突破大數據移動、備份、復制等技術;開發大數據可視化技術。
開發新型資料庫技術,資料庫分為關系型資料庫、非關系型資料庫以及資料庫緩存系統。
其中,非關系型資料庫主要指的是NoSQL資料庫,分為:鍵值資料庫、列存資料庫、圖存資料庫以及文檔資料庫等類型。
關系型資料庫包含了傳統關系資料庫系統以及NewSQL資料庫。
開發大數據安全技術。
改進數據銷毀、透明加解密、分布式訪問控制、數據審計等技術;突破隱私保護和推理控制、數據真偽識別和取證、數據持有完整性驗證等技術。
四、大數據分析及挖掘技術
大數據分析技術。
改進已有數據挖掘和機器學習技術;開發數據網路挖掘、特異群組挖掘、圖挖掘等新型數據挖掘技術;突破基於對象的數據連接、相似性連接等大數據融合技術;突破用戶興趣分析、網路行為分析、情感語義分析等面向領域的大數據挖掘技術。
數據挖掘就是從大量的、不完全的、有雜訊的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
數據挖掘涉及的技術方法很多,有多種分類法。
根據挖掘任務可分為分類或預測模型發現、數據總結、聚類、關聯規則發現、序列模式發現、依賴關系或依賴模型發現、異常和趨勢發現等等;根據挖掘對象可分為關系資料庫、面向對象資料庫、空間資料庫、時態資料庫、文本數據源、多媒體資料庫、異質資料庫、遺產資料庫以及環球網Web;根據挖掘方法分,可粗分為:機器學習方法、統計方法、神經網路方法和資料庫方法。
機器學習中,可細分為:歸納學習方法(決策樹、規則歸納等)、基於範例學習、遺傳演算法等。
統計方法中,可細分為:回歸分析(多元回歸、自回歸等)、判別分析(貝葉斯判別、費歇爾判別、非參數判別等)、聚類分析(系統聚類、動態聚類等)、探索性分析(主元分析法、相關分析法等)等。
神經網路方法中,可細分為:前向神經網路(BP演算法等)、自組織神經網路(自組織特徵映射、競爭學習等)等。
資料庫方法主要是多維數據分析或OLAP方法,另外還有面向屬性的歸納方法。
從挖掘任務和挖掘方法的角度,著重突破:
1.可視化分析。
數據可視化無論對於普通用戶或是數據分析專家,都是最基本的功能。
數據圖像化可以讓數據自己說話,讓用戶直觀的感受到結果。
2.數據挖掘演算法。
圖像化是將機器語言翻譯給人看,而數據挖掘就是機器的母語。
分割、集群、孤立點分析還有各種各樣五花八門的演算法讓我們精煉數據,挖掘價值。
這些演算法一定要能夠應付大數據的量,同時還具有很高的處理速度。
3.預測性分析。
預測性分析可以讓分析師根據圖像化分析和數據挖掘的結果做出一些前瞻性判斷。
4.語義引擎。
語義引擎需要設計到有足夠的人工智慧以足以從數據中主動地提取信息。
語言處理技術包括機器翻譯、情感分析、輿情分析、智能輸入、問答系統等。
5.數據質量和數據管理。
數據質量與管理是管理的最佳實踐,透過標准化流程和機器對數據進行處理可以確保獲得一個預設質量的分析結果。
六、大數據展現與應用技術
大數據技術能夠將隱藏於海量數據中的信息和知識挖掘出來,為人類的社會經濟活動提供依據,從而提高各個領域的運行效率,大大提高整個社會經濟的集約化程度。
在我國,大數據將重點應用於以下三大領域:商業智能、 *** 決策、公共服務。
例如:商業智能技術, *** 決策技術,電信數據信息處理與挖掘技術,電網數據信息處理與挖掘技術,氣象信息分析技術,環境監測技術,警務雲應用系統(道路監控、視頻監控、網路監控、智能交通、反電信詐騙、指揮調度等公安信息系統),大規模基因序列分析比對技術,Web信息挖掘技術,多媒體數據並行化處理技術,影視製作渲染技術,其他各種行業的雲計算和海量數據處理應用技術等。
㈥ 大數據的核心技術有哪些
大數據技術的體系龐大且復雜,基礎的技術包含數據的採集、數據版預處理、分布權式存儲、資料庫、數據倉庫、機器學習、並行計算、可視化等。
1、數據採集與預處理:
Flume NG實時日誌收集系統,支持在日誌系統中定製各類數據發送方,用於收集數據;
Zookeeper是一個分布式的,開放源碼的分布式應用程序協調服務,提供數據同步服務。
2、數據存儲:
Hadoop作為一個開源的框架,專為離線和大規模數據分析而設計,HDFS作為其核心的存儲引擎,已被廣泛用於數據存儲。
HBase,是一個分布式的、面向列的開源資料庫,可以認為是hdfs的封裝,本質是數據存儲、NoSQL資料庫。
3、數據清洗:MapRece作為Hadoop的查詢引擎,用於大規模數據集的並行計算
4、數據查詢分析:
Hive的核心工作就是把SQL語句翻譯成MR程序,可以將結構化的數據映射為一張資料庫表,並提供 HQL(Hive SQL)查詢功能。
Spark 啟用了內存分布數據集,除了能夠提供互動式查詢外,它還可以優化迭代工作負載。
5、數據可視化:對接一些BI平台,將分析得到的數據進行可視化,用於指導決策服務。
㈦ 大數據在軍事領域有哪些應用
在軍事上,用小數據時代的理念和技術,很難與大數據時代的思維和技能相對抗。面對大數據時代的軍事機遇和挑戰,要麼主動進擊,要麼被動跟進,難以置之度 外。其間的取捨與成敗,首先有賴於思維變革,其要求全體軍事人員尤其是指揮員,更加具備基於體系作戰的系統思維、基於數據模型的精確思維及基於對戰爭進行 科學預設的前瞻思維。
大數據創新了軍事管理方法,且這種創新是全方位的--除了可以提高包含閱兵在內的軍事訓練水平,還可以:
1.提高軍事管理水平
管理大師戴明與德魯克都曾提出:「不會量化就無法管理」。數據的根本價值之一,就是可作為管理依據。大數據應用的特點是強調分析與某事物相關的總體數據, 而不是抽取少量的數據樣本;大數據關注事物的混雜性,而不追求事物的精確性;大數據注重事物的相關關系,而不探求其間的因果關系。
將大數據應用於軍事領域,意味著軍事管理將更加剛性,基本不受人為因素的影響,且更加自動化。所以說,大數據強軍的內涵,本質上是軍事管理科學化程度的提 高,即與小數據比起來,由於有了大數據,軍事管理活動量化程度更高了,工具更加先進了,邊界更加寬廣了,管理質量、效率會隨之更高。
2.豐富軍事科研方法
通常人們研究戰爭機理、找尋戰爭規律的方法有三種,又稱為三大範式:實驗科學範式,在戰前通過反復的實兵對抗演習來論證和改進作戰方案;理論科學範式,採用數學公式描述交戰的過程,如經典的蘭徹斯特方程;計算科學範式,基於計算機開發出模擬系統來模擬不同作戰單元之間的交戰場景。
但是,上述研究範式只能使人們感知交戰的過程和結果,並未有效提高對海量數據的管理、存儲和分析能力。
以大數據為核心技術的數據挖掘模式被稱為第四戰爭研究範式。人 們可以有效利用大數據,探尋信息化戰爭的內在規律,而不是被淹沒在海量數據中一籌莫展。大數據研究範式由軟體處理各種感測器或模擬實驗產生的大量數據,將 得到的信息或知識存儲在計算機中,基於數據而非已有規則編寫程序,再利用包括量子計算機在內的各種高性能計算機對海量信息進行挖掘,由計算機智能化尋找隱 藏在數據中的關聯,從而發現未知規律,捕獲有價值的情報信息。
例如,在第一次海灣戰爭前,美軍就利用改進的「兵棋」,對戰爭進程、結果及傷亡人數進行了推演,推演結果與戰爭的實際結果基本一致。而在伊拉克戰爭前,美 軍利用計算機兵棋系統進行演習,推演「打擊伊拉克」作戰預案。隨後美軍現實中進攻伊拉克並取得勝利的行動,也和兵棋推演的結果幾乎完全一致。
作戰模擬早已經從人工模式轉變為計算機模式,再加上大數據,戰前的模擬推演,從武器使用、戰爭打法到指揮手段,都可以清晰地顯現,是非常好的戰時決策依據。一旦發現作戰計劃有問題,可以及時調整,以確保實戰傷亡最小並取得勝利。
3.加速型武器裝備面世
大數據在武器裝備上的廣泛應用,意味著武器裝備建設將從重視研發信息系統到重視數據處理與應用的轉變,從注重信息系統的互聯互通到注重信息系統的透明性互 操作的轉變。當前武器裝備的信息化程度越來越高,裝備體系內各個節點之間的信息共享也越來越方便、可靠,但由此也帶來了一些突出問題,如原始信息規模過 大、價值不夠高、直接提取所需信息的難度增加等,從而使得武器裝備體系在信息獲取效率上大打折扣。在這種背景下產生的大數據為解決上述問題提供了有效方 法。
需要說明的是:大數據應用不僅意味著人們要以創新方式使用海量數據,還意味著人們要採用人工智慧技術來處理自然文本和進行知識表述,以替代目前依賴專家和技術人員昂貴而又耗時的信息處理方式。
大數據與人工智慧是一而二、二而一的關系。受益於大數據技術,武器裝備體系將從戰場上的信息使用者升級為高度智能化和自主化的系統。其具體流程為:經 過智能處理後的高價值信息進入戰場網路鏈路後,與戰場網路融為一體的武器裝備體系能實時自動感知面臨的有關威脅,各裝備節點自動感知包括我情和敵情在內的 戰場態勢,在作戰人員的有限參與下高度自主地分解作戰任務,確定作戰目標和行動方案,經過適當的審批流程後執行相關的作戰行動。
在這方面走在前列的仍然是美軍。美軍大數據研究的第一個重要目標是通過大數據創建真正能自主決策、自主行動的無人系統。這一點已在無人機領域實現。美軍希 望無人機可以完全擺脫人的控制而實現自主行動。美軍2013年試飛的X-47B就是這一系統的代表,它已經可以在完全無人干預的情況下自動在航母上完成起 降並執行作戰任務。
4.提升情報分析能力
19世紀初,軍事戰略家克勞塞維茨以人的認知局限為由,提出了「戰爭迷霧」概念。顯然,「戰爭迷霧」即「數據迷霧」。信息戰首先得消除「戰爭迷霧」。信息 戰是體系對體系的戰爭,而這一體系是一個超級復雜的巨大系統,僅諸軍兵種龐雜的武器裝備和作戰環境數據,就足以大到使普通的信息處理能力捉襟見肘;而敵我 對抗的復雜化,更是讓數據量呈爆炸式增長,從而帶來比傳統戰爭更多的「數據迷霧」。可以說,信息化戰爭的機制深藏在「數據迷霧」中。
消除「戰爭迷霧」會提高指揮員的情報分析與軍情預測能力。過去,由於可以掌握的數據不足,戰爭的不確定性很高,指揮員很容易陷在「戰爭迷霧」之中。而大數據最重要的價值之一是預測,即把數據演算法運用到海量的數據上來預測事情發生的可能性。
具體而言,未來完全可能依託大數據分析處理技術和建構模型,通過數據挖掘模式,從海量數據中挖掘出有價值的信息,及時准確掌握敵方的戰略企圖、作戰規律和 兵力配置,真正做到「知己知彼」,使戰場變得清晰透明,從而撥開「戰爭迷霧」,達成運籌於帷幄之中、決勝於千里之外的作戰目的。
對此趨勢,很多國家及其軍隊都極為看重。例如,美軍明確提出,要通過大數據將其情報分析能力提高100倍以上。如果這一目標實現,那麼在這一領域其他國家 與美軍的差距,將難以用簡單的「代差」來描述。美軍通過多年的發展,已擁有全球最先進的情報偵察系統,因為對海量情報數據的分析,曾是美軍情報偵察能力的 瓶頸,而大數據正好能夠幫助美軍突破這一瓶頸。
大數據時代,往往不要求准確知道每一個精確的細節,只需了解事物的概略全貌即可。通過相關數據信息的大量積累,而不是對某個具體數據的精確分析,大數據技 術可以為我們提煉出事物運行的規律,並判斷其發展趨勢。例如,2011年美軍擊斃本·拉登的「海神之矛」行動,就有賴上千名數據分析員長達10年數據積累 的支撐。換言之,是大數據抓住了本·拉登。
5.引領指揮決策方式變革
管理的核心是決策。大數據帶來的重要變革之一,是決策的思維、模式和方法的變革。建立在小數據時代基於經驗的決策,將讓位於大數據時代基於全樣本數據的決策。
決策是進行數據分析、行動方案設計並最終選擇行動方案的過程。軍事決策建立在對敵情的正確分析預測之上,其目的是通過合理分配兵力兵器,優選打擊目標,設計完成任務的最佳行動方法與步驟。
以往的戰爭,做出作戰決策時缺少足夠數據支持,甚至數據本身的真實性、准確性也難以保證。目前信息化條件下的戰爭,各種條件都變成了數據,這就要求指揮人 員必須掌握分析海量數據的工具和能力。以往,指揮人員更多的是依靠經驗進行相對概略或粗放式決策。大數據的出現必將要求指揮人員以全新的數據思維來進行指 揮決策。這種決策將有幾個特點:
一是准確。只要提供的數據量足夠龐大真實,通過數據挖掘模式,就可以較為准確地把握敵方指揮員的思維規律,預測對手的作戰行動,掌控戰場態勢的發展變化等。
二是迅速。大數據相關技術所提供的高速計算能力有助於指揮員更加迅速地設計行動方案。
三是自動化。針對特定的作戰對手和作戰環境,大數據系統可以自動對己方成千上萬、功能互補的作戰單 元或平台進行模塊化編組,從而實現整體作戰能力的最優化;面對眾多性質不同、防護力不同且威脅度各異的打擊目標,大數據系統可以自動對有限數量、有限強度 和有限精度的火力進行分配,以收獲最大作戰效益。
在大數據時代的戰爭中,軍事專家、技術專家的光芒會因為統計學家、數據分析家的參與而變暗,因為後者不受舊觀念的影響,能夠聆聽數據發出的「聲音」。
總之,基於數據的定量決策將和基於經驗的定性決策同樣重要,基於經驗的決策將很大程度上讓位給全樣本決策,基於大數據的決策手段將從輔助決策的次要地位上升到支撐決策的重要地位。
對此,美軍的認識是最到位的。美軍發布的《2013-2017年國防部科學技術投資優先項目》就將「從數據到決策」項目排在了第一位,凸顯了大數據對其指揮決策方式的巨大影響。
6.優化作戰指揮流程
網路日益普及的情況下,信息的流通與共享已不是難題,人們開始關注對信息的認識,及將信息轉化為知識的能力。
與之相適應,軍事信息技術也從關注「T」(Technology)的階段,向關注「I」(Information)的階段轉變;從建設指揮自動化系統 (C4ISR),即指揮、控制、通信、計算機、情報及監視與偵察等信息系統,整體管理「戰場信息的獲取、傳遞、處理和分發」的全信息流程;發展至重視大數 據處理應用,綜合集成數據採集、處理平台和分析系統,統一優化管理「戰場數據採集、傳遞、分析和應用」的全數據流程。即通過對海量數據進行開發處理,大幅 度提高從中提取高價值情報的能力,從而實現對戰場綜合態勢的實時感知、同步認知,進一步壓縮「包以德循環」(OODA Loop),即觀察-調整-決策-行動的指揮周期,縮短「知謀定行」時間,提高快速反應能力。
隨著數據挖掘技術、大規模並行演算法及人工智慧技術的不斷完善並廣泛應用在軍事上,情報、決策與作戰一體化將取得快速進展。在武器裝備上,將特別注重各作戰 平台的系統融合和無縫鏈接,以保證戰場信息的實時快速流轉,縮短從「感測器到射手」的時間差,實現「發現即摧毀」的作戰目標。
比如近幾年迅速發展的無人機作戰平台,其本質就是一個智能系統。其可以成建制地對實時捕獲的重要目標進行「發現即摧毀」式的精確打擊,還能通過融合情報的 前端和後端,使數據流程與作戰流程無縫鏈接並相互驅動,構建全方位遂行聯合作戰的「偵打一體」體系,從而實現了體系化的「從感測器到射手」的重大突破。
7.推動戰爭形態的演變
大數據可以改變未來的戰爭形態。美軍一直追求從感測器到平台的實時打擊能力,追求零傷亡。
由大數據支撐的擁有自主能力的無人作戰平台,將使得這些追求成為可能。例如,目前全世界最先進的無人偵察機「全球鷹」,能連續監視運動目標,准確識別地面 的各種飛機、導彈和車輛的類型,甚至能清晰分辨出汽車輪胎的類型。現今,美空軍的無人機數量已經超過了有人駕駛的飛機,或許不久的將來,美軍將向以自主無 人系統為主的,對網路依賴度逐漸降低的「數據中心戰」邁進。
無人機能否做到實時地對圖像進行傳輸非常關鍵。
目前,美國正使用新一代極高頻的通訊衛星作為大數據平台的支撐。未來,無人機甚至有可能擺脫人的控制實現完全的自主行動。美軍試驗型無人戰斗機X-47B就是這一趨勢的代表,它已經可以在完全無人干預的情況下,自動在航母上完成起降並執行作戰任務。
總之,基於大數據的實時、無人化作戰,將徹底改變人類幾千年來以有生力量為主的戰爭形態。
8.引導軍事組織形式變革
大數據即大融合,它有望打破軍種之間的壁壘,解決軍隊跨軍種、跨部門協作的問題,真正實現一體化作戰。
就組織形態而言,扁平結構、層次簡捷、高度集成、體系融合應該更符合大數據時代的要求。軍事方面的相關趨勢有:
(1)網狀化。軍隊的指揮體系逐步發展為「指揮網」,原先的「樹狀結構」變為 「網狀結構」。一個師的指揮系統一旦被打垮,師以下各級可通過「網」與上級或其他作戰單元聯系。這就改變了傳統軍事指揮體系由「樹干、樹枝、樹葉」編成的 組織形態,避免了機械化戰爭時期「打斷一枝、癱瘓一片」的指揮弊端,有效提高了局部戰爭中的指揮效能。
(2)小型化。發達國家的陸軍多由軍、師、團、營體制向軍、旅、營制轉變,使作戰集團更加輕便靈活,機動性更強。 根據部隊的不同功能優化組合,基本作戰單位不需要加強補充就能實施多種作戰,從而全面提高應對多種安全威脅,完成多樣化軍事任務的能力。將營作為基本戰術 「模塊」,將旅作為基本合成單位,以搭積木方式進行編組,戰時根據需要臨時編組,看迅速生成擔負不同作戰任務的部隊。
世界各主要國家都非常重視軍隊組織形態變革,並致力於發展新興軍兵種,及時設計和建設新型部隊。
2009年,美國國防部宣布組建網路戰司令部。2013年3月,美國網路戰司令部司令亞力山大宣布,美國將增加40支網路戰部隊。美國、俄羅斯等國都在積極籌劃或正在建設能在太空進行作戰的「天軍」部隊、「機器人」部隊。
隨著新興軍兵種的建立,軍隊的組織形態將出現新面貌,未來戰爭的觸角不斷延伸,網路、電磁頻譜領域的爭奪方興未艾,太空不再是寂寞世界,天戰也不再遙遠。
(3)一體化。軍隊信息化必然要求一體化,信息化程度越高,一體化特徵越明顯。適應新形勢下強軍目標的要求,我軍必須對戰鬥力要素進行一體化整合,推進武裝力量一體化、軍隊編成一體化、指揮控制一體化、作戰要素一體化,提高整體效益。
9.大數據將使體系作戰能力大幅提升
從作戰手段角度看,大數據及其支撐的新型武器裝備的應用,將豐富軍隊的作戰體系;從作戰效能角度看,大數據下的作戰行動循環(包以德循環)所耗時間將大為縮短,更符合「未來戰爭不是大吃小,而是快吃慢」的制勝規律。相關變革的結果,將是軍隊體系作戰能力大幅提升。
10.提升軍隊的信息化建設水平
大數據給了各國軍隊(尤其是像我軍這樣的信息化發展水平參差不齊的軍隊)一個契機,可以牽引、拉動自身的信息化建設向更高層次發展,同時拉齊整體水平,因為大數據意味著「整體」。
具體來說,應以提高決策速度、反應速度和聯合作戰能力為目標,以數據為中心,以搜索分析處理數據為中樞架構,自上而下建設軍事「數據網路」;加快組建雲計 算中心,把對大數據分析處理作為軍事信息化建設的重中之重,努力建構精確分析處理大數據的硬體系統、軟體模型,實現大數據「從數據轉化為決策」的智能化和 瞬時化。
同時,也要抓好末端的單兵及單件武器裝備的數據採集、存儲設備設計,從而為海量數據的挖掘和整合奠定基