GIS 的應用領域
地理信息系統在最近的30多年內取得了驚人的發展,廣泛應用於資源調查、環境評估、災害預測、國土管理、城市規劃、郵電通訊、交通運輸、軍事公安、水利電力、公共設施管理、農林牧業、統計、商業金融等幾乎所有領域。 (加測繪、應急、石油石化等國民經濟各個領域。)
以下地理信息系統的應用領域分別回答了在各自領域內的作用
◆ 資源管理 (Resource Management)
主要應用於農業和林業領域,解決農業和林業領域各種資源(如土地、森林、草場)分布、分級、統計、制圖等問題。主要回答「定位」和「模式」兩類問題。
◆ 資源配置 (Resource Configuration)
在城市中各種公用設施、救災減災中物資的分配、全國范圍內能源保障、糧食供應等到機構的在各地的配置等都是資源配置問題。GIS在這類應用中的目標是保證資源的最合理配置和發揮最大效益。
◆ 城市規劃和管理 (Urban Planning and Management)
空間規劃是GIS的一個重要應用領域,城市規劃和管理是其中的主要內容。例如,在大規模城市基礎設施建設中如何保證綠地的比例和合理分布、如何保證學校、公共設施、運動場所、服務設施等能夠有最大的服務面(城市資源配置問題)等。
◆ 土地信息系統和地籍管理 (Land Information System and Cadastral Applicaiton)
土地和地籍管理涉及土地使用性質變化、地塊輪廓變化、地籍權屬關系變化等許多內容,藉助GIS技術可以高效、高質量地完成這些工作。
◆ 生態、環境管理與模擬 (Environmental Management and Modeling)
區域生態規劃、環境現狀評價、環境影響評價、污染物削減分配的決策支持、環境與區域可持續發展的決策支持、環保設施的管理、環境規劃等。
◆ 應急響應 (Emergency Response)
解決在發生洪水、戰爭、核事故等重大自然或人為災害時,如何安排最佳的人員撤離路線、並配備相應的運輸和保障設施的問題。
◆ 地學研究與應用 (Application in GeoScience)
地形分析、流域分析、土地利用研究、經濟地理研究、空間決策支持、空間統計分析、制圖等都可以藉助地理信息系統工具完成。
◆ 商業與市場 (Business and Marketing)
商業設施的建立充分考慮其市場潛力。例如大型商場的建立如果不考慮其他商場的分布、待建區周圍居民區的分布和人數,建成之後就可能無法達到預期的市場和服務面。有時甚至商場銷售的品種和市場定位都必須與待建區的人口結構(年 齡構成、性別構成、文化水平)、消費水平等結合起來考慮。地理信息系統的空間分析和資料庫功能可以解決這些問題。房地產開發和銷售過程中也可以利用GIS功能進行決策和分析。
◆ 基礎設施管理 (Facilities Management)
城市的地上地下基礎設施(電信、自來水、道路交通、天然氣管線、排污設施、 電力設施等)廣泛分布於城市的各個角落、且這些設施明顯具有地理參照特徵的。它們的管理、統計、匯總都可以藉助GIS完成,而且可以大大提高工作效率。
◆ 選址分析 (Site Selecting Analysis)
根據區域地理環境的特點,綜合考慮資源配置、市場潛力、交通條件、地形特徵、環境影響等因素,在區域范圍內選擇最佳位置,是GIS的一個典型應用領域,充分體現了GIS的空間分析功能。
◆ 網路分析 (Network System Analysis)
建立交通網路、地下管線網路等的計算機模型,研究交通流量、進行交通規則、處理地下管線突發事件(爆管、斷路)等應急處理。 警務和醫療救護的路徑優選、車輛導航等也是GIS網路分析應用的實例。
◆ 可視化應用 (Visualization Application)
以數字地形模型為基礎,建立城市、區域、或大型建築工程、著名風景名勝區的三維可視化模型,實現多角度瀏覽,可廣泛應用於宣傳、城市和區域規劃、大型工程管理和模擬、旅遊等領域。
◆ 分布式地理信息應用 (Distributed Geographic Information Application)
隨著網路和Internet技術的發展,運行於Intranet或Internet環境下的地理信息系統應用類型,其目標是實現地理信息的分布式存儲和信息共享,以及遠程空間導航等。
㈡ 站在「大數據」的台風口,石油行業能起飛嗎三分鍾帶你全面了解
加大油氣勘探開發力度、保障國家能源安全是當前面臨的迫切任務。但隨著優質資源的不斷開發,剩餘資源開采難度越來越大,成本越來越高,迫切需要創新技術提升油氣勘探開發效率和效益。在大數據、人工智慧( artificial intelligence,AI)、5G、雲計算、物聯網等技術推動下,油氣田的智能化水平將會越來越高,這既是油田降本提質增效的有效途徑,也是油氣技術發展規律的必然趨勢。
1、大數據技術定義
2012年興起的「大數據」潮流,讓「Big Data」這個IT圈子裡的名詞一下風靡了各個行業。雖然大數據的重要性得到了大家的一致認同,但是對大數據的理解卻眾說紛紜。大數據是一個抽象的概念,除去數據量龐大這一特徵,大數據還有一些其他的特徵,這些特徵決定了大數據與「海量數據」和「非常大的數據」這些概念之間的不同。
高德納分析員Doug Laney曾於2001年在一次演講中指出,數據增長有3個方向的挑戰:數量(volume),即數據多少;速度(velocity),即資料輸入、輸出的速度;種類(variety),即多樣性,這3方面的特徵即大數據最先提出的3V模型。2011年,在國際數據公司(IDC)發布的報告中,大數據被定義為:「大數據技術描述了新一代的技術和架構體系,通過高速採集、發現或分析,提取各種各樣的大量數據的經濟價值。」大數據的特點可以總結為4個V,即volume(體量浩大)、variety(模態繁多)、velocity(生成快速)和value(價值巨大但密度很低)。這種4V定義得到了更廣泛的認同,指出了大數據最為核心的問題,就是如何從規模巨大、種類繁多、生成快速的數據集中挖掘價值。
2、大數據技術的發展
大數據是人工智慧的血液,當前大數據、雲計算、人工智慧以及區塊鏈技術之間的關系密不可分,也被稱作數據智能。比如,先進的工業互聯網,其中既有區塊鏈技術也有大數據技術,還有雲計算技術,三者合成一體,又衍生出了人工智慧和物聯網的概念。
在大數據基礎上的人工智慧,目前已進入數據智能的深度學習時代,其快速發展引起了 社會 和產業的顛覆性變化。從大數據和人工智慧技術全行業的發展來看,目前美國仍處於領先地位,中國緊隨其後,且具有趕超趨勢。中國在人工智慧相關的論文發表總數和高引論文數量實現對美國的超越,但在人工智慧理論發展和技術方向的引領方面美國還占據支配地位。
3、大數據技術流程
大數據處理的關鍵技術流程主要包括:數據採集、數據預處理(數據清理、數據集成、數據變換等)、海量數據存儲、數據分析及挖掘、數據的呈現與應用(數據可視化、數據安全與隱私等)。
4、大數據的核心演算法
大數據的核心演算法可以分為監督學習(有標簽)和無監督學習(無標簽)兩大類,其中:
監督學習分為回歸和分類:即給定一個樣本特徵,希望預測其對應的屬性值,如果是離散的,那麼這就是一個分類問題,反之,如果是連續的實數,這就是一個回歸問題。無論是分類還是回歸,都是想建立一個預測模型,給定一個輸入,可以得到一個輸出。不同的只是在分類問題中,是離散的;而在回歸問題中是連續的。
無監督學習分為聚類和降維:即如果給定一組樣本特徵,我們沒有對應的屬性值,而是想發掘這組樣本在維空間的分布,比如分析哪些樣本靠的更近,哪些樣本之間離得很遠,這就是屬於聚類問題。如果我們想用維數更低的子空間來表示原來高維的特徵空間,那麼這就是降維問題。聚類也是分析樣本的屬性,事先不知道樣本的屬性范圍,只能憑借樣本在特徵空間的分布來分析樣本的屬性。這種問題一般更復雜。而常用的演算法包括 k-means (K-均值),GMM(高斯混合模型)等。
5、大數據在油氣勘探開發領域的應用
目前大數據技術在地質分析、測井解釋、地震解釋、甜點預測、地質建模、油藏模擬、鑽井、壓裂、採油、產能預測等方面均開展了大量 探索 性研究,收到了良好的效果。但是目前,大數據與油氣行業相關領域的融合還處於起步階段,面臨來自數據、演算法和地下未知因素的諸多挑戰。未來在大數據、人工智慧、5G、雲計算、物聯網等技術推動下,油氣田的智能化水平將會快速發展,這既是油氣技術發展規律的必然趨勢,也是油田降本提質增效的有效途徑。在發展的過程中,智能油氣田建設需要油氣勘探開發與大數據、人工智慧、雲計算以及區塊鏈等技術的深度融合,進而催生一批油氣田領域的顛覆性技術,解決油氣勘探開發的技術需求,提升油氣田勘探開發的經濟和 社會 效益。
( 下期將向您詳細解讀大數據在油氣行業的具體應用 )。
註:本文部分參考資料來源如下:
李陽,廉培慶,薛兆傑,等.大數據及人工智慧在油氣田開發中的應用現狀及展望[J].中國石油大學學報(自然科學版),2020,44(4):1-11
Gantz J,Reinsel D.Extracting Value from Chaos. IDC iView Report,2011
Team O R. Big Data Now:Current Perspectives from O』Reilly Radar.Sebastopol:O』Reilly Media,2014
Grobelnik M. Big data tutorial. http://videolectures.net/eswc2015grobelnik big data/,2012
Walters, R. J., Zoback, M. D., Baker, J. W. 2015. Characterizing and Responding to Seismic Risk Associated With Earthquakes Potentially Triggered by Fluid Disposal and Hydraulic Fracturing. Seismol. Res. Lett. 86 (4): 1–9. https:// doi.org/10.1785/0220150048.
周松蘭.中美歐日韓人工智慧技術差距測度與比較研究[J].華南理工大學學報 ( 社會 科學版),2020,22(2):10-22.
HINTON G E,OSINDERO S,TEH Y W.A fast learning algorithm for deep belief nets[J].Neural Computation,2016,18: 1527-1554.
LECUN Y,BOTTOU L,BENGIO Y,et al.Gradientbased learning applied to document recognition[J].Proceedings of IEEE,1988,86( 11) : 2278-2324.
BENGIO Y, SIMARD P,FRASCONI P.Learning longterm dependencies with gradient descent is difficult[J].IEEE Transactions on Neural Networks,1994,5(2) :157-166
㈢ 大數據的應用
大數據的應用有:構建知識圖譜,追蹤傳播路徑;大數據構建疫情發展模型;大數據挖掘疫情輿論等。
1. 構建知識圖譜,追蹤傳播路徑
大數據技術可以梳理感染者的移動軌跡,追蹤人群接觸史,建立知識圖譜,為精準定位疫情傳播路徑,防控疫情擴散等方面提供重要信息。
追蹤移動軌跡、建立知識圖譜,已經是大數據領域比較成熟的技術。位置數據方面,除了航空、鐵路、公路、輪渡等交通部門統計的出行數據外,在用戶授權的前提下,電信運營商可以基於手機信令等包含地理位置和時間戳信息的數據有效定位用戶的手機位置。
2. 大數據構建疫情發展模型
疫情期間,大眾密切關注疫情的傳播態勢。疫情還會傳播多久?感染者還會大幅增加嗎?哪裡感染風險高?何時能夠進入安全期?要解決這些問題,需要找出關鍵影響因素、分析疫情傳播特徵、搭建疫情發展模型,這其中大數據能夠發揮關鍵作用。
3. 大數據挖掘疫情輿論
疫情面前,疏解民眾的焦慮心理至關重要。由於信息獲取方式、生活方式的改變,搜索大數據已成為疫情之下了解民意的重要載體,每一條信息背後的點擊、每一次搜索,都精準揭示了民眾的需求與問題。
㈣ 基於Ontology驅動的廣東省地質數據中心設計
李丹秋
(廣東省國土資源檔案館)
摘要 本文結合廣東省地質資料管理和應用的實際情況,在已有地質資料空間資料庫和非空間資料庫的基礎上,引入Ontology技術以解決空間資料庫語義沖突問題,擴展和深化已有地質資料查詢的結果,在原有「一張圖」數據中心架構的基礎上重新設計了廣東省地質數據中心。
關鍵詞 Ontology 地質數據中心 構建 模式 廣東省
地質資料是地質工作形成的重要基礎信息資源,具有可被重復開發利用、能夠長期提供服務的重要功能(趙銘,2012)。自2010年國土資源部制定《推進地質資料信息服務集群化產業化工作方案》(國土資發〔2010〕113號)以來,廣東省認真落實地質資料信息服務集群化產業化工作,由廣東省國土資源檔案館承擔建設,目前已初步構建省級地質資料數據集群與管理服務平台和網路服務體系,對廣東省地質資料信息服務集群化產業化工作起到了很好的推動作用。然而現有數據中心的基本架構體系中採用基於數據驅動的數據交互方式,此種交互方式會產生諸如語義沖突、數據挖掘程度低等問題。為解決這些問題,我們通過依託Ontology在語義集成中的優勢,提出了基於Ontology驅動的廣東省地質數據中心設計。
1 Ontology技術概述
1.1 基本概念
Ontology最初是一個哲學概念,是客觀存在的一個系統的解釋或說明,關心的是客觀現實的抽象本質,即「本體」(鄧鴻志,2002)。本體(Ontology)通過建立概念體系,定義概念的屬性、相互約束和關系的方式,實現領域知識的概念化共享(Guarino,1997b)。本體概念應包括四方面:保持獨立性、定義的明確性、計算機可讀性和具有共享性。經過近20年的發展,本體已經為知識轉換、共享和數據集成等領域提供方法,被廣泛用於解決數據互操作能力問題。
地質本體的構建與引入為多源地質數據集成、地質知識的轉化,以及地質數據的互操作性等提供了技術基礎,並在語義層上解決地質異構信息的集成和互操作,從而促進並實現地質相關知識共享、交互和推理(Ma et al.,2012)。特別是本體能夠為數字基礎設施提供語義匹配支持、解決分布式服務組配等問題(Gurnis et al.,2011),形成了地球科學中若乾的本體應用。
1.2 在地質信息領域中本體相關應用
目前,地質本體主要用於地質圖、知識集成及共享。例如,GEON(是2002年由美國自然科學基金委員會信息技術研究項目(NSF Information Technology Research(ITR)program)資助的一個科研項目)工程中的地質本體主要用於地質圖中異構概念模式的協調和異構地質圖的組配(Lin et al.,2008);基於SKOS建立的GTS多語言詞典,可以解決在線地質圖之間的多語言障礙(Ma et al.,2012);通過建立基於詞表的地質圖檢索服務,AuScope克服了在地球科學術語中的語義和語法上的不同(Woodcock et al.,2010);Silva等人提出了應用本體實現地質影像的知識標記和解析,如地層形態和沉積結構、岩石視覺特徵等(Silva et al.,2004)。此外,地質本體被用於解決地質建模中地質語義異構、解析及構建地質知識模型等問題(侯衛生等,2009)。
總體來說,本體大致有兩個不同層次的應用:底層應用與頂層應用。底層應用主要包括數據集成與互操作、數據交換兩個方面,即從語義上實現異構數據源重用、集成及互操作,並對輸入和輸出的異構數據源進行校準;頂層應用主要包括服務和知識的集成、共享及互操作等方面。頂層應用則以語義的方式集成各類服務,以獲得有效工作流,實現知識的形式化、形式化知識推理及跨領域知識共享方式。
2 廣東省地質數據現狀分析
廣東省國土資源檔案館已完成館藏及廳礦政管理各類地質資料成果等數據資源的數據格式、數據完備程度等情況的分析整理,並根據地質資料數據集群與管理服務平台建設的要求,制定了地質資料數據集群與管理服務平台的資料庫規范,做到統一數學基礎、統一數據格式、統一數據分類的要求,提取各類數據的核心圖層,建立各類空間資料庫。初步建立起廣東省國土資源「地質資料數據集群與管理服務平台」的基礎核心數據體系。
目前,廣東省國土資源檔案館所管理的資料庫包括測繪、地質、礦產等多種空間和非空間資料庫,具體見表1。
表1 廣東省國土資源檔案集群服務平台資料庫列表
由此可見,目前省級檔案館在各類地質資料庫中已積累、管理了大量地質數據,種類繁多、類型和結構也存在多樣化,並且在相關業務的處理過程中,又會產生新的衍生數據。如何更好地挖掘地質知識以便更好地為地質服務已成為當務之急。
3 廣東省地質數據中心設計
3.1 架構設計
現有國土「一張圖」的基本架構體系中GIS空間數據引擎與基礎資料庫之間的數據交互是數據驅動的,由於不同資料庫的多源異構的特徵,這種基於數據驅動的數據交互方式會產生諸如語義沖突、數據挖掘程度低等問題。故此,我們通過依託Ontology在語義集成中的優勢,構建了基於Ontology驅動的廣東省地質數據中心設計模式(圖1)。
圖1 廣東省地質數據中心設計
該數據中心包括以下幾個部分:基礎數據層、空間數據交互層、地質大數據處理分析層、數據管理基礎平台、數字基礎設施支撐體系和標准規范及匯交更新機制。數字基礎設施支撐體系是整個數據中心的硬體基礎,包括網路設施、伺服器、存儲設施等。基礎數據層是指廣東省國土資源檔案館所管理的各類數據。空間數據交互層主要為空間數據的交互查詢、更新提供功能,它包括基於數據驅動的交互、GIS空間數據引擎、基於Ontology驅動的數據交互。地質大數據處理分析層是基於Ontology技術的一個地質知識挖掘和服務的中間層,是從結構化的地質資料庫中直接提取各類地質概念,建立相應的概念間邏輯關系與語義關系,為多源地質數據語義提取和數據挖掘提供服務。數據管理基礎平台為外在的數據錄入、管理、分析等交互界面和處理功能,是整個數據中心的外在表現。
標准規范及匯交更新機制是指各類地質數據匯交、更新過程中所必須依據的標准和規范,是整個數據中心運轉的制度保障。在各個平台的使用過程以及各部門的業務流轉過程中,既需要從檔案館地質資料集群平台提取地質數據,同時會產生新的地質數據需要匯交到地質資料集群平台,並更新地質資料集群平台。在這樣一個過程中,數據匯交、更新過程的標准和規范是必要的。
數據中心的底層是廣東省國土資源檔案館管理的基礎資料庫,在資料庫與空間數據引擎之間通過兩種途徑來實現數據交互:一是傳統的基於數據驅動的數據交互,這類交互通過SQL語句或GSQL語句實現對空間和屬性數據的獲取、更新管理;二是通過Ontology來實現數據的查詢,利用Ontology構建工具,基礎資料庫中的每一個資料庫建立一個相應的Ontology,理順資料庫中各實體及相互之間的語義關系、以及所涉及的概念體系,從而為深度數據查詢提供基礎。兩者通過GIS空間數據引擎共同構成了數據基礎管理平台與基礎資料庫之間的溝通橋梁。
該技術架構的設計注重地質數據語義集成與分析,並且可以在不改變業務應用的前提下實現。其中地質本體的構建原則採用侯衛生等人(2013)提出的基於地質空間資料庫的OWL本體自動構建方法,可實現一次構建,隨時更新,永久保存的特性。
3.2 架構優勢
基於Ontology驅動的數據交互和傳統的基於數據驅動的數據交互相比具有明顯的優勢。基於Ontology驅動的數據交互優勢主要包括兩點:
一是解決語義沖突產生的問題,使查詢結果更精確。基礎資料庫包括空間資料庫、非空間資料庫,它們來源廣泛、結構各異、尺度不同、精度不一,對同一地質現象在不同資料庫中的描述肯定不盡相同。如小比例尺空間資料庫中對某區域岩性統一描述為「砂岩」,而大比例尺空間資料庫中會細分為「含礫砂岩」、「含砂礫岩」、「泥質砂岩」、「砂質泥岩」、「含泥砂岩」等岩性描述。如果忽略了不同資料庫間語義上的聯系或沖突,單純使用基於資料庫的查詢方法可能得到不準確的查詢結果。而建立了Ontology之後,通過基於Ontology的查詢就可以很好地規避這個問題。
二是建立了資料庫之間的聯系,深化查詢結果。當前各個基礎資料庫之間是相互獨立的,不同資料庫之間的關聯不緊密或者沒有關聯,在進行數據挖掘時很難挖掘出足夠的信息。例如,對某區域的岩性「地質空間資料庫」描述為「砂岩」,而「水文地質資料庫」稱為「砂質岩」,那麼在基於資料庫查詢「砂岩」時,由於沒有查到「砂質岩」的結果,這次查詢就無法得到「水文地質資料庫」中的信息。而Ontology建立了「砂岩」和「砂質岩」兩個語義之間的聯系,那麼這兩個資料庫的數據都能被挖掘出來。
總之,依託結構化數據構建Ontolgy可以從中提取出各類概念及概念間的語義關系,可以更好地為地質知識挖掘服務。
4 小結
本文根據廣東省地質數據管理現狀,提出了基於Ontology驅動的廣東省地質資料集群化平台的數據中心設計模式。與傳統的基於數據驅動的模式相比,該數據中心設計模式可以解決空間數據查詢時的語義沖突以及數據挖掘程度不夠等問題,為今後拓展地質資料的集群化產業化應用領域,適應大數據的發展,以及更好地為地質數據知識挖掘和服務提供了良好的基礎和數據保障。
參考文獻
[1]Guarino,N..Understanding,building and using ontologies[J].International Journal of Human–Computer Studies,1997,46(2~3):293~310.
[2]Gurnis,M.,Flesch,L.,Okaya,D.,et al.EarthScope Cyber infrastructure Subcommittee(ECISC).Preliminary Strategic Plan for EarthScope Cyberinfrastructure[R].2011.
[3]Lin,K.,Bertram,L.GEON:Ontology-Enabled Map Integration.24th Annual ESRI International User Conference,[C].2008.
[4]Ma,X.,Carranza,E.J.M.,Wu,C.,et al.Ontology-aided annotation,visualization,and generalization of geological time-scale information from online geological map services[J].Computers & Geosciences,2012,40(3):107~119.
[5]Silva OP.da,Freitascmds.,Abel M.Interactive visualization of well data for supporting geological reservoir modeling.2004.
[6]Woodcock,R.,Simons,B.,Duclaux,G.,et al.AuScope』s use of standards to deliver earth resource data.Geophysical Research Abstracts 12,EGU2010-1556,EGU General Assembly,2010.
[7]鄧鴻志,等.Ontology研究綜述[J].北京大學學報(自然科學版),2009,38(5):730~738.
[8]侯衛生,劉修國,吳信才,等.面向三維地質建模的領域本體邏輯結構與構建方法[J].地理與地理信息科學,2009,25(1):27~31.
[9]趙銘.地質檔案信息開發利用新趨勢[J].檔案管理.2012(5):87.
㈤ 大數據應用案例有哪些
案例如下:
1、交通大數據暢通出行
交通作為人類行為的重要組成和重要條件之一,對於大數據的感知也是最急迫的。近年來,我國的智能交通已實現了快速發展,許多技術手段都達到了國際領先水平。交通的大數據應用主要在兩個方面,一方面可以利用大數據感測器數據來了解車輛通行密度,合理進行道路規劃包括單行線路規劃。另一方面可以利用大活數據來實現即時信號燈調度,提高已有線路運行能力。
2、教育大數據因材施教
在課堂上,數據不僅可以幫助改善教育教學,在重大教育決策制定和教育改革方面,大數據更有用武之地。利用數據來診斷處在輟學危險期的學生、探索教育開支與學生學習成績提升的關系、探索學生缺課與成績的關系。
3、環保大數據對抗PM2.5
在美國NOAA(國家海洋暨大氣總署)其實早就在使用大數據業務。每天通過衛星、船隻、飛機、浮標、感測器等收集超過35億份觀察數據。收集完畢後,NOAA會匯總大氣數據,海洋數據,以及地質數據,進行直接測定,繪制出復雜的高保真預測模型,將其提供給NWS(國家氣象局)做出氣象預報的參考數據。
大數據特點
1、大容量
例如,IDC最近的報告預測到2020年,世界數據量將擴大50倍.目前,大數據的規模仍然是不斷變化的指標,單一數據集的規模範圍從數十TB到數PB不同.簡單來說,存儲1PB數據需要2萬台配備50GB硬碟的PC.此外,各種意想不到的來源可以產生數據。
2、多樣性
數據多樣性的增加主要是由於網路日誌、社交媒體、網路檢索、手機通話記錄、感測器網路等數據類型。
3、高速
高速描述的是數據創建和移動的速度.在高速網路時代,通過實現軟體性能優化的高速計算機處理器和伺服器,創建實時數據流已成為流行趨勢.企業不僅要知道如何快速創建數據,還要知道如何快速處理、分析和返回用戶,以滿足他們的實時需求。
㈥ 大數據技術
隨著信息技術的發展,新型信息發布方式的不斷涌現,數據正以前所未有的速度在不斷地增長和累積,大數據時代正式到來。2012年被稱為「大數據元年」,因為在這一年「大數據」這個概念引起了人們的空前關注。首先是美國政府公布「大數據研發計劃」,緊接著世界各國以及各大商業公司也對「大數據」給予了極大的關注。美國在「大數據研發計劃」中,與空間數據關系最為密切的是聯邦地質調查局和航空和航天局。
聯邦地質調查局的科學家們合作完成對全面、長期數據的最新綜合,進一步把大數據集和地球科學理論的大構想轉換成科學發現,提高對地球系統科學問題的理解和應對能力,例如物種應對氣候變化、地震復發率、下一代生態指標等。NASA用先進信息系統技術尋求成熟的大數據能力,以支持未來的地球觀測任務,使得地球信息能為NASA氣候中心的體系結構所識別,減少地球科學部的空基和陸基信息系統的風險、成本、規模和開發時間,提高科學數據的可訪問性和實用性。NASA的地球科學數據和信息系統項目已經活躍了15年以上,旨在對地球衛星數據和空中與實地活動的數據進行處理存檔和發布,努力確保科學家和社會公眾可以滿意地訪問從地球到太空的數據,提升應對氣候和環境變化的能力。NASA與Cray公司制定的太空行動協議,允許一個或多個項目圍繞發展和應用低延遲「大數據」系統合作,使用高度集成的非SQL資料庫傳輸數據,來加速建模和分析軟體的運行,以測試混合計算機系統的實用性。此外,各種專用減災衛星、遙感衛星、通信與導航衛星已廣泛應用於地震、海嘯、台風(颶風)、洪災、旱災、地質災害和火災等各種不同類型的災害管理。
在我國,地學大數據的研究也已開始,國土資源部地質信息技術重點實驗室地學大數據高性能計算應用環境搭建成功,已經對外開放。利用搭建的大數據及高性能地理數據計算平台,開展地質大數據綜合處理、分析和應用研究,對於推進地質數據開發應用、提高服務效率具有重要作用。
㈦ 淺析大數據時代的地質資料管理
杜艷玲
(中石油勘探開發研究院資料中心)
摘要 長期以來,文字描述地質資料是記錄地質信息的有效載體。隨著大數據時代的來臨,地質資料海量數據的發現與提取難度加大,地質資料信息化發展面臨著二次開發與知識服務的新挑戰。本文就地質資料管理的現狀、管理中存在的問題進行了分析探討,並就如何做好大數據時代的地質資料管理工作做了有益的探討並提出了4個方面的意見和建議。
關鍵詞 大數據 地質資料 信息化 二次開發
地質資料是地勘單位記錄歷史地質信息的有效載體,是工作得以有效實施的有力保障。隨著社會發展進步及地質勘探技術的成熟,地質資料管理工作任務量越來越大。如何在大數據時代背景下完善地質資料的信息管理,成為所有檔案工作者迫切需要解決的問題。
1 地質資料管理的現狀
1.1 地質資料互相封閉
隨著經濟建設的快速發展,勘探開發專業人員對地質資料的需求量不斷增大,但是由於大部分地質資料屬於內部管理資料,只用於級別較高且承擔著較大科研任務的項目使用,部分單位甚至為獲取自身利益互相封鎖資料,導致地質檔案無法得到有效的利用。
1.2 地質資料的開發利用與資料保密處理不當
《地質資料管理條例》第十四條規定:地質資料館和地質資料保管單位,應當建立地質資料的整理、保管制度,配置保存、防護、安全等必要設施,配備專業技術人員,保障地質資料的完整和安全。第十九條規定:地質資料館和地質資料保管單位應當按照規定管理地質資料,不得非法披露、提供利用保護期內的地質資料或者封鎖公開的地質資料。地質資料是地質工作價值的集中體現,當它實現項目所需的第一價值之後,一般就進入館藏機構進行存儲。但是地質資料還有後續價值,地質資料所承載的信息資源可以多次、長期、反復地開發利用。這樣,一些國家保密礦種,國家規劃礦區的地質資料一方面具有保密性,一方面又有開發利用的需求,這種矛盾顯而易見。既不能一味強調保密,也不能無視《保密法》等相關規定,擅自開發利用,造成泄密。如何處理好利用與保密的關系、如何做到借閱有法可依、借閱有章可循,成為擺在所有檔案工作者面前的一個難題。
1.3 地質資料的二次開發和深度開發效率較低
大量的地質資料源於長期勘探過程中的積累。如何發現已有資料的內部價值,以便延長其使用壽命,是擺在我國地礦工作者面前的緊迫任務,也是一項新的挑戰。但是由於研究經費短缺、過去和現在成藏理論的限制、不同研究者研究角度不同結論不同等問題,使得我國地質資料二次開發利用率很低。據不完全統計,全國保存的非紙質介質地質資料,共有磁碟34.4萬盒,磁帶294.4萬盒,膠片9.1萬片[1]。但是由於有關人員對地質資料二次開發利用的重視程度不夠,經費、人員也沒有相應的落實,從而經驗做法總結不夠,沒有形成對地質資料二次開發、深入開發的良好氛圍。
2 地質資料管理面臨的挑戰
2.1 海量數據的提取面臨新的挑戰
在信息爆炸的今天,數據已經滲透到世界的每一個角落,且數據總量增長迅猛。據預測,未來每18個月,整個世界的數據總量就會翻倍,到2020年,世界的數據總量將會增長44倍[2]。以中石油勘探開發研究院為例,自1991年成立以來,已經累計積累了勘探開發資料71萬件,其中包括探井36384口、生產井19617口井資料,以及研究院的各類檔案92798萬份,館藏檔案133186卷、786071件。面對不斷豐富的館藏資源,如何在海量的數據中快速而准確地檢索到所需的信息,如何將檔案資源轉化為知識資源,傳統的檔案管理模式已經不足以滿足工作需要。大數據時代的來臨增加了地質資料尋找與提取的難度。
2.2 地質資料面臨知識服務的挑戰
大數據時代的資料用戶已經不滿足僅局限於數據或是文件的利用,而是希望能夠獲得數據背後的信息以及信息蘊藏的知識。與傳統檔案館(室)藏資源或者其他應用相比,大數據時代下數字檔案館藏數量具有媒體形式多、數據量大的特點,大數據時代的用戶需求變得更加個性化、多樣化。特別是近年來,隨著國際油價的持續攀升,礦權市場持續升溫,地質資料的開發利用需求旺盛,地質資料管理人員轉變為信息的咨詢者和系統的服務者,這些都給地質資料的服務帶來了挑戰。
3 如何加強地質資料的管理
3.1 加強網路信息化建設
加強建設地質資料網路信息化建設,是提高地質資料利用率的有效途徑。建立網路信息化可以實現聲音、圖像以及文字等多種形式的信息進行統一的處理、存儲,改變了傳統的地質資料信息管理只能著眼於紙張文字的單一表現形式,呈現給地勘人員更加豐富多彩的地質資料編研形式,提供了更加豐富鮮活的地質檔案信息[3]。用微機對檔案進行收集、篩選、加工,使之轉化為微機軟體形式的二次文件信息,從而作為電子文件數據提供利用。把紙質資料數據文件歸檔電子化,充分利用計算機、掃描儀,建立全文資料庫,以便存儲查找和利用,這既是地質工作現實的要求,也是檔案管理的必然取向[4]。
對地質資料進行現代化信息建設可以很好地實現資料的詳細記錄,可以為以後的相關決策提供有力的依據,在很大程度上避免了由於突發性事件或是蓄意破壞而發生的資料丟失現象。對地質資料進行信息化建設可以遠程服務實現對地質資源的共享,在編纂地質文檔資料的時候可以有效地縮短對地質文獻信息及地質文檔編著的時間,更快、更好地提高現代地質資料信息的利用率。
3.2 建立地質資料目錄檢索資料庫
大數據時代提供了海量的數據,如何在最短的時間內最快地檢索到需要的數據,成為擺在所有檔案工作者面前的一大挑戰。地質資料目錄檢索資料庫很好地解決了這一問題。國土資源部出版了《地質資料檔案著錄細則》,對如何著錄地質資料進行了詳細指導。數據檢索系統智能化程度很高,可以根據使用者的需求,輸入任意關鍵詞,例如資料名稱、井名、勘查程度、礦種或是幾個關鍵詞的組合,均可以從資料庫中檢索出有關的地質資料信息,方便快捷地為地勘人員提供服務。
3.3 拓展地質資料開發利用的方式方法
技術水平直接影響服務的效率和質量,大數據為地質資料的開發利用提供了很好的平台。拓展地質資料的開發利用方式要充分利用現代化服務手段,提升現代化服務水平。重視現代地質資料服務系統、技術和標準的開發,力爭在系統交換和傳輸技術、新方法、新手段上下功夫,推進地質資料的整合和共享。同時加快內網外網和電子政務平台的建設,加強行業和部門互動,形成多層次、多部門社會化服務網路系統,實現地質資料的開發利用和信息共享。同樣重要的是,要同步更新離線服務和在線服務方式方法,提升服務效率。離線服務要突出數據加工和介質拷貝服務,在線服務要提供數據檢索和下載服務,配合電子郵件、傳真、電話等形式,為用戶答疑解惑,提供信息服務[5]。
3.4 加強地質資料的二次開發和深度開發
《國務院關於加強地質工作的決定》明確提出將「推進地質資料開發利用」作為新時期地質工作六大任務之一,充分體現了黨中央、國務院對地質資料工作的高度重視,反映了經濟社會發展對地質資料信息的迫切需求。地質資料具有形成成本高、應用范圍廣、可反復利用、經濟社會效益潛力巨大等特點。地質資料的屬性特徵,決定了其直接價值和潛在價值遠遠大於其投資成本,決定了其反復永續利用的潛力。
地質資料的二次開發,絕不僅僅是對現有的地質資料進行第二輪簡單的整理、歸納,而是以最新的找礦理論、技術和方法為指導,以改革創新的精神對原有的地質資料進行有效而又合理的加工、整理、歸納和總結,提煉出具有重要價值的信息資源。根據利用者的需求,組織相關的工作團隊,通過人、財、物的投入,提高地質檔案社會化服務附加值,從而推動地質資料的產業化[5]。
2003年英國地調局運用成本效益分析法和增值法對其經濟效益進行了評估,結果表明:英國地調局在2001年為英國所做的貢獻相當於其年度營業額的850~1525倍。另外,據其他國家測算,地質產品中的地質圖,即使按最小價值計算,其價值也是填圖成本的25倍[1]。新中國成立以來,我國累計投入了大約5000億美元的地勘費,形成了大量的地質資料,通過對豐富的地質資料開發利用,為國民經濟和社會發展作出了重大貢獻。在大數據時代,必須提高地質資料的利用率,加大資料二次開發和深度開發力度,圍繞用戶的需求而不斷地創新服務,提供多方面的優質服務。
4 結語
在大數據時代,地質資料海量數據管理與服務發生深刻的變化,我們要不斷加強專業知識的學習,積極探索新的管理模式和管理方法,以新思維、新技術、新舉措對待地質資料的現代化建設,以便於更好地為地質勘探事業服務。
參考文獻
[1]姚華軍.深入貫徹學習《決定》大力推進地質資料開發利用[J].中國國土資源經濟,2006(11).
[2]鄭軍,尹兆濤.中國石油應對「大數據的策略分析」[J].石油規劃設計,2013,24(6):27~29.
[3]張艷霞.如何做好地質檔案的全面管理工作[J].價值工程,2012(10).
[4]馮演.對做好地質資料檔案管理工作的思考[J].中國城市經濟,2010(11).
[5]馬忠花.青海省地質檔案的開發與利用研究[D].鄭州:鄭州大學,2011.