Ⅰ 如何利用ArcGIS軟體創建地理資料庫
用ArcCatalog的工具創建。1.顯示excel與xy數據:
打開arcmap軟體,選擇並打開gisdata文件下的oregon文件夾,選擇oregongdata.mdb打開,選擇gtoposhd柵格並打開,打開orstations.xls,進一步查看欄位和屬性2.設置坐標系統:在ArcMap中右鍵點擊表名,選擇Display
XY Data(顯示XY數據),設置坐標欄位。(X Field 為LON, Y Field 為LAT),單擊Edit
按鈕,設置坐標系統,選擇坐標系統。(GCS採用NAD
1983):3.點圖層與降水數值表關聯:添加ORprecipnormals.xls表以實現與orstation表關聯,右擊orstations表名,選擇joins
and relates下的join,選擇station name
作為圖層關聯的基礎,關聯的表選擇orprecipnormals,兩表共同的屬性選擇station
name,點擊OK。4.臨時點圖層導出為Geodatabase數據:右擊ORstations¥Events圖層,選擇Data|Export
Data(導出數據),單擊Browse按鈕,將Save as type更改為File and Personal Geodatabase feature
classes
,定位到mgisdata\Oregon文件夾,命名輸出要素類為Precip。5.創建地理資料庫:啟動ArcCatalog,添加gisdata文件夾,右擊文件夾,選擇New|Personal
Geodatabase,輸入rcdata作為地理資料庫的名稱。6.創建要素數據集:右擊rcdata地理資料庫,選擇New,選擇Feature
Dataset,命名為Admin創建要素數據集,預定義坐標系統選擇UTM Zone
13N,採用相同的方法創建Environmental,Transportation和Watersystem要素集,從Admin中導入坐標系統7.添加Coverage到要素數據集:右擊Admin要素數據集,選擇Import,選擇Feature
Class(single)(單一要素類),將LandUSE(Coverage)POLY導入Admin要素數據集中,命名為LandUSE ,其中的Field
Map中多餘的欄位如area,Perimeter,Lanse#欄位可以刪除。8.添加shapefile(裁切)到要素數據集:右擊Transportation數據集,選擇Import|Feature
Class(single)(單一要素類),從archive文件夾中,導入shape文件rc_roads,命名輸出要素為roads,打開ArcToolbox|Analysis
Tools|Extract|Clip;以shape文件sategeol作為Clip Features,輸出schools,將其放入Admin數據集中。地理國情監測雲平台有相關arcgis 方面的解決方法。以上就是如何利用ArcGIS軟體創建地理資料庫的答案,希望你能看懂哦。
Ⅱ 空間資料庫建庫工作程序
1.空間坐標系統
坐標系統:採用1954北京坐標系,高斯-克呂格投影度帶投影,帶號15,中央經線85°30′,單位為m。
高程基準:採用1956黃海高程系。
2.建庫工作程序
在實際操作過程中,採用的建庫流程參考國家數字地質圖建庫標准,結合西天山地區1:25萬地質圖圖幅要素的實際情況,創建GeoDatabase資料庫,構建各要素集和要素類,資料庫結構如圖4-3所示。在矢量化過程中,採用以線性地質要素(斷層,地質界線,岩性邊界等)矢量為起點,以線跟蹤,線拷貝為中心,最後以線轉面(Feature to Poly-gon)的方法生成各面類地質圖層,然後對臨時面文件按各地質要素進行分類,導入各圖幅的標准地質資料庫中,再進行屬性數據的錄入。
在建庫過程中,第一步,對掃描地質圖進行幾何校正。第二步,在ArcGIS Catalog平台上,按照前文討論的各地質要素數據集,各地質要素欄位創建資料庫表結構。在統一的建庫標准下建立完整的西天山地區地質圖數據結構。每一幅地質圖形成一個單獨的地質資料庫(GeoDatabase),每個庫包含相同的數據結構和欄位類型,每一個屬性表形成一個圖層,存放對應的地質幾何要素;並在各自的資料庫下增加臨時線文件、臨時面文件,用來保存第一步線形矢量化後未分類的圖形數據。
在矢量化過程中,我們首先對斷層要素進行矢量,因為斷層線性平滑,多數斷層是地層岩性的公共邊界。斷層矢量完成後緊接著對所有岩性邊界進行矢量,包括沉積岩地層、侵入岩地層和變質岩地層邊界,岩性邊界數據存入臨時線文件,是一個單獨的線要素圖層,在矢量時,如果斷層恰好是岩性邊界的界線或公共邊,這時,為保證幾何圖形拓撲一致性,我們採用 「線跟蹤」 或 「線拷貝」 的方法將公共邊界的斷層線直接拷貝至 「臨時線」 圖層。凡是作為公共邊界的線,我們都採用同樣的方法進行矢量,比如 「地質界線」圖層與其他面狀要素的公共邊界等。
完成各岩性界線的矢量後,檢查若沒有遺漏,利用ArcGIS空間分析模塊的 「線轉面」(Feature to Polygon)工具,將臨時線文件轉換為臨時面文件,設定閉合容差為10m。轉換完成後按照沉積(火山)岩、侵入岩、岩牆進行面狀要素的分類,逐一導入各自相對應的單獨的圖層中。對於脈岩(面)要素、火山機構和礦點(點)要素基本很少與其他圖層共用邊界,因此,直接對這些要素單獨進行矢量便可。最後進行圖形的質量檢查,包括劃分岩性類別檢查,幾何拓撲檢查,檢查無誤且沒有遺漏後,導入標准庫中。這樣基本完成了一幅掃描地質圖各類地質要素的圖形矢量工作,下一步,主要參考圖例、柱狀圖和地質圖說明書進行屬性錄入,如流程圖4-3所示。最後,檢查屬性數據的錄入完整無誤後,便可進行下一圖幅的矢量工作。
對於化探和航磁的數據處理可以採用多種方式,本次研究中主要採用克里金插值和主成分分析對化探、航磁數據進行處理,並結合地質礦產圖說明書相關內容將化探、航磁數據與致礦有關的信息存入空間資料庫中。上述數據的生產均在ArcGIS平台上完成。
3.空間資料庫內容
本次資源潛力評價空間資料庫包含五個要素數據集,15個要素類以及至少6個柵格數據。
地理要素數據集:使用國家基礎地理信息中心的1:25萬地形資料庫中的水系、政區、居民地和交通要素類四個要素類。
基礎地質要素數據集:包括1:25萬區域地層、侵入岩、火山岩、變質岩、構造分區、斷層、礦產7個要素類。其中,資源潛力評價預測底圖數據由地層和侵入體所定義的構造相單元屬性通過數據融合直接生成,各要素類中所包含的屬性內容及相應的數據類型應和區域成礦模型及資源評價所需要素保持一致,實現模型要求與信息的對稱,各屬性編碼參考 《全國礦產資源潛力評價數據模型數據項下屬詞規定分冊》。
物化探要素數據集:包括1:5萬航磁要素類、1:5萬地面磁法要素類、1:20萬區域化探要素類、1:5萬區域化探要素類四個要素類。
物化探柵格數據集:主要存儲由物化探要素類通過克里金插值轉換而來的柵格數據以及在空間分析過程中產生的柵格數據。
遙感柵格數據集:主要用於存儲研究區ETM+衛星數據,是近年來在地質礦產應用特別是填圖和蝕變信息提取占據主流地位的遙感數據源。
4.資料庫質量控制
空間資料庫在數據完整性、邏輯一致性、位置精度、屬性精度、接縫精度均要求符合中國地質調查局制定的有關技術規定和標準的要求。
Ⅲ 地質-生態環境空間資料庫建庫標准
一、范圍
本標準定義了山東半島城市群地質-生態環境空間資料庫的數據結構框架、數據實體及實體之間的相互關系,定義了成果圖件空間數據的要素集、要素類、要素分類代碼及屬性數據項,可用於山東半島城市群項目數據的採集、存儲、管理、共享及資料庫建設。
二、規范性引用文件
下列標准所包含的條文,通過在本標准中引用而構成為本標準的條文。本標准出版時,所示版本均為有效。所有標准都會被修訂,使用本標準的各方應探討使用下列標准最新版本的可能性。
GB / T 1. 1—2000 標准化工作導則 第 1 部分: 標準的結構和編寫規則
GB / T 13923—92 國土基礎信息數據分類代碼
GB / T 2260—1999 中華人民共和國行政區劃代碼
GB / T 2659 世界各國和地區名稱代碼
GB / T 9649—88 地質礦產術語分類代碼
DZ / T 0160—95 1∶ 200000 地質圖地理底圖編繪規范及圖式
DZ / T 0197—1997 數字化地質圖圖層及屬性文件格式
GB 958—99 區域地質圖圖例 ( 1∶ 50000)
DZ / T 0179—1997 地質圖用色標准及用色原則
DDB 9702 GIS 圖層描述數據內容標准
GB 17108—1997 海洋功能區劃技術導則
中國地質調查局 地質圖空間資料庫建設工作指南 ( 2. 0 版)
中國地質調查局 1∶ 20 萬區域水文地質圖空間資料庫圖層及屬性文件格式工作指南
三、術語和定義
本標准涉及的主要術語如下:
1. 地理信息資料庫 ( geodatabase)
採用標准關系資料庫技術來管理、表現地理信息的空間資料庫。
2. 數據包 ( data package)
邏輯相關數據實體的集合,本標准中將山東半島城市群項目數據整體視作一個數據包。
3. 數據實體 ( data entity)
描述專業領域同一類型數據的數據元素的集合,如地質構造數據實體,概念上等同於UML 的類。數據實體可通過一個或多個相關的數據元素及相關的數據實體定義。
4. 數據集 ( dataset)
邏輯相關數據組成的數據集合,如一幅地圖可視作一個數據集,數據集是一個邏輯上的整體。
5. 數據子集 ( subdataset)
按一定規則劃分的數據集中邏輯相關數據的集合,本標准中的一個數據子集對應一個地圖要素類,數據子集類別對應地圖上的圖層劃分。
6. 空間數據 ( spatial data)
用來表示空間實體的位置、形狀、大小和分布特徵諸方面信息的數據。空間數據不僅具有實體本身的空間位置及形態信息,而且還有實體屬性和空間關系 ( 如拓撲關系)信息。
7. 空間參照系 ( spatial reference)
對地理信息數據的空間范圍和投影的描述。
8. 地圖 ( map)
地理信息的圖形描述,包括地理信息數據和地圖元素,如標題、圖例和比例尺等。本標准中將一幅地圖視作一個數據集進行管理,並通過一組要素集 ( 要素類、關系類、屬性表的集合) 、空間參照系、地圖樣式定義地圖的數據內容及顯示方式。
9. 圖層 ( layer)
地圖上特定區域范圍內按一定規則劃分的相似要素類的集合,如水系、城鎮。圖層為要素類的專題組合及表現,一個圖層定義了它包含地理信息數據的地理位置和顯示方法。
10. 要素 ( feature)
現實世界中的對象在地圖圖層中的表示,如地圖中表示道路的一條線。
……
四、縮略語和符號
1. 縮略語
ARD 圖外整飾要素 ( Elements Around Map)
BMAP 地理底圖 ( Basemap)
BOU 境界、邊界 ( Bourn)
CD 代碼 ( Code)
COL 綜合柱狀圖 ( Colomnar Chart)
DT 日期 ( Date)
ELE 地形高程 ( Elevation)
……
2. UML 類圖符號
山東半島城市群地區地質-生態環境與可持續發展研究
3. ER 圖符號
山東半島城市群地區地質-生態環境與可持續發展研究
五、基於 UML 的 Geodatabase 的空間數據模型
構建地質數據的空間數據模型是建立地質信息資料庫的一項關鍵工作,是資料庫建設的基礎。Geodatabase 數據模型作為 ArcGIS 軟體平台的一種通用數據形式,目前已被國內外眾多地質空間資料庫的建設所採用。數據建模也已經成為地質資料庫建立的一項主要內容。
目前針對地質、水文、礦產、海洋等多個領域的專業 Geodatabase 數據模型都已存在,國內目前應用於區域地質 - 生態環境調查的綜合地質 - 生態環境空間數據模型還比較少見。因此,本項目在分析國內外目前比較通用的各專業數據模型的基礎上,提出了專門面向山東半島城市群地質 - 生態環境空間資料庫建設的 Geodatabase 數據模型。
在 Geodatabase 數據模型中,允許定義要素之間類型的關聯,Geodatabase 對空間數據管理以關系資料庫為基礎,利用商用關系資料庫成熟的數據處理能力對空間數據和非空間數據進行統一管理。Geodatabase 使用面向對象的方法,使得要素可以具有自己的行為和屬性,並且要素類具有繼承性、多態性和封裝性。這樣,以更加適合自然的行為和人的思維方式去組織數據,更精確地模擬真實世界。
1. Geodatabase 數據模型的結構體系
Geodatabase 數據模型作為一種新型的面向對象的數據模型,融入了面向對象的核心技術,如類 ( Class) 、對象 ( Object) 、封裝 ( Encapsulation) 、繼承 ( Inheritance) 和多態( Polymorphism) 等思想和技術。Geodatabase 數據模型的目的就是為了讓用戶能更容易、更自然地表示 GIS 數據特徵和更容易地建立特徵之間的各種關系。Geodatabase 空間資料庫數據模型如表 12 -1 所示。
表 12 -1 Geodatabase 內部結構
續表
2. Geodatabase 資料庫模型的特點
Geodatabase 有兩種,即個人與多用戶 Geodatabase。
1) 個人 Geodatabase 支持內置於 ArcGIS 系統並提供對本地數據的訪問,適用於面向項目的 GIS,在 Microsoft Access 資料庫平台上實現,提供生成和更新 Access 資料庫的服務,可處理小型或適中的 Access 資料庫。但個人 Geodatabase 的存儲容量有不能超過 2GB的限制。
2) 多用戶的 Geodatabase 是通過 ArcSDE ( ARC 空間資料庫引擎) 實現的。ArcSDE可以生成和訪問從小型到大型的 Geodatabase 並提供關系型數據的開放界面。
與標準的關系資料庫相比,Geodatabase 簡化了地理數據建模的工作,因為它包含有用於建模地理信息的通用模型。
此外,Geodatabase 還同時支持兩個視圖,即對象視圖和關系視圖。這樣就綜合了對象視圖和關系視圖兩者的優點。對象視圖在 Geodatabase 中占據主導地位,其目的是提供一個接近於邏輯數據模型的數據模型,因而更接近於現實。關系視圖則用於一些 Geodata-base 數據的常規處理,它表示的是一些簡單地理對象的特徵。
3. 基於 UML 的 Geodatabase 數據模型的設計
( 1) Geodatabase 資料庫設計的方法
在 ArcGIS 中,建立地理資料庫可以有多種方法。藉助 ArcCatalog,可以通過 3 種方式建立新的地理資料庫。
第一種方法是建立一個新的地理資料庫。
第二種方法是移植已經存在的數據到地理資料庫中去。
第三種方式是用 CASE 工具來建立地理資料庫。
( 2) 面向對象和 UML ( 統一建模語言)
面向對象是軟體程序設計中的一種新思想,它能使程序設計更加貼近現實,並且花費更小的精力。面向對象方法學包含了對象 ( object) 、類 ( classification) 、繼承 ( inherit-ance) 、聚集和消息 ( messages) 的概念。
UML ( Unified Modeling Language,統一建模語言) 是一種基於面向對象方法的建模語言,具有創建系統的靜態結構和動態行為等多種結構模型的能力,是一種通用的建模語言。在 Geodatabase 的設計中,主要用到描述系統靜態結構的類圖。類圖的節點表示系統中的類及其屬性和操作。類圖的邊表示類之間的聯系,包括繼承、關聯、依賴、聚合等。
類的表示由 3 個部分方框組成,上面部分給出了類的名稱; 中間部分給出了該類的單個對象的屬性; 下面部分給出了一些可以應用到這些對象的操作。類的表示如圖 12 -5。
圖 12 -5 類的表示
關聯是對類的實例之間聯系的命名,與關聯有關的內容有關聯元數 ( Degree) 、關聯角色 ( Role) 和重復度 ( Multiplicity) 。
UML 中有 3 種類型的類: 抽象類 ( abstract class) 、可創建化類 ( creatable class) 和可實例化類 ( instantiable class) 。
UML 類圖的符號見本節第四部分內容。
( 3) 面向對象的地理數據模型的設計方法
利用 CASE 工具進行 Geodatabase 數據模型設計的步驟具體為:
1) 在 CASE 工具中進行 UML 建模。
2) 將設計好的 UML 模型載入資料庫 ( repositry) 。
3) 利用 GIS 軟體提供的 CASE 介面,根據資料庫中的 UML 模型生成空間資料庫結構。至此,Geodatabase 空間資料庫結構初具雛形。在 GIS 軟體環境中,現在可以將新生成的數據或已有的數據進行格式轉換後載入到設計好的 Geodatabase 空間資料庫中,由空間資料庫統一管理。利用 CASE 工具來建立 Geodatabase 地理資料庫的工作流程見圖12 - 6。
圖 12 -6 利用 CASE 工具來建立 Geodatabase 地理資料庫的工作流程
六、地質 - 生態環境 Geodatabase 數據模型的建立
( 一) 數據模型設計的依據
根據山東半島城市群地質 - 生態環境調查評價研究工作的需要和山東半島城市群地質 - 生態環境 GIS 資料庫系統的整體設計要求,結合各地質 - 生態環境要素的成果圖件和文本報告資料,利用 UML 設計工具 Microsoft Visio 完成了山東半島城市群地質 - 生態環境Geodatabase 數據模型的設計 ( 圖 12 - 7) 。
圖 12 -7 山東半島城市群地質 - 生態環境 Geodatabase 數據模型的設計依據
( 二) 山東半島城市群地質 - 生態環境資料庫的 UML 類圖
1. 數據集管理
山東半島城市群項目數據包中的數據以數據集為單元統一組織管理,數據集管理方式就是將一份文字報告或一幅成果圖件視作邏輯上的整體,用 「數據集編號」唯一標識,通過數據集實體統一管理。同一數據集的不同實體,例如成果圖中的圖層,通過實體中的「數據集編號」元素關聯。
2. 空間數據管理
山東半島城市群項目數據包由文字報告及成果圖件兩大類數據組成,並以成果圖件為主,成果圖件是一空間數據實體,統一存儲在面向對象的地理信息資料庫中,以圖幅為單元進行管理。
3. 數據包總體結構
本標准中山東半島城市群項目數據包總體結構用 UML 模型來體現,山東半島城市群項目數據包由 「成果報告」、「元數據」及 「存檔文件」3 個數據實體 ( UML 類) 組成,通過 「數據集」實體統一組織管理。「成果報告」由它的繼承類 「文字報告」及 「成果圖件」定義,為研究成果數據包的主體數據。「元數據」及 「存檔文件」為數據集的輔助數據,「元數據」存放文字報告或成果圖件的元數據; 「存檔文件」存放文字報告或成果圖件的相關存檔文件,供數據集數據的整體下載與利用。
一個 「數據集」實體對應一個項目的 「文字報告」或一幅 「成果圖件」; 每一個數據集必須有一個而且只能有一個 「元數據」文件; 「存檔文件」是 「數據集」的可選聚合實體。
「成果圖件」是一空間數據實體,由特定的面向對象地理信息資料庫 ( Geodatabase)統一存儲、管理。一幅 「成果圖件」數據內容由一組空間要素集 ( 基礎地理要素集、地質要素集、地球物理要素集、地球化學要素集、輔助要素集) 組成,空間要素集數據類型包括矢量 ( Feature Dataset,簡稱要素集) 、柵格 ( Raster Dataset) 和 TIN ( TIN Dataset)3 種。
4. 數據集編號的編碼規則
數據集編號由資料庫管理方統一編碼,必須保證編號在資料庫中唯一,編號中的英文字母全部大寫。
山東半島城市群項目數據集按 「項目或圖幅—提交單位—提交年份—成果序號」編碼。數據集編號的字元串長度不得超過 22 位,以保證 「數據集編號 + 要素類名」的字元串總長度不超過 30 位。
5. 成果圖件要素類命名規則
要素類名字元串總長度不得超過 8 位。
矢量要素類按 「要素集類型 + 要素類名 + 要素類型」命名,全部用大寫英文字母表示。「要素集類型」用一位代碼表示,如 「L」表示基礎地理要素集。柵格數據集數據以「要素集類型 + 要素類型」命名,要素類型用代碼 RAS 表示,如 「DRSRAS」表示遙感柵格數據。TIN 數據集數據以 「要素集類型 + 要素類型」命名,要素類型用代碼 TIN 表示,如 「LELETIN」表示地面高程 TIN。
6. 成果圖件要素分類編碼規則
要素分類編碼用以標識不同的要素類要素,保證地圖要素存儲、交換、顯示的一致性。
( 1) 分類編碼原則
1) 科學性、系統性;
2) 相對穩定性;
3) 不受地圖比例尺的限制;
4) 完整性和可擴展性;
5) 適用性。
( 2) 分類編碼方法
成果圖件要素類中不同要素的分類編碼採用中華人民共和國國家標准 《國土基礎信息數據分類與代碼》的編碼結構,結構如下:
山東半島城市群地區地質-生態環境與可持續發展研究
大類碼、小類碼、一級代碼和二級代碼分別用數字順序排列。識別位由用戶自行定義,以便於擴充。在本項目中編碼分兩類: ①基礎地理要素編碼; ②地質專業要素編碼( 地質、地球物理、地球化學等) 。
( 三) 山東半島城市群項目數據實體及實體關系
山東半島城市群項目數據實體類及其代碼見表 12 -2,實體類名代碼按實體類的英文名縮略語編碼,本標准中山東半島城市群項目數據實體及實體間關系用 UML 及實體關系圖 ( ERD) 來體現。
表 12 -2 山東半島城市群項目數據實體類及其代碼
1. 數據集實體 ( MGRD_Dataset)
山東半島城市群項目數據包中的 「數據集」實體用來統一組織管理 「文字報告」、「成果圖件」、「元數據」及 「存檔文件」數據實體,「數據集」實體中的數據項包含數據集的歸屬項目、提交日期、提交單位、主題類別及地理范圍等可用於數據集檢索的信息。一個 「數據集」實體對應一個項目的 「文字報告」或一幅 「成果圖件」,「數據集」實體與 「元數據」實體間為一一對應關系,與 「存檔文件」實體間為一對多的對應關系。「數據集」實體的數據內容及其存儲表通過 「數據子集」實體分類定義,主鍵 [數據集編號]可用於同一數據集中不同 「數據子集」的關聯,也可用於數據集對應的 「元數據」及「存檔文件」的關聯。
2. 成果報告數據實體 ( MGRD SumTmaryReport)
研究成果報告數據實體包括項目的最終綜合文字報告及相應的成果圖件。
( 1) 文字報告數據實體 ( SR_WordReport)
文字報告數據實體包括 「文字報告」及圖像格式的 「報告附圖」數據實體,文字報告及附圖均以二進制大對象存儲。數據實體之間通過 [數據集編號] 關聯。
( 2) 成果圖件數據實體 ( SR_hemeMapSet)
「成果圖件」數據實體是一空間數據實體,主要以矢量圖形格式存儲在地理信息資料庫中,其中也包括柵格數據及 TIN 數據用於數據的空間分析。
1) 要素集: 「成果圖件」 數據實體以圖幅為數據集單元進行管理; 圖幅內容以分屬不同空間要素集 ( 基礎地理要素集、地質要素集、地球物理要素集、地球化學要素集、輔助要素集) 的要素類組合,同一個要素集內的要素類享有同一空間參照系,相互具有拓撲關系。
2) 要素類: 一個要素類的存儲單元為關系資料庫中的一個數據表,要素類圖元類型有點、線、面、注記 4 種,一個要素類只能包含一種圖元類型。本標准中基礎地理要素集、地質要素集、地球物理要素集、地球化學要素類、輔助要素集的要素類用 UML 類圖體現。
3) 圖層: 圖層為要素類的專題組合及表現,不同圖層的組合即構成了可視化 「成果圖件」。本項目通過對數據來源的分析,提出並建立了適合山東半島城市群地區地質 - 生態環境調查與評價特點的空間資料庫數據圖層。考慮到空間數據的應用和相互轉換,每一圖層均應建立相應的內部屬性表,屬性表必須包含一些基本欄位內容,根據具體任務的不同,需靈活擴充內部屬性表欄位內容。 「成果圖件」數據實體的圖層劃分及其代碼見表 12 -3。
4) 要素類屬性: 要素類的要素特徵由屬性表定義,屬性表每一行對應一個要素,每一列包含要素的一個特徵信息。
表 12 -3 成果圖件數據實體的圖層劃分及其代碼
5) 要素類要素分類: 同一要素類中不同類型的要素用不同的代碼標識,通過屬性表中的 「編碼」 ( GEO_CODE) 數據項體現,以便地圖中同一要素類要素的分類顯示,並保證地圖要素存儲、交換、顯示的一致性。在本項目中成果圖件的基礎地理要素分類代碼採用中華人民共和國國家標准 《國土基礎信息數據分類與代碼》,並根據需要進行了擴充,地質專業要素分類代碼全部由本標準定義,見表 12 -4 和表 12 -5。
表 12 -4 基礎地理要素分類代碼
表 12 -5 地質專業要素分類代碼
圖12 -8 山東半島城市群項目數據包UML類圖
圖層編碼中,第一位為圖類代碼,L 代表基礎地理類圖層; D 代表基礎地質類圖層;G 代表國土資源圖層; W 代表地殼穩定性圖層; S 代表水資源圖層; H 代表海岸帶圖層;T 代表生態環境圖層; R 代表人類工程活動圖層; F 代表分析評價圖層; Y 代表預測與防治圖層; Z 代表輔助圖層。第二位為比例尺代碼,圖件均採用 1∶ 50 萬比例尺,代碼為 B。第三位到第五位為圖名的漢語拼音首字母縮寫。第六位為圖層數字編號。
( 四) 山東半島城市群項目 UML 類圖
1. 山東半島城市群項目數據包 UML 類圖
UML 類圖見圖 12 - 8。
2. 成果圖件要素集 UML 類圖
1) 基礎地理要素集實體 UML 類圖 ( FD_Geography) 。本項目將基礎地理要素分為地理網格、居民地、境界、交通網、地貌地形、水系、海洋海岸帶、行政區劃、柵格數據等 9個抽象要素類,建立了 「各市基本情況」對象類,與表明各地區域的 「城市群」類相連接,將山東半島城市群8 個地級市的地理位置數據與地區的基本資料數據有機地聯系起來。
2) 地質要素集實體 UML 類圖 ( FD_Geology) 。
3) 國土資源要素集實體 UML 類圖 ( FD_LandResource) 。
4) 水資源要素集實體 UML 類圖 ( FD_WaterResource) 。
5) 生態環境要素集實體 UML 類圖 ( FD_Environment) 。
6) 輔助要素集實體 UML 類圖 ( FD_Ancillary) 。
3. 山東半島城市群項目數據實體關系圖
1) 數據集實體 ER 圖 ( MGRD_DataSet) 。
2) 研究成果報告數據實體 ER 圖 ( MGRD_SummaryReport) ( 圖 12 - 9) 。
圖 12 -9 研究成果報告數據實體 ER 圖 ( MGRD_SummaryReport)
七、山東半島城市群項目數據包數據字典
( 一) 數據集實體 ( MGRD_DataSet)
山東半島城市群地區地質-生態環境與可持續發展研究
( 二) 研究成果報告數據實體 ( MGRD_SummaryReport)
1. 文字報告數據實體 ( SR_WordReport)
山東半島城市群地區地質-生態環境與可持續發展研究
2. 成果圖件數據實體 ( SR_ThemeMapSet)
( 1) 基礎地理要素集實體 ( FD_Geography)
山東半島城市群地區地質-生態環境與可持續發展研究
( 2) 地質要素集實體 ( FD_Geology)
山東半島城市群地區地質-生態環境與可持續發展研究
( 3) 水資源要素集實體 ( FD_HydroResource)
山東半島城市群地區地質-生態環境與可持續發展研究
Ⅳ 資料庫物理模型
資料庫物理模型設計的目標是根據選定的Oracle資料庫系統特點和航空物探數據管理與服務的業務處理需求,確定航空物探資料庫最優的物理環境、存取方法和存儲結構。即通過資料庫物理設計,以便達到物理資料庫結構的優化,使得在資料庫上運行的各種事務響應時間少、存儲空間利用率高、事務吞吐率大。
一、資料庫布局
航空物探信息系統的維護數據(部門、崗位、人員、人員許可權、數據入庫檢查規則及數據字典等)相對比較穩定。入庫前數據需經過各種檢查校對,確認數據正確後才能歸檔,存入航空物探資料資料庫,所以存入資料庫前的數據可能經常需要修改和刪除,相對變化較大;而存入資料資料庫中的數據一般不允許修改和刪除,以免誤操作破壞資料庫數據造成損失。
圖2-12 航空物探資料庫邏輯模型
圖2-13 航空物探資料庫布局與數據採集流程圖
據此,我們採用圖2-13所示的資料庫數據採集流程,並將航空物探資料庫分為資料採集資料庫、資料資料庫、系統維護資料庫分別進行存儲和管理,實現數據的統一管理和統一使用,便於數據入庫和易於維護等。
航空物探資料資料庫是航空物探所有數據最終存儲的場所。資料採集資料庫是數據歸檔存入資料資料庫前的臨時「集散地」,在此接收各項檢查,在確認數據無誤後歸檔到資料資料庫,然後刪除資料採集資料庫中已歸檔的數據。此外,資料採集資料庫中還保存數據入庫、維護、檢查日誌及歸檔記錄。
系統維護資料庫,存儲系統維護信息(如系統功能、資料庫表清單等)、安全信息(如信息系統用戶的角色、許可權、授權的系統功能等),數據字典、入庫數據檢查規則等。將其與航空物探數據分開,有利於系統維護和管理。
二、資料庫空間設置
資料庫空間設置包括磁碟空間設置、應用系統表空間設置、撤銷表空間、臨時表空間、日誌空間和索引空間設置。
(一)磁碟空間設置
磁碟空間設置的目標:磁碟性能不能阻礙實現資料庫性能,資料庫磁碟必須專用於資料庫文件,否則非資料庫將會影響到資料庫性能,且磁碟空間必須滿足恢復和性能的要求。
航空物探資料庫伺服器為IBMP620小型機,8塊硬碟,每塊硬碟36GB空間,每塊物理磁碟建立一個文件系統。為了提高磁碟的反應時間和尋道時間,提高I/O的存取效率,除了一塊硬碟用於UNIX操作系統外,其餘7塊磁碟分別存放資料採集資料庫、系統維護資料庫-日誌文件,資料資料庫及資料資料庫的大欄位數據、索引、回滾段和數據日誌文件。
(二)應用系統表空間設置
信息系統數據採集過程對數據的事務操作比較頻繁,經常進行數據插入(新數據入庫)、修改(入庫數據有誤)和刪除操作(數據重新導入或歸檔入庫),因此航空物探資料採集資料庫所在的表空間會很活躍。為了不影響其他I/O的競爭,同時也可以提高數據入庫的操作效率(50多年的歷史數據需要集中入庫),分配一個磁碟空間(36GB)為採集庫的表空間。由於採集數據歸檔入資料庫後被刪除,同時進行數據入庫的項目也不是很多,雖仍保留所有的採集日誌數據,一個磁碟空間也足夠使用。
航空物探資料資料庫的二維表和Oracle大欄位(BLOB)分別存放在不同的物理磁碟(每個磁碟36GB)上,對同時存在有表格數據和大欄位數據的資料庫表(如航跡線數據)時,可以提高磁碟I/O效率。隨著數據入庫的項目越來越多,需要增加相應的物理磁碟或磁碟陣列。
系統維護資料庫相對穩定,佔用磁碟空間約500M左右。由於系統磁碟有限,把日誌文件存放該磁碟中。
(三)撤銷表和臨時表空間的設置
在Oracle資料庫中,撤銷的目的是確保事務的回退和恢復。撤銷參數有UNDO_MANAGEMENT、UNDO_TABLESPACE和UNDO_RETENTION。
UNDO_MANAGEMENT參數用於資料庫中管理撤銷數據的方式,航空物探資料庫設置為自動模式(auto)。
UNDO_TABLESPACE參數用於指定資料庫中保存撤銷數據的撤銷表空間名稱,航空物探資料庫撤銷表空間名稱為UNDO_ARGS_TBSPACE,空間大小設置為20GB,以確保在保留時間內進行恢復。
UNDO_RETENTION參數用於指定已經提交事務的撤銷數據在能夠覆蓋之前應該保留多長時間,本資料庫系統設置為60min。
臨時表空間是用以存儲大量的排序,與撤銷表空間存放在一個物理磁碟上,本資料庫系統臨時表空間設置為500M。
(四)日誌空間設置
日誌的主要功能是記錄對資料庫已做過的全部操作。在系統出現故障時,如果不能將修改數據永久地寫入數據文件,則可利用日誌得到該修改,所以不會丟失已有操作結果。
日誌文件主要是保護資料庫以防止故障。為了防止日誌文件本身的故障,航空物探資料庫系統分別在一個獨立磁碟和系統維護庫磁碟中存放日誌文件。若系統出現故障,在下次打開資料庫時Oracle資料庫系統自動用日誌文件中的信息來恢復資料庫文件。
根據航空物探資料庫信息系統同時登錄的用戶數及使用的功能,將日誌文件大小設置為10GB。
(五)索引表空間設置
為了提高航空物探信息系統的查詢和統計速度,把所有索引空間與應用表空間完全分開,從而提高I/O存取效率。航空物探索引表空間大小設置為10GB。
聚集是表的一種存儲方法,一般每個基本表是單獨組織的,但對邏輯上經常在一起查詢的表,在物理上也鄰近存放,這樣可減少數據的搜索時間,提高性能。
當幾個關系(表)以聚集方式組織時,是通過公共屬性的值為表聚集的依據。航空物探資料庫系統是以項目標識(PROJ_ID)建立聚集的,所有涉及項目標識的資料庫表直接引用項目標識聚集。航空物探聚集表空間與索引表空間相同。
三、資料庫參數設置
在資料庫創建前需要對如下資料庫參數進行設置,航空物探參數文件名為Inito-raargs.ora,各種參數設置如下:
DB_block_size=16384
DB_name=oraagrs
DB_domain=oraargs.com
Compatible=9.1.0
Nls_characterset=ZHS16GBK
Open_Cursors=100
DB_files=100
DB_file_mutliblock_read_count=16
Log_checkpoint_interval=256000
Processes=200
四、內存設置
航空物探資料庫伺服器物理內存為4GB,除部分用於系統開銷外,其餘全部用於資料庫。
Oracle使用共享系統全局區(System Globla Area,SGA)內存來管理內存和文件結構,包含DB_block_Bufers、DB_cache_size、Shared_pool_size、Log_Buffer參數。航空物探資料庫系統的全局區內存參數設置如下。
DB_block_Buffers參數為SGA中存儲區高速緩存的緩沖區數目,每個緩沖區的大小等於參數DB_block_size的大小,DB_block_Buffers=19200(約300MB)。
Shared_pool_size參數為分配給共享SQL區的位元組數,是SGA大小的主要影響者,Shared_pool_size=1228800000(1.2GB)。
DB_cache_size參數是SGA大小和資料庫性能的最重要的決定因素。該值較高,可以提高系統的命中率,減少I/O,DB_cache_size=1024000000(1GB)。
Log_Bufer參數為重做日誌高速緩存大小,主要進行插入、刪除和修改回退操作,Log_buffer=5120000(5MB)。
五、優化設置
由於航空物探信息系統的採集軟體和應用軟體是採用MS.NETC#進行開發的,應用程序與資料庫之間的連接有傳統的ODBC和OLEDB兩種方式。為了支持ODBC在OLEDB技術上建立了相應的OLEDB到ODBC的調用轉換,而使用直接的OLEDB方式則不需轉換,從而提高處理速度。
在建立資料庫表時,參數Pctfree和Pctused設置不正確可能會導致數據出現行鏈接和行遷移現象,即同一行的數據被保存在不同的數據塊中。在進行數據查詢時,為了讀出這些數據,磁頭必須重新定位,這樣勢必會大大降低資料庫的執行速度。因此,在創建表時應充分估計到將來可能出現的數據變化,正確地設置這兩個參數,盡量減少資料庫中出現的行鏈接和行遷移現象。
航空物探資料採集資料庫表的插入、修改和刪除的頻率較高,Pctfree設置為20,Pctused設置為40;系統維護資料庫表相對穩定,Pctfree設置為10,Pctused設置為15;資料資料庫表除了增加數據外基本不進行修改和刪除操作,Pctfree設置為10,Pctused設置為5。
六、擴展性設置
多CPU和並行查詢PQO(Parallel Query Option)方式的利用:CPU的快速發展使得Oracle越來越重視對多CPU的並行技術的應用,一個資料庫的訪問工作可以用多個CPU相互配合來完成。對於多CPU系統盡量採用並行查詢選項方式進行資料庫操作。航空物探資料庫伺服器為2個CPU,在程序查詢中採用了並行查詢的方式。
在航空物探工作量統計、飛行小時統計、測量面積統計和岩石物性統計中,為了加快統計效率,在相應的查詢語句中增加了並行查詢語句。
隨著航空物探高精度測量程度的不斷提高,測量數據將越來越大。為了滿足航空物探查詢效率及發展,將航磁測量數據與校正後航磁測量數據按比例尺分1:20萬以下、20萬~50萬、1:50萬以上分別存放3張不同的資料庫表。
七、創建資料庫
在完成資料庫布局、空間設置、內存設置、資料庫參數設置、擴展性設置和優化設置後,進行航空物探資料庫物理模型設計,即航空物探資料庫實體創建。由於航空物探空間資料庫邏輯模型是採用ESRI提供的ArcGIS UML構建的Geodatabase模型,因此,使用ESRI公司提供的CaseTools將航空物探數據UML模型圖轉成空間資料庫(Geodatabase)實體(圖2-14)。
航空物探屬性資料庫表(二維表)是採用Power Designer資料庫設計平台直接把資料庫關系模型生成資料庫腳本來創建的。
經過資料庫的概念設計、邏輯設計和物理設計,最終生成航空物探資料庫。
圖2-14 航空物探資料庫物理模型實現
八、空間數據的索引機制
對於海量的空間資料庫而言,資料庫的操作效率是關繫到資料庫成敗的關鍵問題。為了提高數據的訪問、檢索和顯示速度,數據在載入到資料庫時,要素類數據建立了空間索引,柵格數據構建了金字塔結構,對象類數據採用與資料庫直接聯接的訪問機制。
(一)空間索引
為了提高要素類數據的查詢性能,在建立航空物探空間資料庫時,創建了空間索引機制。常用的空間索引有格網索引、R樹索引、四叉樹索引等。Geodatabase採用格網索引方式。所謂格網索引是將空間區域劃分成適合大小的正方形格網,記錄每一個格網內所包含的空間實體(對象)以及每一個實體的封裝邊界范圍,即包圍空間實體的左下角和右上角坐標。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網,然後通過格網編號,就可以快速檢索到所需的空間實體。
確定適合的格網級數、單元大小是建立空間格網索引的關鍵。格網太大,在一個格網內有多個空間實體,查詢檢索的准確度降低。格網太小,則索引數據量成倍增長和冗餘,檢索的速度和效率較低。資料庫的每一數據層採用不同大小、不同級數的空間索引格網單元,但每層最多級數不能超過三級。格網單元的大小不是一個確定性的值,需要根據對象的大小確定。空間索引格網的大小與檢索准確度之間的關系如圖2-15所示。
選擇格網單元的大小遵循下列基本原則:
1)對於簡單要素的數據層,盡可能選擇單級索引格網。減少RDBMS搜索格網單元索引的級數,縮短空間索引搜索的過程,例如航跡線要素類。
圖2-15 索引格網大小與檢索准確度的關系
2)如果數據層中的要素封裝邊界大小變化比較大,應選擇2或3級索引格網。Geodata-base最多提供三級格網單元。每一要素封裝邊界在適合的級內,減少了每一封裝邊界有多個格網的可能性。在空間索引搜索過程中,RDBMS則必須搜索所有3個格網單元級,這將消耗大量的時間。
3)若用戶經常對圖層執行相同的查詢,最佳格網的大小應是平均查尋空間范圍的1.5倍。
4)格網的大小不能小於要素封裝邊界的平均大小,為了減少每個格網單元有多個要素封裝邊界的可能性,格網單元的大小應取平均格網單元的3倍。最佳格網單元的大小可能受圖層平均查詢的影響。
空間域是按照要素數據集定義的,空間索引格網是按照要素類設置的。它們都是在創建Geodatabase資料庫時設置,並一經設置,中間不許改變;所以一定要在充分分析數據的情況下確定它們的值。航空物探數據主要是簡單要素類,空間跨度為70°。根據上述原則,航空物探數據選擇單級索引格網,格網大小為20°。
(二)金字塔結構
金字塔結構的核心是將柵格數據逐級進行抽稀,形成多級解析度的重采樣數據,並將其分割成塊,按一定的文件格式(金字塔文件格式)存儲成磁碟文件;在以後進行圖像顯示處理時,只需將要顯示的部分所覆蓋的塊從磁碟文件直接讀進內存緩沖區顯示即可。從金字塔的所有層中尋找與所要求顯示的比例相近或匹配的一層,並將該層的從某一點起的一定范圍的圖像所覆蓋的所有塊載入到內存緩沖區,提取所需部分並形成圖像。
金字塔演算法(圖2-16)是通過獲取顯示時所需要的一定解析度的數據來提高顯示速度。使用金字塔數據格式後,在顯示全圖時僅需要顯示一個較低解析度的數據,這樣既能加快顯示速度,又不會影響顯示效果。放大圖像,盡管顯示圖像解析度提高,由於顯示區域減小,所以顯示速度不會下降。如果沒有為柵格數據建立金字塔數據,則每次顯示都會讀取整個數據,然後進行重采樣得到顯示所需要的解析度,明顯地降低了顯示速度。
圖2-16 金字塔壓縮示意圖
金字塔數據重采樣方式有:最近鄰法、雙線性內插和立方卷積。其中最近鄰法適用於離散數據,而雙線性內插法和立方卷積法適合於連續數據。
在ArcGISEngine中提供了IRasterPyramid和IRasterPyramid2介面來實現金字塔數據的建立,而建立的數據保存在*.rrd格式的文件中。
(三)空間域定義
空間域是指數據的有效空間范圍,即Geodatabase資料庫的最大等效坐標的值域范圍,其定義主要是指比例系數和MinX、MinY的計算。
因為使用整數比浮點數有更高的壓縮率,並且對整數進行二進制搜索比較快,所以多用戶Geodatabase以4位元組正整數存儲坐標,其最大值為32位正整數所能表示的范圍是21.4億(2147483647),整數的范圍稱為空間域。在創建Geodatabase資料庫時需要定義合適的比例系數。大的整數值將消耗大量的計算機物理內存,所以選定的比例系數最好不要大於必須的比例系數。空間域隨坐標系的單位變化而變化。
比例系數和空間域之間成反比例關系,比例系數越大(存儲單位越小),表達的空間域也越小。為了使目標數據都存儲在系統中,需要謹慎地設置比例系數。將目標數據的寬度和高度較適中的數值乘以比例系數,如果結果小於21.4億,則比例系數是合適的。
航空物探數據模型是為我國的航空物探行業數據建庫設計的,它支持的空間數據的坐標范圍為我國領土覆蓋的海陸空間,最低緯度為赤道。根據概念設計的分析,航空物探數據模型採用的是地理坐標系,坐標系單位是度,基準是Beijing_1954,要求存儲的坐標數據精度達到0.01m。在赤道處,赤道圓周長為40075694.6m,則每度弧長=40075694.6×100/360cm=11132137.389cm,即1cm對應8.983000883E-8°。所以,航空物探數據模型的比例系數取為8.98E-8,即存儲單位為8.98E-8°,可滿足1cm精度要求。
將空間域移動到目標數據范圍之前,首先找到空間域在存儲單位的中心位置,目的是在必要時向各個方向擴展。4位元組正整數可表示的坐標范圍:2147483647×8.98E-8=192.84。我國的領土范圍是東經70°~140°,北緯0°~60°。所以,選取的比例系數是合適的。把空間域坐標系中心定為90°,然後,計算空間域的MinX、MinY。
MinX=((70+140)÷2)-90=15
MinY=((0+60)÷2)-90=-60
所以坐標的存儲數據是:
X_Storage=(X-MinX)/8.98E-8
Y_Storage=(Y-MinY)/8.98E-8
Ⅳ 資料庫設計
根據以上數據內容分析,當前遙感綜合調查基礎資料庫主要由各個專題資料庫(以矢量數據為主)、公共資料庫(既有矢量數據又有柵格數據,前者如1∶25萬基礎地理數據,後者如1∶25萬DEM資料庫和1∶25萬ETM+遙感影像)等構成,同時整個系統還必須具備自身的擴展機制,隨著用戶和應用的不斷變化,資料庫的內容也必將隨之變化。因此,遙感綜合調查基礎資料庫設計的主導思想是,利用ArcSDE技術提供的Multiuser Geodatabase模型組織復雜的空間數據,建立一個開放的、靈活的空間資料庫。
Geodatabase由矢量要素數據集、柵格數據集、TIN數據集、空間域、規則等部件構成。它對通常所要處理和表達的地理空間要素,如矢量、柵格、三維表面、網路、地址等進行了統一的描述,並引入了這些地理空間要素的行為、規則和關系(ESRI,2001)。而遙感綜合調查基礎資料庫只存儲其中的矢量要素數據集、柵格數據集等幾種類型。基於Geodatabase的遙感綜合調查數據模型如圖11.4所示。
設計Geodatabase與設計普通的資料庫是相同的,也分成兩個基本步驟——邏輯數據模型的表達和資料庫模型的物理實施,即邏輯設計和物理設計。邏輯設計是空間數據在用戶或應用中的表現形式,物理設計主要是空間數據在存儲介質里的具體儲存方式。邏輯數據模型是對所要研究的現實世界的有關數據而建立的一個抽象的關聯結構,以描述這些數據之間的邏輯關系。它完全獨立於具體系統實現和處理過程,區別於物理數據模型,即它不是一個在資料庫管理系統中的表結構,不化解或消除實體間的多對多關系,更接近於現實世界,是一個訪問數據的基本視圖。可以說邏輯層是物理層的表現,而物理層是邏輯層的基礎。
圖11.4基於GeoDatabase的遙感綜合調查數據模型
圖11.5邏輯層與物理層的聯系
從邏輯設計的角度來看,本系統基礎資料庫的設計思路是:資料庫→子庫→圖層→空間實體,庫可以包含多個子庫,子庫用來存放不同比例尺或不同用途的空間數據,再根據項目設計書的要求對每一個子庫做大類和圖層的劃分。從物理設計的角度來看,最終反映在ArcSDE的物理資料庫模型則是GEODATABASE→FEATUREDATASET→FEATURECLASS→FEATURE(如圖11.5)所示。