『壹』 如何導入PostgreSQL資料庫數據
說起資料庫,大家耳熟能詳的商業資料庫產品當推Oracle、微軟的SqlServer和IBM的
DB2等,而開源資料庫中則有兩大產品MySQL和PostgreSQL。
PostgreSQL 是一種對象-關系型資料庫管理系統(ORDBMS),也是目前功能最強大、
特性最豐富和最復雜的自由軟體資料庫系統。它起源於伯克利(BSD)的資料庫研究計劃,
目前是最重要的開源資料庫產品開發項目之一,有著非常廣泛的用戶。
PostgreSQL 可以說是最富特色的自由資料庫管理系統,也有人認為可以是最強大的自由
軟體資料庫管理系統。PostgreSQL 是唯一支持事務、子查詢、多版本並行控制系統、數據完
整性檢查等特性的唯一的一種自由軟體的資料庫管理系統。能在多平台下---包括Linux、
FreeBSD和Windows等---運行,並且支持多語言的開發。
在兩大開源資料庫產品的對比中,一般認為MySQL速度更快,所以得到更為廣泛的使
用;而PostgreSQL性能更為先進,PostgreSQL 提供很多 MySQL 目前所不支持的特性,比
如觸發器、視圖、存儲過程等等,在記錄數超千萬之後性能表現尤其出色。
當前的最新版本是PostgreSQL 8.2.3,官方網站是:
www.postgresql.org
1.2 什麼是PostGIS
PostGIS在對象關系型資料庫PostgreSQL上增加了存儲管理空間數據的能力,相當於
Oracle的spatial部分。PostGIS最大的特點是符合並且實現了OpenGIS的一些規范,是最著
名的開源GIS資料庫。
當前的最新版本是PostGIS 1.2.1,官方網站是:
www.postgis.org
二 PostgreSQL和PostGIS的安裝
2.1 在windows下安裝。
新版本的PostgreSQL在其安裝程序中集成了PostGIS,只需要在安裝過程中選中
PostGIS和pgsql項就可以了。
2.2 在Debian下安裝PostGIS
# apt-get install postgresql-8.1 postgresql-8.1-postgis
當前Etch中的版本:PostgreSQL是8.1.7,而PostGIS是1.1.6,雖然不是最新的版本,
但已經足夠了。
還需要做的工作是:
1) 創建一個專門用於PostGIS的資料庫並為專用資料庫導入PostGIS支持:
# su – postgres
$ cd /usr/share/postgresql-8.1-postgis
$ createdb wen1
$ createlang plpgsql wen1
$ psql -d wen1 -f lwpostgis.sql
$ psql -d wen1 -f spatial_ref_sys.sql
2) 創建一個專門的用戶,並把相應的資料庫和數據表的屬主設置為該用戶:
# su – postgres
$ psql
$ create user wen1 password 『123456』;
$ alter database wen1 owner to wen1;
$ alter table spatial_ref_sys owner to wen1;
$ alter table geometry_columns owner to wen1 ;
3) 修改PostgreSQL配置文件以便可以遠程使用。
修改PostgreSQL的配置文件/etc/postgresql/8.1/main/Postgresql.conf,將其中的一句:
listen_address=』localhost』
前面的注釋去掉,並把』localhost』該為』*』。
修改Postgresql的配置文件/etc/postgresql/8.1/main/pg_hba.conf,在文件後面加一句:
host all all 192.168.0.0/24 password
這句的意思是:同網路中192.168.0.*的機器可以以密碼的形式使用所有的資料庫。更具
體的參數意義直接看該配置文件中的注釋就可以了。
這里一定要配置正確,否則無法在遠程連接PostgreSQL資料庫。
2.3 源碼安裝PostgreSQL和PostGIS
參閱以前寫的老文章。
三 PostGIS的使用
要使用PostGIS,需要兩方面的預備知識,一是要熟悉基本的SQL語法;二是熟悉
PostgreSQL資料庫的基本使用。
(一) 快速入門
我們使用前面創建的資料庫wen2,用戶為wen1,現在創建一個包含三個點的資料庫
test1:
首先在Etch下以wen1登陸,然後打開wen2資料庫:
$ psql -d wen2 ;
再在PostgreSQL的控制台下輸入以下命令:
wen2=> create table test1 (myID int4, pt geometry, myName
varchar );
wen2=> insert into test1 values (1, 'POINT(0 0)', 'beijing'
);
wen2=> insert into test1 values (2, 'POINT(31.5 60.87)',
'shanghai' );
wen2=> insert into test1 values (3, 'POINT(10.77 85.902)',
'tianjin' );
這樣我們利用PostGIS創建了一個包含三個點的GIS數據表。
為了能在QGIS中打開這一圖層,我們還需要為數據表創建一個主鍵:
wen2=>alter table test1 add primary key (myID);
可以看到PostGIS的使用其實就相當於使用一個經過擴展的SQL語法,上述語句熟悉
SQL語法的人一看都很熟悉,都是普通的SQL語句,不同的只不過是增加了PostGIS特殊的
geometry數據類型。
你可以再試試這些SQL語句:
select * from test1;
select myID,AsText(pt) from test1;
select Distance(pt, 'POINT(0 0)') from test1;
(二) PostGIS的Geometry數據類型
Geometry可以說是PostGIS最重要的一個概念,是「幾何體」的意思,由於PostGIS很
好地遵守OGC的」Simple Feature for Specification for
SQL」規范,目前支持的幾何體類型包
含其實例有:
POINT(1 1)
MULTIPOINT(1 1, 3 4, -1 3)
LINESTRING(1 1, 2 2, 3 4)
POLYGON((0 0, 0 1, 1 1, 1 0, 0 0))
MULTIPOLYGON((0 0, 0 1, 1 1, 1 0, 0 0), (5 5, 5 6, 6 6, 6 5, 5
5))
MULTILINESTRING((1 1, 2 2, 3 4),(2 2, 3 3, 4 5))
而geometry具體表現又有兩種形式,一種叫做WKT(Well Known Text)形式,如上面的
例子。或者使用如下SQL語句瀏覽:
select AsText(pt) from test1;
另一種叫做「Canonical Form」形式,看上去是一串古怪的數字,其實是一種增強的十六
進制編碼,使用如下SQL語句就可以瀏覽了:
select pt from test1;
(三) 讀寫PostGIS數據
建設好PostGIS資料庫之後,我們現在需要進行讀寫GIS數據了,包括把GIS寫入到
PostGIS資料庫中以及在應用程序中使用PostGIS資料庫的數據。讀寫PostGIS目前主要有以
下四種方式:
3.1 使用psql語言
Psql語言是PostgreSQL內嵌的一個命令行工具,其語法基本上和標準的SQL語法是一
致的,可以使用Psql工具,結合標准SQL語法和一些PostGIS的擴展對PostGIS資料庫進行
讀寫操作。
具體例子如上面「快速入門」中的例子。
這種方式功能強大,但全部需要手工操作,煩瑣且繁重。
3.2 使用一些小工具
有兩個很有用的小的轉換工具,一是shp2pg;一是ogr2ogr
3.2.1 shp2pgsql和pgsql2shp
shp2pgsql和pgsql2shp是PostGIS自身攜帶的一對在Shape文件和PostGIS資料庫之間進
行轉換的工具,在Debian中安裝好PostGIS之後,這兩個程序已經位於可執行文件的搜索路
徑上,因此可以在系統中任何位置使用。
假如當前目錄下有完整的china.shp文件(應該有三個同名不同擴展名的文件),需要把其
中數據輸入到上述的wen2資料庫中的數據表china_postgis中,具體操作為(操作用戶為
wen1):
$ shp2pgsql china china_postgis > tmp.sql
$ psql -d wen2 -f roads.sql
這個工具很好用,缺點在於使用范圍有限,只針對Shape文件格式。
3.2.2 ogr2ogr
PostGIS本身的shp2pg工具只把shape文件轉換到PostGIS 資料庫中,那如何把其他的
GIS數據加入呢?比如說MapInfo的mid格式,ESRI的e00格式呢?這就要使用ogr這個工
具了。
Ogr目前是gdal的一個組成部分,那什麼是gdal呢?其官方主頁(http://www.gdal.org)上
如此介紹:
GDAL is a translator library for raster geospatial data formats
that is released under an X/MIT
style Open Source license by the Open Source Geospatial
Foundation. As a library, it presents a
single abstract data model to the calling application for all
supported formats. It also comes with a
variety of useful commandline utilties for data translation and
processing.
簡單地說,Gdal是一個各種Gis數據格式的轉換軟體庫,ogr則是轉換矢量GIS數據的
軟體庫。
目前ogr能夠支持的數據格式包括:
Arc/Info Binary Coverage、DWG、ESRI Personal
GeoDatabase、ArcSDE、ESRI
Shapefile、GML、GRASS、Mapinfo File、Microstation DGN、ODBC、Oracle
Spatial和
PostgreSQL等。應該說,這就基本包括了我們平常用到的所有矢量型GIS文件格式了。
Gdal支持的柵格數據格式參閱http: //www.gdal.org/formats_list.html
下面我們從源碼編譯安裝gdal---因為我在Debian下使用apt方式安裝的gdal並不支持
postgresql資料庫,其實更為簡便的方法也許是去gdal.org下載一個Fwtools的工具包,可以
直接運行不用繁瑣的編譯,既有Windows的,也有Linux下用的,只不過這個包有些大。
1) 下載最新的gdal-1.3.2
2) 解壓
3) ./configure --prefix=/opt/gdal
--with-pg=/opt/pg/bin/pg_config --without-ogdi
這里我習慣把軟體安裝在/opt目錄下。
--with-pg參數很重要,使ogr可以支持PostGIS,後面的參數是我的PostGIS安裝的地方。
我在這里編譯很多次失敗,經過仔細查找,發現問題出在ogdi上,所以暫時我只好使
它不支持ogdi。
4) make
5) make install
下面是使用過程,假設現在我要把一個rai.mid文件導入到資料庫data1中:
$ ogr2ogr –f Postgresql PG:dbname=data1 rai.mid
注意,f參數後面跟的是導入的數據類型,最後那個文件才是要導出的文件。PG後面說
明的是資料庫的名字,需要是已經創建好的資料庫,而數據表則由程序自動創建。還要特別
注意許可權問題,以上命令我是由postgres用戶執行的。
還有一個要注意的是主鍵問題。一般情況下,你使用shp2pg或者 ogr2ogr向postgis中
增加了Gis數據後,在GIS客戶端添加postgis圖層的時候,常常會因為數據表沒有定義主鍵
而出錯,解決的辦法是,在伺服器上使用psql或者其他sql工具,使用命令:
alter table table_name add primary key (column_name);
另外我們發現ogr竟然是不支持最常見的GIS格式e00格式,好象是因為版權方面的原
因吧。解決的方法就是去sf.net查找相關工具。我在上面就找到一個e002pg工具,支持將
e00文件導入到postGIS資料庫中。
3.3 在其他GIS軟體中讀寫PostGIS數據
比如在QGIS中,能夠打開PostGIS圖層,還有SPIT插件可以把Shape文件輸入到
PostGIS資料庫中。
其他GIS軟體如uDig,Grass等,甚至連ArcInfo都支持或部分支持讀寫PostGIS數據。
3.4 利用介面在應用程序中讀寫PostGIS數據
廣大的開源GIS程序員幾乎為每一種程序設計語言設計好了讀寫PostGIS的介面,如利
用PostgreSQL的JDBC庫,可以使用Java語言在程序中讀寫PostGIS數據;利用libpq庫,
可以使用C語言讀寫PostGIS數據。
(四) 使用PostGIS函數
4.1 PostGIS函數
要能熟練使用PostGIS,掌握PostGIS的所有函數是關鍵。通過掌握這些PostGIS函數,
我們能夠高效、穩定地處理各種地理數據。由於PostGIS的函數設計時都遵守OpenGIS規范,
我們也可以把這些PostGIS叫做OpenGIS函數。
4.2 PostGIS函數的分類
PostGIS函數大致可以分為以下四類
1) 欄位處理函數
這類函數當前一共有3個,分別是:
AddGeometryColumn(var1,var2,var3,var4,var5,var6):為已有的數據表增加一個地理幾何
數據欄位。Var1代表數據表的模式(schema)的名字,一般是public,也可以省略,則使用當
前的預設模式;var2是已有的數據表的名字;var3是新的地理數據欄位的名字;var4是
SRID值,不確定的話就取-1吧;var5是地理數據的類型,可以是POINT等;var6是指該幾
何數據是二維還是三維數據。
前面的SQL語句 create table test1 (myID int4, pt geometry, myName
varchar )更規范的寫
法為:
create table test1 (myID int4, myName varchar );
select AddGeometryColumn('test1','pt',-1,'GEOMETRY',2);
DropGeometryColumn函數顯然是刪除一個地理數據欄位的;
SetSRID函數顯然是設置SRID值的。
2) 幾何關系函數
這類函數目前共有10個,分別是:
Distance Equals Disjoint Intersects Touches Crosses Within
Overlaps Contains Relate
3) 幾何分析函數
這類函數目前共有12個,分別是:Centroid Area Lenth PointOnSurface Boundary
Buffer
ConvexHull Intersection SymDifference Difference GeomUnion
MemGeomUnion
4) 讀寫函數
這類函數很多,主要是用於在各種數據類型之間的轉換,尤其是在於Geometry數據類
型與其他如字元型等數據類型之間的轉換,函數名如AsText、GeomFromText等,其作用是
顯然的。
4.3 PostGIS函數使用示例。
假設在我們的wen2資料庫中,有兩張表,一張為guojia,是從「國家基礎地理數據」
網站下載的國界數據表,數據類型為LINE;二為shengqu_polygon,也從同一個網站下載,
地理數據類型為多邊形。
1) 查詢我國邊境線的長度:
wen1=> select sum(length(the_geom)) as lenth from guojie;
2) 查詢我國面積最大的省區名字:
wen1=> select name area(the_geom) as myarea
from shengqu_polygon
order by myarea DESC
LIMIT 1;
(五) 使用PostGIS擴展函數
除了上述遵循OpenGIS的函數之外,PostGIS還自行擴展了一些當前OpenGIS規范之外
的函數,主要包括以下幾類:
5.1 管理類函數
擴展的管理類函數主要包括一些軟體版本查詢函數,如
postgis_version()、postgis_geos_version()、postgis_proj_version()函數等,分別查詢當前的
PostGIS的版本及其使用的Geos和Proj庫的版本。
5.2 數據類型的輸入輸出函數
除了OpenGIS定義的地理數據類型之外,PostGIS還對數據類型進行了擴展,這種擴展
主要是兩方面的擴展,一是把二維的數據向三維和四維擴展;二就是在WKT和WKB數據
類型基礎上擴展出EWKT和EWKB數據類型。
PostGIS提供了在這些地理數據類型和常用數據類型如字元型、浮點型數據之間進行轉
換的函數。
5.3 量算函數
如length3d函數是對length2d函數的擴展。
5.4 幾何操作函數
如addBBox(geometry)函數給所給的幾何體加上一個邊框。
如simplify(geometry,tolerance)函數可以對折線和多邊形利用Douglas-Peuker演算法進行一
些節點進行刪除,從而使表現的圖形更簡單而清晰,在網路傳輸數據時具有更高的效率。
5.5 操作符號
5.6 其他擴展函數
(六) 建立PostGIS索引
當資料庫的記錄增大的時候,如果沒有建立索引的話,操作的效率就顯著下降。
POstGIS建議當記錄數超過幾千的時候就應該建立索引,而GIS資料庫一般都是海量數據,
所以對PostGIS而言,索引就非常重要。
Shapfile文件為ESRI公司的文件存儲格式,並且得到了業界廣泛的支持。Shapfile格式是一種簡單的,用非拓樸關系的形式存儲幾何位置和地
理特徵的屬性信息的格式。雖然GeoServer採用Shapfile文件可以快速的創建網上地圖服務,但它的缺點確很明顯:
1、Shapefile只支持一個圖層,在實際中沒有意義。
2、直接保用SHP文件不安全,Shapfile文件很容易被病毒或其他原因誤刪除。
3、GeoServer中用Shapfile文件作數據源的效率是很低的。
4、Shapfile中的漢字GeoServer不能解析,會出現亂碼。
5、資料庫可以方便的對地理信息進行查詢。
用PostGIS管理空間數據
PostGIS支持GIST空間索引(附錄1)、規范窗體,能很大的提高處理效率。
OGC格式只提供二維的幾何體,且相關聯的SRID從未深入的用於輸入輸出請求,PostGIS支持OpenGIS組織"Simple
Features for
SQL"規范指定的所有GIS對象和函數,並進行了擴展,格式是EWKB、EWKT,其中增加了對3DZ,3DM和4D
坐標系的支持(當然三維、四維數據的OGC標准還未完全制定),深入引進了SRID信息。
空間數據表結構:PostGIS中存在兩個必需的元數據表格, SPATIAL_REF_SYS(空間參考表格) 和
GEOMETRY_COLUMNS(幾何體屬性列),兩個表用於存儲空間資料庫使用的坐標系統數字ID和文本描述。
PostGIS的shp2pgsql命令可以將Shapfile直接導入到資料庫中也可以導出為SQL文件,推薦先導出為SQL文件再將此文件在SQL運行窗口中執行可將數據導入資料庫。
Shapfile到SQL語句:
shp2pgsql 路徑shp數據文件名 新建的數據表名 >
路徑SQL文件名.sql
Shapfile直接入庫:
shp2pgsql -c 路徑shp數據文件名 新建的數據表名 資料庫名|psql -d 資料庫名
舉例說明:
如將一Shapfile文件「c:road.shp」導入到數據表「road」中,資料庫為「sjzmap」。
1、運行「命令提示符」。
2、切換至PostgreSQL資料庫安裝目錄中的bin目錄下。
3、執行此目錄下的shp2pgsql命令:「shp2pgsql c:road.shp road >
c:road.sql」。
4、如將此文件直接導入資料庫(不推薦):「shp2pgsql -c c:road.shp road
sjzmap | psql -d sjzmap」。
5、使用pgAdmin3
選擇資料庫,再導入表。
『貳』 如何將Postgres備份文件.backup導入到新的資料庫中
1.到www.postgresql.org下載pgadmin這個工具,安裝好
2.在菜單-文件-新增伺服器
名稱:TEST-PGSQL(名稱自己編) 主機:填上你postgresql資料庫專的伺服器ip地址在本機屬可以填上:127.0.0.1
埠號:就是埠postgreql默認是 (5432),
用戶名:就是創建資料庫時指定的超級管理員名稱,密碼:就是創建資料庫時指定的密碼。輸完後點確定,就會連接到你的資料庫。
3.找到你要導入數據的資料庫名稱,點右鍵,點」恢復「或者」備份回存「(pgadmin不同的pgadmin版本導入按鈕的名稱不一樣)。然後跳出讓你選擇xxx.backup的文件,點確定,等導入完就可以。
『叄』 如何處理大數據文件+錄入數據
客戶在集群上提供了一份.sql文件,有2個多G,用vim等編輯器打不開,只能less一部分,而且內容有亂碼(中文部分,也不清楚該份文件的編碼格式)——改一下vim的字元集配置就可以解決。
下載文件到本地,嘗試用notepad++打開,提示「File is to be opened by Notepate++」;用MySQL Workbench打開,出現卡死。
使用文件分割器,對其進行分割。把文件拆分成15等份,每份150MB。
通過less可以看到建表語句,為oracle,改成postgresql版,並建好表。打開1.zg,把insert into之外的語句刪掉後,用Navicat for PostgreSQL工具運行sql,出現字元集錯誤。
提示:
關於處理大文件imsi_param2016.sql:
該文件有2個多G,存放的內容是客戶oracle資料庫中的某張表數據。用Linux的vim等編輯器不能打開,只能less一小部分。
①下載到本地;
②使用notepad++、MySQL Workbench等工具無法打開如此大的文件;
③使用postgresql運行.sql,出現字元集編碼不一致導入失敗的問題;
④使用「橘子分割」器,把文件拆分成15等份,每份150MB,再通過Java程序對文件進行處理,過濾得到完整的sql。把oracle表轉換為postgresql版(因為to_date函數mysql沒有);
⑤再分別對15個sql文件,轉碼成UTF-8;
⑥用程序,把每個文件不完整的sql抽出,並整合成一份error.sql,再人工調整格式;
⑦15分sql文件,逐一運行,確實麻煩,寫程序自動運行,一次搞定;
⑧經過如上處理,oracle可轉為postgresql且錯誤率0%。
『肆』 求postgreSQL 的資料庫的表數據,導入導出的sql語句,謝謝!
Postgresql數據的導入和導出,以及命令介紹
如何導出PostgreSQL資料庫中的數據:
pg_mp -U postgres -f mp.sql mydatabase
具體內某個表
pg_mp -U postgres -t mytable -f mp.sql mydatabase
導入容數據時首先創建資料庫再用psql導入:
createdb newdatabase
psql -d newdatabase -U postgres -f mp.sql
把數據按照自己所想的方式導出,強大的命令:
echo " students to? stdout DELIMITER '|'"|psql school|head
(students為表名,school為庫名,各個欄位以|分隔)
echo ' (select * from students order by age limit 10) to stdout;' | psql school
『伍』 怎麼把sql文件導入postgresql資料庫
我用的pgAdmin4
1、在創建好資料庫下,『模式-public』右鍵create腳本