1. 百度地圖中共有哪些數據類型
你好,很高興回答你的問題。 統計數據一般分為兩大類:計量資料和計數資料,其中,計量資料又叫定量資料或者數值資料,都是一個意思。 計數資料依據資料類型又分為無序分類資料和有序分類資料,其中,有序分類資料有叫等級資料。打個比方,資料為「男、女」或者「血型a\b\ab\o」,它們之間都是平行對等的,就叫無序分類資料;而資料為「療效,分為痊癒、顯效悶世、有效、無效」,它們之間有明顯的等級關系,就叫有螞凱肢序分類資料,又稱等級資料。 另外,尚需考慮個類型資料孫喚是單樣本,兩樣本還是多樣本,單應變數還是多應變數,單自變數還是多自變數,這樣才能得出正確的統計思路。
2. 高德,百度地圖的數據從哪裡來的,怎麼那麼准
要明白地圖的數據分類,必須先理解一個概念,就是地圖圖層的概念:
如上圖,電子地圖對我們實際空間的表達,事實上是通過不同的圖層去描述,然後通過圖層疊加顯示來進行表達的過程。
對於我們地圖應用目標的不同,疊加的圖層也是不同的,用以展示我們針對目標所需要信息內容。
其次呢,讓我們來引入一下矢量模型和柵格模型的概念,GIS(電子地圖)採用兩種不同的數學模型來對現實世界進行模擬:
矢量模型:同多X,Y(或者X,Y,Z)坐標,把自然界的地物通過點,線,面的方式進行表達。
柵格模型(瓦片模型):用方格來模擬實體。
我們目前在互聯網公開服務中,或者絕大多數手機APP里看到的,都是基於柵格(瓦片)模型的地圖服務,比如大家看到的網路地圖或者谷歌地圖,其實對於某一塊地方的描述,都是通過10多層乃是20多層不同解析度的圖片所組成,當用戶進行縮放時,根據縮放的級數,選擇不同解析度的瓦片圖拼接成一幅完整的地圖(由於一般公開服務,瓦片圖都是從伺服器上下載的,當網速慢的時候,用戶其實能夠親眼看到這種不同解析度圖片的切換和拼接的過程)。
對於矢量模型的電子地圖來說,由於所有的數據以矢量的方式存放管理,事實上圖層是一個比較淡薄的概念,因為任何地圖元素和數據都可以根據需要自由分類組成,或者劃分成不同的圖層。各種圖層之間關系可以很復雜,例如可以將所有的道路數據做成一個圖層,也可以將主幹道做成一個圖層,支路做成另外一個圖層。圖層中數據歸類和組合比較自由。
而對於柵格模型(瓦片圖)來看,圖層的概念就很重要的,由於圖層是生成製作出來,每個圖層內包含的元素相對是固化的,因此要引入一個底圖的概念。也就是說,這是一個包含了最基本,最常用的地圖數據元素的圖層,例如:道路,河流,橋梁,綠地,甚至有些底圖會包含建築物或者其他地物的輪廓。在底圖的基礎上,可以疊加各種我們需要的圖層,以滿足應用的需要,例如:道路堵車狀況的圖層,衛星圖,POI圖層等等。
底圖通常是通過選取必要地圖矢量數據項,然後通過地圖美工的工作,設定顏色,字體,顯示方式,顯示規則等等,然後渲染得到了(通常會渲染出一整套不同解析度的瓦片地圖)。
當然,即便在瓦片圖的服務中,在瓦片底圖之上,依然能夠覆蓋一些簡單的矢量圖層,例如道路走向(導航和線路規劃必用),POI點圖層(找個飯館加油站之類的)。只不過瓦片引擎無法對所有地圖數據構建在同一個空間數據引擎之中,比較難以進行復雜的地圖分析和地圖處理。
那麼既然瓦片圖引擎有那麼多的限制和缺陷,為什麼不都直接使用矢量引擎呢?因為瓦片圖引擎有著重大的優勢:
1.能夠負載起大規模並發用戶,矢量引擎要耗費大量的伺服器運算資源(因為有完整的空間數據引擎),哪怕只是幾十上百的並發用戶,都需要極其誇張的伺服器運算能力了。矢量引擎是無法滿足公眾互聯網服務的要求的。
2.由於地圖美工介入的渲染工作,瓦片圖可以做得非常好看漂亮和易讀,比較適合普通用戶的瀏覽
附:一張矢量地圖截圖:
說了這么多了,其實主要就是為了引入圖層和底圖的概念,以方便說明下面的地圖數據分類。
地圖分類數據
為了說明數據的來源和採集渠道,採集方法,我們可以將地圖數據分為以下三大類型,而今天我們只以底圖地圖為例來講:
底圖數據:其實就是地圖中最基本的地物外形數據及一定的相關附加信息(例如道路名,河流名等)。事實上隨著遙感和航拍衛拍技術的進步,這部分數據依賴實地採集的比例已經越來越小,商業地圖數據商,尤其以高德為代表,處於成本收益考量,基本已經很少採用實地採集的方式了。這部分的數據主要來源於3種:官方地圖:嚴格來說,這不能說是一種單獨的渠道,因為官方地圖的數據本身,也是來源於下面的兩種渠道,但是官方地圖一般來源於政府相關部門的權威測繪和發布,因此也單算成一種渠道。當然,需要說明的是,地圖廠商能從國家權威部門拿到或者買到的地圖,要比我們日常在街上商店裡買到的地圖要精細豐富很多,當然,很多時候也是用電子格式提供的。
當然,無論任何國家,真正高精度的地圖(例如1:200比例或更高)是受限制不會對外公布的。(相對應給大家參照的是,我國規定互聯網上可以公開發布的地圖,最高精度是1:10000)
實地外采:說白就是測繪人員利用專業的儀器儀表,在實地環境中測繪所得到的。這樣的採集方法耗時耗人都非常厲害,一則成本高,二則周期長,三則是采環境要求高(去喜馬拉雅山去測測能弄吐血了),而且未必能夠完全跟得上中國現在的城市變化。但是優點在於精度高,置信度,准確度非常高。這是國家測繪部門主要採用的手段,對於像北京市這樣一個城市來說,一般幾年才會完整重新測繪一輪。一般對於大多數商用測繪時,只是用在少數局部需要時,重點測繪才用得到。
這個大家馬路上應該也偶爾能見到當然,在精度和准確度要求沒有那麼高的地方,實地採集也可以使用一些成本更低更便捷的工具,而不是專業測繪設備。例如用攜帶高精度GPS或其他定位的手持智能設備步行以繪制輪廓等。
航片衛片製作:就是通過自己拍攝或者購買的高精度航空照片或者衛星照片或者遙感照片,在此作為底片的基礎上進行人為的矢量標注和勾勒,從而形成自己的矢量數據。現在的航片或者遙感片的精度已經可以很高了,一般來說做到精度在0.05米的程度已經很容易。高德自己的航片據說已經可以做到0.03米的精度,對於商用地圖數據來說,通常已經夠用了。即便作為國家權威測繪,在大量荒郊野嶺的測繪,也主要依賴於這種手段。
目前常用的航拍或者衛拍手段包括機載數碼攝像,機載遙感以及三維激光掃描(主要用於3D地圖數據採集)
0.05解析度航片
衛片路網標注
航片/衛片標注和勾勒,前面是在底片上的操作,後面是勾勒標注後得到的矢量圖
數據加工製作示意圖(來源於高德某公開資料)
從這部分數據來說,網路是沒有自己的採集生產能力的,也沒有執照(沒有測繪資質)。網路的這一塊數據主要是向四維圖新買的。國內這一塊的數據,主要有兩家供應商,就是高德和四維圖新。四維圖新和國家測繪單位的關系非比尋常,其數據依賴國家測繪單位供給的佔大頭(當然也有互相供給的)。高德也有一部分數據來源於國家測繪單位的供給,但是高德自己的航拍製作的能力還是不錯的(還承擔過一些國家測繪機關的測繪任務),相對來說,依賴國家測繪單位數據的比例要低一些。
總的來說,這部分數據的採集生產,在中國需要國家認定的資質,有資質的除了國家測繪機關以外,商業機構本來就不太多,而真正在這個數據供給市場上活躍的,現在主要就是高德和四維圖新這兩家。其他無論是谷歌地圖也好,蘋果地圖也好,這部分的數據,基本上都是從上述兩家購買的。
就國內的情況來看,主要的數據都依賴於採集。這點和國外發達國家有比較大的差別。在國外發達國家,由於建設速度相對比較緩慢,政府的信息化水平以及信息透明做得較好,其實不需要那麼多採集工作。
3. 百度地圖中整合了哪些數據源
1、交通擁堵數據:這個一般來源於專業的數據供應商,這些供應商和交通部門有較深合作,其數據採集主要依賴於改喊前在計程車上核清安裝的GPS來採集實時車速為主,或者通過攝像頭,紅外探頭,雷達測速測量車速為輔;
2、三維數據:主要依賴激光掃描以及手工建模處理等;
3、假三維數據(那種不能旋轉的滲凳45度三維俯視圖):依賴照片拍攝和材質帖紋手工製作;
4、街景:依賴實采拍攝。