導航:首頁 > 數據分析 > 數據開發怎麼設計介面模型

數據開發怎麼設計介面模型

發布時間:2024-04-10 15:28:46

⑴ 數據倉庫數據建模的幾種思路

數據倉庫接典型的兩種數據倉庫建模的理論是維度建模和基於主題域的實體關系建模,這兩種方式分別以Kimball和Immon兩位大師為代表。維度建模以數據分析需求為驅動,倡導匯流排架構:一致的事實和一致的維度,這種數據模型易於用戶理解和數據分析操作。基於主題域的實體關系建模以源系統數據為驅動,整合企業的所有數據,站在企業級的高度對數據進行抽象,整合,採用3NF的實體關系理論建模,這種數據建模方式以更為抽象的方式嘗試建立一個相對穩定的數據模型,並能描述企業級的數據關系。在工業界往往把兩種方式結合起來運用數據倉庫的不同數據層次結構中。
我們上周主要是針對採用基於主題域的實體關系建模中數據整合的方式進行較為深入的討論,討論了以下三種思路:
以屬性聚集的方式同一主題域中不同實體的屬性。比如對於會員、公司、客戶等等實體對象我們都有地址屬性信息、名稱標識屬性信息等等,這種思路就是把屬性內聚性高的欄位整合在一起,並把不同的屬性打上類型標識以樹表的形式存放。它的優點是:第一,模型穩定性好,外圍系統變化了欄位,只需要添加不同的類型,不需要進行表結構的變更;第二,減少大量冗餘記歷史數據。它的缺點是:第一,丟失了很多實體的屬性標識信息,我們從模型上將看不到一個會員究竟有哪些地址屬性,只能通過查詢類型代碼才能獲取這些信息;第二,它極度的膨脹數據表的記錄數,因為它採用豎表的形式存放;第三,應用起來很難,效率是一個大問題,因為我們往往要使用一個實體的多個欄位,就會有很多join操作和豎轉橫的操作。第四:屬性聚集也是一件比較難操作的過程,應為這是一個抽象的過程,對建模人員的業務背景知識和抽象能力都提出了很高的要求;第五:雖然減少了冗餘的記歷史數據,但是記歷史的操作也較為復雜。
採用面向對象建模的方式,抽象不同實體的共同屬性,然後再一步步採用繼承、組合等面向對象的思想具體化實體。他的優點是模型模型概念比較清晰,缺點也是模型相對不是很穩定,整合後的數據的後續應該也面臨重新組合的問題。
貼源的建模方式:
採用基本保持源系統的方式進行建模,重點放在數據的標准化,一致化,和數據業務意義的梳理。這種做法和我們目前數據倉庫的做法比較類似。它具有實施比較容易,快速實現,前台可以直接使用數據;缺點是整合度不高,模型不穩定。
模型終究是為數據分析應用服務的,具體採用什麼方式建模需要根據實際業務特點和源系統的特點決定。阿里巴巴的源系統具有變化快,數據分析應該變化快的特點,響應速度也要快的特點,而且我們要求不同系統之間整合的需求並不是很大,往往深度的數據整合帶來的是應用上的不方便。因此,我個人覺得採用貼源的方式是當前更優的方案。

閱讀全文

與數據開發怎麼設計介面模型相關的資料

熱點內容
52好壓右鍵沒有壓縮文件選項 瀏覽:98
avi什麼類型的文件格式 瀏覽:418
分區表與文件系統 瀏覽:786
獲得文件夾路徑的對話框 瀏覽:179
弟子規哪個版本的好 瀏覽:423
二手蘋果6p的價格 瀏覽:111
微信公眾號版頭設計 瀏覽:917
jdk18讀取配置文件 瀏覽:72
優化關鍵字挖掘工具 瀏覽:672
markdown代碼塊語法 瀏覽:249
arcgis面文件屬性 瀏覽:43
當數據都帶有標准差如何計算 瀏覽:936
聲音挑選程序掃描本地 瀏覽:57
編程語言中如何拼接兩個字串符 瀏覽:482
工地數據中心包括哪些 瀏覽:972
人工成本分析工具 瀏覽:565
蘋果qq群文件在哪裡 瀏覽:724
產品和單位成本分析後有哪些數據 瀏覽:144
日語教程軟體 瀏覽:99
有哪些事業編制的app 瀏覽:89

友情鏈接