Ⅰ 目前主流的數據治理平台有那些。
目前國內外能稱得上數據治理平台的不多,基本上都是主數據管理平台,只不過都改個名字為數據治理平台,真正數據治理的概念可以參考dama的《數據管理知識體系指南》內容。在這個行業,國內廠商主要有四個來源,物資編碼管理廠商(2010年前入行,最早也最普及)、PDM廠商(基本是大BOM的概念,較晚)、ERP廠商(最晚,但是也屬於編碼管理的延續)和其他後續(2015年後)入行的。國外廠商主要來源有三個,客戶主數據廠商(sap、orcale、IBM、informatica)、PDM廠商(達索、Stibo)、開源主數據廠商(Talend)。
國內第一家做主數據管理平台的是一家叫中翰軟體的公司,2010年發布的自主產權MDM平台,2013年最早開啟數據治理概念,並於2014年試水發布了基於靜態數據中心管理的數據治理平台,2018年發布了數據管控平台和數據評估監測平台。
Ⅱ 國內哪個數據治理管理平台性能最好最快希望大家推薦一下,感謝!
國內哪個數據治理管理平台性能最好最快?希望大家推薦一下,感謝
如今,不少企業都想擁有屬於自己企業或產品的手機APP,但其中最困擾企業主的問題就是:開發一款手機APP到底需要多少錢?
簡單點來說,要視手機APP的需求及質量而言,價位一般在幾千到十幾萬左右,更高端的價格更高。
定製款:定製款是指APP的功能全部重新開發,過程比較繁瑣,需要美工、策劃、APP開發(前台/客戶端/手機端)、後台程序員等工種協同完成,大型的、功能復雜的APP甚至需要數十人的團隊。
由於APP的功能和設計都是定製的,因此價格會高些。定製款的開發時間與開發價格是成正比的,開發時間長,大約在兩三個月甚至不定的周期里才能完成,而費用大概在幾萬甚至十幾萬左右。
因此,想要知道開發一款手機APP需要花費多少錢,企業主首先必須把APP的詳細需求和功能告知APP開發公司,開發公司才能報出一個合理的價格。
二、手機APP平台不同,製作成本也不一樣
現在市面上流行的手機APP製作平台主要有兩種一般包括兩種系統:安卓系統(Android)和蘋果系統(IOS)。
一般來說,製作蘋果系統的手機APP軟體費用要比安卓平台的貴一些,因為蘋果公司對蘋果平台的封閉性和手機APP開發語言Objective-C的難度,都讓APP開發者加大了蘋果系統手機APP開發的難度。
三、APP製作成本包含參與人員的工資
通常情況下,開發一款APP需要產品經理、客戶端工程師、後端工程師和UI設計師各一名,這已經是製作手機APP應用軟體比較精簡的配置了,所以這些參與人員的工資也是包含在APP製作成本當中的。這些工作人員的月薪加起來可能都會超過4、5萬元。
四、APP開發公司的所在地
需要注意的是,同樣實力的APP開發公司,在不同的城市也會導致APP的成本費用高一些,如在北京、深圳和上海等地的開發公司開發成本費用就會比較高,因為當地開發人員的薪資和其他支出相對更高。
Ⅲ 數據治理到底在哪裡治對企業來說重要嗎有哪些可以進行數據處理的平台
業來說重要嗎?有哪些可以進行數據處理
Ⅳ 大數據治理平台——維度管理
蘇寧八大產業,每個產業有自己的數據集市,每個數據集市有自己的維度表,沒有統一的維度管理(包括管理規范和系統支撐)。業務痛點包含以下幾個方面:
建立統一的維度管理系統,實現對維度信息的統一管控,並為集團的數據產品提供統一的維度數據服務,包含維度開發管理,維度信息管理及維度數據服務三個方面。
維度數據
如上圖所示,ETL將採集的數據,進行數據清洗之後存儲到維度數據倉庫(磐石)中,維度系統再將維度數據倉庫中的數據同步達到維度庫系統。
維度數據存儲方式:維度數據一般以一百萬的數據量作為分割點,一百萬以上數據量的維度採用的存儲是HBASE,一百萬以下的數據採用的存儲是MYSQL。
維度數據同步方式:存儲到HBASE的維度數據採用的是BULKLOAD導入,存儲到MYSQL的維度數據採用的是SPARKSQL+RDD寫入。針對數據同步臘橡都已經實現通過頁面配置任務的方式一鍵同步,節省人工。
為什麼採用這種存儲方式?
1, 針對數據量的大小採用不同的存儲引擎,節約存儲資源,提高維度服務的穩定性。
2, 實時指標的計算:OALP需要關聯維度表和事實表做指標數據加速(實時計算指標數據)。這種需要實時的查詢維度表的所有維度屬性,調用量非常龐大,所以採用了直接查詢HBASE的方式。
3, 維度需要提供基於維度值ID查詢維度值名稱的服務(包括批量精確查詢和模糊查詢),HBASE在精確查詢上性能較高。MYSQL由於數據量不大,可以再加一層分布式緩存,提高精確查詢維度值的性能。
維度建模
1, 選擇業務過程
根據業務場景以及可用數據源
2, 聲明粒度
根據事實表及應用場景,確定匯總粒度,一般盡可能的用最細粒度
3, 確定維度
根據確定的粒度,定義對應的維度,最細粒度,也是最低層次的維度
4, 確定事實
確認將哪些事實放到事實表中,維度表只是做關聯,不做維度數據的查詢服務。
維度定義
1. 當增加新的維度時,編碼號將在已用號碼的基礎上遞增,四位十進制編碼號不能滿足需求時,可增加編碼號長度為五位十進制數,以此類推。
2. 當刪除已有的維度時,其編碼號將不再利用。
3. 當修改已有的維度時,其編碼號不變。
4. 當拆分已有的維度或合並兩個及兩個以上的維度時(數據應用場景需要),其編碼號的使用原則按照刪除原維度,並新增拆分/合並後的維度執行。
維度管理
維度:目前維度平台支持快速定義維度,通過設置維度的基本信息,選擇維度映射的維度表,做好維度與維度表的映射,設定維度的一些特性(布爾維度,時間維度,雜項維度等),檢測維度的定義結果。達到了讓業務人員能夠只是通過頁面操作就可以制定需要的維度。
維度表:數據開發人員可以通過維度庫平台定義維度表,定義好之後可以集成數據倉庫的同步任務一鍵將倉庫的數據同步到維度表中,將維度表與維度做映射關系。
維度層級:維度庫平台支持定義維度層級,只要是維度庫平台上有的維度表並且做好維度與維度的映射關系之後,就可以定義需要的維度層級,根據維度層級提供維度值的上卷下鑽查詢服務。
維度血緣:提供了維度,指標,報表的血緣關系,以及迅局歷還准備做的維度數據的血緣,維度,指標,報表調用次數的血緣等等。
維度服務
1. 維度服務調用申請:
調用維度服務,需要在維度庫管理系統中申請調用許可權。等維度管理系統授權之後,生成維度服務調用授權碼,在調用維度服務的時候帶上維度服務調用授權碼,維度服務會根據授權碼判定是否有訪問許可權。
2. 維度系統提供的服務:
1,對存儲在HBASE的維度表,我們又加了一層存儲到ELASTICSEARCH(提供維度值的模糊查詢服務)
2,針對負載較高的HBASE表,加了一層本地緩存,解決熱點問題畝搜。
3,對存儲在MYSQL的維度表,我們又加了一層存儲到分布式緩存ZEDIS(提供維度值精確查詢服務)。提供了定時或者手動刷新緩存數據的功能,以及緩存數據的監控機制。
監控分析
由於維度服務的調用量是億萬級別的,系統的監控統計,採用的是Log4j+kafka+druid的架構,如下圖所示,應用將調用日誌採用log4j- KafkaLog4jAppender寫入kafka中,再將kafka與druid集成,准實時的輸入druid中,業務基於druid做統計分析,查看維度服務調用成功或失敗的情況。
除了維度服務的調用監控,平台還有針對維度值的數據量監控(主要監控暴增或者突然沒有維度數據的情況),維度值數據質量的監控(根據維度表和事實表做數據比對,分析維度值數據的差異情況)。維度數據同步任務的監控(每個維度表的數據同步情況監控,異常告警到具體的任務負責人)。通過各種有效的監控手段,來提升維度服務的穩定性和准確性。
1. 未來平台會更加的完善,會有越來越多的維度在平台上建設,提供更加穩定和高效的維度查詢服務。
2. 能夠支持更多個性化的維度,能夠支持維度的數據版本(例如過去一段時間的維度值),支撐全集團所有數據產品的維度調用服務,將平台打造成蘇寧主數據服務的航空母艦。
3. 通過維度數據資產體系的建立,實現集團一切業務數據化,連接打通數據孤島,驅動一切數據業務化,助力企業數字化轉型,讓數據做到真正意義上的產生價值。
4. 通過提供各種維度數據支持數據產品及各類應用產品,幫助各崗位用戶在日常經營決策中做出正確決策。
目前平台的現狀及以後的規劃
1, 完善系統監控功能點:緩存任務較多,沒有有效的監控,告警機制。
2, 完善業務監控功能點:數據量監控,數據異常監控,告警功能
3, 落地維度新增、變更、下線全流程審核管理功能.
4, 完善應用層的維度、指標、報表數據鏈路的血緣分析圖譜,全方位透析資產,
5, 打通全鏈路維度變更通知的消息機制,降低數據鏈路變更帶來的風險,
6, 多系統用戶資源隔離、限流,保障多個部門在使用和體驗上的一致性,
7, 支持用戶自定義維度、完善個人工作台,基於通用維度進行維度的衍生,
8, 維度門戶的建設,將業務端和管理端進行隔離,提升用戶體驗
Ⅳ 用大數據打造「三共」社會治理格局
用大數據打造「三共」社會治理格局
近些年來,社會變遷使得我國社會治理創新面臨多重挑戰,大數據思維可以促進整體性治理、精準化治理和參與式治理,提升我國社會治理的水平。我國各級政府的治理手段越來越依靠以雲端存儲為載體的大數據平台,民眾生活也越來越依賴以大數據分析為基礎的智慧化終端,大數據平台的建構越來越成為社會治理必不可少的一環。政府要不斷增強大數據在創新社會治理方面的優越性,通過建構多種模式的大數據社會治理平台加以實現。
其一,需求導向模式。即從「用戶」出發來構建大數據治理平台,「用戶」即普通民眾。十九大報告指出,中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾。百姓美好生活需求是什麼、民眾的痛點在哪裡,成為大數據參與社會治理的前提。獲取「用戶」需求,仍需要諸如智庫等第三方社會主體通過科學的方法來收集,並長期跟蹤獲得不斷變化的需求,為大數據社會平台提供准確的需求信息。獲知用戶需求後,政府和市場聯手搭建大數據社會治理平台,開發符合民眾需求的產品和服務。
其二,政績評估模式。在當前我國行政體制的運轉模式下,社會治理的績效在相當程度上應體現為政府績效,要杜絕「唯GDP論」的考核方式,將大數據平台的搭建納入幹部考核范圍,敦促政府尋求建立科學、高效、易用的大數據平台。目前較為流行的是BOO(Building-Owning-Operation)模式,即各級政府根據當地情況提出建設要求,大數據公司依託專業技術完成平台設計,社會主體按照實際需求進行運營評估。在這種模式下,政府不投入人力、不幹預運營、不主導評估、不獲得產品所有權,僅需為交付的產品買單而獲得使用權,不僅節省人力物力,而且讓專業人員運營平台更保證了數據的真實性。
其三,市場運營模式。構建大數據平台是一個共建共治共享的工程,它的建設成敗在於社會是否有活力,市場是否有熱情。在市場運營模式中,政府和社會主體分別提出需求,通過大數據公司的市場化創建與運營,調動市場主體的積極性,促進供需方進行公平交易,為頂層制度設計和基層社會治理提供保證,實現收支平衡的大數據平台常態化運轉。例如目前走在互聯網技術創新前沿的BAT(網路、阿里巴巴、騰訊)等大型互聯網企業正立足既有資源再創新,利用企業自身力量推出大數據的治理平台,推動政務服務便利化。
目前我國大數據推動社會治理創新還剛剛起步,對社會治理創新未能發揮真正的引導作用。而大數據的開放精準運用,必定會將社會引向共治共享。這需要突破以下瓶頸:
打破「數據孤島」,完善大數據基礎建設,由政府、市場和社會多主體共建大數據治理平台。由於收集技術和制度體系不健全,我國目前政府數據的調查、編碼和存儲的科學程度並不高;政府部門條塊分割,形成「數據孤島」,許多政府公共信息仍處於零散、分割、封閉狀態;政府主導建立大數據治理平台缺乏其他主體參與,完全依靠政府力量往往難以完成或者效率不高。此外,大數據前提是統一、連接和共享。政府部門之間要摒棄「地方保護主義」和「自我保護主義」,通過規范政府數據採集的標准、建設統一的政府大數據中心,推進公共數據開放和基礎數據資源跨部門、跨區域共享,優先推動信用、交通、醫療、衛生、就業等領域數據向社會開放。除了打通政府各個部門和條塊,還需要政府、市場及社會的共同參與構建大數據治理平台。目前以BAT為代表的互聯網巨頭成為收集大數據的先頭兵。社會民眾也在生產大量數據,如社區居民通過互聯網互動就是大數據的生成過程。因此要推動政府、企業和社會信息資源共建共享和開發利用,形成優勢互補、多元參與、開放競爭的發展格局。
運用大數據思維,深入挖掘大數據,多方低成本使用此平台的大資料庫及分析成果推進社會治理。「大數據」真實價值隱藏於各種各樣、毫無規則的數據之下,要發掘數據背後的價值並真正加以利用,才是大數據推動社會治理創新的關鍵。建立大數據社會治理平台仍是第一步,不解決好應用和服務的問題,重金打造的開放大數據平台很容易「空心化」,難以對社會治理和社會福祉產生應有的支持。從大數據社會治理平台上,政府、市場和社會等各類社會治理主體可以低成本地通過獲取、存儲、管理、分析等手段,將具有海量規模的大數據變成活數據,並廣泛應用於社會治理領域,服務不同社會群體。
全面提升共享意識,助力治理能力升級,引導由此形成的福利增值和精神歸屬。大數據的平等、開放和共享,與社會治理共享共融的本質有共通之處,政府利用大數據的契機,在全社會形成共享的精神:引導各類社會主體整合和開放數據,形成政府信息與社會信息交互融合的大數據治理平台,構建民主開放的社會氛圍;引導基層民眾參與社會協商、社區自治,促進政府與社會之間的協同和合作;引導社會和民眾尊重規則、秩序、信用等,培育全社會的公共文明和契約精神
Ⅵ 數據治理有哪些好的平台工具
國內的數據治理工具平台有睿治數據治理平台
功能描述:睿治智能數據治理平台由億信華辰自主研發,融合元數據管理、數據標准管理、數據質量管理、數據集成管理、主數據管理、數據交換管理、數據資產管理、數據安全管理、數據生命周期管理九大產品模塊,各產品模塊可獨立或任意組合使用,打通數據治理各個環節,可快速滿足政府、企業用戶各類不同的數據治理場景。
國外的數據治理工具平台有:
Alation
平台:ASG Technologies
描述: Alation為廣泛的數據智能解決方案提供了一個平台,包括數據搜索和發現,數據治理,數據管理,分析和數字轉換。該產品具有行為分析引擎,內置的協作功能和開放的界面。Alation還可以分析數據並監視使用情況,以確保用戶對數據准確性有準確的了解。該平台還可以洞察用戶如何從原始數據創建和共享信息。
ASG技術
平台: ASG企業數據智能
描述: ASG Technologies提供了一個數據智能平台,可以發現來自220多個傳統和大數據源的數據。該工具具有通過模式匹配,參考數據集成和豐富指標進行自動數據標記的功能。自動化業務流水線使用戶可以更好地了解他們的數據,並且治理功能包括在數據湖和傳統來源中跟蹤數據的能力。ASG的EDI產品提供了令人印象深刻的功能組合,其中的參考客戶稱贊供應商對各種業務用例的支持。
Ⅶ 如何推進大數據平台建設
隨著信息技術的飛速發展,各領域的數據量都在爆發式增長,尤其在雲計算、物聯網、移動互聯網等技術得到廣泛應用之後,數據的增長實現了從量變到質變的轉型,大數據如浪潮般席捲而來,人類社會進入大數據時代。大數據不僅僅只是一次顛覆性的技術革命,更是一場思維方式、行為模式與治理理念的全方位變革,尤其在政府治理領域,大數據帶來了巨大的變革潛力和創新空間。在「全面深化改革,推進國家治理體系和治理能力現代化」的時代背景下,應充分重視大數據在政府治理中的重要價值,牢牢抓住大數據為政府治理提供的創新機遇,切實提高各級政府部門的治理能力。
一、大數據為政府治理理念轉型帶來新機遇
治理理念的轉型是提升政府治理能力的前提,理念的轉型需要新文化、新思維的融入,大數據所蘊含的數據文化與數據思維恰好可以為治理理念轉型提供突破口,基於大數據探索政府治理的多元、多層、多角度特徵,最終實現以政府為主體的政府管制理念向以協同共治、公共服務為導向的政府治理理念的轉型。在大數據時代,政府治理的依據不再是個人經驗和長官意志,而是實實在在的數據,在過去深入群眾、實地調研考察的基礎上,系統採集的客觀數據和實證分析的科學結果將成為最為重要的政府決策依據。「尊重事實、推崇理性、強調精確」的特徵和「用數據說話、用數據決策、用數據管理、用數據創新」的理念將成為政府治理理念轉型的核心要義。
二、大數據為政府治理模式創新帶來新機遇
大數據通過把數學演算法運用於海量數據,從數據中尋找相關關系,通過這種相關性預測事情發生的可能性,這是大數據方法論的核心思想。此外,依託於大數據技術和平台,通過外包、眾包等靈活的組織方式,可以推動政府治理的組織架構從科層、分割、封閉向開放、協同、合作轉型,因此把大數據的方法和手段引入到政府治理領域,是實現政府治理模式創新的有效路徑。基於上述方法論,大數據為政府治理模式創新帶來的新機遇主要包括:從粗放式管理到精細化治理、從單兵作戰型管理到協作共享型治理、從被動響應型管理到主動預見型治理、從電子政務管理到政府2.0治理、從風險隱蔽型管理到風險防範型治理,最終實現全面數據驅動的治理模式創新。
三、大數據為政府決策科學化帶來新機遇
隨著公共事務的日益復雜,僅憑個人感知已經很難全面了解所有正在發生的事情並做出正確判斷,政府部門想要提高決策的科學性,就需要把大數據思維與技術運用到政府治理與決策中,依靠大規模數據的收集來直觀呈現經濟社會運行規律,通過相應的數據挖掘來輔助政府部門進行科學決策。大數據為政府決策科學化帶來的機遇主要體現在兩個方面:首先,在決策的制定階段,大數據背景下,政府決策不再是個別領導幹部「拍腦袋」做出的,而是通過「用數據說話」,讓聽得見炮火的人(數據)做出決策,這樣的政府決策是在對客觀數據進行科學分析、充分了解客觀現實的基礎上做出的,這樣大大提高了決策的精準性、適用性和科學化水平;其次,在決策實施效果的跟蹤反饋階段,通過物聯網和社交網路的普及,大量的客觀數據能夠快速匯集給決策者,通過這些數據對決策的實施過程和效果進行實時監控,能夠更全面地掌握決策的實施效果和下一步的改進方向。
四、大數據為政府服務效能提升帶來新機遇
提升政府服務效能是政府治理能力提升的重要支撐,也是大數據背景下服務型政府建設的關鍵所在,在政府治理的范疇下,提升政府服務效能主要包括政府部門行政審批的效率提升和公共服務產品的質量提高兩個方面。在提升行政審批效率方面,大數據可以打通各個政府部門的信息孤島,打破各部門數據的條塊分割,通過構建統一的政府行政審批雲平台,讓數據為老百姓「跑腿辦事」,省去了「跑斷腿、磨破嘴,辦事跑十幾個部門,蓋幾十個公章」的苦惱和無奈,這樣既提高了行政審批效率,又節約了政府開支。在提高公共服務產品質量方面,大數據通過對公共服務產品數據和服務對象數據的挖掘、分析,提升公共服務產品供給的精準化、分層化、個性化;通過公共數據的開放和兼容,讓公眾參與到公共服務產品設計、提供和監督等各個環節,實現公共服務產品質量的提高。
Ⅷ 從大數據平台到數據治理,智慧醫院大數據何去何從
背景:上周看了阿里章劍鋒寫的一篇大數據文章,加上對健康醫療大數據相關政策的分析,想就醫院大數據的建設說幾點看法,畢竟國家健康大數據戰略下智慧醫院大數據是必然先驅,有大數據抱負的醫院信息科大部分還在摸著石頭找過河的路,而其他行業的經驗還是很有借鑒意義的。
2019年6月,中國衛生信息與健康醫療大數據學會會長金小桃(中國衛生信息學會會長)在6月20日的2019(14th)中國衛生信息技術/健康醫療大數據應用交流大會上發布《新一代醫院數據中心建設指南》(盡管找遍網路都沒找到這個指南,可能還在整理中...)
而基本同一時間,國家衛健委統計信息中心初版了《醫院數據治理框架、技術與實現》,對「醫院大數據」明確為「醫院數據」,這也是我一直在解釋的名詞,正符合大數據的正確引導和深度理解。
2019年的廈門CHIME,中國醫院協會信息專業委員會發布了《醫療機構醫療大數據平台建設指南(徵求意見稿)》。在結合2015年以來的每年一批的健康醫療大數據國家戰略政策指導,大數據國家戰略的決心和國家支持引導的力度可見一斑,而醫院側信息化的現階段熱點就是醫院信息平台,信息平台的熱方向就是醫院大數據和人工智慧,當然這脫離不了首先建設完備的醫院信息化系統。我們再來看一個政策:
2018年4月,國家衛生健康委員會規劃與信息司發布了《全國醫院信息化建設標准與規范(試行)》。它是在2016年《醫院信息平台應用功能指引》和2017年《醫院信息建設應用技術指引(試行)》基礎上,形成的較為完整的醫院信息系統體系框架。在《醫院信息平台應用功能指引》明確醫院信息化功能和在《醫院信息化建設應用技術指引》上明確了醫院信息化技術。看醫院信息化完整地圖,雲計算、大數據、物聯網以及傳統信息化支撐的是金字塔頂端的人工智慧,最近幾年AI大數據經常被一起稱呼,不可能脫離信息化基礎和大數據基礎去建設AI的空中樓閣。所以大數據和AI找同一廠家(或者同一生態圈)建設會是最好的選擇,畢竟做AI的一定先做數據,但是做數據的卻不一定做得好AI,看市場上那麼多數據搬運工公司就清楚了,這也是造成醫院大數據前期建設重數量輕質量的主要原因。
再來看大數據的宏觀發展環境,從2009年閃亮登場到2015年泡沫頂峰,已經邁過了甘特曲線的2個關鍵節點,現在正處於穩步發展。
大數據技術的2個維度是我覺得章劍鋒最深刻的大數據概念解析,垂直的技術棧維度和水平的數據流維度,也就是垂直的平台+應用,水平的數據處理。何為大數據?這一輪數據到大數據的概念,水平維度的數據處理理論正式出現已經30年了並沒有大變化(這個維度數據大數據都應該稱為數據處理),而聚變的是技術棧維度:hadoop、spark、storm、flink等等,但是閃亮的hadoop不也在沒落么,因為技術為業務而生,符合業務需求的才是最合理的技術。而醫院大數據建設出的第二個比較大的問題就是追求新技術典型如hadoop,就醫院數據體量和應用需求,hadoop真不是最佳實踐,而繁雜的運維和龐大高昂的資源硬體成本可能是壓垮信心的根本原因。
再來看醫院大數據上雲,盡管很多人覺得國內是數據隱私和數據安全比較寬松的環境,但是醫院數據側一直都比較謹慎。雖然最近國內出了政策,允許醫院將患者數據對患者開發,但是把醫院數據放在廠家提供的雲上,對於大型三甲醫院目前依然不現實。醫院除了診療水平,最重要的資產就是醫院數據,醫院數據又比較敏感,醫院本身是要遵從嚴格監管的,所以按照當前形勢,更適合醫院的還是數據在醫院(很多醫院通過免費大數據戰略合作協議讓醫院數據上醫某雲)。
還是回到大數據平台,伴隨著大數據概念火熱,hadoop缺在逐步沒落,就大數據技術棧本身,不存在hadoop架構和oracle架構的選擇(在這個點上大量概念混淆,oracle和hive HDFS只是存儲方案的差異,hadoop是大數據完整技術棧),只存在數據存儲架構的選擇,根據數據量、數據使用方式、數據分析方式決策更合理的架構,選了hadoop就不能用oracle嗎?這是醫院大數據平台建設里經常混淆的點。根據應用場景選擇存儲方案,根據數據分析需求選擇技術棧,如果不清楚需求,何不來個混合架構搞個萬金油?其實醫院大數據,oracle是可以用的,國產化另論。如果定了oracle是不是就不能用hadoop了呢?
這里又引申到另一個問題,Hadoop、Spark、Flink等大數據技術的發展,醫院大數據建設技術要求必提,但是真正建了之後會發現好像哪裡不對勁,難道大數據就是這么高大上到信息科要大量學習新技能嗎?能用的技術才是好技術,自己都用不了的一定有問題。其實醫院信息科真正需要的不應該是Hadoop、Spark、Flink等大數據技術的堆砌,應該是信息科都可以簡單上手操作做數據治理,以這些技術為基礎的能解決業務問題的產品。也即真正的易操作、專業化、流程化、全鏈路的數據平台(絕對不是hadoop),這個平台准備後續專門介紹。
智慧醫院從大數據平台的建設到數據治理平台建設,大部分是從技術棧的hadoop轉向數據專業治理本身,也就是從垂直的技術棧維度轉換為橫向的數據流維度,還是要平台,而此平台已經不再hadoop。數據治理到底如何做呢?參見前一篇文章《如何做數據治理》,數據治理最早成熟應用是在零售業、銀行業,以及運營商,現在每個AI互聯網公司都會有數據部門,醫院數據治理可能還是先解決自身的業務問題本身,能不能發展到數據中台,還要看醫院戰略,而不是各種廣告中的概念。
還有一點需要補充的,中美貿易摩擦,美對中進行了嚴格的出口管制,無論從硬體還是軟體,能支持國產化會是一個更好的選擇。
最後,數據治理本身是一個重運維重交付重實施的事情,當前市場大量充斥草台班子的數據搬運,沒有深度長期的價值挖掘,再好的搬運工做的也是勞民傷財的事,參考谷歌和梅奧的十年戰略合作協議,這才是醫院大數據真正有遠見的規劃。
簡單總結下,智慧醫院大數據發展趨勢:
1. 政策會頻繁頒布,醫院大數據(數據)建設一定是必然,目前已經開始穩步發展;
2. 大數據平台概念會褪去,醫院真正需要的一定是全產業鏈整合的數據管理平台;
3. 智慧醫院會更加重視數據流即數據治理本身,現階段還需要一套簡單上手的平台輔助;
4. 智慧醫院大數據中心依舊以私有雲機房為最佳方案;
5. 智慧醫院大數據中心需要兼容國產化需求;
6. 找一家AI大數據公司作為長期戰略合作夥伴將更加現實,畢竟只講大數據的大部分都是數據搬運工;