❶ 有適合中小企業數據存儲管理的一體機嗎
中科熱備是中科院國科創新孵化的創新企業,發明世界領先的「備份虛擬化技術」, 成功研發出熱備雲系統,是領先的雲計算、雲存儲、雲備份、大數據提供和運營服務商,是我國雲安全,網路安全及數據安全,容災備份行業研發時間最長、綜合實力最強的企業之一。擁有完全自主知識產權,掌握核心技術。自主研發的雲計算平台能夠幫助政府,軍隊,企事業單位建立各操作系統、管理應用系統與存儲介質之間的跨平台無縫連接,為用戶提供數據存儲、備份、安全、高可用 、數據遷移以及數據容災等不同層次的一體化存儲解決方案和專業而完善的服務。
產品優勢
統一保護
物理、虛擬和雲環境
全面的 IT 環境兼容性: 不僅支持傳統 IT 環境下的應用平台保 護, 同時支持物理機、 虛擬機、各種雲環境等現代化工作負載的保護。豐富的數據保護手段: 超越傳統方案中的單一保護技術, 集持續數據保護、集中備份技術等於一身, 滿足不同 SLA 要求。
採用對資料庫整體進行一致性備份, 這樣確保備份中的所有數據文件及控制文件都在備份的那一刻經歷過相同檢查點, 保障和資料庫同步同模式寫入, 實現了資料庫事務的一致性。藉助重復數據刪除、永久增量備份、多並發備份等豐富的數據保護技術。
一體化架構: 相比於傳統分散式購買與管理的4S 方案, 一體機不僅兼具性能優勢, 同時降低50 % 以上的 TCO 。
運維管理簡易: 提供All- in- One- Web 管理模式, 一個頁面即可實現日常管理; 一體化的架構也大幅降低不同組件的運維復雜度。
應用場景
雙雲熱備
熱備雲一體機,幫助打通多雲間的數據壁壘,在任意雲之間自由平滑流動,還可以通過 快照、備份、復制、歸檔、cdm、cdp、數據分層等多方式結合實現輕松跨雲,不被任 何雲供應商綁定。零數據丟失,100%業務連續性,支持任 意 Cluster,支持存儲異構,主機不需要 Agent,不消耗主機、網路、存儲資源,反向自動恢復同步和路徑回切,斷點續傳重新完成同步過程。
集中備份
統一保護:為操作系統、資料庫、應用等提供統一保護。 分級保護:根據不同業務系統及數據的優先順序,採用定時備 份、持續數據保護、業務容災等分級多層次保護
異地備份
支持遠程容災伺服器接管期間數據變化一致性的反向復制。 支持數據傳輸的斷點續傳和網路帶寬流量控制。
支持一對一、N對一、一對N、級聯復制方式,環境多樣性。 支持一鍵接管容災機,保持原有生產機的保護策略,保障業務持續運行。
備份上雲
備份過程可支持源端重刪、存儲加密、傳輸加密、傳輸 多並發、分時段限速、斷點續傳等豐富特性。支持歸檔數據 至多種雲存儲,包括華為雲 OBS、騰訊雲 COS、移動雲、華為 FusionStorageObject、阿里雲 OSS、紫光雲,以及其它任意支持 S3協議的公有雲或私有雲對象存儲.
❷ 一份難得的資料庫市場分析報告
目錄
- 資料庫分類維度:關系型/非關系型、交易型/分析型
- NoSQL資料庫的進一步分類
- OLTP市場規模:關系型資料庫仍占營收大頭
- 資料庫市場份額:雲服務和新興廠商主導NoSQL
- 開源資料庫 vs. 商業資料庫
- 資料庫三大陣營:傳統廠商和雲服務提供商
最近由於時間原因我寫東西少了,在公眾號上也轉載過幾篇搞資料庫朋友的大作。按說我算是外行,沒資格在這個領域品頭論足,而當我看到下面這份報告時立即產生了學習的興趣,同時也想就能看懂的部分寫點心得體會分享給大家。
可能本文比較適合普及性閱讀,讓資料庫領域資深的朋友見笑了:)
資料庫分類維度:關系型/非關系型、交易型/分析型
首先是分類維度,上圖中的縱軸分類為Relational Database(關系型資料庫,RDBMS)和Nonrelational Database (非關系型資料庫,NoSQL),橫軸的分類為Operational(交易型,即OLTP)和Analytical(分析型,即OLAP)。
按照習慣我們先看關系型資料庫,左上角的交易型類別中包括大家熟悉的商業資料庫Oracle、MS SQL Server、DB2、Infomix,也包括開源領域流行的MySQL(MariaDB是它的一個分支)、PostgreSQL,還有雲上面比較常見的SQL Azure和Amazon Aurora等。
比較有意思的是,SAP HANA正好位於交易型和分析型的中間分界處,不要忘了SAP還收購了Sybase,盡管後者今天不夠風光了,而早年微軟的SQL Server都是來源於Sybase。Sybase的ASE資料庫和分析型Sybase IQ還是存在的。
右上角的分析型產品中包括幾款知名的列式數據倉庫Pivotal Greenplum、Teradata和IBM Netezza(已宣布停止支持),來自互聯網巨頭的Google Big Query和Amazon RedShift。至於Oracle Exadata一體機,它上面運行的也是Oracle資料庫,其最初設計用途是OLAP,而在後來發展中也可以良好兼顧OLTP,算是一個跨界產品吧。
再來看非關系型資料庫,左下角的交易型產品中,有幾個我看著熟悉的MongoDB、Redis、Amazon DynamoDB和DocumentDB等;右下角的分析型產品包括著名的Hadoop分支Cloudera、Hortonworks(這2家已並購),Bigtable(來自Google,Hadoop中的HBase是它的開源實現)、Elasticsearch等。
顯然非關系型資料庫的分類要更加復雜,產品在應用中的差異化也比傳統關系型資料庫更大。Willian Blair很負責任地對它們給出了進一步的分類。
NoSQL資料庫的進一步分類
上面這個圖表應該說很清晰了。非關系型資料庫可以分為Document-based Store(基於文檔的存儲)、Key-Value Store(鍵值存儲)、Graph-based(圖資料庫)、Time Series(時序資料庫),以及Wide Cloumn-based Store(寬列式存儲)。
我們再來看下每個細分類別中的產品:
文檔存儲 :MongoDB、Amazon DocumentDB、Azure Cosmos DB等
Key-Value存儲 :Redis Labs、Oracle Berkeley DB、Amazon DynamoDB、Aerospike等
圖資料庫 :Neo4j等
時序資料庫 :InfluxDB等
WideCloumn :DataStax、Cassandra、Apache HBase和Bigtable等
多模型資料庫 :支持上面不只一種類別特性的NoSQL,比如MongoDB、Redis Labs、Amazon DynamoDB和Azure Cosmos DB等。
OLTP市場規模:關系型資料庫仍占營收大頭
上面這個基於IDC數據的交易型資料庫市場份額共有3個分類,其中深藍色部分的關系型資料庫(RDBMS,在這里不統計數據挖掘/分析型資料庫)占據80%以上的市場。
Dynamic Database(DDMS,動態資料庫管理系統,同樣不統計Hadoop)就是我們前面聊的非關系型資料庫。這部分市場顯得小(但發展勢頭看好),我覺得與互聯網等大公司多採用開源+自研,而不買商業產品有關。
而遵循IDC的統計分類,在上圖灰色部分的「非關系型資料庫市場」其實另有定義,參見下面這段文字:
資料庫市場份額:雲服務和新興廠商主導NoSQL
請注意,這里的關系型資料庫統計又包含了分析型產品。Oracle營收份額42%仍居第一,隨後排名依次為微軟、IBM、SAP和Teradata。
代表非關系型資料庫的DDMS分類中(這里同樣加入Hadoop等),雲服務和新興廠商成為了主導,微軟應該是因為雲SQL Server的基礎而小幅領先於AWS,這2家一共占據超過50%的市場,接下來的排名是Google、Cloudera和Hortonworks(二者加起來13%)。
上面是IDC傳統分類中的「非關系型資料庫」,在這里IBM和CA等應該主要是針對大型機的產品,InterSystems有一款在國內醫療HIS系統中應用的Caché資料庫(以前也是運行在Power小機上比較多)。我就知道這些,餘下的就不瞎寫了。
開源資料庫 vs. 商業資料庫
按照流行度來看,開源資料庫從2013年到現在一直呈現增長,已經快要追上商業資料庫了。
商業產品在關系型資料庫的佔比仍然高達60.5%,而上表中從這列往左的分類都是開源占優:
Wide Cloumn:開源佔比81.8%;
時序資料庫:開源佔比80.7%;
文檔存儲:開源佔比80.0%;
Key-Value存儲:開源佔比72.2%;
圖資料庫:開源佔比68.4%;
搜索引擎:開源佔比65.3%
按照開源License的授權模式,上面這個三角形越往下管的越寬松。比如MySQL屬於GPL,在互聯網行業用戶較多;而PostgreSQL屬於BSD授權,國內有不少資料庫公司的產品就是基於Postgre哦。
資料庫三大陣營:傳統廠商和雲服務提供商
前面在討論市場份額時,我提到過交易型資料庫的4個巨頭仍然是Oracle、微軟、IBM和SAP,在這里William Blair將他們歸為第一陣營。
隨著雲平台的不斷興起,AWS、Azure和GCP(Google Cloud Platform)組成了另一個陣營,在國外分析師的眼裡還沒有BAT,就像有的朋友所說,國內互聯網巨頭更多是自身業務導向的,在本土發展公有雲還有些優勢,短時間內將技術輸出到國外的難度應該還比較大。(當然我並不認為國內缺優秀的DBA和研發人才)
第三個陣容就是規模小一些,但比較專注的資料庫玩家。
接下來我再帶大家簡單過一下這前兩個陣容,看看具體的資料庫產品都有哪些。
甲骨文的產品,我相對熟悉一些的有Oracle Database、MySQL以及Exadata一體機。
IBM DB2也是一個龐大的家族,除了傳統針對小型機、x86(好像用的人不多)、z/OS大型機和for i的版本之外,如今也有了針對雲和數據挖掘的產品。記得抱枕大師對Informix的技術比較推崇,可惜這個產品發展似乎不太理想。
微軟除了看家的SQL Server之外,在Azure雲上還能提供MySQL、PostgreSQL和MariaDB開源資料庫。應該說他們是傳統軟體License+PaaS服務兩條腿走路的。
如今人們一提起SAP的資料庫就想起HANA,之前從Sybase收購來的ASE(Adaptive Server Enterprise)和IQ似乎沒有之前發展好了。
在雲服務提供商資料庫的3巨頭中,微軟有SQL Server的先天優勢,甚至把它移植到了Linux擁抱開源平台。關系型資料庫的創新方面值得一提的是Amazon Aurora和Google Spanner(也有非關系型特性),至於它們具體好在哪裡我就不裝內行了:)
非關系型資料庫則是Amazon全面開花,這與其雲計算業務發展早並且占據優勢有關。Google當年的三篇經典論文對業界影響深遠,Yahoo基於此開源的Hadoop有一段時間幾乎是大數據的代名詞。HBase和Hive如今已不再是人們討論的熱點,而Bigtable和BigQuery似乎仍然以服務Google自身業務為主,畢竟GCP的規模比AWS要小多了。
最後這張DB-Engines的排行榜,相信許多朋友都不陌生,今年3月已經不是最新的數據,在這里列出只是給大家一個參考。該排行榜幾乎在每次更新時,都會有國內資料庫專家撰寫點評。
以上是我周末的學習筆記,班門弄斧,希望對大家有幫助。
參考資料《Database Software Market:The Long-Awaited Shake-up》
https://blocksandfiles.com/wp-content/uploads/2019/03/Database-Software-Market-White-Paper.pdf
擴展閱讀:《 資料庫&存儲:互相最想知道的事 》
尊重知識,轉載時請保留全文。感謝您的閱讀和支持!
❸ 數據備份一體機品牌有哪些
中科熱備那個基於備份虛擬化技術的熱備雲系統。他他強調的就是熱備份區別於傳統的冷備份。在線生產數據或者在雲計算數據中心。熱數據直接備份出來。實現雙雲熱備。他可以對這個資料庫的數據,對這個操作系統,也可以對這個虛擬機,也可以對這個文件,然後呢做實時的熱備份。同時呢,也可以備份到這個虛擬帶庫,物理帶庫, 藍光,儲存。雲上。可以滿足備份的黃金法則,321法則。熱備雲一體機,Hotbackup Clound,實時熱備份,發展新趨勢。滿足數據安全法的合規性。
❹ 資料庫一體機與大數據技術區別何在
資料庫一體機與大數據技術區別何在
作為近期信息管理領域最為熱門的兩項技術,資料庫一體機與大數據技術的硬體架構基本相同,但軟體體系有著本質的區別,這也導致了兩者擁有不同的特徵表現。
隨著企業數據量的快速增長,以及用戶對服務水平要求的不斷提高,相當長的一段時間以來,傳統關系資料庫技術在生產實踐中表現出明顯的能力不足。如何以合理的成本獲得海量數據的高可用性已經成為現代IT領域的重大挑戰。為了應對這一挑戰,近年來,IT市場中相繼出現了許多新的技術手段,其中最為引人注目的便是由主流資料庫廠商主導的資料庫一體機(例如Oracle ExaData以及IBM Netezza等),以及以開源力量為主的大數據技術。
不過,雖然資料庫一體機與大數據技術都是當今的熱門話題,並都已經被廣泛應用,但卻有相當一部分用戶仍然無法深入了解兩者之間的本質區別與關系。同時,很多用戶也在為如何在企業內部對這兩者進行正確定位而感到困惑。為此,本文特別對資料庫一體機(也可稱新一代主流關系型資料庫)和大數據技術(例如Hadoop,主要指MapRece與NoSQL)的相關技術特點進行對比。
硬體與軟體
從本質上來講,資料庫一體機與大數據技術的硬體架構基本相同,同樣是採用x86伺服器集群的分布式並行模式,以應對大規模的數據與計算。但是,資料庫一體機的賣家們通常會對其產品的硬體體系進行面向產品化的、系統性的整體調優,同時也會有各自的特色手段。比方說Oracle ExaData的Infiniband、Flash Cache,IBM Nettezza的FPGA(現場可編程邏輯門陣)等。[page] 資料庫一體機與大數據技術最為核心的區別是在軟體體繫上。資料庫一體機的核心是SQL體系,這不只是指SQL解析,更重要的是指包括SQL優化引擎、索引、鎖、事務、日誌、安全以及管理等在內的完整而龐大的技術體系。這一體系是成熟的、面向產品的。
大數據技術軟體體系中的MapRece則提供了一個面向海量數據處理的分布式編程框架,使用者需要自行編制所需要的計算邏輯。MapRece對數據的讀寫是批量連續的,而不是隨機的。而大數據技術的另一體系NoSQL則大都只是提供了海量數據的分布式存儲,以及基於索引的快速讀取機制,為使用者提供的大多是編程API(雖然也有類SQL的語言,但其本質並不是完整的SQL體系)。
由於SQL體系的復雜性與處理邏輯的整體關聯性,導致資料庫一體機在擴展性上遠不及大數據技術體系,雖然前者已經在很大程度上改善了傳統關系資料庫垂直擴展的瓶頸。MapRece與NoSQL的單個集群往往可以擴展到數千個節點,而資料庫一體機如果在硬體上擴展到這個規模,從軟體上來講,已經是沒有意義的了。
特徵與本質
基於軟體體系的不同,導致了資料庫一體機和大數據技術有著不同的特徵表現。資料庫一體機往往適合於存儲關系復雜的數據模型(例如企業核心業務數據),並且需要限制為基於二維表的關系模型。同時,資料庫一體機適合進行一致性與事務性要求高的計算,以及復雜的BI計算。
大數據技術則更適合於存儲較簡單的數據模型,並且可以不受模式的約束。因而其可存儲管理的數據類型更加豐富。大數據技術還適合進行一致性與事務性要求不高的計算(主要是指NoSQL的查詢操作),以及對超大規模海量數據的、批量的分布式並行計算(基於MapRece)。
需要注意的是,NoSQL資料庫由於擺脫了繁瑣的SQL體系約束,其查詢與插入的效率比資料庫一體機更高。大數據技術比資料庫一體機所能處理的數據量也相對大些,這主要是因為其集群可以擴展得更大。
從本質上講,MapRece是對海量數據分布式計算領域的一個重要創新,但也只是在適合於並行處理的大規模批量處理問題上更占優勢,而對一些復雜操作,則不一定具有優勢。NoSQL則可以看作是對傳統關系資料庫進行簡化的結果。由於NoSQL資料庫的設計思想只是提取出關系型資料庫的索引機制,並加了上分布式存儲,把SQL體系中那些對「某些特殊問題」而言並不需要的東西統統刪去,由此實現了更優秀的效率、擴展性與靈活性。[page] 因此,我們可以明顯地看到,在實踐中,有很多問題(特別是流行的大數據問題),關系資料庫中的許多設計並不需要,這才是NoSQL發展壯大的根本立足點。
關系與協作
通過前面的分析,我們不難得出這樣的結論:大數據技術與資料庫一體機應該是相輔相成,並非互相替代的。它們針對不同的應用場景設計,並相互補充與合作。具體來說,大數據技術可以實現:
■處理企業內海量的、模型簡單、類型多樣的非結構化與半結構化數據(例如社會化數據、各種日誌甚至圖片、視頻等),其處理結果可以被直接使用;
■以上處理結果也同時可以被當成是新的輸入存儲到企業級數據倉庫中,這時大數據機相當於是面向大數據源的、新的ETL(提取-轉換-載入)手段;
■面向海量數據的、不太適合SQL的存儲或計算。
而資料庫一體機則應該還是作為企業數據倉庫的主流技術,至少在很長一段時間內應該是這樣。它負責存儲與計算最主要的、有重大價值的企業關鍵業務數據。
現存的誤區
有些人認為,雖然大數據技術的原始開源狀態還不適合充當企業級數據倉庫主平台的要求,但經過開發、補充,應該是可以的。其實這個觀點沒有錯。但實際上,對開源的大數據技術進行補充開發,所要補充的正是大數據技術在原始設計上就去除了的、那些本屬於關系型資料庫體系的東西。
如果進行這樣的補充開發,企業不僅會面臨龐大的、難於估計的開發工作量,同時也難以像專業資料庫廠商那樣實現這些工作的理論化、產品化與體系化。雖然從純技術的角度上講,開發什麼都有可能。但是如果企業真的准備這樣做,是要開發另一個商業化的關系資料庫嗎?很明顯,這違背了大數據技術的設計初衷。