1. 什麼是NoSQL資料庫
2. 什麼是NoSQL?
2.1 NoSQL 概述
NoSQL(NoSQL = Not Only SQL ),意即「不僅僅是SQL」,
泛指非關系型的資料庫。隨著互聯網web2.0網站的興起,傳統的關系資料庫在應付web2.0網站,特別是超大規模和高並發的SNS類型的web2.0純動態網站已經顯得力不從心,暴露了很多難以克服的問題,而非關系型的資料庫則由於其本身的特點得到了非常迅速的發展。NoSQL資料庫的產生就是為了解決大規模數據集合多重數據種類帶來的挑戰,尤其是大數據應用難題,包括超大規模數據的存儲。
(例如谷歌或Facebook每天為他們的用戶收集萬億比特的數據)。這些類型的數據存儲不需要固定的模式,無需多餘操作就可以橫向擴展。
2.2 NoSQL代表
MongDB、 Redis、Memcache
3. 關系型資料庫與NoSQL的區別?
3.1 RDBMS
高度組織化結構化數據
結構化查詢語言(SQL)
數據和關系都存儲在單獨的表中。
數據操縱語言,數據定義語言
嚴格的一致性
基礎事務
ACID
關系型資料庫遵循ACID規則
事務在英文中是transaction,和現實世界中的交易很類似,它有如下四個特性:
A (Atomicity) 原子性
原子性很容易理解,也就是說事務里的所有操作要麼全部做完,要麼都不做,事務成功的條件是事務里的所有操作都成功,只要有一個操作失敗,整個事務就失敗,需要回滾。比如銀行轉賬,從A賬戶轉100元至B賬戶,分為兩個步驟:1)從A賬戶取100元;2)存入100元至B賬戶。這兩步要麼一起完成,要麼一起不完成,如果只完成第一步,第二步失敗,錢會莫名其妙少了100元。
C (Consistency) 一致性
一致性也比較容易理解,也就是說資料庫要一直處於一致的狀態,事務的運行不會改變資料庫原本的一致性約束。
I (Isolation) 獨立性
所謂的獨立性是指並發的事務之間不會互相影響,如果一個事務要訪問的數據正在被另外一個事務修改,只要另外一個事務未提交,它所訪問的數據就不受未提交事務的影響。比如現有有個交易是從A賬戶轉100元至B賬戶,在這個交易還未完成的情況下,如果此時B查詢自己的賬戶,是看不到新增加的100元的
D (Durability) 持久性
持久性是指一旦事務提交後,它所做的修改將會永久的保存在資料庫上,即使出現宕機也不會丟失。
3.2 NoSQL
代表著不僅僅是SQL
沒有聲明性查詢語言
沒有預定義的模式
鍵 - 值對存儲,列存儲,文檔存儲,圖形資料庫
最終一致性,而非ACID屬性
非結構化和不可預知的數據
CAP定理
高性能,高可用性和可伸縮性
分布式資料庫中的CAP原理(了解)
CAP定理:
Consistency(一致性), 數據一致更新,所有數據變動都是同步的
Availability(可用性), 好的響應性能
Partition tolerance(分區容錯性) 可靠性
P: 系統中任意信息的丟失或失敗不會影響系統的繼續運作。
定理:任何分布式系統只可同時滿足二點,沒法三者兼顧。
CAP理論的核心是:一個分布式系統不可能同時很好的滿足一致性,可用性和分區容錯性這三個需求,
因此,根據 CAP 原理將 NoSQL 資料庫分成了滿足 CA 原則、滿足 CP 原則和滿足 AP 原則三 大類:
CA - 單點集群,滿足一致性,可用性的系統,通常在可擴展性上不太強大。
CP - 滿足一致性,分區容忍性的系統,通常性能不是特別高。
AP - 滿足可用性,分區容忍性的系統,通常可能對一致性要求低一些。
CAP理論就是說在分布式存儲系統中,最多隻能實現上面的兩點。
而由於當前的網路硬體肯定會出現延遲丟包等問題,所以分區容忍性是我們必須需要實現的。
所以我們只能在一致性和可用性之間進行權衡,沒有NoSQL系統能同時保證這三點。
說明:C:強一致性 A:高可用性 P:分布式容忍性
舉例:
CA:傳統Oracle資料庫
AP:大多數網站架構的選擇
CP:Redis、Mongodb
注意:分布式架構的時候必須做出取捨。
一致性和可用性之間取一個平衡。多餘大多數web應用,其實並不需要強一致性。
因此犧牲C換取P,這是目前分布式資料庫產品的方向。
4. 當下NoSQL的經典應用
當下的應用是 SQL 與 NoSQL 一起使用的。
代表項目:阿里巴巴商品信息的存放。
去 IOE 化。
ps:I 是指 IBM 的小型機,很貴的,好像好幾萬一台;O 是指 Oracle 資料庫,也很貴的,好幾萬呢;M 是指 EMC 的存儲設備,也很貴的。
難點:
數據類型多樣性。
數據源多樣性和變化重構。
數據源改造而服務平台不需要大面積重構。
2. 什麼是NoSQL資料庫
NoSQL,是not only sql,是非關系資料庫,不同於oracle等關系資料庫。hadoop,是分布式解決方案,即為版Maprece(計算的)和HDFS(文件系權統),使用Hadoop和NoSQL可以構造海量數據解決方案。
3. 什麼是NoSQL資料庫
答案:A
1.文檔型資料庫
作為最受歡迎的NoSQL產品,文檔型資料庫MongoDB當仁不讓地佔據了第一的位置,同時它也是所有NoSQL資料庫中排名最靠前的產品(總排行榜第七名)。Apache基金會的CouchDB排在第二,基於.Net的資料庫RavenDB排在第三,Couchbase排在第四。
2.鍵值(Key-value)資料庫
鍵值(Key-value)資料庫是NoSQL領域中應用范圍最廣的,也是涉及產品最多的一種模型。從最簡單的BerkeleyDB到功能豐富的分布式資料庫Riak再到Amazon託管的DynamoDB不一而足。
在鍵值資料庫流行度排行中,Redis不出意外地排名第一,它是一款由Vmware支持的內存資料庫,總體排名第十一。排在第二位的是Memcached,它在緩存系統中應用十分廣泛。排在之後的是Riak、BerkeleyDB、SimpleDB、DynamoDB以及甲骨文的Oracle NoSQL資料庫。值得注意的是,Oracle NoSQL資料庫上榜不久,得分已經翻番,上升勢頭非常迅猛。
3.列式存儲
列式存儲被視為NoSQL資料庫中非常重要的一種模式,其中Cassandra流行度最高,它已經由Facebook轉交給到Apache進行管理,同時Cassandra在全體資料庫排名中排在第十位,緊隨MongoDB成為第二受歡迎的NoSQL資料庫。基於Hadoop的Hbase排在第二位,Hypertable排在第三。而Google的BigTable並未列入排名,原因是它並未正式公開。
4. nosql資料庫的四種類型
一般將NoSQL資料庫分為四大類:鍵值(Key-Value)存儲資料庫、列存儲資料庫、文檔型資料庫和圖形(Graph)資料庫。它們的數據模型、優缺點、典型應用場景。
鍵值(Key-Value)存儲資料庫Key指向Value的鍵值對,通常用hash表來實現查找速度快數據無結構化(通常只被當作字元串或者二進制數據)內容緩存,主要用於處理大量數據的高訪問負載,也用於一些日誌系統等。
列存儲資料庫,以列簇式存儲,將同一列數據存在一起查找速度快,可擴展性強,更容易進行分布式擴展功能相對局限分布式的文件系統。
文檔型資料庫,Key-Value對應的鍵值對,Value為結構化數據,數據結構要求不嚴格,表結構可變(不需要像關系型資料庫一樣需預先定義表結構),查詢性能不高,而且缺乏統一的查詢語法,Web應用。
圖形(Graph)資料庫,圖結構,利用圖結構相關演算法(如最短路徑定址,N度關系查找等),很多時候需要對整個圖做計算才能得出需要的信息,而且這種結構不太好做分布式的集群方案,社交網路,推薦系統等。
5. 什麼是NoSQL資料庫
NoSQL,是not only sql,是非關系資料庫,不同於oracle等關系資料庫。hadoop,是分布式解決方案,即為Maprece(計算的)和HDFS(文件系統),使用Hadoop和NoSQL可以構造海量數據解決方案。
6. 什麼是NoSQL資料庫
「NoSQL,指的是非關系型的資料庫。NoSQL有時也稱作Not Only SQL的縮寫,是對不同於傳統的關系型資料庫的資料庫管理系統的統稱。NoSQL用於超大規模數據的存儲。這些類型的數據存儲不需要固定的模式,無需多餘操作就可以橫向擴展。」
7. nosql是什麼意思
NoSQL,指的是非關系型的資料庫。
NoSQL(NoSQL = Not Only SQL ),意即"不僅僅是SQL"。
在現代的計算系統上每天網路上都會產生龐大的數據量。
這些數據有很大一部分是由關系資料庫管理系統(RDBMS)來處理。 1970年 E.F.Codd's提出的關系模型的論文 "A relational model of data for large shared data banks",這使得數據建模和應用程序編程更加簡單。
通過應用實踐證明,關系模型是非常適合於客戶伺服器編程,遠遠超出預期的利益,今天它是結構化數據存儲在網路和商務應用的主導技術。
NoSQL 是一項全新的資料庫革命性運動,早期就有人提出,發展至2009年趨勢越發高漲。NoSQL的擁護者們提倡運用非關系型的數據存儲,相對於鋪天蓋地的關系型資料庫運用,這一概念無疑是一種全新的思維的注入。
分布式系統
分布式系統(distributed system)由多台計算機和通信的軟體組件通過計算機網路連接(本地網路或廣域網)組成。
分布式系統是建立在網路之上的軟體系統。正是因為軟體的特性,所以分布式系統具有高度的內聚性和透明性。
因此,網路和分布式系統之間的區別更多的在於高層軟體(特別是操作系統),而不是硬體。
分布式系統可以應用在不同的平台上如:Pc、工作站、區域網和廣域網上等。
8. nosql資料庫的四種類型
nosql資料庫的四種類型如下:
1.key-value鍵值存儲資料庫:
相關產品: Redis、Riak、SimpleDB、Chordless、Scalaris、Memcached.
主要應用: 內容緩存,處理大量數據的高負載訪問,也用於系統日誌。
優點:查找速度快,大量操作時性能高。
2.列存儲資料庫:
相關產品: BigTable、HBase、Cassandra、HadoopDB、GreenPlum、PNUTS.
主要應用: 分布式數據的儲存與管理。
優點:查找速度快,可擴展性強,容易進行分布式擴展。
缺點:功能相對局限。
3.文檔型資料庫
相關產品:MongoDB、CouchDB、ThruDB、CloudKit、Perservere、Jackrabbit.
主要應用: web應用,管理面向文檔的數據或者類似的半結構化數據。
優點:數據結構靈活,表結構可變,復雜性低。
缺點:查詢效率低,且缺乏統一的查詢語言。
4.Graph圖形資料庫
相關產品: Neo4J、OrientDB、InfoGrid、GraphDB.
主要應用: 復雜,互連接,低結構化的圖結構場合, 專注構建關系圖譜。
優點: 利用圖結構相關演算法, 可用於構建復雜的關系圖譜。
缺點: 復雜度高。
9. 什麼是nosql資料庫
Nosql全稱是Not Only SQL,是一種不同於關系型資料庫的資料庫管理系統設計方式。對NoSQL最普遍的解釋是「非關系型的」,強調Key-Value Stores和文檔資料庫的優點,而不是單純的反對RDBMS