Ⅰ SQLServer資料庫中如何保持數據一致性
根據實現策略的不同,主要有快照復制、事務復制、合並復制等三種類型。這三種復制類型,各有各的特點,分別適用於不同的場合。一般來說,在考慮採用哪種復制類型比較合適的時候,主要考慮的是性能與數據同步的時間間復制是SQLServer資料庫中保持數據一致性的一種手段。根據實現策略的不同,主要有快照復制、事務復制、合並復制等三種類型。這三種復制類型,各有各的特點,分別適用於不同的場合。一般來說,在考慮採用哪種復制類型比較合適的時候,主要考慮的是性能與數據同步的時間間隔。那麼在什麼情形下比較適用快照復制呢?筆者就跟大家來討論一下這個話題。 為了在恰當的時候採用快照復制,資料庫管理員首先需要知道快照復制的特點。快照復制是指將數據以特定時刻的瞬時狀態轉發,而不堅實對數據的更新。在發生同步時,將生成完整的快照並將其發送到訂閱伺服器。簡單的說,快照復制就是每隔一段時間發生數據同步操作。而不是發布伺服器的數據一有更新就出發這個快照復制。顯然這種快照復制的數據同步性稍微差一點。在訂閱伺服器與發布伺服器之間有一段時間會存在數據不一致的情況。但是這可以在很大程度上提高訂閱伺服器與發布伺服器的性能。這就好像汽車運輸。採用快照復制的話可以將一個集裝箱裝滿後在送貨,而不是有多少送多少。掌握這個資料庫復快照復制的具體特點之後,資料庫管理員就可以來考慮在什麼情況下,採用快照復制更加的合理。 一、數據更改比較少的系統中。 快照復制與其他復制相比最主要的缺陷就是資料庫中的數據無法及時同發布伺服器一致。為此如果發布伺服器中的內容很少更改的話,顯然此時採用快照復制是比較合理的。此時採用快照復制的話,不僅數據一致性延遲的負面效應會越來越不明顯,同時可以提高發布伺服器與訂閱伺服器的性能。如在實際工作中,經常會遇到這樣的客戶。如一家企業在各地都有辦事處或者銷售機構,就像肯德基一樣,各地的產品價格基本上都是相同的,不怎麼會更改。即使更改的話,各地也是統一調整。由於此時產品價格表更改的比較少,那麼在企業總部的資料庫服務與各地的訂閱伺服器之間,採用快照復制的形式就會比較合適。其實類似的情況有很多。如不少的服裝企業,像李寧、耐克等等,他們不僅自己生產,而且在各地又有自己的銷售辦事處。在價格方面也是統一的。在這種情況下,採用快照復制往往能夠提高資料庫復制的性能,同時又不影響其使用。 二、在某個時段內會出現數據大量的更改。 需要補充說明的一點是,上面說到的數據不怎麼發生更改,指的是數據的延續性更改。如在一年中,每天或者每個小時更改的數據都比較平均。此時採用快照復制不怎麼合適。但是如果數據的更改集中在一個時段內。而其他時間中資料庫的內容不會有多大的更改。此時採用快照復制是可行的。如一些決策性系統,往往在起初導入數據的時候,需要進行大量的更改。而等到數據導入完畢,在大家對數據進行分析時,則資料庫中的內容基本上保持不變。在這種情況下,筆者認為只要數據的更新集中在一個固定的時段,此時採用快照復制仍然是可行的。 再如上面這個KFC或者服裝企業的案例中,如果市場部門維護一個產品的價格,而且這些價格往往在一個固定的時間進行幾次更新。如在換季的時候會進行一些促銷。此時資料庫管理員可以在數據更新完畢後立即執行復制完成的數據快照。所以,以數據更新來判斷是否適合採用快照復制,標准並不是數據的更新量。像上面提到的分析決策系統,其起初的數據更新量可能比有些資料庫系統幾年的數據更新量都要大。筆者認為,主要是根據數據更新的頻率來進行判斷。如果數據更新的比較頻繁,那麼即使數據更新的數據不多,像那種細水長流似的更新,則不適合採用快照復制。而那些井噴似的數據更新,所有的更新都集中在一個固定的時刻,那麼此時採用快照復制是比較合理的。 三、在一段時間內是否允許具有相對發布伺服器已過時的數據副本? 現在不少超市也已經連鎖了,如世紀聯華等等。為了提高利潤,增加市場的份額,這些超市紛紛推出了沖值卡,即消費者先將一定金額的人民幣打入到沖值卡中。然後每次消費完成後從卡中扣費。但前些天經常有新聞報道,說一個客戶的消費卡在一家聯華超市掛失了。但是撿到這張卡的人仍然可以在其他的聯華超市中消費。為此消費者就想不明白了,為什麼掛失了的消費卡仍然可以在其他超市中消費?掛失後的損失該由誰來承擔呢?其實這就使超市在不適當的時候採用了快照復制所造成的。由於採用快照復制,在各個聯華超市的資料庫之間數據無法在短時間內取得一致。如有些商戶說掛失當日之內的損失他們不承擔,這就說明他們可能是每天下班後進行一次快照復制。一般情況下這不會有問題。但是像遇到消費卡被偷了等情況,就會遇到類似的問題了。 所以,在考慮是否適合採用快照復制的時候,還需要考慮在一段時間內是否允許具有相對發布伺服器來說已過時的數據副本。如果不允許的話,那麼就不允許採用這個快照復制。如果允許的話,那麼資料庫管理員就需要評估這段時間最長是多少。如果是24個小時,那麼就需要每隔24小時進行一次快照復制。但是需要注意的是,如果時間的間隔比較短,如才允許十分鍾的數據延遲,那麼採用快照復制就沒有必要了。此時採用事務復制或則和合並復制可能更加的合適。 四、復制少量的數據。 快照復制跟其他復制類型相比,還有一個比較顯著的特點,即當發生數據同步時,將生成完整的快照並將其從發布伺服器傳送到訂閱伺服器。這是一個什麼概念呢?如訂閱伺服器中有10G的數據,而在一個快照復制的周期內,只有1M的數據發生了更改。此時發生快照復制的話,資料庫系統會將10G的數據都傳送到訂閱伺服器上。此時更改的數據只有1M,卻需要在網路上傳送10G的數據流量,顯然會對企業的網路產生比較大的壓力。由於在發布伺服器上快照復制的連續開銷低於事務復制的開銷,一次資料庫系統不會啟用跟蹤增量更改。但是像這種情況,如果要復制的數據量非常的大,而平時的更新又不多。此時資料庫系統要生成和應用快照,就將耗用大量的資源,包括網路資源和伺服器資源。所以說,當發布伺服器中的數據比較多時,採用快照復制不怎麼合適。因為此時網路傳輸反而會成為其最重大的瓶頸資源。相反若能夠採取細水長流的事務復制策略,那麼對於企業網路性能的影響就會小的多,甚至可以忽略不計。 所以在採用快照復制的時候,資料庫管理員一定要明白,快照復制會傳送整個資料庫對象。從而在快照復制傳輸過程中會侵蝕大量的網路帶寬,從而明顯的降低企業網路的性能,甚至導致網路擁塞。有時候為了保障快照能夠准確、迅速的傳遞到其他的訂閱伺服器,還不得不採用VPN等技術來保障傳輸的准確性。為此,筆者認為只有發布伺服器的資料庫並不是很大的情況下,才適合採用快照復制。否則的話,採用快照復制是得不償失。 從以上的分析中,可以得到一個結論。在考慮採用快照復制是否合適時,往往不能夠採用一個指標來判斷。而需要考慮多個因素,如資料庫的大小、數據更新的頻率、允許數據延遲的時間等等因素來進行判斷。最後在數據的一致性與資料庫的性能之間取得一個均衡。說實話,對於大部分資料庫管理員來說,要做出一個抉擇,確實有困難。因為這沒有固定的指標可以拿來參考。如資料庫容量小於多少時該採用快照復制。任何一個資料庫管理專家都不能夠下這個結論。所以在掌握影響其選擇的相關因素外,就要依靠資料庫管理員的經驗了。在遇到類似的選擇題時,往往經驗可以幫助管理員迅速解決問題。最後需要提醒的是,無論最終採取了什麼方案,最好能夠持續跟蹤一段時間,看看自己的選擇是否合理。