① SQLServer資料庫的注意事項
如果你正在負責一個基於SQL Server的項目 或者你剛剛接觸SQL Server 你都有可能要面臨一些資料庫性能的問題 這篇文章會為你提供一些有用的指導(其中大多數也可以用於其它的DBMS)
在這里 我不打算介紹使用SQL Server的竅門 也不能提供一個包治百病的方案 我所做的是總結一些經驗 關於如何形成一個好的設計 這些經驗來自我過去幾年中經受的教訓 一直來 我看到許多同樣的設計錯誤被一次又一次的重復
你了解你用的工具嗎?
不要輕視這一點 這是我在這篇文章中講述的最關鍵的一條 也許你也看到有很多的SQL Server程序員沒有掌握全部的T SQL命令和SQL Server提供的那些有用的工具
什麼?我要浪費一個月的時間來學習那些我永遠也不會用到的SQL命令??? 你也許會這樣說 對的 你不需要這樣做 但是你應該用一個周末瀏覽所有的T SQL命令 在這里 你的任務是了解 將來 當你設段蠢盯計一個查詢時 你會記起來 對了 這里有一個命令可握和以完全實現我需要的功能 於是 到MSDN查看這個命令的確切語法
不要使用游標
讓我再重復一遍 不要使用游標 如果你想破壞整個系統的性能的話 它們倒是你最有效的首選辦法 大多數的初學者都使用游標 而沒有意識到它們對性能造成的影響 它們佔用內存 還用它們那些不可思議的方式鎖定表 另外 它們簡直就像蝸牛 而最糟糕的是 它們可以使你的DBA所能做的一切性能優化等於沒做 不知你是否知道每執行一次FETCH就等於執行一次SELECT命令?這意味著如果你的游標有 條記錄 它將執行 次SELECT!如果你使用一組SELECT UPDATE或者DELETE來完成相應的工作 那將有效率的多
初學者一般認為使用游標是一種比較熟悉和舒適的編程方式 可很不幸 這會導致糟糕的性能 顯然 SQL的總體目的是你要實現什麼 而不是怎樣實現
我曾經用T SQL重寫了一個基於游標的存儲過程 那個表只有 條記錄 原來的存儲過程用了 分鍾才執行完畢 而新的存儲過程只用了 秒鍾 在這里 我想你應該可以看到一個不稱職的程序員究竟在幹了什麼!!!
我們可以寫一個小程序來取得和處理數據並且更新資料庫 這樣做有時會更有效 記住 對於循環 T SQL無能為力
我再重新提醒一下 使用游標沒有好處 除了DBA的工作外 我從來沒有看到過使用游標可以有效的完成任何工作
規范化你的數據表
為什麼不規范化資料庫?大概有兩個借口 出於性能的考慮和純粹因為懶惰 至於第二點 你遲早得為此付出代價 而關於性能的問題 你不需要優化根本就不慢的東西 我經常看到一些程序員 反規范化 資料庫 他們的理由是 原來的設計太慢了 可結果卻常常是他們讓系統更慢了 DBMS被設計用來處理規范資料庫的 因此 記住 按照規范化的要求設計資料庫
不要使用SELECT *
這點不太容易做到 我太了解了 因為我自己就經常這樣干 可是檔宴 如果在SELECT中指定你所需要的列 那將會帶來以下的好處
減少內存耗費和網路的帶寬
你可以得到更安全的設計
給查詢優化器機會從索引讀取所有需要的列
了解你將要對數據進行的操作
為你的資料庫創建一個健壯的索引 那可是功德一件 可要做到這一點簡直就是一門藝術 每當你為一個表添加一個索引 SELECT會更快了 可INSERT和DELETE卻大大的變慢了 因為創建了維護索引需要許多額外的工作 顯然 這里問題的關鍵是 你要對這張表進行什麼樣的操作 這個問題不太好把握 特別是涉及DELETE和UPDATE時 因為這些語句經常在WHERE部分包含SELECT命令
不要給 性別 列創建索引
首先 我們必須了解索引是如何加速對表的訪問的 你可以將索引理解為基於一定的標准上對表進行劃分的一種方式 如果你給類似於 性別 這樣的列創建了一個索引 你僅僅是將表劃分為兩部分 男和女 你在處理一個有 條記錄的表 這樣的劃分有什麼意義?記住 維護索引是比較費時的 當你設計索引時 請遵循這樣的規則 根據列可能包含不同內容的數目從多到少排列 比如 姓名 省份 性別
使用事務
請使用事務 特別是當查詢比較耗時 如果系統出現問題 這樣做會救你一命的 一般有些經驗的程序員都有體會 你經常會碰到一些不可預料的情況會導致存儲過程崩潰
小心死鎖
按照一定的次序來訪問你的表 如果你先鎖住表A 再鎖住表B 那麼在所有的存儲過程中都要按照這個順序來鎖定它們 如果你(不經意的)某個存儲過程中先鎖定表B 再鎖定表A 這可能就會導致一個死鎖 如果鎖定順序沒有被預先詳細的設計好 死鎖是不太容易被發現的
不要打開大的數據集
在CSDN技術論壇中 :) 一個經常被提出的問題是 我怎樣才能迅速的將 條記錄添加到ComboBox中?這是不對的 你不能也不需要這樣做 很簡單 你的用戶要瀏覽 條記錄才能找到需要的記錄 他一定會詛咒你的 在這里 你需要的是一個更好的UI 你需要為你的用戶顯示不超過 或 條記錄
不要使用伺服器端游標
與伺服器端游標比起來 客戶端游標可以減少伺服器和網路的系統開銷 並且還減少鎖定時間
使用參數查詢
有時 我在CSDN技術論壇看到類似這樣的問題 SELECT * FROM a WHERE a id= A B 因為單引號查詢發生異常 我該怎麼辦? 而普遍的回答是 用兩個單引號代替單引號 這是錯誤的 這樣治標不治本 因為你還會在其他一些字元上遇到這樣的問題 更何況這樣會導致嚴重的bug 除此以外 這樣做還會使SQL Server的緩沖系統無法發揮應有的作用 使用參數查詢 釜底抽薪 這些問題統統不存在了
在程序編碼時使用大數據量的資料庫
程序員在開發中使用的測試資料庫一般數據量都不大 可經常的是最終用戶的數據量都很大 我們通常的做法是不對的 原因很簡單 現在硬碟不是很貴 可為什麼性能問題卻要等到已經無可挽回的時候才被注意呢?
不要使用INSERT導入大批的數據
請不要這樣做 除非那是必須的 使用UTS或者BCP 這樣你可以一舉而兼得靈活性和速度
注意超時問題
查詢資料庫時 一般資料庫的預設都比較小 比如 秒或者 秒 而有些查詢運行時間要比這長 特別是當資料庫的數據量不斷變大時
不要忽略同時修改同一記錄的問題
有時候 兩個用戶會同時修改同一記錄 這樣 後一個修改者修改了前一個修改者的操作 某些更新就會丟失 處理這種情況不是很難 創建一個timestamp欄位 在寫入前檢查它 如果允許 就合並修改 如果存在沖突 提示用戶
在細節表中插入紀錄時 不要在主表執行SELECT MAX(ID)
這是一個普遍的錯誤 當兩個用戶在同一時間插入數據時 這會導致錯誤 你可以使用SCOPE_IDENTITY IDENT_CURRENT和@@IDENTITY 如果可能 不要使用@@IDENTITY 因為在有觸發器的情況下 它會引起一些問題(詳見這里的討論)
避免將列設為NULLable
如果可能的話 你應該避免將列設為NULLable 系統會為NULLable列的每一行分配一個額外的位元組 查詢時會帶來更多的系統開銷 另外 將列設為NULLable使編碼變得復雜 因為每一次訪問這些列時都必須先進行檢查
我並不是說NULLS是麻煩的根源 盡管有些人這樣認為 我認為如果你的業務規則中允許 空數據 那麼 將列設為NULLable有時會發揮很好的作用 但是 如果在類似下面的情況中使用NULLable 那簡直就是自討苦吃
CustomerName CustomerAddress CustomerEmail CustomerName CustomerAddress CustomerEmail CustomerName CustomerAddress CustomerEmail
如果出現這種情況 你需要規范化你的表了
盡量不要使用TEXT數據類型
除非你使用TEXT處理一個很大的數據 否則不要使用它 因為它不易於查詢 速度慢 用的不好還會浪費大量的空間 一般的 VARCHAR可以更好的處理你的數據
盡量不要使用臨時表
盡量不要使用臨時表 除非你必須這樣做 一般使用子查詢可以代替臨時表 使用臨時表會帶來系統開銷 如果你是用 進行編程 它還會給你帶來很大的麻煩 因為 使用資料庫連接池而臨時表卻自始至終都存在 SQL Server提供了一些替代方案 比如Table數據類型
學會分析查詢
SQL Server查詢分析器是你的好夥伴 通過它你可以了解查詢和索引是如何影響性能的
使用參照完整性
lishixin/Article/program/SQLServer/201311/22158