㈠ 高可用集群的灰度升級
高可用集群的灰度升級是一種在不中斷業務的情況下,對集群進行版本升級的方法。此方式允許按節點逐一升級,確保每個節點穩定運行後再升級集群內的下一個節點,直至整個集群完成升級。高可用集群部署需採用高可用控制節點和數據副本數至少為2,以支持客戶端的高可用寫入。
在進行灰度升級時,關鍵在於內存中的數據格式、傳輸協議和序列化協議需完全兼容。對於版本跨度較大的升級,需先聯系技術支持工程師進行風險評估。
升級步驟如下:
1. 確保集群版本兼容性,升級前檢查分區狀態是否正常,確認所有副本狀態均為非RECOVERING狀態。
2. 獲取元數據文件存儲目錄。
3. 關閉目標節點,並執行備份元數據、升級DolphinDB版本等操作。
4. 驗證升級後DFS表的time和id欄位是否符合預期,確保寫入未被中斷。
具體步驟包括:
1. 檢查分區狀態正常,執行腳本確認。
2. 使用腳本獲取元數據存儲目錄。
3. 關閉伺服器上的所有節點,包括controller、agent、datanode,備份元數據。
4. 執行DolphinDB版本升級。
5. 重啟controller、agent、datanode,驗證DFS表stock的time和id欄位是否符合預期。
升級前先對第一台伺服器節點執行檢查和備份操作,確保分區狀態正常後進行升級。再依次對第二台和第三台伺服器的節點執行相同步驟,直至集群所有節點升級完成。升級過程中需確保分區狀態始終正常,以避免影響升級進度。升級後通過命令驗證DFS表的狀態,確保數據連續性和完整性。