㈠ 高可用集群的灰度升级
高可用集群的灰度升级是一种在不中断业务的情况下,对集群进行版本升级的方法。此方式允许按节点逐一升级,确保每个节点稳定运行后再升级集群内的下一个节点,直至整个集群完成升级。高可用集群部署需采用高可用控制节点和数据副本数至少为2,以支持客户端的高可用写入。
在进行灰度升级时,关键在于内存中的数据格式、传输协议和序列化协议需完全兼容。对于版本跨度较大的升级,需先联系技术支持工程师进行风险评估。
升级步骤如下:
1. 确保集群版本兼容性,升级前检查分区状态是否正常,确认所有副本状态均为非RECOVERING状态。
2. 获取元数据文件存储目录。
3. 关闭目标节点,并执行备份元数据、升级DolphinDB版本等操作。
4. 验证升级后DFS表的time和id字段是否符合预期,确保写入未被中断。
具体步骤包括:
1. 检查分区状态正常,执行脚本确认。
2. 使用脚本获取元数据存储目录。
3. 关闭服务器上的所有节点,包括controller、agent、datanode,备份元数据。
4. 执行DolphinDB版本升级。
5. 重启controller、agent、datanode,验证DFS表stock的time和id字段是否符合预期。
升级前先对第一台服务器节点执行检查和备份操作,确保分区状态正常后进行升级。再依次对第二台和第三台服务器的节点执行相同步骤,直至集群所有节点升级完成。升级过程中需确保分区状态始终正常,以避免影响升级进度。升级后通过命令验证DFS表的状态,确保数据连续性和完整性。