❶ 什么叫分布式数据库,有什么优点和缺点
1. 分布式数据库是一种将数据库技术与网络技术相结合的系统,其特点是数据在逻辑上或物理上被分散存储。
2. 分布式数据库的优缺点:
优点:
- 管理维护便捷:数据文件按逻辑或物理方式分散存储,便于管理。
- 可靠性提升:通过在多台计算机上复制数据库,系统可在部分故障时继续运行。
- 扩展性好:增加新数据库或提升硬件能力简单易行。
缺点:
- 事务管理成本高:协调跨节点的事务可能需要更多资源。
3. 分布式数据库的主要特点:
- 数据处理就地完成:多数操作针对本地数据库。
- 网络连接:各地计算机通过通信网络相连。
- 降低数据传输成本:减少跨网络的数据传输。
- 系统可靠性高:局部故障不影响其他部分。
- 透明数据库位置:便于系统扩充。
4. 数据分片类型:
- 水平分片:按条件将数据划分为多个子集。
- 垂直分片:将属性集分割成子集并进行投影运算。
- 导出分片:基于其他关系属性的条件进行水平分片。
- 混合分片:水平分片与垂直分片的组合。
5. 数据分片的条件:
- 完备性:所有全局数据必须映射到片段中。
- 可重构性:片段能重建全局关系。
- 不相交性:片段之间无重叠(垂直分片主键除外)。
6. 数据分配方式:
- 集中式:所有数据片段位于同一地点。
- 分割式:数据唯一份被逻辑分割至不同地点。
- 全复制式:数据在每个地点复制。
- 混合式:介于分割式与全复制式之间。
分布式数据库的设计越来越多地采用寻找最优解的算法,如遗传算法和退火机制,以优化数据分配和提升系统性能。
❷ 分布式数据库的查询优化
在硬件达标的情况下,可以通过优化 sql 进行查询优化,tidb 目前通过水平扩容 tikv 节点即可达到增加计算能力的目的,可以关注下这个国产新兴分布式开源数据库 TiDB,TiDB 官方社区(AskTUG)
水平弹性扩展
通过简单地增加新节点即可实现 TiDB 的水平扩展,按需扩展吞吐或存储,轻松应对高并发、海量数据场景。