分库分表

- 日理万妓 2022-04-22 06:12 412阅读 0赞

分库分表

为什么分库分表

在高并发和海量数据的场景下，通过使用分库分表的手段，能够解决单机或者单库单表的性能瓶颈和压力，突破IO、连接数、硬件资源的瓶颈。当然，投入硬件资源会更多，同时也会带来一些技术问题和挑战：如跨分片的复杂查询，跨分片事务等。

一般来说，Mysql 单库超过5000万条记录，Oracle单库超过1亿条记录，DB压力就很大(当然处理能力和字段数量/访问模式/记录长度有进一步关系)。

分库分表后的问题

分布式事务

1）避免分布式事务
同一订单业务相关的数据落在同一下标的库
需要选择合适的业务ID，作为库下标的路由

2）分布式事务问题
见之前的文章

查询数据结果集合并

跨节点Join
首先良好的设计和切分却可以减少此类情况的发生，解决这一问题的普遍做法是分两次查询实现。在第一次查询的结果集中找出关联数据的id,根据这些id发起第二次请求得到关联数据。

跨节点的count,order by,group by以及聚合函数问
每个结点的查询可以并行执行，因此很多时候它的速度要比单一大表快很多。但如果结果集很大，对应用程序内存的消耗是一个问题。

分页查询
分库设计时，一般还有配套大数据平台汇总所有分库的记录，有些分页查询可以考虑走大数据平台，如opensearch

数据扩容

1）一致性hash，
减少了影响数据的范围，但还是避免不了数据迁移，最好的方式还是提前预估数据量。

2）id在 0–100万在第一个库中，100-200万在第二个中，200-300万在第3个中
或者按照时间范围来落库
不需要迁移数据，但是带来一个热点问题：当前的数据量达到某个库表的范围时，所有的插入操作，都集中在这个库/表了。

3）淘宝方案，看不太懂
https://www.cnblogs.com/tommyli/p/3767362.html

来自淘宝综合业务平台团队，它利用对2的倍数取余具有向前兼容的特性（如对4取余得1的数对2取余也是1）来分配数据，避免了行级别的数据迁移，但是依然需要进行表级别的迁移，同时对扩容规模和分表数量都有限制。

全局唯一性ID的保证

要求
1）全局唯一性
2）数据递增

解决

1）UUID
优点：数据迁移不受影响
缺点：字符存储，无序，查询慢，不可读

2）snowFlake雪花算法（twitter）
高位随机+毫秒数+机器码（数据中心+机器ID）+10的流水号
优点：数据迁移不受影响
缺点：强依赖时钟一致

3）redis生成
年份+天+时+redis自增
优点：没有单点故障，不依赖数据库，可读性好
缺点：需要占用网络资源，差于本地

发表评论取消回复

表情：

评论列表（有 0 条评论，412人围观）

还没有评论，来说两句吧...

相关阅读

相关什么是分库？分表？分库分表？

分库分表，是企业里面比较常见的针对高并发、数据量大的场景下的一种技术优化方案，所谓"分库分表"，根本就不是一件事儿，而是三件事儿，他们要解决的问题也都不一样。这三个事儿分别

淡淡的烟草味﹌/ 2024年02月05日 12:47/ 0 赞/ 117 阅读

相关【分库分表】分库分表 Sharding-JDBC

文章目录前言一、基本概念 1.1、表 1.2、逻辑表 1.3、真实表 1.4、绑定表

本是古典何须时尚/ 2023年10月12日 22:32/ 0 赞/ 120 阅读

相关分库分表之_分库分表

前言 Github：[https://github.com/HealerJean][https_github.com_HealerJean] 博客：[http://blog

你的名字/ 2023年07月20日 12:30/ 0 赞/ 103 阅读

相关 Sharding-JDBC分库不分表、分库分表，主从分库分表

分库不分表、分库分表，主从分库分表分库不分表 server: port: 8800 mybatis: confi

柔光的暖阳◎/ 2022年12月30日 15:53/ 0 赞/ 371 阅读

相关分库分表场景--单表转分库分表

原文网址：[分库分表场景--单表转分库分表\_IT利刃出鞘的博客-CSDN博客][--_IT_-CSDN] 方案1：sharding-proxy + sharding-sc

我会带着你远行/ 2022年10月31日 00:38/ 0 赞/ 336 阅读

相关分库分表

分库，降低了单点机器的负载；分表，提高了数据操作的效率，尤其是Write操作的效率。（1）切分的方式主要有两种，水平切分和垂直切分。 1、水平切分简单的说就是，

我不是女神ヾ/ 2022年06月02日 03:37/ 0 赞/ 403 阅读

相关分库分表

常用的切分方案数据的切分（Sharding）根据其切分规则的类型，可以分为两种切分模式。一种是按照不同的表（或者Schema）来切分到不同的数据库（主机）之上，这种

你的名字/ 2022年05月09日 06:38/ 0 赞/ 334 阅读

相关分库分表

分库分表为什么分库分表在高并发和海量数据的场景下，通过使用分库分表的手段，能够解决单机或者单库单表的性能瓶颈和压力，突破IO、连接数、硬件资源的瓶颈。当然，投入

- 日理万妓/ 2022年04月22日 06:12/ 0 赞/ 413 阅读

相关分库分表

一. 数据切分关系型数据库本身比较容易成为系统瓶颈，单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后，由于查询维度较多，即使添加从库、优

小咪咪/ 2022年03月19日 02:44/ 0 赞/ 502 阅读

相关分表分库

一、常见面试题 1、为什么分表分库？ 2、分表分库中间件有哪些？分别有什么特点？ 3、垂直拆分还是水平拆分？有什么区别？二、问题分析 1、由于用户数量增长，

野性酷女/ 2022年01月20日 00:25/ 0 赞/ 526 阅读