MySQL 分区表，为什么分区键必须是主键的一部分？

2023年5月24日下午3:32 • 数据库 • 阅读 78

随着业务的不断发展，数据库中的数据量会越来越大，相应地，单表中的数据量也会越来越大，达到临界值时，单表的查询性能会下降。

[En]

With the continuous development of business, there will be more and more data in the database, accordingly, the amount of data in a single table will become larger and larger, up to a critical value, the query performance of a single table will decline.

这一临界值不能一概而论，它与硬件能力和具体业务有关。

[En]

This critical value can not be generalized, it is related to hardware capability and specific business.

虽然在很多 MySQL 运维规范里，都建议单表不超过 500w、1000w。

但实际上，我在生产环境，也见过大小超过 2T，记录数过亿的表，同时，业务不受影响。

当一张表太大时，企业通常会考虑两种拆分方案：水平拆分和垂直拆分。

[En]

When a single table is too large, the business usually considers two split schemes: horizontal split and vertical split.

水平拆分 VS 垂直拆分

水平拆分，拆分维度为一行，表中的记录一般按照一定的规则或算法拆分成多个表。

[En]

Split horizontally, the split dimension is a row, and the records in the table are generally split into multiple tables according to a certain rule or algorithm.

拆分表可以位于一个实例中，也可以位于多个不同实例中。如果是后者，则涉及分布式事务。

[En]

The split table can be in either one instance or multiple different instances. If it is the latter, distributed transactions will be involved.

纵向拆分，拆分的维度为列，一般拆分为多个业务模块。这种拆分更多的是对上层业务的拆分。

[En]

Split vertically, the dimension of the split is the column, which is generally split into multiple business modules. This kind of split is more of a split of the upper business.

就转型的复杂性而言，前者小于后者。

[En]

In terms of the complexity of the transformation, the former is less than the latter.

因此，当单张表格的数据量太大时，行业中更常用的是水平拆分。

[En]

Therefore, when the amount of data in a single table is too large, horizontal splitting is more commonly used in the industry.

常见的水平拆分方案有：子库表和分区表。

[En]

The common horizontal splitting schemes are: sub-database table and partition table.

虽然子库、子表是比较彻底的横向拆分方案，但一方面其转化需要一定的时间；另一方面对开发能力也有一定的要求。相对而言，分区表相对简单，不需要业务转换。

[En]

Although the sub-library and sub-table is a relatively thorough horizontal split scheme, on the one hand, its transformation takes a certain amount of time; on the other hand, it also has certain requirements for the ability of development. Relatively speaking, partitioned tables are relatively simple and do not require business transformation.

分区表

很多人可能会认为 MySQL 的优势在于 OLTP 应用，对于 OLAP 应用就不太适合，所以，也不太推荐分区表这种偏 OLAP 的特性。

但实际上，对于某些类型的业务，更适合使用分区表，尤其是那些冷热数据差异明显、冷热数据与时间相关的数据。

[En]

But in fact, for some types of business, it is more suitable to use partition tables, especially those that have obvious differences between hot and cold data, and the hot and cold data are time-related.

接下来，让我们看看分区表的优势：

[En]

Next, let’s look at the advantages of partitioned tables:

提升查询性能对于分区表的查询操作，如果查询条件中包含分区键，则这个查询操作就只会被下推到符合条件的分区内进行，无关分区将自动过滤掉。在数据量比较大的情况下，能提升查询速度。
对业务透明将表从一个非分区表转换为分区表，业务端无需做任何改造。
管理方便在对单个分区进行删除、迁移和维护时，不会影响到其它分区。尤其是针对单个分区的删除（DROP）操作，避免了针对这个分区所有记录的 DELETE 操作。

遗憾的是，MySQL 分区表不支持并行查询。理论上，当一个查询涉及到多个分区时，分区与分区之间应进行并行查询，这样才能充分利用多核 CPU 资源。

但 MySQL 并不支持，包括早期的官方文档，也提到了这个问题，也将这个功能的实现放到了优先级列表中。

These features are not currently implemented in MySQL Partitioning, but are high on our list of priorities.

- Queries involving aggregate functions such as SUM() and COUNT() can easily be parallelized. A simple example of such a query might be SELECT salesperson_id, COUNT(orders) as order_total FROM sales GROUP BY salesperson_id;. By "parallelized," we mean that the query can be run simultaneously on each partition, and the final result obtained merely by summing the results obtained for all partitions.

- Achieving greater query throughput in virtue of spreading data seeks over multiple disks.

MySQL 8.0 中分区表的变化

在 MySQL 5.7 中，对于分区表，有个很重大的更新，即 InnoDB 存储引擎原生支持了分区，无需再通过 ha_partition 接口来实现。

所以，在 MySQL 5.7 中，如果要创建基于 MyISAM 存储引擎的分区表，会提示 warning 。

The&#xA0;partition&#xA0;engine,&#xA0;used&#xA0;by&#xA0;table&#xA0;'sbtest.t_range',&#xA0;is&#xA0;deprecated&#xA0;and&#xA0;will&#xA0;be&#xA0;removed&#xA0;in&#xA0;a&#xA0;future&#xA0;release.&#xA0;Please&#xA0;use&#xA0;native&#xA0;partitioning&#xA0;instead.

而在 MySQL 8.0 中，则更为彻底，server 层移除了 ha_partition 接口代码。

如果要使用分区表，只能使用支持原生分区的存储引擎。在 MySQL 8.0 中，就只有 InnoDB。

这就意味着，在 MySQL 8.0 中，如果要创建 MyISAM 分区表，基本上就不可能了。

这也从另外一个角度说明了为什么生产上不建议使用 MyISAM 表。

mysql>&#xA0;CREATE&#xA0;TABLE&#xA0;t_range&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;id&#xA0;INT,<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;name&#xA0;VARCHAR(10)<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;)&#xA0;ENGINE&#xA0;=&#xA0;MyISAM<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;PARTITION&#xA0;BY&#xA0;RANGE&#xA0;(id)&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p0&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(5),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p1&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(10)<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;);<br>ERROR&#xA0;1178&#xA0;(42000):&#xA0;The&#xA0;storage&#xA0;engine&#xA0;for&#xA0;the&#xA0;table&#xA0;doesn't&#xA0;support&#xA0;native&#xA0;partitioning

为什么分区键必须是主键的一部分？

在使用分区表时，您经常会遇到以下错误。

[En]

When using partition tables, you often encounter the following error.

mysql>&#xA0;CREATE&#xA0;TABLE&#xA0;opr&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_no&#xA0;INT,<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_date&#xA0;DATETIME,<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;description&#xA0;VARCHAR(30),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PRIMARY&#xA0;KEY&#xA0;(opr_no)<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;)<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;PARTITION&#xA0;BY&#xA0;RANGE&#xA0;COLUMNS&#xA0;(opr_date)&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p0&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;('20210101'),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p1&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;('20210102'),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p2&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;MAXVALUE<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;);<br>ERROR&#xA0;1503&#xA0;(HY000):&#xA0;A&#xA0;PRIMARY&#xA0;KEY&#xA0;must&#xA0;include&#xA0;all&#xA0;columns&#xA0;in&#xA0;the&#xA0;table's&#xA0;partitioning&#xA0;function&#xA0;(prefixed&#xA0;columns&#xA0;are&#xA0;not&#xA0;considered).

也就是说，分区键必须是主键的一部分。

[En]

That is, the partitioning key must be part of the primary key.

上面的 opr 是一张操作流水表。其中，opr_no 是操作流水号，一般都会被设置为主键，opr_date 是操作时间。基于操作时间来进行分区，是一个常见的分区场景。

为了突破这个限制，可将 opr_date 作为主键的一部分。

mysql>&#xA0;CREATE&#xA0;TABLE&#xA0;opr&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_no&#xA0;INT,<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_date&#xA0;DATETIME,<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;description&#xA0;VARCHAR(30),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PRIMARY&#xA0;KEY&#xA0;(opr_no,&#xA0;opr_date)<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;)<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;PARTITION&#xA0;BY&#xA0;RANGE&#xA0;COLUMNS&#xA0;(opr_date)&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p0&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;('20210101'),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p1&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;('20210102'),<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p2&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;MAXVALUE<br>&#xA0;&#xA0;&#xA0;&#xA0;->&#xA0;);<br>Query&#xA0;OK,&#xA0;0&#xA0;rows&#xA0;affected&#xA0;(0.04&#xA0;sec)

但是这么创建，又会带来一个新的问题，即对于同一个 opr_no ，可插入到不同分区中。如下所示：

mysql>&#xA0;insert&#xA0;into&#xA0;opr&#xA0;values(1,'2020-12-31&#xA0;00:00:01','abc');<br>Query&#xA0;OK,&#xA0;1&#xA0;row&#xA0;affected&#xA0;(0.00&#xA0;sec)<br><br>mysql>&#xA0;insert&#xA0;into&#xA0;opr&#xA0;values(1,'2021-01-01&#xA0;00:00:01','abc');<br>Query&#xA0;OK,&#xA0;1&#xA0;row&#xA0;affected&#xA0;(0.00&#xA0;sec)<br><br>mysql>&#xA0;select&#xA0;*&#xA0;from&#xA0;opr&#xA0;partition&#xA0;(p0);<br>+--------+---------------------+-------------+<br>|&#xA0;opr_no&#xA0;|&#xA0;opr_date&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;|&#xA0;description&#xA0;|<br>+--------+---------------------+-------------+<br>|&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;1&#xA0;|&#xA0;2020-12-31&#xA0;00:00:01&#xA0;|&#xA0;abc&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;|<br>+--------+---------------------+-------------+<br>1&#xA0;row&#xA0;in&#xA0;set&#xA0;(0.00&#xA0;sec)<br><br>mysql>&#xA0;select&#xA0;*&#xA0;from&#xA0;opr&#xA0;partition&#xA0;(p1);<br>+--------+---------------------+-------------+<br>|&#xA0;opr_no&#xA0;|&#xA0;opr_date&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;|&#xA0;description&#xA0;|<br>+--------+---------------------+-------------+<br>|&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;1&#xA0;|&#xA0;2021-01-01&#xA0;00:00:01&#xA0;|&#xA0;abc&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;|<br>+--------+---------------------+-------------+<br>1&#xA0;row&#xA0;in&#xA0;set&#xA0;(0.00&#xA0;sec)

这实际上违背了业务对于 opr_no 的唯一性要求。

既然这样，有的童鞋会建议给 opr_no 添加个唯一索引，But，现实是残酷的。

mysql>&#xA0;create&#xA0;unique&#xA0;index&#xA0;uk_opr_no&#xA0;on&#xA0;opr&#xA0;(opr_no);<br>ERROR&#xA0;1503&#xA0;(HY000):&#xA0;A&#xA0;UNIQUE&#xA0;INDEX&#xA0;must&#xA0;include&#xA0;all&#xA0;columns&#xA0;in&#xA0;the&#xA0;table's&#xA0;partitioning&#xA0;function&#xA0;(prefixed&#xA0;columns&#xA0;are&#xA0;not&#xA0;considered)

即使添加唯一索引，分区键也必须包含在唯一索引中。

[En]

Even if you add a unique index, the partitioning key must be included in the unique index.

总而言之，对于 MySQL 分区表，无法从数据库层面保证非分区列在表级别的唯一性，只能确保其在分区内的唯一性。

这也是 MySQL 分区表所为人诟病的地方之一。

但实际上，这个锅让 MySQL 背并不合适，对于 Oracle 索引组织表（ InnoDB 即是索引组织表），同样也有这个限制。

Oracle 官方文档（ http://docs.oracle.com/cd/E11882_01/server.112/e40540/schemaob.htm#CNCPT1514），在谈到索引组织表（Index-Organized Table，简称 IOT）的特性时，就明确提到了 “分区键必须是主键的一部分”。

Note&#xA0;the&#xA0;following&#xA0;characteristics&#xA0;of&#xA0;partitioned&#xA0;IOTs:<br><br>&#xA0;&#xA0;&#xA0;-&#xA0;Partition&#xA0;columns&#xA0;must&#xA0;be&#xA0;a&#xA0;subset&#xA0;of&#xA0;primary&#xA0;key&#xA0;columns.<br>&#xA0;&#xA0;&#xA0;-&#xA0;Secondary&#xA0;indexes&#xA0;can&#xA0;be&#xA0;partitioned&#xA0;locally&#xA0;and&#xA0;globally.<br>&#xA0;&#xA0;&#xA0;-&#xA0;OVERFLOW&#xA0;data&#xA0;segments&#xA0;are&#xA0;always&#xA0;equipartitioned&#xA0;with&#xA0;the&#xA0;table&#xA0;partitions.

下面，我们看看刚开始的建表 SQL ，在 Oracle 中的执行效果。

SQL>&#xA0;CREATE&#xA0;TABLE&#xA0;opr_oracle&#xA0;(<br>&#xA0;&#xA0;2&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_no&#xA0;NUMBER,<br>&#xA0;&#xA0;3&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_date&#xA0;DATE,<br>&#xA0;&#xA0;4&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;description&#xA0;VARCHAR2(30),<br>&#xA0;&#xA0;5&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PRIMARY&#xA0;KEY&#xA0;(opr_no)<br>&#xA0;&#xA0;6&#xA0;&#xA0;)<br>&#xA0;&#xA0;7&#xA0;&#xA0;ORGANIZATION&#xA0;INDEX<br>&#xA0;&#xA0;8&#xA0;&#xA0;PARTITION&#xA0;BY&#xA0;RANGE&#xA0;(opr_date)&#xA0;(<br>&#xA0;&#xA0;9&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p0&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(TO_DATE('20170713',&#xA0;'yyyymmdd')),<br>&#xA0;10&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p1&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(TO_DATE('20170714',&#xA0;'yyyymmdd')),<br>&#xA0;11&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p2&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(MAXVALUE)<br>&#xA0;12&#xA0;&#xA0;);<br>PARTITION&#xA0;BY&#xA0;RANGE&#xA0;(opr_date)&#xA0;(<br>&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;*<br>ERROR&#xA0;at&#xA0;line&#xA0;8:<br>ORA-25199:&#xA0;partitioning&#xA0;key&#xA0;of&#xA0;a&#xA0;index-organized&#xA0;table&#xA0;must&#xA0;be&#xA0;a&#xA0;subset&#xA0;of&#xA0;the<br>primary&#xA0;key

同样报错。

注意，这里指定了 ORGANIZATION INDEX ，创建的是索引组织表。

看来，分区键必须是主键的一部分并不是 MySQL 的限制，而是索引组织表的限制。

在我看来，索引组织表之所以有这样的限制，是基于性能考虑。

[En]

In my opinion, the reason why there is such a restriction on index organization tables is based on performance considerations.

假设分区键和主键是两个不同的列，尽管在插入操作期间也指定了分区键，但需要扫描所有分区以确定插入的主键值是否违反唯一性约束。这样效率会比较低，这与分区表的初衷是背道而驰的。

[En]

Assuming that the partition key and the primary key are two different columns, although the partition key is also specified during the insert operation, all partitions need to be scanned to determine whether the inserted primary key value violates the uniqueness constraint. In this way, the efficiency will be relatively low, which goes against the original intention of the partition table.

对于堆表没有这样的限制。

[En]

There is no such restriction for heap tables.

在堆表中，主键和表中的数据是分开存储的，只使用主键索引来确定插入的主键值是否违反唯一性约束。

[En]

In the heap table, the primary key and the data in the table are stored separately, and only the primary key index is used to determine whether the inserted primary key value violates the uniqueness constraint.

但与 MySQL 不一样的是，Oracle 实现了全局索引，所以针对上面的，同一个 opr_no，允许插入到不同分区中的问题，可通过全局唯一索引来规避。

SQL>&#xA0;CREATE&#xA0;TABLE&#xA0;opr_oracle&#xA0;(<br>&#xA0;&#xA0;2&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_no&#xA0;NUMBER,<br>&#xA0;&#xA0;3&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;opr_date&#xA0;DATE,<br>&#xA0;&#xA0;4&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;description&#xA0;VARCHAR2(30),<br>&#xA0;&#xA0;5&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PRIMARY&#xA0;KEY&#xA0;(opr_no,&#xA0;opr_date)<br>&#xA0;&#xA0;6&#xA0;&#xA0;)<br>&#xA0;&#xA0;7&#xA0;&#xA0;ORGANIZATION&#xA0;INDEX<br>&#xA0;&#xA0;8&#xA0;&#xA0;PARTITION&#xA0;BY&#xA0;RANGE&#xA0;(opr_date)&#xA0;(<br>&#xA0;&#xA0;9&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p0&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(TO_DATE('20170713',&#xA0;'yyyymmdd')),<br>&#xA0;10&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p1&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(TO_DATE('20170714',&#xA0;'yyyymmdd')),<br>&#xA0;11&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;PARTITION&#xA0;p2&#xA0;VALUES&#xA0;LESS&#xA0;THAN&#xA0;(MAXVALUE)<br>&#xA0;12&#xA0;&#xA0;);<br><br>Table&#xA0;created.<br><br>SQL>&#xA0;create&#xA0;unique&#xA0;index&#xA0;uk_opr_no&#xA0;on&#xA0;opr_oracle&#xA0;(opr_no);<br><br>Index&#xA0;created.<br><br>SQL>&#xA0;insert&#xA0;into&#xA0;opr_oracle&#xA0;values(1,to_date('2020-12-31&#xA0;00:00:01','yyyy-mm-dd&#xA0;hh24:mi:ss'),'abc');<br><br>1&#xA0;row&#xA0;created.<br><br>SQL>&#xA0;insert&#xA0;into&#xA0;opr_oracle&#xA0;values(1,to_date('2020-12-31&#xA0;00:00:01','yyyy-mm-dd&#xA0;hh24:mi:ss'),'abc');<br>insert&#xA0;into&#xA0;opr_oracle&#xA0;values(1,to_date('2020-12-31&#xA0;00:00:01','yyyy-mm-dd&#xA0;hh24:mi:ss'),'abc')<br>*<br>ERROR&#xA0;at&#xA0;line&#xA0;1:<br>ORA-00001:&#xA0;unique&#xA0;constraint&#xA0;(SCOTT.SYS_IOT_TOP_87350)&#xA0;violated

但 MySQL 却无能为力，之所以会这样，是因为 MySQL 分区表只实现了本地分区索引（Local Partitioned Index），而没有实现 Oracle 中的全局索引（Global Index）。

本地分区索引 VS 全局索引

本地分区索引和全局索引示意图如下：

[En]

The schematic diagram of the local partition index and the global index is as follows:

结合示意图，我们来看看这两个指数的区别：

[En]

Combined with the schematic, let’s look at the difference between the two indexes:

本地分区索引同时也是分区索引，分区索引和表分区之间是一一对应的。而全局索引，既可以是分区的，也可以是不分区的。如果是全局分区索引，一个分区索引可对应多个表分区，同样，一个表分区也可对应多个分区索引。
对本地分区索引的管理操作只会影响到单个分区，不会影响到其它分区。而对全局分区索引的管理操作会造成整个索引的失效，当然，这一点可通过 UPDATE INDEXES 子句加以规避。
本地分区索引只能保证分区内的唯一性，无法保证表级别的唯一性，但全局分区可以。
在 Oracle 中，无论是索引组织表还是堆表，如果要创建本地唯一索引，同样也要求分区键必须是唯一键的一部分。

SQL>&#xA0;create&#xA0;unique&#xA0;index&#xA0;uk_opr_no_local&#xA0;on&#xA0;opr_oracle(opr_no)&#xA0;local;<br>create&#xA0;unique&#xA0;index&#xA0;uk_opr_no_local&#xA0;on&#xA0;opr_oracle(opr_no)&#xA0;local<br>&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;&#xA0;*<br>ERROR&#xA0;at&#xA0;line&#xA0;1:<br>ORA-14039:&#xA0;partitioning&#xA0;columns&#xA0;must&#xA0;form&#xA0;a&#xA0;subset&#xA0;of&#xA0;key&#xA0;columns&#xA0;of&#xA0;a&#xA0;UNIQUE<br>index

总结

MySQL 分区表关于”分区键必须是唯一键（主键和唯一索引）的一部分”的限制，本质上是索引组织表的限制。
MySQL 分区表只实现了本地分区索引，没有实现全局索引，所以无法保证非分区列的全局唯一。

如果要保证非分区列的全局唯一性，只能依靠业务实现。

[En]

If you want to ensure the global uniqueness of non-partitioned columns, you can only rely on the business implementation.

不推荐使用 MyISAM 分区表。当然，任何场景都不推荐使用 MyISAM 表。

Original: https://www.cnblogs.com/ivictor/p/15713667.html
Author: iVictor
Title: MySQL 分区表，为什么分区键必须是主键的一部分？

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/507942/

转载文章受原作者版权保护。转载请注明原作者出处！

数据库

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

flowable 从zip压缩包部署流程定义

/**部署流程定义(从zip压缩包) * @param name //部署名称 * @param zippath //zip文件路径 * @return 部署ID * @from …

数据库 2023年6月6日
0077
【数据结构】跳表

一、基本概念 1.1 定义跳表(SkipList)：增加了向前指针的链表叫做指针。跳表全称叫做跳跃表，简称跳表。跳表是一个随机化的数据结构，实质是一种可以进行二分查找的有序链表。…

数据库 2023年6月11日
0076
DRF补充数据库异常和Redis异常

DRF补充数据库异常和Redis异常 (1)在项目适当位置新建exceptions.py，内容如下： from rest_framework.views import except…

数据库 2023年6月14日
0053
keycloak~资源的远程授权

17.1远程资源授权准备 17.1.1认证和访问流程图参考：http://www.zyiz.net/tech/detail-141309.html 17.1.2为用户指定角色可…

数据库 2023年6月6日
0081
ArrayList扩容机制

1.构造函数有三种说第一种无参构造，默认初始容量为10 2.add函数 /** * 将指定的元素追加到此列表的末尾。 */ public boolean add(E e) { …

数据库 2023年6月16日
0075
系统稳定性—OutOfMemoryError常见原因及解决方法

当 JVM内存严重不足时，就会抛出 java.lang.OutOfMemoryError错误。本文总结了常见的 OOM原因及其解决方法，如下图所示。如有遗漏或错误，欢迎补充指正。 …

数据库 2023年6月11日
0089
ReentrantLock 公平锁源码第1篇

ReentrantLock 1 这篇还是接着ReentrantLock的公平锁,没看过第0篇的可以先去看上一篇https://www.cnblogs.com/sunankang/p…

数据库 2023年6月16日
0087
翻译｜使用 StatefulSet 运行数据库应用

本文介绍 Kubernetes 支持数据库等有状态应用的常见解决方案：StatefulSet。我们在构建机器学习向量管理时面临的一个重要问题是：如何持久化数据，避免数据丢失？ […

数据库 2023年5月24日
0090
Git 环境搭建

安装 Git：官网 👉https://git-scm.com/ GIt基础配置（以下操作均在 git bash 窗口下进行） git config –global user.na…

数据库 2023年6月6日
0067
MySQL特性：ICP,Index Condition Pushdown

ICP,Index Condition Pushdown 理解ICP特性前，先去前面理解MRR特性，了解where条件中的三阶段提取： index key、index filter…

数据库 2023年6月16日
0071
MySQL提示sql_mode=only_full_group_by解决办法

MySQL异常sql_mode=only_full_group_by 原因：在MySQL 5.7后MySQL默认开启了SQL_MODE严格模式，对数据进行严格校验。会报sql_mo…

数据库 2023年6月14日
0080
文件传输工具：FileZilla的使用

FileZilla FileZilla 是一款高效的 FTP 客户端工具。FileZilla 可以帮助您将本地计算机上的文件上传到虚拟主机实例中。 FileZilla 界面介绍如…

数据库 2023年6月11日
0080
Logback实现按业务输出到对应日志文件

一、方案由于需要按业务生成不同的日志文件，看到按业务来区分，我的第一感觉就是业务其实是可以按包名来区分的。所以其实我们只要实现不同的包下面的日志输出到不同的文件，就能实现需求了。…

数据库 2023年6月6日
00263
Maven进行clean时报错，解决方法

Q1：由于网络原因，maven仓库中产生了后缀LastUpdated文件，再次clean直接报错参考方法：https://www.cnblogs.com/DDgougou/p/1…

数据库 2023年6月9日
00102
mysql多实例部署

在MySQL中配置多实例 1.软件下载 2.配置用户和组并解压二进制程序至/usr/local下 3.创建各实例数据存放的目录 4.初始化各示例 5.配置配置文件/etc/my.c…

数据库 2023年5月24日
0084
关于在linux上部署.netcore项目，只能Linux访问，不能外部主机访问的问题

在我们在Linux上部署完.netcore项目之后，是进入到部署项目的文件夹之下启动项目，比如我的就是在www/core文件夹下。首先cd 之后我们直接启动项目之后我们在win…

数据库 2023年6月11日
00161

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

MySQL 分区表，为什么分区键必须是主键的一部分？

水平拆分 VS 垂直拆分

分区表

MySQL 8.0 中分区表的变化

为什么分区键必须是主键的一部分？

本地分区索引 VS 全局索引

总结

大家都在看