MongoDB 分片

发表于 2020-09-20 更新于 2025-04-01 分类于数据库，文档数据库， mongodb 本文字数： 4.2k 阅读时长 ≈ 4 分钟

MongoDB 分片

::: info 概述

分区通常是这样定义的，即每一条数据（或者每条记录，每行或每个文档）只属于某个特定分区。实际上，每个分区都可以视为一个完整的小型数据库，虽然数据库可能存在一些跨分区的操作。

在不同系统中，分区有着不同的称呼，例如它对应于 MongoDB, Elasticsearch 和 SolrCloud 中的 shard, HBase 的 region, Bigtable 中的 tablet, Cassandra 和 Riak 中的 vnode ，以及 Couch base 中的 vBucket。

数据量如果太大，单台机器进行存储和处理就会成为瓶颈，因此需要引入数据分区机制。分区的目地是通过多台机器均匀分布数据和查询负载，避免出现热点。这需要选择合适的数据分区方案，在节点添加或删除时重新动态平衡分区。

分区通常与复制结合使用，即每个分区在多个节点都存有副本。这意味着某条记录属于特定的分区，而同样的内容会保存在不同的节点上以提高系统的容错性。一个节点上可能存储了多个分区。每个分区都有自己的主副本，例如被分配给某节点，而从副本则分配在其他一些节点。一个节点可能既是某些分区的主副本，同时又是其他分区的从副本。

:::

分片简介

可扩展性（Scalability）指的是分布式系统通过扩展集群机器规模提高系统性能（吞吐、响应时间、完成时间）、存储容量、计算能力的特性，是分布式系统的特有性质。

系统扩展可以分为垂直扩展、水平扩展。

垂直扩展，即提升单机的硬件处理能力，比如 CPU 处理能力，内存容量，磁盘等方面。但是，单机是有性能瓶颈的，一旦触及瓶颈，再想提升，付出的成本和代价会极高。通俗来说，就三个字：得加钱！
水平扩展：采用分而治之的思想，通过集群来分担吞吐量。集群中的应用机器（节点）通常被设计成无状态，用户可以请求任何一个节点，这些节点共同分担访问压力。水平扩展有两个要点：
- 集群化、分区化：将一个完整的应用化整为零，如果是无状态应用，可以直接集群化部署；如果是有状态应用，可以将状态数据分区（分片），然后部署到多台机器上。
- 负载均衡：集群化、分区化后，要解决的问题是，请求应该被分发（寻址）到哪台机器上。这就需要通过某种策略来控制分发，这种技术就是负载均衡。

MongoDB 支持通过分片进行水平扩展。

MongoDB 分片集群由以下组件构成：

shard（分片）：分片包含分片集群的分片数据的子集。集群的分片共同保存集群的整个数据集。分片必须作为副本集部署，以提供冗余和高可用性。
mongos（路由器）：mongos 充当查询路由器，在客户端应用程序和分片集群之间提供接口。从 MongoDB 4.4 开始，mongos 可以支持 hedged reads 以最大程度地减少延迟。
config servers（配置服务器）：提供集群元数据存储和分片数据分布的映射。

下图描述了分片集群内各组件之间的交互：

MongoDB 在集合级别对数据进行分片，从而将集合数据分布到集群中的分片上。

分片集群组件

分片

分片集群中的每个数据库都有一个主分片。它是数据库中所有未分片集合的默认分片。默认情况下，数据库的所有未分片集合均在数据库主分片上创建。

在创建新数据库时，mongos 通过选择集群中数据量最少的分片来选择主分片。mongos 使用 listDatabases 命令返回的 totalSize 字段作为选择标准的一部分。

配置服务器

配置服务器用于存储分片集群上的元数据。元数据反映了分片集群内所有数据和组件的状态和组织。元数据包括每个分片上的数据段列表以及定义数据段的范围。

mongos 实例缓存此数据，并使用它来将读取和写入操作路由到正确的分片。mongos 在集群的元数据发生变化（例如添加分片）时更新缓存。分片还从配置服务器读取数据段元数据。

配置服务器还存储 “自管理部署上的身份验证” 配置信息，例如基于角色的访问控制或集群的内部身份验证设置。

MongoDB 还使用配置服务器来管理分布式锁。

每个分片集群必须拥有自己的配置服务器。请勿对不同的分片集群使用相同的配置服务器。

路由节点

MongoDB mongos 实例将查询和写入操作路由到分片集群中的分片。从应用程序的角度来看，mongos 提供了通向分片集群的唯一接口。应用程序永远不会直接与分片连接或通信。

mongos 通过缓存来自配置服务器的元数据来跟踪哪个分片上有哪些数据。mongos 使用该元数据将操作从应用程序和客户端路由到 mongod 实例。mongos 没有持久状态，且会使用最少的系统资源。

路由和结果进程

mongos 实例通过以下方式将查询路由到集群：

确定必须接收查询的分片的列表。
在所有目标分片上建立游标。

然后，mongos 会合并来自每个目标分片的数据，并返回结果文档。在 mongos 检索结果之前，会对每个分片执行某些查询修饰符，例如排序。

如果结果不需要在数据库的主分片上运行，则在多个分片上运行的聚合操作可能会将结果路由回 mongos 以合并结果。

在某些情况下，当分片键或分片键的前缀是查询的一部分时，mongos 会执行定向操作，将查询路由到集群中的分片子集。

mongos 对不包含分片键的查询执行广播操作，将查询路由到集群中的所有分片。某些包含分片键的查询仍可能导致广播操作，具体取决于集群中数据的分布和查询的选择性。

`mongos` 如何处理查询修饰符

排序 - 如果查询结果未进行排序，mongos 实例则会将打开一个结果游标，而该游标由分片上的所有游标“循环”生成。
限制 - 如果查询使用 limit() 游标方法限制结果集的大小，则 mongos 实例会将该限制传递给分片，然后在将结果返回给客户端之前将限制重新应用于结果。
跳过 - 如果查询使用 skip() 游标方法指定要跳过的记录数量，则 mongos 无法将此跳过传递给分片，而是从分片中检索未跳过的结果，并在汇编完整结果时跳过相应数量的文档。与 limit() 一起使用时，mongos 会将限值加上 skip() 的值传递给分片以提高这些操作的效率。

广播操作

mongos 实例会向集合的所有分片广播查询，除非 mongos 可以确定哪个分片或分片子集存储此数据。

MongoDB 分片路由-广播操作

在 mongos 收到所有分片的响应后，它会合并数据并返回结果文档。广播操作性能取决于集群的整体负载，以及网络延迟、单个分片负载和每个分片返回的文档数量等变量。尽可能选择引起针对性操作而非广播操作的操作。

多更新操作始终是广播操作。

updateMany() 和 deleteMany() 方法为广播操作，除非查询文档完整指定了分片键。

定向操作

mongos 可以将包含分片键或复合分片键前缀的查询路由到特定分片或分片集。mongos 使用分片键值来定位范围包含分片键值的数据段，并将查询指向包含该数据段的分片。

MongoDB 分片路由-定向操作

例如，如果分片键是：

1	{ "a": 1, "b": 1, "c": 1 }

mongos 程序可以可以将包含完整分片键或以下任一分片键前缀的查询路由到特定的分片或分片集：

1 2	{ a: 1 } { a: 1, b: 1 }

所有 insertOne() 操作都以一个分片为目标。insertMany() 数组中的每个文档都以单个分片为目标，但不能保证数组中的所有文档都插入到单个分片中。

所有 updateOne()、replaceOne() 和 deleteOne() 操作都必须在查询文档中包含分片键或 _id。如果在没有分片键或_id的情况下使用这些方法，MongoDB 将返回错误。

根据集群中数据的分布和查询的选择性，mongos 仍可能执行广播业务来完成这些查询。

分片键

分片键可以是单个索引字段，也可以是复合索引涵盖的多个字段，复合索引决定集合文档在集群分片中的分布。

MongoDB 将分片键值（或哈希分片键值）的取值区间划分为不重叠的分片键值（或哈希分片键值）范围。每个范围都与一个数据块相关联，MongoDB 会尝试在集群中的各个分片之间均匀分配这些数据块。

分片策略

MongoDB 支持两种分片策略：Hash 分片和范围分片。

哈希分片

哈希分片使用单字段哈希索引或组合哈希索引作为分片键，在分片集群中对数据进行分区。

注意：使用哈希索引解析查询时，MongoDB 会自动计算哈希值，应用程序不需要计算哈希。

虽然分片键的范围可能“相近”，但它们的哈希值却不太可能位于同一数据段。基于哈希值的数据分配可促进更均匀的数据分布，尤其是在分片键单调变化的数据集中。

然而，哈希分布意味着对分片键进行基于范围的查询时，不太可能以单个分片为目标，从而导致更多的集群范围的广播操作

范围分片

范围分片涉及根据分片键值将数据划分为多个范围。然后，根据分片键值为每个数据段分配一个范围。

具有“相近”数值的一系列分片键更有可能位于同一个数据段上。这允许进行有针对性的操作，因为 mongos 只能将操作路由到包含所需数据的分片。

范围分片的效率取决于所选分片键。考虑不周的分片键可能会导致数据分布不均，从而抵消分片的某些好处甚或导致性能瓶颈。

扩展阅读：范围分片

分片负载均衡

MongoDB 负载均衡器是一个后台进程，用于监控每个分片集合的每个分片上的数据量。当给定分片上的分片集合的数据量达到特定迁移阈值时，负载均衡器会尝试在分片之间自动迁移数据，并在遵从区域的前提下实现每个分片的数据量均衡。默认情况下，负载均衡器进程始终处于启用状态。

分片集群的均衡过程对用户和应用程序层是完全透明的，不过在执行过程中可能会对性能产生一些影响。

Diagram of a collection distributed across three shards. For this collection, the difference in the number of chunks between the shards reaches the *migration thresholds* (in this case, 2) and triggers migration.

负载均衡器在配置服务器副本集 (CSRS) 的主节点上运行。

分片集群中的区域

区域可帮助改善跨多个数据中心的分片集群的数据局部性。

在分片集群中，可以根据分片键创建分片数据区域。可以将每个区域与集群中的一个或多个分片相关联。一个分片可以与任意数量的区域关联。在均衡的集群中，MongoDB 仅将区域覆盖的数据段迁移到与该区域相关联的分片。

每个区域涵盖分片键值的一个或多个范围。某一区域所覆盖的每个范围始终包括其下边界，而不包括其上边界。

为要覆盖的区域定义范围时，必须使用分片键中包含的字段。如果使用的是复合分片键，此范围则须包含分片键的前缀。在选择分片键时，应考虑将来可能使用区域的情况。

扩展阅读：区域中的分片键

参考资料

MongoDB 官方文档之分片

MongoDB 分片

分片简介

分片集群组件

分片

配置服务器

路由节点

路由和结果进程

mongos 如何处理查询修饰符

广播操作

定向操作

分片键

分片策略

哈希分片

范围分片

分片负载均衡

分片集群中的区域

参考资料

`mongos` 如何处理查询修饰符