分布式唯一ID

请设置文章作者

发布于：Oct 28, 2021

分布式唯一ID

一、分布式唯一ID

ID是一种唯一的标识。在开发中，经常需要使用ID来唯一标识数据。例如，原神中给每个用户分配一个UID。

在最简单的情况下，可以使用数据库的主键自增，自动实现唯一ID。如Mysql的AUTO_INCREMENT。但这种方式具有一定的缺点：一方面，由于依赖于数据库自动实现ID自增，这意味着只有在完成数据的插入之后，才能获得改数据的ID。对于一些需要双向引用的数据，将不得不在插入两份数据后，再做一次更新操作，才能实现双向引用。另一方面，也是最重要的一方面，在分布式系统中，可能需要对数据库进行分库分表。一旦分库分表，通过数据库主键自增的方法将无法再保证ID的唯一性。

因此，在分布式的场景中，往往会设计一种ID生成器，去实现分布式ID的生成。

分布式ID需要尽可能满足以下要求：

唯一性：保证ID在分布式系统中全局唯一。
有序性：保证ID有序（一般是递增），有序的ID在很多场景下有利于性能的提升。
安全性：ID本身不能暴露出敏感信息。

二、常用方案

2.1 数据库号段模式

事实上，仍然可以通过数据库的主键自增，实现唯一ID的生成。只要分布式系统中所有的机器都只使用同一个数据库主键自增生成ID，而不是在自己的数据库服务中生成ID，就不会出现上述的情况。

但实际上，这样操作是不现实的。作为ID生成器的一台数据库服务器往往无法负担起整个分布式系统的请求。

数据库号段模式正是一种改进措施。每次访问用于生成ID的数据库服务器时，直接批量获取多个ID，称为获取一个号段，如获取ID：(1, 1000]。将ID缓存在本地，业务需要ID时直接从缓存中获取。直至缓存中的ID用尽，再重新去请求生成ID的数据库服务器。

2.2 UUID

UUID是Universally Unique Identifier，即通用唯一标识。

UUID是36个字符的字符串，格式为：xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx。UUID生成算法当前有5个版本：

version 1, date-time & MAC address
version 2, date-time & group/user id
version 3, MD5 hash & namespace
version 4, pseudo-random number
version 5, SHA-1 hash & namespace

对于version1和version4，由于时间戳和随机数的唯一性，可以保证生成的UUID是唯一的。

优点：

易于使用
生成UUID的速度较快

缺点：

字符串太长，占用空间。
作为无序的字符串，不适合用作数据库的主键或索引（速度太慢）
基于MAC地址的UUID生成算法可能导致泄露MAC地址

2.3 Snowflake

Snowflake 是 Twitter 开源的分布式 ID 生成算法。Snowflake由64bit组成。

第0位表示符号，一定为正，故第0位一定为0。
第1—41位表示时间戳。以毫秒为单位，2^41毫秒约可以表示69年的范围。但是指的注意的是，这里的时间戳并非传统意义的unix时间戳，不必从1970年1月1日开始计时，而是一种相对的时间戳，可以任意选取计时的起点。
第42—52位表示workerID。即工作机器的ID。可以保证在不同的机器上生成的ID互不相同。
第53—64位表示序列号。序列号是自增的，用来保证某个机器每毫秒生成的ID互不相同。故，1ms的时间中，一个worker最大能够生成2^12个ID。

优点：

生成速度较快，生成的ID有序。

缺点：

如果发生时钟回拨，可能会产生重复ID。

2.4 Leaf

Leaf是美团的分布式ID生成框架。支持号段模式，也支持snowflake模式。

具体细节可以参考美团官方技术团队的文章。

更新于：Nov 2, 2021

分布式

Etcd API

核心API123456789101112131415161718192021service KV { // 从键值存储中获取范围内的key. rpc Range(RangeRequ...

wireguard基础配置

本文配置的wireguard只是为了**（ 1.安装123add-apt-repository ppa:wireguard/wireguardapt updateapt install wir...