分布式ID生成之雪花算法

优化算法

2019-09-05

关注关注

唯一ID可以标识数据的唯一性，在分布式系统中生成唯一ID的方案有很多，常见的方式大概有以下三种：

依赖数据库，使用如MySQL自增列或Oracle序列等。
UUID随机数
snowflake雪花算法(本文将要讨论)

分布式ID生成之雪花算法

一、数据库和UUID方案的不足之处

采用数据库自增序列：

读写分离时，只有主节点可以进行写操作，可能有单点故障的风险
分表分库，数据迁移合并等比较麻烦

UUID随机数：

采用无意义字符串，没有排序
UUID使用字符串形式存储，数据量大时查询效率比较低

二、关于雪花算法

有这么一种说法，自然界中并不存在两片完全一样的雪花的。每一片雪花都拥有自己漂亮独特的形状、独一无二。雪花算法也表示生成的ID如雪花般独一无二。

分布式ID生成之雪花算法

1. 雪花算法概述

雪花算法生成的ID是纯数字且具有时间顺序的。其原始版本是scala版，后面出现了许多其他语言的版本如Java、C++等。

2. 组成结构

分布式ID生成之雪花算法

大致由：首位无效符、时间戳差值，机器(进程)编码，序列号四部分组成。

3. 特点(自增、有序、适合分布式场景)

时间位：可以根据时间进行排序，有助于提高查询速度。
机器id位：适用于分布式环境下对多节点的各个节点进行标识，可以具体根据节点数和部署情况设计划分机器位10位长度，如划分5位表示进程位等。
序列号位：是一系列的自增id，可以支持同一节点同一毫秒生成多个ID序号，12位的计数序列号支持每个节点每毫秒产生4096个ID序号

snowflake算法可以根据项目情况以及自身需要进行一定的修改。

分布式ID生成之雪花算法

三、雪花算法的缺点

雪花算法在单机系统上ID是递增的，但是在分布式系统多节点的情况下，所有节点的时钟并不能保证不完全同步，所以有可能会出现不是全局递增的情况。

分布式算法分布式部署算法 text-align

优化算法

0 关注 0 粉丝 0 动态

关注关注

一致性HASH算法在分布式应用场景使用

比如redis集群场景下，原本我们分3主3从部署。如果有一种算法，无论遇到扩容、缩容问题，最终受影响面足够小，即只有部分数据可能需要重新落DB，其他还是能正确找到对应缓存机器节点，那这是最好的。

Cheetahcubs 2020-07-05

php hash算法实现memcached分布式

Mysql是通过SQL语句管理“磁盘中”的文件，Memcached是通过客户端发送的命令管理“内存中缓存”的数据。需要缓存的对象或数据以 key/value 对的形式保存在服务器端，key的值通过hash进行转换，把value传递到对应的具体的某台服务器上

jkzyx 2020-06-29

分布式负载均衡算法

负载均衡算法分为两类：一种是静态负载均衡，一种是动态负载均衡。将请求按顺序轮流地分配到每个节点上，不关心每个节点实际的连接数和当前的系统负载。采用源地址哈希法进行负载均衡，同一IP地址的客户端，当后端服务器列表不变时，它每次都会落到到同一台服务器进行访问。

seekerhit 2020-05-17

分布式选举

主节点，在一个分布式集群中负责对其他节点的协调和管理。主节点的存在，就可以保证其他节点的有序运行，以及数据库集群中的写入数据在每个节点上的一致性。分布式选举算法：基于序号选举的算法、多数派算法。Election消息，用于发起选举；Alive消息，对Elec

憧憬 2020-04-17

分布式系统卫星时钟服务器（NTP服务器）架设与设计

分布式系统由Tanenbaum定义，“分布式系统是一组独立的计算机，在”分布式系统?原理和范例“中作为用户的单一，连贯的系统出现”。区块链通过构建全球分布式系统，尝试实现分散的新数据存储和组织结构。首先，定位到分布式系统的原因主要是可扩展性，位置和可用性。

YZR 2020-03-06

分布式基础

如果要让不同的子系统或者服务之间互相通信，首先必须有一套分布式服务框架。也就是各个服务可以互相感知到对方在哪里，可以发送请求过去，可以通过HTTP或者RPC的方式。在这里，最常见的技术就是dubbo以及spring cloud，当然大厂一般都是自己有服务框

zhangll00 2020-01-23

梯度下降的分布式训练简介

梯度下降法是目前最常用的优化算法之一，也是目前最常用的神经网络优化方法。同时，每个最先进的深度学习库都包含各种优化梯度下降算法的实现。但大多数都是针对单个节点的训练——假设训练发生在单个GPU/CPU上。随着神经网络规模的日益增大，一些分布式和并行的训练算

frommymind 2019-12-13

Twitter的分布式自增ID算法Snowflake

Twitter-Snowflake算法产生的背景相当简单，为了满足Twitter每秒上万条消息的请求，每条消息都必须分配一条唯一的id，这些id还需要一些大致的顺序，并且在分布式系统中不同机器产生的id必须不同。把时间戳，工作机器id，序列号组合在一起。除

wangxiaohua 2015-05-09

分布式系统之Quorum （NRW）算法

Quorom 机制，是一种分布式系统中常用的，用来保证数据冗余和最终一致性的投票算法，其主要数学思想来源于鸽巢原理。在有冗余数据的分布式存储系统当中，冗余数据对象会在不同的机器之间存放多份拷贝。算法来源于[Gifford, 1979][3][1]。第二条规

horizonheart 2016-12-06

Twitter雪花算法SnowFlake改造: 兼容JS截短位数的53bit分布式ID生成器

众所周知, 在分布式全局唯一ID生成器方案中, 由Twitter开源的SnowFlake算法对比美团Leaf为代表的需要部署的发号器算法, 因其有性能高, 代码简单, 不依赖第三方服务, 无需独立部署服务等优点, 在一般情况下已经能满足绝大多数系统的需求,

阿义 2019-10-28

分布式系统的核心问题一致性与共识

区块链系统是一个分布式系统，而分布式系统的首要问题是一致性的保障。一致性并不代表结果正确与否，而是系统对外呈现的状态一致与否；例如，所有节点都达成失败状态也是一种一致。　　将可能引发不一致的并行操作进行串行化是现代分布式系统处理一致性问题的的基础思路。G

loviezhang 2019-10-22

分布式算法（转）

raft是工程上使用较为广泛的强一致性、去中心化、高可用的分布式协议。在这里强调了是在工程上，因为在学术理论界，最耀眼的还是大名鼎鼎的Paxos。但Paxos是：少数真正理解的人觉得简单，尚未理解的人觉得很难，大多数人都是一知半解。直到看到raft的论文，

来信了上校 2019-10-21

分布式配置服务etcd VS 分布式协调服务zookeeper

etcd是一个高可用的键值存储系统，主要用于共享配置和服务发现。etcd是由CoreOS开发并维护的，灵感来自于 ZooKeeper 和 Doozer，它使用Go语言编写，并通过Raft一致性算法处理日志复制以保证强一致性。Google的容器集群管理系统K

阿义 2017-03-10

《区块链底层设计Java实战》之第五章分布式一致性与共识算法

章将介绍区块链系统的另一个基石——共识算法。通常的理解是共同的认识、一致的看法。识指的是区块链系统中各个节点账本数据同步的实现。因此，本章将从简单的分布式一致算法开始，一步步引导读者学习共识算。只要能掌握分布式一致算法的“美人心”，各类共识算法都会有似曾相

zhangll00 2019-01-23

分布式系统下的哈希一致性算法设计

我们知道，在分布式系统中当数据量无法使用单机进行存储时，最简单粗暴的方法就是水平扩展：加机器，搞集群。最开始的解决方案就是首先给5台机器分别编号：1、2、3、4、5 当对一个数据进行操作时首先计算key的hash然后对机器数量5进行取余，得出的余数就是需要

wangxiaohua 2019-04-25

分布式系统的一致性算法简介

在分布式系统中，我们经常遇到多数据副本保持一致的问题，在我们所能找到的资料中该问题讲的很笼统，模模糊糊的，把多个问题或分类糅合在一起，难以理解。在思考和翻阅资料后，通俗地把一致性的问题可分解为2个问题：。在强一致性的算法中，强调单次修改后结果的一致，需要保

KDF000 2015-06-03

《区块链底层设计Java实战》之第五章分布式一致性与共识算法

hweiyi 2019-01-23

分布式搜索算法

对于搜索引擎来说，索引存放在成千上万台机器上，如何进行分布式搜索呢？假设搜索结果是以分页的方式显示，以PageNumber代表当前页，从1开始，以PageSize代表页面大小，默认为10，以N代表搜索服务器数量。最简单的分布式搜索算法为：有一台合并服务器负

fuel 2013-10-26

从 Memcached 分布式应用看一致性哈希散列函数的选择

Hash设计的原则是尽量使元素均匀分布，从而最大处利用内存。可以说散列函数在当代计算机和网络系统中所起的重要作用大家应该都有目共睹了，特别是在目前这个分布式应用爆炸的时代，这个方面的知识只会越来越引起人们的重视，本文重在从 Memcached 这个流行的

MichaelHsu 2013-07-27

zookeeper 分布式任务

网上说了一大堆关于zookeeper选举，参差不齐，貌似没有啥代码可以copy，把自己也给绕进去了，这里结合一些网上的看法，自己写了代码，关于zookeeper的。ZkLocklock=newZkLock{//创建应用构建必须是有序的，锁在我上篇文字

nmjhehe 2014-03-01

安科网

分布式ID生成之雪花算法

优化算法

优化算法

相关推荐

一致性HASH算法在分布式应用场景使用

php hash算法实现memcached分布式

分布式负载均衡算法

分布式选举

分布式系统卫星时钟服务器（NTP服务器）架设与设计

分布式基础

梯度下降的分布式训练简介

Twitter的分布式自增ID算法Snowflake

分布式系统之Quorum （NRW）算法

Twitter雪花算法SnowFlake改造: 兼容JS截短位数的53bit分布式ID生成器

分布式系统的核心问题一致性与共识

分布式算法（转）

分布式配置服务etcd VS 分布式协调服务zookeeper

《区块链底层设计Java实战》之第五章分布式一致性与共识算法

分布式系统下的哈希一致性算法设计

分布式系统的一致性算法简介

《区块链底层设计Java实战》之第五章分布式一致性与共识算法

分布式搜索算法

从 Memcached 分布式应用看一致性哈希散列函数的选择

zookeeper 分布式任务

优化算法