随机数概论——VRF，Commit Reveal，BLS的原理及应用

本文主要介绍了随机数在区块链中的需求及重要性，主要介绍了VRF，Commit Reveal，BLS的原理及应用，之后会继续完善。

一、场景需求

1. 随机数的需求

依靠随机数来分配社会资源，已经应用到日常生活的方方面面。从幼儿园入学资格、到初高中分配学校、再到买车买房、政府招标，都依赖随机摇号抽签。人的一生，很多重大的选择，其实都是随机数帮助决定的。从经济角度上来讲，随机数广泛应用于密码学、数值计算模拟、统计研究、乐透博彩、游戏抽奖等场合，具有极高的商业价值。

人们为产生随机数，也发明了掷骰子，转转盘，抛硬币等统计方法，通过计算机生成伪随机数，利用量子力学原理获取随机数等。这些方法虽然很好的解决了随机数的随机性、不可控制性、不可预测性等方面的问题，但是却缺乏去中心性与可证公平性。

自然地，人们希望找到一种更公平的随机数生成和发布机制。而区块链作为一个去中心化的平台，为可证公平的随机数生成提供了天然的基础。

但是在公有区块链上设计一个可用的随机数发生器难度更大。除了基本的随机数统计学要求外，公有链上一个可用的随机数发生器至少要满足无法预测，不可操控，难以串谋，可证公平，可审计这几个特点。

因此，如何在区块链上设计并实现可证公平的随机数发生器成为近年来一个重要的研究问题。自从Randao 团队在2015 年提出使用Commit Reveal 方案后，又分别有Vitalik Buterin 提出的Randao++ 方案、部分DApps 使用Oraclize 从链下服务获取随机数的方案，来实现区块链随机数生成。

2. 真随机与伪随机

伪随机数一般由确定的算法生成的，其分布函数与相关性均能通过统计测试。但与真随机数相比，它们由算法生成，而不是一个真实的随机过程。伪随机数也只是尽可能地接近其应具有的随机性，但是因为有“种子值”，所以伪随机数在一定程度上是可控可预测的。伪随机数可使用取中法、同余法、移位法、梅森旋转算法等方式产生。

真随机数的产生不可预计，也不可能重复产生两个相同的真随机数序列。真随机数一般使用物理现象产生，比如掷钱币、掷骰子、晃动鼠标、转转轮、使用电子元件的噪音、使用大气噪声、核裂变等。真随机数发生器的技术要求一般比较高，生产效率一般比伪随机数低。另外，如果信息熵的信息量很有限，不一定能产生真随机数。真随机可以进一步区分为统计意义上的随机以及量子效应上的随机。一般认为，由于量子力学内在的随机性，其产生的随机数比传统物理学通过统计产生的随机数更“真”。

Linux内核提供了统计方式的真随机数生成器。它利用机器的噪音生成随机数，噪音源包括各种硬件运行时速，用户和计算机交互时速，比如击键的间隔时间、鼠标移动速度、特定中断的时间间隔和块IO请求的响应时间等。random利用大气噪音生成真随机数并对外提供。另外，通过监听真空内亚原子粒子量子涨落产生的噪音，澳大利亚国立大学的科学家们建造了随机数发生器并提供给互联网用户。

量子现象利用了在原子尺度下粒子的行为具有随机性，而且其本质还未被人类发现，因此可以将其看做一个具有良好不确定性的熵源；混沌现象是指在混沌系统中，初始量的微小差异会导致未来的发展截然不同，因此除非获得初始时刻的全部准确信息，则无法预测未来的发展趋势（eg. random）。

3. 随机数生成方案衡量标准

不可预测：不可预测是针对所有参与者的，不管是生产者和消费者，都无法根据历史数据预测下一个随机数的可能值，即便是稍稍提高一点点预测的成功率都做不到，即具有马尔可夫性质。在公共随机数的方案中，还要求任何人根据任何公开信息也都不能提高预测概率，例如Bitcoin Beacon的方案中，即便知道区块的历史数据，矿池的公钥，待打包的交易列表等，也无法获得预测上的优势。
不可串谋：在随机数的生成过程中，部分参与方联合起来，互相交换各自的私有信息，并不能影响随机数的生成过程或改变随机数的结果，或具有其他比较优势，比如相比其他人提前获得即将生成的随机数的结果。
不可提前获知：随机数的参与方同时知晓该随机数，任何一方不能提前知道结果。
不可篡改：即随机数的生产者不能伪造一个随机数出来，而当一个随机数生成好后，该随机数无法被任何人修改。
不可选择：随机数的生产过程可能同时有很多个随机数生成，生产者无法只选择其中的某一个提供出去，或用其中一个替代另外一个。
不可隐瞒：生产者在随机数生成完成后，不能拒绝公开该随机数。即生产好的随机数一定会被公开，无法被隐藏或者撤回。
可参与：随机数的生成过程中，随机数的相关方可以容易的参与进来，随机数生成方案应该为一般人的广泛参与提供便利，降低或消除参与门槛，参与的权力不应该被剥夺。
可审计：在随机数生成过程结束后，其整体过程是可以被时候审计的。
成本：随机数的生产成本应该尽可能低
响应速度：随机数的生成过程应该足够快

4. 随机数发生器方案及评价

中心化随机数发生器
- NIST随机数生成器：NIST Randomness Beacon用于实现公共随机数源。它使用两个独立、商用的随机数发生器，每个发生器配备一个独立的物理熵源和SP800-90认可组件。能够实现不可预测（任何算法都无法预测该生成器将会给出的随机数），自主（能够抵抗不相关者介入或阻止分发随机数的过程），一致（一组用户访问该服务能够确实地获得相同的随机数）的随机数源。
- random.org：使用大气噪音生成随机数。即先用录音设备获得大气中的声波，再检测其细微变化作为生成随机数的熵源。
Bitcoin Beacon

斯坦福和普林斯顿的Bonneau&Goldfeder 等于2015年提出可将比特币的区块数据作为一个不依赖第三方的公开随机源，并分析了区块头所包含的熵，以及根据该熵所生成的随机数的安全性。

用比特币区块数据生成随机数的问题在于，其通用安全性不够高，无法防止“块保留攻击（Block Withholding Attacks）”，即参与者可以贿赂矿工丢弃不利于自己的区块，从而在博彩类的应用中获得相对优势。比特币单个区块的奖励是固定的，因此，所有依赖于该方法获得的随机数有一个固定的安全上限，不能根据应用的具体情况动态调整，导致其适用性有很大的限制。此外，Bitcoin Beacon 方案中，普通用户无法参与区块的生成，虽然串谋的成本较高，但矿工并不能避免嫌疑。因此该方案仍然不是一个可证公平的随机数方案。

Algorand

采用Verifiable Random Functions(VRF)选择出块人，委员会成员及解决分叉。

VRF的流程和特点：考虑如下情形：有一个公共的难以找到原象的函数F，现在Bob给出一条信息x，要求Alice用她的秘钥s计算出F(s, x) = v作为一个随机数输出，因为s对公众不可见，所以Bob收到v难以判断这个v是否是Alice诚实计算F(s, x)得出的。VRF实现了：让Alice在给出v的同时也给出一个proof和一个对应s的公钥p，Bob可以用p和proof来验证v是否是F(s, x)。

VRF的签发是由一个参与者完成的，因此该参与者可以选择不发布对自己不利的签名，和Bitcoin Beacon有相似的缺点，因此不适合用来作为可证公平的随机数发生器。

Dfinity

Dfinity的共识算法建立在随机数的基础上，通过BLS签名算法实现随机数的生成，由一组人产生签名，任何个人都无法预测签名结果，单个人无法阻止签名发布。

BLS 是一种门限签名技术。首先将用户分组，第一轮由一个组产生一个随机数，之后每一轮选一个组对上一轮产生的随机数签名，作为这一轮的随机数输出，每个成员都无法提前预知签名结果。其中签名过程使用BLS 签名机制，保证在签名过程中没有个体能够提前预知签名结果，因此无法操纵随机数。

BLS 很好的解决了Withholding 攻击的问题，且生成随机数过程不可操纵，无法预测，很难串谋，是一个比较理想的随机数生成方案。

DAO

DAO是一种无中心的组织结构，组织规则由代码描述并强制执行，任何人可自由加入退出，不同参与者间地位平等，刚好可以满足我们对于公共随机数的设计目标。因此区块链技术以及DAO理论，可以用来支撑并指导公共随机数的设计和实现。

上述随机数发生器评测结果

二、VRF介绍

1. Why VRF？

场景

在区块链场景中，有的框架会用算法随机产生出块节点与验证节点（如Algorand），甚至解决分叉。按传统的随机算法，按一定的哈希规则随机轮询，选出一个节点来记账/验证。如果这个随机轮询的规则是谁都可以复现的，那么可以推测出将来的某个记账/验证节点，集中攻击它。

为了解决这个问题，就引入了VRF，只有自己能够完成这个哈希过程，而别人只能在他声明之后验证这个过程，防止有人可以提前推测出将来的记账节点。

POS中的权益研磨（Grinding）

在任何基于区块链的权益证明算法中，都需要某种机制，来随机从当前活跃验证者集合中选择能够产生下一个区块的验证者。举个例子，如果当前活跃的验证者集合由持有40以太币的Alice，持有30以太币的Bob，持有20以太币的Charlie与持有10以太币的David组成，那么你想让Alice成为下一个区块的创建者的概率为40%，而Bob的概率为30%等（在实践中，不仅要随机选择一个验证者，而是要（随机产生）一个无限验证者序列，只有这样如果Alice不在线的时候，就可以有其他人在过段时间替代她，但是这并没有改变问题的本质）。在非基于区块链的算法中，出于不同的原因也经常需要考虑随机性。
——以太坊Github《Proof of Stake FAQ》

基于PoS的区块链协议最基本的一个问题就是模拟领导者选举过程。为了在股东们之间的选举达到一个真正的随机性，系统中就必须要引入熵(entropy)，但引入熵的机制可能会容易被敌手操作。例如，一个控制一群股东的敌手可能会试图模拟协议的执行，尝试不同的股东参与者的顺序以此来找到对敌对股东有力的继续者。这会导致一个叫做"grinding"的致命弱点，敌对参与者可能会使用计算资源来倾斜领导者选举。
——Ouroboros白皮书《Ouroboros: A Provably Secure Proof-of-Stake Blockchain Protocol》