为以太坊引入 KZG 承诺：工程师视角

以太坊爱好者阅读 4750 2021-6-18 16:40

（续前）什么是 KZG10 承诺？

注 3.6：如果启动设置所计算的 [s],[s^2]…[s^d] 只计算到了指数 d，这一组值是不能用来生成任何阶数大于 d 的多项式的承诺的。反之亦然。

因为在安全的曲线上，没有办法用两个点相乘来得出第三个点，所以 [s^(d+k)] 是一个（永远！）无法求出的值，因此可以说，任意的承诺 c(f) 都只能表示一个阶数小于等于 d 的多项式。

注 3.7：使用 KZG10 承诺的证据基本上就是在证明 f(x) - 某些余数 的结果可以按特定的办法来分解，但这就要有一种办法可以相乘这些因数，并与原始的承诺相比较 C(f)=f([s])。

为此，我们需要 “配对方程”，就是一种能把曲线上的两个点相乘并与另一个曲线点比较的乘法，因为我们无法直接让这两个曲线点直接相乘来得到合成的曲线点。

注 3.8：上述两个属性，可以进一步用来证明某个承诺 c(f) 所代表的多项式 f(x) 的阶数 k 小于 d。

综上，KZG10 承诺可以有很好的属性：

验证承诺的过程是：（由区块生成者）提供底层多项式在任意点 r 上的值 y=f(r) ，以及除法多项式 q(x)=(f(x)-y)/(x-r) 在 [s] 点的值（即 q([s])），并用配对方程来对比之前所提供的承诺 f[s]。这就叫开启在 r 点的承诺，而 q([s]) 就是证据。容易看出，q(s) 就是 p(s)-r 除以 s-r ，恰好就是我们用配对方程来检查的东西，即检查 (f([s])-[y]) * [1]'= q([s]) * [s-r]' （译者注：此处疑为 f(s)-r ，但原文就是 p(s)-r）。

在非交互且确定性的版本中， Fiat Shamir Heuristic 提供了一种办法来获得相对随机的点 r：因为随机性只跟我们尝试证明的输入有关，即，只要已经有了承诺 c=f([s]) ，r 就可以用哈希所有输入（r=Hash(C,..)）来获得，而承诺的提出者要负责提供开启点和证据。

使用预先计算好的拉格朗日多项式，f([s]) 和 q([s]) 都可以在求值形式下直接计算。要计算 r 处的开启值，就需要把 f(x) 转为 f(x)=a0+ a1*x^1.... 的系数形式（也即抽取出 a0、a1、…）。可以通过反向快速傅立叶变换来实现，复杂度为 O(d log d)，但甚至这里也有一种可用的替代算法，在 O(d) 的复杂度内完成计算，而无需使用反向快速傅立叶变换。

你可以使用单个开启点和证据来证明 f(x) 的多个值，也就是多个索引值对应的数值， index1=>value1、index2=>value2 …

（用于计算证据的）除法多项式 q(x) 现在变成了 f(x) 除以零多项式 z(x) =(x-w^index1)*(x-w^index2)...(x-w^indexk) 的商

余数为 r(x) （ r(x) 是一个最大阶数为 k 的多项式，由 index1=>value1, index2=>value2 … indexk=valuek 插值而成）

检查 ( f([s])-r([s]) )* [1] ' = q([s]) * z([s]')

在 PoS 链的共同起步设置中，共享的数据块会被表示为低阶的多项式（并为了纠删码而使用同样的拟合多项式扩展为两倍大），KZG 承诺可以用来检查任意随机分块并验证和确保数据可得性，而无需获得兄弟数据点。这就开启了随机取样的可能性。

现在，对于一个最大可能包含 2^28 个账户键的状态，你需要至少 2^28 阶的多项式来构建扁平的承诺（flat commitment）（实际上的账户键总空间会大得多得多）。在更新和插入的时候，会有一些不便利。对任一账户的任意更改，都会触发承诺（以及更麻烦的，见证数据/证据）的重新计算。

更新 KZG10 承诺

对任一 索引值 => 数值 点的任何更改，比如更改了 indexk，都需要使用相应的拉格朗日多项式来更新承诺。复杂度约为每次更新 O(1)。

但是，因为 f(x) 本身也改变了，所以所有的见证 q_i([s]) ，也即所有对第 i 个键值对的见证，也需要更新。总复杂度约为 O(N)

如果我们没有维护预先计算好的 q_i([s]) 见证，任何一条见证数据都要从头开始计算，都需要 O(N)

一种复杂度为 sqrt(N) 的更新 KZG10 承诺的构造

因此，为了实现理想承诺方案的第四点，我们需要一个特殊的构造：Verkle trie。

Verkle 树

需要表示的以太坊的状态大约有 2^28 约等于 16^7 约等于 2.5 亿 个键值对。如果我们只使用扁平的承诺（那么我们需要的阶数就至少是 2^28)。虽然我们的证据永远是 48 个字节的椭圆曲线元素，但任意的插入或更新，都需要 O(N) 次操作来更新所有预先计算好的见证数据（也就是所有点的 q_i(s) ，因为 f(x) 本身已经改变了）；甚至于，如果没有预先计算好的见证数据，则每条见证数据都需要花 O(N) 来重新计算。

因此，我们需要把扁平的结构换成叫做 Verkle 树的结构，跟默克尔树一样是树结构。

为以太坊引入 KZG 承诺：工程师视角

即，像默克尔树一样，构建出一棵承诺树，这样我们就可以保证阶数 d 比较小（但也需要高达约 256 或者 1024）。

每个父节点都编码对其子节点的承诺，子节点就是一个映射，其索引值都存在其父节点内

实际上，父节点的承诺编码了哈希后的子节点，因为承诺的输入是标准化的、32 字节的值（见上文的注3.0）。

叶子节点编码了对其所存储的数据的 32 字节哈希值的承诺；或者直接跳转到数据，假如其 32 字节的数据的用法与下一章提到的状态树提议用法一样的话。

要提供对一个分支的证据（类似于默克尔分支证据）时，一个多值证明的承诺 D、E 可以围绕使用 fiat shamir heruristic 产生一个相对随机的点 t 来生成。

复杂度

这里是一份对 Verkle 多值证明的分析

更新/插入叶子节点 index=>value 需要更新 log_d(N) 个承诺 ~ log_d(N)

为生成证据，证明者需要

计算 f_i(X)/(X-z_i) 在 [s] 处的值，用于生成 D ，复杂度总计 O(d log_d N)，但可以在更新/插入时调整以节约预计算，复杂度会变成O d log_d(N)

计算 m 个～ O( log_d(N) ) 个 f_i(t) 来计算 h(t)，总计为 O (d log_d N)

计算 π, ρ ，需要对 m~ log_d N 个指数多项式的和做除法。需要约 O(d log_d N) 来获得分子的求值形式，以计算除法

证明的规模（包括用于计算 E 的分支承诺）加上验证的复杂度 ~ O( log_d(N) )

Verkle 树构建

被提议的 ETH 状态 Verkle 树

单一的树结构，存储账户的 header 和代码分块，还有存储项分块，节点的承诺为阶数 d=256 的多项式

把地址和头/存储空档结合起来推导出一个 32 字节的 storageKey，本质上就是元组 (address,sub_key,leaf_key) 的一种表示

所推导的键的前 30 个字节用于构建普通的 verkle 树节点 pivots

后 2 个字节是一个树高为 2 的子树，表示最多 65536 个 32 字节的分块

对于基本的数据，这个树高为 2 的子树最多有 4 个叶子承诺，来覆盖 haeader 和 code

因为一个分块为 65536*32 字节的分块表示为单个的字数，所以主树上可能有许多子树来存储一个账户

Gas 定价方案

访问类型 (address, sub_key, leaf_key) 的事件

每一个专门的访问事件都收取 WITNESS_CHUNK_COST

每个专门的 address,sub_key 组合都收取额外的 WITNESS_BRANCH_COST

代码默克尔化

代码会自动成为 verkle 树的一部分（作为统一的状态树的一部分）

一个区块的 header 和 code 都作为一个树高为 2 的承诺树的一部分

单个分块最多有 4 条见证数据，分别收取 WITNESS_CHUNK_COST，访问账户需要收取一次 WITNESS_BRANCH_COST

数据采样和 PoS 协议中的分片

ETH PoS 的目标之一是能够提交约 1.5MB/s 的数据量（把这个吞吐量理解为状态变更的吞吐量，因而是 L2 rollup 可以利用的交易吞吐量，最终是 L1 EVM 的吞吐量）。要实现这一点，许多并行的区块提议要能发出并在给定的 12 秒内验证；也就是要存在多条分片（约 64），每个分片在每个 slot 都要发布自己的数据块。若有大于 2/3 的投票支持，信标链区块将包含分片数据块，分叉选择规则也将根据信标链区块内所有数据块及其祖先的数据可得性确定它是否能成为主链区块。

注 3：此时的分片不是链，任何隐含的顺序都要由 L2 协议来解释。

KZG 承诺也可以用来构建数据有效性和可得性方案，客户端无需访问分片提议者发布的完整数据就可以校验其可得性。

为以太坊引入 KZG 承诺：工程师视角