原文作者:IOSG Ventures
隐私是人类和组织的基本权利。对于个人而言,隐私可以帮助人们自由表达自己,而无需向第三方透露任何他们不想分享的信息。对于当今的大多数组织而言,数据被视为主要商品,而数据隐私对于保护这一商品至关重要。密码朋克运动和数据商品化加速了密码原语的研究和开发。
密码学是一个相当广泛的领域,当我们在计算的背景下看待密码学时,我们已经看到了许多不同的方案,例如零知识证明、同态加密、秘密共享等,这些方案自 20 世纪 60 年代诞生以来一直在不断改进。这些方案对于解锁隐私计算方法至关重要(数据是主要商品,因为人们可以从中发现见解)。时至今日,隐私计算领域在多方计算和零知识证明方面取得了重大进展,但输入数据本身始终存在隐私问题。
当最重要的商品是公共商品时,任何数据所有者都很难在没有法律协议的情况下外包这些数据的计算。如今,每个人都依赖于数据隐私的合规标准,例如针对健康数据的 HIPAA 和专门针对欧洲地区数据隐私的 GDPR。
在区块链领域,我们更相信技术的完整性,而不是监管机构的完整性。作为无需许可和最大化所有权的信徒,如果我们相信未来用户拥有自己的数据,我们就需要无需信任的方法来对这些数据进行计算。在 2009 年 Craig Gentry 的工作之前,对加密数据进行计算的概念一直难以捉摸。这是第一次有人能够对密文(即加密数据)进行计算(加法和乘法)。
1. 全同态加密(FHE)的工作原理
那么,这种让计算机无需理解输入即可进行计算的“神奇数学”到底是什么呢?
完全同态加密 (FHE) 是一类加密方案,允许对加密数据(密文)执行计算而无需解密数据,从而为隐私和数据保护开辟了一系列用例。
在FHE过程中,在数据加密时,会在原始数据中添加称为噪声的附加数据。这就是加密数据的过程。
每次执行同态计算(加法或乘法)时,都会添加额外的噪声。如果计算过于复杂,每次添加噪声最终将使解密密文变得非常困难(计算量非常大)。此过程更适合加法,因为噪声呈线性增长,而对于乘法,噪声呈指数增长。因此,如果有复杂的多项式乘法,解密输出将非常困难。
如果噪声是主要问题,并且噪声的增长使 FHE 难以使用,则必须对其进行控制。这产生了一种称为 Bootstrapping 的新过程。Bootstrapping 是使用新密钥加密加密数据并以加密方式解密的过程。这非常重要,因为它大大减少了计算开销以及最终输出的解密开销。虽然 Bootstrapping 减少了最终解密开销,但该过程中存在大量的操作开销。这可能既昂贵又耗时。
目前主要的FHE方案包括:BFV、BGV、CKKS、FHEW、TFHE,除TFHE外,这些方案的缩写均为其论文作者的名字。
将这些方案视为同一国家/地区使用的不同语言,每种方案都针对不同的内容进行了优化。理想的情况是有一个统一的国家,同一台机器可以理解所有这些语言。许多 FHE 工作组正在努力使这些不同的方案可组合。像 SEAL(结合 BFV 和 CKKS 方案)和 HElib(BGV + 近似 CKKS)这样的库有助于实现 FHE 方案或用于不同计算的方案组合。例如,Zamas Concrete 库是 TFHE 的 Rust 编译器。
2. FHE 方案比较
以下是 Charles Guter、Dimitris Mouris 和 Nectarios George Tsousos 在他们的论文《SoK:通过标准化基准对完全同态加密库的新见解》(2022 年)中对不同库的性能比较。
Web3 用例
如今,当我们使用区块链和应用程序时,所有数据都是公开的,所有人都可以看到。这对大多数用例来说都很好,但完全限制了许多需要默认隐私或数据机密性的用例(例如机器学习模型、医疗数据库、基因组学、私人金融、非操纵游戏等)。由 FHE 驱动的区块链或虚拟机本质上允许从一开始就对整个链的状态进行加密,从而确保隐私,同时允许对加密数据执行任意计算。在由 FHE 驱动的区块链网络上存储或处理的所有数据本质上都是安全的。Zama 有一个 fhEVM 方案,允许在完全同态环境中执行 EVM 计算。这确保了使用此库构建的任何 L1/L2 项目的执行级别的隐私。虽然隐私链一直是一项很酷的技术,但采用率和代币性能并没有显着提高。
在外包通用计算方面,FHE 本身并不意味着要取代 ZK 和 MPC。它们可以相互补充,打造一个无需信任的私人计算巨头。例如,Sunscreen 正在构建一个隐私引擎,它基本上允许任何区块链应用程序将计算外包给其 FHE 计算环境,并可以反馈结果。结果计算可以通过 ZK 证明进行验证。Octra 正在做类似的事情,但使用一种称为 hFHE 的不同类型的加密方案。
ZK 证明擅长在不泄露数据的情况下证明某些事情,但证明者在某个时间点仍然可以访问该数据。ZK 证明不能用于私有数据的计算;它们只能验证某些计算是否正确完成。
MPC 将加密数据的计算分布在多台机器上,并行执行计算,然后将最终的计算结果拼接在一起。只要执行计算的大多数机器是诚实的,就无法检索原始数据,但这仍然是一个信任假设。由于 MPC 需要各方之间不断沟通(数据需要不断分割、计算和重新连接),因此很难通过硬件进行扩展。
在 FHE 中,所有计算都是针对加密数据进行的,无需解密,而且这可以在单个服务器上完成。FHE 的性能可以通过更好的硬件、更多的计算资源和硬件加速来扩展。
目前,FHE 在区块链领域的最佳用例更多是外包通用计算,而不是构建内置的 FHE L1/L2。以下是 FHE 可以解锁的一些有趣用例:
-
第一代(加密原生):链上 DID、赌场、投注、投票、游戏、私人 DeFi、私人代币、暗池、2FA、备份、密码。
-
第二代(模块化):“Chainlink for Privacy”,外包隐私计算,区块链与合约之间端到端加密,加密数据可用性,可验证的安全数据存储。
-
第三代(企业级):复杂消费者应用、加密和去中心化LLM、人工智能、可穿戴设备、通信、军事、医疗、隐私保护支付解决方案、私人P2P支付。
基于 FHE 的当前行业项目
全同态加密 (FHE) 的发展激发了多个创新区块链项目,这些项目利用该技术来增强数据隐私和安全性。本节深入探讨 Inco、Fhenix 和 Zama 等知名项目的技术细节和独特方法。
国际矿业公司
Inco 率先将 FHE 与区块链相结合,创建了一个使数据计算既安全又私密的平台。Inco 使用基于格的加密技术来实现其 FHE 方案,确保可以在不暴露底层明文的情况下对密文(加密数据)执行操作。该平台支持隐私保护智能合约,允许直接在区块链上处理加密数据。
-
基于格的 FHE:Inco 利用基于格的加密技术实现其 FHE,该技术以其后量子安全特性而闻名,可确保抵御未来可能发生的量子攻击的能力。
-
隐私保护智能合约:Inco 的智能合约可以在加密输入上执行任意函数,确保合约和执行合约的节点都无法访问明文数据。
-
噪声管理和引导:为了处理同态运算期间噪声增长的问题,Inco 实现了一种有效的引导技术来刷新密文并在执行复杂计算时保持可解密性。
菲尼克斯
Fhenix 专注于为隐私保护应用提供强大的基础设施,利用 FHE 提供端到端加密解决方案来保护用户数据。Fhenix 平台旨在支持从安全消息传递到私人金融交易的广泛应用,确保所有计算过程中的数据隐私。
-
端到端加密:Fhenix 确保数据从输入点到处理和存储都保持加密。这是通过结合 FHE 和安全多方计算 (SMPC) 技术实现的。
-
高效的密钥管理:Fhenix 集成了先进的密钥管理系统,以促进安全的密钥分发和轮换,这是维持 FHE 环境中长期安全的关键。
-
可扩展性:该平台使用优化的同态操作和并行处理来有效处理大规模计算,解决了 FHE 的主要挑战之一。
-
协处理器:Fhenix 还率先开发了旨在加速 FHE 计算的专用协处理器。这些协处理器专门用于处理 FHE 所需的密集数学运算,可显著提高隐私保护应用程序的性能和可扩展性。
座间
Zama 是 FHE 领域的领导者,以其 fhEVM 方案而闻名,该方案允许在完全同态环境中执行以太坊 EVM 计算,确保使用该库构建的任何 L1/L2 项目的执行级别隐私。
-
fhEVM 解决方案:Zamas fhEVM 解决方案将 FHE 与以太坊虚拟机集成,以实现加密智能合约的执行。这允许在以太坊生态系统中进行机密交易和计算。
-
具体库:Zamas 具体库是 TFHE(FHE 的变体)的 Rust 编译器。该库提供了同态加密方案的高性能实现,使加密计算更加高效。
-
互操作性:Zama 致力于创建与现有区块链基础设施无缝协作的解决方案。这包括支持各种加密原语和协议,确保广泛的兼容性和易于集成。
3. FHE 在加密和人工智能基础设施及应用中的关键作用
如今,密码学与人工智能的交叉点正如火如荼地展开。无需深入研究这一交叉点,值得注意的是,新模型和数据集的创新将由多方开源协作推动。除了计算之外,最终重要的是数据,而这些数据是这一协作管道中最重要的部分。人工智能应用程序和模型的有用性最终取决于它们所训练的数据,无论是基础模型、微调模型还是人工智能智能代理。保持这些数据的安全和私密为开源协作开辟了巨大的设计空间,同时允许数据所有者继续从训练模型或最终应用中获利。如果这些数据本质上是公开的,那么将很难货币化(因为任何人都可以访问有价值的数据集),因此这些数据更有可能受到严格保护。
在此背景下,FHE 可以发挥关键作用。理想情况下,它可以在不泄露底层数据集的情况下训练模型,这可以解锁数据集的货币化,并极大地促进数据集所有者之间的开源协作。
来源:Bagel Network
FHE 如何增强隐私保护机器学习 (PPML)
-
数据隐私:通过使用 FHE,可以在将医疗记录、财务信息或个人身份信息等敏感数据输入 ML 模型之前对其进行加密。这可确保即使计算环境受到威胁,数据仍能保持机密性。
-
安全模型训练:训练 ML 模型通常需要大量数据。使用 FHE,可以加密这些数据,从而可以在不暴露原始数据的情况下训练模型,这对于处理高度敏感信息且受严格数据隐私法规约束的行业至关重要。
-
机密推理:除了训练之外,FHE 还可用于加密推理。这意味着一旦模型经过训练,就可以对加密输入进行预测,从而确保用户数据在整个推理过程中保持私密。
-
FHE PPML应用领域:
-
医疗保健:以隐私保护的方式训练机器学习模型可以带来更加个性化和有效的治疗,而不会泄露敏感的患者信息。
-
金融:金融机构可以使用 FHE 分析加密交易数据,进行欺诈检测和风险评估,同时保护客户隐私。
-
物联网和智能设备:设备可以以加密形式收集和处理数据,确保位置数据或使用模式等敏感信息的机密性。
FHE 的问题:
如前所述,FHE 方案之间没有统一性。方案不可组合,很多时候需要将不同的 FHE 方案组合起来用于不同类型的计算。对同一计算尝试不同方案的过程也相当繁琐。正在开发的 CHIMERA 框架允许在不同的 FHE 方案(如 TFHE、BFV 和 HEAAN)之间切换,但目前还远远不够用。这导致了下一个问题,即缺乏基准。基准对于开发人员采用这项技术非常重要。这将有助于节省许多开发人员的时间。考虑到计算开销(加密、解密、引导、密钥生成等),许多现有的通用硬件都不太合适。需要某种形式的硬件加速,或者可能需要创建特定的芯片(FPGA 和/或 ASIC)来实现 FHE 的更主流应用。这些模式的问题可以与 ZK(零知识)行业的问题进行比较。只要有一群聪明的数学家、应用科学家和工程师对这个领域感兴趣,我们就会继续看好这两个领域:用于隐私的 FHE 和用于可验证性的 ZK。
4. FHE 驱动的未来将会是什么样子?
是否会有一种 FHE 解决方案可以统领所有解决方案?业界仍在进行这一讨论。尽管理想情况是拥有一个统一的解决方案,但不同应用程序的不同需求可能始终需要针对特定任务进行优化的专门解决方案。解决方案之间的互操作性是最好的解决方案吗?互操作性可能确实是一种实用的方法,它允许灵活地处理不同的计算需求,同时利用各种解决方案的优势。
FHE 何时可用?可用性与减少计算开销、改进基准测试标准和开发专用硬件方面的进展密切相关。随着这些领域的进展,FHE 将变得更加容易获得和实用。
综上所述,FHE 为数据隐私保护和安全计算提供了强有力的工具。尽管在互操作性、计算开销和硬件支持方面仍存在挑战,但 FHE 在区块链、隐私保护机器学习和更广泛的 Web3 应用中的潜力不容忽视。随着技术的不断发展和创新,FHE 有望在未来的隐私保护和安全计算中发挥关键作用。
本文来源:IOSG Ventures:为什么说FHE在Web3中有更好的应用前景?
相关:Shibarium 完成硬分叉,承诺极快交易:价格影响
简讯 Shibarium 完成硬分叉,承诺快速交易。更新旨在打造价格合理、可访问的 Shibarium 网络。如果 SHIB 突破 $0.00002349,其价格可能会飙升。Shibarium 是 Shiba Inu (SHIB) 生态系统的 2 层网络,于 5 月 2 日成功完成了一次重大硬分叉。此更新承诺提供极快的交易速度和更可预测的 gas 费用,从而增强用户与网络的交互。Shibarium 硬分叉后,Shiba Inu 是否准备好突破?Shibarium 网络在 X(以前的 Twitter)上宣布,它在区块高度 4,504,576 处完成了硬分叉。区块链技术中的硬分叉需要进行重大升级,导致网络分裂为两条链。此过程于 4 月 24 日推出,引入了与以前的软件不兼容的根本变化……