本文介绍了对 rapidsnark 进行 GPU 加速的动机、背景和性能。通过将硬件加速集成到 rapidsnark 中,性能达到了 CPU 版本的约 4 倍。主要针对 NTT 和 MSM 计算进行优化,Orbiter Finance 团队开源了加速后的 rapidsnark 代码。
Ingonyama 与 Starkware 合作,通过 CUDA 后端加速 Starkware 的 Stwo 证明器,在不改变 Stwo 前端设计的前提下,ICICLE-Stwo 在多个 CPU/GPU 配置中实现了比 Starkware 优化后的 SIMD 后端 3.25x-7x 的性能提升. ICICLE-Stwo 仓库完全开源,可直接替换标准 Stwo 证明器。
Concrete ML v1.7 版本发布,引入了多项新功能,包括在加密数据上微调 LLM 模型和神经网络,利用 GPU 加速提升加密推理的性能(最高可达 1-2 倍),以及展示了一个通过加密 DNA 预测祖源的 Hugging Face space 示例。此外,该版本还支持 Python 3.11 和 PyTorch 2。
Concrete v2.7版本发布,引入了GPU加速功能,通过安装GPU wheel并设置use_gpu选项即可利用GPU进行FHE计算加速,最多可提速2.5倍。同时,新版本还扩展了函数组合的支持,通过分区优化和指定函数依赖关系,进一步提升模块的性能。此外,v2.7还包含其他一些小的改进。
TFHE-rs v0.6 版本引入了零知识证明技术,增强了 GPU 对有符号整数运算的支持,并引入了加密随机数生成等新的加密功能。该版本现在包含 Marc Joye 提出的公钥方案,并生成零知识证明以验证公钥加密过程的正确性。此外,新版本还支持 GPU 上的有符号整数运算,并改进了 GPU 用户的多位 PBS。
TFHE-rs v0.8版本发布,引入了加密数组类型,并增强了多GPU计算能力,开发者可以更轻松地处理向量和张量,同时大幅缩短GPU上算术运算的计算时间,此外,新版本还引入了诸多新特性,包括后同态计算密文压缩、更多基于GPU的同态运算、以及CPU运算的改进等。
Zama 发布了 TFHE-rs (v0.8)、Concrete (v2.8) 和 Concrete ML (v1.7) 的新版本。
Ingonyama发布了ZaKi,一种新的、垂直集成的ZK托管服务,它基于ICICLE,并对硬件进行了优化配置,以运行加速的ZK工作负载,旨在提供卓越的性价比。ZaKi通过提供一个已经为ZK计算优化的托管环境,消除了硬件设置和配置的障碍,使团队能够专注于他们的ZK应用。
本文介绍了ICICLE V1.6.0版本的一系列更新,包括稳定的Golang绑定、多GPU支持、向量运算API、Grumpkin曲线支持、NTT改进和MSM改进。这些更新旨在提升零知识证明(ZKP)加速的性能和效率,并扩展ICICLE的应用范围,如支持更大的电路和更多编程语言。
本文介绍了ICICLE库的更新,该库使用CUDA加速GPU上的ZK证明。主要更新包括:支持Poseidon哈希和优化的Merkle树构建器,新的混合基数NTT算法,改进的MSM设计,以及修复了Rust绑定在Windows上的支持问题。还包括性能测试结果,展示了Poseidon哈希树构建器和NTT算法的性能提升。
Ingonyama 正在为研究人员和实践者提供 10 万美元的资助,以推进 ZK(零知识证明)加速技术。资助方向包括:学生使用 Icicle 库进行研究、改进 Icicle 中现有加速原语的性能、将现有 ZK 协议移植到 Icicle、向 Icicle 添加新的原语以及将 ZK 基准测试与 Icicle 进行比较。Ingonyama 还将为获得资助者提供技术指导和 GPU 访问权限
Kroma Network 通过集成 Ingonyama 的 ICICLE 库到其 Tachyon 项目中,显著加速了零知识证明的生成过程,特别是在 Circom 证明和 SP1 zkVM 证明方面。通过 GPU 加速,MSM 速度提升了 8-10 倍,NTT 速度提升了 3-5 倍,Circom 证明生成速度提升了 4 倍。
ICICLE 是一个使用 CUDA-enabled GPUs 进行 ZK 加速的库。最新版本引入了 ECNTT、列式 NTT 处理、MSM 预计算等新特性,并优化了编译时间。即将发布的 v2 版本将提供丰富的多项式 API,并支持在 GPU 内部运行端到端的证明器。