龙8头号玩家

申请试用

TsingJ X1 同态加密计算加速卡

TsingJ-X1同态加密计算芯片(卡)是龙8头号玩家自主研发的业内首款同态加密计算加速卡,搭载16颗龙8头号玩家自主研发的同态加密计算ASIC芯片(TsingJ-i900),运算能力达每秒18万次大整数模幂运算(底数位宽4096-bit,指数位宽2048-bit),突破了同态计算的算力壁垒,在基于同态加密的隐匿查询(PIR)和联合建模的大规模数据应用场景中,实现巨大的性能及能效比提升,赋能各行业隐私安全计算场景的落地。

产品优势

安全自主可控

芯片内的同态计算引擎完全自主研发,从底层基础算子硬件单元的IP核设计到同态计算指令集、芯片系统架构,均为自主研发设计,具有完整的自主知识产权,申请并已授权多项专利。

高性能同态计算

上千个模处理单元实现对大整数模幂运算的并发执行,Paillier加密计算性能媲美超过1000个CPU核。

创新架构

安全计算领域的DSA(Domain Specific Architecture)芯片,基于创新的同态加密计算指令集、高效模运算硬件处理单元,采用创新的众核多芯异构体系架构,为同态计算提供强大的底层算力支撑。成果发表在集成电路的产业界顶级会议HotChips 2023。

绿色低碳

单张加速卡功率150W,同等算力下相比CPU能耗降低95%,助力数据中心节能降碳。

软硬协同

支持一卡多芯、一机多卡、多机并行等多种部署方式,在更小的空间中部署更多的算力。

信创适配

采用标准的PCIe接口与各类型服务器进行集成,适配多种国产CPU及信创操作系统。积极融入信创产业。

应用场景

算力和带宽是产业级的大规模数据加密协同计算(数据安全合规流通)的关键瓶颈。不解决加密计算所需的巨大特殊算力开销和带宽需求问题,隐私保护计算的产业级应用将无从谈起。目前在广域网上能够稳定使用的带宽资源通常只有10-20兆甚至更少。目前其他密码学协议和算法可以通过提升算力高效置换对带宽的要求,但需要超大的算力支撑,大规模数据量下仅存在理论上的可行性。在大数据量的隐匿查询(PIR)场景下,基于半同态加密的PIR方案具有最低的数据传输量,是目前能找到的最优方案。经生产环境实测,十亿级数据(千万级混淆)下,单张加速卡的性能超过2000个CPU核。

在XGBoost联合建模场景和逻辑回归(LR)联合建模场景下,百万行乘上10列的运算中,单张加速卡性能相比单核CPU实现接近3个数量级的计算性能提升。

隐匿查询与联合建模场景在金融、运营商、政府等行业都有着显著的业务需求,伴随着数据安全流通需求的显著增加,我们期待突破百亿级超大规模数据加密计算的产业级应用门槛,为提升密文计算性能以适应产业级需求做出贡献。

Sitemap