
Qzone
微博
微信
近日,浙江流流电子科技有限公司表示,公司正在将过往在 3D 集成专用计算芯片领域积累的工程经验,延展至 AI 推理芯片方向。未来,公司将围绕高能效 AI 推理 ASIC、3D 集成架构、Hybrid Bonding 高密度互连以及低功耗专用计算体系展开技术布局。
据公司介绍,流流科技创始团队曾参与研发并推动量产过一款基于 40 纳米工艺、采用 Hybrid Bonding 技术的以太坊专用计算芯片。该芯片于 2021 年进入量产阶段,是团队在先进封装、高并行计算、低功耗架构和专用 ASIC 工程化方面的重要实践。
流流科技认为,从以太坊专用计算芯片到 AI 推理芯片,变化的是应用场景,不变的是底层工程逻辑:如何在有限功耗、有限面积和有限数据通路条件下,最大化单位能耗下的有效计算能力。
一、从 40 纳米 Hybrid Bonding 芯片量产经验出发
在专用计算芯片领域,量产经验往往比单纯的设计概念更具价值。
流流科技创始团队此前参与的 40 纳米以太坊专用计算芯片,并非传统意义上的普通 ASIC,而是一款采用 3D 集成思路和 Hybrid Bonding 技术的专用计算芯片。该产品于 2021 年进入量产阶段,意味着相关团队曾经实际经历过从芯片架构、三维互连、封装协同到量产可靠性的完整工程挑战。
对于任何采用 3D 集成路线的芯片而言,Hybrid Bonding 都不是简单的封装后处理步骤。它会影响芯片层级划分、互连密度、信号传输路径、热分布、测试覆盖以及最终产品的稳定性。因此,能够参与并推动此类芯片进入量产,本身代表了团队对 3D 集成芯片工程复杂度的实际理解。
这也是流流科技此次布局 AI 推理芯片的重要基础。
二、Hybrid Bonding:3D 集成芯片的关键互连方式
在表述上,“3D 集成”和“Hybrid Bonding”并不是两个割裂的技术概念。
更准确地说,Hybrid Bonding 是实现高密度 3D 集成的重要技术路径之一。它通过晶圆与晶圆、芯片与晶圆或芯片与芯片之间的高密度互连,使不同功能层能够在垂直方向上形成更短、更密集的数据连接。
传统二维芯片设计中,计算单元、缓存、控制逻辑和数据通路都需要在同一平面上展开。随着芯片规模扩大,长距离布线、片上拥塞、访问延迟和功耗都会成为限制性能提升的重要因素。
而 3D 集成提供了另一种思路:将不同功能模块在垂直方向上组织起来,使计算、存储和数据通路之间的距离进一步缩短。Hybrid Bonding 则为这种垂直组织方式提供了更高密度、更低寄生、更短路径的互连基础。
对于高能效专用计算芯片而言,这种技术路线的核心价值并不是简单“把芯片叠起来”,而是让芯片内部的数据流动更加高效。
三、从 ETH 专用计算到 AI 推理:不是算法迁移,而是工程能力迁移
流流科技表示,以太坊专用计算芯片与 AI 推理芯片面向的是完全不同的应用场景,因此不能简单理解为“把原来的芯片换一个用途”。
真正能够迁移的,是底层工程能力。
以太坊专用计算芯片强调高并行、低功耗、稳定运行和单位能耗下的计算效率;AI 推理芯片同样关注高并行计算、数据吞吐、功耗控制和持续运行效率。二者虽然执行的算法不同,但都属于典型的专用计算芯片,都需要围绕特定工作负载进行架构优化。
在 AI 推理场景中,芯片面对的不只是矩阵乘法本身,还包括模型权重读取、激活数据缓存、中间结果传输、片上数据复用以及外部存储访问等问题。大量能耗并不完全发生在计算单元内部,而是发生在数据移动过程中。
因此,流流科技认为,过去在 Hybrid Bonding 3D 集成专用计算芯片中的经验,可以为 AI 推理芯片提供重要参考:通过更紧凑的计算-存储组织方式,降低无效数据搬运,提高单位功耗下的有效推理能力。
四、AI 推理芯片的核心竞争:从峰值算力转向有效算力
随着 AI 应用进入大规模部署阶段,推理芯片的评价标准正在发生变化。
过去,AI 芯片常常以理论算力、制程节点和峰值性能作为主要宣传指标。但在真实部署中,客户更加关注的是芯片在持续运行状态下的能效、稳定性、部署密度和长期使用成本。
对于企业私有化 AI 部署,芯片需要在有限电力和有限服务器空间内提供稳定推理能力。
对于边缘 AI 场景,芯片需要控制功耗、散热和体积。
对于视频理解和多模态检索场景,芯片需要处理持续、高频、并发的数据流。
对于语言模型推理,芯片则需要在延迟、吞吐和存储访问之间取得平衡。
这些场景都指向同一个问题:AI 推理芯片的核心不只是“有多少算力”,而是“有多少算力能够被真实模型有效利用”。
这也是专用 ASIC 芯片存在机会的地方。
五、3D 集成有望缓解 AI 推理中的数据搬运瓶颈
AI 推理芯片的能效瓶颈,往往来自计算与存储之间的不匹配。
随着模型参数规模提升,芯片需要不断读取权重、缓存激活数据、传输中间结果。如果计算阵列与存储结构之间距离过长,或者片上数据复用率不足,就会造成大量无效功耗。
3D 集成架构为这一问题提供了新的解决空间。通过垂直方向上的功能组织,芯片可以尝试将计算层、缓存层和数据通路进行更紧密的协同设计,使部分关键数据路径更短,互连密度更高,片上数据复用效率更好。
Hybrid Bonding 在其中的意义,是为不同芯片层之间提供高密度连接能力。对于 AI 推理 ASIC 而言,这种能力有机会帮助芯片降低外部访存压力,减少数据搬运功耗,并提升实际推理场景下的能效表现。
六、成熟工艺结合先进封装,成为专用 AI 芯片的重要方向
流流科技认为,AI 推理芯片并不一定只有依赖最先进制程这一条路径。
在高端训练芯片领域,先进制程、高带宽显存和大规模集群互联非常重要。但在大量推理场景中,客户更加关注成本、稳定性、供货能力、功耗表现和部署灵活性。
因此,成熟工艺结合先进封装,正在成为专用 AI 推理芯片的一种现实路线。
成熟工艺可以带来更可控的设计成本和制造风险,而 3D 集成与 Hybrid Bonding 则有机会从架构层面提升数据流效率。二者结合后,芯片不一定追求通用计算能力的极限,而是围绕特定推理场景做更高效的专用优化。
对于流流科技而言,从此前参与量产的 40 纳米 Hybrid Bonding 以太坊专用计算芯片,到未来布局 AI 推理芯片,本质上是一条从“专用计算”走向“专用智能计算”的技术延展路径。
七、从专用计算经验走向 AI 推理架构创新
流流科技表示,公司未来将围绕 AI 推理 ASIC、高能效专用计算、3D 集成、Hybrid Bonding 和低功耗数据流架构持续展开技术研究。
公司认为,AI 推理市场正在逐步分层。通用 GPU 仍将在大规模训练和通用 AI 计算中占据重要位置,但在部分垂直推理场景中,专用 ASIC 有机会通过更聚焦的架构设计获得能效优势。
与通用芯片相比,专用推理 ASIC 不追求覆盖所有任务,而是围绕特定模型结构、特定算子类型和特定部署环境进行优化。通过减少冗余逻辑、优化数据流、提高片上数据复用率,并结合 3D 集成技术改善计算与存储之间的连接效率,专用芯片有望在单位功耗和单位成本上形成差异化。
流流科技表示,过去参与 Hybrid Bonding 3D 集成芯片量产的经历,使团队更加重视芯片从设计概念到真实产品之间的工程落差。未来,公司将继续以工程可落地为导向,探索面向 AI 推理的新型专用计算架构。
八、结语:以 3D 集成经验切入 AI 推理芯片新阶段
从 40 纳米 Hybrid Bonding 以太坊专用计算芯片,到面向 AI 推理的专用 ASIC 架构探索,流流科技正在尝试将过往在高能效专用计算和 3D 集成领域的经验,转化为面向新一代 AI 应用的芯片能力。
在 AI 推理需求快速增长的背景下,市场对芯片的要求正在从单纯的峰值算力,转向更实际的能效、成本、稳定性和部署效率。3D 集成与 Hybrid Bonding 技术,为专用 AI 推理芯片提供了新的架构可能。
流流科技表示,公司将继续围绕先进封装与专用计算架构的结合展开技术布局,希望在 AI 推理芯片领域探索一条兼具工程可行性和能效优势的发展路径。
TOM2026-06-24 13:5306-24 13:53
TOM2026-06-24 13:4606-24 13:46
TOM2026-06-24 13:4506-24 13:45
TOM2026-06-24 13:3806-24 13:38