Qzone

微博

微信

浙江流流电子科技布局 AI 推理芯片方向：以 3D 集成与 Hybrid Bonding 技术探索高能效专用计算新路径

科技 TOM 2026-06-24 13:58

近日，浙江流流电子科技有限公司表示，公司正在将过往在 3D 集成专用计算芯片领域积累的工程经验，延展至 AI 推理芯片方向。未来，公司将围绕高能效 AI 推理 ASIC、3D 集成架构、Hybrid Bonding 高密度互连以及低功耗专用计算体系展开技术布局。

据公司介绍，流流科技创始团队曾参与研发并推动量产过一款基于 40 纳米工艺、采用 Hybrid Bonding 技术的以太坊专用计算芯片。该芯片于 2021 年进入量产阶段，是团队在先进封装、高并行计算、低功耗架构和专用 ASIC 工程化方面的重要实践。

流流科技认为，从以太坊专用计算芯片到 AI 推理芯片，变化的是应用场景，不变的是底层工程逻辑：如何在有限功耗、有限面积和有限数据通路条件下，最大化单位能耗下的有效计算能力。

一、从 40 纳米 Hybrid Bonding 芯片量产经验出发

在专用计算芯片领域，量产经验往往比单纯的设计概念更具价值。

流流科技创始团队此前参与的 40 纳米以太坊专用计算芯片，并非传统意义上的普通 ASIC，而是一款采用 3D 集成思路和 Hybrid Bonding 技术的专用计算芯片。该产品于 2021 年进入量产阶段，意味着相关团队曾经实际经历过从芯片架构、三维互连、封装协同到量产可靠性的完整工程挑战。

对于任何采用 3D 集成路线的芯片而言，Hybrid Bonding 都不是简单的封装后处理步骤。它会影响芯片层级划分、互连密度、信号传输路径、热分布、测试覆盖以及最终产品的稳定性。因此，能够参与并推动此类芯片进入量产，本身代表了团队对 3D 集成芯片工程复杂度的实际理解。

这也是流流科技此次布局 AI 推理芯片的重要基础。

二、Hybrid Bonding：3D 集成芯片的关键互连方式

在表述上，“3D 集成”和“Hybrid Bonding”并不是两个割裂的技术概念。

更准确地说，Hybrid Bonding 是实现高密度 3D 集成的重要技术路径之一。它通过晶圆与晶圆、芯片与晶圆或芯片与芯片之间的高密度互连，使不同功能层能够在垂直方向上形成更短、更密集的数据连接。

传统二维芯片设计中，计算单元、缓存、控制逻辑和数据通路都需要在同一平面上展开。随着芯片规模扩大，长距离布线、片上拥塞、访问延迟和功耗都会成为限制性能提升的重要因素。

而 3D 集成提供了另一种思路：将不同功能模块在垂直方向上组织起来，使计算、存储和数据通路之间的距离进一步缩短。Hybrid Bonding 则为这种垂直组织方式提供了更高密度、更低寄生、更短路径的互连基础。

对于高能效专用计算芯片而言，这种技术路线的核心价值并不是简单“把芯片叠起来”，而是让芯片内部的数据流动更加高效。

三、从 ETH 专用计算到 AI 推理：不是算法迁移，而是工程能力迁移

流流科技表示，以太坊专用计算芯片与 AI 推理芯片面向的是完全不同的应用场景，因此不能简单理解为“把原来的芯片换一个用途”。

真正能够迁移的，是底层工程能力。

以太坊专用计算芯片强调高并行、低功耗、稳定运行和单位能耗下的计算效率；AI 推理芯片同样关注高并行计算、数据吞吐、功耗控制和持续运行效率。二者虽然执行的算法不同，但都属于典型的专用计算芯片，都需要围绕特定工作负载进行架构优化。

在 AI 推理场景中，芯片面对的不只是矩阵乘法本身，还包括模型权重读取、激活数据缓存、中间结果传输、片上数据复用以及外部存储访问等问题。大量能耗并不完全发生在计算单元内部，而是发生在数据移动过程中。

因此，流流科技认为，过去在 Hybrid Bonding 3D 集成专用计算芯片中的经验，可以为 AI 推理芯片提供重要参考：通过更紧凑的计算-存储组织方式，降低无效数据搬运，提高单位功耗下的有效推理能力。

四、AI 推理芯片的核心竞争：从峰值算力转向有效算力

随着 AI 应用进入大规模部署阶段，推理芯片的评价标准正在发生变化。

过去，AI 芯片常常以理论算力、制程节点和峰值性能作为主要宣传指标。但在真实部署中，客户更加关注的是芯片在持续运行状态下的能效、稳定性、部署密度和长期使用成本。

对于企业私有化 AI 部署，芯片需要在有限电力和有限服务器空间内提供稳定推理能力。

对于边缘 AI 场景，芯片需要控制功耗、散热和体积。

对于视频理解和多模态检索场景，芯片需要处理持续、高频、并发的数据流。

对于语言模型推理，芯片则需要在延迟、吞吐和存储访问之间取得平衡。

这些场景都指向同一个问题：AI 推理芯片的核心不只是“有多少算力”，而是“有多少算力能够被真实模型有效利用”。

这也是专用 ASIC 芯片存在机会的地方。

五、3D 集成有望缓解 AI 推理中的数据搬运瓶颈

AI 推理芯片的能效瓶颈，往往来自计算与存储之间的不匹配。

随着模型参数规模提升，芯片需要不断读取权重、缓存激活数据、传输中间结果。如果计算阵列与存储结构之间距离过长，或者片上数据复用率不足，就会造成大量无效功耗。

3D 集成架构为这一问题提供了新的解决空间。通过垂直方向上的功能组织，芯片可以尝试将计算层、缓存层和数据通路进行更紧密的协同设计，使部分关键数据路径更短，互连密度更高，片上数据复用效率更好。

Hybrid Bonding 在其中的意义，是为不同芯片层之间提供高密度连接能力。对于 AI 推理 ASIC 而言，这种能力有机会帮助芯片降低外部访存压力，减少数据搬运功耗，并提升实际推理场景下的能效表现。

六、成熟工艺结合先进封装，成为专用 AI 芯片的重要方向

流流科技认为，AI 推理芯片并不一定只有依赖最先进制程这一条路径。

在高端训练芯片领域，先进制程、高带宽显存和大规模集群互联非常重要。但在大量推理场景中，客户更加关注成本、稳定性、供货能力、功耗表现和部署灵活性。

因此，成熟工艺结合先进封装，正在成为专用 AI 推理芯片的一种现实路线。

成熟工艺可以带来更可控的设计成本和制造风险，而 3D 集成与 Hybrid Bonding 则有机会从架构层面提升数据流效率。二者结合后，芯片不一定追求通用计算能力的极限，而是围绕特定推理场景做更高效的专用优化。

对于流流科技而言，从此前参与量产的 40 纳米 Hybrid Bonding 以太坊专用计算芯片，到未来布局 AI 推理芯片，本质上是一条从“专用计算”走向“专用智能计算”的技术延展路径。

七、从专用计算经验走向 AI 推理架构创新

流流科技表示，公司未来将围绕 AI 推理 ASIC、高能效专用计算、3D 集成、Hybrid Bonding 和低功耗数据流架构持续展开技术研究。

公司认为，AI 推理市场正在逐步分层。通用 GPU 仍将在大规模训练和通用 AI 计算中占据重要位置，但在部分垂直推理场景中，专用 ASIC 有机会通过更聚焦的架构设计获得能效优势。

与通用芯片相比，专用推理 ASIC 不追求覆盖所有任务，而是围绕特定模型结构、特定算子类型和特定部署环境进行优化。通过减少冗余逻辑、优化数据流、提高片上数据复用率，并结合 3D 集成技术改善计算与存储之间的连接效率，专用芯片有望在单位功耗和单位成本上形成差异化。

流流科技表示，过去参与 Hybrid Bonding 3D 集成芯片量产的经历，使团队更加重视芯片从设计概念到真实产品之间的工程落差。未来，公司将继续以工程可落地为导向，探索面向 AI 推理的新型专用计算架构。

八、结语：以 3D 集成经验切入 AI 推理芯片新阶段

从 40 纳米 Hybrid Bonding 以太坊专用计算芯片，到面向 AI 推理的专用 ASIC 架构探索，流流科技正在尝试将过往在高能效专用计算和 3D 集成领域的经验，转化为面向新一代 AI 应用的芯片能力。

在 AI 推理需求快速增长的背景下，市场对芯片的要求正在从单纯的峰值算力，转向更实际的能效、成本、稳定性和部署效率。3D 集成与 Hybrid Bonding 技术，为专用 AI 推理芯片提供了新的架构可能。

流流科技表示，公司将继续围绕先进封装与专用计算架构的结合展开技术布局，希望在 AI 推理芯片领域探索一条兼具工程可行性和能效优势的发展路径。

责任编辑： WY-BD

———— 分享到 ————