芯片与存储器的紧密连接

芯片与存储器：算力时代的“黄金搭档”

在2025年的科技圈，“AI算力瓶颈”成了高频词。英伟达发布支持CPO的以太网交换机，台积电2nm工艺量产在即，Marvell展示17倍带宽密度的定制SRAM……这些热点背后，都指向一个核心问题：芯片与存储器的连接方式，正在决定AI时代的算力天花板。从手机到数据中心，芯片与存储器的关系就像“大脑”与“记忆库”。CPU负责计算，存储器负责存取数据，两者通过总线（地址、数据、控制）紧密协作。但传统架构下，存储器的速度增长远慢于芯片算力，导致“存储墙”问题日益突出——据英特尔研究，7nm工艺下数据搬运功耗占芯片总功耗的63.7%，这🌲Kaiyun中国意味着每传输1比特数据消耗的能量，可能比处理它还要高几十倍。如何打破这种“算力内耗”？答案藏在连接技术的创新中。

芯片与存储器的紧密连接

1. 位扩展与字扩展：用“拼图”解决容量焦虑

存储芯片的容量总是有限的。以常见的DRAM芯片为例，单片容量可能只有1GB，但现代计算机需要数🌽十GB甚至TB级内存。这时候，“位扩展”和“字扩展”就成了关键技术。位扩展就像“拼积木”：把多个低位宽芯片并联，拼成高位宽的存储模块。比如用8片1位芯片组成8位存储器，CPU一次就能读取8位数据，效率提升8倍。字扩展则像“开连锁店”：通过地址线高位译码，用片选信号控制不同芯片分时工作。例如4片16K×8位芯片，通过地址线A15、A14译码，可组成64K×8位的存储器，容量扩大4倍。更复杂的“字位同时扩展”则结合两者优势。比如用8片16K×4位芯片，先两两并联组成4组8位存储器，再通过地址译码选择组别，最终实现64K×8位的存储空间。这种技术让存储器既能“存更多数据”，又能“每次读更多位”，完美匹配CPU对大容量、宽数据的需求。

2. 近存计算与存算一体：让数据“少跑腿”

传统架构下，CPU与存储器物理分离，数据需要在两者间频繁搬运，导致延迟和功耗飙升。近存计算（PNM）和存算一体（CIM）技术，正是为了解决这一问题而生。近存计算通过2.5D/3D堆叠技术，将计算单元和存储器封装在同一基板上。比如台积电的CoWoS平台，把HBM存储器堆叠在GPU旁边，通过硅通孔（TSV）实现微米级连接，带宽密度比传统PCB提升10倍以上。2025年SEMICON Taiwan展会上，台积电推出的COUPE平台更进一步，将硅光模块与先进封装结合，预计2025年实现每秒6.4T的光学I/O，能耗比传统方案降低40%。 🀄️Kaiyun中国存算一体则更激进——直接让存储器具备计算能力。比如Mythic公司的模拟存内计算芯片，通过修改SRAM的读电路，在存储单元内完成矩阵乘法，能耗比传统GPU降低100倍。这种技术特别适合AI推理场景，例如语音识别、图像分类等任务，能在保持高精度的同时，将功耗控制在10mW级别。

3. 先进封装与CPO：光互联的“最后一公里”

随着数据中心规模扩大，机柜间、甚至数据中心间的互联需求激增。传统铜互连在💰高频场景下信号衰减严重，而硅光与先进封装融合的CPO（共封装光学）技术，成了突破瓶颈的关键。 CPO将光模块直接集成在交换机或服务器芯片上，省去了传统可插拔光模块的DSP转换环节，能耗降低30%。英伟达在2025年3月发布的Spectrum-X Photonics交换机，就采用了CPO技术，支持1.6Tbps端口速率，延迟比传统方案低40%。台积电的COUPE平台更计划在2025年底量产，通过集成硅光引擎和先进封装，实现每秒3.2T的光学I/O，为AI集群提供“零损耗”互联。这种技术对AI大模型训练尤为重要。以GPT-5为例，单次训练需要处理数TB数据，若采用传统电互联，仅数据搬运就能消耗掉总功耗的50%以上。而CPO技术能让数据在光域直接传输，几乎不产生额外能耗，为万亿参数模型的训练提供了可能。

4. 定制化存储：从“通用”到“专用”的进化

AI应用的多样性，推动了存储器从“通用”向“专用”的定制化转型。Marvell在2025年Hot Chips大会上展示的定制HBM方案，就是一个典型案例。传统HBM将存储芯片堆叠在标准基片上，通过接口与加速器相连，但接口占用大量片上空间，且功耗较高。Marvell的方案则将接口逻辑移到HBM堆栈内部，利用“备用区域”实现压缩、加密等近内存加速功能。这种设计不仅减少了加速器芯片的接口面积，还让存储器从“被动数据容器”变成了“主动计算参与者”。更极致的定制化体现在片上SRAM。台积电2nm工艺下的高密度SRAM，通过更宽的单元设计和多端口架构，在相同面积下实现了17倍带宽密度。这意味着AI加速器能以更低的功耗，获得更高的数据吞吐能力——对需要实时处理海量数据的自动驾驶、医疗影像分析等场景，这种技术能直接提升系统响应速度。

未来展望：存储即算力，连接即效率

从位扩展到存算一体，从近存计算到CPO光互联，芯片与存储器的连接技术正在经历一场“静默革命”。2025年的科技热点，无论是台积电的2nm工艺、英伟达的CPO交换机，还是Marvell的定制HBM，都指向一个趋势：存储器的角色，正在从“配角”升级为“算力核心”。对普通用户来说，这些技术可能藏在手机更快的响应速度、数据中心更低的电费账单里；对行业而言，它们则是突破AI算力瓶颈、实现“万亿参数模型自由”的关键。未来三年，随着先进封装、存算一体和近存计算技术的成熟，我们或许会见证一个新时代的到来——在那里，存储与计算的界限彻底模糊，而芯片与存储器的(de)紧(jǐn)密(mì)连(lián)接(jiē)，将(jiāng)成(chéng)为(wèi)驱(qū)动(dòng)数(shù)字(zì)世(shì)界(jiè)的(de)“隐(yǐn)形(xíng)引(yǐn)擎(qíng)”。

Kaiyun官方网站-登录入口网页版