芯片与存储器:算力时代的“黄金搭档”
在2025年的科技圈,“AI算力瓶颈”成了高频词。英伟达发布支持CPO的以太网交换机,台积电2nm工艺量产在即,Marvell展示17倍带宽密度的定制SRAM……这些热点背后,都指向一个核心问题:芯片与存储器的连接方式,正在决定AI时代的算力天花板。 从手机到数据中心,芯片与存储器的关系就像“大脑”与“记忆库”。CPU负责计算,存储器负责存取数据,两者通过总线(地址、数据、控制)紧密协作。但传统架构下,存储器的速度增长远慢于芯片算力,导致“存储墙”问题日益突出——据英特尔研究,7nm工艺下数据搬运功耗占芯片总功耗的63.7%,这🌲Kaiyun中国意味着每传输1比特数据消耗的能量,可能比处理它还要高几十倍。如何打破这种“算力内耗”?答案藏在连接技术的创新中。

1. 位扩展与字扩展:用“拼图”解决容量焦虑
存储芯片的容量总是有限的。以常见的DRAM芯片为例,单片容量可能只有1GB,但现代计算机需要数🌽十GB甚至TB级内存。这时候,“位扩展”和“字扩展”就成了关键技术。 位扩展就像“拼积木”:把多个低位宽芯片并联,拼成高位宽的存储模块。比如用8片1位芯片组成8位存储器,CPU一次就能读取8位数据,效率提升8倍。字扩展则像“开连锁店”:通过地址线高位译码,用片选信号控制不同芯片分时工作。例如4片16K×8位芯片,通过地址线A15、A14译码,可组成64K×8位的存储器,容量扩大4倍。 更复杂的“字位同时扩展”则结合两者优势。比如用8片16K×4位芯片,先两两并联组成4组8位存储器,再通过地址译码选择组别,最终实现64K×8位的存储空间。这种技术让存储器既能“存更多数据”,又能“每次读更多位”,完美匹配CPU对大容量、宽数据的需求。
2. 近存计算与存算一体:让数据“少跑腿”
传统架构下,CPU与存储器物理分离,数据需要在两者间频繁搬运,导致延迟和功耗飙升。近存计算(PNM)和存算一体(CIM)技术,正是为了解决这一问题而生。 近存计算通过2.5D/3D堆叠技术,将计算单元和存储器封装在同一基板上。比如台积电的CoWoS平台,把HBM存储器堆叠在GPU旁边,通过硅通孔(TSV)实现微米级连接,带宽密度比传统PCB提升10倍以上。2025年SEMICON Taiwan展会上,台积电推出的COUPE平台更进一步,将硅光模块与先进封装结合,预计2025年实现每秒6.4T的光学I/O,能耗比传统方案降低40%。 🀄️Kaiyun中国存算一体则更激进——直接让存储器具备计算能力。比如Mythic公司的模拟存内计算芯片,通过修改SRAM的读电路,在存储单元内完成矩阵乘法,能耗比传统GPU降低100倍。这种技术特别适合AI推理场景,例如语音识别、图像分类等任务,能在保持高精度的同时,将功耗控制在10mW级别。
3. 先进封装与CPO:光互联的“最后一公里”
随着数据中心规模扩大,机柜间、甚至数据中心间的互联需求激增。传统铜互连在💰高频场景下信号衰减严重,而硅光与先进封装融合的CPO(共封装光学)技术,成了突破瓶颈的关键。 CPO将光模块直接集成在交换机或服务器芯片上,省去了传统可插拔光模块的DSP转换环节,能耗降低30%。英伟达在2025年3月发布的Spectrum-X Photonics交换机,就采用了CPO技术,支持1.6Tbps端口速率,延迟比传统方案低40%。台积电的COUPE平台更计划在2025年底量产,通过集成硅光引擎和先进封装,实现每秒3.2T的光学I/O,为AI集群提供“零损耗”互联。 这种技术对AI大模型训练尤为重要。以GPT-5为例,单次训练需要处理数TB数据,若采用传统电互联,仅数据搬运就能消耗掉总功耗的50%以上。而CPO技术能让数据在光域直接传输,几乎不产生额外能耗,为万亿参数模型的训练提供了可能。
4. 定制化存储:从“通用”到“专用”的进化
AI应用的多样性,推动了存储器从“通用”向“专用”的定制化转型。Marvell在2025年Hot Chips大会上展示的定制HBM方案,就是一个典型案例。 传统HBM将存储芯片堆叠在标准基片上,通过接口与加速器相连,但接口占用大量片上空间,且功耗较高。Marvell的方案则将接口逻辑移到HBM堆栈内部,利用“备用区域”实现压缩、加密等近内存加速功能。这种设计不仅减少了加速器芯片的接口面积,还让存储器从“被动数据容器”变成了“主动计算参与者”。 更极致的定制化体现在片上SRAM。台积电2nm工艺下的高密度SRAM,通过更宽的单元设计和多端口架构,在相同面积下实现了17倍带宽密度。这意味着AI加速器能以更低的功耗,获得更高的数据吞吐能力——对需要实时处理海量数据的自动驾驶、医疗影像分析等场景,这种技术能直接提升系统响应速度。
未来展望:存储即算力,连接即效率
从位扩展到存算一体,从近存计算到CPO光互联,芯片与存储器的连接技术正在经历一场“静默革命”。2025年的科技热点,无论是台积电的2nm工艺、英伟达的CPO交换机,还是Marvell的定制HBM,都指向一个趋势:存储器的角色,正在从“配角”升级为“算力核心”。 对普通用户来说,这些技术可能藏在手机更快的响应速度、数据中心更低的电费账单里;对行业而言,它们则是突破AI算力瓶颈、实现“万亿参数模型自由”的关键。未来三年,随着先进封装、存算一体和近存计算技术的成熟,我们或许会见证一个新时代的到来——在那里,存储与计算的界限彻底模糊,而芯片与存储器的(de)紧(jǐn)密(mì)连(lián)接(jiē),将(jiāng)成(chéng)为(wèi)驱(qū)动(dòng)数(shù)字(zì)世(shì)界(jiè)的(de)“隐(yǐn)形(xíng)引(yǐn)擎(qíng)”。

