其焦点价值正在于显著降低首Token时延、提拔推理吞吐量,为冲破算力瓶颈取“存储墙”限制,实现存储层从内存向SSD的计谋扩展,该手艺通过将AI推理过程中的矢量数据(如KVCache)从高贵的DRAM和HBM显存迁徙至大容量、高性价比的SSD介质,研报称,带动SSD需求增速高于保守曲线。