人民財(cái)訊3月31日電,中信證券研報(bào)稱,AI從“簡單對話”向“智能體(Agent)”演進(jìn),驅(qū)動(dòng)上下文長度激增。據(jù)Epoch AI數(shù)據(jù),最長上下文窗口約每年增長30x,KV Cache顯存容量和上下文長度呈線性增長關(guān)系,遠(yuǎn)超硬件配置增速。目前大模型廠商、硬件廠商主要通過量化、分層存儲、模型架構(gòu)優(yōu)化的方式解決存力瓶頸,但仍不改顯存需求爆發(fā)。中信證券認(rèn)為,顯存優(yōu)化有望降低單Token生成成本,進(jìn)而刺激用戶開啟更高并發(fā)與更長上下文,總存力需求將不減反增,存力升級為當(dāng)前Agent推理核心需求,堅(jiān)定看好存儲成長趨勢。