欢迎光临水表信息网!
技术前沿
当前位置: 首页 » 技术前沿 » 创新技术
 
创新技术

华为:UCM推理记忆数据管理开源,首Token时延降90%

字体: 放大字体  缩小字体 发布日期:2025-11-06  来源:和讯财经  浏览次数:10
11月5日,华为数据存储宣布,针对AI推理加速的关键技术——UCM推理记忆数据管理正式开源。华为介绍,UCM目前具备稀疏注意力、前缀缓存、预填充卸载、异构PD解耦四大能力。该技术能实现首Token时延最高降低90%,系统吞吐最大提升22倍,还可达到10倍级上下文窗口扩展。
 
免责声明:
本站所提供的文章资讯、图片、音频、视频来源于互联网及公开渠道,仅供学习参考,版权归原创者所有! 如有侵犯您的版权,请通知我们,我们会遵循相关法律法规采取措施删除相关内容。


 
[ 技术前沿搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]
 
相关新闻