金融界2025年7月25日消息,国家知识产权局信息显示,杭州尚乘英港数字科技有限公司申请一项名为“基于动态显存压缩与内存异构的大语言模型推理加速方法及...
2025-07-27 0
金融界2025年7月25日消息,国家知识产权局信息显示,杭州尚乘英港数字科技有限公司申请一项名为“基于动态显存压缩与内存异构的大语言模型推理加速方法及系统”的专利,公开号CN120371524A,申请日期为2025年04月。
专利摘要显示,本发明公开了一种基于动态显存压缩与内存异构的大语言模型推理优化方法及系统,通过整合KV Cache的动态压缩策略与内存并行架构,实现显存资源的智能管理。该方法包含:1)实时分析KV Cache的时空特征,自适应选择量化压缩、稀疏化或低秩分解算法,基于注意力头重要性评分进行分层存储,核心头部保留高精度,次要头部实施低比特量化;2)将压缩后的非活跃数据划分为多个数据块存储于系统内存,根据物理通道数量建立并行数据通道组,在加载时通过多通道并发读取压缩块并利用GPU张量核心加速稀疏矩阵并行解压;3)构建KV Cache复用机制与并行通道,采用硬件加速压缩与异步流水线机制,使压缩/解压过程与模型计算并行化。
天眼查资料显示,杭州尚乘英港数字科技有限公司,成立于2024年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本1万人民币。通过天眼查大数据分析,杭州尚乘英港数字科技有限公司财产线索方面有商标信息1条,专利信息3条。
本文源自金融界
相关文章
金融界2025年7月25日消息,国家知识产权局信息显示,杭州尚乘英港数字科技有限公司申请一项名为“基于动态显存压缩与内存异构的大语言模型推理加速方法及...
2025-07-27 0
#头号创作者激励计划#来源:CreatAR Images当你路过广州琶洲的珠江边,很难不被那两栋错落有致、闪着独特光芒的玻璃大厦吸引目光——这正是知名...
2025-07-27 0
今天上午乘坐由南昌昌北机场返回济南遥墙机场的江西航空MF2408航班——之前多次乘机,对中国空姐的形象并没有仔细观察,今天2个小时的航程,偶尔近距离察...
2025-07-27 0
现在有不少的小家电制造厂商会将各大电器的优点融合在一起,并且推出一个功能更为强大的产品,其实之所以会有这样的想法,也是立足于消费者对于高品质生活的追求...
2025-07-27 0
家人们,不知道最近大家在微信群里有没有刷到过这么一张巨邪门的表情包 ——咱们差评编辑部八十个人的大群,这两天直接被这张「荧光蛙」给沦陷了。。。因为只要...
2025-07-27 0
这项由英国曼彻斯特大学的杨凯来和李昊,以及微软研究院的刘晓、纪磊、龚业云、程鹏和杨毛共同完成的突破性研究,于2025年7月发表在arXiv预印本平台上...
2025-07-27 0
来源:【中国电信】说起令当代人“破防”的因素关键时刻的“网络卡顿”无疑是其中之一抢红包手慢无,打游戏突然掉线简直能让快乐瞬间归零其实,日常生活中我们经...
2025-07-27 0
美西方的技术封锁本想卡住中国芯片产业的脖子,没想到反而倒逼中国加速自主创新。不过说实话,要实现芯片设备100%国产化,光刻机这块硬骨头还真不好啃。《日...
2025-07-27 0
发表评论