IT之家 10 月 14 日消息,科技媒体 9to5Mac 今天(10 月 14 日)发布博文,报道称苹果提出 FS-DFM 扩散模型,仅需 8 轮快...
2025-10-14 0
IT之家 10 月 14 日消息,科技媒体 9to5Mac 今天(10 月 14 日)发布博文,报道称苹果提出 FS-DFM 扩散模型,仅需 8 轮快速迭代,即可生成与传统模型上千轮迭代质量相媲美的文本,且写入速度比同类模型最多可提高 128 倍。
苹果公司与俄亥俄州立大学的研究团队近期联合发表论文,提出一种名为“少步离散流匹配”(Few-Step Discrete Flow-Matching,简称 FS-DFM)的新型语言模型。
该模型专注于解决长文本生成领域的效率瓶颈,仅需 8 轮快速精练,就能生成高质量的长篇文本,其效果足以媲美传统扩散模型执行上千步迭代所实现的效果。
在深入了解 FS-DFM 之前,需要区分两种主流的语言模型范式:
FS-DFM 作为扩散模型的一个变体,进一步简化了迭代过程,旨在用最少的步骤直接生成最终结果。IT之家援引博文介绍,苹果研究人员为实现这一突破,设计了一套精妙的三步法:
在性能评估中,FS-DFM 还支持对比了拥有 70 亿参数的 Dream 模型和 80 亿参数的 LLaDA 模型。测试结果显示,即使是参数量仅为 1.7 亿至 17 亿的 FS-DFM 变体,在困惑度(衡量文本准确与流畅性的指标,越低越好)和熵(衡量模型选词置信度的指标。熵太低,生成的文本可能单调重复;熵太高,则可能胡言乱语)两项关键数据上,都表现出更低的困惑度和更稳定的熵。
相关文章
IT之家 10 月 14 日消息,科技媒体 9to5Mac 今天(10 月 14 日)发布博文,报道称苹果提出 FS-DFM 扩散模型,仅需 8 轮快...
2025-10-14 0
今天已经是10月14日,还有一天,OPPO的ColorOS16就要正式发布了,这次核心升级亮点就是流畅度大幅提升,采用极光引擎、潮汐引擎和繁星编译器三...
2025-10-14 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-14 0
前言英特尔代工业务连亏两年,每个季度都得砸进去几十亿。可即便这样,它还是咬着牙掏了320亿,在亚利桑那沙漠里建俩工厂。这不,新工厂刚启动量产,英特尔就...
2025-10-14 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-10-14 0
电子发烧友原创 章鹰10月10日到12日,2025年中国移动全球合作伙伴大会在广州保利世博馆盛大举行,中国移动宣布,将持续加大对人工智能领域的投入力度...
2025-10-14 0
出品/茶咖观察作者/蒙嘉怡编辑/薛向近日,茶咖观察发现,京东旗下的七鲜咖啡跟随七鲜小厨业务,陆续登陆美团与淘宝闪购平台,目前似乎处于测试阶段,尚未实现...
2025-10-14 0
无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由: 1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自...
2025-10-14 0
发表评论