「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:z...
2025-10-15 4
大象新闻记者 李莉 杨文丽
10月15日,第27届中国国际软件博览会在郑州举办,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜分享了大模型时代AI基础平台驱动软件生态带来的新变化。她表示,大模型的爆发将人工智能推向一个新的高潮。
(吴甜在峰会上作分享)
在开幕式暨主题峰会上,吴甜表示,大模型具有效果好、泛化性强、研发流程标准化等特点,正引领人工智能的发展。在这一阶段,AI研发范式带来了开发、计算、部署的新挑战,尤其是大模型的高效训练和推理部署,需要软硬件协同发力。
她讲到,大模型高效训练的关键要素包括训练吞吐、训练有效时间和收敛效率,这背后涉及框架、芯片、集群、算法等软硬件不同组合的协同优化。对大模型的推理部署来说,效果无损、低时延高吞吐、成本效益等要素极为关键,需要模型压缩与量化、并行推理、软硬件协同优化等技术的支持。
要解决大模型研发所带来的一系列挑战,深度学习平台关键需要具备大规模并行计算、高性能推理部署、全流程工程化三方面能力。以百度飞桨为例,作为百度自研的产业级深度学习开源开放平台,飞桨从核心框架、基础模型库,到端到端开发套件、工具与组件,以及星河社区等,全方位支持了文心大模型的演进过程。飞桨在核心框架和芯片之间构建了硬件适配层,打造多硬件统一适配方案,已适配 60多款系列芯片,相比PyTorch,芯片基础适配的接口数减少56%,代码量减少80%。
在深度学习平台与大模型联合优化下,文心大模型的能力得到了拓展、效率得到了提升,ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%, ERNIE-4.5-300B-A47B模型在TPOT 50ms时延条件下,实现了输入57K tokens/秒、输出29K tokens/秒的高吞吐性能。文心思考模型X1.1相比上个版本,事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。
大模型与深度学习平台为科技创新和产业升级构筑了坚实的AI基础技术底座平台,但在各行各业广泛应用起来,应用生态建设至关重要。
据了解,百度进行了模型及相应配套工具的开源。文心大模型4.5系列已开源11款模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型,配套开源了文心大模型开发套件ERNIEKit、大模型高效部署套件FastDeploy,方便开发者在此基础上实现高效的模型开发和部署,进而在更广泛的行业加速AI的落地应用。
星河社区为开发者提供全方位服务,已上线700万个实践项目,600多门公开课以及400多场AI竞赛。开发者也在应用中反过来推动AI基础技术平台的完善。目前,飞桨框架贡献者俱乐部成员达到195位,飞桨开发者技术专家411位,全球各地开发者自主建立运营的飞桨领航团超过400个。
在文心大模型和飞桨深度学习平台的基础上,百度在上海、广州、武汉、南京、宁波、厦门、南昌、无锡等多地落地产业赋能中心、数据生态中心和教育创新中心,加快区域产业智能化升级。
公开资料显示,截至2025年9月,飞桨文心生态开发者已达到2333万,服务企业达到76万家。
相关文章
「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:z...
2025-10-15 4
乘着“人工智能+”的东风,10月15日下午,以“AI科学 AI未来”为主题的2025年东莞市中小学生科技节在南城商务区北部学校拉开帷幕。东莞市人大常委...
2025-10-15 1
大象新闻记者 李莉 杨文丽10月15日,第27届中国国际软件博览会在郑州举办,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜分享了大模型...
2025-10-15 1
来源:环球网 【环球网科技综合报道】10月15日消息,据pcmag报道称,三星将于10月21日(北京时间 10 月 22 日)举行Galaxy发布会,...
2025-10-15 0
当小米17系列以百万销量刷新纪录时,一位用户晒出的小米6换机帖却意外戳中行业痛点。这款发布于2017年的机型,在2025年仍有大批忠实拥趸,卢伟冰那句...
2025-10-15 1
继人形机器人和人一起站上马拉松赛道之后,机器人又将和人一起站上辩论席。今年10月—11月,首届中国(国际)机器人辩论大赛将在北京经济技术开发区(北京亦...
2025-10-15 1
【CNMO科技消息】CNMO获悉,韩国证券分析师日前预测,人工智能(AI)半导体周期将在2028年达到顶峰,届时三星和SK海力士的业绩有望比当前水平增...
2025-10-15 1
发表评论