10月9日晚8点,京东11.11盛大开启,京东服饰美妆带来女装、男装、美妆、运动鞋服、内衣、箱包配饰、体育健身、黄金珠宝、鞋靴、户外装备、童装童鞋、钟...
2025-10-09 0
封面新闻记者 吉星
这个国庆长假,全球科技界被Sora 2“霸屏”了。
美国当地时间9月30日,OpenAI正式发布其新一代视频生成模型Sora 2,该模型在画面、物理逻辑实现跨越式突破。与此同时,OpenAI在苹果应用商店App Store美国区上线了将Sora 2与社交功能集于一身的App——Sora。短短4天,该App登顶美区App Store免费应用榜。Sora 2生成的短视频则在抖音、B站、Instagram等视频平台广泛传播。Sora 2的火爆可见一斑。
Sora 2将如何改变AI,又对国内AI企业有着什么样的启示呢?
Sora 2让AI更“理解世界”
相比前代产品,Sora 2的突破在于其对物理世界的深度模拟能力。此前的视频生成模型往往难以处理物体运动的合理性(如水流轨迹、光影变化)、人物动作的连贯性以及复杂场景的时间一致性。而Sora 2融合了更先进的扩散模型和Transformer架构,让视频实现了从“能看”到“能演”,真正靠近“模拟世界”的效果。
首先,动态场景的物理逻辑性强。过去半年,OpenAI团队死磕“如何让模型真正学会模拟实际运行”这个关键,如今终于取得重大突破。Sora 2生成的视频中,物体运动符合现实物理规律。例如,打碎的玻璃飞溅轨迹自然,车辆转弯时轮胎与地面的摩擦感逼真,甚至天气变化(如雨滴落地后的水花)也具备高度真实性,难以穿帮。
人物画面的进步更说明了Sora 2的突破。在一段视频里,人物面部、服饰等特征也能够保持稳定,连AI视频最容易出现的断指、多指等手指变异问题,在Sora 2已经通过时空联合注意力机制通过建立帧间关联方式极大地解决,手指数量异常率从17%降至0.3%,视频更可以以假乱真。
其次,长视频与多镜头叙事能力提升。Sora 2模型可生成长20秒连贯剧情的短视频,支持同一场景下多角度镜头切换。这意味着AI初步具备了“导演思维”,能够根据文本指令自动规划镜头语言。而且音频直接跟上,不仅对白和口型对齐,连环境音、动作声效都随场景变化,给人一种「拿来即用」的感觉,省去后期剪辑音频的繁琐。
Sora App的问世,也简化了用户分享此类视频的流程。用户只需要打字输入指令,就能够生成视频。还可以上传自己的影像物料,生成专属AI分身,甚至可以通过“客串”(Cameo)功能,与好友分身共创作品。据了解,OpenAI在进行内部测试时候,通过“客串”,不少员工认识了新朋友。Sora不仅改变了影像生产,也创造了新的互动模式,为企业提供了新的营销途径。
Sora App截图
可以说,Sora 2的诞生确实让生成式AI实现了跨越式的进步,让AI更加理解世界,让生成“虚拟世界”成为可能。
Sora 2改变千行百业
网友用Sora 2生成的骑马视频
Sora 2的发布后,各种生成的恶搞视频疯狂传播,引发了网络世界的狂欢同时,也对产业链各环节带来冲击。
首先,广告、短视频、电影预制环节的单位成本有望大幅降低。广告公司可用Sora 2快速生成创意样片,编剧可通过文本描述预览场景效果。一方面降低了普通用户及视频生产者制作视频的门槛;另一方面,也对传统的视频制作行业造成冲击。从脚本到成片,整个视频生产流程都可能被重构。
Sora 2进一步巩固了OpenAI在生成式AI领域的领先地位,谷歌、Meta等巨头将被迫加速视频生成模型的迭代。此前专注于单一图像或文本生成的企业需尽快拓展技术边界,否则可能面临生态位被挤压的风险。
Sora 2也倒逼硬件与算力需求升级。高质量视频生成对GPU集群、存储网络提出更高要求,与OpenAI达成战略合作的英伟达等芯片厂商受益明显,英伟达更是追加投资1000亿美元,为Sora 2提供AI芯片的支持,上游的光模块以及下游的服务器等节点也因此受益。
当然,Sora 2也引发了不小的争议,最大的争议来自对版权的颠覆。Sora 2发布之初,OpenAI就允许生成受版权保护的角色视频,除非版权所有者主动联系OpenAI并明确要求“选择退出”。这一策略彻底颠覆了传统的授权模式。此后,Sora App的信息流就出现了任天堂、迪士尼、宝可梦等知名IP的二次创作,吸引了大量用户。但同时引发了迪士尼等版权巨头的警惕,选择闪电般退出,迫使OpenAI将“选择性退出”政策改为“选择性加入”。究竟如何在内容可玩性与版权保护间实现平衡,多方的角力结果值得关注。
国内AI应深耕底层技术
Sora 2的突破性进展给了国内AI产业震撼,也引发了舆论对于国内AI是否受制于人的担忧。需要承认的是,尽管国内企业在AI应用层(如电商、短视频领域的AIGC工具)快速落地,但在底层模型架构、原创算法上的积累仍显薄弱。而且,Sora 2仅通过API提供模型服务,未发布完整的开源代码,国内的可灵、即梦等AI视频模型需要走出属于自己的路。
封面新闻认为,Sora 2的成功建立在OpenAI对Transformer、扩散模型等基础架构的长期迭代上。对于相对追求最快经济效益的国内AI企业,如果想要掌握属于自己的核心技术,需要放弃“拿来主义”,加大对物理引擎模拟、多模态融合等底层技术的研发,而非仅依赖对开源模型微调。如此,国内AI行业才能不受制于人,实现真正意义的追赶和超越。
同时,Sora 2也提醒业界完善AI视频等应用生态,实现从生成到分发、消费的闭环生态系统的形成。国内企业也在对此积极探索,如芒果超媒拟推出AI综艺定制服务,观众可通过弹幕指令生成个性化剪辑版本,这有助于丰富AI视频应用的场景和用户体验。
年初DeepSeek的横空出世说明,中国不乏解决AI核心技术的人才和土壤。关键在于高校、企业、科研机构如何打通数据和算力壁垒,通力合作,建立从框架、编译器到算子库的完整软件栈,甚至需要深入参与底层算法设计,从而将生成式AI的基础技术牢牢掌握在自己手中。而这并非一朝一夕之功。
展望未来,尽管其商业化仍面临可靠性、伦理等挑战,但Sora 2展现出强大潜力。对全球AI行业而言,视频生成技术正经历从“工具”到“平台”的演变,未来可能催生新一代内容创作生态。而对中国企业来说,唯有在底层技术上沉心投入,方能在下一轮AI竞争中避免“卡脖子”之忧。
相关文章
10月9日晚8点,京东11.11盛大开启,京东服饰美妆带来女装、男装、美妆、运动鞋服、内衣、箱包配饰、体育健身、黄金珠宝、鞋靴、户外装备、童装童鞋、钟...
2025-10-09 0
你有没有过这种麻烦事?订机票时要切三四个APP:先翻日历确认哪天有空,再打开地图看哪个机场离得近,还得回想起上次常选的航空公司,最后在订票软件里一个个...
2025-10-09 0
封面新闻记者 吉星这个国庆长假,全球科技界被Sora 2“霸屏”了。美国当地时间9月30日,OpenAI正式发布其新一代视频生成模型Sora 2,该模...
2025-10-09 0
【CNMO科技消息】10月9日,荣耀官方宣布,荣耀MagicPad3 Pro将于10月15日19:00正式发布。据CNMO了解,荣耀MagicPad3...
2025-10-09 0
最近关于iOS 26的消息可是非常多,从发布到现在也有半个月了,那么目前在酷安上的评分,iOS26是一落千丈,只有3.7分,主要原因是大家对于今年的“...
2025-10-09 0
哈喽~大家好,我是婉儿,很高兴又见面了!电竞玩家一年中最快乐的“装备升级季”(双十一)又要来咯~你是不是也正盯着显示器纠结该选哪款?提及电竞屏,“败家...
2025-10-09 0
今年做无孔的,还是只有努比亚一家,迭代新旗舰努比亚 Z80 Ultra 和红魔 11 系列游戏手机,都已确定在本月发布。根据爆料,努比亚 Z80 Ul...
2025-10-09 0
刚升完鸿蒙 5.1,手机直接变 “砖”?老粉蹲售后刷机 3 小时,微信抖音全崩,做了半宿的视频没了,连抖音团购订单都凭空消失!2025 年 10 月这...
2025-10-09 0
发表评论