Sora 2来袭颠覆AI行业|通讯Plus·深度

AI科技 2025年10月09日 15:39 0 admin

封面新闻记者吉星

这个国庆长假，全球科技界被Sora 2“霸屏”了。

美国当地时间9月30日，OpenAI正式发布其新一代视频生成模型Sora 2，该模型在画面、物理逻辑实现跨越式突破。与此同时，OpenAI在苹果应用商店App Store美国区上线了将Sora 2与社交功能集于一身的App——Sora。短短4天，该App登顶美区App Store免费应用榜。Sora 2生成的短视频则在抖音、B站、Instagram等视频平台广泛传播。Sora 2的火爆可见一斑。

Sora 2将如何改变AI，又对国内AI企业有着什么样的启示呢？

Sora 2让AI更“理解世界”

相比前代产品，Sora 2的突破在于其对物理世界的深度模拟能力。此前的视频生成模型往往难以处理物体运动的合理性（如水流轨迹、光影变化）、人物动作的连贯性以及复杂场景的时间一致性。而Sora 2融合了更先进的扩散模型和Transformer架构，让视频实现了从“能看”到“能演”，真正靠近“模拟世界”的效果。

首先，动态场景的物理逻辑性强。过去半年，OpenAI团队死磕“如何让模型真正学会模拟实际运行”这个关键，如今终于取得重大突破。Sora 2生成的视频中，物体运动符合现实物理规律。例如，打碎的玻璃飞溅轨迹自然，车辆转弯时轮胎与地面的摩擦感逼真，甚至天气变化（如雨滴落地后的水花）也具备高度真实性，难以穿帮。

人物画面的进步更说明了Sora 2的突破。在一段视频里，人物面部、服饰等特征也能够保持稳定，连AI视频最容易出现的断指、多指等手指变异问题，在Sora 2已经通过时空联合注意力机制通过建立帧间关联方式极大地解决，手指数量异常率从17%降至0.3%，视频更可以以假乱真。

其次，长视频与多镜头叙事能力提升。Sora 2模型可生成长20秒连贯剧情的短视频，支持同一场景下多角度镜头切换。这意味着AI初步具备了“导演思维”，能够根据文本指令自动规划镜头语言。而且音频直接跟上，不仅对白和口型对齐，连环境音、动作声效都随场景变化，给人一种「拿来即用」的感觉，省去后期剪辑音频的繁琐。

Sora App的问世，也简化了用户分享此类视频的流程。用户只需要打字输入指令，就能够生成视频。还可以上传自己的影像物料，生成专属AI分身，甚至可以通过“客串”（Cameo）功能，与好友分身共创作品。据了解，OpenAI在进行内部测试时候，通过“客串”，不少员工认识了新朋友。Sora不仅改变了影像生产，也创造了新的互动模式，为企业提供了新的营销途径。

Sora App截图

可以说，Sora 2的诞生确实让生成式AI实现了跨越式的进步，让AI更加理解世界，让生成“虚拟世界”成为可能。

Sora 2改变千行百业

网友用Sora 2生成的骑马视频

Sora 2的发布后，各种生成的恶搞视频疯狂传播，引发了网络世界的狂欢同时，也对产业链各环节带来冲击。

首先，广告、短视频、电影预制环节的单位成本有望大幅降低。广告公司可用Sora 2快速生成创意样片，编剧可通过文本描述预览场景效果。一方面降低了普通用户及视频生产者制作视频的门槛；另一方面，也对传统的视频制作行业造成冲击。从脚本到成片，整个视频生产流程都可能被重构。

Sora 2进一步巩固了OpenAI在生成式AI领域的领先地位，谷歌、Meta等巨头将被迫加速视频生成模型的迭代。此前专注于单一图像或文本生成的企业需尽快拓展技术边界，否则可能面临生态位被挤压的风险。

Sora 2也倒逼硬件与算力需求升级。高质量视频生成对GPU集群、存储网络提出更高要求，与OpenAI达成战略合作的英伟达等芯片厂商受益明显，英伟达更是追加投资1000亿美元，为Sora 2提供AI芯片的支持，上游的光模块以及下游的服务器等节点也因此受益。

当然，Sora 2也引发了不小的争议，最大的争议来自对版权的颠覆。Sora 2发布之初，OpenAI就允许生成受版权保护的角色视频，除非版权所有者主动联系OpenAI并明确要求“选择退出”。这一策略彻底颠覆了传统的授权模式。此后，Sora App的信息流就出现了任天堂、迪士尼、宝可梦等知名IP的二次创作，吸引了大量用户。但同时引发了迪士尼等版权巨头的警惕，选择闪电般退出，迫使OpenAI将“选择性退出”政策改为“选择性加入”。究竟如何在内容可玩性与版权保护间实现平衡，多方的角力结果值得关注。

国内AI应深耕底层技术

Sora 2的突破性进展给了国内AI产业震撼，也引发了舆论对于国内AI是否受制于人的担忧。需要承认的是，尽管国内企业在AI应用层（如电商、短视频领域的AIGC工具）快速落地，但在底层模型架构、原创算法上的积累仍显薄弱。而且，Sora 2仅通过API提供模型服务，未发布完整的开源代码，国内的可灵、即梦等AI视频模型需要走出属于自己的路。

封面新闻认为，Sora 2的成功建立在OpenAI对Transformer、扩散模型等基础架构的长期迭代上。对于相对追求最快经济效益的国内AI企业，如果想要掌握属于自己的核心技术，需要放弃“拿来主义”，加大对物理引擎模拟、多模态融合等底层技术的研发，而非仅依赖对开源模型微调。如此，国内AI行业才能不受制于人，实现真正意义的追赶和超越。

同时，Sora 2也提醒业界完善AI视频等应用生态，实现从生成到分发、消费的闭环生态系统的形成。国内企业也在对此积极探索，如芒果超媒拟推出AI综艺定制服务，观众可通过弹幕指令生成个性化剪辑版本，这有助于丰富AI视频应用的场景和用户体验。

年初DeepSeek的横空出世说明，中国不乏解决AI核心技术的人才和土壤。关键在于高校、企业、科研机构如何打通数据和算力壁垒，通力合作，建立从框架、编译器到算子库的完整软件栈，甚至需要深入参与底层算法设计，从而将生成式AI的基础技术牢牢掌握在自己手中。而这并非一朝一夕之功。

展望未来，尽管其商业化仍面临可靠性、伦理等挑战，但Sora 2展现出强大潜力。对全球AI行业而言，视频生成技术正经历从“工具”到“平台”的演变，未来可能催生新一代内容创作生态。而对中国企业来说，唯有在底层技术上沉心投入，方能在下一轮AI竞争中避免“卡脖子”之忧。