首页 AI科技文章正文

Sora 2来袭 颠覆AI行业|通讯Plus·深度

AI科技 2025年10月09日 15:39 0 admin
Sora 2来袭 颠覆AI行业|通讯Plus·深度

封面新闻记者 吉星

这个国庆长假,全球科技界被Sora 2“霸屏”了。

美国当地时间9月30日,OpenAI正式发布其新一代视频生成模型Sora 2,该模型在画面、物理逻辑实现跨越式突破。与此同时,OpenAI在苹果应用商店App Store美国区上线了将Sora 2与社交功能集于一身的App——Sora。短短4天,该App登顶美区App Store免费应用榜。Sora 2生成的短视频则在抖音、B站、Instagram等视频平台广泛传播。Sora 2的火爆可见一斑。

Sora 2将如何改变AI,又对国内AI企业有着什么样的启示呢?

Sora 2让AI更“理解世界”

相比前代产品,Sora 2的突破在于其对物理世界的深度模拟能力。此前的视频生成模型往往难以处理物体运动的合理性(如水流轨迹、光影变化)、人物动作的连贯性以及复杂场景的时间一致性。而Sora 2融合了更先进的扩散模型和Transformer架构,让视频实现了从“能看”到“能演”,真正靠近“模拟世界”的效果。

首先,动态场景的物理逻辑性强。过去半年,OpenAI团队死磕“如何让模型真正学会模拟实际运行”这个关键,如今终于取得重大突破。Sora 2生成的视频中,物体运动符合现实物理规律。例如,打碎的玻璃飞溅轨迹自然,车辆转弯时轮胎与地面的摩擦感逼真,甚至天气变化(如雨滴落地后的水花)也具备高度真实性,难以穿帮。

人物画面的进步更说明了Sora 2的突破。在一段视频里,人物面部、服饰等特征也能够保持稳定,连AI视频最容易出现的断指、多指等手指变异问题,在Sora 2已经通过时空联合注意力机制通过建立帧间关联方式极大地解决,手指数量异常率从17%降至0.3%,视频更可以以假乱真。

其次,长视频与多镜头叙事能力提升。Sora 2模型可生成长20秒连贯剧情的短视频,支持同一场景下多角度镜头切换。这意味着AI初步具备了“导演思维”,能够根据文本指令自动规划镜头语言。而且音频直接跟上,不仅对白和口型对齐,连环境音、动作声效都随场景变化,给人一种「拿来即用」的感觉,省去后期剪辑音频的繁琐。

Sora App的问世,也简化了用户分享此类视频的流程。用户只需要打字输入指令,就能够生成视频。还可以上传自己的影像物料,生成专属AI分身,甚至可以通过“客串”(Cameo)功能,与好友分身共创作品。据了解,OpenAI在进行内部测试时候,通过“客串”,不少员工认识了新朋友。Sora不仅改变了影像生产,也创造了新的互动模式,为企业提供了新的营销途径。

Sora 2来袭 颠覆AI行业|通讯Plus·深度

Sora App截图

可以说,Sora 2的诞生确实让生成式AI实现了跨越式的进步,让AI更加理解世界,让生成“虚拟世界”成为可能。

Sora 2改变千行百业

Sora 2来袭 颠覆AI行业|通讯Plus·深度

网友用Sora 2生成的骑马视频

Sora 2的发布后,各种生成的恶搞视频疯狂传播,引发了网络世界的狂欢同时,也对产业链各环节带来冲击。

首先,广告、短视频、电影预制环节的单位成本有望大幅降低。广告公司可用Sora 2快速生成创意样片,编剧可通过文本描述预览场景效果。一方面降低了普通用户及视频生产者制作视频的门槛;另一方面,也对传统的视频制作行业造成冲击。从脚本到成片,整个视频生产流程都可能被重构。

Sora 2进一步巩固了OpenAI在生成式AI领域的领先地位,谷歌、Meta等巨头将被迫加速视频生成模型的迭代。此前专注于单一图像或文本生成的企业需尽快拓展技术边界,否则可能面临生态位被挤压的风险。

Sora 2也倒逼硬件与算力需求升级。高质量视频生成对GPU集群、存储网络提出更高要求,与OpenAI达成战略合作的英伟达等芯片厂商受益明显,英伟达更是追加投资1000亿美元,为Sora 2提供AI芯片的支持,上游的光模块以及下游的服务器等节点也因此受益。

当然,Sora 2也引发了不小的争议,最大的争议来自对版权的颠覆。Sora 2发布之初,OpenAI就允许生成受版权保护的角色视频,除非版权所有者主动联系OpenAI并明确要求“选择退出”。这一策略彻底颠覆了传统的授权模式。此后,Sora App的信息流就出现了任天堂、迪士尼、宝可梦等知名IP的二次创作,吸引了大量用户。但同时引发了迪士尼等版权巨头的警惕,选择闪电般退出,迫使OpenAI将“选择性退出”政策改为“选择性加入”。究竟如何在内容可玩性与版权保护间实现平衡,多方的角力结果值得关注。

国内AI应深耕底层技术

Sora 2的突破性进展给了国内AI产业震撼,也引发了舆论对于国内AI是否受制于人的担忧。需要承认的是,尽管国内企业在AI应用层(如电商、短视频领域的AIGC工具)快速落地,但在底层模型架构、原创算法上的积累仍显薄弱。而且,Sora 2仅通过API提供模型服务,未发布完整的开源代码,国内的可灵、即梦等AI视频模型需要走出属于自己的路。

封面新闻认为,Sora 2的成功建立在OpenAI对Transformer、扩散模型等基础架构的长期迭代上。对于相对追求最快经济效益的国内AI企业,如果想要掌握属于自己的核心技术,需要放弃“拿来主义”,加大对物理引擎模拟、多模态融合等底层技术的研发,而非仅依赖对开源模型微调。如此,国内AI行业才能不受制于人,实现真正意义的追赶和超越。

同时,Sora 2也提醒业界完善AI视频等应用生态,实现从生成到分发、消费的闭环生态系统的形成。国内企业也在对此积极探索,如芒果超媒拟推出AI综艺定制服务,观众可通过弹幕指令生成个性化剪辑版本,这有助于丰富AI视频应用的场景和用户体验。

年初DeepSeek的横空出世说明,中国不乏解决AI核心技术的人才和土壤。关键在于高校、企业、科研机构如何打通数据和算力壁垒,通力合作,建立从框架、编译器到算子库的完整软件栈,甚至需要深入参与底层算法设计,从而将生成式AI的基础技术牢牢掌握在自己手中。而这并非一朝一夕之功。

展望未来,尽管其商业化仍面临可靠性、伦理等挑战,但Sora 2展现出强大潜力。对全球AI行业而言,视频生成技术正经历从“工具”到“平台”的演变,未来可能催生新一代内容创作生态。而对中国企业来说,唯有在底层技术上沉心投入,方能在下一轮AI竞争中避免“卡脖子”之忧。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap