首页 排行榜文章正文

谷歌Veo3.1硬刚OpenAI Sora2,声画合一封神,却因动作翻车被吐槽

排行榜 2025年10月18日 22:01 0 admin

就在OpenAI的Sora2刚发布半个月,谷歌突然甩出大招,10月16日正式推出Veo3.1模型,直接在AI视频生成的赛道上与老对手摆开了架势。

这两年AI生成领域卷得厉害,从图片到音频再到视频,巨头们恨不得每月都更新迭代,而这次Veo3.1的登场,显然是谷歌在这块关键战场上的重要一搏。

毕竟谁都清楚,现在的视频生成技术,正在悄悄改写未来数字内容创作的游戏规则。

谷歌Veo3.1硬刚OpenAI Sora2,声画合一封神,却因动作翻车被吐槽

“声画一对”终于成真?小老板做广告省大钱

用过AI视频工具的人都知道一个痛点:画面生成得再好看,没有匹配的声音也白搭。

以前创作者要么自己找音效库拼拼凑凑,要么花钱请人配音,折腾好几天还未必协调。

Veo3.1最让人眼前一亮的,就是第一次把AI音频生成和视频绑在了一起,真正实现了“声画合一”。

这可不是简单加个背景音乐那么敷衍。

测试里只要输入“清晨小溪边的鹅卵石滩,阳光穿过树叶洒在水面”,模型不仅能渲染出暖乎乎的晨光顺着叶脉往下淌,水面上的光斑跟着水流晃荡的细节,还会自动配上潺潺的流水声、偶尔的鸟鸣,甚至加一段轻柔的钢琴配乐。

对于非专业创作者来说,这一下就把后期音频的门槛给砸没了。

尤其对中小企业和个体户来说,这简直是降本神器。

以前拍一支像样的产品广告,找摄影棚、雇模特、做后期,没个几万块下不来,还得等十几天。

现在用Veo3.1,上传几张产品图,输一句“突出耳机降噪功能,背景从嘈杂地铁切换到安静书房”,十几分钟就能生成带音效的短视频,地铁的报站声、人群嘈杂声逐渐减弱,最后只剩翻书的沙沙声,广告词还能自动配上合适的旋律。

有数据说AI能帮这类小成本创作节省95%以上的成本,这可不是吹的。

Flow平台藏大招:老图变视频,短频变长片

谷歌这次不只是更新了个模型,更把Veo3.1塞进了去年5月推出的Flow创作平台里,摆明了要做“一站式服务”。

用过Flow的人发现,这次升级的几个功能简直是戳中了创作的痒点。

最实用的要数“素材生视频”。

以前做产品展示,得把不同角度的图片一张张衔接,还得手动调过渡效果。

现在只要把产品的正面、侧面、细节图一股脑上传,AI能自动识别关键信息,生成一段连贯的展示视频,连镜头切换的节奏都给安排好了。

谷歌Veo3.1硬刚OpenAI Sora2,声画合一封神,却因动作翻车被吐槽

还有“首尾帧生成”功能,比如你想拍一段“从办公室下班到家里开门”的视频,只要画好开头的办公桌和结尾的家门,中间的走廊、电梯、小区路景,AI都能给补得自然流畅,再也不用愁片段衔接生硬了。

更突破的是“视频延展”。

以前AI生成的视频大多就几秒钟,想做个一分钟的介绍片得拼好几段。

现在Veo3.1能直接把10秒的短片拉长到一分钟,还不会让人觉得拖沓,比如原本只有“咖啡倒入杯子”的特写,延展后会加上勺子搅拌、蒸汽升腾、阳光照在杯壁上的细节,整个画面丰富又不冗余。

这种对创作流程的理解,看得出来谷歌是真的研究过创作者的日常。

实测见真章:光影美到哭,体操动作却“翻车”

虽说功能说得天花乱坠,但AI这东西,实测才见真章。

不少技术博主第一时间上手测试,发现Veo3.1的表现真是“一半海水一半火焰”。

它的光影处理能力确实没得挑。

有博主输入“暴雨后的傍晚,路灯照在湿漉漉的柏油路上,反射着店铺招牌的光”,生成的视频里,路灯的光晕在积水里散开,红色的招牌反光随着水波轻轻晃动,连雨滴落在地面溅起的小水花上都带着光的影子,完全符合真实的物理规律。

跟去年的老版本比,提示词的理解也准多了,说“暖黄色柔光打在复古相机上”,绝不会出来冷白光的效果。

但翻车的地方也挺明显,尤其是复杂的人体动作。

有测试者想做一段体操运动员空翻的视频,结果生成的画面里,运动员的手臂直接拧成了不自然的角度,落地时的重心也歪得离谱,一看就违背物理规律。

其实这也不是Veo3.1独有的问题,连Sora2在处理高速运动的人体时也会偶尔出错,只能说当前AI对复杂运动规律的理解还没练到家。

另外一个小遗憾是敏感内容的处理。

有用户试着上传名人照片想生成视频,结果出来的人物外貌全被改了,眼睛形状变了,脸型也柔和了不少。

虽然这是为了规避肖像权风险,算是谨慎的做法,但确实影响了创作的灵活性。

谷歌Veo3.1硬刚OpenAI Sora2,声画合一封神,却因动作翻车被吐槽

免费送点数还多渠道铺开,谷歌打的什么算盘?

谷歌这次推Veo3.1的架势很猛,不光放Flow平台里,还同步在GeminiAPI、VertexAI和Gemini应用上上线,等于把开发者、企业用户和普通创作者全给覆盖了。

更狠的是推出了免费试用政策,每月送100个AI点数,普通用户随便测功能都够用,这波操作直接拉低了尝试门槛。

这背后其实是笔精明的生意。

现在AI模型迭代太快,光靠实验室的数据优化远远不够,得靠真实用户的反馈打磨产品。

先靠免费吸引大量用户来用,收集各种场景下的需求和问题,比如小商家想要更简单的模板,自媒体需要更长的生成时长,这些数据反过来能让模型更快进化。

等用户用顺手了,再针对高频使用的专业用户收费,这不比一开始就定价圈钱来得高明?而且谷歌看得很清楚,AI视频生成的市场蛋糕正在变大。

数据显示2024年全球这市场规模就有6.15亿美元,到2032年可能涨到25.63亿美元,年复合增长率快20%。

现在用免费策略抢用户、占场景,未来在广告、电商、教育这些刚需领域就能占得先机。

毕竟国内玩家已经靠类似策略做到了数百万用户,谷歌自然不想落后。

巨头贴身肉搏,创作者的好日子与坏消息

Veo3.1的发布,把谷歌和OpenAI的竞争推向了新阶段。

有意思的是,两家走了完全不同的路子:OpenAI的Sora2更侧重“硬实力”,在物理规律模拟、多镜头叙事上挖得很深,能生成25秒的长视频,还能做数字分身客串;谷歌则盯着“实用性”,把模型和Flow平台绑在一起,连编辑功能都给配齐了,显然是想让用户“拿来就能用”。

这种竞争对创作者来说绝对是好事。

以前高端视频制作是少数人的游戏,现在只要会写简单的提示词,普通人也能做出堪比专业水准的内容。

比如美食博主不用扛着相机拍半天,输一句“煎牛排的过程,特写油花四溅,焦香感拉满”,就能生成带滋滋声响的视频;老师做教学课件,也能快速生成“地球公转示意图”的动态视频,比PPT生动多了。

谷歌Veo3.1硬刚OpenAI Sora2,声画合一封神,却因动作翻车被吐槽

但麻烦也随之而来。

AI生成速度太快,会不会导致内容同质化严重?以前辛辛苦苦拍的原创视频,会不会被AI一键“借鉴”?更现实的是,一些基础的视频剪辑、后期岗位,可能会因为AI工具的普及受到冲击。

有行业人士估算,未来3年内,至少20%的基础视频制作工作可能被AI替代。

不过总的来说,技术的轮子已经滚起来了。

结语

从谷歌Veo3.1的升级能看出来,AI视频正在从“能看”向“好用”迈进,虽然还有诸如复杂动作生成、版权界定之类的问题没解决,但已经在广告、电商、自媒体这些场景里站稳了脚跟。

对普通人来说,与其担心被技术淘汰,不如早点学着用这些工具提升自己,毕竟AI是助手不是对手,会用工具的创作者才会走得更远。

而对整个行业来说,怎么在技术进步和行业稳定之间找到平衡,恐怕是接下来最该琢磨的事。

发表评论

长征号 Copyright © 2013-2024 长征号. All Rights Reserved.  sitemap