评论
分享

谷歌DeepMind推出4K视频模型,正面迎击Sora

这个是认证

热点科技

2024-12-17 17:56 中国

39327 0 0

近日,谷歌 Alphabet 部门 Google DeepMind 突然公布 Veo 2 视频模型,距离 Veo 一代发布仅七个月后,现版本已经可以生成最高 4K 分辨率,长达两分钟以上的视频。

要知道,OpenAI 在一周前刚刚正式推出了 Sora 视频模型,同样经过近一年的打磨,Sora 却依旧受限于 1080p 的最大分辨率。

谷歌在关于 Veo 2 的介绍中提到:" 低分辨率视频非常适合移动设备,但创作者希望看到他们的作品在大屏幕上大放异彩。" 显然,这段发言直指 Sora。

谷歌发言人表示,Veo 2 的 4K 剪辑默认限制为 8 秒,但可以延长至 2 分钟或更长时间。与之相比,Sora 的 1080p 视频上限仅为 20 秒。

抛开以上这些参数,AI 视频模型有个问题绕不过,就是那些 " 低级 "BUG。Sora 一经推出,很多自媒体都做了测试,坏消息是,各种奇怪的物理和人体表现依旧存在。比如,生成人物可能有许多条腿,或遇到稍微复杂的运动时,扭曲的身体让人看得背后发毛,似乎这是 AI 现阶段难以逾越的大山。

但谷歌部门声称,在纠正 " 幻觉 " 细节(如额外的手指)和展示 " 现实世界的物理学以及人类运动和表情 " 方面取得了重大进展。

一些具备相关学术背景的专业人士对 AI 所犯的物理错误发表了看法,他们认为,只能通过所谓的世界模型来解决,这些模型具有理解和生成 3D 环境的 " 空间智能 "。凑巧的是,谷歌本月早些时候推出了自己的 Genie 2 世界模型,难道这就是《黑客帝国》的训练场?

同时,Veo 2 也能更好理解 " 电影语言 ",比如 "18mm 镜头 "、" 浅景深 " 等专业用语。但是,也有很多人对日趋 " 合理 " 的视频模型产生担忧,图像和视频生成器的输出越合理,它们被用于邪恶目的的风险就越大,防伪技术的迭代势在必行。

对于 Veo 2 来说,DeepMind 将不可见的 SynthID 水印置于 Veo 2 生成的视频中。这种 " 水印 " 的优点是,隐匿的 SynthID 可能会让视频传播者大意,技术人员更容易发现造假视频的证据。缺点也很明显,普通人很难区分一段视频是否由 AI 生成。

相比之下,OpenAI 的 Sora 会在其生成视频的右下角嵌入一个可见的水印动画,对于普通人更容易分辨。

不过大家对于 AI 视频模型的担忧一定不会停止,现阶段,各家视频大模型还是以秒或分钟来生成,而且相对比较容易分辨。但按照当今的发展速度,未来 AI 生成的视频一定会以假乱真,到时候我们将如何面对互联网世界?你所喜爱的视频博主,也许根本不存在。

# 谷歌
# AI
本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
点赞
发表评论
请先 注册 / 登录后参与评论
推荐阅读