上个星期,我一直饱受流感困扰,完全无法更新视频号:既没有心思撰写文案,更没有状态出镜。这却给了我一个很好的机会,尝试能否完全依靠目前高度发达的生成式AI工具,做一期像样的短视频。我的选题是:“虽然AI大模型推理成本大幅下降,但算力需求反而更高了,就像当年蒸汽机的发明,反而推动了全世界的煤炭需求。因此,今后算力作为一种战略资源的地位会更重要。”全长大约1分钟。
我躺在沙发上,把这段话输入了DeepSeek R1。它用了28秒,生成了包括画面描述、配音以及转场效果在内的全套文案:
【开场:蒸汽火车喷着白烟穿越金色麦田,镜头切换至芯片内部流光溢彩的电子流动】
(背景音乐:科技感音效与蒸汽朋克风格音乐交织。)
【画面:老式蒸汽机活塞特写→现代服务器集群闪烁蓝光】
“1820年,瓦特改良蒸汽机后,英国煤炭消耗量反而暴增300%——效率提升永远会激发更大需求!”
【动画:AI大脑吸收海量数据流,形成算力黑洞】
“今天,AI大模型单次推理成本下降80%,但全球算力需求正以每年翻倍的速度狂奔!GPT-4处理一本《战争与和平》,只需要你喝口咖啡的时间。”
【数据可视化:地球表面升起无数光缆,构成神经网络覆盖大陆】
(音效:数据处理声逐渐密集)
“每个智能客服都在消耗一座小城市的算力,每辆自动驾驶汽车都是移动的超算中心,这,就是AI时代的‘煤炭悖论’!”
【画面:稀土矿脉与芯片工厂交替闪现,最后定格在量子计算机冷却装置】
"当算法进化遇上物理极限,算力战争已悄然打响。从硅基芯片到光子计算,从液冷技术到星链基站,21世纪最硬的通货正在重新定义——”
【结尾:火箭发射升空,尾焰化作二进制代码照亮夜空】
"记住:蒸汽时代属于煤炭,电气时代属于石油,而正在展开的智能时代,谁能掌握算力之源,谁就能点燃下一个文明纪元!”
(字幕弹出:算力即权力)
老实说,上述文案稍嫌煽情,但不是什么大问题,稍微调整一下即可。根据我提供的简短选题,能够做出这样一份文案已属不易。问题在于,目前DeepSeek尚不具备多模态(图片/视频/音频)生成能力,所以视频生成环节必须交给别的AI工具。那么到底交给谁呢?
我马上想到了可灵AI。严格地说,快手于去年6月发布的可灵大模型,是第一个真正“震惊世界”的国产大模型,也是第一个在应用水准上超过国外竞争对手的大模型——只需要看看当初它上线之后,国外AIGC圈子铺天盖地的评价就知道了。OpenAI的Sora虽然官宣时间更早,却要等到六个月后才全面上线。在国产AI进军世界先进水平的道路上,可灵是一个十分重要的里程碑,足以载入行业史册。
由于可灵AI目前只能一次生成最多10秒的素材,所以我把上述文案拆分成六份,依次进行生成。不是所有片段都完全达到了我的预期,但其中至少有两个让我比较满意:“蒸汽机车驶过麦田”,以及“稀土矿脉与芯片工厂的交替闪现”。要知道,我不是一个专业的AI创作者;倘若我更熟练一点,生成的视频质量肯定会更高,不过现在的成果已经够用了。
如果没有AI的力量,我就只能从互联网通用素材库当中寻找相关片段,不但很难找到合意的,而且难以规避版权风险。更重要的是,通用素材不具备独特性,如果另一位视频创作者有相同选题、选择了相同素材,我们的视频看起来就没什么区别了。
(“蒸汽机车驶过麦田”视频截图)
当然,作为短视频创作者,我清楚一切目前的一切AI视频应用都存在局限性,可灵AI也不例外:它一次生成的视频长度有限,无法一次性生成复杂的中长视频;生成速度有待提高,尤其是高画质视频的生成耗费时间较长。但是这并不妨碍它成为一种有益的工具,帮助视频创作者大幅提升效率。而且,随着时间推移,尤其是算力瓶颈的逐渐缓解,上面提到的问题都是可以得到解决的。
想象一下,技术进一步成熟后,我们可以用DeepSeek将视频创意转化为文案和分镜头脚本,再用可灵AI将前者转化为完整视频,最后通过微调将其塑造为自己所需要的样子。到那个时候,可灵AI这样的视频生成应用内部或许将接入DeepSeek或者与之类似的强大文本模型,从而一站式地完成“从创意到成品”的任务。别误会,这不会取消创作者的自主性,反而会让创意更加值钱——绝大部分重复劳动被替代之后,剩下的是那些真正的闪光点!当一位创作者不用把大部分时间花在寻找素材、制作转场特效上,他就可以集中精力去构思真正独特而且感人的视频了。
毫无疑问,DeepSeek和可灵都是AI生产力工具。从生产力角度讲,DeepSeek代表的是“左脑”:逻辑推理和结构化生成能力;可灵AI代表的则是“右脑”:多模态理解与生成能力。左脑和右脑连接起来才是一个完整的大脑,即人类的“第二大脑”。由“第二大脑”承担大部分执行环节、帮助人类的“第一大脑”进行决策,将是AI时代人类工作的常态。关于DeepSeek所代表的“左脑”的市场潜力,市面上已经有很多分析了,毋庸赘述。而关于“右脑”的市场分析,却还明显不够。
在此,我想问一个稍微小一些的问题:以可灵AI为代表的AI视频生成工具,其长期市场空间有多大呢?答案首先取决于国内短视频市场的规模。根据国家广电智库的统计,截止2024年,国内短视频用户约为10.5亿;各家咨询机构对短视频市场收入规模的估算,则在3000-5000亿人民币不等(很可能还低估了)。假设数年之后,市面上10-20%的短视频时长由AI生成,或者至少由AI辅助生成,那就意味着每年数千亿小时的用户时长,对应500亿乃至上千亿的时长收入规模。AI生成工具能从这块蛋糕中分走多少?现在难以精确估计,但数额总归不会太小。
除了短视频,中长视频也将被AI深刻改变。还记得吗?Sora发布之后,许多电影从业者认为“电影行业将被AI深刻改变”,必须先理解改变趋势才能进行下一步的计划。快手副总裁盖坤曾指出,可灵这样的视频大模型在本质上是“世界模拟器”,是对世界表征的复杂应用模型的建模。这就意味着,在游戏、VR……等与“真实世界”相关的复杂生成赛道上,这样的技术都将是不可或缺的,AI工具从中获得的收入可能不低于短视频领域。我们不需要立即计算出一个结论,只需要知道市场的天花板很高就够了。
8个多月前,当可灵大模型第一次发布时,我的几位互联网行业的朋友不约而同地感叹:“快手的基础研发实力得到了证明。在视频生成赛道上,它组织起了一个具备战斗力的团队,以自己擅长的方式取得了成果。”去年12月,谷歌发布veo2视频大模型时,同时公布了MovieGenBench基准数据集,这是一个人类评估者对视频生成质量的对比评估——表现最好的是可灵1.5,它也被谷歌定义为veo2最大的竞争对手;而Sora反而是主流视频生成模型里表现最差的。这充分说明,在技术架构和数据层面,可灵就是世界先进水平。附带说一句,当时谷歌测试使用的是可灵1.5大模型,而现在的可灵早已进化到了1.6。
(一条热门推特:“中国AI产业决不只有DeepSeek……可灵是最好的视频生成模型”)
然而,在过去大半年的时间里,资本市场和媒体在讨论可灵AI的时候,往往也只是把它视为一个孤立的工具类应用,而不是快手生态的一个重要组成部分。在我看来,可灵对快手的重要性远远超出了单纯的工具层面。首先,对于快手这样的短视频+直播平台来说,强大的AIGC工具的意义怎么估计都不过分,能够大幅充实内容生态、提高内容多样性。
其次,可灵AI再次证实了快手的科技属性:它不仅是一家消费互联网公司,还是一家具备科技创新能力的公司。生成式AI是一个基础研发主导的赛道,产品、运营都是锦上添花,唯有基座大模型能力是不可或缺的——这就是DeepSeek后来居上、超过诸多互联网大厂自研大模型的原因,也是可灵AI超过许多资源更丰富的竞争对手的原因。可灵AI是一个缩影,体现了快手既重视基础研发,也能够做好基础研发;在生成式AI方面如此,在其他方面可能也是如此。
可灵AI应该值多少钱?我们不妨以国际上的同类工具作为参考:视频生成领域最大的独角兽Runway的最新一轮估值为40亿美元,而图像生成领域(也是整个AI创意生成赛道)最著名的MidJourney的估值则为105亿美元。此时此刻,快手的市值仅为约300亿美元,去掉净现金更是仅有280亿美元。显然,包括可灵在内的AIGC生态,尚未充分被纳入快手的估值。而且,即便已经从年初的低点上涨约50%,快手目前的动态P/E仍然只有15倍,P/E/G也仍然低于1倍。不论在互联网中概股当中,还是在全球消费科技类公司当中,这个估值都显著低于平均水平。
今年年初以来,中国资产的价值重估逻辑无非是两条:宏观经济尤其是内需的拐点,以及科技创新的蓬勃发展——快手的核心业务以及AIGC布局,恰好对应着这两点。虽然任何人都无法预测资本市场的短期波动,但是从长期逻辑看,这样的快手迎来一波结构性的价值重估是完全合理的。