左脑DeepSeek，右脑可灵，或许是国产AI的“完全形态”

上个星期，我一直饱受流感困扰，完全无法更新视频号：既没有心思撰写文案，更没有状态出镜。这却给了我一个很好的机会，尝试能否完全依靠目前高度发达的生成式AI工具，做一期像样的短视频。我的选题是：“虽然AI大模型推理成本大幅下降，但算力需求反而更高了，就像当年蒸汽机的发明，反而推动了全世界的煤炭需求。因此，今后算力作为一种战略资源的地位会更重要。”全长大约1分钟。

我躺在沙发上，把这段话输入了DeepSeek R1。它用了28秒，生成了包括画面描述、配音以及转场效果在内的全套文案：

【开场：蒸汽火车喷着白烟穿越金色麦田，镜头切换至芯片内部流光溢彩的电子流动】

（背景音乐：科技感音效与蒸汽朋克风格音乐交织。）

【画面：老式蒸汽机活塞特写→现代服务器集群闪烁蓝光】

“1820年，瓦特改良蒸汽机后，英国煤炭消耗量反而暴增300%——效率提升永远会激发更大需求！”

【动画：AI大脑吸收海量数据流，形成算力黑洞】

“今天，AI大模型单次推理成本下降80%，但全球算力需求正以每年翻倍的速度狂奔！GPT-4处理一本《战争与和平》，只需要你喝口咖啡的时间。”

【数据可视化：地球表面升起无数光缆，构成神经网络覆盖大陆】

（音效：数据处理声逐渐密集）

“每个智能客服都在消耗一座小城市的算力，每辆自动驾驶汽车都是移动的超算中心，这，就是AI时代的‘煤炭悖论’！”

【画面：稀土矿脉与芯片工厂交替闪现，最后定格在量子计算机冷却装置】

"当算法进化遇上物理极限，算力战争已悄然打响。从硅基芯片到光子计算，从液冷技术到星链基站，21世纪最硬的通货正在重新定义——”

【结尾：火箭发射升空，尾焰化作二进制代码照亮夜空】

"记住：蒸汽时代属于煤炭，电气时代属于石油，而正在展开的智能时代，谁能掌握算力之源，谁就能点燃下一个文明纪元！”

（字幕弹出：算力即权力）

老实说，上述文案稍嫌煽情，但不是什么大问题，稍微调整一下即可。根据我提供的简短选题，能够做出这样一份文案已属不易。问题在于，目前DeepSeek尚不具备多模态（图片/视频/音频）生成能力，所以视频生成环节必须交给别的AI工具。那么到底交给谁呢？

我马上想到了可灵AI。严格地说，快手于去年6月发布的可灵大模型，是第一个真正“震惊世界”的国产大模型，也是第一个在应用水准上超过国外竞争对手的大模型——只需要看看当初它上线之后，国外AIGC圈子铺天盖地的评价就知道了。OpenAI的Sora虽然官宣时间更早，却要等到六个月后才全面上线。在国产AI进军世界先进水平的道路上，可灵是一个十分重要的里程碑，足以载入行业史册。

由于可灵AI目前只能一次生成最多10秒的素材，所以我把上述文案拆分成六份，依次进行生成。不是所有片段都完全达到了我的预期，但其中至少有两个让我比较满意：“蒸汽机车驶过麦田”，以及“稀土矿脉与芯片工厂的交替闪现”。要知道，我不是一个专业的AI创作者；倘若我更熟练一点，生成的视频质量肯定会更高，不过现在的成果已经够用了。

如果没有AI的力量，我就只能从互联网通用素材库当中寻找相关片段，不但很难找到合意的，而且难以规避版权风险。更重要的是，通用素材不具备独特性，如果另一位视频创作者有相同选题、选择了相同素材，我们的视频看起来就没什么区别了。

（“蒸汽机车驶过麦田”视频截图）

当然，作为短视频创作者，我清楚一切目前的一切AI视频应用都存在局限性，可灵AI也不例外：它一次生成的视频长度有限，无法一次性生成复杂的中长视频；生成速度有待提高，尤其是高画质视频的生成耗费时间较长。但是这并不妨碍它成为一种有益的工具，帮助视频创作者大幅提升效率。而且，随着时间推移，尤其是算力瓶颈的逐渐缓解，上面提到的问题都是可以得到解决的。

想象一下，技术进一步成熟后，我们可以用DeepSeek将视频创意转化为文案和分镜头脚本，再用可灵AI将前者转化为完整视频，最后通过微调将其塑造为自己所需要的样子。到那个时候，可灵AI这样的视频生成应用内部或许将接入DeepSeek或者与之类似的强大文本模型，从而一站式地完成“从创意到成品”的任务。别误会，这不会取消创作者的自主性，反而会让创意更加值钱——绝大部分重复劳动被替代之后，剩下的是那些真正的闪光点！当一位创作者不用把大部分时间花在寻找素材、制作转场特效上，他就可以集中精力去构思真正独特而且感人的视频了。

毫无疑问，DeepSeek和可灵都是AI生产力工具。从生产力角度讲，DeepSeek代表的是“左脑”：逻辑推理和结构化生成能力；可灵AI代表的则是“右脑”：多模态理解与生成能力。左脑和右脑连接起来才是一个完整的大脑，即人类的“第二大脑”。由“第二大脑”承担大部分执行环节、帮助人类的“第一大脑”进行决策，将是AI时代人类工作的常态。关于DeepSeek所代表的“左脑”的市场潜力，市面上已经有很多分析了，毋庸赘述。而关于“右脑”的市场分析，却还明显不够。

在此，我想问一个稍微小一些的问题：以可灵AI为代表的AI视频生成工具，其长期市场空间有多大呢？答案首先取决于国内短视频市场的规模。根据国家广电智库的统计，截止2024年，国内短视频用户约为10.5亿；各家咨询机构对短视频市场收入规模的估算，则在3000-5000亿人民币不等（很可能还低估了）。假设数年之后，市面上10-20%的短视频时长由AI生成，或者至少由AI辅助生成，那就意味着每年数千亿小时的用户时长，对应500亿乃至上千亿的时长收入规模。AI生成工具能从这块蛋糕中分走多少？现在难以精确估计，但数额总归不会太小。

除了短视频，中长视频也将被AI深刻改变。还记得吗？Sora发布之后，许多电影从业者认为“电影行业将被AI深刻改变”，必须先理解改变趋势才能进行下一步的计划。快手副总裁盖坤曾指出，可灵这样的视频大模型在本质上是“世界模拟器”，是对世界表征的复杂应用模型的建模。这就意味着，在游戏、VR……等与“真实世界”相关的复杂生成赛道上，这样的技术都将是不可或缺的，AI工具从中获得的收入可能不低于短视频领域。我们不需要立即计算出一个结论，只需要知道市场的天花板很高就够了。

8个多月前，当可灵大模型第一次发布时，我的几位互联网行业的朋友不约而同地感叹：“快手的基础研发实力得到了证明。在视频生成赛道上，它组织起了一个具备战斗力的团队，以自己擅长的方式取得了成果。”去年12月，谷歌发布veo2视频大模型时，同时公布了MovieGenBench基准数据集，这是一个人类评估者对视频生成质量的对比评估——表现最好的是可灵1.5，它也被谷歌定义为veo2最大的竞争对手；而Sora反而是主流视频生成模型里表现最差的。这充分说明，在技术架构和数据层面，可灵就是世界先进水平。附带说一句，当时谷歌测试使用的是可灵1.5大模型，而现在的可灵早已进化到了1.6。

（一条热门推特：“中国AI产业决不只有DeepSeek……可灵是最好的视频生成模型”）

然而，在过去大半年的时间里，资本市场和媒体在讨论可灵AI的时候，往往也只是把它视为一个孤立的工具类应用，而不是快手生态的一个重要组成部分。在我看来，可灵对快手的重要性远远超出了单纯的工具层面。首先，对于快手这样的短视频+直播平台来说，强大的AIGC工具的意义怎么估计都不过分，能够大幅充实内容生态、提高内容多样性。

其次，可灵AI再次证实了快手的科技属性：它不仅是一家消费互联网公司，还是一家具备科技创新能力的公司。生成式AI是一个基础研发主导的赛道，产品、运营都是锦上添花，唯有基座大模型能力是不可或缺的——这就是DeepSeek后来居上、超过诸多互联网大厂自研大模型的原因，也是可灵AI超过许多资源更丰富的竞争对手的原因。可灵AI是一个缩影，体现了快手既重视基础研发，也能够做好基础研发；在生成式AI方面如此，在其他方面可能也是如此。

可灵AI应该值多少钱？我们不妨以国际上的同类工具作为参考：视频生成领域最大的独角兽Runway的最新一轮估值为40亿美元，而图像生成领域（也是整个AI创意生成赛道）最著名的MidJourney的估值则为105亿美元。此时此刻，快手的市值仅为约300亿美元，去掉净现金更是仅有280亿美元。显然，包括可灵在内的AIGC生态，尚未充分被纳入快手的估值。而且，即便已经从年初的低点上涨约50%，快手目前的动态P/E仍然只有15倍，P/E/G也仍然低于1倍。不论在互联网中概股当中，还是在全球消费科技类公司当中，这个估值都显著低于平均水平。

今年年初以来，中国资产的价值重估逻辑无非是两条：宏观经济尤其是内需的拐点，以及科技创新的蓬勃发展——快手的核心业务以及AIGC布局，恰好对应着这两点。虽然任何人都无法预测资本市场的短期波动，但是从长期逻辑看，这样的快手迎来一波结构性的价值重估是完全合理的。

左脑DeepSeek，右脑可灵，或许是国产AI的“完全形态”

第一批靠DeepSeek赚到钱的出海人是谁？| 霞光Talk

AI医生，离“神医”有多远？中医或颠覆赛道

马斯克用20万块英伟达芯片练出Grok 3，印证了DeepSeek真的强

重磅！60页PPT讲清DeepSeek，打开AI时代财富密码（附下载）

DeepSeek时代：马上消费走到“AI 分水岭”