评论
1
分享

异构智算的统一战线太长,需要一个“六边形玩家”!

巨头财经

2024-09-28 16:57 北京

86096 0 1

前记: 

作为一名文科生,这可能是最烧脑的一篇学习笔记。AI时代来临,我们不得不向深水区窥探,逼自己向AI上游挺进,理解新世界的朴素原理。 

主笔 / 佳佳 ;文章架构师 / 拓跋野 ;出品 / 巨头财经 

01. 

AI上游在哪里? 

离老百姓最近的是AI应用 → 这两年音浪最大的是大模型 → 大模型的基础肯定是算力 → 不同算力之间需要「异构智算」管理 → 再上游就要到卡脖子的5nm芯片 → 以及工业塔尖明珠的EUV光刻机……     

好多名词好像都听过,唯独这个「异构智算」格外陌生。 

02. 

用大白话来解释【同构/异构】。 

当一个企业构建算力集群的时候,采买完全一致的型号显卡,这属于「同构计算」,适合不差钱的金主客户;采买相近系列的A厂、B厂、C厂显卡,这叫「同构智算」; 

但现实是,成本因素、供应链因素、老卡续用、新卡采买等,都需要将各类GPU混合使用,这叫「异构智算1.0」; 

继续将GPU和CPU杂糅,以适应各种训练、调优、推理,尤其是不同指令集的CPU混合,这种复杂局叫「异构智算2.0」; 

这两年更卷了,算力卡短缺局面层出不穷,智算开始向超算借闲置算力,智算集群+超算集群的异构,被称为「异构智算3.0」。 

03. 

算力已是国家级战略。 

宏观层面,算力已经是全球竞争的主战场之一。根据中国信通院的测算,每投入1元,将带动3至4元的GDP经济增长。 

全世界GDP也和算力完全正相关,中国算力指数大概是美国的70%左右。但咱们增长是全世界最强劲的,全国数据中心机超过760万标准机架,算力总规模达到197EFLOPS,也是全球第二。 

差距能这么小,完全是因为提前N年,将算力升级为国家战略,鼓励适度超前建设,尤其大名鼎鼎的「东数西算」工程。 

04. 

但是该说说问题了。           

微观层面,面临三个核心难题:① 同质化竞争激烈,高质供给不足;② AI芯片研发供给受限,国产替代不足;③ 缺乏一个可以支撑智算产业发展的完整生态体系。     

此时,异构智算的价值就凸显出来了:① 能将分散的算力打造成一张网,集中起来办大事;② 也能为上游AI芯片、光刻机等硬科技,争取一定的缓冲时间;③ 更重要的是,在B端、C端的实际使用中,通过集群效应实现降本增效。 

问题和解题,都极具中国特色,既有一盘大棋的统筹,又有市场经济的驱动。 

05. 

异构智算产业生态联盟的意义。           

这里面,玩家是非常多的,清北复交等高校、还有众多芯片厂商、联想这样的综合解决方案厂商、超算互联网平台等协同机构、头部互联网公司等等。 

为什么需要一个联盟?因为不同的主体,有不同的视角,不同的出发点,不同的利益诉求,不同的技术壁垒,不同的路径选择,这些都是「异构技术之外的异构」,需要打通里面的信息不对称,平衡各方的利益,甚至一部分主体做出让步和牺牲。 

今年4月,联想集团与中国智能计算产业联盟共同宣布,发起成立异构智算产业生态联盟,首批共计16家成员单位。 

06. 

为什么是联想? 

除了个人PC市场绝对老大身份外,7年前,联想跟着国家战略,前瞻性地布局人工智能,提出了基于“端-边-云-网-智”新IT架构的“全栈AI”,凭着综合多元的实力,站在了新起跑线的第一排。 

在AI终端领域,一体多端战略,发售了全球第一台AI PC,同时植入更多具有异构AI算力的设备; 

在基础设施领域,一横五纵战略,在国家尖端科研项目、行业级模型落地、垂类行业性能/效率优化、混合算力的统一管理、标准化快速交付方案等,都成为异构智算的标配选项; 

在解决方案领域,一擎三箭战略,通过以企业智能体为核心的“擎天3.0”,为政企客户、中小企业、消费客群提供针对性解决方案和服务; 

正因为在终端、AI基础设施、解决方案等的综合实力,通过联想发起的联盟框架,才有机会实现从AI芯片层、AI设备与系统层、AI平台与应用层,到全行业场景的解决方案。 

异构智算的统一战线太长,确实需要一个“六边形玩家”。 

07. 

算力背后拼的是冷实力。 

对于算力产业来说,节能是降本增效的关键。2024年相关部门的要求,未来新建大型数据中心,PUE要将至1.25以内。 

联想在液冷领域深耕已久,全面布局了风液冷混合、全液冷、整机柜液冷、单相浸没式液冷等。尤其自研的海神温水水冷技术,PUE可降至1.1以下,该技术已升级至第六代,全球部署已经超过7万套。 

最新的财报显示,联想AI服务器在手订单环比增加了50%,基于液冷技术的服务器营收同比增长55%,创历史新高。 

08. 

两款最新发布的AI产品。 

一款AI服务器,联想问天WA7880a G3,可兼容国内主流厂商的OAM GPU,且支持CPU和GPU之间单上行和双上行拓扑配置。 

一款企业AI应用部署解决方案:联想AIPod!有机会成为AI智能风控、智慧工厂、AI医疗等场景的首选解决方案。 

这些,都是打通「异构智算」的基础设施。 

09. 

“国产算力到了从‘可用’迈向‘好用’的阶段。” 

——联想集团副总裁、联想中国基础设施业务群总经理陈振宽如是说。 

翻译一下,算力好用的十个标准:① 不再需要那么多晦涩名词;② 像水电燃气一样简单使用算力;③ GPU/CPU/超算等形成一张算力网;④ 即时调用、即时分配、即时计算成本;⑤ 从芯片到系统到大模型到应用产业一体化;⑥ 市场出现多类一站式AI解决方案;⑦ 提高C端生活品质,赋能千行百业;⑧ 性能和功耗逼近当前架构的物理极限;⑨ 解决国产卡脖子难题,不再受制于人;⑩ 全球范围内公平竞争。     

但当下仍处于算力好用的早期阶段,仍需各界齐心努力。 

10. 

昨天,河南郑州,中国算力大会,一场行业风向标级的盛会。全程盯完异构智算论坛的直播,虽然专业晦涩,颇有认知收益。 

三流的大会搞势能,二流的大会秀肌肉,一流的大会定标准。 

AI未来可期,因为有一批信AI的实干家。

# 服务器
# 联想
# AI
本文为凯迪网自媒体“凯迪号”作者上传发布,代表其个人观点与立场,凯迪网仅提供信息发布与储存服务。文章内容之真实性、准确性由用户自行辨别,凯迪网有权利对涉嫌违反相关法律、法规内容进行相应处置。
举报
投喂支持
1人点赞
发表评论
请先 注册 / 登录后参与评论
推荐阅读