全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施

2025-09-01 06:26:48 - 新榜

“打开水龙头前,全球千我们不需要知道水是首发N生设施从哪条河里来的。同理,无问未来我们用各种AI应用时,芯穹芯片也不会知道它调用了哪些基座模型,发布用到了哪种加速卡的规模女秘书求签算命后被诱导门事件全集算力——这就是最好的AI Native 基础设施。”


7月4日,异构在2024年世界机器智能大会AI基础设施论坛上,混训无问芯穹联合创始人兼CEO夏立雪发布了全球首个千卡规模异构芯片混训平台,平台千卡异构混合训练集群算力利用率最高达到了97.6%。筑基同时,态格夏立雪宣布无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,局的基础是全球千全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,首发N生设施支持包括AMD、无问华为昇腾、日式会所小姐陪酒天数智芯、沐曦、摩尔线程、NVIDIA六种异构芯片在内的大模型混合训练。7月起,通过试训申请的客户,已可在Infini-AI上一键发起700亿参数规模的大模型训练。

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施 

就在4个月前,无问芯穹Infini-AI大模型开发与支持云平台宣布首次公测,已有智谱AI、月之暗面、生数科技等大模型公司客户在Infini-AI上稳定使用异构算力,还有20余家AI Native应用创业公司在Infini-AI上持续调用各种预置模型API,使用无问芯穹提供的工具链开发自身业务模型。此次发布全球首个可进行千卡规模异构芯片混训的平台,不仅是无问芯穹在异构计算优化与集群系统设计方面的深厚底蕴和卓越工艺的实力体现,同时也是无问芯穹秉承“MxN”中间层生态理念的关键成果。

 

【打破异构芯片“生态竖井”,让异构芯片转化为大算力】

 

作为大模型生命周期中不可或缺的两个阶段,训练和推理均需要强大的计算资源支撑。然而,与国际上模型层与芯片层“相对集中”的格局相比,中国的模型层与芯片层更加“百花齐放”。然而,大量的异构芯片也形成了“生态竖井”,不同硬件生态系统封闭且互不兼容,给算力的使用方带来一系列工艺挑战。

 

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施 

据不完全统计,宣布拥有千卡规模的中国算力集群已不少于100个,出于诸多缘由,比如过度依赖单一硬件平台可能会使企业面临供应链风险,又比如国产芯片的性能快速提升为集群方提供了多种选择,绝大部分集群已经或正在从同构转向异构。“生态竖井”的存在让大多数企业和开发者对此望而却步,即便算力集群众多,也难以实现有效的整合与利用,这无疑是对算力资源的浪费。“生态竖井”不仅成为构建AI Native基础设施的最大难点,也是当前大模型行业面临“算力荒”的关键原因。

 

构建适应多模型与多芯片格局的AI Native基础设施,无问芯穹的底层解法是,提供高效整合异构算力资源的好用算力平台,以及支持软硬件联合优化与加速的中间件,让异构芯片真正转化为大算力。这一系列研、产进展背后,是无问芯穹研发团队在异构芯片计算优化与集群系统设计上的强大实力支撑。近日,无问芯穹与清华、上交的联合研究团队发布了HETHUB,这是一个用于大规模模型的异构分布式混合训练系统,这是业内首次实现六种不同品牌芯片间的交叉混合训练,且工程化完成度高。夏立雪介绍,这项工艺工程化的初衷,是希望能够通过整合更多异构算力,继续推高大模型工艺能力的上限,同时通过打通异构芯片生态,持续降低大模型应用落地成本。

 

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施 

【引领“MxN”生态格局的AI Native基础设施建设,让天下没有难用的AI算力】

 

当前,大模型行业增长正在进入规模化产业落地阶段,应用场景的百花齐放,带来了对大模型训练日益迫切的需求,巨大的市场前景,使得基础模型和算力芯片的行业玩家迅速攀升。构建大模型时代的AI Native基础设施,不仅能够为AI开发者提供更加通用、高效、便捷的研发环境,同时也是实现算力资源有效整合,支撑AI产业可持续增长的关键基石。

 

无问芯穹具备顶尖的AI计算优化能力与算力解决方案能力,以及对“M种模型”与“N种芯片”行业格局的前瞻判断,率先构建了“MxN”中间层的生态格局,实现多种大模型运算规则在多元芯片上的高效、统一部署。 截止目前,Infini-AI已支持了Qwen2、GLM4、Llama3、Gemma、Yi、Baichuan2、ChatGLM3系列等共30多个模型,以及AMD、华为昇腾、壁仞、寒武纪、燧原、海光、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡。

 

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施 

无问芯穹致力于成为AI Native 基础设施领跑者,未来将继续突破异构算力优化与集群系统设计的工艺上限,持续拓展模型层和芯片层的上下游生态伙伴力量,共同实现“MxN”的有效打通、利用和整合,构建真正适应多模型与多芯片的AI Native基础设施,让天下没有难用的AI算力,助力推动大模型在各行业中的应用创新。

 

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施 

“工艺上限推高与工艺落地扩散不矛盾,且取决于我们决心如何对待这个工艺。”夏立雪表示,今天说让大模型成本下降10000倍,就像30年前说让家家户户都通电一样。优良的基础设施就是这样一种“魔法”,当边际成本下降到临界值,就能有更多的人拥抱新工艺。

 雷峰网(公众号:雷峰网)


雷峰网版权文章,未经授权禁止转载。详情见转载须知。

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施

- END -

8

产业跑进数字世界,要先迈过安全这道坎

产业跑进数字世界,要先迈过安全这道坎

当数字化转型成为时代的浪潮,企业的发展已经无法脱离数字行为、单打独斗。各类商业场景与链接的裂变与新生,驱动产业协作数字化的不断升级。与此同时,参与数字活动的安全与风险,也成为企业融入新产业协作模式的阻

周伯文:下一代大模型 OS,工具和语言缺一不可丨GAIR 2023

周伯文:下一代大模型 OS,工具和语言缺一不可丨GAIR 2023

作者丨孙溥茜编辑丨陈彩娴编者按:2023 年 8 月14日,第七届 GAIR 全球人工智能与机器人大会在新加坡乌节大酒店正式开幕。论坛由 GAIR 研究院、雷峰网、世界科技出版社、科特勒咨询集团联合主

首场“解数Talk” 直播来了——大模型语料数据联盟开源数据集解读

首场“解数Talk” 直播来了——大模型语料数据联盟开源数据集解读

一、解数Talk 介绍为帮助广大开发者更好地了解大模型语料数据联盟发布的AI大模型语料数据,沟通大模型企业在AI视角下的数据需求,不断服务大模型产业生态和落地应用,联盟发起单位上海人工智能实验室联

SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展

SCOW 首次亮相 HPC China 2022,以算网融合助力“东数西算”工程发展

12月13日,以“新算力 新赋能 新未来”为主题的2022 CCF全国高性能计算学术年会CCF HPC China 2022)在线上正式召开。作为高性能计算领域全球最具影响力的三大超算盛会之一,大会邀

相声演员杨少华去世 享年九十四岁

相声演员杨少华去世 享年九十四岁

来源:北青娱见[相声演员杨少华去世 享年九十四岁 ]今天下午,记者在相声演员@苗阜 、天津知名相声主持人小佀老师处获悉,相声演员杨少华去世享年九十四岁。北青报王磊 07M)杨少华,1931年出生于北京

对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型

对话中科深智成维忠:数字人的关键是交互,交互的关键是大模型

作者丨王悦编辑丨董子博“今年的数字人市场迎来了天翻地覆的变化。”中科深智创始人成维忠对目前国内的数字人市场如是评价。过去,国内数字人企业真正做技术的并不多,大部分以IP打造为主。出道即巅峰的虚拟美妆达

上海AI实验室开源发布高质量语料“万卷CC”

上海AI实验室开源发布高质量语料“万卷CC”

近日,上海人工智能实验室上海AI实验室)发布新一代高质量大模型预训练语料“万卷CC”WanJuan-CC),首批开源的语料覆盖过去十年互联网上的公开内容,包含1千亿字符100Btoken),约400G

阿里云 all in AI 的决心

阿里云 all in AI 的决心

如何抓住 AI 的机会?这是进入大模型时代后,面对新的起点,各大云厂商在不断思考的问题。毋庸置疑,AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑,而大模型的落地应用,给云计算勾勒了一

《少年书院行》:用青春脚步丈量文明厚度

《少年书院行》:用青春脚步丈量文明厚度

来源标题:《少年书院行》:用青春脚步丈量文明厚度在文化类节目不断探索年轻化、可视化、沉浸式表达的新语境中,由湖南卫视与芒果TV联合推出的《少年书院行》以鲜活的少年视角与行走式的叙事模式,开辟出一条传统

对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

对话加拿大工程院于非院士:寻找 AI 领域的「香农定理」

当科学家把一些菟丝子移植到几株营养状态不同的山楂树上时,那些营养状况更好的山楂树会更容易获得菟丝子的「青睐」。这在以往被看作是植物内「被动」存在的东西,但据研究人员发现,植物也具备从过去的经验中学习区

大模型「点火」,AI for Science 提速

大模型「点火」,AI for Science 提速

在生产环节中,95% 是一个分水岭。以人为对照标准,人工的准确率在 92% 至 98% 之间,因此,行业对机器容忍度的判别标准取之中位数,未达到 95% 的部分,无论是 80% 乃至 90% 的准确率

体育中考「上难度」,视觉 AI 下场「减负」

体育中考「上难度」,视觉 AI 下场「减负」

“组织体育中考30年了,今年是第一年没有遇到12345投诉的考试。”“监考17年,第一次能准点吃饭,提前下班。”上面这些评价,来自今年北京市部分体育中考考场裁判老师。每年3月到5月,是各地学校组织体育