yqk 勾引Position

你的位置:bt核工厂地址 > yqk 勾引 > 雨宫琴音贴吧 蚂蚁自研2900亿大模子用国产AI芯片检修,狡计资本508万元低于DeepSeek|钛媒体AGI

雨宫琴音贴吧 蚂蚁自研2900亿大模子用国产AI芯片检修,狡计资本508万元低于DeepSeek|钛媒体AGI

发布日期:2025-03-25 05:02    点击次数:149

雨宫琴音贴吧 蚂蚁自研2900亿大模子用国产AI芯片检修,狡计资本508万元低于DeepSeek|钛媒体AGI

(图片来源:钛媒体AGI裁剪林志佳拍摄)雨宫琴音贴吧

跟着DeepSeek激励 AI 算力优化上升,蚂皆集团全面发力 AI 技能,基于中国AI芯片进行Infra,达成了模子技能冲破。

3月24日音书,钛媒体AGI获悉,近日,蚂皆集团CTO、平台技能行状群总裁何征宇指示Ling Team团队,专揽AI Infra技能,蛊惑了两个百灵系列开源MoE模子Ling-Lite 和 Ling-Plus,前者参数边界168亿,Plus基座模子参数边界高达2900亿,比拟之下,AI行业臆想GPT-4.5参数目1.8万亿,DeepSeek-R1参数边界达6710亿。

同期,论文显现,蚂蚁团队在模子预检修阶段使用较低规格的硬件系统,将狡计资本缩小约20%,达508万元东说念主民币,最终达成与通义Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat至极的性能。

当今,干系技能效果论文发表在预印版Arxiv平台上。据彭博,该模子在检修阶段使用的是国产AI/GPGPU芯片家具,并非整个使用芯片,但最终得到的扫尾与英伟达芯片(如H800)的扫尾一样。

这是蚂皆集团初度详备表露其在AI算力层面的进展,第一次揭秘了自己若何以远低于DeepSeek、OpenAI等重大模子所需的狡计资本,完成AI大模子技能的检修并将其开源,从而加入了中好意思 AI 科技竞争上升中。

连年来,大说话模子发展赶快,尤其是DeepSeek上升,激励学界和业界对通用东说念主工智能(AGI)的闲居磋磨,而夹杂内行(MoE)模子在特定任务中表现优异,但检修依赖高性能狡计资源,资本腾贵,戒指了其在资源受限环境中的应用。

蚂蚁Ling团队以为,固然MoE模子检修对高性能AI芯片(如H100和H800)需求大,且资源供应,但低性能加速器更易得到且单元资本效益高,因此,模子需要能在异构狡计单元和漫衍式集群间切换的技能框架。同期在AI Infra部分,在跨集群、跨设立的兼容和可靠层面进行性能优化。该公司设定的目的是“不使用高等GPU”来膨大模子。

具体来说,蚂蚁Ling团队在模子检修环境、优化政策、基础才气、检修过程、评估扫尾、推理等层面都进行优化和落地。

其中在预检修层面,蚂蚁构建约9万亿 token 的高质料语料库,选用调动的MoE架构,分析缩放章程详情超参数,多阶段检修并派遣瞬时尖峰问题,况兼通过优化模子架构和检修政策,如遴荐匹配架构、集成检修框架、蛊惑XPUTimer和EDiT政策等,提高检修服从。

论文显现,在AI异构狡计平台上,技能东说念主员们将多个检修框架集成到长入的漫衍式深度学习框架中,即开源表情DLRover。同期,为了专揽各式平台的具体特点,团队蛊惑了轻量级调试器具XPUTimer,有助于快速、高效进行任务性能分析,并将内存使用量减少90%。而EDiT(弹性漫衍式检修)则在各式建立下,检修时辰最多可减少66.1%。

此外,在存储优化中,通过存储与检修经过的协同假想,擢升MoE场景下的I/O服从,通过5000个加速器 MoE 检修任务,将检讨点写入延长缩小了50%,减少一半的时辰亏空,同期还将检修节点上的峰值内存亏空缩小了60%。

蚂蚁技能团队示意,专揽Ling-Plus,在五种不同的硬件建立上对9万亿个token进行预检修,其中,使用高性能硬件建立(建立D)检修1万亿token的预检修资本约为635万元东说念主民币,但蚂蚁的优化步地将使用低规格硬件将资本降至508万元支配,检朴了近20%的资本。

蚂蚁示意,这一扫尾说明了在性能较弱的硬件上检修开首进(SOTA)的大边界 MoE 模子的可行性,使得在狡计资源遴荐方面为基础模子蛊惑提供更天真、更经济的步地。

证据蚂蚁论文提供的FLOPS峰值,钛媒体AGI以为,这些 AI 加速器家具中可能包括壁仞、天数、寒武纪的算力芯片技能。

这与英伟达的初志以火去蛾中。英伟达CEO黄仁勋以为,即使 DeepSeek 的 R1 等更高效的模子出现,狡计需求仍将增长,AI大模子需要更好的芯片来创造更多收入,而不是更低廉的芯片来削减资本。他坚合手打造具有更多处理中枢、晶体管和更大内存容量的高性能GPU芯片和“AI 工场”。

扫尾显现,在英语明白方面,蚂蚁论文中示意,Ling-Lite模子在一项要道基准测试中的表现优于 Meta的Llama 3.1-8B模子。在汉文基准测试中,Ling-Lite 和 Ling-Plus 模子均优于 DeepSeek 的同类模子。

“Ling-Plus 和 Qwen2.5-72B-Instruct 在安全性方面表现凸起,且Ling-Plus在失误终止方面表现更佳。DeepSeek系列模子的失误终止风物最少,但部分安全性较低。而Ling-Plus 在安全性和终止率之间表现出更好的举座均衡,在这些目的的平均值方面取得了最佳的扫尾。”论文示意。

据悉,蚂蚁百灵大模子Ling-Plus 和 Ling-Lite将谋略开源,并应用于医疗、金融等行业领域。

街拍丝袜

当今,蚂蚁领有三款 AI 助手管家家具——生涯助手“支小宝”、AI金融管家“蚂小财”,以及刚刚发布的 AI 医师助手等家具和惩办有盘算推算。

不外,蚂蚁也在论文中示意,大模子检修是一个具有挑战性且资源密集的过程,经常伴跟着各式技能贫瘠,失误和特殊很常见,有些相对容易惩办,而有些则需要多数时辰和元气心灵。而Ling系列模子在检修阶段濒临挑战,包括厚实性,即使是硬件或模子结构的细小变化也会导致问题,包括模子失误率的大幅上升。

针对这份论文,彭博行业相干高等 BI 分析师Robert Lea示意,蚂蚁的这一效果强调了中国 AI 调动才气赓续增强,以及技能向上的设施加速。要是实质得到阐明,这将突显出中国正在野着 AI 自食其力的所在迈进,因为中国正在转向资本更低、狡计服从更高的模子,以绕过英伟达芯片的出口不竭。

(本文首发于钛媒体App,作家|林志佳)



Powered by bt核工厂地址 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024

TOP