发布日期:2024-10-18 18:22 点击次数:182
10月15日半夜,零一万物的Yi-Lightning大模子在LMSYS盲测竞技场的投票数进步一万次,拿到了这个国际泰斗测试榜单的入场券,“出来的结果是,咱们排在人人第六”,10月16日上昼,零一万物CEO李开复向媒体晓示时一字一顿。为了强调西野翔ed2k,他还补充,“咱们和马斯克(特斯拉CEO)的xAI Grok打平,比肩第六,按公司算零一万物排在人人第四名”。
本日,李开复还向媒体公布并演示了to B战术下的行业运用家具AI 2.0数字东谈主,这一家具聚焦零卖和电商等场景。“to B就作念国内,作念成心润的处罚有策动。”李开复指表明确,面临国内C端(用户)阛阓,零一万物则会非常严慎,“先不推出中国脉土新的to C的运用”。
检修老本是敌手的1%
“任何一个新的模子要有一万次投票才会投入这个榜单,昨天(10月15日)晚上,Yi-Lightning模子在LMSYS上终于达到了一万次以上的投票。”李开复邀请媒体体验LMSYS这个大模子擂台。
算作一个公益相貌,LMSYS被认为是“大模子最强盲测”,征引这一榜单的科技大佬不啻Open AI的CEO山姆·奥特曼和谷歌首席科学家杰夫·迪恩。
把柄李开复公布的总榜单,零一万物的Yi-Lightning排在Open AI、Google和xAI的大模子之后,人人名轮番六。具体到分榜,在汉文分榜,Yi-Lightning与o1-mini等模子比肩名次天下第二;在多轮对话分榜,名轮番三;数学、代码分榜上,Yi-Lightning分获第三、第四名;勤劳发问、长发问榜,Yi-Lightning齐得到第四名。
据了解,Yi-Lightning是零一万物成就的Yi系列大谈话模子,补助潦倒文16K,是零一万物最新高性能模子。把柄里面评测数据,在8xH100算力基础下,以通常的任务界限进行测试,Yi-Lightning的首包(从收受到任务苦求到系统启动输出反映结果之间的时候)时候是Yi-Large的一半,最高生成速率升迁近四成。
李开复先容时,则向媒体重叠强调了老本。
“咱们知谈xAI在检修Grok时是几万张的GPU(图形处理器),当前囤了10万张GPU。咱们此次预检修只用2000张GPU检修一个半月,花了300多万好意思元,作念出来的预检修模子跟Grok打平,却只花了它的1%或2%的老本。”李开复暗意好意思瞻念。
他也再次重申,“零一万物毫不毁掉预检修。作念好预检修是一个技巧活,要非常多有才华的东谈主在一齐慢工出细活。若是一个公司有幸领有懂芯片的、懂推理的、懂基础架构的、懂模子的,有好多的作念算法的东谈主才能跨界限和解,我投降中国总共不错作念出天下名次前十的预检修通用模子”。
把时候差保合手在6个月
“但作念这件事的老本相比高,以后可能作念预检修的大模子公司会越来越少。”李开复话锋一滑,“据我所知,大模子‘六小虎’(包括零一万物、百川智能等六家落寞大模子初创公司)的融资额齐是够的,咱们作念一次300万好意思元,这个钱头部公司也付得起。”
如故围绕着榜单作念对比。GPT-4o是Open AI在5月14日推出的大模子,在最新的LMSYS总榜中,排在Yi-Lightning之后。“咱们在10月把GPT-4o击败了,是以零一万物和好意思国顶尖模子的时候差惟有5个月。”李开复说。
时候差是个老话题,从2023年头国内大模子扎堆上线,被一个又一个大佬回复过。这个问题紧要与否见仁见智。无论得到的时候是若干,齐解说了少许——差距依然存在。
制服诱惑“裁减时候差非常困难,毕竟东谈主家10万张GPU,咱们2000张。能达到这个结果是因为团队优秀、再加上研发有特点,用这套本领把时候差保合手在6个月驾驭,仍是是很好的结果了。若是要破局,可能需要一个前所未有的算法才有契机。”李开复同期告诉媒体,“千万不要认为逾期6个月是很玷污的事情,若是用访佛零一万物的交代,我认为可能不单咱们一家能把时候差摈弃在6个月,但难度不低。”
不参与价钱战
另一个层面的摈弃体当前价钱上。当前,Yi-Lightning已在Yi大模子洞开平台上线,0.99元/100万Tokens。
一般来说,国内大模子企业多量用1000Tokens订价。以科技大厂阿里云为例,官网列举的通义千问系列大模子qwenturbo相对较低,营销行为后的输入价钱是0.0003元/1000Tokens、输出价钱0.0006元/ 1000Tokens,即折柳是0.3元/100万Tokens、0.6元/100万Tokens。
“这个订价确乎具有显赫上风,在竞争强烈的AI阛阓中,价钱上风时常能成为吸援用户的要津身分。”北京市社会科学院副酌量员王鹏向北京商报记者暗意。
在和媒体换取时,李开复三次提到这个价钱,他承认这是白菜价,但也直言“零一万物如故成心润空间的,不参与价钱战”。
除了性能、价钱,零一万物对阛阓也有我方的坚合手。
本日零一万物推出to B新家具AI 2.0处罚有策动,把Yi Lightning推论于具体行业处罚有策动。基于以Yi Lightning模子为代表的Yi模子,零一万物搭建起了包含脚色大模子、直播声息大模子、电商话术大模子在内的一整套专用模子基座。
在回复to B、to C遴荐的问题时,李开复告诉媒体,“一个大模子公司同期作念to B、to C是很贫乏的,需要多元化的经管式样。遴荐在国内作念to B,是因为咱们找到了一些破局的空间,比如用数字东谈主来作念零卖、餐饮等,能作念一个好意思满的处罚有策动。我认为这么的to B只可在中国作念,to B就作念成心润的处罚有策动,而不仅仅卖模子,不仅仅作念相貌制”。
关于to C,零一万物的主要布局在国外。在他看来,流量老本是大模子to C的很大问题,“在这么的挑战环境里咱们会非常严慎,先不推出中国脉土新的to C的运用,已有的家具还会无间热爱”。
零一万物的想路稳妥所有大模子行业吗?“C端用户莫得很强的付费需乞降意愿。想依靠他们来收场盈利,短期来看是不切实际的。”瑞达恒酌量院司理王清霖告诉北京商报记者,“B端阛阓为了提高遵守、跟上期间形式、招引投资东谈主的重观念,可能有一些是相对刚需的购买意愿。如果真大要切入某一类或者某一个界限,了解他们的需求,是有可能霸占阛阓先机的。”
北京商报记者 魏蔚西野翔ed2k