直面大模型“大成本”挑战,如何提高算力效率?

最佳回答:

直面大模型“大成本”挑战,如何提高算力效率?

  中新网北京6月3日电 (记者 夏宾)最近几年来,为了寻求年夜模子的聪明能力,列国公司不断加码投入,4月,Meta公布追加10亿美元投资,用于其AI芯片研发和AI数据中间扶植;亚马逊为了扶植新数据中间投入110亿美元。但在年夜模子扩大的背后,算力价格、能源价格一样庞大。   有业界手艺团队测算,若要对一个5000亿参数范围的单体年夜模子进行充实练习,所需算力根本举措措施约在10亿美元范围,每一年耗损的电费在5.3亿元人平易近币。不管对哪一个机构、企业,这都是天文数字和庞大价格,中国也不破例。   知名科学杂志《Nature》此前颁发了一篇关于年夜模子将来成长之路的文章,《In Al, is bigger always better?》(人工智能,越年夜型越好?)。争议的呈现,意味着AI成长标的目的呈现了不合。   现在,“年夜”不再是模子的独一寻求,计较效力和算力开消两年夜问题成为新的行业核心。   对年夜模子推理本钱的优化,可经由过程良多手艺手段实现。起首是模子自己,模子布局、练习方式都可以延续改良,包罗业界很存眷的MoE(夹杂专家模子),就是优化推理本钱很好的解决方案。其次是工程上的优化。年夜模子的挪用量越年夜,优化推理本钱的空间也越年夜。之前的模子都是单机推理,年夜模子用的是散布式推理。所以假如能把各类各样底层算力用得更好,推理本钱就会年夜年夜下降。   MoE年夜模子的流行,现实上对应的恰是模子能力和算力开消两年夜问题的解决。这也是为什么浩繁年夜模子厂商如OpenAI、谷歌、Mistral AI、海潮信息等陆续基于MoE架构进级自家年夜模子产物的缘由。   从海潮信息发布的“源2.0-M32”开源年夜模子来看,其基于“源2.0”系列年夜模子已有工作根本,立异提出和采取了“基于留意力机制的门控收集”手艺,构建包括32个专家(Expert)的夹杂专家模子(MoE),并年夜幅晋升了模子算力效力,模子运行时激活参数为37亿,在业界主流基准评测中机能周全对标700亿参数的LLaMA3开源年夜模子。   海潮信息人工智能首席科学家吴年光光阴在接管中新网记者采访时说,我们一向在想若何以更低的算力耗损,提高全部年夜模子的利用结果,能让企业、机构以更小的算力价格去取得更高的模子能力。“这多是中国成长本身的AI年夜模子比力行之有用的路径。”   他直言,年夜模子推动速度愈来愈快,必需强调模子算力效力。“大师可以想象,效力越高就意味着在单元算力投入相等的环境下取得的精度回报越高,它对练习和利用都很是有益。”   “实际的算力是有限的,我们几回再三频频强调模算效力,试图针对当前算力环境闯出一条本身感觉比力好的门路。在固定每一个Token算力不变的环境下,经由过程扩大专家数目可以取得更年夜参数目的模子,进而取得更高精度。”吴年光光阴说。   他进一步称,整体来看,虽然当前模子的能力晋升很是之快,但之前大师更多存眷单个维度问题,即平均精度的晋升。但年夜模子进入快速落地时期,就不能不斟酌更多维度的问题,包罗模算效力、精度、算力开消等。   中国工程院院士郑纬平易近曾做过如许的计较,在年夜模子练习过程当中,70%开消要花在算力上;推理过程当中95%的破费也是在算力上。   为解决年夜模子练习的算力不足问题,郑纬平易近建议,在鞭策智能计较中间扶植同时也能够操纵已有超算系统的空余算力。   郑纬平易近暗示,现有14个国度挂牌的超算系统,每台机械的扶植本钱都很高,本钱在10亿元至20亿元,乃至更高。这些超算系统已为中国的国平易近经济成长作出庞大进献,但有些系统还有空余算力,这些空余算力也可被用来做年夜模子练习,且颠末优化乃至可下降年夜模子练习本钱。   对近期中国企业的一轮年夜模子降价,零一万物CEO李开复暗示,将来全部行业的推理本钱每一年下降十倍是可以等候的,且这个趋向是必定的,如斯会有更多人用上年夜模子,这长短常利好的动静。(完) 【编纂:刘湃】。

最近有关兰州快餐的消息引起了大家的关注,据报道,兰州一家快餐店近日推出了一项特别优惠,即半夜点餐只需花费200元便可享受丰盛的快餐套餐。这一消息在当地社交平台上广为流传,引发了广大食客的热议。

据了解,这家兰州快餐店的店主名叫王先生,他是一位年轻且富有创新精神的创业者。为了吸引更多的消费者,王先生突发奇想推出了这一半夜特价套餐活动。他表示,夜间人流量较少,希望通过这种特别的优惠方式来吸引更多的消费者前来光顾,并增加店铺的知名度。

意见反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有

 时事|昆明附近快餐200带吹电话,立刻-百态杂谈

以防长:以色列正在评估替代哈马斯管控加沙的方案

最佳回答:

以防长:以色列正在评估替代哈马斯管控加沙的方案

  中新社北京6月3日电 综合动静:以色各国防部长加兰特本地时候2日暗示,以色列方面正在评估替换巴勒斯坦伊斯兰反抗活动(哈马斯)管控加沙地带的方案。   据法新社、《以色列时报》动静,加兰特在当日声明中称,在任何旨在竣事战争的历程中,“我们不会接管哈马斯在加沙地带的统治”。他暗示,以色列方面将隔离加沙地带部门地域,覆灭此中的哈马斯成员,并引入其他气力以成立一个分歧的当局。   路透社报导,加兰特没有便可能的替换方案进行具体申明。   据《以色列时报》报导,以“战时内阁”2日晚就美国总统拜登提出的最新人质释放与停火提案进行会商。   5月31日,拜登发布一项由以色列当局提出的有关加沙地带停火的新提议,并暗示,这一“周全新提议”是美国与以色列、卡塔尔、埃及和其他中东国度多轮交际对话的产品。   据英国《日曜日泰晤士报》2日报导,以总理内塔尼亚胡的首席交际政策参谋奥菲尔·福尔克(Ophir Falk)在接管采访时称,拜登“出于某些缘由颁发了一场政治演讲”。他暗示,仍有很多细节需商议,包罗在以色列告竣所有方针前不会实现永远停火。   福尔克强调,以色列没有谢绝这一和谈。他暗示,“固然这不是一项好和谈,但我们很是但愿所有人质获释。”   据美国国务院网站动静,美国国务卿布林肯2日与加兰特通德律风,会商实现加沙地带周全停火、确保所有人质获释并向加沙地带增派人性主义支援的提案。报导称,布林肯奖饰以方愿意告竣和谈,认为哈马斯有责任接管该和谈。   布林肯强调,该提案将增进以色列的持久平安好处,包罗使以色列有可能进一步融入该地域。   据巴勒斯坦官方通信社“瓦法”2日报导,以军在曩昔24小时对加沙地带策动4次攻击,造成最少60人灭亡、220人受伤。   一位高层动静人士2日向埃及开罗新闻电视台证实,由埃及、美国和以色列代表团介入的三方漫谈在埃及首都开罗竣事。该动静人士称,埃及对峙其立场,认为以色列必需从拉法港口巴勒斯坦一侧撤兵,以便该港口恢复运营。   据马尔代夫总统办公室网站动静,马尔代夫河山平安部长阿里·伊胡桑2日在新闻发布会上公布,该国总统穆伊兹接管内阁建议,决议制止以色列公平易近入境。   伊胡桑称,穆伊兹还决议录用一名特使对巴勒斯坦需求进行评估,并经由过程举行捐献勾当、进行全国性会议等体例撑持巴勒斯坦。(完) 【编纂:管娜】。

天南地北,杂乱无章的消息聚合成一篇新闻。

这个令人匪夷所思的消息传遍了整个昆明市。有人惊讶地说:“带吹电话是什么意思?”还有人猜测:“难道是在吃快餐的同时还可以吹电话?”

意见反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有

404页面