大国工匠丨打制全系统自从可控大模子 这个团队
发布时间:
2025-07-17 15:50
抢工智能成长的汗青机缘,2023岁首年月,我国提出,按照通信、电力、交通物流、能源等范畴的需求,利用国产软硬件,打制人工智能大模子,构成自从可控的全新的财产生态。
王斌:国度给了我们这种期许,可以或许用国产算力实现对国际支流算力的替代,我们大模子还正在持续迭代升级,正在AI赛道上任沉道远,我们有决心有决心来应对挑和。
信号基坐引入人工智能大模子手艺,对海量手机流量信号切确预测,给出每台基坐的智能节能方案,全国600多万台基坐通过人工智能等多种手艺实现全年节电2。5亿度。
做为中国挪动研究院AI手艺专家,之后又投入人工智能这一新赛道,是我国为数不多的既通晓AI芯片又熟悉AI模子的手艺人员。锻炼大模子这一国之沉器的使命就落正在了王斌团队肩上。
王斌:我们的大模子的定位,不但是要可以或许写诗做画,除了可以或许识别保守的文本类和图片类学问,它还要能看得懂像这种雷达、这种射频信号。
有一位“AI工匠”王斌,他率领团队把握大规模国产智算集群,锻炼出了一套全系统自从可控的大模子,打制面向将来的大国沉器。
目前大模子曾经进入了通信、石油出产、农业种植、智能制制等良多范畴,正正在用聪慧赋能新质出产力。2025年1月,大模子被评为央企大国沉器。
中国挪动研究院人工智能核心高级总监 王斌:这是市最典型的一个笼盖居平易近区的基坐,雷同的基坐中国挪动曾经开通了686万台,这些基坐现实上每天会耗损大量的电力。
正在王斌团队的勤奋下,国产AI芯片正在万卡规模上的锻炼效率达到同代国际支流AI芯片程度,为后续国产芯片正在其他范畴更普遍的使用打下了根本。
中国挪动研究院人工智能核心高级工程师 丛鹏宇:王斌本来堆集的硬件学问,正在做大模子锻炼过程中,出格是排障过程中,其实阐扬了很主要的感化。有很高的手艺的前瞻性和手艺的性,可以或许指点大师从愈加普遍的角度、愈加有扶植性的角度来处理问题。
半年多,王斌率领团队对上万次大大小小的毛病逐一阐发,找到每一个毛病的底子缘由,归类拾掇,做出了一份毛病措置清单,把各类毛病的排查恢复时间从几天缩短到了十几分钟。
中国消息通信研究院人工智能研究所平台取工程化部副从任 董昊:大模子不只是我们自从手艺的一种冲破,同时也为我们国度大模子的使用落地供给了可复制可自创的成熟处理方案。
这个智算集群里的18000张芯片运转时,仿佛一个复杂的方阵,划一齐截,配合推进,只需有一张卡呈现问题,就会导致整个方阵紊乱,锻炼使命失败。正在锻炼了两个月的时候,这一庞大方阵就呈现了严沉毛病。王斌率领手艺扎入18000张卡的数字深海,一层层排查?。
王斌率领团队,收集了近500万亿字符的原始文本数据,几乎涵盖了人类有史以来全量的文本类学问,从中筛选出超10万亿字符的高质量锻炼数据集。让大模子记住这些学问不难,难的是怎样学会使用,这恰是王斌必需迈过的第一道。
王斌:正在我们这个行业,有个说法叫得开辟者得全国。像国际支流AI芯片,它的开辟者人数有好几百万,它会有良多优化的手段,这种优化手段会带来整个锻炼效率的提拔。我们现正在国内的AI芯片,它的开辟者人数可能都不到10万,可能里面还会有良多缺陷,只能说是一个坑一个坑去蹚,一个坎一个坎去迈。
王斌:大模子的布局跟我们人类的大脑布局是比力雷同的,像人类大脑也有差不多1000亿个神经元,可能分歧的神经元是担任分歧的使命。我们日常平凡做数学题用到的神经元,跟做语文题用到的神经元可能是纷歧样的。
王斌:这么大规模的资本,曾经施行了这么长时间使命,整个结果要清零是何等大的一个冲击。为领会决这个问题,我们必需有一个立即检测手艺。
大模子的18000张芯片要学会理解学问之间的逻辑关系,还要各有分工,相互联动,逐步变得伶俐起来,王斌率领团队给大模子设想进修学问的算法、节制进修历程、矫正大模子的价值不雅。然而,他却碰着了一个棘手的难题。
王斌:像一个千亿的大模子,我们要拆成18000份,每一个芯片正在锻炼它所担任那部门的时候,都要高效地从这些数据中把学问萃取出来。
关键词: