华体会-大模型怎么才叫“成了”?百度王海峰详解技术进阶—新闻—科学网

文|《中国科学报》记者 赵广立

11月12日,上海,百度世界年夜会2024的现场迎来了3位神秘佳宾——中国国度跳水队的奥运冠军全红婵、陈芋汐和曹缘。

他们是来分享百度人工智能(AI)手艺利用体验的。每一年的百度世界年夜会城市分享曩昔一年百度在手艺立异方面的最新功效。但本年仿佛有些分歧,年夜会主题很是光鲜,只有4个字“利用来了”。

这指确当然是年夜模子。用百度开创人李彦宏的话说,它代表了百度“对年夜模子和生成式AI当下的认知和判定”。

全红婵等国度队队员都谈到了一点:奥运赛场上的“水花销掉术”,背后有AI系统和年夜模子的一份功绩。

年夜模子怎样才叫“成了”?

早在2019年,百度就和中国国度跳水队展开手艺合作,研发智能跳水辅助练习系统,为活动员科学练习供给手艺支持。具体而言,针对活动员从起跳到入水的1.8秒,智能辅助练习系统采取云、边、端一体化手艺,主动辨认、跟踪、收集、阐发每个跳水动作,并及时反馈到锻练手中的“平板”上,进而对活动员的姿式、动作等进行针对性指点。

另外,基在文心年夜模子,系统还可以给动作及时打分、进行精准量化阐发、制定练习打算,并对活动员身体数据进行周全治理和科学评估,助力科学高效练习。

全红婵(右2)、陈芋汐(左2)、曹缘(右1)与王海峰同台分享。

这就是全红婵口中的“(百度AI)真是太周全了”。她在台上感伤:“‘巴黎周期’我长高、变重了,做动作的感受和之前纷歧样,这套系统可以多角度还原我的动作。每跳竣事后,锻练城市给我看,同时也能和之前的动作做对照,看看不同在哪里,帮我把动作完成得更好。”

百度与中国国度跳水队的手艺合作是当前年夜模子手艺利用落地的一个缩影。百度世界年夜会2024勾当设置在上海世博中间,《中国科学报》在现场看到,包罗各类智能体在内的上百个年夜模子财产利用,占满了跨越5000平方米的超年夜展区,笼盖金融、能源、教育、雇用、公共办事等各个范畴。

“以年夜模子为代表的AI手艺已深切千行百业,深切人们的工作、进修和糊口。”百度首席手艺官王海峰在现场表露,今朝文心年夜模子的日均挪用量已跨越15亿,文心一言的用户范围到达4.3亿。

本年4月,文心年夜模子的日均挪用量是2亿。半年多实现如许的增加,李彦宏称“超越预期”。

“年夜模子怎样叫‘成了’?当日均利用法式接口(API)挪用量一年涨10倍的时辰,我认为就是成了,申明大师都需要。”李彦宏说,挪用量涨幅如斯之年夜的背后,是文心年夜模子竭尽全力进级进化、降本提速的进程,更是紧贴需求、不竭发现问题并解决问题的进程。

《中国科学报》连系以往公然信息领会到,自客岁3月16日文心一言发布以来,百度文心年夜模子仅公然报导的进级次数就达5次。王海峰说,这时代,常识加强、检索加强和智能体等手艺不竭进化。

“幻觉消逝术”:检索加强手艺延续前进

手艺的前进,让一些问题变得不那末成问题。好比,年夜模子的“幻觉”问题。

“假如你问我,曩昔这24个月,对行业而言最年夜的转变是甚么,那我的回覆必然是——年夜模子根基消弭了幻觉,回覆问题的正确性年夜年夜晋升了。”李彦宏说,这让AI从“一本正经的乱说八道”变得可用、可托赖。

百度的“幻觉消逝术”是甚么?谜底是检索加强手艺的延续前进。王海峰介绍,在检索加强方面,百度研发了“理解-检索-生成”协同优化的检索加强手艺,晋升了年夜模子手艺和利用结果。

比拟文字幻觉,图片幻觉更加辣手。王海峰说,面向分歧利用场景的生图需求,百度进一步研发了检索加强的文生图手艺,既可以生成切确的图片,也能够进行泛化生图。

年夜模子是若何做到的?他注释说,年夜模子先基在用户的需求进行阐发理解,主动计划切确或泛化方案,好比需对哪些实体进行加强;接着在加强阶段,对需要加强的实体,检索并选择响应的参考图。比及了生成阶段,百度经由过程自研的多模可控生图年夜模子,一方面,经由过程局部留意力计较,在连结实体特点不变的环境下,实现图象的高泛化生成,好比按照牛顿的肖像,生成绘本气概的牛顿;另外一方面,经由过程整体留意力计较,进行高切确的图象生成,好比生成图中的汽车跟原图片完全一致。

“在现实利用中,这个方式撑持用户上传参考图,按用户期望进行生成。”王海峰说,通俗地讲,当采取了检索加强手艺后,年夜模子会操纵检索到的信息“指点”文本或图片等谜底的生成,从而年夜幅提高生成内容的质量和正确性。

多智能体协同:“智”多气力年夜

放眼望去,当前年夜模子利用的“集散地”是智能体。李彦宏提到,智能体是AI利用的最主流形态,“行将迎来它的爆发点”。

“智能体可能会酿成AI原生时期内容、信息和办事的新载体。”李彦宏说,这背后有两个缘由,一是在根本年夜模子不竭冲破的根本上,智能体的门坎愈来愈低;二是智能体的天花板足够高,可以做出功能壮大的利用。特殊是多个智能体的协作,可以解决很是复杂的问题。

王海峰介绍说,百度在客岁10月发布了智能体机制,并研制出可以或许靠得住履行、自我进化的“系统2”,其焦点是思虑模子,这使年夜模子可以或许像人一样思虑和步履,同时在情况中延续进修、自立进化。

正如“人多气力年夜”,智能体也需要“协作”以完成更复杂使命。王海峰以百度发布的“秒哒”和“文心快码”为例,介绍了多智能体在代码场景里的巧思妙用。

秒哒不是辅助代码生成东西,而是百度最新开辟的一款“不需要写代码就可以够实现肆意设法的软件”。在年夜会现场,李彦宏将秒哒的功能演示作为“压轴节目”,显现了若何借助它将“建造一个勾当约请系统”的设法,在几分钟以内变成实际的进程。

王海峰介绍说,秒哒采取了智能体的中间化模式,此中的代码智能体经由过程场景常识的加强,晋升了复杂代码生成的质量与不变性,高效实现用户需要的功能。好比在前述演示案例中,主智能体将使命拆解成需求肯定、内容出产、工程开辟3个步调,其他4个智能体别离饰演了筹谋、小编、法式员、质检员的脚色,协作完成主体使命。

一样,在“法式员的AI同侪”——文心快码的利用中,多智能体的流水线协同感化在功能开辟、代码测试和问题修复等环节,年夜幅提高法式员的工作质量和效力。

在手艺延续进级的布景下,年夜模子利用在财产的门坎逐步下降。

王海峰介绍,面向财产需求,百度打造了文心年夜模子矩阵,包罗ERNIE 4.0 Turbo等旗舰年夜模子、ERNIE Speed等轻量模子,和基在根本模子出产的系列思虑模子和场景模子,以知足分歧利用的需要。在这背后,文心年夜模子和飞桨深度进修平台的结合优化、延续立异,晋升了模子结果、练习效力和推理机能,支持了文心年夜模子的普遍利用。

截至今朝,飞桨文心开辟者数目已达1808万,办事了43万家企业,建立了101万个模子。在现场,百度还发布了AI人材培育的最新数据——已为社会培育了592万AI人材。

“相信大师很是关心根本年夜模子的进展。我可以很笃定地告知大师,文心年夜模子仍在延续练习中,敬请等候更壮大的新版本。”王海峰最后说。

特殊声明:本文转载仅仅是出在传布信息的需要,其实不意味着代表本网站不雅点或证实其内容的真实性;如其他媒体、网站或小我从本网站转载利用,须保存本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或联系转载稿费等事宜,请与我们联系。

上一篇:华体会-河北发布省科学技术奖行业评审相关准备工作的通知—新闻—科学网 下一篇:华体会-邬贺铨院士:“人工智能+6G”挑战很多,不宜乐观—新闻—科学网