业界动态
李彦宏:没有应用,AI模型一文不值,闭源,人工智能,基础
2024-07-09 12:26:26
李彦宏:没有应用,AI模型一文不值,闭源,人工智能,基础

7月4日周四,2024年世界人工智能大会(hui)(WAIC 2024)在上(shang)海(hai)正式(shi)开幕。本届大会(hui)以“以共商促共享,以善治促善智”为主(zhu)题(ti),将将聚(ju)焦全球人工智能领域的前沿技(ji)术(shu)和创新应用,致力于展示人工智能如何改变世界、塑造未来。

下午(wu)13:30开始的产业发展主(zhu)论坛上(shang),百度创始人、董(dong)事长兼CEO李彦宏出席发表主(zhu)题(ti)演讲。本文整(zheng)理出核心观点如下:

1、同(tong)样(yang)参数规模之下,闭源(yuan)模型(xing)的能力比开源(yuan)模型(xing)要更好。当你处在一(yi)个激(ji)烈竞争的市场环(huan)境当中的时候,你需要使(shi)让自(zi)己的业务的效率比你的同(tong)行更高、成(cheng)本比你的同(tong)行更低,这(zhe)个时候,商业化的闭源(yuan)模型(xing)是最能打的。

2、没有应用,光有一(yi)个基础(chu)模型(xing),不管是开源(yuan)还是闭源(yuan),一(yi)文不值。所以我(wo)从去年下半年开始讲,大家不要卷模型(xing)了,要去卷应用。

3、文心大模型(xing)的日调(diao)用量最近超过了5亿(yi),代表了真实的需求,说明有人在用、是有人真的从大模型(xing)当中获(huo)益了,并得到了价(jia)值。

4、超级能干的应用比只看DAU的超级应用恐怕要更重要,只要对产业、对应用场景能产生大的增益,整(zheng)体的价(jia)值就比移动互联网要大多(duo)了。

5、随着基础(chu)模型(xing)的日益强大,开发应用也越来越简单了,最简单的就是智能体,这(zhe)也是我(wo)们最看好的AI应用的发展方向。

6、AI不是人类的竞争对手,更多(duo)的是在扮演副驾的角色,还要人来把关。目前,AI已经创造了一(yi)些全新的工作机会(hui)。

以下是李彦宏演讲的主(zhu)要内容:

各位下午(wu)好,非常高兴再次来到上(shang)海(hai)参加世界人工智能大会(hui)。我(wo)是这(zhe)个会(hui)议的常客,但是去年因(yin)为出国没有来,所以我(wo)上(shang)一(yi)次来参加WAIC是2022年,我(wo)记得当时大会(hui)的主(zhu)题(ti)是元宇宙,我(wo)当时讲的主(zhu)题(ti)是AIGC, 就是AI Generated Content(生成(cheng)式(shi)人工智能),我(wo)认为AI的技(ji)术(shu)发展路线(xian)发生了方向性的改变,就是从过去的辨别式(shi)人工智能转向了未来的生成(cheng)式(shi)人工智能。

这(zhe)番话当时发表于2022年的夏天,五个月之后,大家都知(zhi)道,ChatGPT发布(bu)了。

后来的事情(qing)大家就更清楚,所以两年的时间其实恍若隔(ge)世,就是感觉整(zheng)个世界都变了,人工智能可以说颠覆了绝大多(duo)数人的认知(zhi)。

商业化的闭源(yuan)模型(xing)“最能打”

2023年国内出现了百魔大战(zhan),造成(cheng)了社会(hui)资源(yuan)的巨大浪费,尤(you)其是算力的浪费,但是也使(shi)得我(wo)们追(zhui)赶世界上(shang)最先进的基础(chu)模型(xing)的能力得到了建立。去年10月我(wo)宣布(bu)文心4.0发布(bu)的时候,我(wo)说文心4.0的能力跟GPT-4相比毫不逊色,好多(duo)的同(tong)行还不以为然。

今天大家可以看到,国内已经有多(duo)款(kuan)闭源(yuan)模型(xing)声称他们已经追(zhui)平或者是超越了GPT-4的水(shui)平。注意,我(wo)这(zhe)里说的是闭源(yuan)大模型(xing),不是开源(yuan)大模型(xing)。

这(zhe)也是今年以来就是争议比较多(duo)的一(yi)个话题(ti),有些个外行甚至混淆了模型(xing)开源(yuan)和代码开源(yuan)这(zhe)两个概念。模型(xing)开源(yuan)你拿(na)到的是一(yi)大堆的参数,你还是要去做SFT,还是要去做安全对齐,你不知(zhi)道这(zhe)些参数是怎么来的,你是无(wu)法做到“众人拾柴火焰高”的,即使(shi)你拿(na)到对应的源(yuan)代码,你也不知(zhi)道他用了多(duo)少数据,用了什么比例的数据去训练这(zhe)些个参数,所以拿(na)到这(zhe)些东(dong)西(xi)并不能够让你站在巨人的肩膀上(shang)去迭代和开发。

所以同(tong)样(yang)参数规模之下,闭源(yuan)模型(xing)的能力就比开源(yuan)模型(xing)要更好。而(er)如果开源(yuan)想(xiang)要能力追(zhui)平闭源(yuan),那么它就需要有更大的参数,这(zhe)就意味着推理成(cheng)本会(hui)更高,反(fan)应速度会(hui)更慢(man)。

很多(duo)人拿(na)开源(yuan)模型(xing)来改款(kuan),以为这(zhe)样(yang)可以更好地服务自(zi)己的个性化的应用,殊不知(zhi)这(zhe)样(yang)你就创造了一(yi)个孤本的模型(xing),既无(wu)法从基础(chu)模型(xing)的持(chi)续升级当中获(huo)益,也没办法跟别人去共享算力。

当然我(wo)也承认开源(yuan)模型(xing)在某些场景下是有它的价(jia)值的,比如说一(yi)些学术(shu)研究(jiu),或者说在教(jiao)学领域,大家想(xiang)要研究(jiu)大模型(xing)的工作机制形成(cheng)理论,这(zhe)个时候可能是有价(jia)值的。

因(yin)为大家可能也经常听到,就是我(wo)们觉得大模型(xing)能力很强,但是不知(zhi)道为什么能力强,因(yin)为背(bei)后没有理论来支持(chi)他,所以研究(jiu)领域用开源(yuan)的我(wo)觉得没问题(ti),但是大多(duo)数的应用场景开源(yuan)模型(xing)并不合(he)适。

当你处在一(yi)个激(ji)烈竞争的市场环(huan)境当中的时候,你需要使(shi)让自(zi)己的业务的效率比你的同(tong)行更高、成(cheng)本比你的同(tong)行更低,这(zhe)个时候,商业化的闭源(yuan)模型(xing)那是最能打的。

没有应用,AI模型(xing)一(yi)文不值

当然这(zhe)些都不是最重要的,没有应用,光有一(yi)个基础(chu)模型(xing),不管是开源(yuan)还是闭源(yuan),一(yi)文不值。所以我(wo)从去年下半年开始讲,大家不要卷模型(xing)了,要去卷应用。

但是我(wo)看到我(wo)们的媒体仍然是把主(zhu)要的关注点放(fang)在了基础(chu)模型(xing)身上(shang),一(yi)天到晚到处去关注跑分、刷榜,谁又超越GPT-4了?OpenAI又出来GPT-4o了等等,今天这(zhe)个震撼发布(bu),明天那个史诗级更新,但是我(wo)要问:应用在哪里?谁从中获(huo)益了?

应用其实离我(wo)们并不遥远,基于基础(chu)模型(xing)的应用在各行各业各个领域都已经开始了逐步的渗透。

两个多(duo)月前,我(wo)们宣布(bu)文心大模型(xing)的日调(diao)用量超过了2亿(yi),最近又超过了5亿(yi)。其实仅(jin)仅(jin)是两个多(duo)月的时间,调(diao)用量发生了这(zhe)么大的变化,它背(bei)后是代表了真实的需求,是有人在用、是有人真的从大模型(xing)当中获(huo)益了,得到了价(jia)值。

比如在快递(di)领域,让大模型(xing)帮助处理订单,做到了一(yi)张图、一(yi)句话,寄(ji)快递(di)不再需要其他的繁(fan)琐流(liu)程,时间从3分多(duo)钟缩短到19秒,而(er)且90%以上(shang)的售后问题(ti)也都是由大模型(xing)来解决,效率提升非常的明显。

再比如在小说的创作领域,一(yi)开始我(wo)们用开源(yuan)模型(xing)做出过一(yi)些效果,后来改用文心的轻(qing)量级模型(xing),经过10轮(lun)上(shang)万组数据的SFT和Post-pretraining(后期预训练),结果有了明显的提升。

最近,我(wo)们又转到文心4.0的版本,那么仅(jin)用了数百条(tiao)的数据,生成(cheng)的内容无(wu)论是可用率还是优(you)质率,都大大超过了文心的轻(qing)量级模型(xing)。网文作者们如虎添翼。

超级能干的应用比只看DAU的超级应用更重要

其实更通用的领域,比如说代码生成(cheng)功能,文心、快马这(zhe)样(yang)的软件在各个领域也在逐步地渗透。

百度内部的话,我(wo)们有30%左右的代码已经是用AI生成(cheng)的,代码的采用率超过了44%。

不过我(wo)们要避免掉入(ru)超级应用陷阱,觉得一(yi)定要出一(yi)个日活(huo)用户10亿(yi)的APP才叫成(cheng)功。我(wo)认为这(zhe)是移动时代的思维,AI时代的规律很可能不是这(zhe)样(yang)。超级能干的应用比只看DAU的超级应用恐怕要更重要,只要对产业、对应用场景能产生大的增益,整(zheng)体的价(jia)值就比移动互联网要大多(duo)了。

看好智能体的应用发展方向

随着基础(chu)模型(xing)的日益强大,开发应用也越来越简单了,最简单的就是智能体,这(zhe)也是我(wo)们最看好的AI应用的发展方向。

制作一(yi)个好的智能体通常并不需要编码,只要用人话,把这(zhe)个智能体的工作流(liu)说清楚,再配上(shang)专(zhuan)有的知(zhi)识库,一(yi)般就是一(yi)个很有价(jia)值的智能体了,这(zhe)比互联网时代制作一(yi)个网页还要简单。

未来,在医疗、金融、教(jiao)育、制造、交通、农业等等领域,都会(hui)依据自(zi)己的场景,自(zi)己特有的经验(yan)、规则、数据等等做出各种各样(yang)的智能体,将来会(hui)有数以百万量级的智能体出现,形成(cheng)庞大的智能体生态。

而(er)搜(sou)索(suo)是智能体分发的最大的入(ru)口。刚刚过去的高考季(ji),很多(duo)大模型(xing)公司热衷于去写(xie)高考作文:我(wo)用AI写(xie)一(yi)个作文能得多(duo)少分儿?其实这(zhe)个实用价(jia)值是不大的,人家不会(hui)允许你带(dai)一(yi)个大模型(xing)进去参加高考。

真正的需求是大量的考生在考完之后要报志愿,要选择学校、选择专(zhuan)业。他们对一(yi)所大学一(yi)个专(zhuan)业会(hui)有各种各样(yang)的问题(ti),而(er)每一(yi)个考生的情(qing)况又是不一(yi)样(yang)的。这(zhe)个时候就是需要有一(yi)个智能体来回答每一(yi)个考生专(zhuan)有的问题(ti)。

在高峰时期,百度的高考智能体每天要回答超过200万个考生的问题(ti),而(er)我(wo)们总共只有1000万的考生。在一(yi)天当中,有这(zhe)么大比例的人在利用这(zhe)个智能体,说明AI正在以前所未有的速度向各行各业渗透。

AI只是辅(fu)助,相关工作机会(hui)正大量诞生

很多(duo)人担心,如果我(wo)们日常的工作都让AI去做了,人是不是就没有工作机会(hui)了?

这(zhe)种担心不是没有道理,但是过去这(zhe)段时间,我(wo)听到的担心、听到的抱怨很多(duo),听到的建设(she)性的意见比较少,很少有人去致力于发掘生成(cheng)式(shi)AI带(dai)来的新的工作机会(hui),我(wo)在这(zhe)儿算是抛砖(zhuan)引(yin)玉吧(ba)。

我(wo)觉得,一(yi)方面AI更多(duo)的是在扮演副驾的角色,还要人来把关,AI只是辅(fu)助人工作,而(er)不是替代人工作,它让人的工作效率更高,质量更好。另外一(yi)方面,我(wo)们也看到有一(yi)些全新的工作机会(hui)开始冒出来了。

比如数据标注师,过去几年我(wo)们帮助全国20多(duo)个城市落地了数据标注中心,提供了大量的新的就业岗位;再比如提示词工程师,以后不用编程了,但是做好一(yi)个智能体还需要把工作流(liu)说清楚,这(zhe)里头要有很强的逻辑性,要用提示词对模型(xing)进行调(diao)校。

随着智能体的大量涌(yong)现,这(zhe)种工作需求也会(hui)飙升。这(zhe)些个工作机会(hui)通常门槛并不高,你做的一(yi)般也能够养家活(huo)口,做得好的话,那上(shang)限可以年薪百万。

自(zi)人类文明诞生以来,永不停止(zhi)的创新,就是刻在我(wo)们DNA当中的,从石器时代的手斧,到移动时代的手机,再到AI时代的大模型(xing),人类不断创造各种工具来改善生活(huo)、提高生产力,但是它们永远只是工具,只有在被人类所使(shi)用的时候才有价(jia)值。

我(wo)们坚定地相信(xin)AI不是人类的竞争对手,构建和应用人工智能技(ji)术(shu)是为了满(man)足人的需求,增强人的能力,让人类的生活(huo)更美好。谢谢。

发布(bu)于:上(shang)海(hai)市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7