业界动态
记者观察:大模型逐鹿下半场,超级应用仍未“敲门”,人工智能,时代,数字
2024-07-15 00:22:18
记者观察:大模型逐鹿下半场,超级应用仍未“敲门”,人工智能,时代,数字

中新经纬7月6日电 (常涛)以按(an)下应用加(jia)速键为标志(zhi),大模型竞争进入下半场。

在移动互联网时代(dai),App成为超级应用。在大模型时代(dai),会不会出现新的(de)超级应用?超级应用又可能是什么?这一问题,或许可以从2024世界人(ren)工智(zhi)能大会(下称大会)上找到答案。

中新经纬记者(zhe)在大会展览馆走访(fang)后发现,相比于去年(nian)观众们普遍关注(zhu)“大模型能干(gan)什么”,今年(nian)观众们对于大模型的(de)关注(zhu)也渐入“深水区(qu)”。“这个图生视频(pin)结果真不真?”“虚拟口语教(jiao)练以前也有,基于大模型做(zuo)的(de)有什么不一样?”他们在关心,大模型未来将以怎样的(de)形式(shi)影响他们的(de)生活。

类比于用户通过App享受移动互联网带来的(de)便利,各大模型厂商(shang)也在积极探索大模型时代(dai)“App”。

去年(nian),以ChatGPT、文心一言为代(dai)表(biao),大模型“内(nei)卷(juan)”的(de)主战场是图文问答,今年(nian)以来,大模型文、图生成视频(pin)受到关注(zhu)。

大会期间,快手(shou)视频(pin)生成大模型“可灵”展示了其(qi)图生视频(pin)的(de)能力。上传蒙娜(na)丽(li)莎图片后,记者(zhe)输(shu)入“蒙娜(na)丽(li)莎用手(shou)戴(dai)上眼镜”文字(zi)后,不久后就可生成5秒钟蒙娜(na)丽(li)莎戴(dai)眼镜的(de)视频(pin),让名画中的(de)人(ren)物活了起来。

7月6日,可灵AI网页端上线,可灵AI基础(chu)模型也迎来升级,推出更加(jia)清(qing)晰的(de)高画质版,以及(ji)首尾(wei)帧控制、镜头控制等全新编辑能力,同时,创作者(zhe)单次生成的(de)文生视频(pin)时长增加(jia)至10秒。

与(yu)人(ren)进行(xing)实(shi)时、准确交互,也是目前大模型在应用侧瞄准的(de)场景。

7月5日,商(shang)汤科技发布了所见(jian)即所得模型“日日新5o”,带来一种全新的(de)AI交互模式(shi),即实(shi)时的(de)流式(shi)多模态交互。

比如(ru)对着它随手(shou)画一只小兔子,“日日新5o”能很快识别“这是一只可爱的(de)兔子”,工作人(ren)员又画了一个微笑表(biao)情(qing),它从这个平静(jing)的(de)表(biao)情(qing)中捕捉到了笑意(yi),工作人(ren)员又改(gai)了一笔(bi)把(ba)嘴巴画大增添(tian)了舌头,“日日新5o”看到后立马说道“这表(biao)情(qing)开心多了”。

据商(shang)汤科技介绍,它就如(ru)同真人(ren)聊天一样在交流对话,这种交互模式(shi)特别适用于实(shi)时对话和语音识别等应用。

在大会展览馆,随处(chu)可见(jian)的(de)还有基于大模型的(de)各种数字(zi)人(ren),这也有可能是大模型时代(dai)的(de)超级应用。

腾讯展示了基于优图实(shi)验室自研算法打造的(de)有智(zhi)能、有形象(xiang)、可交互的(de)“数智(zhi)分身”,其(qi)中在医疗行(xing)业数智(zhi)人(ren)展台,腾讯把(ba)AI技术充分融入就诊全流程,在诊前为患者(zhe)提供(gong)智(zhi)能导诊、预问诊;在诊中模拟医生形象(xiang),提供(gong)实(shi)时交互,实(shi)现在线问诊;在诊后为患者(zhe)提供(gong)合理的(de)用药提醒和智(zhi)能随访(fang)。

今年(nian)“618”期间,京东发起了一场特殊的(de)“总裁数字(zi)人(ren)直播”活动,多位企业创始人(ren)或CEO通过京东云言犀化身数字(zi)人(ren)下场直播。

京东云言犀相关负责人(ren)在大会期间接受中新经纬采访(fang)时说,大模型的(de)颠覆(fu)性应用,不可能从通用大模型的(de)优化中产生,必然是技术进步与(yu)产业积累的(de)结合,数字(zi)人(ren)可能成为AI时代(dai)的(de)颠覆(fu)性产品。团队在京东“618”的(de)数字(zi)人(ren)直播中,发现观众接受程度很高:不仅已经跨(kua)过了“恐(kong)怖谷(gu)”效应,而且人(ren)均观看时长接近2分钟。这意(yi)味着大部分观众已普遍接受了数字(zi)人(ren)主播。

“618期间数字(zi)人(ren)直播时长超40万小时,观看人(ren)次超1亿、交互超500万次,这给(gei)了我(wo)们很大的(de)信心。”上述负责人(ren)说。

不过,在讨论(lun)大模型时代(dai)的(de)超级应用是什么时,也不要忽视硬件,硬件本身就是最直接的(de)应用。

大会期间,有些厂商(shang)也展示了一批装配(pei)了大模型的(de)硬件产品。例如(ru),联想AI PC中的(de)“天禧”个人(ren)大模型,是基于阿里通义千问等通用大模型打造;有道词(ci)典笔(bi)X7内(nei)置了子曰教(jiao)育(yu)大模型的(de)两大原生应用——虚拟人(ren)口语私教(jiao)Hi Echo和AI全科家庭教(jiao)师小P老师;小米旗下的(de)人(ren)工智(zhi)能助(zhu)手(shou)“小爱同学”与(yu)阿里云通义大模型展开合作,强化其(qi)在图片生成、图片理解等方面的(de)多模态 AI 生成能力,并(bing)在小米汽车、手(shou)机等多类设备(bei)落地。

在各厂商(shang)积极探索大模型时代(dai)的(de)超级应用可能是什么时,与(yu)会企业负责人(ren)也给(gei)出了一些前沿的(de)思考。

对于未来的(de)AI应用长啥样,百度创始人(ren)李彦宏最看好的(de)方向是智(zhi)能体,因为“开发最简单”。

李彦宏表(biao)示,随着基础(chu)模型的(de)日益强大,开发应用也越来越简单,其(qi)中,最简单的(de)就是智(zhi)能体,只要用“人(ren)话”把(ba)工作流说清(qing)楚,再配(pei)以专(zhuan)有知(zhi)识库,即可做(zuo)出一个很有价值的(de)智(zhi)能体,“比互联网时代(dai)制作一个网页还简单”。

李彦宏认为,医疗、教(jiao)育(yu)、金融、制造、交通、农业等各领域,未来都会依据自己的(de)场景和特有经验、规则(ze)、数据等,做(zuo)出各种智(zhi)能体,将会出现数百万量级的(de)智(zhi)能体,形成庞大生态。

蚂蚁集团董事(shi)长兼CEO井(jing)贤栋持相似观点。他认为,为了破解通用大模型落地严谨产业面临的(de)三个“能力短板”,即领域知(zhi)识相对缺乏、复杂决策难(nan)以胜(sheng)任、对话交互不等于有效协同,蚂蚁选择了构建专(zhuan)业智(zhi)能体生态的(de)路径,“从我(wo)们的(de)实(shi)践来看,专(zhuan)业智(zhi)能体是大模型落地严谨产业的(de)有效路径。”

井(jing)贤栋还指出,未来智(zhi)能化的(de)用户体验,一定不是只靠一个大模型,而是需要全行(xing)业深度协作,需要很多的(de)专(zhuan)业智(zhi)能体共同参与(yu)、各司其(qi)职。

对于智(zhi)能体,腾讯云副总裁、腾讯云智(zhi)能负责人(ren)、腾讯优图实(shi)验室负责人(ren)吴运声(sheng)表(biao)示,智(zhi)能体的(de)本质回归(gui)了大语言模型的(de)初衷——人(ren)类输(shu)入不精确的(de)自然语言,大模型能够用统一的(de)方式(shi)去应对,而智(zhi)能体提供(gong)的(de)正是端对端的(de)解决方法。吴运声(sheng)说:“这是一种可以解决广泛问题的(de)技术路线,所以业界对智(zhi)能体的(de)研究非常多。”

猎户星(xing)空董事(shi)长傅盛表(biao)示,人(ren)工智(zhi)能的(de)应用是核心,应用就是真正帮助(zhu)人(ren)们解决各种实(shi)际问题、以各种AI技术为底层的(de)App、硬件、软件。“只靠用户和大模型去聊天,并(bing)不能解决我(wo)们的(de)大多数问题,这就是为什么所有人(ren)都在谈应用。”

在7月5日举办的(de)腾讯论(lun)坛上,腾讯集团副总裁蒋杰在发言时表(biao)示,应用场景是未来大模型决战的(de)必然战场。但当前大模型的(de)落地主要集中在生产工具和提效方面,距(ju)离真正的(de)业务创新还有一定距(ju)离,缺少杀手(shou)级的(de)应用。

(更多报道线索,请联系本文作者(zhe)常涛:changtao@chinanews.com.cn

发布于:北京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7