业界动态
记者观察:大模型逐鹿下半场,超级应用仍未“敲门”,人工智能,时代,数字
2024-07-15 06:29:04
记者观察:大模型逐鹿下半场,超级应用仍未“敲门”,人工智能,时代,数字

中(zhong)新经纬7月6日电 (常涛)以按下应(ying)用加速键为标(biao)志,大模型竞争进入下半场。

在移动互联网时代,App成为超级应(ying)用。在大模型时代,会不会出(chu)现新的超级应(ying)用?超级应(ying)用又可(ke)能是什么?这(zhe)一问题,或许可(ke)以从2024世界人工智能大会(下称(cheng)大会)上找到答案。

中(zhong)新经纬记者在大会展览馆走访后(hou)发(fa)现,相(xiang)比(bi)于去年观众们普遍关(guan)注“大模型能干什么”,今年观众们对于大模型的关(guan)注也渐入“深水区”。“这(zhe)个图生视频结果真(zhen)不真(zhen)?”“虚(xu)拟口语教练以前也有,基(ji)于大模型做(zuo)的有什么不一样?”他(ta)们在关(guan)心,大模型未来将以怎(zen)样的形式影(ying)响他(ta)们的生活。

类比(bi)于用户通过App享受移动互联网带来的便利,各大模型厂商也在积(ji)极(ji)探索大模型时代“App”。

去年,以ChatGPT、文心一言为代表(biao),大模型“内(nei)卷(juan)”的主战场是图文问答,今年以来,大模型文、图生成视频受到关(guan)注。

大会期间,快手视频生成大模型“可(ke)灵”展示了其图生视频的能力。上传蒙娜丽莎(sha)图片后(hou),记者输入“蒙娜丽莎(sha)用手戴上眼镜(jing)”文字后(hou),不久后(hou)就(jiu)可(ke)生成5秒(miao)钟蒙娜丽莎(sha)戴眼镜(jing)的视频,让名(ming)画中(zhong)的人物活了起来。

7月6日,可(ke)灵AI网页端上线,可(ke)灵AI基(ji)础模型也迎(ying)来升级,推出(chu)更加清晰的高画质(zhi)版,以及(ji)首尾帧控(kong)制、镜(jing)头(tou)控(kong)制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至10秒(miao)。

与人进行实时、准确交(jiao)互,也是目(mu)前大模型在应(ying)用侧瞄准的场景(jing)。

7月5日,商汤科技发(fa)布了所见即所得模型“日日新5o”,带来一种全新的AI交(jiao)互模式,即实时的流式多模态交(jiao)互。

比(bi)如对着它随手画一只小(xiao)兔子,“日日新5o”能很快识别(bie)“这(zhe)是一只可(ke)爱的兔子”,工作人员又画了一个微笑表(biao)情,它从这(zhe)个平(ping)静(jing)的表(biao)情中(zhong)捕(bu)捉到了笑意,工作人员又改了一笔把嘴巴画大增添了舌头(tou),“日日新5o”看到后(hou)立马(ma)说道“这(zhe)表(biao)情开心多了”。

据(ju)商汤科技介绍,它就(jiu)如同真(zhen)人聊天一样在交(jiao)流对话,这(zhe)种交(jiao)互模式特别(bie)适用于实时对话和语音识别(bie)等应(ying)用。

在大会展览馆,随处可(ke)见的还(hai)有基(ji)于大模型的各种数字人,这(zhe)也有可(ke)能是大模型时代的超级应(ying)用。

腾讯展示了基(ji)于优图实验室(shi)自研算法打造的有智能、有形象、可(ke)交(jiao)互的“数智分身”,其中(zhong)在医疗(liao)行业数智人展台,腾讯把AI技术充分融入就(jiu)诊全流程(cheng),在诊前为患者提供(gong)智能导诊、预问诊;在诊中(zhong)模拟医生形象,提供(gong)实时交(jiao)互,实现在线问诊;在诊后(hou)为患者提供(gong)合理的用药提醒和智能随访。

今年“618”期间,京东发(fa)起了一场特殊的“总裁数字人直播”活动,多位企业创始人或CEO通过京东云言犀化身数字人下场直播。

京东云言犀相(xiang)关(guan)负责人在大会期间接受中(zhong)新经纬采访时说,大模型的颠覆性应(ying)用,不可(ke)能从通用大模型的优化中(zhong)产生,必然是技术进步(bu)与产业积(ji)累的结合,数字人可(ke)能成为AI时代的颠覆性产品。团队在京东“618”的数字人直播中(zhong),发(fa)现观众接受程(cheng)度(du)很高:不仅已经跨过了“恐怖谷”效应(ying),而且人均观看时长接近2分钟。这(zhe)意味着大部分观众已普遍接受了数字人主播。

“618期间数字人直播时长超40万小(xiao)时,观看人次超1亿、交(jiao)互超500万次,这(zhe)给了我(wo)们很大的信心。”上述负责人说。

不过,在讨论大模型时代的超级应(ying)用是什么时,也不要忽(hu)视硬件,硬件本(ben)身就(jiu)是最直接的应(ying)用。

大会期间,有些厂商也展示了一批装配(pei)了大模型的硬件产品。例如,联想AI PC中(zhong)的“天禧”个人大模型,是基(ji)于阿里通义千问等通用大模型打造;有道词典笔X7内(nei)置了子曰教育大模型的两大原生应(ying)用——虚(xu)拟人口语私教Hi Echo和AI全科家庭教师小(xiao)P老(lao)师;小(xiao)米旗(qi)下的人工智能助手“小(xiao)爱同学(xue)”与阿里云通义大模型展开合作,强(qiang)化其在图片生成、图片理解等方(fang)面的多模态 AI 生成能力,并在小(xiao)米汽车、手机等多类设备落地。

在各厂商积(ji)极(ji)探索大模型时代的超级应(ying)用可(ke)能是什么时,与会企业负责人也给出(chu)了一些前沿的思考。

对于未来的AI应(ying)用长啥样,百度(du)创始人李彦宏最看好的方(fang)向是智能体,因为“开发(fa)最简单”。

李彦宏表(biao)示,随着基(ji)础模型的日益强(qiang)大,开发(fa)应(ying)用也越来越简单,其中(zhong),最简单的就(jiu)是智能体,只要用“人话”把工作流说清楚(chu),再配(pei)以专(zhuan)有知识库(ku),即可(ke)做(zuo)出(chu)一个很有价值的智能体,“比(bi)互联网时代制作一个网页还(hai)简单”。

李彦宏认为,医疗(liao)、教育、金(jin)融、制造、交(jiao)通、农业等各领域,未来都会依据(ju)自己的场景(jing)和特有经验、规则、数据(ju)等,做(zuo)出(chu)各种智能体,将会出(chu)现数百万量级的智能体,形成庞大生态。

蚂蚁集团董事(shi)长兼CEO井贤栋持相(xiang)似观点。他(ta)认为,为了破解通用大模型落地严谨(jin)产业面临的三(san)个“能力短板(ban)”,即领域知识相(xiang)对缺乏、复杂决策(ce)难以胜任(ren)、对话交(jiao)互不等于有效协同,蚂蚁选择了构建专(zhuan)业智能体生态的路径,“从我(wo)们的实践来看,专(zhuan)业智能体是大模型落地严谨(jin)产业的有效路径。”

井贤栋还(hai)指出(chu),未来智能化的用户体验,一定不是只靠一个大模型,而是需要全行业深度(du)协作,需要很多的专(zhuan)业智能体共同参与、各司其职。

对于智能体,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室(shi)负责人吴运声表(biao)示,智能体的本(ben)质(zhi)回归了大语言模型的初衷——人类输入不精确的自然语言,大模型能够用统一的方(fang)式去应(ying)对,而智能体提供(gong)的正是端对端的解决方(fang)法。吴运声说:“这(zhe)是一种可(ke)以解决广泛问题的技术路线,所以业界对智能体的研究非常多。”

猎户星空董事(shi)长傅盛表(biao)示,人工智能的应(ying)用是核心,应(ying)用就(jiu)是真(zhen)正帮助人们解决各种实际问题、以各种AI技术为底层的App、硬件、软件。“只靠用户和大模型去聊天,并不能解决我(wo)们的大多数问题,这(zhe)就(jiu)是为什么所有人都在谈应(ying)用。”

在7月5日举办(ban)的腾讯论坛(tan)上,腾讯集团副总裁蒋杰在发(fa)言时表(biao)示,应(ying)用场景(jing)是未来大模型决战的必然战场。但当前大模型的落地主要集中(zhong)在生产工具和提效方(fang)面,距离真(zhen)正的业务创新还(hai)有一定距离,缺少(shao)杀手级的应(ying)用。

(更多报道线索,请联系本(ben)文作者常涛:changtao@chinanews.com.cn

发(fa)布于:北京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7