记者观察：大模型逐鹿下半场，超级应用仍未“敲门”,人工智能,时代,数字20240715-业界动态-qdyuchuan.com

记者观察：大模型逐鹿下半场，超级应用仍未“敲门”,人工智能,时代,数字

2024-07-15 06:29:04

记者观察：大模型逐鹿下半场，超级应用仍未“敲门”,人工智能,时代,数字

中(zhong)新经纬7月6日电 (常涛)以按下应(ying)用加速键为标(biao)志，大模型竞争进入下半场。

在移动互联网时代，App成为超级应(ying)用。在大模型时代，会不会出(chu)现新的超级应(ying)用？超级应(ying)用又可(ke)能是什么？这(zhe)一问题，或许可(ke)以从2024世界人工智能大会(下称(cheng)大会)上找到答案。

中(zhong)新经纬记者在大会展览馆走访后(hou)发(fa)现，相(xiang)比(bi)于去年观众们普遍关(guan)注“大模型能干什么”，今年观众们对于大模型的关(guan)注也渐入“深水区”。“这(zhe)个图生视频结果真(zhen)不真(zhen)？”“虚(xu)拟口语教练以前也有，基(ji)于大模型做(zuo)的有什么不一样？”他(ta)们在关(guan)心，大模型未来将以怎(zen)样的形式影(ying)响他(ta)们的生活。

类比(bi)于用户通过App享受移动互联网带来的便利，各大模型厂商也在积(ji)极(ji)探索大模型时代“App”。

去年，以ChatGPT、文心一言为代表(biao)，大模型“内(nei)卷(juan)”的主战场是图文问答，今年以来，大模型文、图生成视频受到关(guan)注。

大会期间，快手视频生成大模型“可(ke)灵”展示了其图生视频的能力。上传蒙娜丽莎(sha)图片后(hou)，记者输入“蒙娜丽莎(sha)用手戴上眼镜(jing)”文字后(hou)，不久后(hou)就(jiu)可(ke)生成5秒(miao)钟蒙娜丽莎(sha)戴眼镜(jing)的视频，让名(ming)画中(zhong)的人物活了起来。

7月6日，可(ke)灵AI网页端上线，可(ke)灵AI基(ji)础模型也迎(ying)来升级，推出(chu)更加清晰的高画质(zhi)版，以及(ji)首尾帧控(kong)制、镜(jing)头(tou)控(kong)制等全新编辑能力，同时，创作者单次生成的文生视频时长增加至10秒(miao)。

与人进行实时、准确交(jiao)互，也是目(mu)前大模型在应(ying)用侧瞄准的场景(jing)。

7月5日，商汤科技发(fa)布了所见即所得模型“日日新5o”，带来一种全新的AI交(jiao)互模式，即实时的流式多模态交(jiao)互。

比(bi)如对着它随手画一只小(xiao)兔子，“日日新5o”能很快识别(bie)“这(zhe)是一只可(ke)爱的兔子”，工作人员又画了一个微笑表(biao)情，它从这(zhe)个平(ping)静(jing)的表(biao)情中(zhong)捕(bu)捉到了笑意，工作人员又改了一笔把嘴巴画大增添了舌头(tou)，“日日新5o”看到后(hou)立马(ma)说道“这(zhe)表(biao)情开心多了”。

据(ju)商汤科技介绍，它就(jiu)如同真(zhen)人聊天一样在交(jiao)流对话，这(zhe)种交(jiao)互模式特别(bie)适用于实时对话和语音识别(bie)等应(ying)用。

在大会展览馆，随处可(ke)见的还(hai)有基(ji)于大模型的各种数字人，这(zhe)也有可(ke)能是大模型时代的超级应(ying)用。

腾讯展示了基(ji)于优图实验室(shi)自研算法打造的有智能、有形象、可(ke)交(jiao)互的“数智分身”，其中(zhong)在医疗(liao)行业数智人展台，腾讯把AI技术充分融入就(jiu)诊全流程(cheng)，在诊前为患者提供(gong)智能导诊、预问诊；在诊中(zhong)模拟医生形象，提供(gong)实时交(jiao)互，实现在线问诊；在诊后(hou)为患者提供(gong)合理的用药提醒和智能随访。

今年“618”期间，京东发(fa)起了一场特殊的“总裁数字人直播”活动，多位企业创始人或CEO通过京东云言犀化身数字人下场直播。

京东云言犀相(xiang)关(guan)负责人在大会期间接受中(zhong)新经纬采访时说，大模型的颠覆性应(ying)用，不可(ke)能从通用大模型的优化中(zhong)产生，必然是技术进步(bu)与产业积(ji)累的结合，数字人可(ke)能成为AI时代的颠覆性产品。团队在京东“618”的数字人直播中(zhong)，发(fa)现观众接受程(cheng)度(du)很高：不仅已经跨过了“恐怖谷”效应(ying)，而且人均观看时长接近2分钟。这(zhe)意味着大部分观众已普遍接受了数字人主播。

“618期间数字人直播时长超40万小(xiao)时，观看人次超1亿、交(jiao)互超500万次，这(zhe)给了我(wo)们很大的信心。”上述负责人说。

不过，在讨论大模型时代的超级应(ying)用是什么时，也不要忽(hu)视硬件，硬件本(ben)身就(jiu)是最直接的应(ying)用。

大会期间，有些厂商也展示了一批装配(pei)了大模型的硬件产品。例如，联想AI PC中(zhong)的“天禧”个人大模型，是基(ji)于阿里通义千问等通用大模型打造；有道词典笔X7内(nei)置了子曰教育大模型的两大原生应(ying)用——虚(xu)拟人口语私教Hi Echo和AI全科家庭教师小(xiao)P老(lao)师；小(xiao)米旗(qi)下的人工智能助手“小(xiao)爱同学(xue)”与阿里云通义大模型展开合作，强(qiang)化其在图片生成、图片理解等方(fang)面的多模态 AI 生成能力，并在小(xiao)米汽车、手机等多类设备落地。

在各厂商积(ji)极(ji)探索大模型时代的超级应(ying)用可(ke)能是什么时，与会企业负责人也给出(chu)了一些前沿的思考。

对于未来的AI应(ying)用长啥样，百度(du)创始人李彦宏最看好的方(fang)向是智能体，因为“开发(fa)最简单”。

李彦宏表(biao)示，随着基(ji)础模型的日益强(qiang)大，开发(fa)应(ying)用也越来越简单，其中(zhong)，最简单的就(jiu)是智能体，只要用“人话”把工作流说清楚(chu)，再配(pei)以专(zhuan)有知识库(ku)，即可(ke)做(zuo)出(chu)一个很有价值的智能体，“比(bi)互联网时代制作一个网页还(hai)简单”。

李彦宏认为，医疗(liao)、教育、金(jin)融、制造、交(jiao)通、农业等各领域，未来都会依据(ju)自己的场景(jing)和特有经验、规则、数据(ju)等，做(zuo)出(chu)各种智能体，将会出(chu)现数百万量级的智能体，形成庞大生态。

蚂蚁集团董事(shi)长兼CEO井贤栋持相(xiang)似观点。他(ta)认为，为了破解通用大模型落地严谨(jin)产业面临的三(san)个“能力短板(ban)”，即领域知识相(xiang)对缺乏、复杂决策(ce)难以胜任(ren)、对话交(jiao)互不等于有效协同，蚂蚁选择了构建专(zhuan)业智能体生态的路径，“从我(wo)们的实践来看，专(zhuan)业智能体是大模型落地严谨(jin)产业的有效路径。”

井贤栋还(hai)指出(chu)，未来智能化的用户体验，一定不是只靠一个大模型，而是需要全行业深度(du)协作，需要很多的专(zhuan)业智能体共同参与、各司其职。

对于智能体，腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室(shi)负责人吴运声表(biao)示，智能体的本(ben)质(zhi)回归了大语言模型的初衷——人类输入不精确的自然语言，大模型能够用统一的方(fang)式去应(ying)对，而智能体提供(gong)的正是端对端的解决方(fang)法。吴运声说：“这(zhe)是一种可(ke)以解决广泛问题的技术路线，所以业界对智能体的研究非常多。”

猎户星空董事(shi)长傅盛表(biao)示，人工智能的应(ying)用是核心，应(ying)用就(jiu)是真(zhen)正帮助人们解决各种实际问题、以各种AI技术为底层的App、硬件、软件。“只靠用户和大模型去聊天，并不能解决我(wo)们的大多数问题，这(zhe)就(jiu)是为什么所有人都在谈应(ying)用。”

在7月5日举办(ban)的腾讯论坛(tan)上，腾讯集团副总裁蒋杰在发(fa)言时表(biao)示，应(ying)用场景(jing)是未来大模型决战的必然战场。但当前大模型的落地主要集中(zhong)在生产工具和提效方(fang)面，距离真(zhen)正的业务创新还(hai)有一定距离，缺少(shao)杀手级的应(ying)用。

(更多报道线索，请联系本(ben)文作者常涛：changtao@chinanews.com.cn

发(fa)布于：北京市

版权号:18172771662813

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多