业界动态
商汤科技“日日新5o”发布,能听会看还会找话题,模型,人工智能,表情
2024-07-14 00:35:23
商汤科技“日日新5o”发布,能听会看还会找话题,模型,人工智能,表情

随便翻开一本书的任何一页,它都能自动介绍(shao),不是简单的文字识别,而是能够总结“文章大意”;给它一幅画,它“瞥”一眼就能言简意赅地介绍(shao)出图画的内容,还能根据(ju)图案细节(jie)猜测人物心情;当你(ni)和它面对面,它能根据(ju)你(ni)所处(chu)的场景(jing),推测出你(ni)大概在什么场合,还叮嘱你(ni)要“好(hao)好(hao)学习”……

是的,你(ni)并没(mei)有看错,“它”就是商汤科技7月(yue)5日发布的“日日新5o”——国内首个所见即所得模型。它通过整合跨模态信息,基(ji)于声音、文本、图像和视频等多种形式,带(dai)来一种全新的AI交互模式,即实时的流式多模态交互。交互体验对标(biao)GPT-4o。

作为2024世界人工(gong)智能大会暨人工(gong)智能全球治理高级别会议(WAIC 2024)战略合作伙伴,商汤科技召(zhao)开了“大爱无疆·向新力”人工(gong)智能论坛。现场,近千人共同见证这一创新交互模式——

工(gong)作人员刚开始仅是和“日日新5o”打个招呼,它就自动识别出工(gong)作人员佩戴的胸卡带(dai)子上的字,判(pan)断出现场就是世界人工(gong)智能大会会场,并表示在这个地方可以“好(hao)好(hao)学习”。

接下来工(gong)作人员拿了一只(zhi)可爱小狗玩偶,“日日新5o”准确(que)描述了小狗的外貌(mao)、表情以及穿戴——一顶印有商汤科技logo的白帽子,很给主场人排面。

再上些难度,随便翻开一本书的任何一页,“日日新5o”都能自动介绍(shao),不是简单的OCR识别文字,而是识别图文给出好(hao)理解的总结,这一切在瞬间即可完成,真正做到实时交互。

工(gong)作人员还现场发挥“画功”,随手(shou)画了一只(zhi)简笔画小兔子,“日日新5o”直呼画得可爱;而后工(gong)作人员又(you)画了一个微笑表情,“日日新5o”从这个平(ping)静的表情中捕捉(zhuo)到了笑意;工(gong)作人员又(you)改了一笔,把嘴(zui)巴画大增添了舌头,“日日新5o”看到后立马说(shuo)道(dao):“这表情开心多了。”

能听,会看,还会找话题(ti),和“日日新5o”的交互就如同和真人对话一般。这种交互模式特别适用于实时对话和语音识别等应(ying)用,其多任务适应(ying)性(xing)强,能够在同一模型中自然处(chu)理多种任务,且根据(ju)不同上下文自适应(ying)调整行为和输(shu)出。

商汤科技表示,能够实现对标(biao)GPT-4o的交互体验,正是源于“日日新5.5”基(ji)础模型能力的全面提升。7月(yue)5日,商汤科技正式发布“日日新5.5”大模型体系,在今(jin)年4月(yue)商汤科技发布的“日日新5.0”大模型基(ji)础上又(you)迎来多项升级,综(zong)合性(xing)能较“日日新5.0”平(ping)均提升30%,数学推理、英文能力和指(zhi)令跟随等能力明显增强,交互效果和多项核心指(zhi)标(biao)对标(biao)GPT-4o。

据(ju)了解,“日日新5.5”采(cai)用混合端云协同专家架构(gou),最大限度发挥云边端协同,降低推理成本,模型训练基(ji)于超过10TB tokens高质量训练数据(ju),包括大量合成的思维链数据(ju),提升推理思维能力。

为了让更多企业(ye)用户低门槛接入并使用“日日新”大模型体系的强大能力,商汤于近期推出了“大模型0元Go”计划。凡是“日日新”的新注册用户,都可获得涉及调用、迁(qian)徙、训练等多项免费服务大礼包。同时,商汤还将赠送5000万(wan)tokens包,并且派(pai)出专属搬家顾问,帮助OpenAI用户实现零服务成本迁(qian)移。

来源:上海徐汇

版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7