业界动态
商汤科技发布“日日新5o” 实时多模态流式交互对标GPT-4o,模型,推理,表情
2024-07-08 06:22:29
商汤科技发布“日日新5o” 实时多模态流式交互对标GPT-4o,模型,推理,表情

7月5日,在2024世界人工智能大会“大爱(ai)无疆·向新力(li)”人工智能论坛上,商汤科技发布国内首个所见即所得模型“日日新5o”,交互体验对标GPT-4o,实现全新AI交互模式。

通过整合跨模态信息,基于声音、文本、图像(xiang)和视频等多种形式,国内首个所见即所得模型“日日新5o”带来一种全新的AI交互模式,即实时(shi)的流式多模态交互。在现场,工作人员刚(gang)开始仅是和“日日新5o”打个招(zhao)呼,它(ta)就(jiu)自动识(shi)别出工作人员脖子佩戴的胸卡(ka)带子上的字眼,判断出现场就(jiu)是世界人工智能大会会场,并表示在这(zhe)个地方可以“好好学习(xi)”。

接下来工作人员拿了一只可爱(ai)小狗玩偶,“日日新5o”准(zhun)确描述了小狗的外貌、表情以及重要穿戴——一个带着印有商汤科技logo白帽子,很(hen)给(gei)主场人排面。

再(zai)上些难度,随便翻(fan)开一本书(shu)的任何一页,“日日新5o”都能自动介绍,不是简单的OCR识(shi)别文字,而是识(shi)别图文给(gei)出好理解(jie)的总结,这(zhe)一切在瞬间(jian)即可完成,真(zhen)正做到实时(shi)交互。

工作人员还现场发挥了“画(hua)功”,随手画(hua)了一只简笔(bi)画(hua)小兔子,“日日新5o”直呼画(hua)得可爱(ai),而后工作人员又画(hua)了一个微笑表情,它(ta)从这(zhe)个平静的表情中捕捉到了笑意,工作人员又改(gai)了一笔(bi)把嘴巴画(hua)大增添了舌头,“日日新5o”看到后立马说(shuo)道这(zhe)表情开心多了。

能听(ting)会看更会找话题,就(jiu)如同真(zhen)人聊天(tian)一般的交流对话,这(zhe)种交互模式特别适用于实时(shi)对话和语(yu)音识(shi)别等应用,其(qi)多任务适应性(xing)强,能够在同一模型中自然处理多种任务,且根(gen)据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验正是源于“日日新5.5”基础模型能力(li)的全面提升。

今年4月发布的“日日新5.0”是国内首个对标GPT-4 Turbo的国产大模型,短短两个多月时(shi)间(jian),全新“日日新5.5”体系迎来多项升级,综合性(xing)能较“日日新5.0”平均提升30%,在数学推理、英文能力(li)和指令跟随等能力(li)明(ming)显增强,交互效果和多项核心指标实现对标GPT-4o。

据介绍,“日日新5.5”采(cai)用混合端云协同专家架(jia)构,最大限(xian)度发挥云边端协同,降低推理成本,模型训练基于超过10TB tokens高质(zhi)量训练数据,包括大量合成的思维链数据,提升推理思维能力(li)。

商汤于近期推出了“大模型0元Go”计划。凡是“日日新”新注册用户,都可获(huo)得涉及调用、迁徙、训练等多项免费服务大礼包,同时(shi)商汤还将免费赠送5000万Tokens包,并且派出专属搬(ban)家顾问,帮助OpenAI用户实现零服务成本迁移。

文/北京青年报(bao)记者 温婧

编辑/田野

发布于:北京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7