业界动态
抢在ChatGPT前发布语言助手!法国实验室演示自带70种情绪AI,Kyutai,Moshi,OpenAI
2024-07-14 10:22:05
抢在ChatGPT前发布语言助手!法国实验室演示自带70种情绪AI,Kyutai,Moshi,OpenAI

本文作者:李丹

来源(yuan):硬AI

OpenAI被超越了,而且还是(shi)“栽在”已(yi)经公开演示过(guo)的语音助手上。

当地时间7月3日周三,法国(guo)独立非盈利AI研究实验室Kyutai公开演示了一款语音助理Moshi的实验性(xing)原型。Kyutai介绍,Moshi由该实验室的八人研究团队耗时六个月从零开始开发,是(shi)全球首款全体大众都可使用的实时生成式语音AI。

Moshi具有多种类似人类的情绪。Kyutai的科学家们表示,Moshi系(xi)统能够带着70种情绪和风格讲话(hua)。他们现场演示了,Moshi如(ru)何就攀登珠穆朗(lang)玛峰提供建议(yi),还让Moshi用浓重的法国(guo)口音朗(lang)诵一首它自己创作的诗歌。

Kyutai宣布,周二晚些时候可在其网站查(cha)看Moshi的交互式演示。从周二起(qi),就可以(yi)在线免费测试(shi)Moshi。Kyutai致力于为AI的开放(fang)研究和整个生态系(xi)统的发展做出贡(gong)献,Moshi模型的代码(ma)和权重将很快免费共享,这对于此(ci)类技术来说也是(shi)前所未(wei)有的。Kyutai的一名代表表示,Moshi模型和相(xiang)关(guan)研究将在未(wei)来几(ji)周内发布,没(mei)有透露具体日期(qi)。

Kyutai认为,Moshi有潜力彻底改变(bian)数字世(shi)界中语音的使用方(fang)式,并举例称,在表达情感和多种声音之间的互动方(fang)面,它的文本转语音功能非常出色。

Kyutai的CEO Patrick Pérez称,Moshi可以(yi)“边说话(hua)边思考”,还说“我们相(xiang)信 Moshi 具有巨大的潜力,可以(yi)改变(bian)我们与机器交流的方(fang)式。”

研究者Lucas Beyer在社交媒体发帖评论,Kyutai的Moshi是(shi)首个实时音频(pin)大语言模型(LLM)。Kyutai的演示种,Moshi基本上没(mei)有延迟,甚至还打断了演讲者几(ji)次。它实际上有点急于快速回答。而且Moshi是(shi)全部(bu)开源(yuan)的。虽然声音质量还有点机械化,但作为初版,它还是(shi)表现不错(cuo)。总体来说很酷。

Beyer指(zhi)出,演示时,在苹果电脑(nao)macbook设备上的模型有一些实时拒绝误报,也许Kyutai对安全调整有点太(tai)急切了。然而,这只是(shi)证实了演示确(que)实是(shi)实时的,甚至可能是(shi)自由发挥(hui)的,他喜欢这点。

有网友评论称,有趣的是(shi),看到日语单词以(yi)赛博朋克的方(fang)式融(rong)入西方(fang)文化。在日语中,Kyutai 的意思是(shi)球体,moshi 是(shi)电话(hua)里的口语问(wen)候语,所以(yi)这两者结合起(qi)来就是(shi)“你好球体”。

Moshi被视(shi)为ChatGPT的最新挑战(zhan)者。包括Anthropic、Cohere和谷(gu)歌在内,越来越多初创公司和科技巨头推出模型与GPT-4 竞争,尽管一些行业专家担心这项新兴技术带来危险。

Moshi的问(wen)世(shi)让Kyutai成为抢跑OpenAI推出语音助手的先锋(feng)。OpenAI之前打算在机器人聊天工具ChatGPT上提供类似功能,不到两个月前正式向公众展示了基于GPT-4升级版GPT-4o模型的语音助手。

在OpenAI今年5月中展示过(guo)程中,语言助手表现得像一个真正的成年人,能听能说能看,还能有情绪变(bian)化,最关(guan)键是(shi)几(ji)乎(hu)可以(yi)即时回应请求(qiu)。它不仅可以(yi)讲睡前故事,能通(tong)过(guo)外(wai)表观察人的情绪变(bian)化,还能像一位朋友般安抚人紧张(zhang)的情绪,甚至还可以(yi)像个经验丰富(fu)的数学老师(shi)般指(zhi)导解(jie)代数方(fang)程,让一些观众联想到了2013年电影《她》中的AI虚拟助手。

但一个多月后,OpenAI又宣布因安全顾虑推迟发布上述语音助手。6月25日上周二,OpenAI在社交媒体发帖称,推迟上线ChatGPT语音助手功能是(shi)因为,需要确(que)保(bao)它能安全有效地处理来自数百万用户的请求(qiu),还需要一个月才能达到公司的发布标(biao)准。

有网友本周二评论称,Kyutai推出Moshi基本上等于,把OpenAI还没(mei)公开发布的客户产品开源(yuan)了,向Kyutai致敬。

不同于微软150亿美元支(zhi)持的“美系(xi)”资本背景OpenAI,Kyutai致力于研究通(tong)用AI,去年11月“出生”起(qi)得到合计(ji)3亿欧元支(zhi)持,其中主要来自欧洲(zhou)实业资本。

Kyutai是(shi)法国(guo)亿万富(fu)翁Xavier Niel去年表示将对AI领域(yu)投资2亿欧元的投资对象之一。Niel旗下的电信集团Iliad去年公布,将为Kyutai项目投入1亿欧元。另一位法国(guo)亿万富(fu)翁、法国(guo)航运和物流巨头CMA CGM的CEO Rodolphe Saadé也对Kyutai投资了1亿欧元。前谷(gu)歌CEO Eric Schmidt也参与了Kyutai的投资,未(wei)披露金(jin)额。

Niel本周二表示,Moshi表明,欧洲(zhou)可以(yi)成为AI发展的全球参与者。Kyutai“今天展示的所有产品都是(shi)全球一流的,我们很高兴能在欧洲(zhou)推出这款产品。”

在安全方(fang)面,Kyutai的首席科学官 Hervé Jégou介绍,Kyutai将使用索引和水(shui)印工具识别和跟踪其 AI 生成的音频(pin)。

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7