业界动态
详细拆解“苹果智能”:苹果自研、GPT-4o还是谷歌Gemini?,模型,功能,siri
2024-07-09 01:49:46
详细拆解“苹果智能”:苹果自研、GPT-4o还是谷歌Gemini?,模型,功能,siri

在落后同行们近两年后,苹果终(zhong)于在本周WWDC大会发布AI功能。

“不拼AI技术,靠的是OpenAI大模型,AI功能没有新(xin)意......”以“重新(xin)定(ding)义AI”开启新(xin)征程的苹果似乎并没让大家(jia)满意,本次大会苹果也几乎并没有提“人(ren)工智能”,而称之(zhi)为“苹果智能”(Apple Intelligence)。

然(ran)而,资本市场却买单了,苹果周三扭转跌(die)势,一夜暴(bao)涨7%,市值攀升(sheng)2000亿(yi)美元。

那么是什么让市场扭转态度?所(suo)谓“苹果智能”到底意味着什么?苹果AI战略仅靠OpenAI?

贯穿苹果生态场景的AI

与大模型公司蜂拥推出独立(li)的聊天机器人(ren)不同,苹果做出的选择是,将AI功能整合到用户正在使用的APP和产品中(zhong),融入用户日常使用场景中(zhong)。

这样一来,苹果AI的功能远比独立(li)聊天机器人(ren)能做的要多,可以智能照片编辑、生成笔记和短信摘要、自动转录(lu)语音备忘录(lu)等等。

苹果利用自研内部模型实现较为简单的AI功能,依靠更为强(qiang)大的外部模型,如GPT来实现更高(gao)级、复杂(za)的AI功能。以全新(xin)siri、写作工具的演示(shi)为例:

全新(xin)Siri:苹果公司展示(shi)了如何用Siri帮(bang)忙填(tian)写PDF表格,Siri还能找到用户驾照的照片,提取驾照上的号码并输(shu)入表格。在另一个演示(shi)中(zhong),Siri可以在短信和邮件中(zhong)搜索朋友发送的食谱。

真(zhen)正让Siri功能得到提升(sheng)的是ChatGPT。当要求Siri做一些(xie)它不知道怎(zen)么做的事情时(shi),比如根据最(zui)近的购物清单安排出一顿晚餐菜(cai)谱,Siri就会在征求用户允(yun)许后,直接调(diao)用GPT接口,向(xiang)ChatGPT征询意见。用户不必(bi)是ChatGPT Plus的用户,就可以享受Siri这种(zhong)功能。

写作工具:苹果将为备忘录(lu)、邮件、Pages文稿等应用添加总结、改写和校对的AI功能,集成写作工具还可以针对短信和电(dian)子(zi)邮件提出回复建议和不同语气的回复。

但(dan)至于更有创意的功能,比如写一首关于iPhone的诗,将交(jiao)给ChatGPT来完成。同样的这个写作工具会先(xian)征求用户同意,然(ran)后才会去咨询ChatGPT。

全新(xin)Siri:苹果公司展示(shi)了如何用Siri帮(bang)忙填(tian)写PDF表格,Siri还能找到用户驾照的照片,提取驾照上的号码并输(shu)入表格。在另一个演示(shi)中(zhong),Siri可以在短信和邮件中(zhong)搜索朋友发送的食谱。

真(zhen)正让Siri功能得到提升(sheng)的是ChatGPT。当要求Siri做一些(xie)它不知道怎(zen)么做的事情时(shi),比如根据最(zui)近的购物清单安排出一顿晚餐菜(cai)谱,Siri就会在征求用户允(yun)许后,直接调(diao)用GPT接口,向(xiang)ChatGPT征询意见。用户不必(bi)是ChatGPT Plus的用户,就可以享受Siri这种(zhong)功能。

写作工具:苹果将为备忘录(lu)、邮件、Pages文稿等应用添加总结、改写和校对的AI功能,集成写作工具还可以针对短信和电(dian)子(zi)邮件提出回复建议和不同语气的回复。

但(dan)至于更有创意的功能,比如写一首关于iPhone的诗,将交(jiao)给ChatGPT来完成。同样的这个写作工具会先(xian)征求用户同意,然(ran)后才会去咨询ChatGPT。

苹果表示(shi),Apple Intelligence、iOS 18、iPadOS 18和MacOS Sequoia将在秋(qiu)季(ji)整合一系列AI功能,但(dan)一些(xie)更强(qiang)大的AI功能可能要到2025年才会亮相。

场景背后的三层(ceng)大模型架构

支撑以上场景功能背后的内部、外部模型,可以进一步细分为端侧(ce)小模型(Apple On-Device),自研云端模型(Apple Server),以及ChatGPT等外部大模型。

第一层(ceng)架构是苹果端侧(ce)小模型,其中(zhong)一个参数量为3B,可以直接在手机等终(zhong)端设备上运行。

此前文章指出,这其实是综(zong)合考虑了运行速度、算力需求的结果,大部分苹果端侧(ce)模型根据用户个人(ren)习惯(guan)和个人(ren)数据,针对不同的任务预先(xian)进行了训练,因此各种(zhong)需求响应速度也很快。

第二层(ceng)是苹果自研的更大语言模型,该模型通过私有云计算在苹果芯片服(fu)务器上运行。

性能方面(mian),有分析指出该模型虽然(ran)没有明(ming)确参数量,但(dan)其性能可以与GPT-4对标。在真(zhen)实世界提示(shi)评估中(zhong),大模型Apple Server性能强(qiang)于GPT-3.5-Turbo,略逊于GPT-4-Turbo,该模型也针对苹果用户的日常行为进行微调(diao)训练。

苹果强(qiang)调(diao)隐私是第一位,内部模型运行过程中(zhong)这些(xie)数据不会被保存(cun),不会被其他(ta)人(ren)获取。

此前文章提到过,这些(xie)服(fu)务器都内置使用Swift语言编写的安全工具,苹果AI“只发送完成任务所(suo)需的相关数据”到这些(xie)服(fu)务器,不会给予对设备上下文信息的完全访问权限。

第三层(ceng)架构就是和OpenAI合作,接入GPT大模型。

根据苹果演示(shi),当需要实现更复杂(za)AI功能,且在获得用户同意后,可以调(diao)用GPT接口。

而且可以确定(ding)的是,OpenAI可能不会是苹果唯一的外部合作伙伴。苹果负责软件工程的高(gao)级副(fu)总裁Craig Federighi表示(shi):

苹果计划以后让用户选择自己喜欢的大模型,其中(zhong)包括谷(gu)歌的Gemini等。

苹果计划以后让用户选择自己喜欢的大模型,其中(zhong)包括谷(gu)歌的Gemini等。

发布于:上海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7