业界动态
蚂蚁发起“隐私革命”,数据,应用,技术
2024-07-17 15:33:50
蚂蚁发起“隐私革命”,数据,应用,技术

AI加快了整个(ge)行业迈向数据密态时代。

7月5日,在2024年世界人(ren)工智能大会(hui)上(shang),蚂蚁(yi)集(ji)团推出了蚂蚁(yi)密算(suan)公司的第一款产品——“隐语(yu)Cloud”大模(mo)型密算(suan)平台(tai)。

据蚂蚁(yi)密算(suan)CEO王(wang)磊介绍,“隐语(yu)Cloud”大模(mo)型密算(suan)平台(tai)主要提供两个(ge)能力,分别(bie)为大模(mo)型密态托管和大模(mo)型密态推理。

密态托管主要是解决大模(mo)型本身(shen)IP保护的问题,当大模(mo)型在云上(shang)部署的时候,大模(mo)型会(hui)被加工成密态的,确(que)保模(mo)型IP不会(hui)被别(bie)人(ren)偷去。大模(mo)型密态推理主要解决的是访问信息的保护,访问信息在整个(ge)的推理过程中都是密态的。

当下,高质量数据供给和安全流通,成为大模(mo)型进入垂直产业应(ying)用的首要挑战。大模(mo)型在垂直行业应(ying)用时,许多企业通过私有化部署来应(ying)对数据安全挑战,这不仅增加企业的运(yun)维和服务成本,也影响(xiang)对外服务的效率和质量。

专业数据通常分布(bu)在不同机(ji)构和企业,因其高价值和保密性而难以(yi)共享。同时,企业、大模(mo)型厂商(shang)和用户之间存在信任障碍:企业担心数据泄露,厂商(shang)担心模(mo)型资产安全,用户则担心个(ge)人(ren)隐私风险。

王(wang)磊透露,隐语(yu)Cloud平台(tai)将提供全链路数据安全服务,覆盖大模(mo)型从构建到服务的全过程。平台(tai)将为大模(mo)型的预训(xun)练、微调、评(ping)测、推理和用户交互提供密态计算(suan),确(que)保数据在提供方(fang)、使用方(fang)之间的安全流转。此外,平台(tai)还(hai)将提供包括密态检索、提示词和流程编(bian)排在内的全链路开发工具。

蚂蚁(yi)集(ji)团副总裁兼首席技术安全官、蚂蚁(yi)密算(suan)董事(shi)长韦韬认为,数据供给决定了大模(mo)型应(ying)用能力的上(shang)限,而隐私计算(suan)技术决定了数据跨域供给的上(shang)限。当大模(mo)型从通用走向专业应(ying)用,从技术想(xiang)象力走向产业的生产力,必须要解决高质量数据集(ji)稀(xi)缺与专业数据阻滞的挑战,否则大模(mo)型作为“智力引擎”,只会(hui)陷入空转。

5月底(di),蚂蚁(yi)集(ji)团宣布(bu)了以(yi)AI和数据技术为核心的科(ke)技战略(lue),并成立了浙江蚂蚁(yi)密算(suan)科(ke)技有限公司,将提供密算(suan)相关的产品和服务,包括一套端到端的数据安全保障、一套软硬(ying)件(jian)结合的计算(suan)加速解决方(fang)案和一个(ge)隐私计算(suan)云服务平台(tai),推动数据安全可(ke)信的跨云跨端低成本流通。

以(yi)下是华尔街见闻与蚂蚁(yi)集(ji)团副总裁兼首席技术安全官、蚂蚁(yi)密算(suan)董事(shi)长韦韬和蚂蚁(yi)密算(suan)CEO王(wang)磊的对话实(shi)录(经(jing)编(bian)辑):

提问:如何看(kan)待成本、安全和性能之间的关系?

王(wang)磊:安全一定是有成本的,这本质上(shang)包含(han)两个(ge)方(fang)面(mian):首先,从商(shang)业视角看(kan),隐私计算(suan)技术带来的安全收益是否足够抵(di)消成本。例如,在数据泄露事(shi)件(jian)中,我们观察到的损失动辄数百万美元,因此,如果安全措施的成本低于潜(qian)在损失,那么这些措施就是可(ke)接受的。其次(ci),从技术角度出发,随着(zhe)技术的不断迭代,相关成本将逐步降低。此外,隐私计算(suan)产品需(xu)要根据安全需(xu)求进行分级,对于价值不是非常高的数据,不必采用高成本的安全防护措施。在对数据进行安全分级的基础(chu)上(shang),技术措施也应(ying)相应(ying)分级。当数据的价值与其安全措施的成本相匹配时,这样的安全策略(lue)才是最经(jing)济、最合理的。

提问:如何理解在加入密态计算(suan)流程后,服务成本反而降低的情况?此外,加入密态计算(suan)似乎(hu)增加了一个(ge)步骤,这将如何影响(xiang)整个(ge)数据流通的效率,是提高还(hai)是降低?

韦韬:单(dan)纯看(kan)技术链路肯(ken)定是成本更高,但从整个(ge)全链路来看(kan),综(zong)合考虑人(ren)为因素(su)、技术因素(su)和合规因素(su)等,实(shi)际上(shang)总成本是更低的。明文计算(suan)虽然在初期看(kan)似简单(dan),但一旦发生数据泄露,将会(hui)带来巨大的损失,包括商(shang)业利益的损失和法律风险等。密态计算(suan)的研发将引发一场变革。目前,许多数据源方(fang)由于担心数据泄露,不敢轻易共享数据。密态计算(suan)技术能够使这些原本无法流通的数据得以(yi)安全流通,从而充(chong)分发挥(hui)数据的价值。

提问:随着(zhe)大模(mo)型的问世,人(ren)们普遍(bian)关注算(suan)力速度和价格这两个(ge)问题。近两年,许多独立的隐私计算(suan)厂商(shang)发现生意越发难做。在我们的策略(lue)或方(fang)法中,当应(ying)用到具体(ti)的业务场景时,客户通常在哪些方(fang)面(mian)会(hui)采用密态计算(suan)?

韦韬:在过去两年中,隐私计算(suan)行业进行了大量尝试,主要处于所谓(wei)的"桶装水"阶段,实(shi)现了点对点的连接。PSI(隐私计算(suan)求交)是目前应(ying)用最广(guang)泛的技术之一,它允许两个(ge)机(ji)构在保护各自用户隐私的前提下,进行用户群(qun)体(ti)的交集(ji)计算(suan)。虽然这种技术在验证单(dan)个(ge)环节方(fang)面(mian)表现良好,但其应(ying)用范围相对有限,尚未实(shi)现数据流转的全链路保护。

在整个(ge)研发过程中,数据源方(fang)对于数据泄露的担忧仍然很大,这一问题尚未得到有效解决。当前的技术应(ying)用在深度和广(guang)度上(shang)都还(hai)不够。如果将"桶装水"阶段的技术扩展到大规模(mo)应(ying)用,成本将会(hui)非常高,而且整个(ge)流程缺乏一致性的保障,风险也未能得到有效控制。

王(wang)磊:隐私计算(suan)商(shang)业化之所以(yi)不再那么热(re)门,主要有以(yi)下两个(ge)原因:首先,隐私计算(suan)技术目前主要适用于小规模(mo)应(ying)用,且成本高昂,难以(yi)实(shi)现规模(mo)化,这导致了成本难以(yi)降低。只有扩大规模(mo),成本才有望降低。其次(ci),传统的商(shang)业模(mo)式主要是销(xiao)售软件(jian),这种高成本的交付模(mo)式并不利于隐私计算(suan)技术的应(ying)用和推广(guang)。隐私计算(suan)的最终目标(biao)是促进数据的安全流通。

我们成立新公司后,也在深入思考这个(ge)问题。一方(fang)面(mian),我们计划采用云化模(mo)式,包括即将推出的隐语(yu)Cloud等系列产品。我们认为,只有通过云服务,数据才能真正实(shi)现大规模(mo)流通,并应(ying)用于更复(fu)杂(za)的场景,从而实(shi)现规模(mo)化并降低成本。同时,我们也将在端侧推出相关产品,实(shi)现端云协同。

另一方(fang)面(mian),我们希望建立一种对结果负责的商(shang)业模(mo)式。这意味着(zhe)在数据流通的整个(ge)过程中,我们能够确(que)保数据安全,从全链路的角度降低成本和法律风险。我们希望在这个(ge)过程中持续获得收益,因为数据价值得到了保障,从而从数据价值中获得利润。

我们希望引入保险公司,它能够起到两个(ge)作用:一是作为独立第三方(fang),在事(shi)前对产品安全性进行评(ping)估,提供数据安全保险;二是在发生不可(ke)预见的黑天(tian)鹅事(shi)件(jian)时,提供事(shi)后保障。通过这个(ge)方(fang)式推动整个(ge)的产业良性地运(yun)作起来。这样的机(ji)制将促进整个(ge)产业的良性运(yun)作。只有商(shang)业模(mo)式健(jian)康(kang)运(yun)转,技术创新和迭代才能持续健(jian)康(kang)发展。

提问:在过去几年中,市场上(shang)普遍(bian)认同了隐私计算(suan)技术的重要性,但在技术层(ceng)面(mian),对其是否为一项必不可(ke)少的技术存在分歧。一些专家(jia)指出,尽管隐私计算(suan)的成本较高,但可(ke)能存在性价比更高的替代技术。隐私计算(suan)要获得市场机(ji)构的广(guang)泛认可(ke),是否真的存在迫切(qie)的需(xu)求?它还(hai)需(xu)要克服哪些障碍?

韦韬:隐私计算(suan)技术的发展轨迹与光伏产业颇(po)为相似。光伏技术刚推出时成本高昂,不可(ke)能立即普及到所有行业。然而,随着(zhe)高需(xu)求行业率先采用并推动规模(mo)化生产,成本逐渐降低。当光伏发电成本降至(zhi)与煤电相当的临界点时,它便开始得到广(guang)泛应(ying)用。

隐私计算(suan)同样遵循这一模(mo)式,它将首先在高价值数据和场景中得到应(ying)用。尽管隐私计算(suan)解决的问题并非仅限于高价值数据,但当前数据泄露问题已经(jing)非常严重。许多机(ji)构的数据在暗网上(shang)被交易,造成严重后果。然而,这只是冰山一角,国内黑产的大量数据交易已经(jing)不仅限于暗网,这是一个(ge)非常危险的现象。数据泄露正在大规模(mo)发生,对社会(hui)造成巨大伤害,而传统技术路径无法有效保障数据安全。

当高价值数据和场景的行业首先建立起隐私计算(suan)体(ti)系,并实(shi)现规模(mo)化以(yi)降低成本时,它将能够服务于更多行业。我们认为,每个(ge)行业场景的临界点是隐私计算(suan)的成本降至(zhi)数据流通价值的5%左右,这将实(shi)现规模(mo)化推广(guang)。

王(wang)磊:我也补充(chong)一下,首先先讲一个(ge)概(gai)念(nian),虽然我们经(jing)常提到密态计算(suan),但隐私计算(suan)仍然是行业内的共识(shi)。我们之所以(yi)不再频繁提及隐私计算(suan),并不是为了炒一个(ge)新概(gai)念(nian)。在大家(jia)的印象中隐私计算(suan)更多是基于多方(fang)安全计算(suan)和联(lian)邦安全学(xue)习两方(fang)做融合,融合的过程中增加保证参与者之间互相不能够窃取到数据。其实(shi)在数据大规模(mo)流通过程中,很多应(ying)用场景并不是这个(ge)。

举个(ge)很现实(shi)的例子,现在公共数据开放面(mian)临什么风险?数据要放到外网做开放,这里面(mian)可(ke)能不涉(she)及到数据融合,但有巨大的风险,这是他(ta)们不敢开放的原因。例如,将政务内网的数据转移到外网平台(tai)时,如何确(que)保数据的安全性?即使运(yun)维公司是可(ke)信的,运(yun)维人(ren)员是否也同样可(ke)信?他(ta)们是否可(ke)能通过拆卸硬(ying)盘或其他(ta)方(fang)式轻易地窃取数据?此外,在数据加工和使用过程中,即使是有正常权(quan)限的人(ren)员,也可(ke)能存在数据泄露的风险。

所以(yi)有很多的真正有价值的数据是不敢开放的,一直讲开放,一直很难开放。密态计算(suan)通过密态的方(fang)式确(que)保运(yun)维者没有办(ban)法窃取到数据,让数据真正的开放流通起来。

隐私计算(suan)之前只应(ying)用到整个(ge)数据流通当中的一小环节一小部分环节,当数据真正大面(mian)积流通,我需(xu)要做到多方(fang)数据融合。我们认为密态计算(suan)是下一代的隐私计算(suan),希望解决数据更大规模(mo)流通中遇到的真正问题。

发布(bu)于:上(shang)海市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7