业界动态
专访商汤田丰:行业已从感知智能进入生成式人工智能,未来期待具身智能,模型,能力,世界
2024-07-10 00:41:10
专访商汤田丰:行业已从感知智能进入生成式人工智能,未来期待具身智能,模型,能力,世界

伴随过(guo)去一年AI大模型的爆发,生成式人工智能迎(ying)来了飞(fei)跃性的发展。

7月5日(ri),在2024世界人工智能大会上(shang),商汤科技(下称商汤)董事(shi)长兼CEO徐立发布了“日(ri)日(ri)新(xin)SenseNova 5.5”大模型体系。他在会上(shang)还提出,当前人工智能正处于一个关键的转折节点,人工智能的超级时刻有(you)赖于行业(ye)共同营造(zao)超级应用。

中(zhong)国人工智能产业(ye)正经历过(guo)哪些重(zhong)要转变?当前AI产业(ye)如(ru)何(he)打造(zao)独特竞争力?未来人类与科技如(ru)何(he)共生?带着这些问题,时代周报记者专访商汤智能产业(ye)研究院院长田(tian)丰,与他共同探讨。

图:商汤智能产业(ye)研究院院长田(tian)丰;图源:受访者供(gong)图

十年跃迁:从感知智能到生成式人工智能

2024年,恰逢商汤成立的十周年,十年间商汤也伴随行业(ye)一起成长。

田(tian)丰表示,当前行业(ye)已走过(guo)两个阶段(duan)。第(di)一阶段(duan)是感知智能时代,例如(ru)智慧城市、智能手机、自动驾驶汽车的激光雷(lei)达等技术(shu),都是通过(guo)摄像头进行感知操作,是1.0阶段(duan)的产业(ye)特点。第(di)二段(duan)路是随着2018年前后商汤研发AI大模型以(yi)及(ji)2023年ChatGPT带来的生成式人工智能的爆发,进入(ru)AI 2.0的时期。

当前2.0阶段(duan)又分(fen)为上(shang)半场(chang)和下半场(chang),上(shang)半场(chang)是知识(shi)工程,需要将各行业(ye)大量的高质量数据喂养大模型,例如(ru)人文社科、医(yi)疗、法律、数学、物理等知识(shi),让通用大模型具(ju)备(bei)语义理解和用户意图识(shi)别(bie)等能力。下半场(chang)是具(ju)身智能驱动的工业(ye)革命,商汤及(ji)行业(ye)正处于第(di)二阶段(duan)的上(shang)半场(chang)。

对于具(ju)身智能阶段(duan),田(tian)丰展现(xian)出期待。他认为,“具(ju)身智能将真正实现(xian)AI与物理世界的深度(du)融合,使AI具(ju)备(bei)感知、记忆(yi)、决(jue)策、分(fen)析(xi)、认知和执行的综合能力并与机器人等执行体进行融合。届(jie)时,AI将不再(zai)仅仅是数字世界的数智生产力,而是能够真实改造(zao)物理世界的强大新(xin)质生产力。”

大模型如(ru)火如(ru)荼,围绕背后的重(zhong)要基础设施――算力,在过(guo)去一年的讨论(lun)也从未停止(zhi)。

算力对行业(ye)的影响(xiang),可参(can)照英特尔(er)公司创始人摩尔(er)在1965年提出的“摩尔(er)定律”,摩尔(er)发现(xian),集成电路上(shang)可容纳的晶体管数量每隔一段(duan)时间就会翻倍,同时价格也会减半。在现(xian)代社会,则体现(xian)在技术(shu)性能每隔一段(duan)时间显著(zhu)提高,而技术(shu)成本也随之(zhi)下降,能加速推动行业(ye)发展,进而对人类生活带来巨大变化。而目前在尺度(du)定律推动下,每一代大模型对AI算力的需求呈现(xian)超越摩尔(er)定律的指数级增长趋势。

2018年,商汤开始研究大模型,2019年商汤注意到算力的“巨大缺口”,于是在2020年7月和上(shang)海临港集团,投入(ru)56亿元,在上(shang)海自由贸易试验区临港新(xin)片区打造(zao)新(xin)一代人工智能计算与赋能平台(商汤临港AIDC),开发新(xin)型人工智能基础设施SenseCore商汤大装置。

最终,商汤成为最早布局AIDC人工智能智算中(zhong)心的AI公司,也成为国内第(di)一个发布超过(guo)千亿参(can)数级大模型的公司。

据田(tian)丰介(jie)绍,SenseCore商汤大装置管理的算力实现(xian)全国联网的统一调度(du),在上(shang)海、深圳、广州(zhou)、福州(zhou)、济(ji)南、重(zhong)庆等地(di)都拓展了新(xin)的计算节点,总算力规模高达12000 petaFLOPS 。相当于可以(yi)同时支持训练20个1000亿参(can)数量的模型,具(ju)备(bei)庞大的算力和数据服务规模。

对于算力的重(zhong)要性,田(tian)丰表示:“模型参(can)数量、算力规模、训练数据规模的提升(sheng)对于最终效果的影响(xiang)并不是两三(san)倍的放大,而十倍百倍甚至千倍万倍的的提升(sheng)。如(ru)果算力能保持指数级的发展,未来3年到4年就有(you)可能真正实现(xian)通用人工智能,从这个角度(du)讲(jiang),现(xian)在的算力仍(reng)处于起点,需要长周期中(zhong)更大规模的扩张,才(cai)可能保证国产大模型始终领先在全球的前沿位(wei)置上(shang)。”

独特优势:三(san)位(wei)一体与端云结合

据田(tian)丰介(jie)绍,在上(shang)述的商汤临港AIDC项目,当前已实现(xian)了全连接万卡(ka)的AI超算集群,并行效率达95%,适(shi)配20多款(kuan)国产GPU芯片。

但从行业(ye)来看,算力的需求永(yong)远(yuan)不会完全满足。因此,要想拥有(you)独特优势,开发新(xin)型大模型能力应用方(fang)式也成为关键,商汤的解法是端云一体融合的大模型架构。

“例如(ru),我要在手机上(shang)用AI助手查上(shang)海世博中(zhong)心与周边的吃喝(he)玩乐方(fang)案,算力原(yuan)本部署在云侧,比如(ru)只支持100万用户,但是我们把(ba)70%以(yi)上(shang)的算力移到到用户的手机端处理需求,如(ru)果有(you)处理不了的难题,再(zai)调动云侧大模型,手机端的智能体和云侧的大模型联动,能更好的利用手机闲置算力。由于中(zhong)国有(you)海量的移动端用户,这种方(fang)式可将支持的用户量一下提升(sheng)3倍以(yi)上(shang)。端侧小模型加上(shang)云侧大模型分(fen)工协同就是商汤日(ri)日(ri)新(xin)应用的独特优势。”田(tian)丰解释道(dao)。

对于大模型的能力进阶,田(tian)丰提出了三(san)个核心层面的见解。首先,最为基础的是知识(shi)能力,这是大模型认知世界的基石。其次,推理能力作为进阶,要求大模型能够进行深入(ru)、精准的逻辑分(fen)析(xi)。最终,执行能力作为最高层次,要求大模型能够将理论(lun)知识(shi)转化为实践行动。

田(tian)丰比喻道(dao),“在商汤从1.0到发布5.5版本的过(guo)程中(zhong),首要任务是让大模型实现(xian)无所不知,从天文、地(di)理、到历史、物理等等,包罗万象,使得大模型如(ru)同接受通识(shi)教育的大学生,快速形成对世界的全面认知与常识(shi)储备(bei)。现(xian)阶段(duan)则处于把(ba)大学生培养成研究生,要求大模型在精准研究、复杂推理方(fang)面具(ju)备(bei)能力,这也是大家(jia)当前提升(sheng)的重(zhong)点目标。最后则是向各行业(ye)专家(jia)和科学家(jia)看齐,达到人类顶尖的水平。”

同时田(tian)丰认为,如(ru)果要达到最后的顶尖阶段(duan),“数据是模型的生命线,高质量的数据很关键。”

数据第(di)一来源是各行业(ye)龙头企业(ye)的高质量数据集。例如(ru)打造(zao)法律大模型,需要把(ba)大量律师的经验和法律合同喂养给大模型训练,现(xian)在解决(jue)之(zhi)道(dao)法律服务平台的法律大模型能在一分(fen)钟之(zhi)内生成一份定制(zhi)化法律合同。第(di)二部分(fen)是各领域顶尖专家(jia)的思维链数据。要想接近通用人工智能,需要学习各领域顶尖专家(jia)长链推理和思考过(guo)程,那么真正训练出来的大模型,会远(yuan)高于人类的平均水平。

田(tian)丰强调,“真实世界的优质数据是有(you)限且昂(ang)贵的,今年合成数据在训练中(zhong)将超过(guo)真实数据。例如(ru),大模型可以(yi)把(ba)1道(dao)数学题扩写成5道(dao)题,也能够生成高质量的不同解题方(fang)法,通过(guo)举一反三(san)的能力产生更多合成数据。所以(yi)合成数据能力在未来是数据竞争非常重(zhong)要的核心技术(shu)。”

田(tian)丰表示,“商汤跟其他人工智能公司最大的不同,在于底层AI算力基础设施,数据管线工具(ju)、基础大模型,三(san)方(fang)面同时兼具(ju),算力、数据、模型三(san)位(wei)一体,形成具(ju)有(you)自闭环创新(xin)价值的全栈自研模式。”

展望(wang)未来:人机共智与普惠向善

未来关于AI工具(ju)对于人类的作用,田(tian)丰认为,AI工具(ju)将经历“有(you)中(zhong)生有(you)”到“无中(zhong)生有(you)”的两条路径。

第(di)一种路径是强化学习,不断(duan)学习人类顶尖专家(jia)经验,掌握人类最聪明的思考方(fang)式,创造(zao)更优解法。第(di)二种是自主(zhu)推理,在一个规则体系之(zhi)内,大模型通过(guo)算力和模拟环境快速实现(xian)远(yuan)超人类历史发现(xian)的科学突破,达到“无中(zhong)生有(you)”的科学智能推理能力。

“例如(ru)找到新(xin)的数学的猜想和物理学的假设推理,我们称之(zhi)为‘机器猜想’。人脑的神经元是100万亿,现(xian)在GPT-4是1.8万亿,当更大的模型达到百万亿之(zhi)后,可能会涌现(xian)出这种更高级别(bie)的推理能力与机器猜想能力,也是我们争取的目标。”田(tian)丰说道(dao)。

不久前,微软计划投资1000亿美元打造(zao)全球最大的AI超算集群星(xing)际之(zhi)门。大模型的成本固然高昂(ang),但相比资金,更重(zhong)要的是AI研发人才(cai)。

对于过(guo)去一年国内外激烈的人才(cai)竞争,田(tian)丰表示:“通过(guo)我们的研究分(fen)析(xi),中(zhong)国其实是全球最大的AI人才(cai)培养国,想要留存人才(cai),需要领军(jun)科学家(jia)的号(hao)召和青年科学家(jia)的扶持。”

他认为,要想把(ba) AI相关的天才(cai)人员留在中(zhong)国沃土,团队需要领军(jun)科学家(jia)为首“灵魂人物”,同时应当提供(gong)充分(fen)的信任、充足的预算,足够的科研自由,让青年AI科学家(jia)人才(cai)去做技术(shu)带头人、持续投入(ru)基础科研突破,实现(xian)领军(jun)科学家(jia)带青年科学家(jia),青年科学家(jia)再(zai)带一群跨领域工程师的团队架构。只有(you)人才(cai)密度(du)、算力密度(du)、数据密度(du)很高的公司,未来才(cai)能够具(ju)有(you)跃迁的能力。

田(tian)丰透露,商汤因为坚(jian)持自主(zhu)研发的原(yuan)创能力,不断(duan)吸引AI人才(cai)加入(ru)。自他2019年加入(ru)商汤至今,公司团队人数已实现(xian)了2~3倍的增长,目前以(yi)徐立博士为核心,科研团队稳定地(di)加速推进研发。

对于,心中(zhong)未来的AI时代,田(tian)丰的憧憬是:“人机共智、开放共享,普惠向善。”

发布于:北(bei)京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7