业界动态
一个月内三次重大升级 快手可灵大模型实现让AI技术创造更多价值,视频,能力,商业
2024-07-15 07:18:32
一个月内三次重大升级 快手可灵大模型实现让AI技术创造更多价值,视频,能力,商业

视(shi)频拍摄制作(zuo)一直以来都是有一定专业性(xing)要求的技能(neng),而如今(jin),在新技术的推动下,这一印象有望被重塑(su)。通过大(da)模(mo)型(xing),用户只需输入文字或者图片,就能(neng)自动生成一段(duan)高清视(shi)频,它还可以不断延长视(shi)频的长度,最长能(neng)达到3分钟(zhong)。

这并非天(tian)方夜谭。国产视(shi)频大(da)模(mo)型(xing)快手“可灵”已于日前正式(shi)推出,作(zuo)为首个Sora级面(mian)向用户开放的文生视(shi)频大(da)模(mo)型(xing),可灵一经(jing)发(fa)布便引发(fa)了国内外持续的高度关注。在刚刚落幕的2024世界人(ren)工智能(neng)大(da)会上,继图生视(shi)频、视(shi)频续写功能(neng)发(fa)布之后,可灵在一个月(yue)内迎来了第三次重大(da)升级,网页端也正式(shi)上线,让这款大(da)模(mo)型(xing)的话题感(gan)再度拉满。

业内人(ren)士向央广网表示,目(mu)前各行业的大(da)模(mo)型(xing)产品数量已经(jing)超200个,而且呈现持续增加的态势。如何在繁多的大(da)模(mo)型(xing)中脱颖(ying)而出,是对各家技术沉淀(dian)和和综合实力(li)的考验(yan)。

图文生视(shi)频有何难?做到符合物理规律决定了模(mo)型(xing)上限

台上一分钟(zhong),台下十年功,这句(ju)俗语用在视(shi)频大(da)模(mo)型(xing)行业来说恰如其分,从视(shi)频大(da)模(mo)型(xing)的推出整体晚于图文生成大(da)模(mo)型(xing)也可见一斑。2月(yue)15日,美(mei)国人(ren)工智能(neng)研究公(gong)司OpenAI正式(shi)发(fa)布了旗下首个文生视(shi)频模(mo)型(xing)Sora,此后这个领域才(cai)更多呈现在普通用户面(mian)前。

相(xiang)关视(shi)频大(da)模(mo)型(xing)从业者表示,自Sora以来,各家视(shi)频生成模(mo)型(xing)都非常注重生成符合物理规律的视(shi)频,这决定了模(mo)型(xing)能(neng)力(li)的上限。记者在测试过程中也发(fa)现,不管是还原现实生活场(chang)景还是天(tian)马(ma)行空的想象场(chang)景,可灵在动作(zuo)还原上都较为流畅真实。

(蒙娜丽莎戴眼镜动图)

如何做到这一点?快手大(da)模(mo)型(xing)团队表示,可灵具有大(da)幅度且合理的运动生成能(neng)力(li)。通过建模(mo)复杂的时空运动,可灵可以生成较大(da)幅度的运动,并符合运动规律。

本次WAIC可灵宣布的高画(hua)质版、首尾帧控制和相(xiang)机镜头控制功能(neng),分别(bie)是可灵AI在电影(ying)级高清画(hua)面(mian)生成、领先图生视(shi)频效果和优秀视(shi)频生成可控性(xing)三大(da)能(neng)力(li)上的进一步演化。此外,在更充分模(mo)型(xing)训练的加持下,可灵AI在运动生成、生成时长、物理规律、指(zhi)令响应等(deng)其他四大(da)能(neng)力(li)上也进一步升级。

值得一提的是,快手核心的基础(chu)模(mo)型(xing),以及(ji)底层的IDC算力(li)中心、网络架构AI平台,都是快手自研。为了支持大(da)模(mo)型(xing)的训练和推理,快手建立了一个万(wan)亿参数规模(mo)的大(da)模(mo)型(xing)训练及(ji)推理基础(chu)设施。这个基础(chu)设施为大(da)模(mo)型(xing)提供了必要的计算能(neng)力(li)和存储(chu)资(zi)源,确保(bao)了模(mo)型(xing)的高效运行和持续优化。

商业落地成效初显,用AI技术创造更多价(jia)值

与很(hen)多大(da)模(mo)型(xing)的商业路径还在探索(suo)阶段(duan)不同,快手大(da)模(mo)型(xing)的商业落地路径清晰,且已经(jing)初显成效。身处短视(shi)频领域第一梯队,快手视(shi)频生成大(da)模(mo)型(xing)有更加天(tian)然、广泛的应用场(chang)景。

据了解,目(mu)前快手使用大(da)模(mo)型(xing),在广告领域里面(mian)进行构建了视(shi)频脚(jiao)本生成,直播实时脚(jiao)本生成,广告线索(suo)的克服技术等(deng)。叠加数字技术,能(neng)够助力(li)商业化广告主低成本的生成高品质短视(shi)频和直播。

数据显示,快手的AIGC的广告消(xiao)耗从1月(yue)份几乎可以忽略不计,到6月(yue)份快速增长,现在月(yue)度日均(jun)值消(xiao)耗将近2000万(wan)每(mei)天(tian),峰值日消(xiao)耗远远超过2000万(wan)。

快手商业化外循环和AI商业产品负责人(ren)刘逍透露,半年来,有近2万(wan)商家在快手平台借助大(da)模(mo)型(xing)能(neng)力(li)实现智能(neng)化经(jing)营,获得不菲回(hui)报。相(xiang)比今(jin)年1月(yue),今(jin)年6月(yue)的AIGC月(yue)活跃客(ke)户数增长了8倍,月(yue)GMV规模(mo)提升了64倍,平台AIGC广告收(shou)入规模(mo)提升了12倍。刘逍表示,磁力(li)开创、女娲数字人(ren)、π数字员工等(deng)“新生意”工具将持续为商家深度赋能(neng),“我们将继续深化AI技术在商业化中的应用,不断创新和发(fa)展,为客(ke)户创造更多价(jia)值。”

技术积(ji)累(lei)加上商业化前景明朗,让可灵大(da)模(mo)型(xing)的每(mei)一步动向都引发(fa)强烈关注。快手高级副(fu)总裁、主站业务与社区科学线负责人(ren)盖坤表示,一直以来,AI技术创新都是推动快手发(fa)展的驱动力(li),不仅覆盖内容生产、理解、推荐等(deng)多个层面(mian),也持续推进着快手商业生态的智能(neng)化经(jing)营水(shui)平。快手未来将继续加大(da)在AI领域的投入,大(da)力(li)推动技术创新,“坚定地为用户做最好的AI技术”。

发(fa)布于:北京市
版权号:18172771662813
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7