新闻

数字人登上亚运会,大模型是幕后功臣

2023-09-27

当瓦特蒸汽机的齿轮转动了第一圈;当乔布斯从牛皮纸袋掏出 Macbook;当 ChatGPT 用流畅优美的语言回答第一个问题。科技,曾经、正在、也将改变未来。

【Future】是 36 氪科技报道团队主理的一档专栏,我们将围绕科技产业的前沿突破,记录那些实验室里令人振奋的新技术,是如何穿越 PMF(Product Market Fit 产品与市场结合)的惊险周期,进而影响更广阔的商业社会。

在这里,看见【Future】。

文 | 林炜鑫

编辑 | 苏建勋

谁也没想到,点燃亚运会开幕式火炬的,竟是超一亿数字人。

这在亚运会历史上尚属首次。手持火炬的巨型 " 数字人 ",踏过钱塘江,绕体育场飞奔,近 10 万观众爆发出巨大的欢呼声。

工程师方凯坐在看台,和身旁的人一块庆祝。他是支付宝团队的技术专家,为亚运会数字人项目提供技术支持,前后忙了一年半。20 多万行代码,10 多万次测试,圣火点燃,方凯长舒一口气。

数字点火仪式是整个项目的高潮,在此之前,支付宝花费数月时间,召集用户加入线上火炬传递。方凯告诉 36 氪,每位用户都拥有各自的 3D 数字人形象,点火仪式后会获得一张专属证书,永久存储在区块链上。

数字人玩法成功吸引了超一亿普通用户。这些数字人在开幕式上,化身一个个小火苗,汇聚钱塘江,形成具象的 " 数字人 ",跑进场馆内的 185 米立体网幕。

 

" 数字人 " 在传递火炬

 

方凯表示,为了让用户的数字人达到 " 千人千面 " 的效果,团队在研发前期折腾许久,最终把目光投向最新的人工智能技术。

生成式 AI 没有让他们失望。技术人员开发了 58 个捏脸控制器,AI 根据人脸识别画出数字火炬手的面孔,自由调整脸型、头发、鼻子、嘴巴、眉毛等。方凯透露,AI 最多提供 2 万亿种形象搭配。

他们还研发了 AI 动作捕捉,只需输入少量的真人动作,AI 便可驱动数字人自主学习更多动作。

"3D 数字人的工作流比 2D 要复杂非常多,起初内部评估工期,大家都很崩溃。" 方凯说。幸运的事,生成式 AI 极大提升了产能,不夸张的说,拯救了焦头烂额的技术团队。

开幕式还未结束," 亚运会数字人 " 便冲上了微博热搜。

 

开幕式现场的巨型 " 数字人 "

 

国内数字人赛道的从业者也在讨论开幕式。一位业内人士告诉 36 氪,亚运会数字人在技术上不难实现,但创意很新鲜,更重要的是" 对数字人这个概念做了重要的推广 "。

亚运会这一年,也是 AI 蒙眼狂奔的一年,数字人则是老树生新芽,有了新的生命力。

大模型把数字人抢救回来

数字人不是新鲜词,2021 年,元宇宙还是风口,数字人被认为是元宇宙不可或缺的一环,成为资本追捧的宠儿。翻开数据表,2021-2022 年数字人赛道出现 57 起融资,总金额达 44.61 亿元。热钱砸过来,数字人借势起航。

数字人公司良胜数字 CEO 张大胜回忆,那会市面上爆红的数字人 " 大多是 Q 版(卡通)形象 ",原因则是制作团队大多出自游戏领域。

如果你还记得,在抖音吸粉无数的 " 柳夜熙 ",凭借国风美妆 " 捉妖 " 人设,拿下超过 200 个品牌合作,其中包括安踏、vivo、字节游戏、小鹏汽车等。风光无限之际,没人在意 " 柳夜熙 " 背后的公司仅制作投入就烧了百万元,制作第一条短视频又花了几十万。

结果 " 柳夜熙 " 在抖音快两年,一共只发了 48 条短视频。人们这才意识到成本高昂是大问题。小冰公司首席运营官徐元春曾对媒体说,一个 3D 数字人运营一年可能要花掉五六百万。更要命的是,成本很难砍下来。

彼时数字人缺少大规模的商用场景,仅有的一些 B 端需求则杯水车薪。烧钱成了无底洞。

当元宇宙被大厂们渐渐冷落,数字人的寒冬也就来了。

直到生成式 AI 崛起,进入各行各业,数字人的命运发生变化。张大胜表示," 大模型对数字人的影响是翻天覆地的。" 而新壹科技 CEO 雷涛对 36 氪说," 大模型为数字人注入了灵魂。"

大模型直接降低了 3D 数字人的制作难度。新壹科技有自研的视频大模型,并搭建了数字人工具平台。雷涛表示,过去 3D 建模依赖传统 CG 技术,动作捕捉需要采集真人大量数据,现在在他们的平台上,算法可以高效生成 3D 模型,处理面部细节," 更加逼真 "

方凯说,数字人吸引 C 端用户的关键在于个性化定制。过去受技术限制,数字人长得都差不多,而大模型拓宽了用户 " 自定义的自由度 "。

 

支付宝工程师设计数字火炬手形象

 

张大胜选择与科大讯飞合作,在星火大模型的基础上,研发小模型,作为 3D 数字人的 " 大脑 "。接入大模型能力,数字人获得了 " 人设 "。他谈起公司最近正和一家咖啡店连锁品牌合作,做咖啡客服数字人。" 喂了世界上全部的咖啡知识给它," 张大胜告诉 36 氪," 它会是最懂咖啡的数字人。"

大模型对 2D 数字人的提效更加夸张。AI 的生成能力天然适配 2D 数字人。近几个月,市面上出现了许多 2D 数字人定制工具,逻辑基本一致:只要你输入文案素材,就能生成数字人形象。

" 我们的 2D 数字人售价一万元左右,24 小时就给你做好了。" 雷涛说。价格被打下来后,一些公司果断从 3D 数字人转向 2D 数字人,生怕错过商机。

数字人,入侵直播带货

汲取了元宇宙时期的教训,今天的数字人公司有了更强烈的时不我待。等不及打磨技术与产品,就已经在寻找能落地的商业场景。

最容易想到的便是电商直播。

一间 200 平的大平层,深夜四下无人,20 多位数字人主播出现在显示屏上,兢兢业业地直播带货。在电商大本营杭州,这样的办公室如雨后春笋那样冒出来。

即构科技相关负责人杜晓斌对 36 氪说,电商直播是普通人最容易接触的场景,2D 数字人已经做到直播互动,只要企业建立一个知识库,直播时触发关键词,就能让数字人调取相应知识去回答。接入大模型能力,数字人主播的互动效果还能有所提升。即构科技主营音视频云服务,今年开始提供 2D 数字人服务。

雷涛认为,数字人主播 24 小时不下播,光这一点就让店铺省下一大笔钱。事实确实如此。一家杭州电商尝试用数字人开播,一星期后,老板裁掉了公司十几位主播。结果,公司照样赚钱不误。

养那么多人还不如数字人能干活,那位老板感慨道。

张大胜告诉 36 氪,今年许多大厂都下场做 2D 数字人,赛道内卷严重。作为一家初创公司,他战略放弃了 2D 数字人,专注打造高端 3D 数字人。他强调:" 超写实 "。

 

良胜数字推出超写实数字人 AINIA

 

他的团队正在研究如何让数字人透过文本懂得正确的情绪," 你得让数字人讲话带有情绪,才能使用户交互体验更好。"

这些 3D 数字人造价在 80-150 万之间,将用于金融、教育、旅游等提供服务的行业,也会和一些企业联名打造 IP 形象。总的来说,要做的生意比直播带货更高级,自然也会更难。

相比之下,一款 2D 数字人主播,最低只需几百块。卖数字人的公司,率先赚到了钱。

遗憾的是,便宜往往没好货。被数字人主播坑了的电商不在少数。要么数字人实际效果远被夸大,只买了个模版,要么数字人开播,数据惨淡,甚至被平台封号。杜晓斌表示," 目前政策没有特别明确,平台也有自己的规则。"

尽管市场略显混乱,但数字人总算淌出了一条商业道路。

多位从业者对数字人的未来表示乐观,在他们眼里,技术迭代很快,极有可能解决数字人现有的问题。而一切努力的指向便是,让数字人更像人。

打造亚运会数字人的方凯,坚信技术进步会让数字人加速走向大众,而未来将是一个虚实结合的世界。他很期待那个世界。" 我是游戏爱好者," 他说。

欢迎交流

联系我们
TOP