36氪 - 最新资讯频道 ( ) • 2023-05-12 07:39

 数字人成上海元宇宙赛道“先发优势” 或迎来风口

上海音乐厅的舞台上,在一群孩子们中间,新中国的缔造者之一、国家名誉主席宋庆龄先生出现了,“她”用沪语讲述了她生前发表的最后一篇文章《愿小树苗健康成长》。

这是出现在3月23日晚上,由中福会主办的纪念宋庆龄诞辰130周年音乐会上的一幕,这也是宋庆龄数字人首次出现在大众视野中。通过超写实数字人,观众们跨越时空,感受宋庆龄先生的温暖面容。

数字人,已经不再是虚拟世界中的专属,也不再是仅供游戏娱乐的角色,其已经成为一个产业。伴随着上海发展元宇宙的脚步,在影音娱乐、文化旅游、虚拟客服、教育培训等领域,都可以看到数字人的身影。

去年,《上海市培育“元宇宙”新赛道行动方案(2022—2025年)》发布,计划到2025年“元宇宙”相关产业规模达到3500亿元,数字人成为上海发展元宇宙赛道上的“先发优势”,上海的数字人产业和技术发展正在经历着从偶像型虚拟数字人到服务型数字人的转变升级过程。

带来一场效率革命

2012年,虚拟歌手洛天依诞生时,数字人还是以虚拟偶像IP化为主。2020年以后,随着3D、智能化、虚实交互等技术的成熟,数字人开始转变为交互服务型,如首位在国内大型新闻直播中亮相的二次元虚拟新闻主播“申䒕雅”、浦发银行的数字员工“小虹”等。

在4月7日揭牌的上海城市数字化转型体验馆中,《IT时报》记者看到不少企业的数字人在各自的“岗位”上迎接参观者。

“你能唱首歌给我听吗?”感觉到有人站在她面前,上海元集之智能数字科技有限公司打造的一款身着白色旗袍的数字人立刻在屏幕上动了起来,听到记者的询问,她立刻用甜美的声音回答:“好的,你想听什么歌呢?”

当然,数字人不是用来被“调戏”的,上海元集之智能数字科技有限公司CEO陆文斌告诉《IT时报》记者,在金融、医疗、教育、直播等领域,数字人都在一定程度上解决了人力和效率的问题。银行大堂里,数字人可以代替大堂经理引导来办理业务的用户;在直播间,数字人主播既可以一边口播,也可以识别屏上用户的留言并实时互动,并且连续播上24小时也不会累。

在陆文斌看来,之所以数字人可以从事服务性、交互性的工作,得益于语言识别技术的发展和成熟,现在数字人对语义的理解可以称为强悍。“以前AI需要非常具体的指令,但现在AI聪明多了,‘你要把客户照顾得妥妥的’,以前AI肯定不理解什么叫‘妥妥的’,现在可以理解一些比较抽象的要求。

在这背后,是超大数据库的训练,训练一个数字人比训练一个真人的数据量要大得多,同时对数字人可以进行多元化、多学科知识点的训练。比如在培训领域,把培训内容“灌输”给数字人,数字人就可以代替真人进行培训,让培训者降本增效,释放时间。

天猫超级品牌日数字主理人AYAYI

天猫超级品牌日数字主理人AYAYI、万科总部最佳新人奖得主数字员工崔筱盼……他们不仅不拿工资、全年无休,还能大幅提升工作效率,降低出错率。去年10月,集数字人、阅读机器人、智能书架等为一体的上海首个“智慧图书馆”长宁区图书馆开门迎客,一个名叫“馨叶”的数字人小姐姐有条不紊地为读者解答长宁区图书馆的信息,还“无偿”提供图书借阅服务。

领悟时代数字研究院首席研究员唐树源向《IT时报》记者表示,数字人会带来一场效率革命,比如在企业传统重复性劳动的环节中,数字人就可以代替员工,让员工去从事更有价值的事务,提升企业的生产效能和形象。

陆文斌告诉《IT时报》记者,目前很多企业对数字人的接受度较高,他们非常看重降本增效,数字人在一定程度上解决了一些痛点。

为数字人注入灵魂

如果说一开始虚拟数字人凭借动漫式的外表吸引注意,那么现在,数字人也正在从打磨“好看的皮囊”进化至拥有独特的精神和灵魂,真人数字人在一定程度上让数字人拥有了精神。

比如通过宋庆龄数字人,可以感受到这位伟大的爱国主义战士的人格魅力。宋庆龄数字人制作团队开天工作室相关负责人告诉《IT时报》记者,由于可供参考的照片、音频资料非常有限,制作团队探访多地,从近千张影像照片中选取出了最经典、最清晰、形象特征最鲜明的一组照片做参考,并基于SFM(Structural From Motion)算法,还原出3D模型。“通过数字资产全链实现数字化还原,涵盖两块核心技术:数字资产(人物设定、模型)和资产驱动(绑定、动捕、驱动、AI算法),不仅考验在有限史料下,对人物形体、造型比例的极致还原,深究人物的神韵,要实现技术与艺术的平衡与融合。”

如何在尽可能还原和复现宋庆龄原貌的基础上,让数字人以更好的风貌神韵呈现出来,是最大的挑战。“人的面部肌肉很多,连带的运动也极其复杂,很多理论上‘自然的表情’放在数字人脸上,就会失真。当前市面上通过面部捕捉形成的数字人视频,表情精细度和写实度,仍然需要结合领先的实时渲染技术,才能达到最好的状态。”开天工作室相关人士说。

由北京广播电视台、《北京时间》共同打造的“时间小妮”,是以北京广播电视台主持人春妮为原型的中国首个广播级智能交互真人数字人。通过人工智能、深度学习、卷积神经网络学习技术,将春妮自然朗读的7000个句子和形象表情进行影像采集和智能处理,让计算机制造出真假难辨的“数字人”,形象气质、语音语调、口唇表情、肢体动作跟真人的相似度达到97%。

据《IT时报》记者了解,目前,生成一个写实数字人的成本大约在几十万到上百万元不等。

“真人数字人需要更多的技术,如对真人的形象、声音和动作构建真实人物的数字模型,提取或积累真人面部和身体运动的3D4D数据、语音数据等进行动态表情、动作的构建与迁移,进行渲染。”萨摩耶云科技集团首席经济学家郑磊向《IT时报》记者解释,为了实现高精度的细节重现,需要大量数据和计算,目前成本还非常高。真人数字人需要美术、计算机、AI等多领域的人才和技术储备,暂时还不会大范围商用。

数字人人才受追捧

IDC在2022年6月发布的《中国AI数字人市场现状与机会分析》报告显示,到2026年,中国AI数字人市场规模将达到102.4亿元。

有数据显示,截至2022年11月24日,中国数字人相关企业总量超4500家,其中2022年新注册企业数量超1200家,创历史新高。

目前的市场价值决定了数字人越来越受追捧,“虚拟主播、虚拟偶像、影视的核心价值是美术能力,通过技术让细节更逼真、更灵动;数字人客服的价值在于能否真正帮人解决问题。”开天工作室相关人士表示。

 “未来的趋势是数字人会越来越聪明,更懂、更像真人,每个企业对于数字人的开发侧重点不同,有的侧重数字成像,有的侧重应用场景,有的关注数字人和AI的结合,我们更看重应用场景。”陆文斌说。

作为元宇宙的组成部分,数字人在制造效率、使用场景和分析决策层面,都有望迎来新的突破口。

但是,数字人的发展目前受到技术、人才、法律等方面的限制。以人才为例,很多数字人企业对于人才的需求量比较大。“数字人技术发展快,很多技术并非现成的,也没有经验可循,很难找到有经验的技术人员,行业内的人才争抢比较激烈。”陆文斌向《IT时报》记者表示。

数据显示,2021年,上海人才总量达675万人,其中,数字化人才占比12.94%,位居北、上、广、深、杭五大数字化转型引领城市首位。

“上海有许多大学,不仅提供了温暖的孵化场地,还为元宇宙发展培养了大量人才。”影眸科技大数据项目一位管理人员曾告诉《IT时报》记者,公司大部分人才都来自上海高校,甚至还有些员工一边读研一边工作,可以直接将学校最新技术运用到实践中

唐树源向《IT时报》记者表示,未来数字人面临的风险主要是技术和内容,技术上要做到安全可靠、不侵犯相关知识产权;内容上不违背伦理道德,不侵害国家社会公共利益和他人合法权益。

本文来自微信公众号 “IT时报”(ID:vittimes),作者:潘少颖,36氪经授权发布。