知乎热榜 ( ) • 2021-12-01 12:41
半佛仙人的回答

这话题,我喜欢。

其实从问题就可以看出来,这数字人、虚拟人、数智人,名字都没有拿捏清楚,和这三个说法同时存在的还有一些,比如虚拟形象、虚拟数字人、数字孪生、虚拟替身等等。


按照某研究院的说法,虚拟人更偏重外观和智能,而数字人更加笼统,以3D图像软件或者其他仿真工具做出来的都是数字人。

按照《虚拟数字人深度产业报告》的说法,这些名字都可以指代由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等手段打造出来的具有人类外貌特征、表演能力、交互能力等等的非物理世界产物。

总归就是,各说各的,各自赋能,各自定义。

但是没关系,一个新事物在初期,都会有这样那样的定义纷争,这刚好说明虚拟数字人最大的特点,就是刚起步,依然是处在炒概念,玩噱头为主的阶段。

那我就先简单的说是数字人吧,这咱们其实经常遇到。

比如我很喜欢逛的B站,虚拟主播都有自己专门的分区了,到2020年底已经有超过3万虚拟主播存在,比前年增长了40%。


而在很多传统领域,数字人也是各种登台,比如播报个天气,比如客串个游戏。


这种立体化仿真化的数字人,背后要单向输出的内容,大多是事先设定好的。

支撑起这样从「壳」角度仿真的,是3D建模、动作捕捉技术、渲染等技术,不过不具备识别外界环境,与人交流互动的能力。

在我看来,这种数字人还处在初级阶段,更进一步的,其实在《赛博朋克2077》这款游戏里面有所体现。

比如基努里维斯作为NPC的存在,就是一方面具有了一定程度的真实感,一方面还能和玩家进行剧本设定型互动,算是比较高级的数字人了。


这里就可以单独把数智人拎出来说了,数智人和数字人的核心区别就在于那个「智」上。

虽然是一字之差,但是点睛之笔就在这个地方,当然,也是最难跨越的坎儿。

精美的卡通或者真人数字形象,那只是皮,骨架,内核在于语音交互、自然语言理解、图像识别等AI能力。

其实图灵很早就告诉我们了,要测试人工智能,就是要聊天。

所以数智人最大的考验也是最好的发挥场所,就是和人的互动。

把冰冷单纯的人机交互变成更加有真实体感的交流,这就是数智人正在做的。

现在人工智能已经越来越高级,语音语调、各种停顿、语气词等的小动作的模仿还不是关键,关键在于听得懂,能对话。

这不光涉及到自然语言理解,还需要人工智能可以把对方的话,拆解成意图和实体,当然还有无法避免的语气助词和废话。

比如你说,今天心情好,干脆去动物园溜达一圈吧。

这里面意图就是溜达,实体就是动物园,其他的就是语气助词和无关紧要的东西。

而且咱们说话,很多时候都不会完全的传递信息,而是相信对方根据自己的常识、经验、场景甚至直接来解读。

这些都是人工智能在逐步攻克的难题。

现在能做到什么程度呢?两年前就有AI冒充真人打电话去餐馆订座位让人难分真假的测试,这些,都是技术不断堆积后的产物。

不过,所谓数智人,也不是说给数字人单纯的加上人工智能就完事儿了,仿佛那是个大道至简一通百通的秘诀。

大家都知道,现在互联网行业很多都开始从ToC往ToB端转型,那种一招鲜吃遍天更多的是发生在ToC端,但是到了行业解决方案的时候,往往就需要更多的行业深耕,行业定制,行业解决方案。

这人工智能也是一样的,能订座的AI,那背后的语料库肯定更生活化,更符合预订场景。你让同样的AI去帮你做一下服务引导,或者做个单纯输出型的资讯播报,都很难做到精准场景下的适配。

这其实就是行业下沉过程中的专攻问题,不过,这也是数智人未来更广大的市场。

我觉得金融行业就是一个典型案例。

我前年的时候参加过一个国内很有牌面的商业银行的峰会,完事儿以后被带看他们的最新黑科技,里面就有一个人工智能ATM,最亮眼的我觉得就是里面的远程协助部分。

就是你用ATM遇到问题了,现在常规场景是旁边有大堂经理帮忙来处理,但是这家银行是用人工智能ATM直接解决,你对着他说话就行。

我当时是激动的心颤抖的手,要知道很多金融机构的客服中心都是成本中心,不论网店里面的员工成本,还是呼叫中心的话费、人工成本、设备器材维修等等,花的都是真金白银。

能有这样的人工智能ATM,可以进行智能互动,那可以省下很多的运营费用。

结果测试完了,非常丝滑,然后工作人员说,这其实背后是成都的客服中心远程帮助,我以为自己是在和ATM互动,结果其实还是和真人。

这就尬住了。

其实银行说要数智化转型已经很多年了,从开户到协助,从资产管理到定点理财顾问,都开始慢慢的智能化,但这种智能化不能解决交互问题。

而现在数智人的升级,就可以让我前年被戳破的幻想重新成真,数智人已经开始尝试辅助传统意义上需要由银行员工进行的,和客户交互的工作。

现在已经有一家金融机构落地了首个金融AI数字员工,我查了一下,背后提供解决方案的是腾讯云小微数智人。


这种在AI驱动下的形象逼真到就像是个真人在服务的数智人,开始为银行做审核工作。

咱们平日里面和银行打交道,其实遇到最多的就是各种申请,各种填表,各种审核,过程中因为我们的知识不对等,必然是需要有人帮忙进行指导,有问题也需要随时得到解答。

用这种金融AI数字员工,一方面是可以实现「不打烊」的服务,一方面也是可以解决人工成本攀升的问题。

而且还能避免因为人工错误导致的用户体验下降。

这套解决方案已经服务了大量用户,在这过程中,就是给了人工智能充分学习和迭代的机会,从而提供更好的金融领域客服的专业积淀。

这就是为什么我之前说,具体场景下落地是数智人未来发展的大趋势。

对C端来说,解决的是具体的问题,比如等待时间、响应速度、服务质量;对B端来说,带来的也是直白的成本节约和效率提高。

可以想象,以后金融AI数字员工这类的专精数智人能承担的工作,能包括客服、柜员、理财顾问、销售经理等多项现在银行重人力成本投入的领域。


当然这仅仅是其中一个案例,金融行业是非常需要提高客户服务质量并且降低人工成本的领域之一,类似的行业还有文教传媒和公共服务等等。

我现在能查到的是腾讯云小微的数智人已经在故宫、龙门石窟等景区提供 AI 导览服务,为游客提供个性化游览路线推荐,景点文物讲解等多种服务,不光是讲,还能问,还能声情并茂的答,非常的灵性。

这时候完全可以畅想一下,只要有交互需求的地方,数智人在未来都能有用武之地。

愿景是美好的,但是距离也是遥远的。

其实路要一步一步走,饭要一口一口吃。

一上来就说脑后插管,肉体飞升,憧憬是给力的,不过技术的积累更重要的是解决当下需求,也只能在解决现实意义问题中才能不断的迭代。

从虚拟播报,到数智人互动,仅仅是个开始,旅游行业的智能导游,传媒领域的AI主播,金融领域的虚拟面审官,这些只要是有人参与的过程,都能在数智人的协助下更进一步。

这直白带来的,第一就是大家的用户体验更加顺畅,不需要等待坐席,不需要考虑工作时间,能实现脱离时空场地束缚的全方位互动。

第二那就是可以让企业把更多的精力和资源从简单的客户服务上腾出来,投入到创新研发、产品升级等等更具有远期竞争力的领域上。

所以数智人虽然同样是一个初创的概念,但是未来具有很大的市场前景和落地空间,这种有温度、有表情、有情绪的数智人,我很期待未来的表现。