要闻 - 每经网 ( ) • 2024-04-19 00:44

每经记者 朱成祥    每经编辑 董兴生    

“大家好,我是刘强东,今天是不是看起来有些不同?很久没直播,还有些许紧张……话不多说,老刘的数字直播带货现在开始。”4月16日,京东创始人刘强东在京东平台开启数字人直播。

“东哥”数字人直播,迅速引起广泛关注,数字人替代真人直播的时代来临了吗?

4月18日,数字人头部厂商硅基智能创始人司马华鹏接受了《每日经济新闻》记者的专访。司马华鹏表示:“刘强东这次数字人直播,对我们行业是非常大的品牌宣传。他使用(数字人直播),说明这个行业得到了一次非常重要的认可。”

司马华鹏 图片来源:受访者供图

对于AI的使用,司马华鹏建议:“未来所有使用AI的人,应该专注到人类特有的东西,比如创意,比如有温度的东西。我们提出一个概念,人类提供1%的灵感,99%的汗水让AI来做。”

拆解数字人技术

“数字人刘强东”是否有硅基智能技术的支持?司马华鹏表示:“我们不太方便对外公开,但这些技术最早的开创者肯定是我们。我们在整个(数字人)直播上大概有40多项发明专利,在申请的也有几十项。现在行业内有很多在使用我们的技术授权,也有很多在使用硅基智能的API(应用程序编程接口)。”

图片来源:京东黑板报

“东哥”数字人究竟是如何打造出来的?司马华鹏介绍:“它(数字人)这些内容是用AI渲染出来的。如果现在想做东哥同款,你需要提供几分钟的视频。然后我们会将其训练成一个数字人模型。这个数字人模型背后,将有大模型在驱动它。定时去上一些产品、定时回复一些客户需求、定时做一些记录,这些都是事先做好的剧本,这些剧本实质有大模型在驱动,比较接近于人类的行为和反馈。”

那么,除了上述AI渲染技术外,数字人直播还需要哪些技术支持?司马华鹏称:“我们的大模型是多模态的,是文本生成、声音生成和数字人生成的结合。其实很多人在反馈,他(刘强东)声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速,但是直播(过程中),一个用户停留时长是比较短的,你必须在很短时间内把大量的信息披露出来,所以必须把声音放得快一些。”

对于语音合成技术,司马华鹏表示:“我们全部技术都是自己的。从目前端到端的生成来讲,(语音合成)已经是一个非常成熟的技术。”

数字人形象、语音合成,都是外在展现形式,数字人直播内容仍旧离不开文本。对于文本,司马华鹏称:“文本大模型方面,我们基本上都是原创的技术,最近‘炎帝’大模型刚刚通过网信办的备案。”

数字人能否替代真人直播?

目前,大家看到的直播带货,很可能就是数字人。司马华鹏介绍:“我们在2021年开创AIGC直播的大方向,(刘强东数字人)基本上是我们2023年产品能够呈现出来的效果,这样的直播间我们已经卖掉了上万个,京东、淘宝、抖音、快手和视频号平台都有。”

真人直播会面临各种复杂场景,特别是交互性和情感交流,那么数字人可以做到吗?司马华鹏表示:“我们在看东哥直播的时候,会不会把他(数字人)当作真正的东哥来看,这是决定数字人智能化程度的重要标志。从开播到现在,行业有非常多的评价,大家觉得还是能看到一些机械的痕迹。”

“这个(数字人)行业发展的核心就是‘看不出来’。”司马华鹏强调。

其认为:“我们现在也有大量的直播间在播,效果比这个(刘强东数字人)要好很多。如果他这个直播不是在自家平台,而是在其他平台,很容易被机器识别出来,很快就会被限流。”

因此,在司马华鹏看来,数字人行业核心是让整个直播间符合图灵测试。对于数字人行业的发展,其认为:“(该领域)图灵测试1.0是分不清(是人类还是AI);图灵测试2.0则是双向情感交互,AI这边付出情感,你也付出情感;图灵测试3.0就是‘死生相契’,未来我们与AI之间,可能是Soul Mate(心灵伴侣)的关系,它是你非常重要的助手、朋友,也可能是你亲密的合作伙伴。”

图片来源:受访者供图

目前,很多问答式大模型主要给受众提供专业类辅助,但若诉诸情感,是否兼具图像、声音和文本的多模态大模型更具优势?对此,司马华鹏表示认可。“人类大脑的设计中,90%以上是针对图形,所以我们说有图有真相。基于文本,产生的是想象力,(阅读文本)的能力确实非常重要,但对大部分人而言,(自己的大脑)生成图片,然后再想象出一个空间,还原出这个东西,是非常累的。因此,多模态也好,或者视频化交互能力,能够大大降低我们之间信息沟通对应的脑力消耗。”

对于未来AI电商的形态,司马华鹏认为:“未来更大的价值是专业性。比如说,假设我们在食品领域有一个很好的AI专家,它可以从数据、算法的角度给我们提供很多的专业性。这样的专家,它带来的影响力会超过现有的人类专家。AI电商未来一定是大量专业性的AI专家,给大家提供信用和信任,然后这些信用和信任会带来真正的、更好的电商交易。”

其进一步解释称:“人类在做很多行为的时候,有一定的偏颇或者偏见,或者带有一定的商业目的。而以数字和算法驱动的AI专家,会成为我们的朋友、我们的伙伴,很有可能成为AI电商未来的主流。现在这些成本还比较高,只是出现在奢侈品领域。我希望未来每一类小产品上,都有这样一个专家顾问,来给我们提供非常好的沟通交流方式。这是AI电商未来非常重要的一部分。”