新聞 | iThome ( ) • 2024-04-20 16:33

SAS揭露创新实验室3大重点,其一是延续去年强调的数位双生,整合了智能助理Copilot,使用者可用自然语言提示,来获得模拟预测的可能状态。

图片来源: 

摄影/王若朴

在今年度Innovate 2024年会最后一日上,SAS揭露创新实验室发展亮点,包括数位双生、实体整合(Entity resolution)和量子运算等3大主轴。其中,数位双生就像是企业的分身,可透过数位方式预测特定情境下的运行变化,实体整合则指将零散、有缺失的资料归户到同一个实体,量子运算则可用来加速复杂运算,如肾脏移植匹配。同时,SAS也说明新产品合作生态系,像是联手英特尔提供硬体加速,来更快执行SAS平台服务,包括已使用英特尔最新发布的AI晶片Gaudi 3来与客户进行PoC验证,以及整合至微软去年推出的Fabric资料分析平台,来提供原生的SAS资料处理功能。

锁定数位双生、实体整合和量子运算3大创新方向

SAS近年产品策略聚焦AI,不只在主力产品云端资料分析平台Viya上添加AI模型生命周期管理功能和服务,今年更深化AI产品线,揭露合成资料生成器、AI应用开发工具和更多生成式AI功能,同时也扩展AI监管工具和治理顾问服务,要让AI产品线更完善。

在创新部分,他们延续2023年提出的数位双生主轴,今年也将数位双生纳入发展重点。SAS执行长办公室执行副总裁Gavin Day表示,数位双生是将实体物件虚拟化模拟的作法,可用来预测特定条件下的可能变化。现场以一家大型零售厂商为例,使用者可在SAS平台仪表板上检视物流、供应链和整体表现数据,还能透过Copilot智能助理,来询问、模拟不同决策的可能状况,比如分部工厂将关厂30天,可能带来的收益和服务影响(如下图)。

另一创新重点是实体整合,这是一种将分散的资讯归户到同一个实体(Entity)的作法,又可称为数据匹配。Gavin Day指出,实体整合很重要,对AI发展尤是如此,因为透过数据匹配、将零散的资料清理干净,就能降低「Garbage in,garbage out」的窘境。SAS资深资料科学家Charles Cavalier举例,实体整合可用于资料归户,比如在教育资料、驾照、医疗资料等各种政府资料中,从众多类似人名的资料卡中正确归纳出特定民众资讯,甚至能因此补足原本单一类别缺失的资料。(如下图)

在实际应用上,就有机构用来侦测税务诈欺,透过实体整合来分析税务纪录,进而避免大量损失。

至于实体整合的下一步,Charles Cavalier透露,SAS AI建模团队打算建置Transformer小型语言模型,作为基础模型,接著对模型做实体整合任务微调,让模型学会实体分类。

他也表示,这类实体整合应用适用于企业、服务商或医疗机构。团队目前正研究生成式资料处理技术和深度嵌入,搭配这些技术,就能用来在不同资料集中找出同一个实体的描述纪录,就像是资料归户,另也能用于搜寻任务。之后,SAS计划将这些能力整合到既有产品中。

最后一项创新主轴是量子运算。SAS以肾脏捐赠配对为例,通常三分之一的捐赠者和受赠者无法第一次就配对成功,为解决这个问题,他们使用图学,用点来代表捐赠者,以边(点与点之间的直线距离)代表捐赠者与受赠者的匹配程度,并从这些点与边形成的网路中,找出最合适的肾脏移植配对(如下图)。

这需要大量复杂的运算,就算是传统优化过的运算,得要180秒才能得出99.4%的最佳解,但用量子运算加速,30秒就能找出100%的最佳解(如下图)。

与英特尔、微软合作生态系新方向瞄准硬体加速和软体整合

另一方面,SAS也揭露支撑自家产品线的合作生态系,包括联手英特尔,使用其硬体来加速分析平台执行时间,甚至也开始使用最新发布的Gaudi 3处理器,来与进行PoC验证。再来,已成为策略合作伙伴4年的微软,在今年进一步整合软体服务,SAS自家的决策建立器Decision Builder可在微软去年上线的资料分析平台Microsoft Fabric中使用,尤其使用者可使用SAS原生功能,一站式快速建模、处理资料和管理逻辑。(如下图)