国内企业正在大模型领域加速投入,其中,AI Agent也成为了探索的方向之一。这篇文章里,作者就对AI浪潮下诞生的钉钉AI助理做了分析和拆解,并以钉钉AI助理为例,尝试从落地产品类型来探索AI Agent如何发展,一起来看。

从ChatGPT因良好的用户反馈席卷全球开始,2023年起,国内的科技企业们就加速了大模型领域的投入。同时,关于大模型的应用,各大公司也在不断探索,朝着模拟人类行为的AI Agent形式成为了应用的方向之一。围绕着AI Agent的落地,“钉钉AI助理”就应运而生了, 钉钉AI助理是什么样的?AI Agent又会如何发展?笔者将通过本篇文章抛砖引玉,与大家一块探索。

一、认识钉钉AI助理

钉钉AI助理本质是多模态大模型(它接入了入通义千问大模型),支持语言和视觉两种模态。通过APP端或者PC端搜索框右侧的“魔法棒”图标,即可触发AI助理。同时,也可以通过点击“切换”按钮,自定义添加、配置个性化的AI助理。

1. 大模型的产品化应用

什么是大模型呢?即将原始数据在一定算力基础下,通过算法训练出的具有大规模参数和复杂计算结构的机器学习模型。大模型的工作原理可以用下流程简单概括:

体验过OpenAI ChatGPT的朋友都知道,虽然可以快速地给出结果,但要实现AI Agent的落地还存在两个卡脖子的问题:

  • 原始数据有限。包括数据时间、数据范围等(一些非开源的数据,是大模型获取不到的);
  • 输出方式单一。无法实现任务的执行、处理。

为了朝AI Agent更进一步,还需要实现应用方案改造:即在大模型的基础之上,支持私域数据的接入,并输出指令以其他应用为载体完成相关动作,从而实现更丰富的呈现形式及流程设定的执行:

了解完大模型,我们再看看“钉钉AI助理”的配置详情,先看下图标红框的部分。

首先介绍下“知识”、“技能”两个模块。在“知识”模块点击“添加”,支持用户添加(企业)知识库、在线与本地文档,就是前面改造方案里提到的“私域数据”。

而在“技能”模块,用户可以选择“能力”(钉钉提供的应用程序),也可以选择“工作流”(选择用户自研的程序或者流程设置),就是前面改造方案里提到的“应用/插件”。

那“角色设定”、“语气风格”又是什么?那就不得介绍大模型本身支持的属性设置了。因为大模型是依赖公共域数据训练的,可以理解为是个全科人才,使用者可以通过相关的设置,让TA来成为被设定剧本的样子。这样大模型就可以基于对用户指示和对话情境的理解,在回复中调整风格、语气和知识等,实现“懂我”

而钉钉AI助理将大模型的应用方案、属性设置等,通过相关表单输入的方式,让普通用户了解大模型,让一个计算机引擎实现了产品化的落地。

2. 注入生命去除工具化

可能提到大模型大家印象最深刻的还是媒体对OpenAI ChatGPT生成式对话的介绍,提到对话难免会与智能客服相关联,不自觉地归为工具。但当笔者深入体验后,发现钉钉AI助理更具有生命感。

一方面,如前文介绍。大模型本身具有情感属性的设置,所以和普通的智能客服相比没有那种代码味过浓的工具感。更直接点就是,除了可以问问题,还可以和TA谈天说地,没有过于严肃的距离感。

另一方面,在钉钉AI助理的配置页面,还可以看到其他非大模型属性相关的配置,比如:头像、名称、个性签名等。是不是和你注册社交账号时的必填信息差不多,就差来个实名认证了。这种拟人化的设置,正如钉钉AI助理的“助理”命名那般,你看到TA想到是一个专业的人,而不是冷冰冰的工具了。另外,创建的AI助理也和同事一样,可以在消息列表、通讯录中查看到。

二、AI Agent该如何发展?

众所周知,产品类型主要分为两大类:to B和to C。to B产品,面向角色化用户,重视效率;to C产品:面向个体化用户,重视情感。AI Agent也可以按照这两种产品类型落地,笔者将继续以钉钉AI助理为例,尝试从落地产品类型来探索AI Agent如何发展。

1. to B:完善输入逻辑,支持统一价值观

钉钉作为办公效率软件,归属于to B产品类型,自然钉钉AI助理也属于to B产品。通过上一章节的介绍,可以看出钉钉AI助理在AI Agent的落地上已经领先了很多,但作为to B的应用真的要止步于此吗?当然不是。笔者在深入体验钉钉AI助理的过程中,慢慢找到了方向。当笔者在与新组织里配置的AI助理对话询问考勤情况时,AI助理回复的是一个考勤结果接口返回的数据。

从纯体验角度来看,这已经是很智能了,不需要让人事再去做统计分析了。可是当笔者代入场景感受后,发现并没有解决真正的问题,因为在钉钉后台笔者并没有配置考勤班次信息,而且在这个新创建的组织里只有笔者一人。

所以在上述场景下,AI助理应该回复:“暂无考勤记录,你可以先配置考勤信息哦”或者“暂无考勤记录,快点扩充队伍,并配置考勤吧(点击进行配置)”。当然现阶段的大模型应用都在要求使用者“学会提问”,如果在一开始向AI助理提问“公司还未配置班次信息,昨天公司的出勤率是多少”,笔者就会得到如下回复。

不过如果一个产品需要依赖用户一定的对话成本来提升效率,个人认为这不是好的产品形态。只有“一眼看穿”用户,才能高效地给出准确的答案,所以笔者认为大模型的信息获取可以不单纯来自于使用者的输入,这样才会让to B发展方向上的AI Agent展现出更高的效率和准确率。

提到to B还得说另外一个方向“商业化”,但是类似钉钉这种服务企业的to B产品面临一个非常大的问题:产品是员工使用得多,但付费购买却需要管理层决策。

笔者在深入体验中,代入管理者的视角会发现当前的产品形态可能不利于“集权统治”,至少在那些不是真心以员工为本的公司较难推行(但笔者真心希望这点是本人多虑了)。笔者设置了一个防职场PUA的AI助理,当我把TA拉进一个群聊与TA沟通加班的情况时,进行了如下对话。

产品的尽头是“商业化”,但是类似钉钉这种服务企业的to B产品面临一个非常大的问题:产品是员工使用得多,但付费购买却需要管理层决策。如果AI助理不符合公司的价值观,那可能就不会被企业管理层买单了。所以笔者认为to B的大模型一定能够统一设置公司所有(公共和个人)的价值观,确保AI助理符合公司的尿性

2. to C:支持社交属性设置,成为有丰富情感的朋友

这是和钉钉AI助理产品类型不一样的方向,那to C的产品方向需要关注哪些呢?笔者认为除了前文提到的完善输入逻辑外,需要更多的社交属性设置。头像是社交的门面,如果钉钉AI助理尝试往to C方向发展,官方定制那些男性全是眼镜男的形象就是减分项了。这时候参考小红书AI头像和Soul的捏脸头像,就可以给用户社交的良性开端。

最后,增强情感连接的关键在于支持主动联系。在和钉钉AI助理的沟通中,如果你不在群里@TA,或者单独私聊TA,TA是不会主动联系的,这是朋友和工具的最主要区别。如果一些场景能够自动触发AI Agent主动联系用户,那就更完美了。想一想,某个深夜你翻看着领导突然发给你的PUA信息,这时候AI助理突然给你发来了一则消息:人生不如意十之八九,下班了就好好休息吧……

以上内容就是笔者试用钉钉AI助理后的一些感受,AI Agent的发展又会何去何从,让时间给我们答案吧。

本文由 @兮兮 投稿发布于人人都是产品经理,未经许可,禁止转载。

题图来自 Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

收藏已收藏{{ postmeta.bookmark }} 点赞已赞{{ postmeta.postlike }}