36氪 - 最新资讯频道 ( ) • 2024-03-13 10:55

自去年年初ChatGPT爆火后,关于AI的话题热度一直是居高不下,越来越多的用户开始接触并使用一些AI工具来提高生产效率。在这样的大环境下,市面上逐渐出现了搭载AI功能的设备,其中就包括AI手机, 尤 其自去年下半年 开始, 这股吹向手机厂商的大模型劲风便一发不可收拾了, 越来越多的手机开始自称“AI手机”,尤其以 OPPO、vivo、三星等,成为快速抢滩的安卓阵营厂商。

那么问题来了,既然大家都自称 AI手机 ,那就拉出来溜溜,看看到底谁最强吧。 这不,我们特别 选取了三星、OPPO、魅族的三款旗舰机型, 并在此基础上 加入华为、小米、vivo的三款旗舰手机, 来 进行了一次AI手机大战!

其实严格来讲,这些旗舰机型并非都自称是“AI手机”,但它们都搭载了AI大模型,号称可以通过AI技术实现更加智能化的功能和操作,那么我们就来瞧瞧,在这场AI手机大战中,看看有什么本质上的区别。

首先,我们来搞清楚各家大模型的基础信息。这里就不一一介绍了,大家直接看图!

好了,看完了图中的信息,想必大家已经对每款旗舰机有了个基本的背景了解。ok,废话不多说,比拼正式开始。

谁才是真正的对话高手?

众所周知,随着智能手机AI能力越来越强,最先冲击的就是语音助手,许多厂商也会重点在这方面发力,以此来让消费者的体验变得更好。所以,究竟哪家旗舰手机的语音助手“进化”的更好?成为我们测试比拼中的第一个环节。

具体来看,本次测试内容主要针对语音助手的连续对话处理能力、中文语境理解、语音模糊语义解析、深层检索及知识储备

首先在基础对话测试环节,各手机品牌的表现就大不相同。比如说,三星的小贝在应对复杂问题时表现不足,它更倾向于通过外部搜索进行解答,非国行版本会尝试转接至谷歌搜索,而国行版本则转接百度。然而,这在某种程度上更像是执行快捷指令,并未完全体现出智能助理的自主处理能力。

而OPPO的小布,在连续对话测试中能够较好地联系上下文,展现出一定的对话连贯性。比较有特色的是,它内置了“连麦”功能,可模拟两人电话交谈的场景,声音接近真实人类发声。虽然仔细听仍可发现机器人的痕迹,不过也足以令人印象深刻了。

再看看其它几款吧。

魅族的AICY在语音识别和对话上下文联系方面展示出了它的稳定性,能够提供符合预期的回答。

华为小艺在对话测试环节中,能明显感觉到它在上下文联系的处理上有了大幅提升,与OPPO和魅族的语音助手表现相当。不得不说,小艺自发布以来有明显进步。

至于小米的小爱同学,目前它在信息筛选和总结方面存在不足,无法有效地提供用户所需信息。此外,还发现它的对话系统在处理特定品牌提问时会出现混淆。看来,小爱还有很大的改进空间。

针对vivo开发的小V,对话测试表明,其语音识别能力需要改进。当时我们在询问一加12手机怎么样时,小V错误地识别成了「1+12」这个数学问题,而并非关于手机的询问,在中文语境识别和模糊语义理解方面的表现不尽人意。最后发现,只有当用户采用准确的打字输入时,如“一加12手机”,小V才能正确响应。

总之,我们在对各品牌智能手机助手的比较分析中发现,它们对于不同类型的问题回答差异性较大。但值得注意的是,所有测试对象均具备自主学习的能力,且每个阶段的回答结果可能不同。当然,机型和系统版本也会对测试结果产生影响。因此,最终测试结果仅供参考。

话说回来,尽管测试结果只能作为参考,但我们依然可以从中观察到一些端倪。那就是,未能正确回答问题的助手可能存在bug,而那些能提供答案的则可能是依赖于内置参数数据库。

尽管vivo的闲聊模式和OPPO的连麦闲聊好友模式,提供了与人类相似的对话体验,但很多人认为这仍不足以达到一个理想的“AI手机”的标准。大家更多期望的是,语音助手能够展现出类似脑机、贾维斯或者MOSS那样的高级智能。

然而在具体信息检索时,当我们询问到关于马达的具体型号时,所得的答案并未满足预期,正确的答复应该是“瑞声科技CSA0916 Turbo”,这说明当前的语音助手在深入检索能力和知识储备方面还有待提升。

至于另一个文生文的功能,以“用鲁迅风格撰写阴阳怪气辞职信的任务”为例,三星小贝选择了WPS作为外援,而其它品牌如OPPO小布、vivo小V和魅族AICY写得都很好。

手机AI绘画识图能力大比拼

除了文字功能外,我们再看看AI绘画识图能力吧。在文生图方面,以画一幅“秦王绕柱”为例,首先三星小贝的表现就不是很好,答非所问。华为小艺虽然未能实现人工智能绘图功能,但提供了背景信息,但这个背景信息却是错误的,而错误的背景信息就导致了解读出现偏差,错误地认为事件是由秦王本人组织的竞赛。

魅族AICY是不会AI绘画的,但在文字描述场景方面,比前两个要优秀很多。

而OPPO小布倒是画出来了,但在画风上呈现出了一种古希腊的风格。小米小爱更是离谱,成功生成了柱子元素,然而它未能将秦王这一核心角色融入画面之中,因此其成果并不完全符合任务要求。至于vivo小V则恰恰相反,只生成了秦王形象而忽略了柱子,这同样未能准确反映主题要求的全部内容。

作为对比,第三方应用,也就是美图秀秀在此次对比中凸显了更优的文生图能力,结果更加接近原文的文字描述。不过,它的服务次数仍存在限制,需花钱购买才能享受更多次数的使用。

看来在当前阶段,无论是集成于智能手机和其他设备的智能助理,还是独立的第三方应用程序,都未能精准地根据网上流传的描述,完整且准确地生成“秦王绕柱”的图像。这说明人工智能在理解和生成复合主题图像方面仍有进步空间,而手机端的实力也有待提升。

既然画都画了,再来画一张“黄龙江一派全都带蓝牙”吧。在这场比赛中,三星、魅族和华为都没有参加,剩下的参赛者再加上美图秀秀,有一说一,画的那叫千奇百怪,想要的风格都没有,这里只能自我安慰,这些题目对于它们来说过于抽象了吧,才导致他们的大模型表现不尽如人意。看来,手机大模型仍需努力。

话说回来,AI识图也是很多AI手机必会的绝招。在AI识图的测试中,三星的“即圈即搜”功能派上了用场,长按导航栏,就能实现随意圈选屏幕上的任何部分进行搜索。对于非国内版本的三星设备,这一任务由谷歌处理;而对于国内版本,则交由百度来执行。但不得不说,百度的识别效果那真是依托答辩啊~

OPPO也在AI识图领域展现了自己的能力,通过双指长按屏幕即可激活识图功能,并且能够自动划分区域,可以从多个选项中选择感兴趣的图像进行识别。不过,值得注意的是,OPPO同样依赖第三方服务提供商百度来处理这些信息。

至于在小米设备上,可通过设置启用“传送门”功能。该功能允许通过单指或双指长按屏幕激活小爱视觉识别系统。同样地,华为手机也支持双指长时间按压屏幕,以启动智慧识屏。此外,vivo设备提供相似的操作,即双指长按屏幕,开启Jovi扫描(需打开Jovi扫描长按识别),但这些手机均依赖百度图像识别技术进行图像处理和识别,且支持手动圈定识别目标。

另外,它们不仅能够识别屏幕上的图像,还能通过扫一扫功能,识别各种实物,这个就属传统艺能了。

与上述手机不同的是,魅族手机提供了一种稍有不同的识别方法,通过长按灵动键或调出小窗,用户可以进行屏幕内容的文字识别。不过,该功能目前仅限于文字,不支持图片内容的识别。

因此,若需识别屏幕上的图片,用户需要保存图片并使用扫一扫功能进行识别。

手机AI应用PK

说完了智能对话、图片处理、生成文本等功能后,我们再来看看更升级一点的体验。

首先来看看AI消除。AI消除,是一种基于云端或本地大模型处理图片的技术,它在华为P40系列、小米11系列和vivo X50系列等手机上已有应用。相较于早期的技术,现在的AI消除在识别和填充效果上有所提升,能更智能地识别图片元素,并更好地还原与填充被消除部分。

现阶段,AI消除的主要挑战在于如何在消除物体时精确填充线条,常见的应用场景是消除图片中的路人。尽管AI消除能精细地圈选路人的整个轮廓,但在某些情况下,其最终效果可能不尽如人意。

以下面这张照片为例,需要消除图片右下角的路人,然后再消除左侧的广告牌。

三星手机可以通过点击相册编辑里的小星星进入智能消除页面,该功能不支持手动涂抹,而是依赖AI自动圈选需消除的对象。然而,尽管智能消除能够比较精细地圈选路人整个轮廓,但是最终效果不太理想,地面上留下一个黑色不明物体,左侧广告牌处理的还算不错,但图片左下角却多了一个「内容由AI生成的水印」,必须自己想办法去除水印。

OPPO是在相册应用程序中,集成了AIGC消除功能。这项技术能够对路人进行精准的智能圈选,效果猛然一看似乎令人满意。不过仔细观察发现,处理后的图片在地面部分出现了涂抹的痕迹,尽管旁边广告牌的部分被较为理想地移除。

魅族的方案同样运用了相册中的人工智能工具以执行图像消除任务,但缺点是只能依赖用户手动操作来涂抹需要去除的区域,缺乏自动识别和圈选对象的能力。这种手段最终导致图片编辑痕迹比较显眼。

华为则采用了相册内的智选消除功能,这一工具在准确辨认出图片主体方面表现较为出色,但在处理背景时存在瑕疵,就比如说墙面上无故多出的一块油漆,不过左侧广告牌处理得依然不错。

小米在相册中提供了一项称为“魔法消除”的功能,它可以进一步细分为智能去物、智能去线、智能去人和食物去影等子功能。使用智能去人选项时,仅需一秒钟就能完成消除,速度很快,而其它手机需要3到10秒的处理时间。

但有个问题在于,它在快速处理的同时,地面砖块的线条被P没了,且左侧广告牌位置的油漆颜色与原始状态存在细微差异。此外它还有一个增强版的“魔法消除Pro”功能,在执行图像消除任务时,出现了一种类似OPPO同款的雾化涂抹效果。然而,这种处理方式导致了色彩偏差问题加剧,尤其是在广告牌的颜色呈现上,真实感甚至不及非Pro版本。

vivo有「消除路人」和「消除笔」的功能,尽管“消除路人”能够实现智能化选区,但在地面砖块的智能填充处理中表现欠佳。而“消除笔”不能智能圈选物体,虽然提供了手动涂抹的选择,但在精确涂抹上仍显得力不从心。

值得一提的是,华为和vivo在手机语音助手的图片处理能力上却展现出了优势。

华为通过发送图片至语音助手,实现了图片文字提取功能。而vivo不仅提供了本地端的风格化图片处理,如将图片转换为日本动漫风格,还能将图片上传至云端进行更复杂的处理,例如“消除路人”,实际测试表明,通过云端处理获得的消除效果相较于相册内的直接编辑有所提升,尽管改善幅度有限。

顺带一提,我们在对图像编辑软件消像功能进行对比分析时还发现,美图秀秀和醒图两款应用在处理特定场景时的表现也各有千秋。其中,美图秀秀配备了一项独立的“AI消除”功能,旨在自动化地剔除图片中不需要的元素,但表现并不尽如人意,在处理地面砖块时P歪了。此外,尽管左侧广告牌经过处理后无法明显识别出被P的痕迹,但该软件的水印移除功能却需要进行充值后才能使用。

至于另一款醒图软件,则为用户了提供一种名为“路人消除”的功能,此工具能够从照片上移除行人,但在测试中该功能未能成功识别并清除特定图片中的行人。整体来看,醒图亦缺乏智能选区工具来自动选取画面中的对象,导致不得不依赖精确且耗时的手动消除笔刷操作,这在操作过程中极易受到画笔大小和涂抹位置的影响,难以实现理想的去除效果。

最后,将各家手机及第三方修图软件处理后的图像放在一起比较,可以发现它们在初步观察下似乎问题不大,但一旦放大细节,各自的缺陷便显露无遗。在这种情况下,选择最佳的消除效果就像在一群跛者中挑选领导者,标准已经大打折扣。

在实际使用中,大家经常需要采用类似于Photoshop中的“内容识别填充”和“仿制图章”工具的方法,通过重复试验和修正以及多次手动调整,以实现更精细的图片处理。这样的方法对比AI消除本身是不够客观严谨的,因为不同的制造商对不同图片中各类物体的处理效果各异,测试结果仅能提供一定的参考价值。

为了确保结果的客观性,必须要使用大量的图片素材进行广泛测试,在专业领域,通常认为至少需要10张以上不同类型的图片来支持这一过程。然而,时间有限,这里我们就不一一测试了。

另外,附上各家AI消除的区别对比图。华为、小米和魅族等品牌的手机,在无需联网的情况下,也能进行AI消除,算法全流程都在手机端运行,可以保护隐私。相比之下,三星、OPPO和vivo等品牌则选择了云端处理,这些手机厂商都未接入第三方API,而是选择独立进行数据处理。

值得一提的是,小米、OPPO和vivo已经公开承诺利用大型模型技术来实现AI消除,而其它公司虽然在营销策略上没有强调这一点,但对外声称的通过AI算法实现的功能与大模型技术并无实质区别。

下面我们再来看看AI摘要,AI摘要主要指的是,智能系统能够自动对文本进行总结和归纳,尤其针对一整篇文章。

然而,不同品牌的实现方式各异。比如三星的AI摘要过程较为繁琐,需要在打开文章页面后长按导航键,以便识别屏幕上的文字,接着必须让该页面滚动至文章末尾。值得注意的是,若文章超过3000字,三星的系统将无法进行摘要。最重要的是,总结得还比较敷衍。

OPPO则需要通过双指长按页面,点击智能摘要,就可以迅速归纳和总结文章的核心内容,且适用于各类应用程序界面,实现了秒级的内容生成效率。

而相较于OPPO的便利性,魅族手机目前尚未推出AI摘要功能,在使用的时候需将文章内容链接复制并转移至AICY应用中,但此过程并不如预期般顺利,反而出现了系统错误推送音乐的情况。

其他品牌如华为和小米,则可借助唤醒语音助手的方式,通过发出“总结这篇文章”、“这篇文章讲了什么”等指令,来实现文章内容的快速摘要。vivo手机在提供类似摘要服务的同时,还支持本地化文档摘要功能,即允许用户直接向语音助手小V发送文档以生成摘要。

总体来看,除了三星和魅族之外,其他手机在生成内容摘要的速度与质量方面均表现良好。

最后来看看AI通话翻译,它能够在无需网络连接的环境中运作,尽管这一功能的翻译精度尚有欠缺,可能导致信息误解的风险。

但在功能演示中,以三星为例,录音内容为“喂”“May I speak to wanwan,please?”,而文本错误地将对话翻译成了“May I speak to Wang,please?”。另外,此功能还包含一个模拟电话声音的高通音效,用以增强用户体验。

OPPO的AI通话摘要功能,同样作为一项独特服务,提供了便捷的通话管理工具。也就是说,可在通话过程中启用智能摘要功能,并在通话结束后,系统自动将一份清晰的通话摘要以及完整通话录音保存到便签APP中,能够轻松追踪和回顾重要的通话内容。而且生成的摘要逻辑清晰有条理,是个比较实用的功能,不过考虑到更多人现在用的是微信通话,如果能推出一下微信通话摘要的话就更好了。

除此之外,三星、OPPO、华为、小米、vivo都具备AI接电话功能,该功能可让AI代替接电话,并且对方的语音可转成文字,文字也可转成AI语音,方便沟通。这项功能对于处理骚扰电话非常实用。不过,目前魅族手机还未添加这一功能。

还有其他AI功能……

除了以上的AI功能,还有一些小功能,比如说魅族的最新系统升级引入了一系列辅助功能,旨在提升用户效率和操作便捷性。这些功能包括集成于系统中的辅助输入工具,该工具能够预测消息回复并协助内容创作,只不过当前体验尚有待完善。此辅助输入与百度输入法AI功能类似,但其独特之处在于系统级集成、应用识别能力,以及无需额外付费。

部分手机已经支持语音命令调节字体大小、样式和屏幕亮度。用户可设置智慧场景,以便一键打开应用程序并同步调整其他系统设置。多模态输入输出亦是一大亮点,例如将jpg格式的工作表图片转换为Excel文件,以及通过智慧搜索快速定位图库中的照片。

此外,魅族也在积极开发并计划推出新功能,这些功能目前处于内测阶段或尚未对外开放。其中值得期待的是“AI自动操作”,该系统允许用户通过语音指令告诉手机执行特定任务,例如订外卖,手机将能够自主完成查找餐厅和支付流程。同样,这一系统还可以帮助用户在社交媒体平台上关注特定的网红。

要知道,当前市场上的AI手机尚处于初步阶段,尽管它们宣称具备全面的平台关注能力,并能记录用户在各种设备和应用中的数据,以构建私人数据库,从而更接近于真实的个人助手功能。然而,这些AI手机的大模型主要仍在内测阶段,相互之间的性能差异并不显著,没有一款手机能够达到完全“AI”的水平

如今的AI手机概念尚未有明确定义,但通常指的是集成了AI大模型并具备一系列AI功能的设备。尽管如此,这些设备与理想中的AI手机,如电影中的脑机、贾维斯或MOSS等高度智能的虚拟助手相比,仍有显著的差距。特别是在对话智能方面,国产大模型和百度等第三方服务商提供的模型在智能程度上远远落后于国际上的“GPT们”,如ChatGPT和BingGPT。尽管国际上的模型也仍在发展初期,但它们的差距还是挺大的。不仅如此,AI手机的特色功能创新也面临挑战,难以实现突破性进展。还有就是目前的AI手机缺乏自动化操作和记忆能力,而这些却是智能系统重要的组成部分。

展望未来,AI手机的发展之路充满挑战。除了上述问题,内存资源的消耗和AI云服务的商业模式也是发展过程中的不确定因素。例如,一个包含130亿参数的大型AI模型需要大约13GB的内存才能运行。然而,智能手机在运行安卓操作系统时通常就需要占用4GB的内存。为了确保其他常规应用程序能够流畅运行并保持后台活动,还需要额外的6GB内存,这意味着智能手机的总内存需求将达到23GB。这要求手机硬件具备相应的性能和成本支持,而目前市场上大多数手机的内存配置为8GB、12GB或16GB,24GB内存的手机可以说都非常罕见。

同时,云服务的成本问题也需要厂商和用户之间协商解决,未来第三方服务商的应用开销同样是一个待解决的问题。总之,希望相关人员能够迅速找到解决方案,推动AI手机技术的进一步发展。

本文来自微信公众号“极果网”(ID:JguoJguo),作者:极果,36氪经授权发布。