澎湃新闻 - 首页头条 ( ) • 2024-06-30 13:34

文图扫描如何实现“所得”超越“所见”,解决阴影、脏污、印刷和手写文字混杂所带来的困扰?人形双足机器人在人工智能大会上将带来哪些惊喜?

2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)将于7月4日在沪开幕。日前,澎湃新闻(www.thepaper.cn)记者提前对相关亮点展品进行了探访。

一键去除干扰因素,让扫描“所得超所见”

数字化时代,扫描工具正变得越来越智能和个性化。无论工作中还是在旅途里,人们经常会使用手机扫描褶皱、脏污的文件。

手机扫描效果的优劣,与文档本身的清晰度、拍摄环境与硬件等因素密切相关,也受到诸如手部遮挡、阴影、拍摄角度引起的畸变等因素的影响。在实际中,文档本身存在的透字、页面模糊、清晰度不足等“不可抗力”也会影响扫描的效果,比如尘封已久的资料、褶皱的文档、热敏纸上逐渐褪色的文字,即使用户反复调整拍摄角度和滤镜,也无法获得清晰的扫描效果。

本届世界人工智能大会上,合合信息将展示扫描全能王最新升级的智能高清滤镜2.0版本功能,该功能可智能研判图像问题,一键去除十余种干扰因素,显著提升文档画面清晰度。

一张矿物宝石分类图,拍摄扫描后宝石名称可以横平竖直的文档顺序显示。澎湃新闻记者 俞凯 图

据扫描全能王事业部产品总监许昌华介绍,扫描全能王智能高清滤镜2.0版本升级了图像增强能力和图像清晰度,实现了多方向文字提取,用户只需点击拍摄按钮,便可自动生成一张如原稿般清晰平整的图片。

比如拍摄扫描一张矿物宝石分类图,图上呈圆形放射状排列的宝石名称可以轻而易举地以横平竖直的文档顺序显示在手机屏幕上,方便阅读、修改和存储;拍摄一张存在透字和手指“闯镜”的笔记或者作业时,智能滤镜可以很聪明地只保留本页上的文字内容,智能去除透字和手指影像。如果一张名校的考卷已经被人做了答题和红笔批改,借助生成式AI技术,拍摄扫描后可以马上得到一张高清晰度的空白考卷,不用再费力费时地重新誊抄,达到事半功倍的效果。

已经被人做了答题和红笔批改的考卷,拍摄扫描后可以得到一张高清晰度的空白考卷。澎湃新闻记者 俞凯 图

这款人形机器人可以烤面包片、熨烫衣服

具身智能有哪些应用场景和前沿成果?在本届世界人工智能大会上,特斯拉、达闼将首发首展最新一代人形机器人。

据介绍,达闼机器人研制的最新人形双足机器人XR4(又名“七仙女”小紫)将在本次大会首秀。这款身高165厘米、体重75公斤、采用碳纤维复合材料打造的全尺寸双足机器人,采用自研智能柔性执行器SCA和独创的串并联混合结构,融通信、计算、传感于一体,最大峰值输出力矩800NM。这款手眼足协同具身智能人形机器人采用直腿拟人行走步态,行走速度0.5米/秒。

人形双足机器人XR4“七仙女”小紫。受访者供图

值得一提的是,“七仙女”小紫拥有超过60个智能柔性关节,手臂可承载10公斤重物,通过模仿学习和基于数字孪生的强化学习,展现出卓越的稳定性。借助14组力触感知单元,小紫拥有感知、认知、推理、决策能力,手部尺寸操作灵活,可以轻松拿起鸡蛋和纤薄的扑克牌,也可以双手协作完成烤面包片和装盘、熨烫衣服等精细活,并且能通过自认语言的方式听懂人类的指令并完成具体任务,在工业制造、家庭养老和商业服务等多个领域大有可为。

达闼方面透露,小紫机器人将会在本次世界人工智能大会上与观众见面互动,并进行限量预售。

小紫机器人手部尺寸操作灵活,可以轻松拿起鸡蛋和纤薄的扑克牌。受访者供图

小紫机器人也可以双手协作完成烤面包片和装盘、熨烫衣服等精细活​。受访者供图

达闼的另一款人形机器人Cloud Ginger也将在本次大会首次展示其在机场厕所清洁方面的新应用。凭借图像识别和深度学习技术,这款机器人能够精准识别污渍、自主规划清洁路径,实现高效细致清洁。

本次大会上,特斯拉首发的人形机器人擎天柱二代(Optimus)采用视觉感知方案和神经网络技术,以完成路径规划、物体识别等核心功能,相较一代拥有更大自由度,甚至可以用它来完成煮鸡蛋等精细活。

届时,参观者还将能看到傅利叶展出的商业化量产GR-1人形机器人、星动纪元针对制造业及服务业等商用场景推出的全尺寸人形机器人XBot-L、自重仅48kg的钛虎轻量化人形机器人T170A,以及能广泛适用于科研教育、医疗物流、特种场景、家庭服务等行业领域的乐聚KUAVO开源鸿蒙人形机器人。