机器人学会利用声振动来感知物体
想象一下,你坐在黑暗的电影院里,想知道你的大杯子里还剩下多少苏打水。你不用撬开盖子查看,而是拿起杯子摇晃一下,听听里面有多少冰在晃动,这样就能大致判断你是否需要免费续杯。

你放下饮料,心不在焉地想着扶手是不是真木做的。然而,敲了几下,听到空洞的回声后,你断定它一定是塑料做的。
这种通过物体发出的声波振动来理解世界的能力是我们无需思考就能做到的。研究人员即将把这种能力带给机器人,以增强它们快速发展的感知能力。
杜克大学的新研究将于11月6日至9日在德国慕尼黑举行的机器人学习会议(CoRL2024)上发表,该研究详细介绍了一种名为SonicSense的系统,该系统允许机器人以以前仅限于人类的方式与周围环境互动。该研究结果发表在arXiv预印本服务器上。
“如今的机器人主要依靠视觉来解读世界,”论文第一作者、杜克大学机械工程与材料科学教授陈博远实验室一年级博士生刘嘉勋解释道。“我们希望创造一种解决方案,可以处理日常复杂多样的物体,让机器人拥有更丰富的‘感受’和理解世界的能力。”
SonicSense的机器人手有四根手指,每根手指的指尖都嵌入了一个接触式麦克风。这些传感器可以检测并记录机器人敲击、抓握或摇动物体时产生的振动。由于麦克风与物体接触,机器人可以屏蔽环境噪音。
根据交互和检测到的信号,SonicSense提取频率特征并利用其先前的知识,结合人工智能的最新进展,确定物体的材质及其3D形状。如果是系统从未见过的物体,系统可能需要20次不同的交互才能得出结论。但如果是数据库中已有的物体,它只需4次就能正确识别。
“SonicSense为机器人提供了一种新的听觉和感觉方式,就像人类一样,它可以改变当前机器人感知和与物体互动的方式,”陈说,他也有电气和计算机工程以及计算机科学的职位和学生。“虽然视觉是必不可少的,但声音增加了信息层,可以揭示眼睛可能错过的东西。”
在论文和演示中,陈和他的实验室展示了SonicSense的多项功能。通过转动或摇动一个装满骰子的盒子,它可以计算出里面的骰子数量和骰子形状。通过对一瓶水做同样的事情,它可以知道里面有多少液体。通过轻敲物体的外部,就像人类在黑暗中探索物体一样,它可以对物体的形状进行3D重建,并确定它是由什么材料制成的。
虽然SonicSense并不是首次尝试使用这种方法,但它比以前的工作更进一步,使用四根手指代替一根手指,使用触摸式麦克风来消除环境噪音和先进的AI技术,效果更好。这种设置使系统能够识别由多种材料组成的物体,这些物体具有复杂的几何形状、透明或反射表面,以及对基于视觉的系统具有挑战性的材料。
“虽然大多数数据集是在受控实验室环境中或人工干预下收集的,但我们需要我们的机器人在开放实验室环境中独立与物体互动,”刘说。“在模拟中很难复制这种复杂程度。受控数据和现实世界数据之间的差距至关重要,而SonicSense通过使机器人能够直接与物理世界的多样化、混乱的现实互动来弥补这一差距。”
这些能力使SonicSense成为训练机器人在动态、非结构化环境中感知物体的坚实基础。其成本也非常低;使用音乐家用来录制吉他声音的相同接触式麦克风、3D打印和其他市售组件,构建成本保持在200美元以上。
未来,该团队将致力于增强系统与多个物体交互的能力。通过集成物体跟踪算法,机器人将能够处理动态、混乱的环境,使其在现实任务中的适应能力更接近人类。
另一个关键发展在于机械手本身的设计。“这只是一个开始。未来,我们设想SonicSense将用于更先进的机械手,具有灵巧的操控技能,使机器人能够执行需要细致触觉的任务,”陈说。“我们很高兴探索如何进一步开发这项技术,以整合多种传感模式,例如压力和温度,以实现更复杂的交互。”
推荐阅读
- alfa romeo车标含义?(阿尔法罗密欧车标)
 - 华为鸿蒙os如何操作 华为鸿蒙os2.0系统官网报名入口
 - 14款沃尔沃s60l二手车能买吗?(沃尔沃s60为什么贬值厉害)
 - power mp3 wma converter(mp3格式转换器)软件介绍(power mp3 wma converter(mp3格式转换器))
 - 42岁李贞贤宣布平安生女,网友:歌声击退山贼的那个
 - 热火朝天的高铁WiFi迟迟未到(5G能否破局)
 - 华为手机性价比最高是哪几款2022? 华为哪款手机性价比高最值得入手
 - 进口捷豹全部车型报价?(捷豹报价大全价格表)
 - 韩庚江铠同疑相恋,两人同游马尔代夫遭曝光
 - 八卦格字帖软件介绍(八卦格字帖)
 - 虚拟机 操作系统(操作系统整合:虚拟机管理程序的下一步)
 - 比亚迪f6参数配置?(比亚迪f6)
 - 奥沙利文获世锦冠军,奥沙利文得了几次世锦赛冠军
 - Evel Knievel手游游戏介绍(Evel Knievel手游)
 - 索尼wi1000x拆解(SONYNZW-X1000系列高清拆解图集)
 - 4座硬顶敞篷跑车都有哪几款?(4门4座硬顶敞篷车推荐)
 - 艺术体操团体全能决赛,艺术体操团体全能决赛中国
 - 工人物语6通用修改器游戏介绍(工人物语6通用修改器)
 - 简述电机换向器的工作原理图(简述电机换向器的工作原理)
 - Atheros-AR5007EG无线网卡驱动软件介绍(Atheros-AR5007EG无线网卡驱动)
 
