问题——衣物“柔性难题”制约服务机器人落地 家庭服务、酒店保洁、养老照护等应用中,“把散落或堆叠的衣物整理归位”是高频需求;然而,相比纸箱、餐具等刚性物体,衣物意义在于形态可变、褶皱随机、遮挡严重等特征,同一件衣服在不同堆叠状态下外观差异大、抓取反馈不确定,导致机器人在“从衣堆中取出指定衣物”该步就容易失败。特别是长裙、外套等长条柔性物体,单臂抓取时容易拖地、卷带邻近衣物,进而引发二次混乱与重复搜索,成为影响实际应用的关键瓶颈。 原因——“看得见”不等于“听得懂、抓得稳、拿得准” 业内既有方法往往偏重图像层面的识别与分割,能够在一定程度上“看见衣物”,却难以把用户指令中的语义约束转化为可执行的操作策略:一上,指令往往涉及颜色、类别、位置等复合描述,需要遮挡与相似纹理中做可靠判别;另一上,即便选对目标,抓取点选择仍受褶皱、重心与接触摩擦影响,单靠规则或经验很难兼顾成功率与对周边衣物的扰动。此外,衣物被提起后的形态会快速变化,系统若缺少对“是否过长”“是否夹带多件”等状态的线判断,就难以决定是否需要双臂配合,从而影响稳定搬运与后续折叠、悬挂等操作。 影响——从“能抓”走向“会整理”,是服务机器人能力升级的分水岭 衣物整理看似琐碎,却牵动服务机器人从展示性任务走向持续性任务的关键能力:其一,衣物操作要求在复杂遮挡中做目标检索与顺序决策,考验感知与规划的融合;其二,柔性物体的形态变化要求系统具备在线反馈与纠错能力;其三,整理任务通常需要与人共处环境,涉及安全、卫生与效率,直接关系到产品化落地的可行性。若能在“衣堆取衣”环节形成稳定可靠的方法,将有望带动衣物分类、折叠、入柜等更长链条的自动化,拓展服务机器人在家庭与机构场景的应用边界。 对策——“视觉—语言—可供性”一体化管线+状态感知双臂协作 针对上述痛点,北京大学团队提出GarmentPile++方案,核心思路是把杂乱衣物从“不可枚举的柔性状态”转化为可检索、可推理、可执行的操作对象,并用三类模块形成闭环。 第一步,明确“拿哪件”。系统首先对衣堆进行全景分割,并结合视觉与语言的联合理解能力,将用户指令映射到候选衣物集合中,再综合暴露面积与遮挡代价等因素确定优先目标。为降低分割误差带来的连带影响,方案引入了“掩码微调”机制:当系统判断某些分割结果存在把多件衣物混为一体的风险时,通过试探性抓取与抖动获取更清晰的观测,再对分割结果进行校正,从而提升单件对应的准确性。 第二步,决定“从哪抓”。在锁定目标后,系统基于点云信息进行可供性评估,输出抓取“热度分布”,倾向选择褶皱中心、受力更稳定且更接近衣物重心的位置作为抓取点,以提高一次抓取成功率,并尽量减少对相邻衣物的误抓与带动。 第三步,保障“怎么拿得稳”。衣物离开堆叠后形态迅速变化。方案通过对抓取过程的视频流进行状态评估,在线判断是否出现“提起后下垂过长”或“夹带多件”等情况。一旦触发阈值,辅助机械臂将对下垂部位进行补抓,形成双臂协同搬运,避免拖地与二次纠缠,为放置到工作台、后续折叠或悬挂创造稳定前提。 团队在开放边界与封闭边界等典型环境中,围绕“顺序取出全部衣物”和“按指令取出指定衣物”等任务进行验证。结果显示,该方案在平均成功率和平均抓取次数等指标上表现较为突出。消融测试更表明,掩码微调、可供性抓取、双臂判定与双臂协作等环节相互支撑,缺少任一模块都会显著影响整体效果。 前景——从“精准取出一件”迈向“自动整理一柜”,仍需跨越工程化门槛 业内人士认为,GarmentPile++在于把“语言指令理解—目标检索—抓取执行—状态反馈”贯通起来,为柔性物体操作提供了可复用的技术路径。下一阶段,若要从实验室走向家庭与机构的真实场景,还需在三上继续突破:其一,提升跨材质、跨款式、跨光照条件的泛化能力,降低对特定数据分布的依赖;其二,强化安全与可靠性验证,尤其是在与人共处环境中对夹手、碰撞、误抓私人物品等风险进行约束;其三,打通与衣物分类、折叠、入柜等任务的流程衔接,实现从“取出”到“整理”的全链条闭环。随着传感器成本下降与硬件平台成熟,柔性物体操作有望成为服务机器人能力升级的重要方向,并在养老照护、家庭家政与公共服务等领域释放更大应用空间。
柔性物体操作的难点在于不确定性,而这种不确定性需要依靠“理解—判断—执行”的系统能力来化解。将语言意图、可供性推理与双臂协作纳入同一决策链条,展现了服务机器人迈向真实生活场景的一条可行路径。未来,能否在安全、成本与泛化能力之间取得平衡,将决定这类方案走向规模化应用的速度与质量。