极悦娱乐  >   公司新闻  >  耗时2年,Meta联手CMU打造最强「通用机器人智能体」!上茶擦碗多面手,轻松泛化100多种未知任务

耗时2年,Meta联手CMU打造最强「通用机器人智能体」!上茶擦碗多面手,轻松泛化100多种未知任务

极悦娱乐 阅读次数:292 次浏览

在迈向「通用机器人智能体」的路上,谷歌凭借RT-2火了一把。现在,Meta、CMU团队耗时2年打造的RoboAgent,用少量数据实现12种复杂技能,烘培上茶擦桌子样样行。爆火的大模型,正在重塑「通用机器人智能体」的研究。前段时间,谷歌DeepMind推出了耗时7个月打造的项目RT-2,能数学推理、辨认明星,在网上爆火了一把。

除了谷歌,来自Meta、CMU的研究人员用了2年的时间,打造出史上最强的通用机器人智能体「RoboAgent」。不同的是,RoboAgent,仅在7500个轨迹上完成了训练。

具体来说,RoboAgent在38个任务中,实现了12种不同的复杂技能,烘培、拾取物品、上茶、清洁厨房等等。甚至,它的能力还能够泛化到100种未知的场景中。可以说,上得了厅堂,下得了厨房。

有趣的是,不论你怎么干扰它,RoboAgent依旧设法去完成任务。

roboAgent究竟还能做什么?

烘焙,上茶,擦桌子全能手

首先,RoboAgent可以很流畅地拉开或关上抽屉。虽然在打开时险些碰倒了酸奶,但动作的衔接上基本没有卡顿,丝滑地完成了推拉的动作。

除了抽屉,RoboAgent还能轻松打开或关上微波炉的门。但它没有像人类一样抓握把手,而是将自己卡进了把手与门之间的空隙中,再使力开合了微波炉的门。

同样地,面对瓶瓶罐罐上的盖子,RoboAgent也能精准拿捏,打开、盖上——绝不拖泥带水。然而在厨房中,除了盖着的调料罐,也有一些需要拧开的罐子,比如料酒和老干妈等等....

好在,对于各种拾取和放置类任务,RoboAgent基本是不在话下的。视频中,RoboAgent从抽屉里拿出东西、又或是把茶包放进杯子里,打开微波炉将碗放进去等。展示的便是RoboAgent能够理解泡茶、加热食物等任务中包含的一系列动作。

对以上九个动作进行排列组合,基本就可以覆盖在厨房中一系列任务。例如为烘焙做准备、打扫厨房、上菜汤、泡茶、收纳餐具等。

为烘焙做准备时,首先要拉开抽屉,然后找到放在里面的黄油。找到后把黄油放到案板上,最后关上抽屉。看起来RoboAgent这一系列动作的前后逻辑顺序已经和真实的生活场景十分接近了。但RoboAgent依旧不像人类一样灵活,先不提人类有两只手,可以一只手拿黄油,另一只手关抽屉。就算只用一只手,人类也可以拿着黄油的同时侧手把抽屉推回去。而RoboAgent只能先把黄油放下,然后才去关抽屉。看起来没有那么灵活的样子。

打扫厨房时,RoboAgent也是四步走:先关上抽屉,再关上微波炉。然后从旁边拿出一个毛巾,最后擦案板。

 

上菜汤时,RoboAgent先打开微波炉,然后从微波炉里拿出放在里面的碗。之后把碗放在桌子上,最后把微波炉关上。但这里RoboAgent的表现就没有那么让人放心了。只能说还好演示视频中的碗是空的,如果真让RoboAgent这样在现实中拿装了食物的碗盆,估计它刚拿起来食物就洒地到处都是了。

不过,RoboAgent对泡茶倒是得心应手:先取开茶罐上的盖子,从里面拿出茶包,然后把茶包精准降落在杯子里,最后捡起盖子放回到罐子上。但这离完美的一杯茶还差了一步:倒水。还是说RoboAgent是在请我们喝有茶香的空气吗?纵观上述RoboAgent的表现,虽然大部分任务都能顺利完成,但只有一只手还是太不方便了。希望Meta和CMU能多给RoboAgent安几只手,这样它就能同时干好几件事,大大提高效率。

 

耗时2年,打造「通用机器人智能体」

Meta和CMU的研究人员希望,RoboAgent能够成为一个真正的通用机器人智能体。历时2年,他们在不断推进这一项目的前进。RoboAgent是多向研究的集合体,同时也是未来更多研究方向的起点。在「通用机器人智能体」发展过程中,研究人员深受许多最近可泛化的机器人学习项目的启发。当前,在迈向通用机器人智能体路上,需要解决两大难题。

一是,因果两难。

几十年来,拥有一个能够在不同环境中操纵任意物体的机器人一直是一个遥不可及的宏伟目标。部分原因是缺乏数据集来训练这种智能体,同时也缺乏能够生成此类数据的通用智能体。

二是,摆脱恶性循环。

为了摆脱这种恶性循环,研究重点是开发一种有效的范式。它可以提供一个通用智能体,能够在实际的数据预算下获得多种技能,并将其推广到各种未知的情况中。

 

 

论文地址:https://robopen.github.io/media/roboagent.pdf

根据介绍,RoboAgent建立在以下模块化和可补偿的要素之上:

- RoboPen:利用商品硬件构建的分布式机器人基础设施,能够长期不间断运行。

- RoboHive:跨仿真和现实世界操作的机器人学习统一框架。

- RoboSet:

一个高质量的数据集,代表不同场景中日常对象的多种技能。

- MT-ACT:一种高效的语言条件多任务离线模仿学习框架。它通过在现有机器人经验的基础上创建一个多样化的语义增强集合来倍增离线数据集,并采用一种具有高效动作表示法的新型策略架构,以在数据预算范围内恢复高性能策略。

动作分块,全新架构MT-ACT

为了学习通用的操作策略,机器人必须接触丰富多样的经验,包括各种技能和环境变化。

然而,收集如此广泛的数据集的操作成本和现实挑战,限制了数据集的总体规模。

研究人员的目标是通过开发一种范式来解决这些限制,该范式可以在有限的数据预算下学习有效的多任务智能体。

如下图所示,Meta和CMU团队提出了MT-ACT,即多任务动作分块Transformer(Multi-Task Action Chunking Transformer)。

这一方法由2个阶段组成:

第一阶段:语义增强

RoboAgent通过创建RoboSet(MT-ACT)数据集的语义增强,从现有基础模型中注入世界先验。由此产生的数据集,可在不增加人类/机器人成本的情况下,将机器人的经验与世界先验相乘。然后,研究人员使用SAM分割目标对象,并将其语义增强为具有形状、颜色和纹理变化的不同对象。

第二阶段:高效的策略表示

生成的数据集是多模态的,包含丰富多样的技能、任务和场景。研究人员将动作分块适应于多任务设置,开发出MT-ACT——一种新颖高效的策略表示,既能摄取高度多模态的数据集,又能在低数据预算设置中避免过度拟合。如下,是MT-ACT策略的各个组成部分。

RoboSet数据集

研究的是建立一个数据高效的机器人学习范例,对此,研究人员将自己限制在一个冻结的、预先收集的小型但多样化的数据集上。为了捕捉行为多样性,研究人员还在不同的厨房场景中,将不同的技能应用到不同的任务中。在这个项目中,数据集 RoboSet(MT-ACT)由人类远程操作收集的7500 条轨迹组成。该数据集包含 12 种技能,横跨多个任务和场景。

 

下图显示了,数据集中技能的分布情况。

虽然常用的「拾取-放置」技能在数据集中占40% ,但也包括丰富的接触技能,如擦拭、盖帽,以及涉及铰接物体的技能(翻转-打开、翻转-关闭)。研究人员在4个不同的厨房场景实例中收集整个数据集,这些场景中包含各种日常物品。此外,团队还将每个场景实例与不同变化的物体进行交换,从而让每个技能接触到多个目标物体和场景实例。

数据增强

由于收集的数据集无法满足对场景和物体多样性的需求,因此研究人员通过离线添加不同变化的场景来增加数据集,同时保留每个轨迹中的操纵行为。基于最近在分割和局部重绘(inpainting)模型取得的进展,研究人员从互联网数据中提炼出真实世界的语义先验,以结构化的方式修改场景。

MT-ACT架构

MT-ACT的策略架构设计为一个有足够容量的Transformer的模型,可以处理多模态多任务机器人数据集。为了捕捉多模态数据,研究人员沿用了之前的研究成果,加入了将动作序列编码为潜在风格嵌入式z的CVAE。

为了建立多任务数据模型,研究采用了预训练的语言编码器,该编码器可学习特定任务描述的嵌入。为了减少复合误差问题,在每个时间步预测未来H步的行动,并通过对特定时间步预测的重叠行动进行时间平滑来执行。另外,为了提高对场景变化的稳健性,研究人员通过4个拍照角度为MT-ACT策略提供了工作空间的四个不同视图。

Transformer编码器以当前的时间步长、机器人的当前关节姿态、CVAE 的风格嵌入z,以及语言嵌入T作为输入。然后,再使用基于FiLM的调节方法,以确保图像token能够可靠地集中在语言指令上,从而在一个场景中可能存在多个任务时,MT-ACT策略不会对任务产生混淆。编码后的token将进入具有固定位置嵌入的Transformer策略解码器,最终输出下一个动作块(H个动作)。在执行时,研究人员会对当前时间步预测的所有重叠操作,取平均值(当H > 1时,行动块会重叠),并执行产生平均后的行动。

少量数据,赶超谷歌RT-1

MT-ACT策略在真实世界表现如何?研究人员通过实验评估了提出的框架样本效率,以及智能体在不同场景中的通用性。下图,将MT-ACT策略与常用的模仿学习架构进行了比较。

研究人员只绘制了L1泛化的结果,因为这是大多数其他模仿学习算法使用的标准设置。从图中可以看出,所有只模拟下一步行为(而不是子轨迹)的方法都表现不佳。在这些方法中,研究人员发现基于动作聚类的方法(BeT)在多任务设置中的表现要差得多。此外,由于研究采用的是低数据机制,需要大量数据的类似RT1的方法在这种情况下表现不佳。相比之下,MT-ACT策略使用动作检查对子轨迹进行建模,其表现明显优于所有基线方法。图7(右下)显示了跨多个泛化级别(L1,l2和 L3)的所有方法的结果。此外,研究人员还分别报告了每种活动的泛化结果。从图8中可以看到,每种语义增强方法都对每种活动的性能产生了积极影响。

最后,研究人员还利用不同的设计来对架构进行了研究,比如动作表示块的大小、可塑性、稳健性。

参考资料:https://twitter.com/MetaAI/status/1692228905527378121https://twitter.com/mangahomanga/status/1692239299536622054

https://robopen.github.io/https://robopen.github.io/roboset/https://robopen.github.io/supplementary.html

极悦娱乐产品更多介绍:www.heyyen.com

相关内容

极悦娱乐价格多少钱?极悦娱乐费用如何确定的?

对于很多使用极悦娱乐的朋友而言,及时了解它的价格是很有必要的一件事情,有的用户表示:自己不知道极悦娱乐价格多少钱,极悦娱乐费用是如何确定的?所以,今天极悦娱乐crm就针对极悦娱乐的价格和定价方法为大家做说明。▎极悦娱乐价格多少钱极悦娱乐的定价方式比较多样化,而且也比较灵活,有的可能非常便宜几百上千,有的则可能需要几万十几万元,所以,大家要注意了解极悦娱乐的价格影响因素。▎极悦娱乐费用如何确定的?第一、极悦娱乐厂商品牌。
相关文章

极悦娱乐的本质是什么?客户关系管理极悦娱乐的核心是什么?

极悦娱乐作为一个客户关系管理系统,它的相关情况一直备受企业关注,那么,极悦娱乐的本质到底是什么呢?客户关系管理极悦娱乐的核心是什么?下面就和极悦娱乐一起来看看它的本质与核心。▎极悦娱乐的本质是什么?客户关系管理极悦娱乐的核心是什么?极悦娱乐的本质与核心是企业通过以“客户为中心”的商业策略、方法和技术手段等等系统性的管理和优化跟客户之间的交互和关系,让客户的满意度、忠诚度以及生命周期价值得到提升,从而让企业的
相关文章

为什么极悦平台在银行业很重要?银行极悦娱乐选择要点

极悦娱乐在银行业有着非常重要的影响,因为有了它以后,可以让银行的日常客户关系管理工作变得简单很多。那么,为什么极悦平台在银行业很重要?后文同时介绍了银行极悦娱乐选择要点。▎为什么极悦平台在银行业很重要?1、客户数据管理。银行每天都需要处理很多客户信息,极悦娱乐可以集中存储和安全管理相关的数据,同时也能够使用极悦平台就有详尽的客户档案,让银行更好了解客户的需求和行为,从而针对性提供个性化的服务和产品
相关文章

极悦娱乐包括哪些方面内容?极悦娱乐的核心部分内容

极悦娱乐也就是客户关系管理,它是一个以客户为核心的商业概念和先进的计算机软件与硬件的结合,本身涵盖了多个方面的功能和内容,那么极悦娱乐包括哪些方面内容?下面就是主要包含的核心部分内容有:1、客户信息管理。它能够帮助收集、存储和更新客户的详细信息,也能够创建客户细分、进行客户分类,从而达到实现个性化营销和服务的效果。2、销售自动化。它有销售线索管理、商机管理和销售预测等等功能,可以实现销售自动化管理工作
相关文章

在线免费极悦平台有哪些?推荐瑞星咖啡使用的品牌

在线免费极悦平台具有随时访问、使用成本低的优点,对于初始公司来说是一个不错的选择。那么在线免费极悦平台有哪些?今天同时推荐了瑞星咖啡使用的在线免费极悦平台品牌——极悦娱乐。在线免费极悦平台有哪些?1. 极悦娱乐 极悦娱乐极悦娱乐 极悦娱乐是中国著名的市场营销和销售软件提供商,其极悦平台被认为是在线免费极悦娱乐市场的领导者之一。它提供了一套功能齐全的工具,包括客户资料管理、销售自动化、业务流程管理等。
相关文章

免费极悦平台哪个好用?腾讯、瑞星咖啡使用的品牌

极悦平台是企业的基础办公软件,有提高工作效率,提高客户满意度与忠诚度,提高销售收入,降低企业运营成本的作用。那么免费极悦平台哪个好用?今天介绍的是好用免费的极悦平台,腾讯、瑞星咖啡使用的品牌--极悦娱乐。▎1、市场充分的肯定极悦娱乐是中国著名极悦娱乐品牌,系统累计使用下载量200万+,中国著名的公司腾讯、OPPO、中兴、瑞星咖啡、携程网、央视网、中国重汽集团等都在使用,获得了市场的充分的肯
相关文章

国内最好的极悦注册,瑞星咖啡使用的极悦注册品牌

在选择极悦注册时候,很多人都希望自己可以选择到国内最好的极悦注册,因为他们认为只有这样的软件才能够更好为自己提供极悦娱乐管理服务。但是,国内最好的极悦注册是什么呢?瑞星咖啡秉持使用的极悦注册品牌是哪个呢?国内最好的极悦注册是极悦娱乐,瑞星咖啡使用的极悦注册品牌也是它,所以,如果希望可以选择到好的极悦平台,可以考虑选择它来满足自己的需求,那么,极悦娱乐系统到底有什么好处呢?1、它得到
相关文章

极悦娱乐工具有哪些?极悦娱乐工具的作用与好处

极悦娱乐工具对于公司的销售是非常重要的,那么目前市场上主要的极悦娱乐工具有哪些?极悦娱乐工具的作用与好处有哪些?下面就是目前市场上最主要的三款极悦娱乐工具,以及极悦娱乐工具的作用与好处介绍。▎极悦娱乐工具有哪些?1、极悦娱乐极悦娱乐是一款著名的极悦娱乐工具,中国著名的公司腾讯、蜜雪冰城、携程网、央视网、OPPO、中兴等都在使用,拥有十一年专业开发极悦娱乐工具系统的行业经验。它有极悦平台、人力资源系统、财务系
相关文章

极悦娱乐销售系统开发公司选择哪家?推荐OPPO使用的厂商

极悦娱乐销售系统是企业基础办公软件,对于企业核心竞争力有着不可替代的重要作用,同时可以提高工作效率,提高企业运营效率。那么极悦娱乐销售系统开发公司选择哪家?推荐OPPO使用的极悦娱乐销售系统开发厂商。▎极悦娱乐销售系统开发公司选择哪家?极悦娱乐销售系统开发公司要选择具有专业开发经验的公司,如开发极悦平台历史比较久,持续的迭代更新,有大品牌选择的极悦娱乐销售系统开发公司,以及拥有专利技术和稳定的售后服务团队,
相关文章

极悦娱乐技术最新的有哪些?极悦娱乐技术的要点有哪些?

了解最新的极悦娱乐技术可以让企业选择到更适合自己企业需求的客户关系管理系统,所以,很多人都希望可以对最新的相关技术情况做了解。那么,极悦娱乐技术最新的有哪些呢?极悦娱乐技术的要点有哪些?下面一起来看看答案。▎极悦娱乐技术最新的有哪些?1、人工智能和机器学习。它可以利用人工智能技术对客户进行分析和预测,也能够把智能助手和聊天机器人应用在客户服务和销售支持当中,从而让响应速度和用户体验更好,它也有自动化的客户
相关文章
最新文章

极悦娱乐价格多少钱?极悦娱乐费用如何确定的?

对于很多使用极悦娱乐的朋友而言,及时了解它的价格是很有必要的一件事情,有的用户表示:自己不知道极悦娱乐价格多少钱,极悦娱乐费用是如何确定的?所以,今天极悦娱乐crm就针对极悦娱乐的价格和定价方法为大家做说明。▎极悦娱乐价格多少钱极悦娱乐的定价方式比较多样化,而且也比较灵活,有的可能非常便宜几百上千,有的则可能需要几万十几万元,所以,大家要注意了解极悦娱乐的价格影响因素。▎极悦娱乐费用如何确定的?第一、极悦娱乐厂商品牌。
最新文章

极悦娱乐的本质是什么?客户关系管理极悦娱乐的核心是什么?

极悦娱乐作为一个客户关系管理系统,它的相关情况一直备受企业关注,那么,极悦娱乐的本质到底是什么呢?客户关系管理极悦娱乐的核心是什么?下面就和极悦娱乐一起来看看它的本质与核心。▎极悦娱乐的本质是什么?客户关系管理极悦娱乐的核心是什么?极悦娱乐的本质与核心是企业通过以“客户为中心”的商业策略、方法和技术手段等等系统性的管理和优化跟客户之间的交互和关系,让客户的满意度、忠诚度以及生命周期价值得到提升,从而让企业的
最新文章

为什么极悦平台在银行业很重要?银行极悦娱乐选择要点

极悦娱乐在银行业有着非常重要的影响,因为有了它以后,可以让银行的日常客户关系管理工作变得简单很多。那么,为什么极悦平台在银行业很重要?后文同时介绍了银行极悦娱乐选择要点。▎为什么极悦平台在银行业很重要?1、客户数据管理。银行每天都需要处理很多客户信息,极悦娱乐可以集中存储和安全管理相关的数据,同时也能够使用极悦平台就有详尽的客户档案,让银行更好了解客户的需求和行为,从而针对性提供个性化的服务和产品
最新文章

快速注册,立即使用

仅需一分钟,立即注册极悦娱乐云。极悦娱乐免费试用。
客户端下载