BEHAVIOR挑战赛:具身智能的新里程碑
李飞飞团队发起的首届BEHAVIOR家务挑战赛,旨在推动具身智能的发展,这一举措受到了ImageNet成功的启发。以下是关于BEHAVIOR挑战赛的一些关键点和背后的原因。
发起背景
1. ImageNet的成功经验
- 2009年,李飞飞团队在CVPR发表了《ImageNet: A Large-Scale Hierarchical Image Database》,开启了计算机视觉领域的黄金时代。
- ImageNet挑战赛成为计算机视觉领域的试金石,极大地推动了深度学习的发展。
- 李飞飞希望通过类似的挑战赛,推动具身智能领域的发展。
2. 当前具身智能面临的挑战
- 缺乏标准化:现有的机器人学习任务通常是零散的,难以进行比较。
- 训练数据匮乏:类似于ImageNet出现之前计算机视觉领域所面临的问题。
- 任务复杂性:机器人需要具备跨房间导航、双手精细操控、长期规划与动态适应等多种能力。
挑战赛详情
1. 比赛设置
- 参赛者要求:统一使用星海图R1 Pro(双手操作+轮式移动)作为本体。
- 环境设置:在逼真的BEHAVIOR-1K虚拟家庭环境中进行。
- 任务类型:涵盖重新布置、烹饪、清洁等各种活动,共50项完整家务任务。
2. 赛道选择
- 标准赛道(Standard Track):机器人只能用“自己能看到的东西”决策。
- 特权赛道(Privileged Track):机器人可以获取更详细的环境状态信息(如物体坐标、房间结构)。
3. 评分标准
- 主要指标:任务完成率(是否能完全完成任务,如“把餐具放进洗碗机”)。
- 次要指标:模拟时间、导航距离、手部位移、稳定性等。
- 最终排名:主要看平均任务完成率。
4. 奖励机制
- 比赛提交截止日期为2025年11月15日。
- 最终获奖前三名将获得最高1000美元奖金及RTX 5080显卡。
看点与意义
1. 以人为中心的理念
- BEHAVIOR被设计为以人为中心,强调AI是为了增强和赋能人类,而非取而代之。
- 任务定义、数据选择和伦理价值导向都确保机器人的目标与人类需求相符。
2. 明确的目标与标准
- 首次明确提出家庭机器人应具备的能力:跨房间导航、双手精细操控、长期规划与动态适应。
- 覆盖1000个家庭活动,50个完整长程挑战,平均单个任务需要6.6分钟连续操作。
3. 规模巨大
- 提供1万条专家演示轨迹(约1200小时),方便参赛者用模仿学习快速上手。
- 使用高保真模拟器OmniGibson,支持复杂物理交互。
展望未来
BEHAVIOR挑战赛有望成为具身智能领域的“下一个ImageNet”。正如ImageNet开启了视觉智能的黄金时代,BEHAVIOR可能会成为具身智能发展的第一声号角。通过这一挑战赛,李飞飞团队希望能够凝聚学术界和产业界的力量,共同推动具身智能的发展,使其更好地服务于人类生活。