四足机器人强化学习挑战
赛道状态报名中
报名截止于 2025-06-30

赛道介绍special-title-icon

全球机器人产业迎来深度变革,四足机器人凭借出色的地形适应性与运动灵活性,从实验室研究快速迈向规模化商业应用,成为具身智能产业落地的核心载体。在此背景下,四足机器人运动控制比赛成为衔接前沿技术研发与真实市场需求的关键桥梁,不仅考验机器人本体运动控制能力,更严苛检验产品在复杂极端场景的实用性与可靠性,契合市场对高性能、高适应性四足机器人的需求。具身智能运动控制折射出机器人技术市场化的核心鸿沟,赛事聚焦的运动控制、环境感知等问题,正是突破行业规模化应用瓶颈、降本拓景的关键所在。

面向对象

全国高等学校(本科类和高职高专类院校)具有正式学籍的全日制在校学 生(含 2026 年应届毕业生,本专科、研究生不限)可以组队参赛。
● 上述高校毕业不超过 5 年(2021 年后毕业)的毕业生可组队参赛。
● 参赛队员允许跨校组队。
● 每参赛团队仅限选一竞赛类别参赛,每位队员限参加一支团队,禁止不同参赛团队之间共用队员。
● 每参赛团队队员上限为5人,指导老师上限为2人。
● 参赛选手的专业范围和所属学院不限。建议参赛团队选择能力互补、专业背景多样化的选手组队。

赛程简介special-title-icon

区域赛初赛
2026年3月-4月
本赛题主要考查AI的基础开发能力:强化学习基础算法、环境奖励设计。
扫地机器人路径规划任务
智能体数量1
评估方式环境积分测评
算力资源本地算力(参赛者自备)

赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动智能体,让其在对地图不断的探索中学习移动策略,合理利用充电桩进行充电,在限定的时间内躲避官方机器人并尽可能多的清扫地面。 地图中包含小悟机器人、官方机器人、小悟机器人出生点、官方机器人出生点、污渍地面、充电桩、道路、障碍物。智能体有局部视野,可以在地图中移动,完成道路清扫可获取清扫得分,该污渍地面变回普通道路。(报名成功后,平台内配套的开发指南有详细介绍)

赛题目标:参赛团队需要在指定的时间内,本地训练并提交一个模型,并在考核地图中控制智能体用尽可能少的时间获得尽可能多的积分,完成道路清扫任务。

.png

排名规则: 区域赛初赛成绩由腾讯开悟比赛平台系统自动运行得出客观测评成绩

任务得分 = 清扫得分(清扫格数)

清扫得分为被智能体清扫的污渍地面数量。

在赛程提交阶段结束后,系统将以参赛团队提交的最新模型自动运行挑战,并按照各团队得分高低排名,该排名榜单即本赛段最终成绩。

区域赛决赛
2026年4月-6月
本赛题主要考查强化学习基础算法,机器人运动控制算法稳定性。
仿真环境下四足机器人自主寻路与运动控制
评估方式综合得分评估
算力资源集群算力(平台提供)

赛题简介:在本赛题中,参赛选手在仿真平台通过强化学习训练、优化运动控制算法并提交一个模型,在虚拟环境中控制四足机器人Go2自主寻路并通过复杂的比赛场景,到达赛道终点。并根据成功次数、速度、稳定性等指标综合评定四足机器人的自主寻路与运动控制能力。(晋级区域赛决赛后,平台内配套的开发指南有详细介绍)

赛题目标:参赛团队需要在指定的时间内,训练并提交一个模型,并在指定虚拟赛道中控制四足机器人用尽可能少的时间通过。重复运行训练成果,记录四足机器人顺利到达终点的次数,并根据成功次数、最快通关速度、稳定性等指标综合评定四足机器人的运动控制能力,综合评分后进行排名。

image.png

排名规则:

区域赛决赛成绩由两部分组成,线上客观测评成绩与线下答辩成绩

线上客观测评成绩:(70%)在本赛程比赛测评模型提交阶段结束后,系统将以参赛团队提交的最新模型自动运行多轮虚拟环境赛道挑战测评任务。并根据成功次数、速度、稳定性等指标综合评定四足机器人的自主寻路与运动控制能力得到多轮任务评分并取平均值求出最终得分。

线下答辩成绩(30%)

各区域按线上成绩排名,然后区域决赛团队将需要进行线下答辩环节,最终综合线上客观测评成绩与线下答辩成绩评出全国总决赛晋级名额

全国赛决赛
2026年6月-8月
本赛题主要考查强化学习基础算法,运动控制算法优化,算法部署。
真实环境下四足机器人自主寻路与运动控制
评估方式客观用时排名
算力资源集群算力(平台提供)

赛题简介:在本赛题中,需要参赛团队通过强化学习训练四足机器人的运动控制算法,并部署一个模型在指定四足机器人Go2上,在实际赛道中,使四足机器人能自主寻路并通过复杂的赛道,到达终点。并根据速度、稳定性等指标综合评定四足机器人的自主寻路与运动控制能力。(晋级全国决赛后,平台内配套的开发指南有详细介绍)

赛题目标:参赛队伍需要在指定的时间内,训练并部署一个模型在指定四足机器人Go2上,在实际赛道中,使四足机器人能自主寻路并通过复杂的赛道,到达终点。

image.png

排名规则:
全国决赛成绩由三部分组成,线上测评成绩、真实赛道挑战与技术报告成绩,最终评出全国一等奖、二等奖及三等奖

线上测评成绩(20%)
在本赛程比赛测评模型提交阶段结束后,系统将以参赛团队提交的最新模型自动运行多轮虚拟环境赛道挑战测评任务。并根据成功次数、速度、稳定性等指标综合评定四足机器人的自主寻路与运动控制能力得到多轮任务评分并取平均值求出最终得分。

真实赛道挑战(70%)
参赛团队通过强化学习训练四足机器人的自主寻路及运动控制策略,并将模型部署至宇树四足机器人go2,完成真实环境赛道挑战的路径规划与动态避障,并根据完成情况、速度、稳定性等指标综合评定得出最终成绩。

技术报告成绩(10%)
开赛后将在平台内同步《人工智能算法类答辩与技术报告评分标准》

推荐设备配置special-title-icon

建议一个团队至少拥有一台符合以下推荐配置的电脑,完成本地环境的搭建,进行本地开发和训练。

操作系统Windows10/11
CPUIntel 9代酷睿i5及以上
内存16GB

赛题合作方介绍special-title-icon



宇树科技
宇树科技是一家世界知名的民用机器人公司,专注于消费级和工业级高性能通用四足机器人、人形机器人、六轴机械臂等产品的研发、生产和销售。宇树科技是全球首家面向公众零售高性能四足机器人的公司,也是首家实现产业落地的公司,多年来全球销量遥遥领先。宇树科技在机器人核心部件、运动控制、机器人感知等综合领域拥有卓越的领先地位。