赛道介绍
当前,人工智能与决策科学迈入以智能体为核心的新阶段,腾讯开悟平台聚焦智能体决策算法,是多智能体强化学习与复杂决策研究前沿,推动 AI 从封闭棋盘博弈走向开放复杂环境模拟,搭建起理论研究与产业级决策应用的桥梁。本赛道以《王者荣耀》复杂对抗环境为场景,考察智能体在信息不完整、实时对抗等场景的决策能力,全面检验算法、策略及多智能体协同等能力,贴合产业落地需求。赛道聚焦强化学习等核心技术,契合决策智能发展与产业需求,是实现感知智能向认知决策跃迁的关键,将深刻影响未来智能系统的发展。
面向对象
全国高等学校(本科类和高职高专类院校)具有正式学籍的全日制在校学 生(含 2026 年应届毕业生,本专科、研究生不限)可以组队参赛。
● 上述高校毕业不超过 5 年(2021 年后毕业)的毕业生可组队参赛。
● 参赛队员允许跨校组队。
● 每参赛团队仅限选一竞赛类别参赛,每位队员限参加一支团队,禁止不同参赛团队之间共用队员。
● 每参赛团队队员上限为5人,指导老师上限为2人。
● 参赛选手的专业范围和所属学院不限。建议参赛团队选择能力互补、专业背景多样化的选手组队。
赛程简介
赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动智能体,让其在对地图不断的探索中学习移动策略,合理利用召唤师技能与加速增益,在限定的时间内走到终点并尽可能多的收集宝箱。 地图中包含起点、终点、道路、障碍物、加速增益和宝箱。智能体有局部视野,可以在地图中移动,释放召唤师技能,走到宝箱处可获取宝箱内的奖励。(报名成功后,平台内配套的开发指南有详细介绍)
赛题目标:参赛团队需要在指定的时间内,本地训练并提交一个模型,并在考核地图中控制智能体用尽可能少的时间获得尽可能多的积分,完成重返秘境的探险目标。

排名规则: 区域赛初赛成绩由腾讯开悟比赛平台系统自动运行得出客观测评成绩
客观测评评分规则:
任务得分 = 步数得分 + 宝箱得分
步数得分 = 任务完成步数 * 奖励系数1.5
宝箱得分 = 100 * 收集宝箱个数
任务完成步数为智能体被怪物追到时所使用的步数。
在赛程提交阶段结束后,系统将以参赛团队提交的最新模型自动运行挑战,并按照各团队得分高低排名,该排名榜单即本赛段最终成绩。
赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动智能体,让其在对王者荣耀1v1地图不断的探索中学习最优策略,率先击破对方阵营水晶前的一座防御塔以获得胜利。 本赛题所用地图为长条状,地图两端是双方智能体的复活点,复活点前方为阵营所属水晶。水晶可以不断生产己方阵营的小兵,小兵将向对方阵营自动前行,可以沿路攻击对方阵营的防御塔、水晶和英雄。水晶前方为己方防御塔,可以攻击进入范围的对方阵营的英雄和小兵。 智能体在地图内可随意移动及释放技能。(报名成功后,平台内配套的开发指南有详细介绍)
赛题目标:参赛团队需要在指定的时间内,运用给定的算力资源训练模型,让其在对1v1地图不断的探索中学习最优取胜策略,在与其他团队的对战中取得尽可能多的胜利。

排名规则: 区域赛决赛成绩由两部分组成,线上客观测评成绩与线下答辩成绩
线上客观测评成绩:(70%) 在本赛程比赛测评模型提交阶段结束后,系统将以参赛团队提交的最新模型自动运行多轮对战。本赛段每支参赛团队将与所在赛区的所有对手进行等量轮数对战。 在每两队间的一轮对战中,双方的全部英雄均需出战,并与对方全部英雄逐一匹配,换边对战2局。赢一局得1分,输则不得分。
线上成绩将按梯度打分规则进行百分制转换。具体规则参考腾讯开悟比赛平台内文档《智能体决策算法区域决赛与全国决赛线上跑榜评分规则》
线下答辩成绩(30%)
各区域按线上成绩排名,然后区域决赛团队将需要进行线下答辩环节,最终综合线上客观测评成绩与线下答辩成绩评出全国总决赛晋级名额
赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动2个智能体,与平台bot操纵的1个队友协作,在对王者荣耀3v3地图不断的探索中学习最优策略,率先摧毁对方阵营的水晶以获得胜利。 本赛题所用地图除长条状兵线主路,还包含了一个上部野区和下部野区。地图两端是双方智能体的复活点,复活点前方为阵营所属水晶。水晶可以不断生产己方阵营的小兵,小兵将向对方阵营自动前行,可以沿路攻击对方阵营的防御塔、水晶和英雄。水晶前方为己方防御塔,可以攻击进入范围的对方阵营的英雄和小兵。 野区是打野英雄获得经济收益和经验收益的主要来源,地图上2个阵营的玩家共享整块野区,但部分野区入口有阵营限制。(提示:可以利用它们来巧妙的摆脱敌人的追击) 智能体在地图内可随意移动及释放技能。随着时间的推移,智能体会获得金钱和经验,击杀野区怪物、对方小兵、对方英雄或摧毁对方防御塔会获得大量金钱和经验。 成功摧毁对手水晶的团队获得本局胜利。
赛题目标:参赛团队需在指定的时间内,用给定的算力资源训练模型,配合平台bot操纵的队友, 让其在对3v3地图中不断的探索中学习最优协作取胜策略,在与其他团队的对战中取得尽可能多的胜利。

排名规则: 全国决赛成绩由两部分组成,线上客观测评成绩与线下答辩成绩
线上客观测评成绩:(70%) 在本赛程比赛测评模型提交阶段结束后,系统将以参赛团队提交的最新模型自动运行多轮对战。本赛段每支参赛团队将与所在赛区的所有对手进行等量轮数对战。 在每两队间的一轮对战中,双方的全部阵容均需出战,并与对方全部阵容逐一匹配,换边对战2局。赢一局得1分,输则不得分。
线上成绩将按梯度打分规则进行百分制转换。具体规则参考腾讯开悟比赛平台内文档《智能体决策算法区域决赛与全国决赛线上跑榜评分规则》
线下答辩成绩(30%)
按线上成绩排名,根据参赛团队排出全国一二等奖候选团队和三等奖团队,一二等奖候选团队将需要进行线下答辩环节,最终成绩由线上客观测评成绩与线下答辩成绩组成,最终评出全国一等奖及二等奖。
推荐设备配置
建议一个团队至少拥有一台符合以下推荐配置的电脑,完成本地环境的搭建,进行本地开发和训练。
