logo
avatarLog in
中文
智能体决策算法-高级
Track statusgame.2023.open.competition.status.ended
Total Prize¥360,000

赛道介绍special-title-icon

本赛道要求参赛团队自主训练模型,完成王者荣耀场景挑战任务。重点考查:单智能体以及多智能体的解决方案、探索模型泛化性和通用性。

面向对象

本赛道接受全日制高等院校在读的专科生、本科生、硕士/博士研究生报名。参赛者需以团队为单位参赛。每支参赛团队由2至5名来自同一高校的学生组成,团队成员专业不限,每人仅可加入一个团队。且每支参赛队伍需由1至3名本校在职教师担任指导教师。

赛道奖励special-title-icon


本赛道优胜奖金设置如上。金额单位为人民币(税前)。

除奖金外,参赛团队还可获得以下奖励:

1.完成初赛赛程(成功提交模型并验证通过)即能获得官方参赛证书。

2.优秀的参赛者有机会获得腾讯开悟项目相关岗位的实习机会。具体细则另行通知。

赛程简介special-title-icon

初赛
2025年7月-8月
本赛题主要考查AI的基础开发能力:强化学习基础算法、环境奖励设计。
重返秘境
智能体数量1
评估方式环境积分测评
算力资源本地算力(参赛者自备)

赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动智能体,让其在对地图不断的探索中学习移动策略,合理利用召唤师技能与加速增益,在限定的时间内走到终点并尽可能多的收集宝箱。 地图中包含起点、终点、道路、障碍物、加速增益和宝箱。智能体有局部视野,可以在地图中移动,释放召唤师技能,走到宝箱处可获取宝箱内的奖励。(报名成功后,平台内配套的开发指南有详细介绍)

赛题目标:参赛团队需要在指定的时间内,本地训练并提交一个模型,并在考核地图中控制智能体用尽可能少的时间获得尽可能多的积分,完成重返秘境的探险目标。

gorge_walk.png

排名规则:在赛程提交阶段结束后,系统将以参赛团队提交的最新模型自动运行挑战,并按照各团队得分高低排名,该排名榜单即本赛段最终成绩。

奖项设置: 根据各区域/省参赛团队成绩分别排名,不分组别,分设一等奖10%、二等奖20%和三等奖30%,颁发电子荣誉证书和电子优秀指导老师证书。具体详情请查看计挑赛官网。

晋级规则: 总计晋级80支团队
初赛榜单前70名的团队,可晋级到下一赛段; 2024腾讯开悟人工智能全球公开赛算法赛道全球总决赛10支优秀团队直接晋级本赛道复赛。

复赛
2025年8月-9月
本赛题主要考查单智能体解决方案: 模型结构设计、强化学习算法设计、环境奖励设计和训练方式探索。
智能体决策挑战-1v1
智能体数量1
评估方式智能体决策比拼胜负
算力资源集群算力(平台提供)

赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动智能体,让其在对王者荣耀1v1地图不断的探索中学习最优策略,率先击破对方阵营水晶前的一座防御塔以获得胜利。 本赛题所用地图为长条状,地图两端是双方智能体的复活点,复活点前方为阵营所属水晶。水晶可以不断生产己方阵营的小兵,小兵将向对方阵营自动前行,可以沿路攻击对方阵营的防御塔、水晶和英雄。水晶前方为己方防御塔,可以攻击进入范围的对方阵营的英雄和小兵。 智能体在地图内可随意移动及释放技能。(报名成功后,平台内配套的开发指南有详细介绍)

赛题目标:参赛团队需要在指定的时间内,运用给定的算力资源训练模型,让其在对1v1地图不断的探索中学习最优取胜策略,在与其他团队的对战中取得尽可能多的胜利。

排名规则:在赛程提交阶段结束后,系统将以参赛团队提交的最新模型自动运行多轮对战。每支参赛团队将与所在赛区的所有对手进行等量轮数对战,并按照各团队得分高低排名。 在每两队间的一轮对战中,双方的全部英雄均需出战,并与对方全部英雄逐一匹配,换边对战2局。赢一局得1分,输则不得分。

晋级规则: 榜单前8名的团队,可晋级到下一赛段。

决赛
2025年9月-11月
决赛赛题主要考察多智能体决策解决方案,强调AI之间的配合协作,以及AI与其他队友(平台bot)的协作能力。参赛选手还要考虑复杂模型结构与强化学习算法,奖励函数设计,训练方式探索等内容。
智能体决策挑战-3v3人机协作
智能体数量3
评估方式智能体决策比拼胜负
算力资源集群算力(平台提供)

赛题简介:在本赛题中,参赛团队需要通过算法训练模型驱动2个智能体,与平台bot操纵的1个队友协作,在对王者荣耀3v3地图不断的探索中学习最优策略,率先摧毁对方阵营的水晶以获得胜利。 本赛题所用地图除长条状兵线主路,还包含了一个上部野区和下部野区。地图两端是双方智能体的复活点,复活点前方为阵营所属水晶。水晶可以不断生产己方阵营的小兵,小兵将向对方阵营自动前行,可以沿路攻击对方阵营的防御塔、水晶和英雄。水晶前方为己方防御塔,可以攻击进入范围的对方阵营的英雄和小兵。 野区是打野英雄获得经济收益和经验收益的主要来源,地图上2个阵营的玩家共享整块野区,但部分野区入口有阵营限制。(提示:可以利用它们来巧妙的摆脱敌人的追击) 智能体在地图内可随意移动及释放技能。随着时间的推移,智能体会获得金钱和经验,击杀野区怪物、对方小兵、对方英雄或摧毁对方防御塔会获得大量金钱和经验。 成功摧毁对手水晶的团队获得本局胜利。

赛题目标:参赛团队需在指定的时间内,用给定的算力资源训练模型,配合平台bot操纵的队友, 让其在对3v3地图中不断的探索中学习最优协作取胜策略,在与其他团队的对战中取得尽可能多的胜利。

排名规则:在赛程提交阶段结束后,系统将以参赛团队提交的最新模型自动运行多轮对战。本赛段参赛团队将与其余所有对手进行等量轮数对战,并按照各团队得分高低排名。 在每两队间的一轮对战中,双方的全部英雄均需出战,并与对方全部英雄逐一匹配,换边对战2局。赢一局得1分,输则不得分。

奖项设置: 根据成绩排名颁发名次奖项和奖金。

冠军奖金150,000元+大赛证书

亚军奖金80,000元+大赛证书

季军奖金50,000元+大赛证书

第4名奖金30,000元+大赛证书

第5~6名各奖金15,000元+大赛证书

第7~8名各奖金10,000元+大赛证书

推荐设备配置special-title-icon

建议一个团队至少拥有一台符合以下推荐配置的电脑,完成本地环境的搭建,进行本地开发和训练。

操作系统Windows10/11
CPUIntel 9代酷睿i5及以上
内存16GB