赛道介绍
本赛道为“腾讯开悟人工智能全国公开赛”的高等难度级别赛道,主要面向有强化学习赛事及项目经验的高校学生。本赛道赛程主要包含强化学习赛前培训课程,以及海选赛、复赛、决赛三个阶段。
面向对象
本赛道接受报名阶段在读的全日制高等院校在校专科生、本科生、硕士/博士研究生报名。每个团队成员需来自同一高校,最多5人,且拥有至少一名指导老师。队伍成员专业不限,每人仅可加入一个团队。
赛道奖励
成功提交模型参与海选赛、复赛和决赛榜单排名的队伍,可获得的奖金设置如下。金额单位为人民币(税前)。
冠军:奖金 200,000 元+大赛证书+奖杯
亚军:奖金 100,000 元+大赛证书+奖杯
季军:奖金 60,000 元+大赛证书+奖杯
卓越奖(4-8名):奖金 20,000 元+大赛证书
优秀奖(9-16名):奖金 5,000 元+大赛证书
其他奖励
除奖金外,参赛队伍还可获得以下奖励:
1.完成海选赛程(成功提交模型并验证通过)即能获得官方参赛证书。
2.优秀的参赛者可以获得腾讯开悟项目相关岗位的实习机会,以及腾讯集团校园招聘和实习招聘绿色通道资格。具体细则另行通知。
3.优秀参赛队伍将获邀参腾讯STAC科创联合大会的分享交流。
赛题简介:峡谷漫步使用峡谷之森地图,地图中包含起点、终点、道路、障碍物、加速增益和宝箱。智能体没有全图视角,可以在地图中移动,释放召唤师技能,走到宝箱处可获取宝箱内的奖励。在遇到障碍物时无法继续前进。智能体需在规定时间内走到终点,否则判定为任务超时。(报名成功后,平台内配套的开发指南有详细介绍)
赛题目标:通过算法训练模型驱动智能体,让其在对测试地图不断的探索中学习移动策略,合理利用召唤师技能与加速增益,在限定的时间内完成收集宝箱、躲避障碍物及走到终点。 参赛队伍需要在指定的时间内,本地训练并提交一个模型,并在考核地图中控制英雄鲁班七号用尽可能少的时间获得尽可能多的积分,完成峡谷漫步地图探险目标。

榜单排名规则:系统将在赛程最后一周以参赛队伍提交的最新模型自动运行,其总分即为参赛队伍排名分数,该排名榜单即海选赛最终成绩。该赛道完成挑战的前80支战队晋级复赛。
赛题简介: 本赛段使用王者荣耀1v1墨家机关道地图,地图为长条状。 地图两端是双方智能体的复活点,复活点前方为阵营所属水晶。水晶可以不断生产己方阵营的小兵,小兵将向对方阵营自动前行,可以沿路攻击对方阵营的防御塔、水晶和英雄。水晶前方为己方防御塔,可以攻击进入范围的对方阵营的英雄和小兵。 智能体在地图内可随意移动及释放技能。随着时间的推移,智能体会获得金钱和经验,击杀对方小兵、对方英雄或摧毁对方防御塔会获得大量金钱和经验。 成功摧毁对手水晶的队伍获得本局胜利。
赛题目标:在指定的时间内及给定的算力资源下训练模型,让其在对1v1地图不断的探索中学习最优取胜策略。

积分规则:在每两队间的一轮对战中,双方的全部英雄均需出战,并与对方全部英雄逐一匹配,换边对战2局。赢一局得1分,输则不得分。
榜单排名规则:系统将在赛程最后一周以参赛队伍提交的最新模型自动对战,每次排行榜对战轮数待定,根据各队积分进行排名。该排名榜单即复赛最终成绩,榜单前8名战队可进入决赛。
场景简介:本赛段使用王者荣耀3v3长平攻防战地图。除长条状兵线主路,还包含了一个上部野区和下部野区。 地图两端是双方智能体的复活点,复活点前方为阵营所属水晶。水晶可以不断生产己方阵营的小兵,小兵将向对方阵营自动前行,可以沿路攻击对方阵营的防御塔、水晶和英雄。水晶前方为己方防御塔,可以攻击进入范围的对方阵营的英雄和小兵。 野区是打野英雄获得经济收益和经验收益的主要来源,地图上2个阵营的玩家共享整块野区,但部分野区入口有阵营限制。(提示:可以利用它们来巧妙的摆脱敌人的追击) 智能体在地图内可随意移动及释放技能。随着时间的推移,智能体会获得金钱和经验,击杀野区怪物、对方小兵、对方英雄或摧毁对方防御塔会获得大量金钱和经验。 成功摧毁对手水晶的队伍获得本局胜利。
赛题目标:在指定的时间内及给定的算力资源下训练模型,让其在对3v3地图中不断的探索中学习最优取胜策略。

积分规则: 在每两队间的一轮对战中,双方的全部阵容组合均需出战,并与对方全部阵容组合逐一匹配,换边对战2局,具体局数根据英雄数量决定,赢一局得1分,输则不得分。
榜单排名规则:每次排行榜对战轮数待定,根据各队积分进行排名。
参赛设备配置
建议一个队伍至少拥有一台符合以下推荐配置的电脑,完成本地环境的搭建,进行本地开发和集群任务的提交。
Windows10
i5-9代
16GB
绿色通道
在第三届“腾讯开悟多智能体强化学习大赛”中进入复赛的12支战队,在保留队名及至少一名原有队员情况下,可不参加海选考核,直接进入2023腾讯开悟人工智能全国公开赛“博弈算法-高级赛道”复赛。详情请咨询工作人员。
