第三届腾讯开悟多智能体强化学习大赛
由王者荣耀、腾讯AI平台部、腾讯新文创总部联合主办,腾讯云、腾讯高校合作、腾讯游戏学堂协办。大赛期望建立产学研合作新生态,推动AI+游戏产业升级及人工智能研究的发展。
  • 比赛介绍
  • 比赛排行榜
由王者荣耀、腾讯AI平台部、腾讯新文创总部联合主办,腾讯云、腾讯高校合作、腾讯游戏学堂协办。大赛期望建立产学研合作新生态,推动AI+游戏产业升级及人工智能研究的发展。

背景

本届赛事依托「王者荣耀」游戏测试环境,为研究者开放游戏核心集群(Gamecore)及研究资源,并提供计算平台、评估工具以及其他研究支持服务,以测试并提升AI在MOBA游戏对战场景下的应用水平。

本届腾讯开悟大赛于2022年8月启动,拟邀36支学生队伍同台竞技,初赛首次支持本地开发及测试。

赛题

本届赛事包含初赛、复赛及决赛三个阶段。

初赛 - 1v1 墨家机关道

参赛队伍需要在指定的时间内,在给定的资源下训练并提交一个模型,控制狄仁杰、公孙离、后羿、鲁班七号、马可波罗等五位英雄进行墨家机关道1v1对战。

初赛主要考查单智能体解决方案,模型结构设计,强化学习算法设计和训练方式探索。重点探索模型泛化性和通用性。

复赛与决赛 - 3v3 长平攻防战

参赛队伍需要在指定的时间内,在给定的资源下训练并提交一个模型,控制多个指定三人阵容进行长平攻防战3v3对战。

相比于初赛,复赛与决赛涉及到多智能体解决方案(更强调AI之间的配合协作),并且比赛使用的游戏环境具有更大的状态空间,需要更复杂的模型结构与强化学习算法。此外,参赛选手还要考虑奖励函数设计,训练方式探索等内容。重点探索模型泛化性和通用性。

注:上述对局遵循王者荣耀游戏环境规则:玩家(智能体)将被分成两个阵容,并从地图的两端同时发起攻击。玩家(智能体)将控制他们的英雄互相合作,获取资源并击败他们的对手。胜利条件为摧毁敌人总部的水晶。

赛事流程

邀请报名 (2022.8)

所有受邀请的学校需于腾讯开悟官网提交参赛队伍信息。赛事组委会将于后台人工审核,并通过邮件将审核结果反馈给战队队员。

初赛 (2022.9->2022.10)

1. 初赛启动后,系统将为注册成功的队伍各分配一套开发资源。

2. 对局及积分规则:初赛采取循环积分赛制。在每两队间的一轮对战中,双方5个英雄需全部出战,并与对方5个英雄逐一匹配,换边对战2局,一轮合计50局(例:蓝方后羿将与红方五个英雄分别匹配,交换场地各打2局,共10局;蓝方其余四名英雄也将以同样匹配方式各出战10局)。在每次排行榜,每支队伍均需与其余所有队伍进行10轮对战,根据各队胜局数进行排名。

3. 常规排行榜:每支队伍可使用腾讯开悟客户端在本地环境进行智能体开发及测试,并将训练好的模型提交至腾讯开悟平台实验系统参与跑榜。系统将在每周五24:00(GMT+8)以参赛队伍提交的最新模型自动对战,并于次周周一发布上周的积分排名榜单。该排名仅作参考,不计入本赛段成绩。

4. 最终排行榜:初赛阶段最后一周榜单即初赛最终成绩,榜单前12名团队可进入复赛。

5. 基准AI挑战:初赛期间,参赛选手可挑战主办方提供的3个不同难度的基准AI,挑战成功即可获得额外奖励。

复赛 (2022.11->2022.12)

1. 复赛启动后,系统清除初赛数据,并为进入复赛的12支队伍各分配一套开发资源。

2. 对局及积分规则:复赛采取循环积分赛制。在每两队间的一轮对战中,双方的全部阵容组合均需出战,并与对方全部阵容组合逐一匹配,换边对战2局。在每次排行榜,每支队伍均需与其余所有队伍进行10轮对战,根据各队胜局数进行排名。

3. 常规排行榜:每支队伍可通过腾讯开悟平台实验系统进行智能体训练,并提交训练好的模型。系统将在每周五24:00(GMT+8)以参赛队伍提交的最新模型自动对战,并于次周周一发布上周的积分排名榜单。该排名仅作参考,不计入本赛段成绩。

4. 最终排行榜:复赛最后一周榜单为复赛最终成绩,榜单前6名团队可进入决赛。

决赛 (2023.03->2023.04)

1. 决赛启动后,系统清除复赛数据,并为进入决赛的6支队伍各分配一套开发资源。

2. 对局及积分规则:决赛采取循环积分赛制。在每两队间的一轮对战中,双方的全部阵容组合均需出战,并与对方全部阵容组合逐一匹配,换边对战2局。每次排行榜对战轮数待定,根据各队胜局数进行排名。

3. 常规排行榜:每支队伍可通过腾讯开悟平台实验系统进行智能体训练,并提交训练好的模型。系统将在每周五24:00以参赛队伍提交的最新模型自动对战,并于次周周一发布上周的积分排名榜单。该排名仅作参考,不计入本赛段成绩。

4. 最终排行榜:决赛最后一周提交模型视为最终模型。线下决赛时间及地点另行通知,现场产生的榜单结果即本届大赛最终成绩。

5. 技术文档:在最终排行榜发布后30天内,决赛队伍需提交决赛3v3模型完整代码及技术报告文档。未提交、复现未成功或审核不通过的队伍,将取消决赛资格和比赛奖励。

技术文档提交(2023.01->2023.05)

1. 1v1模型技术文档:晋级复赛的12支队伍,需在复赛排行榜发布的30天内,提交初赛1v1模型完整代码及技术报告文档。

2. 3v3模型技术文档:晋级决赛的6支队伍,需在决赛排行榜发布的30天内,提交决赛3v3模型完整代码及技术报告文档。

3. 未提交材料、复现未成功或审核不通过且未按要求修改的队伍,将被取消成绩和比赛奖励。

比赛奖励


冠军:奖金 200,000 元

亚军:奖金 100,000 元

季军:奖金 70,000 元

第四名:奖金 50,000 元

第五名:奖金 30,000 元

第六名:奖金 20,000 元

第七到十二名:奖金 5,000 元

其他奖励

初赛阶段,参赛队伍AI模型成功挑战指定段位基准AI,即可获得额外奖金,不同档位奖励可叠加。该挑战不影响初赛及复赛最终成绩。段位及奖金设置如下(税前):

永恒钻石:奖金 1,000 元

至尊星耀:奖金 1,500 元

最强王者:奖金 2,000 元

合作伙伴

声明:

1. 参赛团队需保证自身所提交的一切资料均真实有效,如比赛过程中,因参赛团队提供资料中存在虚假信息而导致的一切后果,由参赛者自行承担。

2. 参赛团队需保证自身所提交评审的代码及说明文档均为自主创作,不存在侵犯任何第三方合法权益的情形。在比赛过程中,因参赛团队上传代码及说明文档等内容存在侵权争议而导致的一切后果,由参赛者自行承担。

3. 腾讯有权根据大赛运行情况及相关需求,调整、变更相关比赛规则、奖品信息、比赛时间等全部比赛所涉及的内容,并在腾讯开悟官网(aiarena.tencent.com)公示,参赛者应及时登陆该网站了解最新信息。

4. 腾讯提供的全部数据、信息等,视为腾讯的保密信息,未经允许,任何参赛者不可以任何形式使用、传播、披露、授权他人使用;

5. 无论参赛团队最终是否获得奖项,其提交的全部参赛成果的知识产权、所有权等归腾讯及开发团队共同所有。

决赛
第三届腾讯开悟大赛决赛成绩于2023年4月26日线上实时直播跑榜产生。腾讯开悟平台以北京时间2023年3月31日24:00 前各参赛队伍提交的最后一版模型运行对战,所产生榜单即为本届赛事最终成绩,现公示如下。
排名队伍名称积分胜局数总局数