让AI玩转斗地主 快手实践课题获Deecamp2019最佳团队奖

DeeCamp2019人工智能训练营在北京中国科学院大学雁栖湖校区举办全国成果展示暨结营仪式。快手发起的实践课题“挑战快手小游戏AI”、“端上AI助你走进名画”分别获得DeeCamp2019最佳团队奖、最佳技术奖。

DeeCamp人工智能训练营由教育部、创新工场、北京大学联合主办,今年有超过1万人次报名,最终600名学生入选。4周的时间内,学员接受了顶级 AI 大牛导师的「学术+产业」课程培训,共计完成了 50 个 AI 实践课题。

让AI玩转斗地主 快手实践课题获Deecamp2019最佳团队奖

“挑战快手小游戏AI”获最佳团队奖

4周时间,学员们完成了由 22 家企业发起的 50 个 AI 相关课题,接受了总计 115 位来自企业的技术负责人和工程师的课题辅导。实践课题全部基于真实世界场景精心设计,力求贴近产业一线需求、提高学生动手能力。其中4个课题为快手发起,包括挑战快手小游戏AI、端上AI助你走进名画、多模态AI音乐生成、质量感知的媒体传输优化。结营仪式当天,“挑战快手小游戏AI”获得最佳团队奖,“端上AI助你走进名画”获得最佳技术奖。

斗地主要解决的是不完美信息下博弈问题,是要在无法看见其他玩家手牌的前提下,对游戏中的14种合法牌型、13551种合法出牌、10的30次方的状态空间和10的85次方的游戏树进行全面考虑,整体难度较高。从技术角度看,该项目将游戏领域内的领先核心算法应用到斗地主中;其次,结合RankSVM思路,设计了新的斗地主监督学习模型;小组还设计了多个强化学习模型,使用强化学习进行多模型融合。

项目团队没有一味追求胜率,通过调试做到一个和人类玩家相似的胜率结果,更加拟人化。当人类与人类对战时,人类作为地主的胜率为52.4%、作为农民的胜率为47.8%;而该项目小组研发的AI在与人类进行对战时,AI作为地主的胜率为58.6%、作为农民的胜率为41%。

快手导师:学员们的探索性方法带来惊喜

快手游戏联合实验室提供了此次“挑战快手小游戏AI”的课题,并指导学员完成此次实践课题。该课题给学员提供了一个设计游戏AI从0到1的完整历程,学员能体验到跟自己设计的AI共同成长的默契。快手游戏联合实验室,致力于利用人工智能技术全面赋能游戏,使用户获得更佳的游戏体验,同时进行前沿的人工智能技术研究及应用。

让AI玩转斗地主 快手实践课题获Deecamp2019最佳团队奖

“不完美信息博弈是非常有挑战的AI难题,学员们产出的探索性结果和方法也给我们带来了惊喜,我们会加大投入探索不完美信息博弈的游戏”。 快手游戏联合实验室刘霁介绍说,不完美信息博弈是非常挑战的AI难题,斗地主AI的难题在于它是一个3人游戏;两人组队合作跟另外一个人博弈,如何组队,以及队内信息又是不共享的,这使得斗地主的博弈问题更加复杂;既需要算法的精巧设计,又需要高效得利用算力。

快手导师迅速帮助学员们抓住课题重点,从叫牌阶段策略,出牌过程策略,预测对方牌型等侧重点进行指导。利用游戏AI的经验,初步提供了不同的AI模型在游戏中的基本能力和实现效果,强调了非全信息下的博弈难度,便于学员们进行理解和选择,学员在2天的时间内快速确定了最终的开发框架。

因为斗地主是不完美信息博弈没有成功的经验可以借鉴,快手导师指导团队制定一个套多模型融合的策略,把基于规则的AI,基于强化学习的AI,基于蒙特卡洛搜索的AI(Alphago的思路),基于CFR的AI(德州扑克的思路),以及基于模仿学习的AI通过一个整体的强化学习AI融合一起。时间紧任务又有挑战的情况下,快手导师提供了对每一种AI设计方案方向性的指导并且参与细节的讨论,最终学员圆满完成课题。

快手游戏联合实验室于明泽介绍说,这次的课题在学术上存在挑战,有助于推动产学研结合。快手游戏联合实验室提供了丰富的AI应用场景,比如验证游戏核心玩法、文字音频图形的AI处理、数据分析、个性化决策、自动推荐等。游戏环境是全数字环境,便于训练数据的采集,利于技术的落地。此外,游戏本身是强商业化的方向,更容易创造出兼具学术意义和商业价值的产品。

 

原创文章,作者:新智派,如若转载,请注明出处:https://knewsmart.com/archives/13795

(0)
上一篇 2019年8月20日 下午10:49
下一篇 2019年8月20日 下午10:50

相关推荐

发表回复

登录后才能评论
联系我们
联系我们
分享本页
返回顶部