游戏对战平台--吃货大作战

游戏对战平台--吃货大作战
前言:
　　首先, 我得假正经的郑重宣布: "取这个名字, 并非卖萌", ^_^. 萌萌哒的世界, 大叔你不懂, hoho.
　　言归正传, 记得我还在读大学的时候, 学院老师和某社团搞了一个"老鼠吃大米"的游戏比赛, 其平台是基于J2SE实现, 意在推广JAVA语言, 门槛不高, 活动反响好. 游戏重在参与, 寓教于乐, 很happy!!!
　　本文是想借这个"老鼠吃大米"这个游戏, 来讲述下简易的游戏对战平台的搭建以及设计思路, 顺便附带讲解下"小老鼠"游戏AI的设计.

简介:
　　让我们先来介绍下游戏规则和平台功能.
　　游戏的场景和规则很简单:
　　1).迷宫中散布着大米
　　2).小白鼠行动选项: {上, 下, 左, 右, 吃, 休息}
　　目标: 在规定的时间范围内, 吃到最多大米的小鼠获胜.
　　
　　参赛的玩家多且数量不确定, 采用单局群K(玩家数量不确定,灵活)+淘汰赛制.

　　玩家需要提交,实现特定接口的JAVA实现类的代码即可.

实现:
　　运行平台是个J2SE的桌面应用, 其实现本身极富技术含量的, 让我们来一一道来.
　　1). 接入游戏平台
　　玩家的AI如何接入平台? 有约束不?
　　没有约束是不可能, 但最小化限制和约定, 是一个好平台应该追求的.
　　运行平台负责, 比赛组织和游戏判定. 而游戏玩家扮演好比赛者的角色.
　　鉴于此, 我们引入接口类, 用于描述小鼠AI的决策行动.
　　定义具体行为:
```
public enum MoveAction {
    LEFT,           // 左
    RIGHT,          // 右
    UP,         　　// 上
    DOWN,           // 下
    EAT,            // 吃
    SLEEP,          // 休息
    NONE            // 无效
}
```
注: 该枚举类, 描述了小鼠每一次决策时, 能执行的动作类型.
　　决策定义类:
```
public interface BaseMouse {
 
    /**
     * @brief       　　返回代表老鼠的名称，与申请的保持一致
     */
    public String getName();
     
    /**
     * @brief       　　决策当前的行动
     *
     * @param x     　　小鼠的x坐标
     * @param y     　　小鼠的y坐标
     * @param maze      迷宫地图        0: 平地, 1: 障碍物, 2: 大米
     * @param others    其他小老鼠的信息列表(x, y, score)
　　   */
    public MoveAction execute(int x, int y, int[][] maze, List<MouseInfo> others);
     
}
```
注: 函数execute是玩家的具体类中需要好好实现的.
　　玩家实现该BaseMouse类后, 提交该java源码即可.
　　由于java的类加载机制, 只要把类文件编译后的class文件, 放入桌面应用的classpath中去. 运行平台就能加载和运行该游戏AI, 并进行模拟比赛.

　　2). 游戏规则的约束实现
　　游戏PK环节中, 其主逻辑可以描述如下:
```
for ( i = 0; i < max_step; i++ ) {
    // 在1秒内, 执行完各个游戏AI的决策函数
    foreach ( player in player list ) {
        // 执行决策函数
        action <- player.execute(x, y, maze, list)
        actions <- (player, action)
    }
    // 更新并作用游戏
    game.update(actions);
}
```
这边的难点比较隐蔽, 是对接口调用的时间约束.
　　尽管我们对数据的输入和输出做了控制和限定, 看上去一切完美. 但接口的实现方, 可能因某个错误逻辑, 导致内部调用超时, 甚至死循环. 这会导致外部的主循环阻滞和无法及时响应.
　　框架层, 如何对用户实现的函数做个超时控制/约束呢?
　　Java并发库的Future模式可以轻松解决这个问题(做Java开发的同学真幸福).
```
ExecutorService executor = Executors.newFixedThreadPool(20);
 
// 超时增强控制
FutureTask<String> task = new FutureTask<String>(new Callable<String>() {
 @Override
 public String call() throws Exception {
  return "Hi";
 }
});
executor.execute(task);
 
// 结果聚合处理
try {
 // 在1秒的限定内， 等待结果返回/超时
 String result = task.get(1, TimeUnit.SECONDS);
 // Do thing about result
} catch (InterruptedException | ExecutionException | TimeoutException e) {
 task.cancel(true);
}
```
在Callable回调函数中, 放置用户/玩家的execute函数调用即可.
　　框架代码会增强并发计算能力, 其代码逻辑比这更复杂一些.

　　3). 抽签和比赛安排
　　不像世界杯, 限定在32支队伍. 游戏本身参与的用户数不确定, 给安排比赛带来麻烦.
　　按2进1晋级这种模式, 有些幸运的玩家可以首轮轮空, 直接晋级. 略微有些不好的地方是, 对于一个小竞赛而言, 总场次多了一点.
　　利好的是单局群K, 其人数配置比较灵活. 数量配得多点, 可以加速游戏的收敛进程.
```
把比赛过程分为: 小组赛和淘汰赛.
小组赛的每局玩家数相对灵活, 范围选为[k, 2k), 每局选取第一名晋级.
淘汰赛的每局玩家数固定为k, 第一名晋级. k个第一名进行下一轮的晋级, 直至总决赛.
对于用户总数为M.
寻找n使得: k*k^n <= M < 2k*k^n     (M>=2, k>=2).
首轮总共 k^n 场次, 每场人数灵活设定在[k, 2k)之间.
比如参与用户数为M=31, 晋级比k=4, 则n=1, 满足 4*4^1<=31< 8*4^2.
首轮共4场, 每场人数在[4, 8)之间,比如按(8,8,8,7)分配.
晋级赛一轮, 即为总决赛.
```
注: 这边只是提供了一种思路, 感觉这边比赛安排这块, 是个可深挖的切入点.

游戏AI:
　　这边的老鼠AI, 需要用户/玩家去设计实现. 最基本的实现方式, 贪心法. 每次最短路径到最近的大米.
　　具体的算法: 可参见之前的博文<谈谈面试--迷宫寻路系列>.
　　当然贪心策略会步入局部最优的陷阱, 在具体决策时, 需要综合考虑全局的大米分布以及对手的行动.
　　对对手的行为预测分析, 以及对大米分布综合分析, 将决定用户最终的得分.
　　不管怎么样, 该游戏AI设计的三个层次:
　　1). 决策
　　2). 路径规划
　　3). 移动执行
　　当目标状态发生变化时, 则立即决策下一个目标. 选定一个目标后, 就坚定地执行该任务, 直至目标完成或变化. 尽量避免行动过程中的决策震荡.
　　由于用户/玩家的众多, 以及策略的相克. 游戏充满了偶然性, 就像石头剪子布一样, 想多了输, 想少了输. However, Just a Game! Enjoy Happy.

总结:
　　其实该平台可挖掘的点很多, 很多都不能一一细说. 我希望将来我能实现一个类似的网页版游戏对战平台,就像腾讯的"在线编程对战游戏--CodeTank"一样.
相关阅读:
HDU 5714
C++ 中的名称冲突之 "y1"
FFT 模板
 Modular Query
找礼物(find)（模拟）
水流(water)（BFS）（DFS）
单词接龙(dragon)（BFS）
细菌(disease) （位运算）（状态压缩）
Diamond Collector （动态规划）
超级素数(sprime) （BFS）
原文地址：https://www.cnblogs.com/jiangxiaobo/p/6110095.html