1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

让人工智能去下路边街头的象棋残局会赢吗?

本帖由 漂亮的石头2020-07-25 发布。版面名称:知乎日报

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    486,695
    赞:
    47
    [​IMG] 宝珠道人,AI + 科普 | 道哥求关注 阅读原文

    这个话题非常有趣。没有标准答案,重要的是展现思路。我按照“能赢”来强答一波。

    先讲讲历史进行铺垫

    大家知道,在 2016 和 2017 年,谷歌旗下 DeepMind 公司先后研发了围棋机器人 AlphaGo 和 Alpha Zero,前者战胜了韩国棋手李世石,后者战胜了中国棋手柯洁,两位均是人类的顶尖棋手,世界冠军。而且,Alpha Zero 在与 AlphaGo 的对弈中,取得了 100:0 的胜率。至此,围棋作为体现人类智力活动巅峰的一种活动,也被人工智能无情碾压。

    对棋类了解少一点的同学,可能只了解到人工智能战胜了围棋,还不清楚其实在更早的时候,计算机算法(那时候大家还不习惯称之为人工智能)就已经在国际象棋和中国象棋上展现了大杀四方的能力,具体情况可参看如下两个早期的知乎帖子。

    国际象棋:

    IBM 超级计算机「深蓝」为什么能赢棋王卡斯帕罗夫?

    中国象棋:

    人工智能与中国象棋的顶尖高手对弈的结果有哪些?

    看到这里,大家是不是有一种对人工智能来说,下赢街头象棋残局如砍瓜切菜、小菜一碟的错觉。其实不然。具体解释之前,我们先看一个街头残局的例子,内容来源于如下帖子:

    有哪些经典的中国象棋残局?

    [​IMG]

    具体的,作者摆出了一个如下的象棋残局。虽然从棋子上看红方差距悬殊,但不难看出,这样的棋局其实黑方必败。

    [​IMG]

    以上例子让我们对路边街头的江湖象棋残局略知一二。简单说,很多街头象棋残局其实是不按常理出牌的盘面,看似车马炮齐全的黑方,主力部队被堵在里面动弹不得,发挥不了作用,相当于没有。(我对街头的象棋残局理解较为粗浅,且说到这)

    回到技术上,计算机算法战胜国际象棋和中国象棋的故事发生在前人工智能时代(以 2006 年 Hinton 教授在 Science 上发表第一篇深度学习的文献为界),当时主要依靠的计算机强大的计算能力。具体地,根据国际象棋或中国象棋走棋规则制定了一套搜索决策算法,在单位时间内,计算机可以对百万甚至更多的可能走法(涵盖多步走棋的时序组合)进行穷举试走,能够精准评价各种走法的优劣,从而展现出超越绝大部分棋手的分析决策能力,获得胜利。一句话总结,在那个时代,机器靠基于特定规则的搜索实现智能

    以上取胜的关键在于机器能够精准评估多步走法对应的各种组合的优劣。由于可能组合随着步数的增加呈指数增长,再强的计算机能评估步数也是有限的,若是不能够设计出高效的剪枝算法的话。换言之,剪枝算法的设计决定了相同计算能力的机器能够在单位时间内评估的步数

    能够评估得越多,相比于人的优势越大。具体实现上举个例子,设计得好的剪枝算法,可以精准评估未来 10 步内 99.9% 的合理对弈产生的结果,设计不好的,也许只能精准评估未来 3 步内 99.99% 的合理对弈产生的结果,而这个能力人类高手也具备。然而,很多路边街头的残局,钻的正是这 0.1% 或是 0.01% 的空子。计算机算法不能很好的解决这些盘面,因为在它的规则设计中,假定这种情况不会出现。

    再回到围棋这个主题,前人工智能时代围棋为什么不能取得超过人类的水平,核心原因在于围棋的盘面空间远大于国际象棋或中国象棋,导致搜索空间庞大了许多,即使计算能力强个成百上千倍,面对这么大的搜索空间也是杯水车薪。因此需要理论和算法上的新突破才能予以解决,而深度学习就是这片钥匙。简言之,当前的人工智能时代是通过学习(特别是深度学习)实现智能。

    看到这里,相信大家一个自然的问题是:深度学习能够学会下围棋,那下象棋岂不也是小菜一碟?其实不然。基于规则的搜索和基于学习的方法是两类不同的方法,通过基于学习的方法解决下象棋并不是那么容易。象棋有多种不同类型的棋子,各自走法和限制很多,而围棋只有一种棋子,走棋也相对无限制,二者的博弈学习和评价准则差异明显,通过深度学习下象棋,其实比下围棋难。当然这两年这方面的进展也很大,参看人机对战星际争霸等方面进展就可以想象。抽象出来看,打星际争霸才更像下象棋。

    说完了机器下围棋和下象棋的发展故事,再回到我们象棋残局的主题,我之所以说这个话题非常有趣,是因为它对应了一个传统规则搜索方法的一个盲区,同时现在的人工智能方法也没有专门的去解决它。若要解决这个问题,虽然改进搜索方法和设计专门的人工智能学习方法也是提供解法的一个途径,但更为雅致的方法是:将传统规则搜索方法和深度学习方法在这个特定问题上结合起来,设计一个计算代价不高,又能解决变幻莫测的残局问题的精致方法,而且这个方法在其它抽象出来具有类似特点的问题上还具有一定推广泛化能力。拔高一点,也即通过知识规则与数据的协同驱动来解决象棋残局问题。

    这对应着传统人工智能和新一代人工智能的融合。在当前博弈学习、强化学习大跨步发展的背景下,我对走通这条路保持乐观。

    阅读原文
     
正在加载...