加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 大数据 > 正文

AI AlphaGo算法是如何运行的,你真的了解吗?

发布时间:2021-10-04 14:24:40 所属栏目:大数据 来源:互联网
导读:围棋 百度百科的定义中,阿尔法围棋 (围棋机器人、AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯哈萨比斯领衔的团队开发,其主要工作原理是深度学习(深度学习是指多层的人工神
围棋
 
百度百科的定义中,阿尔法围棋 (围棋机器人、AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯哈萨比斯领衔的团队开发,其主要工作原理是“深度学习”(“深度学习”是指多层的人工神经网络和训练它的方法)。
 A
 
AlphaGo对战职业棋手
 
今天我们就来简单讲讲AlphaGo的工作原理,不会很深入,目的是让大家有所了解。
 
AlphaGo的算法其实主要是“蒙特卡洛树搜索”与“卷积神经网络”,术语看起来超级高大上的,但其实都是非常好理解的东西。
 
先从功能上来说,蒙特卡洛算法是用来确定下一步落子位置的。人类下棋的时候,第一凭经验看准哪几个落子点,然后再进行计算,得到最佳的落点,实际上和蒙特卡洛算法是相同的方式。
 
再说的详细一些,蒙特卡洛算法的本质就是随机:人们给AlphaGo记录了好多棋谱,它自己也对弈了很多局,在对棋谱中,当前形势下的落子可能性做了统计之后,根据棋谱中出现频率比较高的胜招好棋,帮助它找最优解。
 
 
 
蒙特卡洛树
 
百科中是这样说的:“一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。”当然这包括了我们接下来要说的,“卷积神经网络”。
 
 
AlphaGo对战李世石
 
卷积神经网络其实就是帮助计算机认识图像的。如果只是输入一张图片,人工智能或者说计算机,只能感应到一堆像素点,它要如何才能判断照片里的东西是什么呢?这就是这个所谓的“卷积神经网络”算法干的事情。
 
 
卷积神经网络
 
那么这个算法用在围棋里,就是帮助程序看到棋局了。每一次落子之后,形成的棋局盘面,就是一个图像信息。计算机认识棋型、死活等这类事情,本质上都是图像信息处理的过程。棋局评估也用到了这个,因此AlphaGo的估值、策略能力很准,从而能有效的判断局势并且选定落子,这就是AlphaGo比以前的围棋软件更厉害的原因。
 
 
围棋机器人
 
除此之外,我们已经提到了,AlphaGo围棋机器人会自我学习,这是因为它会自己跟自己对弈,然后分析自己的棋谱,从而改变棋局评估的侧重因素,以及在某些局势下落子的概率。AlphaGo在复盘过程中,能够使某步棋的概率提高一些,从而让最开始说的那个“蒙特卡洛算法”更容易选中它,另外让棋局评估系统认识这一局面,并把它判断为“其实是一步好棋”。
 
说到这里,大家是否有对围棋机器人有一点了解了呢?

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读