在德州扑克人机大战中,四位职业牌手与CMU开发的人工智能系统Libratus进行了激烈对抗。
Libratus是卡耐基梅隆大学的托马斯·桑德霍尔姆和诺姆·布朗(Noam Brown)开发的。他们以前开发的机器人Claudico在2015年的德州扑克比赛中没能击败职业牌手。
此前雷锋网也曾报道过,“一对一无限注德州扑克”就是两个人玩的赌博游戏,因为事先会给每位玩家分发2张底牌,所以对方“底牌信息”你是不知道的,对于计算机来说,就是在处理一种“非完整信息博弈”。我们知道AlphaGo玩围棋,对弈双方的信息是完整的、对称的,并没有隐藏的信息。所以在德州扑克上AI取得了进步,是具有重要意义的。
比赛期间,前三轮比赛失利后,四位职业牌手在第四天和第六天的比赛中获得胜利。Libratus原本领先193000美元,在第六轮比赛后Libratus仅领先51000美元。
在人类选手反击迅猛之时,牌手之一詹森·莱斯便在一封电子邮件中写道:
我们花了一段时间学习,以理解正在发生的事情。
然而,随后Libratus的表现让所有非常人吃惊:再次获得关键性胜利。第10天结束时,Libratus已经领先677000美元,而且局势也似乎不可逆转。
跟AlphaGo相似,Libratus也可通过增强学习进行自我博弈和学习。
Libratus的开发者之一托马斯·桑德霍尔姆也说道:
我们不能详细谈论Libratus的技术,直到比赛结束为止。但是,我可以告诉大家,Libratus的算法一直在超级计算机上运行,所以超级计算机每天都在输出改进的策略。
今年1月底,Libratus可能会在下一场比赛中再次击败人类。到目前为止,机器人还没有在无限制德州扑克团体赛中击败过人类,但这一天也许不会太远了。
人工智能扑克机器人的研发具有重大意义。首先,它是一种教导人工智能系统处理不完整信息的方式。诺姆·布朗指出“在现实世界中,所有的相关信息通常不像棋盘上的棋子那样明显。有些重要的信息会丢失或隐藏,人工智能需要能够处理这样的信息。”
精彩评论