蜘蛛纸牌– Kashish Varshney –中

蜘蛛纸牌

蜘蛛纸牌(以下简称为蜘蛛)是一种流行的纸牌游戏,经常在在线或离线计算机上玩。 顾名思义,该游戏仅适用于一位玩家。 有两个标准的纸牌组,玩家打算将纸牌组织成八套完整的套装并将其从画面中移除。 可以根据特定规则从卡中发卡或从一列移动到另一列。 我们不会详细讨论这些规则,并假定读者已经理解它们。 在本文中,我们将仅讨论游戏的四套游戏版本。

蜘蛛纸牌游戏有两个标准的扑克牌。

众所周知,用户抱怨各种软件程序存在偏差。 更具体地说,如果程序检测到玩家的胜率较高,则它将在后续游戏中“卡牌”以人为地降低胜率。 当然,用户也可以倾斜并发挥自己的最佳状态。 但是,使用一些基本的统计技术,应该有可能验证或驳斥偏见。 这也可以很好地练习人们如何使用在现实世界中观察到的数据和统计技术来检验假设(例如“蜘蛛程序有偏见”)是否正确。

测试统计

对于每场比赛,我们希望记录一组统计数据,以反映纸牌的运气,因此,较高的值表示获胜的机会更大。 这样做的目的是估计在完全公平,无偏的游戏中这些测试统计量将获得什么值,然后将它们与我们怀疑可能有偏差的游戏中记录的值进行比较。

显示了一个典型的散点图(下面定义了AGT和ATSV统计信息),其中蓝色圆圈和红色十字分别表示获胜和失败。

一旦发出前十张牌,我们就可以计算保证回合 (GT),这是玩家在被迫发另一行之前可以确定暴露的最少张牌数。 每当发新的10张牌时我们都可以进行类似的计算(并假装这是新游戏的开始)。 这样,我们可以计算出平均GT(AGT)。 如果GT连续数轮处于低位,玩家可能会遇到麻烦。 请注意,AGT独立于玩家,因此可以通过运行大量试验(即处理大量行)来轻松模拟AGT的概率分布。

根据我的经验,我注意到如果牌的整体分配不佳,玩家也会遇到麻烦。 例如,如果有七个皇后区,但是即使有一个或多个空列,也只能出现两个杰克在比赛中的问题。 因此,我定义了总平方偏差 (TSV),该总偏差通过取相邻等级计数的平方的负平方和而获得。 在上面的示例中,七个皇后和两个杰克将贡献这笔款项。 之所以采用负值,是为了确保更高的值表示出更多的获胜机会,就像AGT一样。 如果我们在有新卡公开时计算TSV,则可以计算单个游戏的平均TSV(ATSV)统计信息。 请注意,为了使ATSV独立于玩家,我们假设承认游戏的玩家必须以随机顺序公开所有未公开的卡片(尽管玩家可以选择先公开哪个未公开的卡片,但他无法避免每个未公开的卡片的事实卡出现的可能性均等)。 幸运的是,这可以通过仿真轻松完成。

模拟显示,在很多游戏中,对于一个没有偏见的程序,AGT应该等于3.96,而ATSV应该等于-32.29。 在示例起始位置,我们将具有2的GT和-28的TSV。 在游戏完成之前,我们不会知道AGT和ATSV。

估计胜率

除了AGT和ATSV,我们还希望估计无偏见的Spider程序的“正确”获胜百分比。 一个明显的困难是获胜率取决于玩家,因此很难证实有人可以赢得例如50%的比赛的说法。 另一个问题是,我在各种Spider程序中获得了不同的获胜率,范围从45%到60%以上,而且我没有证据表明在使用此类程序期间我的比赛有所改善(即,我的获胜率与时间的增加没有正相关关系) )。

拒绝原假设(尽管它是真的)被称为I类错误。 它发生的可能性等于显着性水平。 假设检验中的另一种错误(II型错误)是接受原假设,即使该假设为假。

特别令人感兴趣的是皮普金的《白痴的欢乐纸牌服务器》 。 这是一个免费的在线纸牌程序,其中包含许多纸牌变体,其中包括著名的克朗代克,空当接龙和蝎子等。 《白痴的喜悦》允许玩家选择从1到999999指定一个给定的种子编号。例如,如果选择了种子142857,则前十张卡始终是各种花色的2J56J9JQ59。 请注意,如果玩家在玩游戏之前随机生成一长串种子号,则该程序无法根据玩家的胜率调整难度级别。 因此,我使用了《 白痴的喜悦》来估算我的获胜百分比。

我在Idiot’s Delight上玩了100场比赛,使用的种子数在1到100之间。我赢了59场比赛,输了41场,所以我估计无偏蜘蛛程序的获胜百分比为59%。

估算值

我在免费蜘蛛纸牌上玩了100场蜘蛛游戏 。 选择该选项是因为经过一些实验后,它“似乎一直很糟糕”:虽然有可能获胜,但即使是专家玩家也通常需要付出一些努力。 对于每场比赛,我记录了结果(赢/输)以及AGT和ATSV统计数据。 我分别为AGT和ATSV获得了和的-value。 这意味着AGT和ATSV的统计数据低于预期(即对玩家不利),但是因为这两个值均超出了我们的阈值,因此在统计上并不显着:合理地讲,较低的值可能是由于偶然的变化引起的。 不幸的是我只赢了46场比赛,比预期少了13场。 这可能表明进一步测试是合理的; 但是请记住,获胜率是特定于玩家的,在100场比赛中,我很有可能没有发挥出最佳状态。

我认为没有足够的证据证明“ 自由蜘蛛纸牌”存在偏见。 然而,四十六次的胜利有点令人失望,使该计划避开了一颗子弹。 但是其他Spider程序可能并不那么幸运……