操作条件调节有效吗？惩罚对基于团队游戏的绩效影响的非科学案例研究电视电影小迷妹 TVco.cn

我真的很喜欢玩一款名为《反恐精英：全球攻势》（CSGO）的游戏。这是第一人称射击游戏，一个团队（T队）试图摧毁一个物镜，而另一个团队（CT队）试图阻止它们。我通常会随便玩游戏，以发泄精力或只是为了玩乐。但是我最近有一个想法：是否可以通过操作条件调节来改善我的游戏玩法？现在，在获得结果之前，我认为我们首先必须定义一些事情，例如什么是操作条件，以及如何客观地衡量游戏性能。

操作条件

操作者调节是学习过程的一种形式，通常归功于心理学家BF斯金纳（BF Skinner）。它试图通过强化或惩罚来改变特定的行为。强化是当您尝试通过添加正面刺激或消除负面刺激来强化行为时。惩罚是当您尝试通过添加不受欢迎的刺激或删除有吸引力的刺激来减少负面行为时。

在这种情况下，我尝试减少的行为在游戏中被杀死。为了减少这种行为，每当我被不必要地杀死时，我都会增加20个俯卧撑的惩罚。

实验条件

在6天的时间里，我每天玩4个休闲游戏。在开始的三天内，每次满足特定条件时我都会进行俯卧撑，而在接下来的三天中，我不会进行俯卧撑以观察是否有任何即时效果持续下去。因此，我的实验条件。

在每场比赛的开始，我的得分都从0开始。

每次杀人时，我的得分都会加1。如果我被多次杀死，那么我的分数将会提高。在每个新回合开始时，得分+1或更高将成为+1。

如果我是T，则每次植入设备时我都会获得+1。如果我是CT，每次拆解设备时都会获得+1。

每当我被杀死时，我的分数就会下降1。

如果我的分数以-1结尾，则下一轮我的分数将重置为0。

每当我的分数下降到-1时，我都会立即进行20次俯卧撑。

结果

因此，正如我确定您想知道的那样，在那三天内，我完成了多少俯卧撑？好吧，答案是：很多！

在这三天中，我总共进行了820次俯卧撑！但是，有趣的是，我每天做俯卧撑的次数越来越少，从第一天的420下降到第三天的160。这表明在这三天的过程中，我确实确实在改善我的游戏玩法，不必要地减少了击杀次数次。

死亡/死亡比率似乎支持这一点。在此实验之前，我的平均K / D为1.18。在第一天，我的平均K / D为0.86，大大低于我的总体平均水平。但是，在接下来的两天里，当我开始适应惩罚时，我的K / D大大超过了基准。有趣的是，在实验的惩罚阶段之后，我的k / d比率仍然保持在基准之上。

绩效的另一个衡量标准是在每个回合结束时赢得MVP奖励。奖励通常给予在那轮比赛中产生最大影响的获胜团队中的玩家。这通常是由杀害，扩散或种植该设备最多的人测量的。在进行此实验之前，我参加了13819轮比赛，获得了1289个MVP明星，因此MVP明星的平均比例为0.09。在第一天，我实际上得到了0星，这对实验来说并不是一个好兆头。但是，第二天我的MVP星星跃升到0.14，并在4/6天的时间内保持在0.09基准之上。在过去的6天里，我平均每天只玩50轮，这意味着获得单个MVP奖对比率的影响要大得多，但确实对我玩的回合产生了更一致的影响。

最后，我们最后要看的是每轮获胜的百分比。我的实验前比率是7276/13819，胜率约为53％。就像我们查看的其他值一样，第一天的表现非常糟糕，与基准相比，我的获胜率更低。再一次，在接下来的5天里，我的获胜百分比缓慢上升并保持在获胜百分比基准之上。

因此，总的来说，这个实验似乎是成功的。在俯卧撑期间，不仅我的K / D，MVP之星和获胜百分比增加，而且收益还会延续到接下来的3天，尽管效果略有下降。但是，有趣的是，我从这次实验中也吸取了许多不同的教训，这不仅与游戏有关，而且还包括我一般的学习方式。

本实验的教训

责任有整体转变

当我以前玩这个游戏时，我并没有真正为发生的事情负责。如果我被杀，或者我们输掉了回合，我有很多理由可以用来解释。另一支球队更好，有人显然在偷东西，他们欺骗了我们，我们无法获得位置。但是，一旦我开始做俯卧撑，我就把责任更多地转移给了我自己。例如，如果我被杀了，我就开始责怪自己位置不好或目标不好。如果我不得不猜测为什么会这样，我会说这是一种应对机制。如果玩家只是比我强，那么我无能为力，而我最终只会做越来越多的俯卧撑。但是，如果我说问题出在我身上，那么突然我可以采取一些措施来纠正这种情况。如果我的位置不好，那么我可以开始看到自己的变化，这样就不会再发生了。我确实认为这是在这么长的时间内帮助我成为更好的球员的事情。

激励是避免惩罚，而不是赢

对我来说，这也是一个有趣的发展。我会说我是一个很有竞争力的人。我喜欢赢球，而我开始这个实验的原因是为了变得更好。但是，在第一场比赛还没结束之前，心态已经改变。我不再考虑该怎么做才能赢得比赛，但要避免做更多的俯卧撑。游戏变得更加明智。我不再只是匆匆忙忙地对每个回合产生重大影响（以后会再介绍）。我开始更多地分析情况，以找出如何最好地放置自己，而不是为了帮助球队获胜，而是为了提高自己的得分而被杀。

最重要的是， 为了短期满意 ， 我放弃了长期优势。 为了理解这意味着什么，您必须对游戏有更多的了解。胜负很大程度上取决于管理团队的经济状况。每个回合，每个人都会基于各种因素获得一定数量的资金。然后，这笔钱可以用来购买武器和装备，这些装备和装备的价格都一定。平均而言，冲锋枪比突击步枪便宜得多，但您会放弃射程和伤害等方面。对于同等级别的较便宜的枪支，例如加利尔（2000美元）和Ak-47（2700美元），这种情况也可能成立。现在，我最喜欢的枪支之一是AWP狙击步枪，因为它每次射击都会造成很大的伤害，并且射程很远。但是，与其他枪支相比，这是非常昂贵的，而且我必须花几轮才能省下钱才能买得起。因此，在第一轮中购买非常便宜的东西是有意义的，然后在下一轮中使用省下的钱购买AWP（$ 4750）。如果我做得对，那把武器可能会在多回合中产生重大影响。但是，俯卧撑的惩罚似乎产生了很大的影响，我什至不敢冒险。每次我必须购买一轮新武器时，我都会购买最好的突击步枪，在T侧使用AK-47（$ 2700），在C侧使用M4A4（$ 3100），并且经常降级为Galil或Famas（ 2250美元）（如果我的现金不足）。在我看来，我知道获得AWP可以使我更有机会在多发回合中被击杀，但是由于担心立即俯卧撑，我不得不在每一回合中购买最好的武器，而不必担心自己的经济状况。

更少关注成为明星，更多关注成为团队成员

对于FPS游戏，我典型的游戏风格是非常进取和孤独。我经常会偷偷溜到地图的一侧，并试图惊讶地抓住我的敌人。这可以产生巨大的回报，获得4–5次杀人回合，获得MVP明星的机会很大。但是，每次执行此操作，我都会得到2或3轮回合，我会立即被杀死，或者可能会被杀死。

在我设置的这个系统中，多次杀人等于一次杀人而不是死亡。但是，这对我没有任何影响的回合进行了严重的处罚。这样，我的游戏风格自然就变成了一种更柔和的风格。我几乎从来没有独自去过，因为那没有给我很大的成功机会。取而代之的是，我经常跟随背包走，走到哪里。我会保持共同的立场，这样，如果一个敌人冲顶并杀死了我的队友，我就有很大的机会被杀死。而且我经常会和我的团队一起推到客观的地点，或者一起挤过瓶颈。这减少了我被杀的机会（更多人同时射击），但也减少了我被杀的机会。

但是，令我感到惊讶的是，在整个实验过程中，我实际上获得了比平均水平更高的MVP明星。

我仍然不确定为什么会这样，因为我每一轮都没有做任何令人惊奇或令人难忘的事情。但是我猜想，通过存活更多的回合并在我周围有更多的队友，我会认为。它给了我一个更好的机会，可以多次被击杀或达到目标。结果，它增加了我获得多轮MVP明星的机会，而不是进行超高影响力的一轮，然后在接下来的3或4时间内什么也不做。

受到惩罚时会有更强的精神毅力

如果您玩过任何竞技游戏，那么毫无疑问，您会听到“倾斜”一词。对于其他每个人，正是当您进入情绪状态时，您才会采取不太理想的策略。因此，对于CSGO之类的游戏而言，倾斜是指某人被一遍又一遍地杀死，感到沮丧，然后开始玩的情况比以前更糟。

每当我的分数下降到-1时都必须做俯卧撑，这对我来说是一个很好的动力。在第一天，您可以看到我做俯卧撑最多。我想对自己玩过的游戏感到沮丧。我会被杀死，做20次俯卧撑，立即被再次杀死，再做20次，然后可能连续第三次被杀死，在几分钟的时间内进行60次俯卧撑。现在显然，以这种速度，我真的很快就累了，而且我知道我必须清醒头，否则我会做更多的俯卧撑。我开始在各回合之间进行短暂的冥想，然后分析为什么我之前被打死。通过在游戏中添加大脑元素，我能够消除情感方面的困扰。每次，我被杀死，我都没有让它得到我。我将重置并将下一轮视为全新的事物。我也继续保持镇定。即使我真的很想跑步，我也会在地图上走动。即使有时所有动作都发生在地图的另一侧，有时我也会为一轮的大部分时间保持一定角度，因为我知道敌人极有可能试图越过该侧。在第2天和第3天，我很少连续被杀死。相反，在被杀死并进行一系列俯卧撑后，我经常将其转弯并在下一轮中获得2或3个杀死。

仅当我亲自看到收益时，收益仍然存在

这与游戏无关，而更多地是对操作条件的普遍批评。每当我被不必要地杀死时，都必须做俯卧撑，这使我的比赛方式从非常激进变成了非常被动。但是，在实验的俯卧撑阶段结束后，我很快又回到了更具侵略性的游戏风格，因为它更有趣，而且对我来说更自然。但是，我确实注意到，我仍然保持了那三天中我学到的一些东西，例如保持一定角度，因为敌人喜欢那样走，或者如果我们极有可能成功地聚集起来冲向某个地点。这样看来，虽然操作条件调节对于改变行为非常有效，但当消除惩罚/强化时，效果也很容易逆转。唯一的错误是我亲眼看到这样做的好处。在这些情况下，我坚持进行更改。这节课可以从视频游戏推论到生活的其他部分。例如，如果父母将醋或辣酱放在儿童衬衫上以阻止其咀嚼衣领，则它们会迅速停止。但是，如果除去醋或辣酱，他们通常会再次启动，除非他们亲自找到停止咀嚼衬衫的理由。

结论

现在，我知道可以更好地控制实验，可以延长俯卧撑阶段以更好地减少不良行为，我可以让实验运行更长的时间以查看收益是否可以长期保持，而我使用的测量值可能不会一直是最好的。但是，我并不想进行良好协调和控制的实验。这只是一个有趣的想法实验，结果却得出了一些非常酷的结果。我学到了一些关于自己的课程，并且在自己喜欢的游戏中变得更好。

如果您有任何问题或意见，请在评论中告知我。

操作条件调节有效吗？ 惩罚对基于团队游戏的绩效影响的非科学案例研究