员工们的囚徒困境

2007年4月18日 · 阅读需 21 分钟

几个月前，我读了一本由詹姆斯·米勒（James Miller）撰写的《Game Theory at Work》（《职场博弈论》）。早就想写点读后感，但一直没抽出时间。今天，终于找到了契机，把自己的感悟整理出来。

读完这本书，我深感收获良多。书中不仅让我理解了许多以前模糊不清的概念，还帮助我用更深刻的视角看待生活中的现象。例如，过去在看电影《美丽心灵》时，我听说过“纳什均衡”这个名词，却始终搞不清它的确切含义。如今，通过这本书的阐释，我终于弄明白了。

书中的另一个亮点是，它揭示了一些日常现象背后的逻辑，并将这些看似普通的事情提升到了理论层次。例如“逆向选择”的原理，这在生活中比比皆是却往往被忽略：在追求异性时，如果表现得过于迫切，成功的概率往往微乎其微；而若能掌握“若即若离”的技巧，反而可能让对方更感兴趣。同样的道理也适用于找工作——如果在面试中过于显露对工作的渴望，面试官可能会怀疑你的真实能力；反过来，如果是公司拼命想要招揽你，你很可能会懊悔自己当初定下的薪资太低。

当然，书中提到的博弈论原理不止于此。其中最为经典的，无疑是“囚徒困境”。这一理论在经济学中几乎是绕不开的议题，也被很多相关书籍反复提及和讨论。

囚徒困境

为了便于理解，不妨引用经济学家格里高利·曼昆（N. Gregory Mankiw）在《经济学原理》（Principles of Economics）中对囚徒困境的描述：

警方有确凿证据表明邦妮（Bonnie）和克莱德（Clyde）犯下了非法持有枪支的轻罪，如果罪名成立，他们将被判入狱一年。然而，警方还怀疑两人涉及抢劫银行的重罪，但苦于没有直接证据。于是，警方将他们分开关押，并分别向他们提出了相同的交易条件：“如果你承认抢劫罪并指控你的同伙，我们将豁免你的刑罚，你可以立即获释。而你的同伙将因抢劫罪被判20年。如果你保持沉默，但你的同伙选择揭发你，那么你将面临20年的牢狱之灾。如果你们都选择坦白，我们会判你们各8年徒刑。若两人都保持沉默，只会被判轻罪，各坐一年牢。”

面对这样的抉择，邦妮和克莱德该怎么办？假设两人都是完全理性且自私的，那么他们会发现，无论对方如何选择，坦白始终是对自己最有利的策略。邦妮可能这样想：“如果克莱德保持沉默，我坦白就能立即获释；如果克莱德坦白，我也必须坦白，这样至少能避免最糟糕的20年刑期。”同样，克莱德的逻辑与邦妮如出一辙。最终，两人都选择了坦白，结果双双被判8年牢狱之灾。而如果他们都选择保持沉默，仅需服刑一年即可重获自由。

囚徒困境的悲剧在于，各自追求最优解的理性选择，却导致了对双方最不利的结果。

囚徒困境不仅仅是理论推演，而是现实生活中广泛存在的现象。例如，在一个小镇上，有两家竞争的饮料公司。如果双方都选择不做广告，它们可以平分市场，从而获得丰厚的利润。但由于担心对方抢占市场份额，两家公司都认为投放广告是对自己最有利的策略。结果，它们的广告费用大幅上升，利润却被广告公司分走大半，最后两家公司都得不偿失。这个例子生动地体现了囚徒困境的普遍性。

摆脱囚徒困境

当我们面对类似囚徒困境的情形时，尽管局势看似无解，但仍有方法可以努力摆脱。最常见的手段之一就是签订协定或达成某种共识。例如，两个小朋友如果一起干了坏事，在被老师叫去之前通常会私下约定：“谁都不许出卖对方！”这样一来，即便老师调查，也难以掌握更多的证据，对两人的惩罚自然会轻得多。

那么，邦妮和克莱德是否可以在被抓之前达成协议，约定在审讯时都保持沉默呢？理论上可以，但实际上，这种协议未必能改变他们最终的选择。因为即使有了协议，邦妮依然无法确定克莱德是否会背叛她。而从理性的角度看，无论克莱德是否守约，选择出卖对方都对邦妮更加有利。同理，克莱德也会得出相同的结论。最终，他们仍会背弃协议，互相揭发。

由此可见，仅仅签订协约是不够的 - 没有约束力的协议就是一张废纸。要想让协议真正生效，必须对违反协议的行为设置严厉的惩罚。两个小朋友之所以会相互袒护，是因为彼此清楚：如果我这次出卖了你，下次你也会反过来告发我。这种潜在的惩罚迫使他们选择合作。而对于邦妮和克莱德来说，情况却截然不同。他们被捕后很可能再也没有机会“共事”，因此无需担心背叛对方会导致未来的报复。当然，如果他们隶属于某个帮派，那就另当别论了。帮派通常对叛徒实施严厉制裁，例如家族清算，这会极大地遏制叛徒行为，也解释了为何一些帮派成员宁死不屈。

不过，加入帮派毕竟只是特例。在大多数情况下，对于类似的多次博弈，对违约者最有效的惩罚就是对方在下一轮选择同样的违约行为。

假设一个小镇政府计划在一年内分 12 次采购饮料。如果小镇上的两家饮料公司报价一致，政府会将订单平分；但若一家报价低于另一家，政府会将更多订单给报价更低的公司。显而易见，对两家公司来说，达成一致报出较高价格符合各自的利益。然而，在这种多次博弈中，他们真的能长期合作吗？

假设他们最初签订了合约，约定都报出较高的价格。然而，在最后一次博弈时，由于未来已无合作机会，任何一方都可能选择违约，降低报价以获取更多订单。既然最后一次违约是“必然”的，那么倒数第二次博弈时，双方也无需遵守协议，因为他们知道接下来违约无法避免。这种逻辑继续倒推，最终会导致从一开始，双方都不信守合约。结果，两家公司为了争夺市场而恶性竞争，最终双双受损。

只有当博弈的次数是无限的，或双方对博弈的结束时间存有不确定性时，才能形成长久有效的合作。因为在这种情况下，违约者可能面临持续的报复，而合作的收益远超一次性违约的短期利益。在这种情况下，双方才更可能摆脱囚徒困境，实现长期共赢。

让员工们陷入囚徒困境

假如你是某事业部门的经理，手下管理着七八名业务员。有什么方法可以激励他们拼命工作，甚至自愿加班？如果你仔细阅读了前面的内容，或许已经想到了一个高效的策略——将他们置于囚徒困境之中。一旦每名员工都认为，自己拼命工作、无条件加班是最佳选择，老板的工作自然会轻松许多。

实现这一目标的手段多种多样，例如：

威逼：对员工的业绩进行评级排名，并明示最差者将被扣工资；
利诱：承诺业绩最优者将获得丰厚奖金；
煽风点火：对小王说，“小王啊，公司近期正准备提拔一批管理人员，我对你非常看好。不过，老张可是拖家带口，最近常常忙到深夜。他这么努力，你可不能落后呀！这样我才能放心向老板推荐你。”接着又对老张说，“老张，瞧瞧小王，刚毕业就拼劲十足，业绩蒸蒸日上。你作为老员工，要是表现比不上新人，我在老板面前可很难为你说话哦。”

通过这套方法，员工之间的攀比心理会被激发出来，他们或许会竞相加班加点。然而，结果真的如此吗？未必如此简单。

如果你接手的是一个成立已久、员工彼此熟悉且关系融洽的部门，这套手段可能很快失效。原因在于，员工的工资是按月发放的，他们面对的是一次次无法预期结束的多轮博弈。理性的员工会逐渐意识到：听从老板的安排，只会让自己付出更多的劳动，却未必能得到相应的回报。于是，他们之间可能形成一种默契，逐步摆脱囚徒困境：

工作态度恢复“佛系”，能偷懒就偷懒；
奖金采取轮流分配的方式，既安抚了落选者，也维护了内部和谐；
偶尔拿奖金的员工甚至会“出血”请客，以换取团队支持。当这种默契建立后，你或许会尝试打破局面，比如引入外部变量：招聘一位任劳任怨、不计较个人得失的“蠢驴”型员工，以搅乱员工之间的默契。但这是否有效呢？

答案依然是否定的。其他员工可能会孤立这位“蠢驴”，用排挤行为增加其博弈成本。久而久之，“蠢驴”可能做出以下选择：

投向其他员工的阵营，与他们达成一致；
因孤立而工作困难，最终难以长期获取奖金。

甚至，这位“蠢驴”可能会进化为更加精明的“野牛”或“狐狸”，试图在博弈中谋求新平衡，而囚徒困境依然无法重现。

要让员工陷入囚徒困境，关键是设计出难以达成默契或合约的博弈情境。例如：

小组间竞争：将员工划分为小组，激励小组内部合作，同时制造小组之间的竞争。
跨区域竞争：让自己的部门与异地部门进行竞争。由于不同部门的员工缺乏直接互动，很难形成合谋。

这种策略利用了人与人之间的陌生感与隔阂，延缓甚至彻底打破默契的建立，从而实现短期内的高效激励。上述讨论基于博弈论的前提：参与者是理性的，即追求自身利益最大化。然而，人类并非总是理性。某些情境中，人们可能因情绪、信仰或其他非理性因素而做出利他或不可预测的行为。例如：

传教：通过思想灌输改变人的行为方式；
树立偶像：引导员工为精神上的成就感而非物质奖励奋斗；
宣扬仇恨：将情感导向竞争对手，从而提升内部凝聚力。

有些管理者可能倾向于鼓励非理性行为，认为这样能降低对员工的控制难度。然而，非理性员工的行为往往难以预测，可能无意间扰乱企业的管理秩序，增加成本。因此，最有效的管理方式仍然是制度化：通过规则和奖惩机制，让员工在理性框架内工作，以实现更可持续的发展。

制定薪水的策略

在企业中，不同部门、不同岗位的薪资往往有较大差异。然而，当面对同一群体的员工（例如一组销售人员）时，如何设计一套合理且激励性强的薪资方案是一门艺术。以下，我们以销售人员为例，探讨制定薪资的策略。

统一薪资显然不可行。这种做法曾在过去的计划经济中普遍存在，但实践证明效果并不理想。经济学的第四基本原则告诉我们：人们会对激励做出反应。没有浮动薪资作为激励手段，大部分员工会失去动力，企业的整体业绩也难以提升。

另一个常见方案是以相对业绩决定薪资，即根据员工之间的排名或表现差距来分配工资。这种做法试图通过内部竞争来激发动力，但前文提到的博弈论揭示了其潜在弊端：

员工可能通过默契合作削弱竞争，以保障彼此的舒适度。
甚至可能引发内部分裂，员工间的敌对情绪反而损害团队凝聚力。

因此，完全依赖相对业绩并不是理想方案。

更直接的方式是将薪资与绝对业绩挂钩，例如按照销售额的一定比例支付提成。理想状态下，员工的收入可以完全取决于其个人表现：

优点：这种方式激励性极强，能最大限度调动员工积极性。
缺点：员工需要承担较大的收入风险，而大多数人倾向于规避风险。

假设两家公司提供以下薪资方案：

公司A：固定月薪1万元；
公司B：完全按业绩提成，可能收入为0，也可能月入10万元。

虽然理论上后者的潜在收益更高，但多数人仍会选择公司 A。这并非因为自身能力不足，而是源于对不确定性的恐惧。正是这一心理，让许多人宁愿看老板脸色，也不愿冒险创业。

综合来看，大多数企业采用的是固定薪资+提成的混合模式：

固定薪资：提供基本的生活保障，降低员工的收入风险；
提成部分：将员工与业绩挂钩，确保激励效应。

这种模式对新员工尤为有效，因为初入职场的他们往往缺乏足够的自信和资源来承受收入波动。然而，对于那些有经验且业绩稳定的老员工，这种模式可能不够激励。对他们而言，完全基于业绩的薪资方案反而更具吸引力。随着员工在岗位上的经验积累和信心增强，他们逐渐倾向于接受更高比例的风险以换取更高的回报。这一过程与创业类似：初期阶段，员工需要一定的“安全网”；而一旦具备了稳定的能力和市场资源，他们可能更愿意冒险，以实现更大的收入增长。

因此，弹性薪资方案是最佳选择。例如：

对新人：提供较高的固定薪资和较低的提成比例；
对资深员工：允许选择更高提成比例、甚至完全基于业绩的薪资方案，以激发更高的积极性。

囚徒困境​

摆脱囚徒困境​

让员工们陷入囚徒困境​

制定薪水的策略​

囚徒困境

摆脱囚徒困境

让员工们陷入囚徒困境

制定薪水的策略