跳到主要内容

员工们的囚徒困境

· 阅读需 21 分钟

几个月前,我读了一本由詹姆斯·米勒(James Miller)撰写的《Game Theory at Work》(《职场博弈论》)。早就想写点读后感,但一直没抽出时间。今天,终于找到了契机,把自己的感悟整理出来。

读完这本书,我深感收获良多。书中不仅让我理解了许多以前模糊不清的概念,还帮助我用更深刻的视角看待生活中的现象。例如,过去在看电影《美丽心灵》时,我听说过“纳什均衡”这个名词,却始终搞不清它的确切含义。如今,通过这本书的阐释,我终于弄明白了。

书中的另一个亮点是,它揭示了一些日常现象背后的逻辑,并将这些看似普通的事情提升到了理论层次。例如“逆向选择”的原理,这在生活中比比皆是却往往被忽略:在追求异性时,如果表现得过于迫切,成功的概率往往微乎其微;而若能掌握“若即若离”的技巧,反而可能让对方更感兴趣。同样的道理也适用于找工作——如果在面试中过于显露对工作的渴望,面试官可能会怀疑你的真实能力;反过来,如果是公司拼命想要招揽你,你很可能会懊悔自己当初定下的薪资太低。

当然,书中提到的博弈论原理不止于此。其中最为经典的,无疑是“囚徒困境”。这一理论在经济学中几乎是绕不开的议题,也被很多相关书籍反复提及和讨论。

囚徒困境

为了便于理解,不妨引用经济学家格里高利·曼昆(N. Gregory Mankiw)在《经济学原理》(Principles of Economics)中对囚徒困境的描述:

警方有确凿证据表明邦妮(Bonnie)和克莱德(Clyde)犯下了非法持有枪支的轻罪,如果罪名成立,他们将被判入狱一年。然而,警方还怀疑两人涉及抢劫银行的重罪,但苦于没有直接证据。于是,警方将他们分开关押,并分别向他们提出了相同的交易条件:“如果你承认抢劫罪并指控你的同伙,我们将豁免你的刑罚,你可以立即获释。而你的同伙将因抢劫罪被判20年。如果你保持沉默,但你的同伙选择揭发你,那么你将面临20年的牢狱之灾。如果你们都选择坦白,我们会判你们各8年徒刑。若两人都保持沉默,只会被判轻罪,各坐一年牢。”

面对这样的抉择,邦妮和克莱德该怎么办?假设两人都是完全理性且自私的,那么他们会发现,无论对方如何选择,坦白始终是对自己最有利的策略。邦妮可能这样想:“如果克莱德保持沉默,我坦白就能立即获释;如果克莱德坦白,我也必须坦白,这样至少能避免最糟糕的20年刑期。”同样,克莱德的逻辑与邦妮如出一辙。最终,两人都选择了坦白,结果双双被判8年牢狱之灾。而如果他们都选择保持沉默,仅需服刑一年即可重获自由。

囚徒困境的悲剧在于,各自追求最优解的理性选择,却导致了对双方最不利的结果。

囚徒困境不仅仅是理论推演,而是现实生活中广泛存在的现象。例如,在一个小镇上,有两家竞争的饮料公司。如果双方都选择不做广告,它们可以平分市场,从而获得丰厚的利润。但由于担心对方抢占市场份额,两家公司都认为投放广告是对自己最有利的策略。结果,它们的广告费用大幅上升,利润却被广告公司分走大半,最后两家公司都得不偿失。这个例子生动地体现了囚徒困境的普遍性。

摆脱囚徒困境

当我们面对类似囚徒困境的情形时,尽管局势看似无解,但仍有方法可以努力摆脱。最常见的手段之一就是签订协定或达成某种共识。例如,两个小朋友如果一起干了坏事,在被老师叫去之前通常会私下约定:“谁都不许出卖对方!”这样一来,即便老师调查,也难以掌握更多的证据,对两人的惩罚自然会轻得多。

那么,邦妮和克莱德是否可以在被抓之前达成协议,约定在审讯时都保持沉默呢?理论上可以,但实际上,这种协议未必能改变他们最终的选择。因为即使有了协议,邦妮依然无法确定克莱德是否会背叛她。而从理性的角度看,无论克莱德是否守约,选择出卖对方都对邦妮更加有利。同理,克莱德也会得出相同的结论。最终,他们仍会背弃协议,互相揭发。

由此可见,仅仅签订协约是不够的 - 没有约束力的协议就是一张废纸。要想让协议真正生效,必须对违反协议的行为设置严厉的惩罚。两个小朋友之所以会相互袒护,是因为彼此清楚:如果我这次出卖了你,下次你也会反过来告发我。这种潜在的惩罚迫使他们选择合作。而对于邦妮和克莱德来说,情况却截然不同。他们被捕后很可能再也没有机会“共事”,因此无需担心背叛对方会导致未来的报复。当然,如果他们隶属于某个帮派,那就另当别论了。帮派通常对叛徒实施严厉制裁,例如家族清算,这会极大地遏制叛徒行为,也解释了为何一些帮派成员宁死不屈。

不过,加入帮派毕竟只是特例。在大多数情况下,对于类似的多次博弈,对违约者最有效的惩罚就是对方在下一轮选择同样的违约行为。

假设一个小镇政府计划在一年内分 12 次采购饮料。如果小镇上的两家饮料公司报价一致,政府会将订单平分;但若一家报价低于另一家,政府会将更多订单给报价更低的公司。显而易见,对两家公司来说,达成一致报出较高价格符合各自的利益。然而,在这种多次博弈中,他们真的能长期合作吗?

假设他们最初签订了合约,约定都报出较高的价格。然而,在最后一次博弈时,由于未来已无合作机会,任何一方都可能选择违约,降低报价以获取更多订单。既然最后一次违约是“必然”的,那么倒数第二次博弈时,双方也无需遵守协议,因为他们知道接下来违约无法避免。这种逻辑继续倒推,最终会导致从一开始,双方都不信守合约。结果,两家公司为了争夺市场而恶性竞争,最终双双受损。

只有当博弈的次数是无限的,或双方对博弈的结束时间存有不确定性时,才能形成长久有效的合作。因为在这种情况下,违约者可能面临持续的报复,而合作的收益远超一次性违约的短期利益。在这种情况下,双方才更可能摆脱囚徒困境,实现长期共赢。

让员工们陷入囚徒困境

假如你是某事业部门的经理,手下管理着七八名业务员。有什么方法可以激励他们拼命工作,甚至自愿加班?如果你仔细阅读了前面的内容,或许已经想到了一个高效的策略——将他们置于囚徒困境之中。一旦每名员工都认为,自己拼命工作、无条件加班是最佳选择,老板的工作自然会轻松许多。

实现这一目标的手段多种多样,例如:

  • 威逼:对员工的业绩进行评级排名,并明示最差者将被扣工资;
  • 利诱:承诺业绩最优者将获得丰厚奖金;
  • 煽风点火:对小王说,“小王啊,公司近期正准备提拔一批管理人员,我对你非常看好。不过,老张可是拖家带口,最近常常忙到深夜。他这么努力,你可不能落后呀!这样我才能放心向老板推荐你。”接着又对老张说,“老张,瞧瞧小王,刚毕业就拼劲十足,业绩蒸蒸日上。你作为老员工,要是表现比不上新人,我在老板面前可很难为你说话哦。”

通过这套方法,员工之间的攀比心理会被激发出来,他们或许会竞相加班加点。然而,结果真的如此吗?未必如此简单。

如果你接手的是一个成立已久、员工彼此熟悉且关系融洽的部门,这套手段可能很快失效。原因在于,员工的工资是按月发放的,他们面对的是一次次无法预期结束的多轮博弈。理性的员工会逐渐意识到:听从老板的安排,只会让自己付出更多的劳动,却未必能得到相应的回报。于是,他们之间可能形成一种默契,逐步摆脱囚徒困境:

  • 工作态度恢复“佛系”,能偷懒就偷懒;
  • 奖金采取轮流分配的方式,既安抚了落选者,也维护了内部和谐;
  • 偶尔拿奖金的员工甚至会“出血”请客,以换取团队支持。     当这种默契建立后,你或许会尝试打破局面,比如引入外部变量:招聘一位任劳任怨、不计较个人得失的“蠢驴”型员工,以搅乱员工之间的默契。但这是否有效呢?

答案依然是否定的。其他员工可能会孤立这位“蠢驴”,用排挤行为增加其博弈成本。久而久之,“蠢驴”可能做出以下选择:

  • 投向其他员工的阵营,与他们达成一致;
  • 因孤立而工作困难,最终难以长期获取奖金。

甚至,这位“蠢驴”可能会进化为更加精明的“野牛”或“狐狸”,试图在博弈中谋求新平衡,而囚徒困境依然无法重现。

要让员工陷入囚徒困境,关键是设计出难以达成默契或合约的博弈情境。例如:

  • 小组间竞争:将员工划分为小组,激励小组内部合作,同时制造小组之间的竞争。
  • 跨区域竞争:让自己的部门与异地部门进行竞争。由于不同部门的员工缺乏直接互动,很难形成合谋。

这种策略利用了人与人之间的陌生感与隔阂,延缓甚至彻底打破默契的建立,从而实现短期内的高效激励。     上述讨论基于博弈论的前提:参与者是理性的,即追求自身利益最大化。然而,人类并非总是理性。某些情境中,人们可能因情绪、信仰或其他非理性因素而做出利他或不可预测的行为。例如:

  • 传教:通过思想灌输改变人的行为方式;
  • 树立偶像:引导员工为精神上的成就感而非物质奖励奋斗;
  • 宣扬仇恨:将情感导向竞争对手,从而提升内部凝聚力。

有些管理者可能倾向于鼓励非理性行为,认为这样能降低对员工的控制难度。然而,非理性员工的行为往往难以预测,可能无意间扰乱企业的管理秩序,增加成本。因此,最有效的管理方式仍然是制度化:通过规则和奖惩机制,让员工在理性框架内工作,以实现更可持续的发展。

制定薪水的策略

在企业中,不同部门、不同岗位的薪资往往有较大差异。然而,当面对同一群体的员工(例如一组销售人员)时,如何设计一套合理且激励性强的薪资方案是一门艺术。以下,我们以销售人员为例,探讨制定薪资的策略。

统一薪资显然不可行。这种做法曾在过去的计划经济中普遍存在,但实践证明效果并不理想。经济学的第四基本原则告诉我们:人们会对激励做出反应。没有浮动薪资作为激励手段,大部分员工会失去动力,企业的整体业绩也难以提升。

另一个常见方案是以相对业绩决定薪资,即根据员工之间的排名或表现差距来分配工资。这种做法试图通过内部竞争来激发动力,但前文提到的博弈论揭示了其潜在弊端:

  • 员工可能通过默契合作削弱竞争,以保障彼此的舒适度。
  • 甚至可能引发内部分裂,员工间的敌对情绪反而损害团队凝聚力。

因此,完全依赖相对业绩并不是理想方案。

更直接的方式是将薪资与绝对业绩挂钩,例如按照销售额的一定比例支付提成。理想状态下,员工的收入可以完全取决于其个人表现:

  • 优点:这种方式激励性极强,能最大限度调动员工积极性。
  • 缺点:员工需要承担较大的收入风险,而大多数人倾向于规避风险。

假设两家公司提供以下薪资方案:

  • 公司A:固定月薪1万元;
  • 公司B:完全按业绩提成,可能收入为0,也可能月入10万元。

虽然理论上后者的潜在收益更高,但多数人仍会选择公司 A。这并非因为自身能力不足,而是源于对不确定性的恐惧。正是这一心理,让许多人宁愿看老板脸色,也不愿冒险创业。

综合来看,大多数企业采用的是固定薪资+提成的混合模式:

  • 固定薪资:提供基本的生活保障,降低员工的收入风险;
  • 提成部分:将员工与业绩挂钩,确保激励效应。

这种模式对新员工尤为有效,因为初入职场的他们往往缺乏足够的自信和资源来承受收入波动。然而,对于那些有经验且业绩稳定的老员工,这种模式可能不够激励。对他们而言,完全基于业绩的薪资方案反而更具吸引力。     随着员工在岗位上的经验积累和信心增强,他们逐渐倾向于接受更高比例的风险以换取更高的回报。这一过程与创业类似:初期阶段,员工需要一定的“安全网”;而一旦具备了稳定的能力和市场资源,他们可能更愿意冒险,以实现更大的收入增长。

因此,弹性薪资方案是最佳选择。例如:

  • 对新人:提供较高的固定薪资和较低的提成比例;
  • 对资深员工:允许选择更高提成比例、甚至完全基于业绩的薪资方案,以激发更高的积极性。