相信许多玩家都深有体会:放学或下班后,满怀期待地打开电脑想痛快玩几局游戏,结果每把都会遇上几个让人哭笑不得的“神仙”队友——LOL里猫咪打野、CS里夕阳红大狙、三角洲行动里队友仿佛阿萨拉士兵、PUBG里落地挂机。为了赢,你拉上好友开黑,结果两人连坐越打越沉默,连梦里都在复盘为什么赢一把这么难。
一个人遇到这种情况,或许只能无奈;但当千万玩家都遭遇同样的困境,这就成了一种普遍现象。至于现象背后的原因,很少有人深究,经过口口相传,大家下意识地把一切归咎于三个字——Elo。

你可能并不清楚,吐槽Elo并非近两年才兴起,而是玩家圈中由来已久的“祖传传统”。早在英雄联盟北美公测的第二年(2010年),不堪忍受Elo的外国玩家就创造了一个词——Elo地狱(Elo hell),用来描述长期困在某个段位的无力感,类似于我们常说的青铜天坑。后来随着电竞发展,Elo地狱逐渐破圈,蔓延到几乎所有PVP在线游戏中。
不过,Elo地狱在玩家群体中一直存在争议。有人认为是厂商故意为之,也有人坚持只是自己运气差。双方争论了十几年,原本可能永远没有定论。直到2024年7月,V社在《Dota2》7.33版本的更新说明中,直接将真相公之于众——原文很长,但核心结论是:Elo地狱确实存在。

V社这波“官方背书”,无疑为Elo热度再添一把火,玩家们吐槽得更加猛烈。有Dota玩家排位连败十场,感觉被系统锁死;有LOL手游玩家选人时遇到亚索辅助,自己带惩戒虚弱摆烂,结果反而赢了,以此证明Elo正在发挥作用。

也有玩家不信邪,晒出LOL连胜战绩,坚称Elo根本不存在。结果网友顺藤摸瓜,根据ID查出楼主连败的对局记录,帖子下瞬间充满了快活的空气。

短期内大量案例在网络流传,Elo的名声越来越糟糕。它被描述为厂商操控胜率的邪恶工具,目的就是将玩家胜率锁定在50%,让大家像拉磨的驴一样日复一日地爬分,从而维持日活。为实现这一目标,Elo在匹配时暗中动手脚——你会发现被你碾压的对手正在碾压你的队友,一想到两队中必有一方会赢,就感到浑身不自在。
面对Elo,玩家们各显神通。有人疯狂发帖吐槽,有人搞起玄学:上分前先在匹配模式输几把,或者少充值游戏。还有高手直接利用Elo的bug上分,大张旗鼓制作教程,手把手教大家如何从养号开始躺上高段位。

看了这么多案例,即便你只是旁观者,也会觉得Elo不是什么好东西。但真正让你玩到戴上痛苦面具的,真的是Elo吗?要搞清楚这个问题,你得先弄明白,Elo到底是什么。
Elo的起源:一位物理学家的象棋之瘾
Elo这个名字来源于匈牙利裔美国物理学教授阿尔帕德·埃洛(Arpad Elo),这位1903年出生的“00后”老爷子对国际象棋情有独钟,棋瘾比公园里的大爷还要大。他曾八次夺得威斯康星州冠军,也是第十一位入选世界国际象棋名人堂的成员。

20世纪50年代,国际象棋界开始采用等级分系统,但埃洛认为旧系统存在缺陷,可能导致评估结果与实际水平脱节。1959年,他开始进行研究,最终推出了沿用至今的Elo评级系统。这套系统的唯一目的就是科学地衡量棋手的真实实力。
它有多复杂?看看下面两张图就明白了——公式和符号密密麻麻,想必大家没有兴趣听一堂数学课。


不过,要理解其基本逻辑,掌握两个核心公式即可。
第一个公式:玩家获胜概率的计算

其中Ea代表玩家A对战玩家B的获胜概率,Ra和Rb分别是两人的当前Elo分数。例如,我的Elo分为2000,你的为1500,计算后我的胜率约为0.94——几乎是一场碾压局。
第二个公式:对局后的Elo分更新

Ra'代表更新后的分数,Ra为原分数,S为比赛得分(胜1分、负0分、平局0.5分),K是常数。K值越大,分数变动越快——新玩家K值较大,便于快速定位其水平;老玩家K值较小,以维持稳定性。例如,我(2000分)对战你(1500分),胜率0.94,K=20,获胜后仅增加1.2分,因为系统认为这是实力碾压。

采用Elo系统的比赛通常会为新玩家设定基础分(例如1400分)。有了公式一、公式二以及基础分,评分系统就能正常运转了。恭喜你,到这里你已经掌握了Elo的基本原理。
看到这里,你或许会觉得Elo是一个不错的设计。但正如埃洛发现旧系统存在缺陷一样,Elo后来也暴露了新的问题:它没有考虑到棋手短期内实力飞跃、顶尖棋手为了保住分数而故意和棋等特殊情况。因此,如今的Elo已经过多次迭代,但其核心逻辑并未改变。

游戏圈中的Elo:适用于1v1的标尺,却量出了团队竞技的痛点
电子游戏与国际象棋一样追求博弈。2000年以后,PVP游戏逐渐普及,给玩家评分成为不可或缺的环节。目前常见的评分系统包括Glicko(Elo的改进版,引入了等级分偏差和波动性,用于CS2、Dota2等)、TrueSkill(由微软开发,引入平均值和不确定性,用于光环、彩虹六号等),以及被广泛使用的经典Elo系统。


2009年,拳头游戏的设计副总裁在论坛明确表示,LOL采用了改良版的Elo系统,并会计算团队Elo值。细心的玩家可能已经察觉到问题:原本为1v1定制的Elo,在与团队竞技结合后,匹配过程会产生巨大的不确定性。

早期LOL的匹配机制大致分为三步:组队时匹配更强的对手;安排分数相近的玩家;排队时间越长,匹配范围越广;最终分成两队,尽量使双方胜率接近50%。许多游戏采用的都是类似思路。

基于这套逻辑,当某位玩家连续获胜后,系统判定其水平已超出当前段位,Elo分会迅速上升。然而对局仍需匹配当前段位的玩家。为了保证两队胜率均为50%、团队总分相近,系统便会给你分配几个水平较低的队友来平衡分数。于是你明显感到队友实力弱于当前段位,体验极差——这正是所谓的“Elo”典型感受。
但玩家们疯狂吐槽的“Elo”是否真实存在,其实仍是一个未知数。例如年初在韩服疯狂上分、胜率高达92%的AI玩家,后来被证实是职业选手在操作。2024年,一位钻石大师水平的玩家借用了朋友十年未动的黑铁号,打了100场比赛,取得72胜28负的成绩,一路冲上黄金一,期间经常排到白金翡翠段位的玩家。他非常明确地得出结论:游戏并没有所谓的Elo。

说实话,一款游戏是否采用Elo系统,对大多数玩家而言并不重要。2024年有报道称拳头将Elo改为TrueSkill2,Dota2则将Elo换成Glicko,但根本没人在意。玩家们只是因为感到不爽,就发帖开喷。在在线游戏中,匹配到的其他玩家往往成为情绪的宣泄对象——顺风时聊家常,逆风时聊家长里短。那些不可预知的逆天队友,更是放大了愤怒情绪。如果说单机游戏体验差带来的愤怒值是1,那么竞技游戏体验差可能直接飙升到10。猫咪打野、夕阳红大狙,他们成了显眼的靶子,恰好承接了你的怒火。

“Elo”问题能解决吗?
至少目前,还没有任何游戏公司能够彻底解决这一问题。从设计角度来看,评分和匹配机制已经尽量做到公平——只是它过于理性:系统判定你某段时间表现强势,就会塞几个水平较弱的队友来拉低团队分数。但玩家玩游戏时最不需要理性,大家渴望的是体感上的公平:高手与高手对决,菜鸟与菜鸟互啄。
这样做也有问题:你愿意为了匹配到实力完全相同的九位玩家,而等待15分钟吗?很多玩家匹配超过30秒就开始怀疑游戏服务器出了问题。更何况,双方实力过于接近会使每一局游戏体验雷同,非常无聊。一款游戏一旦被贴上“无趣”的标签,基本就宣告失败了。

说白了,玩家们所讨厌的Elo,在厂商眼中并非十恶不赦——它能最大程度调动玩家情绪、吸引高频参与、并尽力维持胜率。换一个更简单的说法:那些没有被玩家说使用Elo的游戏,有几个能比被狂喷Elo的“垃圾游戏”更火?至于你是否认同厂商的观点,那又是另一回事了。
可以确定的是,在相当长一段时间内,“Elo”并不会消失。但对于厌恶它的玩家,有一个绝妙的解法:暂时放下鼠标,移开键盘,站起身来,抬头看看远处的雪山吧。
