![]() 《酒館戰棋》的等級分系統 | |
基本資料 | |
用語名稱 | ELO算法 |
---|---|
其他表述 | 埃洛等級分、隱藏分、表現分 |
用語出處 | 西洋棋 |
相關條目 | 排位分段、數學 |
ELO算法(ELO Rating Algorithm)是一種廣泛用於各種競技類遊戲(包括電子遊戲)領域的,用於量化選手水平的經典算法。
ELO 算法由匈牙利裔美國物理學家和西洋棋大師阿帕德·埃洛(Arpad Elo) 在20世紀50年代提出,目的是為西洋棋比賽提供一種將選手實力數值化的方法(此前棋手的等級分系統難以準確反映棋手的真實水平)。Elo基於統計學原理,提出了一種動態、可計算的評分系統,能夠根據比賽結果自動調整選手的等級分,使評分更公平、合理。
ELO系統的核心思想是每位選手有一個「等級分」(Rating),代表其當前技能水平;而比賽結果與預期結果的差異則會決定等級分的調整。每場比賽後,勝敗雙方的等級分會依據二者的實力情況發生一定程度的增減。同時,當玩家在匹配池中執行匹配時,系統會儘可能尋找等級分與玩家本人接近的玩家作為對手。如果匹配的等待時間較長,則會視情況上浮等級分差值的容忍範圍。
若有兩名玩家 A 和 B,A 的 Rating 是 $R_A$,B 的 Rating 是 $R_B$ (玩家的 Rating 範圍一般是 0~3000 分,帶小數),則 A 和 B 的預期勝率 $E_A,E_B$ 會按照下述公式計算:
因此在匹配雙方等級分儘可能接近的匹配機制下,雙方的預期勝率會各自接近 50%,而這也是絕大多數採用該機制的遊戲的運營方希望看到的。在比賽結束後,雙方的等級分會按照下述公式更新:
其中 $ R_A' $ 是更新後的等級分, $K$ 會在全局範圍內控制每場對局隱藏分的增減幅度,稱為學習率(一般常見為 10、20、32 等);$ S_A $ 是最終的實際得分(勝=1,平=0.5,負=0)
基礎版的公式中,所有的超參數全部都是定死的。而在真實的電子遊戲中,學習率以及指數裡的 400 等往往會根據社區情況以及玩家的個體情況進行調整。
例如《爐石傳說》就採用了可變學習率的機制。不論是連勝還是連敗的累計,學習率都會越來越大。這一機制會在玩家連勝時,讓玩家能夠快速遇到更強大的對手,維持遊戲的挑戰性,也可以在玩家遭遇連敗時,分數急劇下降,從而匹配到較弱的對手終結連敗,減少挫敗感。
典型的算法變體包括 TrueSkill 算法等。
由於整個玩家社區中所有的玩家都有一個隱藏分,因此在這一算法的加持下,玩家社區就會構成了一種獨特的動態系統,自然也會在宏觀上形成各種數學性質。
(待補充)
(待補充)