icon_install_ios_web icon_install_ios_web icon_install_android_web

基於平均場博弈論的盃賽系統CP505協議博弈機制創新

分析6 年前發佈 6086比...
95 0

一、簡介

在國際開放的大型盃賽體系中,國際合法博彩集團在比賽規則的製定中發揮重要作用,對整個體育產業資本產生重大影響。每屆世界重大賽事,例如世界杯,博彩公司都會為所有參賽球隊給出賠率,世界各地的球迷會根據自己的喜好選擇自己的球隊進行投注。 [1]

賠率設定涉及非常複雜的數學分析,是整個競技遊戲的核心。賠率是根據參賽球隊實力、球員目前狀態、球隊歷史表現等一系列指標進行加權計算,由博彩公司主觀給出。對於博彩公司來說,理想的情況是任何比賽的結果都可以相互抵消,並且博彩公司賺取無風險的佣金。這是一個非常理想、完全正常的商業模式。

然而,由於競技運動的突發事件較多,球迷也有自然傾向,在某些時候,當涉及到全球關注的重要比賽以及全球巨額投注時,大量的投注就會集中在一個方向上。如此一來,如果比賽結果爆冷,大部分玩家猜錯了,那麼投注團就會有超額利潤,少數猜對的玩家也會獲得巨額利潤,但如果大部分玩家猜對了,那麼投注團就將獲得超額利潤。

雖然如今的賠率系統已經發展成為非常複雜的數學模型和透過網路即時調整賠率的動態機制,但有時球迷對某些球隊的喜愛程度會嚴重影響球隊的實際實力。許多極端情況都會導致賭博團體面臨風險。例如2014年世界盃半決賽德國與巴西,兩隊排名、水準接近,理論上賠率應該相差不大,但巴西隊有主場優勢,2014年的巴西隊光芒四射。由於全球互聯網的快速發展,巴西隊擁有大量球迷,這導致了當時罕見的一邊倒的情況。大部分籌碼都押在了巴西隊最終的勝利和晉級決賽上。博彩公司面臨著大賺還是大虧的困境,被迫成為大多數資金的對手,這對任何博彩集團來說都是無法接受的。儘管沒有證據表明比賽被操縱,但在這場歷史性的比賽中,德國隊在巴西主場以7:1的比分以主場優勢擊敗了最受歡迎的巴西隊,取得勝利並晉級。這個賽前難以想像的比數幾乎沒有被球員猜到。從結果來看,博彩公司是最大的受益者。在所有的國際比賽中,球迷們都總結出一條沒有科學根據的規則:奪冠熱門必須死。但事實上,這是由於零和博弈帶來的巨大風險。讓心儀的團隊消亡,是降低經營風險最無奈的辦法。這個與機率論如此不相符的簡單規則,間接證明了存在幹擾賽局結果的資訊不對稱。

雖然傳統賭博集團在商業模式上並不以參與賭博為目標,但簡單的賠率投注方式肯定會要求賭博集團支付更多的賭注。如果想從源頭遏制人為幹預遊戲,絕對不是製定法律法規並嚴格執行來杜絕人為幹預,而是要改變莊家主動給賠率的傳統遊戲方式。隨著區塊鏈技術的日益成熟,區塊鏈技術的透明性、去中心化和可編程性可以讓遊戲規則無法被任何人篡改。透過多種標準協議的結合,本文提出了一個基於平均場博弈論的新博弈合約CP 505協議。

二.相關工作

2.1 平均場遊戲(MFG)

平均場博弈論[2]由Pierre-Louis Lions等人提出。 2006-2007 年為涉及大量同質智能代理的博弈提供了均衡解。該理論從數學角度描述了擁有大量參與者的系統中的個體如何根據其他參與者的統計行為做出最佳決策。

2.2 博弈論

博弈論[3]是研究具有衝突與合作特徵的決策者之間相互作用的數學理論。它提供了一個用於理解和預測基於錦標賽的賭博遊戲中的策略行為的框架。

2.3 市場機制設計[4]

市場機制設計重點在於如何設計市場規則以實現特定的經濟目標,如效率、公平、透明等。

2.4 加密貨幣與區塊鏈技術

加密貨幣和區塊鏈技術提供了去中心化的價值轉移機制,為創建透明且不可變的遊戲平台提供了技術基礎。 [5]

2.5 行為經濟學

行為經濟學將心理學和經濟學結合起來,研究人們在經濟決策中的非理性行為,這對於理解和設計賭博遊戲中的使用者互動具有重要意義。 [6]

2.6 錦標賽博彩市場分析

錦標賽博彩市場的分析,包括賠率設定、市場流動性和資訊效率,為設計博彩遊戲提供實證研究基礎。 [7]

2.7 囚徒困境

經典的兩人非合作博弈模型,其中每個玩家根據其個人最佳選擇做出的決定會導致所有玩家的結果不佳。此概念由Albert W. Tucker於1950年首次提出。

2.8 多人遊戲的計算難度

隨著博弈人數的增加,尋找均衡解的難度顯著增加。這是因為遊戲的策略空間隨著玩家數量呈指數級增長,使得計算均衡變得更加複雜。 [9]

2.9 多人博弈的均衡

在多人遊戲中,納許均衡可能不存在或難以找到,因為每個玩家的最佳反應策略取決於所有其他玩家的策略,而每個玩家的策略選擇空間非常大。 [10]

3 理論基礎與模型構建

3.1 平均場博弈論在假設上的應用

如果用戶的每一次投注都可以變成無數的碎片進行交易,並且市場可以自由地對碎片進行定價,並且這些碎片可以自由地實現新的投注,這將把傳統的賠率方法轉變為金融方法。問題將從分析和研究使用者的投注問題轉化為分析使用者的金融行為,進而轉化為具有近無限個同質對手的博弈策略問題。

在經典博弈論中,博弈發生在對手之間的場景中,通常只涉及兩個人,例如著名的囚徒困境。三個對手的博弈在計算上非常困難,很難達到平衡,這就是為什麼西方《金色三鏢客》如此經典的原因。如果遊戲的參與者數量達到四、五甚至更多,那麼從數學上來說就是無解的。這裡的不可解是指不存在所謂的最優策略,因此博弈參與者無法採取收斂策略。

然而,如果遊戲中對手的數量可以被認為是無限的,那麼就有一個數學解決方案。法國數博弈參與者在均衡點的策略。

當平均場博弈論首次提出時,人們並不認為該理論在金融領域有任何應用。建立平均場博弈論的前提是博弈的對手是同質的。在傳統金融市場中,對手的能力和類型完全不同。其中有具有內部知識和實際執行力的公司管理階層,有機構和大帳戶,也有不少個人投資者。因為遊戲的對手不同,所以總是存在操縱的情況。例如,股價並不是公平博弈的結果。掌握內線消息的大股東或管理階層,或是看到籌碼分佈的大基金,通常都是股價的操縱者。

3.2 平均場博弈論

平均場博弈(MFG)理論專門探討了在競爭環境中大量智能體所使用的策略。每個智能體都會對其周圍其他智能體採取的行動做出反應,以最大化自己的利益。

代理人的假設通常包括以下:

  • 1.同質性:所有智能體都是同質的,即他們具有相同的偏好和決策能力。

  • 2.大量的代理:系統中代理的數量非常多,單一代理的行為對整個系統的影響可以忽略不計。

  • 3.交互作用的簡化:智能體之間的交互作用是透過智能體行為的平均效應(即平均場)來簡化的,而不是透過個體之間的直接交互作用來簡化。

  • 4.連續時間:智能體的行為和決策過程通常在連續時間框架中建模。

  • 5.理性:假設智能體是理性的,即他們會根據自身利益最大化的目標選擇最優策略。

  • 6.資訊結構:在某些模型中,代理人可能具有不同的資訊結構,例如完整資訊或不完整資訊。

  • 7. 策略選擇:智能體將根據其他智能體的平均行為調整其策略,以最大化個體效用。

  • 8.穩定性與均衡:智能體的行為會趨向某種均衡狀態,如納許均衡,這是MFG理論分析的焦點之一。

  • 9.分散式決策:Agent的決策過程是分散式的,沒有中央協調機構。

3.3 建構相似的代理假設

在傳統的賠率體系中,由於賠率是由博彩公司設定的,所有球迷只是根據自己對球隊的偏好或者客觀的估計,以及博彩公司設定的賠率是否有套利空間來投注。大多數使用者的個人行為不能影響他人的行為,他人的投注行為也不會影響我的投注行為。當賠率因大量用戶的行為而改變時,投注用戶無法撤回投注或改變策略。一旦他們做出決定,就沒有機會後悔。這不符合平均場博弈的假設。

然而,當區塊鏈技術和智慧合約技術應用後,每個用戶都可以將自己的賭注進行碎片化,形成高流動性的交易產品。碎片價格由市場用戶二次決定,間接使得用戶能夠改變自己的策略,進而影響其他人的策略。這些使用者的行為非常接近平均場博弈論中智慧代理的行為。

一旦我們的模型有機會讓大量的參與用戶成為近似的智能體,那麼根據平均場博弈論,就有可能會出現一個最優解,而這個最優解往往是一組複雜的納許平衡。

3.4 納許均衡特徵概述

  • 1.非合作:在非合作賽局中,每個智能體獨立選擇自己的最優策略,而不考慮其他智能體的利益。

  • 2.策略組合:納許均衡是所有代理策略的特定組合。在均衡狀態下,每個智能體的策略是對其他智能體策略的最佳反應。

  • 3.穩定性:納許均衡是一種穩定狀態,即在沒有外部幹預的情況下,任何主體都不會因改變其策略而受益。

  • 4.可預測性:在賽局理論中,納許均衡提供了一種預測賽局結果的方法,因為它代表了一種自我增強的策略狀態。

  • 5.可能的多重均衡:在某些賽局中,可能存在多個納許均衡,每個納許均衡代表一個可能的賽局結果。

  • 6.理性假設:納許均衡的建立是基於智慧主體是理性的事實,即他們會根據自身利益最大化的目標來選擇策略。

  • 7.效用最大化:在均衡狀態下,每個智能體根據其他智能體的策略選擇一個最大化自己效用的策略。

3.5 假設模型的理論架構

在有大量玩家的賭博遊戲中,在沒有莊家的情況下,這些大量玩家是同質代理人,這滿足平均場博弈的成立條件。同時,這些玩家無法與大量其他玩家達成合作博弈,因此平均場博弈也是非合作博弈。

納許均衡為我們帶來了一個重要的價值,就是這個模型中的所有用戶都不再賭博了,因為在非合作條件下,如果用戶是理性的,他只能採取某種策略,或者說佔優策略,這就是對他最有利。納許均衡通常對少數玩家有效。理性參與者都採取優勢策略並達到一定的均衡。平均場博弈和納許均衡的前提是非合作博弈。平均場博弈達到的均衡可以理解為無數納許均衡的組合結果。

傳統賠率賭博在給定賠率下只能是零和遊戲。一旦最大的參與者(賭博集團)發現存在巨大的賠付風險,就極有可能以各種方式乾預遊戲結果,造成極大的不公平。 CP 505協議下的新遊戲模型有機會讓用戶選擇自己的策略並實施多種策略。每個決定都會影響其他人,無數智能體最終都有機會達到納許均衡,獲得最適解。這個最優方案並不是讓所有使用者都獲利,而是在公平透明的前提下,所有使用者都根據自己的理性決策充分自主地實施自己的策略。這是一種新的遊戲設計,而不是傳統的賭博。

在盃賽制中,每輪比賽的結果公佈後,所有球員都會收到相同的情況變化訊息。玩家根據條件的變化和其他玩家的行為重新定義他們的策略並執行它們。每輪比賽結果確定後,根據各隊繼續生存的機率以及玩家自由交易產生的各隊成為最終獲勝者的幾率,利用平均值的理論數學公式計算出理論均衡值場比賽。這個均衡值就是一系列隊伍和籌碼的定價。玩家的情緒可能會導致實際定價與理論定價出現偏差,而理性交易者(套利者)會根據這種偏差進行交易,使得實際定價趨向於理論定價。市場中套利者和具有情感偏好的交易者的存在將使市場產生足夠的交易,這有利於市場活動。

3.6 基於CP 505協定的賽局模型假設

基於上述分析,CP 505協議博弈模型的設計應充分考慮以下假設:

  • 1.所有比賽資訊公開透明

  • 2.所有遊戲規則均不可被任何人竄改

  • 3.即使比賽結果不同,也不會影響比賽策略

  • 4. 任何中心化組織都沒有能力介入任何規則的製定。即使乾擾了比賽,也不會對集體策略產生影響。

  • 5. 每個參與者都是同質的。他們都追求最高的回報率而不是賠率。他們可以根據其他參與者的策略反覆調整自己的行為。

  • 6.單一代理人的行為對整個系統的影響可以忽略。

  • 7.市場價格由充分的市場競爭及流動性決定。市場價格是由所有參與者透過重複博弈動態改變的。它的變化反映了市場上所有智慧實體策略的狀態和機率分佈。市場定價被視為平均場博弈產生的均衡結果。

3.7 區塊鏈技術與智慧合約為模型提供技術支撐

區塊鏈技術和基於以太坊的智慧合約技術可以使所有數據公開可搜尋、可追溯。利用去中心化的分散式記帳網絡,程式可以記錄在所有網路節點上,任何人都無法竄改既定的規則。

3.8 建構模型

  • 1.將參賽隊伍的所有投注轉換為基於ERC 721協議的NFT資產。該資產也可以以去中心化的方式進行交易。

  • 2.當使用者購買任意球隊的NFT時,就代表了一種特殊類型的投注。

  • 3.所有投注不由任何中心化團體控制,而是由智能合約保管,並透過智能合約分配給最終的獲勝者。

  • 4.基於CP 505協議的設置,所有NFT都可以被銷毀並轉換為ERC 20通用代幣。但是,每次銷毀 NFT 所獲得的 ERC 20 代幣的一部分將在黑洞地址中永久銷毀。

  • 5. 代幣在基於自動做市商(AMM)模型的去中心化交易所進行交易,避免任何人為幹預。

  • 6.一定數量的ERC 20代幣可以用來重新合成一支球隊的NFT卡,也就是重新投注。一般可以隨機產生。如果用戶對隨機產生的隊伍不滿意,可以再次銷毀NFT,獲得代幣,然後重新產生。

  • 7. 每個用戶根據自己的決定進行銷毀和合成,將導致代幣不斷銷毀,進而影響代幣在二級市場的價格。這個市場的買家需要購買代幣來合成新的隊伍卡牌,而代幣的賣家則需要透過出售代幣來減少損失,甚至透過低買高賣來降低自身風險。市場價格將是透過連續平均場博弈形成的價格。使用者重複、自由、理性地銷毀和產生NFT,是個體自由選擇策略的充分體現。

  • 8.決賽結束後,所有持有冠軍隊伍NFT卡的用戶將分享合約中的所有賭注。理論上,決賽結束後,每位使用者都有足夠的時間合成冠軍卡牌。

  • 9. 此模型的最終結果在數學上表示為一系列平均場博弈產生的均衡價格。

4. CP 505 商業設計課程

假設:市場上有一場大規模的競爭,有36支球隊爭奪冠軍。比賽為期1個月。到底是哪36隊已經是眾所皆知,比賽結果更是物理世界的公開事件,具有獨一無二的確定性。理論上,任何競技遊戲都可以實現這個假設。

第一個NFT盲盒。每個盲盒隨機產生五支球隊的投注。每個賭注都完全相同。例如,如果一個盲盒價值$100,那麼將隨機開啟5個團隊NFT,每個NFT價值$20。這個$20可以考慮作為一個賭注。

在NFT交易市場中,熱門團隊的交易價格會上漲,直到形成均衡價格。由於冷門球隊沒有需求,理論上價格會下降很多。這就是第一個市場博弈均衡。

根據CP 505協議的機制,可以銷毀NFT並產生固定的ERC 20代幣V-Token,然後用V-Token重新合成盲盒。這樣做的好處是,用戶有機會獲得自己比較滿意的團隊的 NFT 晶片。

銷毀NFT產生的V-Token由智能合約控制,其中10%在去中心化交易所出售並添加到總獎金池中。這增加了用戶獎金總額。另外10% V-Tokens被送到黑洞位址進行銷毀。

最後冠軍隊伍NFT的持有者分享獎金池。

玩家策略思考

對於參與者來說,他們可以採取的行動包括但不限於以下策略:

  • 購買大量盲盒即可獲得熱門球隊卡牌,淘汰無價值的球隊卡牌,合成新的盲盒,逐步將手中的球隊卡牌變成冠軍卡牌以獲得獎金

  • 賣出價格已經被誇大的熱門球隊的NFT,買入自己看好的球隊的NFT,獲得NFT投資回報。

  • 透過拆散自己不看好的團隊的NFT,生成V-Token,他可以選擇出售來收回部分成本,或者用V-Token重新合成盲盒,繼續追尋盲盒的應急性。

  • 隨著小組賽或淘汰賽的進行,各隊NFT的價值會發生變化,而這種價值變化的驅動因素來自於比賽結果的隨機性。隨著團隊 NFT 的價值變化,會驅使參與者採取他們認為合適的行動,例如購買/出售團隊 NFT,或碎片化 NFT/合成盲盒。

  • 玩家還可以觀察V-Token的價格。隨著被淘汰隊伍數量的增加,碎片化程度也隨之增加。由於購買量不足,V-Token的價格可能會低於理論價格。購買V-Token來合成新的NFT的玩家將獲得額外的好處。同樣,如果總獎金池價值的增加導致V-Token的投機需求增加,V-Token的價格將超過理論值。這個時候,出售尚未被淘汰但奪冠希望渺茫的球隊的 NFT 碎片化產生的 V-Token 可能會有利可圖。

5. 開源智能合約程式碼

https://github.com/ai77simon/cp505/

這段程式碼的編寫得到了位於新加坡的獨立業務團隊 Euro 505 集團的部分支援。他們根據這篇論文進行了一個以歐洲盃為背景的社會實驗,我們將在下一篇論文中進一步向讀者展示實驗數據。

六.結論

基於區塊鏈技術構建的 CP 505 協議為所有盃賽賽事創建了新的博弈論。其理論基礎來自平均場博弈、納許均衡、行為經濟學等理論。從技術上來說,一定是完全去中心化、公開透明、不可竄改的區塊鏈技術,以及許多去中心化NFT交易市場和去中心化代幣交易市場的產業合作。在這個博弈中,相當於無限多個同質個體的參與,所有資訊都公開透明,使用者可以反覆修改策略,從而影響他人的策略,最終達到任意短期均衡狀態(下一輪比賽結果的隨機性尚未產生)。理論上,所有使用者共同決定最優策略,而這個最優策略的直接體現就是價格(包括團隊NFT價格和V-Token價格)。

由於玩家總是有各種偏好和情緒,交易產生的價格可能會偏離理論均衡價格。這時就會有理性的套利者利用這個價格偏差進行交易,高拋低吸,使交易價格最終趨於理論價格。所有的價格都是由市場上的情感偏好參與者和理性套利者透過交易產生的,而不是透過操縱或不正當交易產生的。套利者和追求個人喜好的參賽隊伍的玩家不同的目的和策略,會增加市場的活躍度,讓市場更健康。

從另一個意義上來說,這個規則的設計是人類在技術創新下的一次嘗試,利用數學博弈論來打破傳統的以賠率為基礎的賭博機制,實現一種不以賭博為目的而是以投資為目的的新遊戲體驗。

由於作者能力有限,所有的設計思維和開發工作都存在不足之處。希望這項研究能為更多的學者帶來啟發,也願意接受任何學者的批評和指正。

參考

[1]阿希,P.(2017)。數學:賭徒、經理和體育愛好者如何使用

二十一世紀棒球中的數學。普林斯頓大學出版社。

[2] 獅子,P.-L。 (2007)。平均場比賽。參見:J. Math。科學,卷。 177,第 3 期,第 415-430 頁。

[3] 納什,JF (1950)。 n人博弈中的平衡點。在:過程。納特。阿卡德。科學。

美國,卷。 36,第 1 期,第 48-49 頁。

[4] RB 邁爾森(1981)。最佳拍賣設計。在: 運籌學

研究,卷。 6,第 1 期,第 58-73 頁。

[5] 中本聰 (2008)。比特幣:點對點電子現金系統。

請參閱:Bitcoin.org。

[6] 卡尼曼,D.,特沃斯基,A. (1979)。前景理論:決策的分析

風險。在:計量經濟學,卷。 47,第 2 期,第 263-291 頁。

[7] 福雷斯特,D.,西蒙斯,R.(2006)。博彩市場:一項調查。在:雜誌

預測市場,卷。 1,第 1 期,第 2-31 頁。

[8] 塔克,AW (1950)。兩個人的困境。在:心理測量,卷。 17號,2號,

第 186-202 頁。

[9] Leyton-Brown, K.,Shoham, Y. (2008)。多人遊戲。在:遊戲要點

理論:簡明的多元學科介紹,第 97-120 頁。摩根和克萊普爾。

[10] 納什,JF (1951)。非合作博弈。在:數學年鑑,卷。 54、

第 2 期,第 286-295 頁。

本文源自網路:基於平均場博弈論的盃賽系統CP505協定賽局機制創新

相關:Ripple 的 XRP 面臨價格大幅調整的風險

簡而言之,XRP 價格正在嘗試突破對稱三角形模式,這表明可能會上漲 27%。 Ripple 交易者似乎對 XRP 的上漲持懷疑態度,這在他們的看跌押注中顯而易見,他們傾向於價格下跌。如果相對強弱指數(RSI)突破中性線,則可以確認看跌無效。瑞波幣(XRP)價格反彈很大程度上取決於更廣泛的加密貨幣市場和投資者的行為。然而,雙方都不贊成價格上漲,這可能會對 XRP 持有者造成相當大的損害。 Ripple 投資者後退一步 XRP 價格試圖上漲,但從表面上看,這項努力將受挫。這是因為 Ripple 注意到投資者,尤其是交易員的看跌情緒。期貨中對 XRP 的看跌押注有所增加…

© 版權聲明

相關文章