雷火·竞技电竞网站,乐盈,雷火电竞官网

來源：互聯網

博弈論（Game theory）又叫決策論或者對策論，是研究決策者在競爭情況下進行策略選擇的數學理論，起源于對賭博、棋和撲克等一類游戲的數學研究。

1928年，馮·諾依曼證明了博弈論的基本原理，從而宣告了博弈論的正式誕生。1944年，馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統地應用于經濟領域，從而奠定了這一學科的基礎和理論體系。

在博弈論中，每個決策者都被稱為“玩家”，他們根據一定的規則來進行競爭。博弈論的研究對象可以是不同的博弈模型，例如零和博弈、非零和博弈、合作博弈和競爭博弈。

博弈論本身涉及到概率論、數理統計學、拓撲學、泛函分析和抽象代數等高深的現代數學知識。作為現代數學的新分支和運籌學的重要學科，博弈論還被廣泛應用于金融學、證券學、生物學、國際關系、計算機科學、政治學、軍事戰略等領域。主要應用在經濟學領域，在現實生活中，博弈論可以用來分析競爭市場中企業之間的策略選擇、國際貿易的談判策略、政治博弈中的決策制定等問題。

發展歷史

早在2000多年前中國春秋時期的齊王與田忌賽馬，以及《孫子兵法》中的軍事策略等已用到了博弈思想。

1838年，數學家奧古斯丹·古諾（A．Cournot）在其《財富理論的數學原理研究》中利用數學模型，對兩寡頭壟斷市場作了具體分析，半個世紀后通過伯特蘭·阿瑟·威廉·羅素（Bertrand Arthur William Russell）重新論證后，人們才開始認識到古諾模型與其思想方法的重要價值。這也是現代博弈論的萌芽時期，其進一步的發展提供了思想雛形。

20世紀三十年代前后是博弈論學科的建立時期。博弈論領域第一本重要著作是馮．諾伊曼與奧斯卡·摩根斯坦出版的《博弈論與經濟行為》(1944)。該書匯集了博弈論的研究成果，將其框架首次完整而清晰地表達出來，使之成為一門科學。

20世紀四、五十年代是博弈論的快速成長期。1950年～1951年，約翰·福布斯·納什（John Forbes Nash Jr）利用不動點定理證明了均衡點的存在，為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》（1950），《非合作博弈》（1951）等等，給出了納什均衡的概念和均衡存在定理。此外，萊因哈德·澤爾騰、約翰·海薩尼的研究也對博弈論發展起到推動作用。博弈論已發展成一門較完善的學科。

1950年蘭德公司提出的囚徒困境的博弈論模型，兩個共謀犯罪的人被關入監獄，不能互相溝通情況，雙方利用合作博弈，取得最優的囚徒困境結果，通過該模型，很好地解釋了在集體環境中，個體理性與集體理性經常會發生沖突時的博弈情況。

2002年，北京國際數學家大會上舉行的“對策論及其應用”，會議向世界展示了博弈論以及其應用在20世紀所取得的例如：納什均衡理論、市場競爭、合作關系、拍賣等經濟現象上的成就，并討論了新世紀中所面臨的主要問題例如：非對稱信息下的道德風險、激勵機制等，為如何在矛盾和沖突中成功地選擇和運用策略提供了幫助。

博弈論獲得的獎項

1994年獲得諾貝爾獎的約翰·海薩尼（John C.Harsanyi）和約翰·納什以及萊因哈德·澤爾騰(Reinhard Selten）三人對博弈論的創造性貢獻分別是在非合作博弈論中引入納什均衡；澤爾騰將納什均衡推廣到動態博弈，提出了精練納什均衡；海薩尼將不完全信息引入博弈論，他們在非合作博弈的均衡分析理論方面做出了貢獻，對博弈論和經濟學產生了影響。

1996年，英國劍橋大學的詹姆斯·莫里斯(James A．Mirrlees) 和美國哥倫比亞大學的威廉·維克瑞(William Vickrey)獲得了諾貝爾獎，前者在信息經濟學理論領域做出了重大貢獻，尤其是不對稱信息條件下的經濟激勵理論的論述，后者在信息經濟學、激勵理論，博弈論等方面都作出了貢獻。

2001年，美國學者喬治·阿克爾洛夫(George A．Akerlof)邁克爾·斯彭斯(A．Michael Spence)和約夫·斯蒂格利茨(Joseph E.Stiglitz)在不對稱信息條件下的市場運行機制方面形成了現代微觀信息經濟學理論（博弈論的一個分支）的核心，其實際應用非常廣泛，不僅包括傳統的農業市場，而且包括現代的金融市場，因此三人獲得了諾貝爾經濟學獎。

2005年諾貝爾經濟學獎授予了有以色列和美國雙重國籍的羅伯特·奧曼(Robert J·Aumann)和美國人托馬斯·謝林(Thomas C·Schelling)，他們的貢獻是在經濟學與社會科學之間架起了橋梁，兩位諾貝爾獎得主將已經發展成熟的非合作博弈方法從經濟學領域向社會科學的諸多領域滲透，進一步拓展到解釋人類的合作和沖突行為。

定義

基本概念

博弈論是研究決策主體的行為發生直接相互作用時如何決策以及這種決策的均衡問題的學科。它與很多利用數學工具研究社會經濟現象的學科一樣，從復雜現象中抽象出基本元素，并對這些元素構成的數學模型進行詳盡分析，然后逐步引入對其形勢產生影響的其他因素，從而分析其結果。為建立沖突對抗條件下決策的數學模型，必須數學化地描述沖突的主體所有可能的行為方式及其行為結果。由于對數學的要求高，博弈論也被視為數學的一個重要分支。

基本構成要素

博弈論基本構成要素由以下五類組成

4.博弈形式（game form）：博弈形式是描述博弈問題的數學模型，包括玩家數目、策略集合和收益函數。

5.納什均衡（Nash equilibrium）：納什均衡是一個博弈中所有玩家實現收益最大化的狀態，即達到一個穩定的最優解。納什均衡，即非合作博弈。在納什均衡的策略下，每個參與者都達到了最優結果，以致于都不會主動改變自己的策略。它是由諾貝爾獎獲得者約翰·納什提出，并成為博弈論的兩大基礎理論之一。納什均衡拓展了博弈論，使其從理論走向現實，奠定了現代主流博弈理論和經濟理論的根本基礎，并廣泛應用到經濟學、社會學、國際貿易、外交博弈和哲學理論的研究等諸多領域。

基本假定

博弈論的分析基于一些基本假定，這些假定是指在博弈過程中，參與者的行動以及相關的因素，這些假定被博弈論家視為足夠精確來描述參與者的行為和結果。

經典策略

囚徒困境

“囚徒困境”是1950年蘭德公司梅里爾·弗勒德（MerrillFlood）和梅爾文·德雷希爾（MelvinDresher）擬定出相關困境的理論。后來由顧問艾伯特·塔克（AlbertTucker）以囚徒方式闡述，并命名為“囚徒困境”：兩個共謀犯罪的人被關入監獄，不能互相溝通的情況下。如果兩個人都不揭發對方，則由于證據不確定，每個人都坐牢一年；若一人揭發，而另一人沉默，則揭發者因為立功而立即獲釋，沉默者因不合作而入獄十年；若互相揭發，則因證據確實，二者都判刑八年。由于囚徒無法信任對方，因此傾向于互相揭發，而不是同守沉默。最終導致納什均衡僅落在非合作點上。“囚徒困境”是博弈論的非零和博弈中頗具代表性的例子，反映出個人最佳選擇并非團體最佳選擇。

運用博弈論分析，參與者為嫌疑犯甲和嫌疑犯乙；行動集分別為嫌疑犯坦白或者抵賴。若兩名嫌疑犯均選擇坦白，其支付結果為（-8,-8）；若嫌疑犯甲坦白而乙抵賴，其支付結果為（0,-10）；若嫌疑犯甲抵賴，乙坦白，支付結果為（-10,0）；若嫌疑犯甲、乙均選擇抵賴，其支付結果為（-1,-1）。支付矩陣見下表。

智豬博弈

假設豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽，另一頭安裝著控制豬食供應的按鈕，按一下按鈕會有10個單位的豬食進槽，但是誰按按鈕就會首先付出2個單位的成本，若大豬先到槽邊，大小豬吃到食物的收益比是9∶1；同時到槽邊，收益比是7∶3；小豬先到槽邊，收益比是6∶4。那么，在兩頭豬都有智慧的前提下，最終結果是小豬選擇等待。

可以發現，“智豬博弈”的均衡就是大豬按，小豬等待，違背了多勞多得的原則。具體來看：在大豬選擇行動的前提下，小豬選擇等待可得到4個單位的純收益，而小豬行動則僅能獲得大豬吃剩的1個單位的純收益；在大豬選擇等待的前提下，小豬行動的純收益為-1單位（收入不抵成本），小豬等待則收益為零（成本也為零）。因此小豬未能參與競爭創造價值，也能獲得一定收益，反映了社會資源配置無效率和不公平。由“智豬博弈”得出的結論有三點：1、沒有占優戰略均衡；2、均衡是大豬按小豬等待；3、多勞不多得，少勞不少得。“智豬博弈”模型也從側面體現了一種吃“大鍋飯”的思想，因為自己的努力所得自己不能完全享受，所以人會產生一種惰性思想。

槍手博弈

槍手博弈是一個經典的博弈模型。三人對槍自決，甲乙丙槍法依次為好，中，差。兩種前提：同時開槍或是先后開槍，最后的結局卻是無奈而神奇的：槍法最好的槍手，倒下的概率卻也是最高的；而最蹩腳的槍手存活的希望卻最大。因為大家都會把目標定為對自己威脅最大的一個人，但沒有人會把威脅最小的槍手列為首先攻擊的目標。

斗雞博弈

“斗雞博弈”又稱“鷹鴿博弈”或者“雪堆博弈”，較之于“囚徒困境”更適合研究個體間競爭和沖突的實驗范式，參加博弈的兩個人取得集體收益最大化的條件是彼此建立良好的合作關系，輪流做出不同的選擇。

該博弈任務的原始情景是飛車黨徒為了彰顯勇敢，兩人分別駕駛摩托車急速對撞；如果一方怕死而首先讓道，那么此人就被稱為懦夫；如果兩人同時讓道，兩人均被稱為懦夫；如果兩人都不讓道，則有可能非死即殘。被稱為懦夫的人在飛車黨內地位低下、備受歧視；不讓道的個體則會享受崇高的榮譽，受到眾人的推崇。“斗雞博弈”的雙方均曉得，如果在對方選擇讓路的前提下，自己最好選擇相撞；如果在對方選擇相撞的前提下，自己最好選擇讓路。

因此，“斗雞博弈”中的最優選擇是彼此間建立良好的合作關系，輪流做出不同的選擇。

應用

寡頭

在寡頭市場中，博弈論可以用來分析和解釋行業中寡頭企業之間的競爭和合作。寡頭市場是由少數幾個企業壟斷市場份額的市場。這些企業之間存在一定程度的相互依賴和相互作用，其行為和戰略會產生重要的影響，每個企業都可以采取一種策略來影響市場，在博弈論中，一般采用“納什均衡”來描述兩個或多個決策者之間的結果，寡頭企業采取的策略相互博弈后產生的結果，其中沒有企業有動機單獨改變自己的策略。

博弈論的應用可以幫助分析和預測寡頭市場的行業發展趨勢。例如，企業可能會選擇合作并共同限制生產數量，以提高產品價格和市場份額。或者，他們可能會選擇采用不同的定價策略來吸引不同的客戶群體。

比如假設社會總產量為Q(Q1+Q2)，廠商1的產量為Q1，廠商2的產量為Q2，市場出清價格為P=P(Q)=8-Q，生產單位產品的邊際成本為C=2。則在這種市場條件下兩廠商的利潤分別為:

U1=Q1(P-C)=Q1[8-(Q1+Q2)-C]=Q1[8-(Q1+Q2)-2]

U2=Q2(P-C)=Q2[8-(Q1+Q2)-C]=Q2[8-(Q1+Q2)-2]

可以看出任何一方的利潤大小都取決于另一方的產量。求該U1、U2的最大值，可得Q1=Q2=2時兩廠商都能獲得利潤最大化，且U1=U2=4。如果將兩個廠商看作一個整體: U=Q (P-C)=Q (8-Q-C)=Q(8-Q-2)求U的最大值，可得Q=3時，整體獲得最大利潤，且U=9。

從上面分析可得寡頭企業在追求個人利益最大化時并不能使社會整體利益達到最大化。但如果設計一個協議能夠使得兩個廠商互相合作，在都減少產量的同時提高利潤，使得個人利益最大化與整體利益最大化一致。但這樣的狀態并不穩定，因為只要有一個人不遵守約定，就會獲得更大的利益，最終將重新達到在獨立決策情況下個人利益最大化的狀態。這種協議顯然對于雙方來說都不具有約束力，即該博弈為非合作博弈。

并購

企業并購是多方利益集團實現均衡的過程。企業并購的利益相關方主要有三個，他們是并購企業、目標企業與政府。并購方和被并購方之間的交易行為顯然是一種博弈行為，并且政府參與其中。由于并購雙方在信息占有方面存在差異性。因此，這種博弈是不完全信息博弈。另外，并購過程要經過雙方多次磋商和討價還價，因此，又屬于動態博弈。

假設并購企業發現目標企業的發現成本為C，目前的盈利為R1，并購后的協同收益為r。同理，目標企業發現并購企業的發現成本為C，并購后的協同收益也為r，假設目標企業的盈利為R2。則我們可以得到以下博弈矩陣(并購企業在前，目標企業在后)：

并購是企業在追求最大化利益的過程中實現利益均衡的結果。并購企業和目標企業在博弈過程中都在尋求一個均衡。

一般均衡

在經濟學中，一般均衡是指商品、勞動和資本市場之間的一種普遍聯結關系。博弈論經濟學應用于一般均衡模型，以探討決策者間相互影響的結果和市場上資源配置的最佳狀態。

一般均衡研究了在一個經濟中追逐自身消費利益最大化的消費者，在市場的引導下最終會使經濟達到這樣一個交換結果，在該交換結果中每位消費者都使自身消費利益最大化。因此，它特指消費者在市場的引導下所達到的一般的商品交換結果，并不涉及策略互動的經濟主體行為，而只是強調了市場調整的最終結果。

在一般均衡模型中，市場中存在多個決策者，包括生產商、消費者和中介。每個參與者都掌握著一些關于市場的信息和資源，并制定他們的策略以獲得最大收益。博弈論經濟學通過研究參與者間相互作用的影響，從而解釋市場發展的趨勢。

通過博弈論模型的應用，可以預測市場上不同決策者的行為，并描繪他們之間的策略，規則和相互結果。博弈論模型旨在展示市場在不同的情境下的均衡狀態，在這種狀態下，每個參與者的策略都能夠最大化其自己的利益，同時也能夠滿足市場的總體需求。

價格戰

價格戰是企業為了占據市場份額采取的一種通過把價格作為競爭策略的市場競爭行為，短期內可以幫助企業消化庫存、緩解資金壓力、提高社會購買力、迫使企業提高生產效率。但這會導致整個行業收益水平下降，允諾顧客的承諾難以兌現會喪失顧客對企業的信任度、忠誠度，損害品牌形象。

價格戰是企業之間價格競爭的一種戰略，它可以使企業在短期內增加市場份額，但也可能會導致企業的盈利能力下降。在價格戰中，博弈論經濟學可以為企業提供策略和分析工具，通過博弈論分析，企業可以預測競爭對手可能的反應，并選擇最優定價策略，預測市場份額和價格。在價格戰中，企業可以選擇提高銷售量，降低產品價格或采取其他營銷手段來吸引消費者。價格戰使一個企業能夠在短期內獲得市場份額，因為它可能會吸引那些希望在購買商品時節約金錢的消費者。但是，如果企業過度依賴價格戰來吸引消費者，它可能會對自己的盈利能力造成長期損害。

假設市場上有家電企業A和B，原來都以較高價格銷售相同的空調。兩家企業都想通過降價以獲得更大的市場份額和利潤。假如維持現狀，A企業和B企業都將獲得200萬元的利潤；若有一方采取降價策略，降價方將獲得300萬元的利潤，而另一方只獲得80萬元；若A、B雙方都降價，則將各獲得120萬元的利潤。其得益矩陣如下：

由于這個博弈是一個非合作博弈，且博弈雙方都肯定對方會按照個體行為理性原則決策，B企業會認為A企業將采取降價措施以獲得更高的利潤，在A企業降價時B企業只有降價才能獲得較高收益；同樣，A企業也將這樣考慮B企業。最后雙方都會采用低價策略，各自得到120萬元的利潤，而各得200萬元利潤的結果是永遠無法實現的。

拍賣

經濟學家可以通過博弈論來分析不同拍賣規則下的策略選擇和收益分配，以找到最優的拍賣策略。下面的一個例子是博弈論在拍賣行業的應用。

在80年代，美國政府無償的把無限電的波段送給電視臺和廣播電臺，后來覺得這樣做無償的放棄了國家利益，于是決定銷售無限電的波段，這樣做不僅能增加收入而且能提高使用效率。拍賣的方式是利用了博弈論中的激勵機制。

當時，政府的期望值是希望財政收入增加能夠達到5億美元，事實上，在90年代真正實行了拍賣制度之后，財政收入達到了五百億美元。在一種稱為封閉式的拍賣當中，封閉式的拍賣就是說每個競標者開標前給出自己的競標價格，每個競標者不知道其他競標者的價格。然后拍賣主辦方公布所有競標者的價格，出價最高者競拍成功，并按所報的價格支付費用。后來，有學者對封閉式的拍賣提出了另外一個競標的準則：出價最高者競拍成功，但按第二競標價支付費用。表面看，似乎是對賣家不利，好象把到手的錢丟出去了，但是，事實上這樣可以賣得更多的錢，其理論基礎是不對稱信息條件下的經濟激勵理論，在這個領域做出杰出貢獻的兩位學者是詹姆斯·莫里斯(James A.Mirrlees)和威廉一維克瑞(William Vickrey)，他們的杰出貢獻也是他們分享1996年諾貝爾經濟學獎的主要原因之一。在現實中有很多封閉式的拍賣，比如，陸上或者海上石油的競拍。

心理學

博弈論在國際關系心理學中關注個體決策者的角色。通過分析個體的理性和非理性行為，可以揭示國際關系中個人如何影響決策和行動的過程。例如，博弈論可以用來研究領導者的決策行為以及國家內部政治環境對國際政策的影響。它為分析國際合作與沖突、穩定性與不穩定性等問題提供了一種有效的工具和理論框架。

社會學

博弈論在社會學中的應用可以幫助解釋社會規范、協作行為、公共物品提供等問題。對社會中連綿不絕的人際互動進行抽象和分析：社會中的博弈是持續不斷的，可以通過提取其中的片段和情節，以一般性模式展開分析，并做出解釋和預測，博弈論研究中的基本要素包括參與人、策略和收益，它們是靜態的要素。而信息和行動則是引人的變動性因素，會對博弈過程產生影響和變化。

計算機科學

博弈論理論中的納什均衡可以在計算機科學中可以被用于設計和分析無線通信網絡系統，無線通信網絡中有較多的參與人，如個人用戶( 普通PC網絡用戶和手機接入用戶) 和網絡服務提供商(ISP) ，收益函數比如延時，功耗和價格等，用戶之間存在合作和競爭關系，在博弈中大家的利益趨于最大化。在無線通信網絡中研究的一個熱點是異構無線網絡HWNS，其主要關注無線網絡中多種異構的接入終端和多種異構的服務提供者之間的資源分配問題。將博弈論應用到異構無線網，可以有效解決HWNS中包括網絡選擇、接納控制和負載均衡，帶寬和功率控制等問題。

未來展望

參考資料 >

..2023-05-12

..2023-06-02

..2023-07-03

..2023-06-12

..2023-05-12

..2023-06-02

..2023-06-12

..2023-05-12

..2023-06-02

..2023-05-12

..2023-06-02

..2023-05-12

..2023-06-02

..2023-05-12

..2023-06-12

..2023-05-12

..2023-06-02

..2023-07-03

納什均衡及其在計算機科學中的應用.中國知網.2023-07-03

..2023-05-12

必威电竞|足球世界杯竞猜平台

發展歷史

博弈論獲得的獎項

定義

基本概念

基本構成要素

基本假定

經典策略

囚徒困境

智豬博弈

槍手博弈

斗雞博弈

分類

零和博弈

非零和博弈

合作博弈

非合作博弈

完全信息博弈

不完全信息博弈

重復博弈

應用

寡頭

并購

一般均衡

價格戰

拍賣

心理學

社會學

計算機科學

未來展望