① 博弈論是什麼怎麼解釋的
在《博弈聖經》中寫到:博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的意義。
229、對待博弈方法的基本原理,先由淺入深地理解,再慢慢地拓寬視野,這是一個由人文理智和物理混合的創造性思維。在事物的進程中,人的行為讓事件會產生更富有神秘和希望的前景,而且是最具有嶄新的波瀾壯闊的前景。
博弈的研究會讓人明白更多的深層次問題。前人發現的合理科學,有效理論,創造性的設置、技術技能、知識技能、精彩的文章片斷,都可以從別人那裡拿來。典型的是市場營銷學,產品銷售學,都是有目的的。這里抄一段,那裡揀一點,零零星星,綜合排序、命題,堆成厚厚一本書,看了以後,感覺都是一些靈機一動的小聰明,沒有大智慧;裡面全是一些暗中的行為欺騙,都是陳釀舊事。這些書上寫的是摧毀文明道德、摧毀誠實信用的事例,都是為了一些眼前利益的雕蟲小技,歪曲了企業家特徵。而博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的意義。博弈應用於奧林匹克競賽是最成功的實例。仔細看看那些營銷學、產品銷售學,明顯地是主動封閉一些信息,誇大某些信息,主動預設一些陷阱。金錢與欺騙聯姻,使無數的百姓上當,把這些垃圾書改名為:市場飢荒學或產品飢荒學,更具有誇張意義。當這些書上的方法應用之後,最終都會感到不適、惡心、受辱、內疚,有愧良心,這些書永遠不能成為科學,這是江湖說書藝人、傳教士攜帶的一股擊潰民族本土文化的邪教。這樣的書多了,會沖擊文明的民族文化。品味一下這些人的談話,哪一句是實話?可以讓法官評論一下,請教師、教育專家分析一下:他們的目的就是得點小利,傷害了一個民族的企業骨幹,如果你的孩子按照他們說的去做,孩子絕不是個誠實的孩子,連下一代的誠信也沒有了。我有三個侄子,大的是博士,我問了他:「老二學習怎麼樣?」他說考試都是抄的,我一聽:是個人才,將來可以出產品銷售學,發表論文。然後又問:「老三學習怎麼樣?」他說「愛講別人的事」。我想:這又是一個人才,將來可以開一個企業咨詢公司,專門講企業咨詢管理,可以發大財。
我以前的文章里論述過的,生物行為被歷史記載,這種東抄一段西抄一段拼湊成的一本書都是些摘錄。這種現象已發生在科學界里,看似一部書,裡面都是用別人的文章拼湊成的。業內的人可以看出裡面原理不足,科學方法不足,斷斷續續,不成體系,使讀者感到有障礙,同時影響著他們的創新思路,影響創造的唯一性。
真正偉大的科學發明成果都是從創造的科學方法中形成的,特別是博弈科學,這是有人文精神參與的科學,並且和其他更多的學科有著盤根錯節的聯系,這些需要理清頭緒。從理論意義上講,它根基於普通感知力,有集成一個大整體的性質,用全面的宏觀圖景式的理解、精細過分的技巧,是虛偽的誇大也是科學的不誠實。科學的發現是盡可能轉到合乎理性、真理、客觀、現實的立場上。獨霸一切的單邊主義○50,不讓別人參與實踐的科學,是令人失望的科學。這些江湖說書藝人到處講如何經營,問問他自己的企業怎麼樣,他家鄉的企業怎麼樣,又是講成本多少,講利潤多少,講租金多少,講管理費用多少,應該營利多少,企業家都知道,能這樣算嗎?咋聽起來像是一個賭徒教別人如何押注似的一派胡言。某某企業管理咨詢有限公司,一個十足的外行,一個企業游醫,在台上的表演真像小丑,根本不知道聽課人屬於什麼行業,就大談產品怎麼製造,產品怎樣銷售、經營、怎樣管理,把天天研究自己企業的總經理當成了白痴,像看一場滑稽劇。根據博弈的規則和伯努利的大數定理,管理秩序的工商和稅務稽查部門、國家安全執法部門、電視新聞媒體和資深記者一旦開始調查他們,就會讓這一幫企業游醫立刻停止沖動。
233. 博弈的教育是基礎的原理教育,應用和計算顯示有明顯的行業和區域特點。博弈用於無法證明的或者具有長期大尺度的背景條件,用復雜的周期,用龐大的數字支持,用組織機構在玩一種游戲,比如保險、市場預測、股票、證券、氣象或宇宙的粗說等。現在博弈娛樂場仍然停留在原始的階段,幾乎沒有任何人受過博幣○41因特○27的有效教育。我們從大學里的博弈論在賭場的失效就可以看出,人類對博弈中的自然法則還沒觸動過。人類對博弈的無知程度相當於少兒的行為游戲。人們應當反思,要有自知之明,用開闊的心胸對歷史行為進行反思:科學是自由的、是專橫的、是反反復復的,靠單純的熱情是遠遠不夠的。讓所有對科學的理解溶入到經驗的整體中,最終施加對大自然法則的影響,理解疾風暴雨、冰雹地震、電閃雷鳴。這種大自然的語言用理想的結果對參與人進行教育,用粒子行為論○4教育,用博弈正理○17教育,目前發明家震驚經濟領域里的一大科學成果,就是它的有效適用。
307、人類的靈魂、意志、心理、行為、情感和事物的形態產生的交叉現象,是最值得研究的有趣現象,用語言很難描述,用理論很難有章法的細致地詮釋。博弈專家看了我的書,可以會感到對博弈的詞彙、語言、思想全然不知,也會第一次感到博弈的深奧,會恍然明白自己對博弈的了解只是皮毛,這沒什麼稀奇。博弈才有幾十年的歷史,還沒有真正影響人類的博弈專著。看看大學里的博弈論和博弈教材,你們首先會看到:納什均衡,納什均衡,囚徒困境,囚徒困境,還有什麼?博弈的很多詞彙和語言都是從其他學科中借來的,你抄他的,他抄別人的,抄來抄去,這些業余成果,他們自己都不滿意,你能知道些什麼,能說出一二三嗎?我說他們的貢獻你反對嗎?我說他們的錯誤你贊成嗎?有些人也出版了博弈論專著,總能有一點點作用。讀者一定會感覺到著作人對多門學科全然無知,閱讀他們的博弈論專著,書里的詞彙、語言和思想的貧乏,真是令人遺憾。也可能會有人直白,真是嶄新的垃圾。
人們把以前的博弈論想得神聖又偉大,內容卻是小詭計、小兒戲。幾千年前,普普通通的古人都已經想到過了。
我們把博弈看成人類科學中牽涉面最廣的一門科學,是用靈魂、意志、心理、情感作為元素參與其中的一些無法定量的特殊結構。我們也可以把人的一些非物質又存在的現象看成是生理學和宇宙學的一個分支,又是矛盾的分支,它與自然科學有著十分緊密的關系。在我們觀察到的現象中,進化的本質非常重要。那些摸不著、看不見、又能感覺到的非物質的東西起著原動力的作用,在實體內部又與物質世界有對立性,決不能說是超自然。除了我描述的博弈的世界之外,還有一個合成的博弈世界,人類目前還根本無法感知非物質與物質合成之後的混合世界,發明家用粒子行為論○4眾多的模型解釋是正確的。在行為沼澤○40模型解釋博弈行為結構之前,任何人的決策都可以看成是偶然的,都是例外。可以認為任何人的決策,都是雞鴨現象○71,行為沼澤○40模型的發現是在不絕對對立的狹縫中找到那有關行為具體特性,並可以計算。靈魂的自由、意志的自由、心理的自由、情感的自由,發明家在這種完全自由的環境里,發現了這個業余成果。任何一位大發明家的成果,都不是預先想到的,都是業余的,是在偶然中被發現的。所以公開想到的缺點就不容易犯,想隱瞞的東西就容易暴露。想要的東西很難得到,這正是「有意栽花花不開,無心插柳柳成蔭」。這是博弈的結果告訴我們的,讓大家舉一反三地去思考吧。
② 什麼是博弈
一個完整的博弈應當包括五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔後果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先後;第五,博弈方的收益,即各博弈方做出決策選擇後的所得和所失。 關於博弈論 現今博弈兩字也常用於博弈論的引申含義,在學術、商業、政治等領域有多角度多含義解釋。
③ 什麼是博弈
通俗地講,博弈論是一種「游戲理論」。其准確的定義是:一些個人、團隊或其他組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的信息,同時或先後,一次或多次,從各自允許選擇的行為或策略進行選擇並加以實施,並從中各自取得相應結果或收益的過程。
一個完整的博弈應當包括五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔後果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先後;第五,博弈方的收益,即各博弈方做出決策選擇後的所得和所失。
博弈論對現代企業管理的意義可概括為兩個方面。其一,博弈論的研究成果可直接運用於現代企業的經營決策之中。在市場經濟條件下,企業之間的競爭日益加劇,行業內的競爭逐漸表現為幾個大型集團之間的直接對抗,企業在這種情況下的經營總體戰略和一般戰略決策必須在充分掌握競爭對手信息和策略的情況下進行。從上述博弈定義來看,這類問題都可歸結為博弈問題。因此,企業運用博弈論中的決策模型進行這些問題的決策將使決策過程更加合理化。
其二,博弈論對現代企業管理觀念和方式的改變有著重要的指導意義。舉個例子來說,從「囚徒困境」這個典型博弈問題,我們可以深刻體會到企業實施「供應鏈管理」的必要性。
「囚徒困境」講的是兩個同案犯罪嫌疑犯(囚徒)被警方拘捕後,為防其相互間串供,而分別拘捕、隔離審問時,兩疑犯所面臨的認罪策略選擇的問題。
擺在兩疑犯面前的選擇無非兩種:坦白或不坦白。按照我們通常的政策,坦白從寬,抗拒從嚴,所以若兩人均坦白,則可從輕處理,分別判刑8年;若兩人中有一人坦白而另一人拒不坦白,則坦白者可免於處罰,而拒不坦白者,將從重處罰被判10年;當然,若兩人拒不交代,而警方手中又無足夠的證據可以指控犯罪嫌疑人,那他們只能被按妨礙公務被判1年。
由於兩個囚徒沒有條件串供,因此,對兩個囚徒總體來說,最佳結果不會是同時坦白,各判8年或都不坦白,各判1年。兩囚徒決策時都以自己的最大利益為目標,結果是無法實現最大利益甚至較大利益。
在現實生活中,我們的企業與企業之間,尤其是企業與其供應商之間,很多情況下正如上面兩個囚徒所遇情形一樣,沒能真正實現自身的最佳利益,甚至是損人不利己。因此,實施供應鏈管理,藉助IT工具,強化企業之間的合作,將是企業獲得雙贏局面的一條捷徑。
④ 發明博弈論的人是誰
《博弈聖經》博弈論的定義:「我們把動物利用大自然移動的癮魂,在決策人期待的空間里,形成相對均衡的語文學理論,稱為博弈論。」
你們讀一篇來自國務院發展研究中心博弈聖經著作人的經典文章,《科學發展觀在博弈世界中運動》一文,搜索就有,一篇文章含金量,超過中共黨理論專家的100本書。
來源:美國資訊網 博弈聖經;經濟學世界十部經典著作
博弈論 就是張冠李戴 捕風捉影 以訛傳訛
《博弈聖經》【典故】諷刺博弈論的最高博弈水平
有人問博弈聖經著作人,什麼是博弈論。
他回答說;博弈論就是,一問、二答、三無知。
也就是說;問者無知、回答者無知、聽者更無知。
有人追問,到目前為止,那麼多博弈論圖書,那麼多作者,他們的最高博弈水平是什麼?
博弈聖經著作人一聽就笑了;目前他們的最高博弈水平,就是想賣給你一本書,贏你一本書錢。
博弈聖經著作人通俗的談;菜鳥與金鳥,
一個人想變得偉大,從一個菜鳥變成一個金鳥,就要利用國家實體特性造個金鳥籠。日後,就可以在媒體的報道中、繪聲繪色地描述那個金鳥籠;他是某某大學院校、某某著名教授、某某首席科學家、某某諾貝爾獎得主、甚至某某政府官員,他就自然地鑽進了金鳥籠。
博弈論理論,它是太過於急躁、太過於草率的理論。
但明眼的人都能看得出,他抄來的無效理論編成的一本本博弈論,就是張冠李戴、捕風捉影、「以訛傳訛」,不管他從外國哪個地方抄來的,不管他抄了多少、編了多少本書、多少篇文章,究其低劣的學術品質,他仍然是一個菜鳥。
假如博弈論大師,走出那個金鳥籠,再靠講課賺大錢,靠賣書賺小錢,靠博弈取勝策略賺不到一毛錢,他就是騙子,也許是一個罪犯。
更為諷刺的是,一本本博弈論著作,古老的內容千篇一律,裡面沒有幾句精彩的話,沒有幾個經典的詞,更沒有定理、定律、定義和法則。至今一個個博弈論專家、矛盾論專家、概率論專家和外行知道得一樣多。
看博弈聖經著作人對納什的嘲諷
來源:美國資訊網;麻省理工福布斯納什-著名大學名人-正文-時間:2013-12-02
瑞典皇家科學院經濟學獎委員斯塔爾說;我們今天既然把納什均衡帶到公眾面前,未來一定會出現博弈的取勝理論,大家擔心納什均衡可能一敗塗地,若干年後將變成一大丑聞。
斯塔爾又說;納什均衡是一個博弈取勝的幻想,他自己也不知道怎麼均衡、不知道怎麼單方占優、不知道怎麼取勝。因此,納什在世期間不會向世人做出博弈如何取勝的解釋,所以他一直保持沉默。
...................
⑤ 什麼是博弈論
1.博弈論是指某個個人或是組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程,在經濟學上博奕論是個非常重要的理論概念。
什麼是博弈論?古語有雲,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 「出棋」 著數中理性化、邏輯化的部分,並將其系統化為一門科學。換句話說,就是研究個體如何在錯綜復雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的游戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最「理性」 的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法…
面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立,1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經濟行為》,標志著現代系統博弈理論的初步形成。對於非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,凈獲利為零。在這里抽象化後的博弈問題是,已知參與者集合(兩方) ,策略集合(所有棋著) ,和盈利集合(贏子輸子) ,能否且如何找到一個理論上的「解」 或「平衡」 ,也就是對參與雙方來說都最「合理」 、最優的具體策略?怎樣才是「合理」 ?應用傳統決定論中的「最小最大」 准則,即博弈的每一方都假設對方的所有功略的根本目的是使自己最大程度地失利,並據此最優化自己的對策,諾伊曼從數學上證明,通過一定的線性運算,對於每一個二人零和博弈,都能夠找到一個「最小最大解」 。通過一定的線性運算,競爭雙方以概率分布的形式隨機使用某套最優策略中的各個步驟,就可以最終達到彼此盈利最大且相當。當然,其隱含的意義在於,這套最優策略並不依賴於對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現的基本「理性」 思想是「抱最好的希望,做最壞的打算」 。
2.在經濟學中,「智*博弈」(Pigs』payoffs)是一個著名博弈論例子。
這個例子講的是:*圈裡有兩頭*,一頭大*,一頭小*。*圈的一邊有個踏板,每踩一下踏板,在遠離踏板的*圈的另一邊的投食口就會落下少量的食物。如果有一隻*去踩踏板,另一隻*就有機會搶先吃到另一邊落下的食物。當小*踩動踏板時,大*會在小*跑到食槽之前剛好吃光所有的食物;若是大*踩動了踏板,則還有機會在小*吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那麼,兩只*各會採取什麼策略?答案是:小*將選擇「搭便車」策略,也就是舒舒服服地等在食槽邊;而大*則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。
原因何在?因為,小*踩踏板將一無所獲,不踩踏板反而能吃上食物。對小*而言,無論大*是否踩動踏板,不踩踏板總是好的選擇。反觀大*,已明知小*是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
「小*躺著大*跑」的現象是由於故事中的游戲規則所導致的。規則的核心指標是:每次落下的事物數量和踏板與投食口之間的距離。
如果改變一下核心指標,*圈裡還會出現同樣的「小*躺著大*跑」的景象嗎?試試看。
改變方案一:減量方案。投食僅原來的一半分量。結果是小*大*都不去踩踏板了。小*去踩,大*將會把食物吃完;大*去踩,小*將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。
如果目的是想讓*們去多踩踏板,這個游戲規則的設計顯然是失敗的。
改變方案二:增量方案。投食為原來的一倍分量。結果是小*、大*都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小*和大*相當於生活在物質相對豐富的「共產主義」社會,所以競爭意識卻不會很強。
對於游戲規則的設計者來說,這個規則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈,想讓*們去多踩踏板的效果並不好。
改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小*和大*都在拚命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。
對於游戲設計者,這是一個最好的方案。成本不高,但收獲最大。
原版的「智*博弈」故事給了競爭中的弱者(小*)以等待為最佳策略的啟發。但是對於社會而言,因為小*未能參與競爭,小*搭便車時的社會資源配置的並不是最佳狀態。為使資源最有效配置,規則的設計者是不願看見有人搭便車的,政府如此,公司的老闆也是如此。而能否完全杜絕「搭便車」現象,就要看游戲規則的核心指標設置是否合適了。
比如,公司的激勵制度設計,獎勵力度太大,又是持股,又是期權,公司職員個個都成了百萬富翁,成本高不說,員工的積極性並不一定很高。這相當於「智*博弈」
增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的「小*」也有),一度十分努力的大*也不會有動力了----就象「智*博弈」減量方案一所描述的情形。最好的激勵機制設計就象改變方案三----減量加移位的辦法,獎勵並非人人有份,而是直接針對個人(如業務按比例提成),既節約了成本(對公司而言),又消除了「搭便車」現象,能實現有效的激勵。
許多人並未讀過「智*博弈」的故事,但是卻在自覺地使用小*的策略。股市上等待莊家抬轎的散戶;等待產業市場中出現具有贏利能力新產品、繼而大舉仿製牟取暴利的游資;公司里不創造效益但分享成果的人,等等。因此,對於制訂各種經濟管理的游戲規則的人,必須深諳「智*博弈」指標改變的個中道理。
3.背景知識:納什博弈論的原理與應用
http://ent.sina.com.cn 2002年03月21日17:44 北京晚報
1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯系。納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發現卻遭到馮·諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子裡挑戰權威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。要不是30多年的嚴重精神病折磨,恐怕他早已
站在諾貝爾獎的領獎台上了,而且也絕不會與其他人分享這一殊榮。
納什是一個非常天才的數學家,他的主要貢獻是1950至1951年在普林斯頓讀博士學位時做出的。然而,他的天才發現———非合作博弈的均衡,即「納什均衡」並不是一帆風順的。
1948年納什到普林斯頓大學讀數學系的博士。那一年他還不到20歲。當時普林斯頓可謂人傑地靈,大師如雲。愛因斯坦、馮·諾依曼、列夫謝茨(數學系主任)、阿爾伯特·塔克、阿倫佐·切奇、哈羅德·庫恩、諾爾曼·斯蒂恩羅德、埃爾夫·福克斯……等全都在這里。博弈論主要是由馮·諾依曼(1903—1957)創所立的。他是一位出生於匈牙利的天才的數學家。他不僅創立了經濟博弈論,而且發明了計算機。早在20世紀初,塞梅魯(Zermelo)、鮑羅(Borel)和馮·諾伊曼已經開始研究博弈的准確的數學表達,直到1939年,馮·諾依曼遇到經濟學家奧斯卡·摩根斯特恩(Oskar Morgenstern),並與其合作才使博弈論進入經濟學的廣闊領域。
1944年他與奧斯卡·摩根斯特恩合著的巨作《博弈論與經濟行為》出版,標志著現代系統博弈理論的的初步形成。盡管對具有博弈性質的問題的研究可以追溯到19世紀甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產量與價格壟斷;2000多年前中國著名軍事家孫武的後代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬於早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統。馮·諾依曼和摩根斯特恩的《博弈論與經濟行為》一書中提出的標准型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼的博弈論的局限性也日益暴露出來,由於它過於抽象,使應用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數數學家的專利,所以,影響力很有限。正是在這個時候,非合作博弈———「納什均衡」應運而生了,它標志著博弈論的新時代的開始!納什不是一個按部就班的學生,他經常曠課。據他的同學們回憶,他們根本想不起來曾經什麼時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數拓撲學。斯蒂恩羅德恰恰是這門學科的創立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。於是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數學王國的每一個分支,如拓撲學、代數幾何學、邏輯學、博弈論等等,深深地為之著迷。納什經常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學術野心。1950年整個夏天納什都忙於應付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的「放棄」,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續思考下,逐步形成一條清晰的脈絡,突然來了靈感!這一年的10月,他驟感才思潮湧,夢筆生花。其中一個最耀眼的亮點就是日後被稱之為「納什均衡」的非合作博弈均衡的概念。納什的主要學術貢獻體現在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為「非合作博弈」的長篇博士論文,1950年11月刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之後,他遇到蓋爾,告訴他自己已經將馮·諾依曼的「最小最大原理」(minimax solution)推到非合作博弈領域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終於意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現實的情況,而對其嚴密優美的數學證明極為贊嘆。蓋爾建議他馬上整理出來發表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這么做。結果還是蓋爾充當了他的「經紀人」,代為起草致科學院的簡訊,系主任列夫謝茨則親自將文稿遞交給科學院。納什寫的文章不多,就那麼幾篇,但已經足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內提一個教授,要求在「核心的刊物」上發表多少篇文章。按照這個標准可能納什還不一定夠資格。
1996年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麼文章,特殊的人才,必須有特殊的選拔辦法。
納什在上大學時就開始從事純數學的博弈論研究,1948年進入普林斯頓大學後更是如魚得水。20歲出頭已成為聞名世界的數學家。特別是在經濟博弈論領域,他做出了劃時代的貢獻,是繼馮·諾依曼之後最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。後續的研究者對博弈論的貢獻,都是建立在這一概念之上的。由於納什均衡的提出和不斷完善為博弈論廣泛應用於經濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。
囚犯的兩難處境
大理論中的小故事
要了解納什的貢獻,首先要知道什麼是非合作博弈問題。現在幾乎所有的博弈論教科書上都會講「囚犯的兩難處境」的例子,每本書上的例子都大同小異。
博弈論畢竟是數學,更確切地說是運籌學的一個分支,談經論道自然少不了數學語言,外行人看來只是一大堆數學公式。好在博弈論關心的是日常經濟生活問題,所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰爭等帶有競賽、對抗和決策性質的問題中借用的術語,聽上去有點玄奧,實際上卻具有重要現實意義。博弈論大師看經濟社會問題猶如棋局,常常寓深刻道理於游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,並不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,並從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後只是順手牽羊偷了點兒東西。於是警方將兩人隔離,分別關在不同的房間進行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,「由於你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同夥要被判十年刑。如果你拒不坦白,而被同夥檢舉,那麼你就將被判十年刑,他只判三個月的監禁。但是,如果你們兩人都坦白交代,那麼,你們都要被判5年刑。」斯卡爾菲絲和那庫爾斯該怎麼辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結果是大家都只被判一年。但是由於兩人處於隔離的情況下無法串供。所以,按照亞當·斯密的理論,每一個人都是從利己的目的出發,他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監禁———3個月,但前提是同夥抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結局(被判1年刑)就不會出現。這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱為「納什均衡」,也叫非合作均衡。因為,每一方在選擇策略時都沒有「共謀」(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構成。沒有人會主動改變自己的策略以便使自己獲得更大利益。「囚徒的兩難選擇」有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導致的最終結局是一個「納什均衡」,也是對所有人都不利的結局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監禁的結果。「納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。不妨讓我們重溫一下這位經濟學聖人在《國富論》中的名言:「通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。」從「納什均衡」我們引出了「看不見的手」的原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,「納什均衡」提出的悖論實際上動搖了西方經濟學的基石。因此,從「納什均衡」中我們還可以悟出一條真理:合作是有利的「利己策略」。但它必須符合以下黃金律:按照你願意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的「己所不欲勿施於人」。但前提是人所不欲勿施於我。其次,「納什均衡」是一種非合作博弈均衡,在現實中非合作的情況要比合作情況普遍。所以「納什均衡」是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發展,甚至可以說是一場革命。
從「納什均衡」的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象。我們將例舉出許多類似於「囚徒的兩難處境」這樣的例子。如價格戰、軍奮競賽、污染等等。一般的博弈問題由三個要素所構成:即局中人(players)又稱當事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關系被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。
價格戰博弈:
現在我們經常會遇到各種各樣的家電價格大戰,彩電大戰、冰箱大戰、空調大戰、微波爐大戰……這些大戰的受益者首先是消費者。每當看到一種家電產品的價格大戰,百姓都會「沒事兒偷著樂」。在這里,我們可以解釋廠家價格大戰的結局也是一個「納什均衡」,而且價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結果是穩定的,即是一個「納什均衡」。這個結果可能對消費者是有利的,但對廠商而言是災難性的。所以,價格戰對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結果或「納什均衡」可能導致一個有效率的零利潤結局。二是如果不採取價格戰,作為一種敵對博弈論(vivalry game)其結果會如何呢?每一個企業,都會考慮採取正常價格策略,還是採取高價格策略形成壟斷價格,並盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點,我們又引出一條基本准則:「把你自己的戰略建立在假定對手會按其最佳利益行動的基礎上」。事實上,完全競爭的均衡就是「納什均衡」或「非合作博弈均衡」。在這種狀態下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中,每一企業要使利潤最大化,消費者要使效用最大化,結果導致了零利潤,也就是說價格等於邊際成本。在完全競爭的情況下,非合作行為導致了社會所期望的經濟效率狀態。如果廠商採取合作行動並決定轉向壟斷價格,那麼社會的經濟效率就會遭到破壞。這就是為什麼WTO和各國政府要加強反壟斷的意義所在。
污染博弈:
假如市場經濟中存在著污染,但政府並沒有管制的環境,企業為了追求利潤的最大化,寧願以犧牲環境為代價,也絕不會主動增加環保設備投資。按照看不見的手的原理,所有企業都會從利己的目的出發,採取不顧環境的策略,從而進入「納什均衡」狀態。如果一個企業從利他的目的出發,投資治理污染,而其他企業仍然不顧環境污染,那麼這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要破產。這是一個「看不見的手的有效的完全競爭機制」失敗的例證。直到20世紀90年代中期,中國鄉鎮企業的盲目發展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業才會採取低污染的策略組合。企業在這種情況下,獲得與高污染同樣的利潤,但環境將更好。
貿易自由與壁壘:
這個問題對於剛剛加入WTO的中國而言尤為重要。任何一個國家在國際貿易中都面臨著保持貿易自由與實行貿易保護主義的兩難選擇。貿易自由與壁壘問題,也是一個「納什均衡」,這個均衡是貿易雙方採取不合作博弈的策略,結果使雙方因貿易戰受到損害。X國試圖對Y國進行進口貿易限制,比如提高關稅,則Y國必然會進行反擊,也提高關稅,結果誰也沒有撈到好處。反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發,雙方都減少關稅限制,結果大家都從貿易自由中獲得了最大利益,而且全球貿易的總收益也增加了。
參考資料:網路知道
⑥ 博弈論是什麼
博弈論是指某個個人或是組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程,在經濟學上博奕論是個非常重要的理論概念。
什麼是博弈論?古語有雲,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 「出棋」 著數中理性化、邏輯化的部分,並將其系統化為一門科學。換句話說,就是研究個體如何在錯綜復雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的游戲或曰博弈如象棋、撲克等。數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最「理性」 的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法…
面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立,1944年他與經濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經濟行為》,標志著現代系統博弈理論的初步形成。對於非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,凈獲利為零。在這里抽象化後的博弈問題是,已知參與者集合(兩方) ,策略集合(所有棋著) ,和盈利集合(贏子輸子) ,能否且如何找到一個理論上的「解」 或「平衡」 ,也就是對參與雙方來說都最「合理」 、最優的具體策略?怎樣才是「合理」 ?應用傳統決定論中的「最小最大」 准則,即博弈的每一方都假設對方的所有功略的根本目的是使自己最大程度地失利,並據此最優化自己的對策,諾伊曼從數學上證明,通過一定的線性運算,對於每一個二人零和博弈,都能夠找到一個「最小最大解」 。通過一定的線性運算,競爭雙方以概率分布的形式隨機使用某套最優策略中的各個步驟,就可以最終達到彼此盈利最大且相當。當然,其隱含的意義在於,這套最優策略並不依賴於對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現的基本「理性」 思想是「抱最好的希望,做最壞的打算」 。
2.在經濟學中,「智*博弈」(Pigs』payoffs)是一個著名博弈論例子。
這個例子講的是:*圈裡有兩頭*,一頭大*,一頭小*。*圈的一邊有個踏板,每踩一下踏板,在遠離踏板的*圈的另一邊的投食口就會落下少量的食物。如果有一隻*去踩踏板,另一隻*就有機會搶先吃到另一邊落下的食物。當小*踩動踏板時,大*會在小*跑到食槽之前剛好吃光所有的食物;若是大*踩動了踏板,則還有機會在小*吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那麼,兩只*各會採取什麼策略?答案是:小*將選擇「搭便車」策略,也就是舒舒服服地等在食槽邊;而大*則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。
原因何在?因為,小*踩踏板將一無所獲,不踩踏板反而能吃上食物。對小*而言,無論大*是否踩動踏板,不踩踏板總是好的選擇。反觀大*,已明知小*是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
「小*躺著大*跑」的現象是由於故事中的游戲規則所導致的。規則的核心指標是:每次落下的事物數量和踏板與投食口之間的距離。
如果改變一下核心指標,*圈裡還會出現同樣的「小*躺著大*跑」的景象嗎?試試看。
改變方案一:減量方案。投食僅原來的一半分量。結果是小*大*都不去踩踏板了。小*去踩,大*將會把食物吃完;大*去踩,小*將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。
如果目的是想讓*們去多踩踏板,這個游戲規則的設計顯然是失敗的。
改變方案二:增量方案。投食為原來的一倍分量。結果是小*、大*都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小*和大*相當於生活在物質相對豐富的「共產主義」社會,所以競爭意識卻不會很強。
對於游戲規則的設計者來說,這個規則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈,想讓*們去多踩踏板的效果並不好。
改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小*和大*都在拚命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。
對於游戲設計者,這是一個最好的方案。成本不高,但收獲最大。
原版的「智*博弈」故事給了競爭中的弱者(小*)以等待為最佳策略的啟發。但是對於社會而言,因為小*未能參與競爭,小*搭便車時的社會資源配置的並不是最佳狀態。為使資源最有效配置,規則的設計者是不願看見有人搭便車的,政府如此,公司的老闆也是如此。而能否完全杜絕「搭便車」現象,就要看游戲規則的核心指標設置是否合適了。
比如,公司的激勵制度設計,獎勵力度太大,又是持股,又是期權,公司職員個個都成了百萬富翁,成本高不說,員工的積極性並不一定很高。這相當於「智*博弈」
增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的「小*」也有),一度十分努力的大*也不會有動力了----就象「智*博弈」減量方案一所描述的情形。最好的激勵機制設計就象改變方案三----減量加移位的辦法,獎勵並非人人有份,而是直接針對個人(如業務按比例提成),既節約了成本(對公司而言),又消除了「搭便車」現象,能實現有效的激勵。
許多人並未讀過「智*博弈」的故事,但是卻在自覺地使用小*的策略。股市上等待莊家抬轎的散戶;等待產業市場中出現具有贏利能力新產品、繼而大舉仿製牟取暴利的游資;公司里不創造效益但分享成果的人,等等。因此,對於制訂各種經濟管理的游戲規則的人,必須深諳「智*博弈」指標改變的個中道理。
3.背景知識:納什博弈論的原理與應用
http://ent.sina.com.cn 2002年03月21日17:44 北京晚報
1950年和1951年納什的兩篇關於非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯系。納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發現卻遭到馮·諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子裡挑戰權威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。要不是30多年的嚴重精神病折磨,恐怕他早已
站在諾貝爾獎的領獎台上了,而且也絕不會與其他人分享這一殊榮。
納什是一個非常天才的數學家,他的主要貢獻是1950至1951年在普林斯頓讀博士學位時做出的。然而,他的天才發現———非合作博弈的均衡,即「納什均衡」並不是一帆風順的。
1948年納什到普林斯頓大學讀數學系的博士。那一年他還不到20歲。當時普林斯頓可謂人傑地靈,大師如雲。愛因斯坦、馮·諾依曼、列夫謝茨(數學系主任)、阿爾伯特·塔克、阿倫佐·切奇、哈羅德·庫恩、諾爾曼·斯蒂恩羅德、埃爾夫·福克斯……等全都在這里。博弈論主要是由馮·諾依曼(1903—1957)創所立的。他是一位出生於匈牙利的天才的數學家。他不僅創立了經濟博弈論,而且發明了計算機。早在20世紀初,塞梅魯(Zermelo)、鮑羅(Borel)和馮·諾伊曼已經開始研究博弈的准確的數學表達,直到1939年,馮·諾依曼遇到經濟學家奧斯卡·摩根斯特恩(Oskar Morgenstern),並與其合作才使博弈論進入經濟學的廣闊領域。
1944年他與奧斯卡·摩根斯特恩合著的巨作《博弈論與經濟行為》出版,標志著現代系統博弈理論的的初步形成。盡管對具有博弈性質的問題的研究可以追溯到19世紀甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產量與價格壟斷;2000多年前中國著名軍事家孫武的後代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬於早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統。馮·諾依曼和摩根斯特恩的《博弈論與經濟行為》一書中提出的標准型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼的博弈論的局限性也日益暴露出來,由於它過於抽象,使應用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數數學家的專利,所以,影響力很有限。正是在這個時候,非合作博弈———「納什均衡」應運而生了,它標志著博弈論的新時代的開始!納什不是一個按部就班的學生,他經常曠課。據他的同學們回憶,他們根本想不起來曾經什麼時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數拓撲學。斯蒂恩羅德恰恰是這門學科的創立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。於是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數學王國的每一個分支,如拓撲學、代數幾何學、邏輯學、博弈論等等,深深地為之著迷。納什經常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學術野心。1950年整個夏天納什都忙於應付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的「放棄」,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續思考下,逐步形成一條清晰的脈絡,突然來了靈感!這一年的10月,他驟感才思潮湧,夢筆生花。其中一個最耀眼的亮點就是日後被稱之為「納什均衡」的非合作博弈均衡的概念。納什的主要學術貢獻體現在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為「非合作博弈」的長篇博士論文,1950年11月刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之後,他遇到蓋爾,告訴他自己已經將馮·諾依曼的「最小最大原理」(minimax solution)推到非合作博弈領域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終於意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現實的情況,而對其嚴密優美的數學證明極為贊嘆。蓋爾建議他馬上整理出來發表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這么做。結果還是蓋爾充當了他的「經紀人」,代為起草致科學院的簡訊,系主任列夫謝茨則親自將文稿遞交給科學院。納什寫的文章不多,就那麼幾篇,但已經足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內提一個教授,要求在「核心的刊物」上發表多少篇文章。按照這個標准可能納什還不一定夠資格。
1996年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麼文章,特殊的人才,必須有特殊的選拔辦法。
納什在上大學時就開始從事純數學的博弈論研究,1948年進入普林斯頓大學後更是如魚得水。20歲出頭已成為聞名世界的數學家。特別是在經濟博弈論領域,他做出了劃時代的貢獻,是繼馮·諾依曼之後最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。後續的研究者對博弈論的貢獻,都是建立在這一概念之上的。由於納什均衡的提出和不斷完善為博弈論廣泛應用於經濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。
囚犯的兩難處境
大理論中的小故事
要了解納什的貢獻,首先要知道什麼是非合作博弈問題。現在幾乎所有的博弈論教科書上都會講「囚犯的兩難處境」的例子,每本書上的例子都大同小異。
博弈論畢竟是數學,更確切地說是運籌學的一個分支,談經論道自然少不了數學語言,外行人看來只是一大堆數學公式。好在博弈論關心的是日常經濟生活問題,所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰爭等帶有競賽、對抗和決策性質的問題中借用的術語,聽上去有點玄奧,實際上卻具有重要現實意義。博弈論大師看經濟社會問題猶如棋局,常常寓深刻道理於游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,並不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,並從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後只是順手牽羊偷了點兒東西。於是警方將兩人隔離,分別關在不同的房間進行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,「由於你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同夥要被判十年刑。如果你拒不坦白,而被同夥檢舉,那麼你就將被判十年刑,他只判三個月的監禁。但是,如果你們兩人都坦白交代,那麼,你們都要被判5年刑。」斯卡爾菲絲和那庫爾斯該怎麼辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結果是大家都只被判一年。但是由於兩人處於隔離的情況下無法串供。所以,按照亞當·斯密的理論,每一個人都是從利己的目的出發,他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監禁———3個月,但前提是同夥抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結局(被判1年刑)就不會出現。這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱為「納什均衡」,也叫非合作均衡。因為,每一方在選擇策略時都沒有「共謀」(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構成。沒有人會主動改變自己的策略以便使自己獲得更大利益。「囚徒的兩難選擇」有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導致的最終結局是一個「納什均衡」,也是對所有人都不利的結局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監禁的結果。「納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。不妨讓我們重溫一下這位經濟學聖人在《國富論》中的名言:「通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。」從「納什均衡」我們引出了「看不見的手」的原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,「納什均衡」提出的悖論實際上動搖了西方經濟學的基石。因此,從「納什均衡」中我們還可以悟出一條真理:合作是有利的「利己策略」。但它必須符合以下黃金律:按照你願意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的「己所不欲勿施於人」。但前提是人所不欲勿施於我。其次,「納什均衡」是一種非合作博弈均衡,在現實中非合作的情況要比合作情況普遍。所以「納什均衡」是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發展,甚至可以說是一場革命。
從「納什均衡」的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象。我們將例舉出許多類似於「囚徒的兩難處境」這樣的例子。如價格戰、軍奮競賽、污染等等。一般的博弈問題由三個要素所構成:即局中人(players)又稱當事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關系被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。
價格戰博弈:
現在我們經常會遇到各種各樣的家電價格大戰,彩電大戰、冰箱大戰、空調大戰、微波爐大戰……這些大戰的受益者首先是消費者。每當看到一種家電產品的價格大戰,百姓都會「沒事兒偷著樂」。在這里,我們可以解釋廠家價格大戰的結局也是一個「納什均衡」,而且價格戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結果是穩定的,即是一個「納什均衡」。這個結果可能對消費者是有利的,但對廠商而言是災難性的。所以,價格戰對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結果或「納什均衡」可能導致一個有效率的零利潤結局。二是如果不採取價格戰,作為一種敵對博弈論(vivalry game)其結果會如何呢?每一個企業,都會考慮採取正常價格策略,還是採取高價格策略形成壟斷價格,並盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點,我們又引出一條基本准則:「把你自己的戰略建立在假定對手會按其最佳利益行動的基礎上」。事實上,完全競爭的均衡就是「納什均衡」或「非合作博弈均衡」。在這種狀態下,每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中,每一企業要使利潤最大化,消費者要使效用最大化,結果導致了零利潤,也就是說價格等於邊際成本。在完全競爭的情況下,非合作行為導致了社會所期望的經濟效率狀態。如果廠商採取合作行動並決定轉向壟斷價格,那麼社會的經濟效率就會遭到破壞。這就是為什麼WTO和各國政府要加強反壟斷的意義所在。
污染博弈:
假如市場經濟中存在著污染,但政府並沒有管制的環境,企業為了追求利潤的最大化,寧願以犧牲環境為代價,也絕不會主動增加環保設備投資。按照看不見的手的原理,所有企業都會從利己的目的出發,採取不顧環境的策略,從而進入「納什均衡」狀態。如果一個企業從利他的目的出發,投資治理污染,而其他企業仍然不顧環境污染,那麼這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要破產。這是一個「看不見的手的有效的完全競爭機制」失敗的例證。直到20世紀90年代中期,中國鄉鎮企業的盲目發展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業才會採取低污染的策略組合。企業在這種情況下,獲得與高污染同樣的利潤,但環境將更好。
貿易自由與壁壘:
這個問題對於剛剛加入WTO的中國而言尤為重要。任何一個國家在國際貿易中都面臨著保持貿易自由與實行貿易保護主義的兩難選擇。貿易自由與壁壘問題,也是一個「納什均衡」,這個均衡是貿易雙方採取不合作博弈的策略,結果使雙方因貿易戰受到損害。X國試圖對Y國進行進口貿易限制,比如提高關稅,則Y國必然會進行反擊,也提高關稅,結果誰也沒有撈到好處。反之,如X和Y能達成合作性均衡,即從互惠互利的原則出發,雙方都減少關稅限制,結果大家都從貿易自由中獲得了最大利益,而且全球貿易的總收益也增加了。
⑦ 博弈論是誰提出的
……上面那個回答太長,現在來給個短的。首先,博弈論並不是由那什Nash提出來的,盡管他因為這個獲得了諾貝爾經濟獎。然後,是馮·諾伊曼John Von Neumann(匈牙利裔美籍數學家,計算機和博弈論的發明者,1903-1957)和普林斯頓的經濟學家奧斯卡·摩根斯特恩Oskar Morgenstern於1944年在《博弈論和經濟行為》「Theory of Games and Economic Behavior」中提出了他們關於博弈論的研究報告。博弈論的創造者是馮·諾伊曼。 參考資料:囚徒的困境——馮·諾伊曼、博弈論和原子彈之謎,北京理工大學出版社出版