圍棋定式中的納什均衡與有限理性論文
圍棋定式中的納什均衡與有限理性論文
關(guān)于圍棋的定式,棋界有不同解說,但也有一些基本共識,如定式之“定”只有相對含義,定式經(jīng)歷歷史沿革,可見其非自然法則,乃人之發(fā)明,而且行棋中出“變著”也為常見。甚至有求道者如小林光一痛思“定式”之束縛,打破“思維定勢”和行棋慣例,進(jìn)而天馬行空追求“隨心所欲而不逾矩”的境界。但畢竟,人人都用定式,且亦步亦趨,不輕易越雷池為多,職業(yè)高手也常不例外?梢姸ㄊ阶匀挥衅浞稀捌謇怼敝帯1疚臄M對定式之“理”以及定式的局限作一理論探討。
定式與“納什均衡”
何為“定式”,小林光一有如下定義:“在局部戰(zhàn)斗中,用最穩(wěn)妥的順序,而且能經(jīng)得住以后的檢驗,從而被固定下來的就是定式”。在此定義中,“局部”較易理解,但何為“穩(wěn)妥”?如何“檢驗”?均語焉不詳。下面就用博弈論(gametheory)——尤其是“納什均衡”(Equilibrium)作一詮釋。
博弈論的基本前提為:某人或某物的行為效果如何,有賴于他人或他物的行為。由于世上人間的事物很少不依賴于其他事物而存在,因此博弈論用途甚廣,從軍事,政治,經(jīng)濟等社會科學(xué),到工程學(xué)和生物學(xué)等自然科學(xué),均留下印記。在日常生活中,從待人接物到談情說愛,無不涉及博弈過程。
初期博弈論強調(diào)利益的沖突,即非合作甚至對抗?fàn)顟B(tài)。比如,“零和理論”指一方得益則意味著另一方遭損。這在圍棋中早有運用,如“他人之急所即我之急所”。棋,包括圍棋,既然講的是勝負(fù)之道,就規(guī)定了它的對抗性。軍事行為、經(jīng)濟行為、政治行為、國際均有對抗的因素,但如果這個宇宙只有對抗和沖突,它又如何避免分崩離析的結(jié)果呢?這樣的問題,在美蘇冷戰(zhàn)時期(雙方都擁有毀滅性核武器),尤其顯得重要。數(shù)學(xué)家約翰·納什(JohnNash,1928——)就是在這樣的背景下提出了他的均衡理論,后稱為“納什均衡”,這一理論也是他1994年獲諾貝爾經(jīng)濟學(xué)獎的主要理由。
納什早年入普林斯頓大學(xué)數(shù)學(xué)系做研究生即與圍棋結(jié)緣。對于納什來說,棋局中的博弈隱喻著人間事物的基本規(guī)律。事態(tài)如棋局,而棋局是可以用策略思維加以概括的。比如“過分”,“本手”與“緩著”之間,一般都會選擇本手,著法過分如不遇反擊,可能占到便宜,如遇反擊則可能虧損,因此如果棋力相當(dāng),則應(yīng)考慮到對手的反擊手段。對手也同樣考慮到在追求利益中不可能占盡便宜。這就導(dǎo)致雙方都能接受的方案。
納什的均衡理論的要義在于:即使在對抗條件下,雙方可以通過向?qū)Ψ教岢鐾{和要求,找到雙方能夠接受的解決方案而不至于因為各自追求自我利益而無法達(dá)到妥協(xié),甚至兩敗俱傷。穩(wěn)定的均衡點建立在找到各自的“占優(yōu)策略”(dominantstrategy),即無論對方作何選擇,這一策略優(yōu)于其他策略(所謂“本手”是也)!岸ㄊ健奔词窃S多變化中雙方都認(rèn)為“不虧”的一種變化。
納什均衡與定式的關(guān)系可以從兩個層面看。從策略層面看,如一方的策略是“撈地”,另一方是“取勢”,而結(jié)果相當(dāng),互有所得,雙方就愿意那樣下!皳频亍保ǹ紤]現(xiàn)實利益),“取勢”(考慮將來發(fā)展)便形成一個“納什均衡”;另一方面,可以從具體行棋效果來看,如果一步棋能考慮到對手各種應(yīng)手而依然成立,對手也運用同樣法則找到應(yīng)對,則可以說雙方達(dá)成了“納什均衡”。
這樣看,定式是一系列納什均衡的累計直至局部達(dá)到穩(wěn)定的一種變化,直到一方認(rèn)為可以根據(jù)形勢選擇任何變化或脫先而無局部受損之虞。由于定式是在大量實戰(zhàn)基礎(chǔ)上不斷被驗證并長期積累而成,可以說定式是圍棋中科學(xué)成份最大的。
但是,圍棋的變化無窮,定式之外其他種種變化難以窮盡。一個定式少則幾步,多則幾十步。有些定式具有強大必然性,不然有崩潰之虞,或明顯虧損,有些可能具有彈性空間,將來趨勢也未必明了。在某一局部具有均衡意義(即雙方地考慮了對方可能的策略而達(dá)成的對等的占優(yōu)策略)的變化可能有多種,而“定式”只是在前人經(jīng)驗總結(jié)出的一部分。從而會有新的定式出現(xiàn)。而在任何對局中,全局情況,對手棋風(fēng),都會決定一個定式是否真正具有“均衡”意義。比如,一個棋風(fēng)銳利、咄咄逼人的棋手碰到處處忍讓的棋手,可能占到便宜,遇到同類棋手,則會陷入惡戰(zhàn)和險境。
由此可見,在變化的棋局中,“均衡”只有相對意義。因而小林光一說定式不可通用,局部構(gòu)思不利于全局時就應(yīng)該使用變著。再者,棋手的日的常常不是尋找均衡點,而是利用對方的弱點打破均衡而獲得優(yōu)勢。解決這些問題,還需要從心理學(xué)入手。
定式與“有限理性”
赫勃特·賽蒙(HerbertSimon,1916——1997)用心理學(xué)原理探討經(jīng)濟行為——尤其是商業(yè)行為的第一人,他也是對國際象棋進(jìn)行心理學(xué)研究的先行者之一。他對傳統(tǒng)經(jīng)濟學(xué)提出挑戰(zhàn)。經(jīng)典經(jīng)濟學(xué)假定人的經(jīng)濟決策是高度理性的,即掌握完全信息,有能力作出最優(yōu)化的選擇!凹{什均衡”同樣基于競爭對手雙方都擁有完全信息(如對手有哪些應(yīng)對手段),和完全理性的假設(shè)(如考慮到對手有A、B、C三種手段,自己的選擇中哪一種可立于不敗之地)。
而賽蒙認(rèn)為:人無法獲得決策所需的所有信息,即使能獲得所有信息,人也無法實現(xiàn)充分理性,因為我們能力有限,而且面臨時間壓力,不可能無限制地周全思考一個問題的全部復(fù)雜關(guān)系及行動后果。這就是賽蒙“有限理性”的命題。那么,有此缺陷的人究竟如何決策呢?賽蒙用了“滿意/犧牲”(satisfice)概括人或經(jīng)濟實體的行為,人并非追求利益最大化,而是滿意即可。這一理論使他獲得1978年諾貝爾經(jīng)濟學(xué)獎。
“有限理性”應(yīng)用于“定式”,可得出如下結(jié)論:定式未必是解決雙方利害沖突的最優(yōu)化的均衡結(jié)果,而是我們達(dá)到雙方滿意的權(quán)宜手段。主要原因是圍棋變化過于復(fù)雜,數(shù)學(xué)上稱為“組合爆炸”(combinatoryexplosion)。
這樣,小林光一所說的“穩(wěn)妥的順序”可以這樣解釋:面對紛亂的變化可能,定式“避免了計算帶來的認(rèn)知超載,并由于經(jīng)過前人檢驗,其結(jié)果有可預(yù)測性且相對對等(即如按定式下不會壞到哪里)。從這個意義上說,定式所依據(jù)的不是客觀上的絕對均衡(即納什均衡),而是主觀上雙方都不愿意看到一開始就紛亂失控的局面而作的妥協(xié)(追求結(jié)果的穩(wěn)定性和可預(yù)測性)。定式成為可能也是因為局部對全局的戰(zhàn)略意義尚不明了。但對于高手來說,定式的選擇運用早有戰(zhàn)略的企圖,只是我們尚不能領(lǐng)會而已。從這一角度看定式,也可見有意識地打破定式的意義,一方面,打破定式是追求利益最大化,即優(yōu)化選擇的必然結(jié)果,因為定式作為雙方滿意的權(quán)宜之計不可能考慮到周圍和全局的變數(shù)。另一方面,打破定式也可以是心理戰(zhàn)術(shù),對方造成心理壓力,因為增加了棋的變數(shù)和不可預(yù)測性。
如果定式僅僅是達(dá)到雙方滿意的結(jié)果,又如何解釋小林光一所言一個定式必然“經(jīng)得住以后的檢驗”呢?這是指一種變化既然為大家認(rèn)可而成為定式,就必然具有合理性,具有了納什均衡的實質(zhì)效果,但是“有限理性”決定了納什均衡只是理論的假定,因為全知能力只屬于上帝,而不為任何一方所有。任何定式都只能實現(xiàn)相對的均衡,每一步棋都蘊含著新的不平衡(形勢向某一方的傾斜)。而所謂棋高一籌,正是看到了不平衡所帶來的契機,進(jìn)而獲得勝機。
由此念及初學(xué)定式可能帶來的弊病。視定式為百試不爽的招數(shù),盲目地,機械地,不經(jīng)思考地照搬定式,在初學(xué)階段可能尚不成問題,但很快就會成為提高棋藝的障隘。反過來說,能夠活用定式,甚至能恰到好處地打破定式,則體現(xiàn)了對棋的悟性。
同理,在圍棋教學(xué)中不僅傳授定式(知其然),更要教授定式的合理運用和局限(知其所以然),才不至于束縛學(xué)童的想象力,創(chuàng)造力。定式能夠變通,其存在才具有價值。
【圍棋定式中的納什均衡與有限理性論文】相關(guān)文章:
不定式省略to的九種情況總結(jié)07-03
英語接不定式固定搭配總結(jié)06-05
初中英語動詞不定式的形式總結(jié)08-08
有關(guān)圍棋的教案(通用13篇)08-22
羅威納犬眼屎的清理方法03-20
試論體育教學(xué)中如何培養(yǎng)終身體育意識論文07-02
探討教育心理學(xué)在英語教學(xué)中的實際應(yīng)用論文08-13
拼音中輕聲的總結(jié)03-30