2018年11月28日 星期三

從遊戲談起-信任的演化

這是一個應該很多人玩過的小遊戲
https://audreyt.github.io/trust-zh-TW/
作者企圖藉由賽局與電腦模擬的來方,來向大眾說明「寬容」在社會上所能的價值與具備的優勢。而事實上,這個遊戲所能表現的除了寬容的價值外,還有不少可以說道的地方。

在遊戲裡共有提到8種具體的策略,而其實仔細的去推敲的話,可以發現其中有許多的策略都代表了一種道德的準則,而其它的策略也都各自有其意義,「寬容」並非是賽局的唯一解,甚至非最佳解,以下我們先整理一下其策略與所代表的意義
「模仿貓」 - 第一步合作,然後一直模仿對方上一步的舉動
「模仿咪」 - 與模仿貓一樣,但容許一次的背叛

「紅嬰仔」 - 總是合作
「黑到底」 - 總是欺騙,在遊戲中這代表了不友善的環境
「牛文聰」 - 先合作,直到被欺騙一次,之後就欺騙到底
「福爾摩斯星兒」 - 合作→欺騙→合作→合作→ 模仿貓/黑到底
「少根筋」 - 先合作,如果對方合作則延續上一回合的選擇,如果對方欺騙則作出與這次相反的選項
「胡亂來」 -隨機的選擇合作或背叛

------------------------------------------
「模仿貓」- 公平
模仿貓是遊戲中在模仿咪之前獲勝的略策,代表著「公平」的道德價值。稟持著善意的合作開始,但你背叛我一次我也一定背叛你一次,絕不吃虧。 幾乎在大部份的狀況下,模仿貓的表現都並不差,即使遊戲中最後的勝利者是模仿咪,但模仿貓一樣是生存了下來。
值得注意的是,如果你去觀察遊戲的過程,會發現在大部份的遊戲狀況中,模仿貓反轉增殖的時間點總是比模仿咪出現的更早,而且早期和中期的增殖速度也快過模仿咪,直到盤面上幾乎沒有其它策略存在時,模仿咪才開始獲得更大的優勢而削減模仿咪的數量;這代表了「模仿咪」的最佳解其實是一種「封閉條件下」才會有的狀況,而當「開放條件」的狀況下(例如有外在敵人),模仿貓則是比模仿咪有著更好的表現。

「模仿咪」- 寬容
模仿咪在遊戲中已經講的夠多了,就不再多提

「紅嬰仔」 - 爛好人
總是合作的紅嬰仔,在遊戲中的生存能力其實很弱,更是許多惡意策略獲得成長的溫床。然而其實紅嬰仔卻有著突破模仿貓與模仿咪後期社會防守的能力,特別是模仿貓。如果我們在一個滿是模仿貓與模仿咪的盤中放上少少的幾隻紅嬰仔,那你最後得到的就是整盤的紅嬰仔。因為模仿貓與模仿咪都是會進行報復的策略,而報復其實是一種需要消耗自身的力量的行為 (失去合作獲利的機會),而紅嬰仔則不需要支付這些成本
於是在一個開放的盤局中我們就會看到這樣的循環   模仿貓/模仿咪 → 紅嬰仔 → 惡意策略 →模仿貓/模仿咪   ,爛好人的爛,指的不僅是自身,更是對社會的影響。
另外值得注意的就是,紅嬰仔的策略是善良策略裡最「簡單」的一個,這點的影響我們之後再提

「少根筋」- 自省者/怯懦者
少根筋的策略其實是一種自我檢討的模型,如果對方合作則延續上一回合的選擇,如果對方欺騙則檢討策略改出相反的選項,是一種很有自省能力的個性,如果說紅嬰仔給人的第一直覺是「道德」,那少根筋則是可以用「短視的理性」來代表,不斷的依據「當下」的反匱來決定是否改變策略。
在一對一的對抗中,少根筋對紅嬰仔有著良好的剝削能力,並與模仿貓打平;在整體的盤局中更是能和紅嬰仔一樣能夠突破兩個模仿機的封鎖,但在面對不友善環境時卻缺乏抵御的能力。所以整體而言,少根筋和紅嬰仔在開放盤局中的循環是和紅嬰站在同一個位置的,出現的比紅嬰仔晚點,活的比稍微久點

「牛文聰」- 被壓迫者
牛文聰這名字其實還蠻傳神的,一開始秉持善意進行合作,但只要被背叛後就久遠的記著你了,而再無合作的可能。因為牛文聰秉持著合作的初衷開始,並且不主動背叛,所以基本上算是一種善意的策略,但機乎沒什麼能贏的盤局
不過,牛文聰的策略有一個特點-「幾乎在所有惡意的盤局中,能撐最久的策略都是牛文聰」,這也是我給我個策略訂下這名稱的理由,並不是說牛文聰的策略很像被壓迫者的道德策略,而是「所有長期被壓迫的團體,都會沾染上牛文聰的個性」,因為沒有這種個性的都死了。即便不是永遠的沒有回頭的可能,但三次、五次的不合作代價是免不了的。

「福爾模斯星兒」- 偽善者/受教者
福爾模斯星兒並不算是一種善良的策略,他會主動的偵測並且主動的找機會去欺壓沒有抵抗力的紅嬰仔,然而若你是有抵抗能力的,他的表現就會一如善良的模仿貓一般,對惡劣的環境也有不錯的抵抗能力,在應對的全面性上,是非常強力的一套策略
或許是封閉條件的關係,在遊戲中紅嬰仔是第一個消失的,這使得星兒失去了後續剝削的來源,而當盤面趨向明顯之後,在善意的環境裡星兒打不過模仿機,在惡劣的環境裡也打不過黑到底,在開放條件下,應該會有較好的表現

「胡亂來」- 能力不足者
總是隨機出牌的胡亂來,代表的是一種能力不足的狀態,沒有能力判斷對方的善意惡意;沒有能力判斷自身該強硬軟弱;沒有能力預見對方對己身行為的解讀…等等的,最後產生的都會是「胡亂來」的策略狀態。

胡亂來對社會和自己都是一個不良狀能,就解決的方式而言提升自己或許是一個長期解,而短期解的話則是降低策略的複雜度。以遊戲中的幾個策略而言,我們大概可以這樣的區分

高策略複雜度 - 需辨認對方行為表現,並企圖辨識對方是否為可欺壓的對象
福爾模斯星兒、少根筋
中策略複雜度 - 僅辨認對方行為表現作為應對
模仿貓、模仿咪
低策略複雜度 - 僅以自身作回應,或有需要辨識對方行為的需求但不高
紅嬰仔、牛文聰 (雖然需要辨認對方是否合作,但以長期策略而言,如果辨識的能的沒那麼強,在第二次或第三次才辨認出惡意對整個策略的影響並不大)
在整個環境的變化中,由高策略複雜度降到中策略複雜度的話,不管哪條路徑環境都是往善意發展,而由中策絡複雜度降至低複雜度則要看最後的結果了。牛文聰雖然是善意的策略,但對環境的結果卻不是那麼美妙。

----------------------------------
牛文聰是所有的善良策略中很麻煩的一個。牛文聰的策略者不具有主動的惡意,但與其合作犯錯的代價會很高,很難組建或融入一個較大的策略聯盟. 而且其本身屬於低複雜度的策略,要求其進行中複雜度的策略執行上可能都有問題了,更別說是高複雜度的東西。所以比較可行的方案是讓其轉向紅嬰仔策略,但牛文聰的策略優勢就是在惡劣的環境中生存,反過來說也就是牛文聰的策略者本身對環境的感受就是惡意的,並且採取警戒的狀態,所以紅嬰仔的策略方式絕不可能被其接受。
也許頻繁的「短期、具體」的小型合作型式會是更有幫助的選擇,短期.具體能幫助各方減少犯錯而被記仇的可能,而頻繁的合作能降低其對社會惡意的判斷,助其策略發生偏移。

沒有留言:

張貼留言