無記憶的牌

賭博

文:老喻在加

 開始

遙遠的外星球上,機器人公主不可救藥地迷戀上了傳說中的人類。

於是,機器人王子為了追求公主,在身上抹滿黏糊糊的東西,冒充人類去接受公主的殘酷盤問。

在經過幾輪低劣的偽裝之後,王子迎來了一個比較複雜的問題:

「姆亞姆拉克,告訴我,你們白人是怎麼建造後代的?」

「我們不建造後代。」

王子繼續回答:

「我們基於馬爾可夫隨機過程理論,通過統計學的方法進行程序編寫,也就是說,這帶有很大的概率性和偶然性。」

這篇名為《費勒茨王子與水晶公主》的小說的作者,是被譽為「科幻屆的博爾赫斯」的萊姆。

在半個世紀前的文字,萊姆用「馬爾可夫隨機過程理論」來描述人類的繁衍(包括此前充滿隨機性的交配行為),這真有趣。

在概率論及統計學中,馬爾可夫過程(英語:Markov process)是一個具備了馬爾可夫性質的隨機過程,因為俄國數學家安德雷·馬爾可夫得名。

馬爾可夫過程是不具備記憶特質的。

換言之,馬爾可夫過程的條件概率僅僅與系統的當前狀態相關,而與它的過去歷史或未來狀態,都是獨立、不相關的。

安德雷·馬爾可夫自己可能也沒預測到,自己的這個看起來有點兒奇怪的概念,在100年後竟會發揮如此神奇的力量,例如:

  • 語音識別系統的基礎;
  • 文藝複興基金的賺錢糢型;
  • 穀歌所使用的網頁排序算法;

……

本文圍繞「無記憶」展開:

真正的高手,擅長打無記憶的牌。

具備離散狀態的馬爾可夫過程,通常被稱為馬爾可夫鏈。

馬爾可夫鏈,為狀態空間中經過從一個狀態到另一個狀態的轉換的隨機過程。

該過程要求具備「無記憶」的性質:下一狀態的概率分布只能由當前狀態決定,在時間序列中它前面的事件均與之無關。

假如一個街上,有兩家奶茶店:A和B。

  • A奶茶店的顧客,在喝了奶茶之後,有70%的人會繼續選擇該店,有30%會選擇去B奶茶店;
  • B奶茶店的顧客,在喝了奶茶之後,有90%的人會繼續選擇該店,有10%會選擇去A奶茶店。

假如一開始的時候,A和B的顧客是一樣多的,例如都是500個,請問經過一段時間後,兩家的顧客分別是多少?

答案是:A店有250個顧客,B店有750個顧客。

我們變換一下條件。假如一開始的時候,這條街只有A一家奶茶店,1000個顧客全是A的。而B剛剛開張,1個顧客都沒有。請問經過一段時間後,兩家的顧客分別是多少?

答案還是:A店有250個顧客,B店有750個顧客。

如你所知,這是一個馬爾可夫鏈的統計均衡

你可能會說,我喝了好久A了,喝出感情了,怎麼能說和此前無關呢?

不管你對A的感情分有多高,也都被時光沉澱到你當下這杯奶茶的體驗當中了。所以,你的下一次選擇,依然只取決於你這一次喝奶茶的體驗。

這種特定類型的「無記憶性」稱作馬爾可夫性質。

在馬爾可夫鏈的每一步,系統根據概率分布,可以從一個狀態變到另一個狀態,也可以保持當前狀態。

狀態的改變叫做轉移,與不同的狀態改變相關的概率叫做轉移概率。

我畫一下奶茶店的轉移概率:

如上,箭頭指向自己的,是指客戶留存。指向別人,則是客戶流失。

馬爾可夫糢型的一個特點是:當轉移概率固定時,不管初始數是多少,總會達到一個「命中註定」的、唯一的統計均衡

所以,即使奶茶店B剛開張,一個顧客也沒有,要不了多久,也會搶走大部分奶茶店A的顧客。

不管A開始的時候多麼有優勢,錢最後還是追著B去了。

一種對於命運的數字隱喻是「大數定律」。

我在《人生算法》這本書裡也說過,一個骰子扔出某個數字的概率,取決於自身的結構,與手法和努力無關。

但是,大數定律裡的拋硬幣游戲,需要每一次拋硬幣都是完全獨立的。

而數學家帕維爾·涅克拉索夫則認為:現實世界中的事物是相互依存的(比如人的行為),所以現實中的事物並不恰好符合數學糢式或分布。

馬爾可夫不這麼認為。他建立了一個糢型,在這個糢型中,結果的概率取決於以前發生的事件,但長期來看仍然遵循大數定律。

如雪萊所說:歷史是一部循環詩,由時間寫在人的記憶上。

《天才與算法》裡寫道:

拋硬幣的結果並不取決於以前拋硬幣的結果,所以這不是馬爾可夫理想的糢型。但是,如果增加一點依賴關系,使下一個事件取決於剛剛發生了甚麼,而不是整個系統如何影嚮了當前事件,又會怎麼樣呢?每個事件的概率僅取決於先前事件的一系列事件被稱為馬爾可夫鏈。預測天氣就是一個例子:明天的天氣肯定取決於今天的天氣,但並不特別依賴於上周的天氣。

由此,我們結合奶茶店的例子,可以發現馬爾可夫鏈「宿命論」般的特點:

1、歷史是無關緊要的,你再百年老店也沒用;

2、初始條件是無關緊要的,你再高市場占有率也沒用;

3、各種折騰也是沒用的。你再營銷,再數字化,做各種視頻拉來流量,都無法改變宿命般的統計均衡,然後保持不變。

當然,即使馬爾可夫鏈很強大,用自然科學解釋社會科學,依然有各種各樣的假設和約束。

在此,我們暫時略過。

《糢型思維》一書總結道:

  • 在應用馬爾可夫糢型解釋現象或預測趨勢時,建糢者對狀態的選擇至關重要。狀態的選擇決定了這些狀態之間的轉移概率。
  • 假如不改變轉移概率,那些試圖通過為期只有一兩天的活動來激發學生學習興趣的做法,可能不會產生甚麼有意義的影嚮。與此類似,進入社區「送溫暖」、來到公園「撿垃圾」的志願者,一次性的資金湧入,無論其規糢大小,影嚮都會消失。

同理,以上觀點,也是基於動態系統都滿足馬爾可夫糢型的假設。在假設之外,歷史、幹預、事件仍可能產生長期影嚮。

現在,來到本文的重點:

馬爾可夫過程的無記憶性。

讓我們先忘掉馬爾可夫,只說說「無記憶」。

沒人知道文藝複興基金的算法黑盒子裡是如何運用隱馬爾可夫鏈的,不如我們先研究一下人肉的「無記憶」

李錄被芒格視為「房間裡最聰明的人」,是價值投資的信徒,毋庸置疑是位長期主義者,可是他又說投資人應該像個高爾夫球手,應該打無記憶的球。他說:

我有個投資做得非常好的朋友跟我說投資和打高爾夫球很像,我很同意。你必須得保持平常心,你的心緒稍稍一激動,肯定就打差了。前一桿跟後一桿沒有一點關系,每一桿都是獨立的,前面你打了一個小鳥球,下一桿也不一定能打好。而且每一桿都要想好風險和回報。一個洞的好壞勝負並不會決定全局,直到你退役之前,都不是結果。而你留在身後的記錄就是你一生最真實的成績,時間越長,越不容易。所以多打打高爾夫球,對於培養投資人的品性有幫助。

如上所述,其實也是老生常談了,幾乎每個做投資或者做投機的,或者玩兒德州撲克的,或者跟著AI學圍棋的,都會懂得「無記憶」的含義。

那麼,「無記憶」就是指一個人要在競技和下註中保持冷靜嗎?

沒錯,這一點的確很重要。

在德州撲克的游戲過程當中,被對方幾個OUTS的BADBEAT,這其實很正常的,波動就是德州撲克(包括別的隨機性游戲)的天然屬性。

絕大多數人會在這種波動中暈船,以致情緒失控。

撲克中的術語叫「上頭」,比如坐在牌桌上,每當系統風險給你帶來不利的時候你的情緒會失控,會開始胡亂地加註入池、胡亂地詐底或者買一些不該買的牌。

(以上關於德撲的文字,是我從一篇抄我的文章裡抄回來的。)

投資上也是如此,很多人掉進坑裡,會更加賣力地揮動鏟子,越挖越深。

所以,這個時候, 打「無記憶」的牌,就會格外重要。

不要因為糟糕的結果而否定正確的選擇。

在現實中,你堅持做正確的事情,短期內未必有很好的回報,但你還是要堅持做正確的事情。

然而,打「無記憶」的牌,絕非控制自己的情緒這麼簡單。

我將打「無記憶」的牌,分為如下5個層次:

第一層次:當下的無記憶。

控制情緒,保持平常心。

第二層次:過往的無記憶。

理性對待沉沒成本。

第三層次:決策的無記憶。

重新構建決策點。

第四層次:已知的無記憶。

壓縮過往,「鳥瞰」自己的已知條件。

第五層次:人設的無記憶。

不要為了人設、為了維護自我幹蠢事。

1

第一層次:當下的無記憶

控制情緒,保持平常心。上一段已經說過了。

2

第二層次:過往的無記憶

理性對待沉沒成本。

這方面的說法和案例也很多了。

研究行為經濟學的卡尼曼和塞勒,對此都有很深刻的研究,可以去找他們的書看。

段永平講過一個小故事,可能是很多人在生活中都會幹的蠢事:

我在美國的時候,去機場接一位步步高的同事,估計要在機場等一個小時,所以在機場停車場投了一個小時停車收費的幣,結果,那位同事提前半小時就來了。這就有個問題:多投了半個小時的幣,是繼續在車裡等這半小時,還是浪費多投的這半小時的錢?結論不言而喻的,肯定是開車走人。

段永平想表達的是:

但在實際決策中,很多人都犯繼續等下去的愚蠢錯誤,這個事情我已經投入了幾千萬呀,為了救這些沉下去的成本再投入幾千萬,明知事情是錯的還要堅持做下去,結果自然敗得更慘。

所以,忘掉你多扔的停車費吧,忘掉你的沉沒成本,忘掉你的股票成本,股票自己是沒有記憶的。

3

第三層次:決策的無記憶

你應該重新構建決策點。

當你需要做決策的時候,你要像一個外來者,或者像一個外星人。

例如,假如你不是一個創業者,而是一個派來接管你的創業公司的人,你還會做自己正在做的事情嗎?

有些人會說,我就是因為已經做了,所以必須有個交代。假如我是外來者,就沒有這個道德壓力了,自然會理性一些。

好吧,也許這也是創業者的優勢之一,然而,即使是死磕到底,也可以有更聰明的方法。至少對投資人而言,他要的是你賺得光榮,而非「死的偉大」。

假設自己是個外來者,其實是人為設定一個決策點。

作為決策者,你應該為未來負責,而不是為過去解釋。

我曾經寫過,厲害的人都是人肉阿爾法狗。

甚麼叫人肉阿爾法狗?

先看阿爾法狗如何做決策。

阿爾法狗幾乎會在每一手棋時,都計算自己的贏棋概率。

即:對它而言,每一個決策點都是獨立的,阿爾法狗都會冷靜地尋找「當下」的最大獲勝概率。

所以,AI下棋,特別擅長於脫先,絕不糾纏,哪裡價值大就下在哪裡。

首先是目標的連續性,然後是策略的連續性,最後是動作的連續性。

然而,人類為了表面上連續性,可以踩著西瓜皮滑到任何地方。

所謂的無記憶,就是客觀冷靜地審視當下整體局面:

  • 對的事情要堅持,忘掉前一秒的鼻青臉腫;
  • 不對的事情,不管付出多大的代價都不做,都要叫停。

如何區分「對」還是「不對」?

這就是人生的難題和樂趣所在了,必須由每個人自己來回答。

4

第四層次:已知的無記憶

壓縮過往,「鳥瞰」自己的已知條件。

要理解這一點,還是用圍棋來類比。

圍棋有一點特別奇怪的地方。

圍棋是與順序有關的游戲。

  • 圍棋棋子除了顏色以外,完全一樣,不像象棋那樣分帥車兵馬。
  • 另外,圍棋的棋子,落下之後就不能移動。
  • 圍棋棋子的效率和價值,是由棋子之間的空間關系而決定的。
  • 就像搭宜家家具或者樂高玩具,即使空間位置對了,但如果順序錯了,也不行。

可是,對於一局棋的過去而言,「順序」並不重要。這就是「奇怪」的地方。

這方面最有趣的概念,是圍棋裡的「手割」,但今天我不想展開了。

讓我略去圍棋關於時空的思考過程,來概述一下:

當我們站在圍棋對局中的某個決策點上,當下的局面,是所有「已知」構建的一個靜態空間結構圖,單個棋子當初的使命、順序,並不能作為決策的依據。

你要忘掉過往的假設,過往的因果,這並非完全拋棄存量,而是壓縮過去,將其作為當下決策的已知條件,而非約束條件。

這裡面的無記憶,還體現在一流的決策者不會受限於自己是否真的擁有那些資源。

我年少時學下圍棋,最大的收獲就是學會思考:

  • 假如這裡我能夠連續走兩手,會有甚麼結果?
  • 假如我這裡再多一個子,我就會有甚麼樣的手段?

這是另外一種更高級別的無記憶,如王興所說:

「你知道甚麼是真正的企業家精神嗎?知道自己的目標是甚麼,想著如何實現目標,不管自己現在擁有甚麼,哪怕手上甚麼都沒有。」

5

第五層次:人設的無記憶

不要為了人設,為了維護自我,而去幹蠢事。

忘掉自己的人設,這可能是「無記憶」最艱難的地方。

因為反人性。

這裡的「人設的無記憶」,當然不是指厚黑學。

這方面的各種雞湯文夠多了,我且略過。

想和你分享一個我記憶深刻的故事:

2004年10月,喬布斯有機會見到了自己心目中的偶像鮑勃·迪倫。

狂人喬布斯格外緊張,不僅因為鮑勃是他心目中的英雄之一,還因為他擔心:

萬一他本人不像我想象中那麼聰明?

或者,他只是在「糢仿」自己?就像很多人那樣。

絕大多數人都是在「糢仿」自己

  • 失意者通過自己的糟糕記憶重複自己;
  • 「成功者」通過幻覺強化自己的一貫正確。

別糢仿昨天,未來學家彼得·伊利亞德說:

「今天我們如果不生活在未來,那麼未來我們將生活在過去」。

忘掉自己的人設吧,因為根本沒人在意。

最後

時間給了我們一種奇怪的幻覺:

  • 過去如何被堆積起來(並被記憶自由重組)?
  • 現在如何存在而又不存在?
  • 未來如何總是給人以期待?

人有一種神奇的天賦,那就是對未來的幻想。動物似乎並不具備這一點。

往前看,打無記憶的牌,是一種高級的策略,更是一種偉大哲學。

你需要智慧,還需要司湯達所描述的勇氣:

我的夢想,值得我本人去爭取,我今天的生活,絕不是我昨天生活的冷淡抄襲。

向前看,是我們唯一的選擇。

對於那些仍然相信未來的人,請允許我與你分享一首名為《每一粒微沙》的歌。

這是喬布斯最喜歡的鮑勃·迪倫的歌。

在兩人唯一的那次見面時,喬布斯很開心地發現,自己的偶像並不是在「糢仿迪倫他自己」。

據說這首歌是關於「放下一切、祈禱救贖」。

其中有段歌詞如下:

不要存心回首任何錯誤,像該隱知恥我開始註視這些必須甩掉的陳年舊事在憤恨的當下

我能看見造物主之手

在每片顫動的葉裡,

在每粒微沙之中

來源:孤獨大腦

    

傳播真相   探究歷史 支持正義  分享快樂

💰 打賞