猴子敲打出莎士比亞全集
蔡聰明莎士比亞全集是人類天才智慧的至高創造,然而今人驚奇的是機率論可以證明:一隻猴子在打字機前任意地且不斷地敲打下去,殆確(almost sure,即機率為 1)可以得到莎士比亞全集。下面我們就來介紹這個奇妙的結果。 首先將莎士比亞全集翻譯成摩斯電碼(Morse code,例如 ‥·––– ‥·表示 SOS),得到由點與線段所組成的一長串符號,長度雖然很長,但終歸是有限。 其次,猴子的打字也翻譯成摩斯電碼:敲打出一個點或一個線段的機率各為http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img1.gif。猴子不斷地敲打下去就可以得到一個無窮序列之摩斯電碼。 接著我們考慮一個銅板,其有正面 (head) H 或反面 (tail) T。將此銅板獨立地且不斷地丟下去,就得到一個銅板序列(又叫做樣本點)
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img2.gif
所有可能的銅板序列全體就組成樣本空間 (Sample space):
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img3.gif
現在將 H 與 T 分別對應線「-」與點「.」,於是一個銅板序列就對應一個摩斯電碼序列,反之亦然。從而猴子打字就相當於丟一個公正銅板 (a fail coin)。因此,我們的問題就轉化成:不止息地丟一個公正銅板,可以得到莎士比亞全集的機率是多少? 機率論所要研究的對象是涉及說不準 (uncertainty) 的隨機現象。在思考上,我們必須分辨現實 (realization) 與可能 (possibilities)。作個隨機實驗,得到一個現實 ω(又叫樣本點),相應就有所有可能結果所形成的樣本空間 Ω,現實 ω 只是樣本空間 Ω 的一個元素。機率論就是要相對於一個樣本空間 Ω,衡量其中一個事件 (event) http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img4.gif 的機率大小。這必須對一個隨機實驗建立機率空間 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img5.gif,其中 F 為事件全體,P 為一個機率測度。在這個架構之下,對 A http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img6.gif F 求算機率 P(A)。 對於「無窮多次丟銅板」這個複雜的隨機實驗,根據測度論 (measure theory),我們可以適當地為其建立一個機率空間 (http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img7.gif)。我們要問:一串符號模式 (pattern),例如「HTTH」或「莎士比亞全集」,在銅板序列中發生的機率是多少? 首先我們考慮「H」模式的特例。不斷地丟一個公正銅板,直觀經驗告訴我們,幾乎可以確定 H 會不時地出現。 為了闡明這個直觀結果,我們先作一般的準備。設 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img8.gif 為一列事件,令它們不時地發生之事件為 B,那麼 B 的結構是什麼呢?
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img9.gif
所以
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img10.gif
通常我們簡記, http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img11.gif 為 (An, i.o.) 這表示 An 不時地發生的事件,i.o.是“infinitely often”之縮寫。 另一方面,事件 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img11.gif 代表什麼意思呢?
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img12.gif
因此, http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img13.gif 表示,除了有限多個指標之外,對其餘的指標 n 皆有 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img14.gif (for all but finitely many n)。換言之, http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img11.gif 表示 An 終究 (eventually) 要發生的事件。 由集合運算的 De Morgan 法則知道
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img15.gif
並且顯然有
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img16.gif
模仿數列的上極限 (upper limit) 與下極限 (lower limit) 的定義,我們也有如下的極限概念。 定義: 當 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img17.gif 時,這個共同集合 A,叫做 (An) 的極限,記為 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img18.gif 由機率的演算規則,我們可以證得下面兩個定理。 定理1:(機率測度P的連續性) 若 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img18.gif,則 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img19.gif、
定理2: (i)Boole不等式:
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img20.gif
(ii)次可列加性(countable subadditivity):
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img21.gif
事件 (An i.o.) 的機率是多少?由定理1與定理2知
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img22.gif
所以,如果 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img23.gif(收斂),則 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img24.gif,於是
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img25.gif
但是,如果 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img26.gif(發散),由(1)式我們對於 P(An i.o.) 得不到什麼結論。然而。若再加上 (An) 為一列獨立事件,那麼由不等式
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img27.gif
就得到
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img28.gif
從而
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img29.gif
當 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img30.gif,上式最後一項趨近於 0,因此,對任意 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img31.gif,恆有 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img32.gif,於是
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img33.gif
由此可得
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img34.gif
定理3 (Borel-Cantelli 補題) 假設 (An) 為機率空間 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img5.gif 中的一列事件,那麼我們有 (i) 若 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img35.gif,則 P(An i.o.)=0 (ii) 若 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img36.gif 且 (An) 是獨立的,則 P(An,i.o.)=1
註:(i)與(ii)分別叫做第一與第二 Borel-Cantelli 補題。 定理4 (Borel 0-1 律或 Borel 兩條路定理) 假設 (An) 為機率空間 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img5.gif 中的一列獨立事件,那麼 P(An i.o.)=0 或 1,端視 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img37.gif 為收斂或發散。 現在回到先前的問題:在銅板序列中,模式「H」不時地出現之機率是多少?令 Hn 表示第 n 次丟銅板,出現正 (H) 之事件,那麼 (Hn) 是獨立的,並且 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img38.gif。於是
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img39.gif
由定理3的(ii)知,P(Hn i.o.)=1,即不時地出現正面的機率為 1。 進一步我們問;有限模式「HTTH」不時地出現之機率是多少? 今 En 表示「HTTH」的模式在丟第 n 次銅板時開始出現之事件,亦即
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img40.gif
於是
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img41.gif
從而 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img42.gif,不巧的是,(En) 不互相獨立,所以我們不能使用第二 Borel-Cantelli補題。還好,事件 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img43.gif 是獨立的, 並且 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img44.gif,故由第二 Borel-Cantelli 補題知 P(E4k+1 ,i.o.) = 1,今因 http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img45.gif,所以
http://episte.math.ntu.edu.tw/articles/sm/sm_29_12_1/img46.gif
立即得到
P(En i.o.)=1
換言之,模式「HTTH」不時地出現之機率是 1。 同理可證,任何由 H 與 T 所組成的有限長度之模式,在銅板序列中不時地出現之機率也是 1。因此,我們就證明了下面的驚人結論: 定理3: 猴子不時地敲打出莎士比亞全集的機率為 1。 豈止是敲打出而已,是不時地敲打出且機率為 1,這個結果跟直觀常識似乎是矛盾的,故被稱之為 Borel 詭論 (Borel paradox)。什麼是天才的創造?機運或偶然?堅持或努力? 從另一個角度來看,這也反映出如果生命「無窮」並且「永不止息」地工作下去,會產生石破天驚的成果,沒有什麼事是辦不到的。愚公移山是另一個例子。 莊子說:「吾生也有涯,而知也無涯。以有涯逐無涯,殆矣!」然而,數學或人間許多浪漫情事,恰好就是「以有涯逐無涯」所完成的。
頁:
[1]