機率 2
則 Y 就是個統計數據,恆非負,因此 Markov 不等式對 Y 適用!也就是說:對 k>0,(其實 k>1 才有聊!)k\cdot A.M.(Y)\} &
但是,照定義,
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img28.gif
而且記 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img29.gif, l>0,則得
l^2\cdot(S.D.(X)^2)\}
但是
l^2\cdot(S.D.(X))^2)\end{displaymath}" src="http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img31.gif" width=237 height=28>
就等於
l \cdot S.D.(X).\end{displaymath}" src="http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img32.gif" width=200 height=28>
因此有(Chebyshev 不等式):
l\cdot S.D.(X)\}
或
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img34.gif
我們在這裏打住,不再講記述統計了,就轉到機率論來! http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif8. 我想先把主題點出來:機率論和記述統計,幾乎完全一樣!只是一虛一實而已。 為了說明這一點,我們想像這種情形。去年我做了完整的紀錄弄成一張張卡片,到了這一年度,我決心做個不負責的老師:若你是個學生,我請你抽一張卡片,就當做你的分數。 這麼一來記述統計就成了機率論了!如果,去年有 4 個人分數不到五十分,那麼,
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img35.gif
現在,你的分數不到五十分的機率就是 0.08,換句話說,「相對頻率」改成「機率」,用符號 P 表示:
P{X<50}=0.08
如果去年有 6 個人不及格,即 f{X<60}=0.12,則現在你不及格的機率是 0.12,即
f{X<60}=0.12
當然,現在的 X 從「統計數據」改成了「隨機變數」,隨著機會(你的運氣)而變的數;另外,「算術平均」A.M.,也改成(數學)期望值 E;如果去年全班平均為 A.M.(X)=74 分,則你(現在)的期望值就是
E(X)=74 .
換句話說,我們有個簡單的小字典來對照這兩種語言:
記敘統計學機率論相對頻率 f機率 P統計數據隨機變數算術平均 A.M.期望值 E.方差 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img36.gif方差 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img36.gif標準差 S.D.標準差 S.D.以下兩國語言大致相同http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif9. 為什麼說記述統計與機率是一實一虛呢?我造了 50 張卡片,當這是記述時,這是很真實的東西(這是我教學的成果),X 代表這 50 張,張張皆實。反過來,你要抽一張,我讓你先看過一遍,有兩張 98、一張 92,……,但,只有你抽到的那張才是真實的,所以,X 只代表那一張。在記述統計,如果 A.M.(X)=84,或者 f{X<60}=0.02(只有一人不及格),顯然我這老師教得不錯;若改成機率,則 E(X)=84,或 P{X<60}=0.02,只是你的機會不錯,期望值很高,或者,不及格的機會只有50分之一。 可是,我們已經強調過了,這機率是虛的。萬一(其實不是「萬一」,而是「五十一」),你抽到那張不及格的卡片,那麼 X<60。(例如 X=50 吧),妳的運氣不好,那麼這些期望值,或機率,都幫不了你的忙!說「我及格的機率高達 98http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img37.gif」,或者我分數之期望值為 84 都喪失意義了。在你抽卡之前有意義,但抽了卡片,X 是多少,就多少,如果 X=50,那麼 P{X<60}=0.02 及 E(X)=84 都是自欺欺人的安慰。 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif10. 那麼機率的意義是什麼?當然機率很大(接近 1)很小(接近 0)有它的意義,我們也承認這可以有不同的見解。不過我認為這和「近似值」的情形一樣,對於每一個具體的情形,自然有它具體的意義。所以,我們不打算花精神來解釋「很可能」跟「很不可能」,把它們當做是不須要解釋的,就跟「近似」之不要解釋一樣。 那麼我們怎麼解釋「一事件之機率為 p」呢?我贊成 Bridgeman 的運作觀 (operationalism),所以我找採大數法則來解釋。 (弱)大數法則:假設一事件 A 發生之機率為 p,假設我們能夠一再地重覆我們的實驗,觀察同樣的現象,每次的佈置都相同(機會相同),而且一次次之間互相沒有關聯,作了 n 次,其中有 k 次發生了這件事件;我們計算發生的相對頻率 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img38.gif,那麼,在 n 趨近無限大時,這相對頻率 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img38.gif 就趨近於 p,(說得客氣一點)「 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img39.gif 不很小」的機會很小! 我們先強調一下:不能重複(獨立)地作實驗的事情,講機率不太有意義! 我再把上述的大數法則推廣一下: 定理: 假設 X1, X2,…,Xn 是隨機變數,互相獨立,而且機率分佈相同,那麼,
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img40.gif
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif11. 我該說明前一敘述只是後一敘述的特殊情形!──規定 A 發生時,X=1,A 不發生時 X=0,那麼 X 是隨機變數,我們可以作出獨立,而且機會的狀態全同的 X1,X2,http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img9.gif,一樣,P(A)=p 就是 E(Xi)=p,故前一敘述是後一敘述之特例。 應用:如果你知道 E(X)=84,較安全的辦法是請老師(我)同意:抽很多次,(雖則我規定抽出來要放回去重新抽)。用它們的平均 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img41.gif 做為你的成績。如此可以保證這個平均會很接近 84。──不接近 84 的機會很少。
通常的大數法則,都再加上些不必要的條件,這些條件雖然不必要,但在初學時,是很有利的〔假設 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img42.gif〕。這證明可在拙著《普通數學》中找到,大意如下: 由於諸 Xi 互相獨立,
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img43.gif
故
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img44.gif
由 Chebyshev 不等式
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img45.gif
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img46.gif
故 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img47.gif
頁:
[1]