機率 1
機率論的一個發源地是記述統計學;明瞭記述統計學的概念,對於機率論的學習,大有助益! http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif1. 假設我擔任一班數學課;共有50位學生,現在考慮某次月考的成績;我們用 xn 代表第 n 號學生的成績。所以就有一堆數據:x1, x2, x3,…,xN,(此地 N=50)。我們用 X 來代表這個統計數據。所以,事實上 X 是映射: http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img2.gif, http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img3.gif,… …;不是集合 {x1,x2,…,xN}; ──例如,這集合的元素個數可以小於 N,而且,若是看成集合,則 「1 號得 70 分,2 號得 81 分」 與 「2 號得 70 分,1 號得 81 分」 並無區別;但是,就學生的立場,這當然有區別,對於老師,區別就不大!倒是有幾個人 81 分,幾個人 70 分,還有點區別! 還有,要記住的一點是:X 的定義域,此地是 1 到 50 之自然數,這不太重要。 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif2. 記述統計學的最初的問題,可以很具體地這樣子來說明。如果校長問我:「他們這次月考考得怎麼樣?」,我該怎麼報告? 對於學生的家長,我要答以他子女的成績就好了;對於校長,一個個學生的成績他卻不會耐煩聽;他要知道最重要卻也最起碼的兩件事:甲、大體如何?乙、是否參差不大?(也許該考慮「能力分班」?……)。 校長不一定滿意於一個籠統的,(定性的)說法,如「大體很好,參差不大」,他要一個更精確的,(定量的)說法;於是,我要給他兩個數字:甲、代表值 1 。乙、參差度 2 。 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif3. 我先強調兩點: 一、通常人只想到甲,那太粗魯了!顯然乙也很重要。 二、統計數據本身才是完整的資料;(古典的)記述統計就是需要 X 這麼完整的資料,而(近代的)統計並不肯花精力得到它。(通常是做不到,太貴了。)無論如何,從 X 變成兩個數值,顯然是資訊 (information) 的大大濃縮(或損失)。對於某些事或某些人(如校長),這剩下的資訊就很夠用了。對某些事,這卻不夠。 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif4. 如何取代表值 α,及參差度 β? 通常採用http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img4.gif
的制度,於是,對於校長的報告,就是「本班本次月考成績為 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img5.gif」。
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img6.gif
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img7.gif
我必須再強調這一點:採用這種「http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img8.gif」制,是最常見的,(甚或是最方便的)制度。但是它一點兒也不是唯一的制度。事實上這情形有一點兒像橋牌的叫牌制度:你可以隨便發明一套,只要說清楚你的制度。 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif5. 在計算和式中,我們當然可以聰明一點,不必 x1 + x2 + x3 + http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img9.gif(慢慢加),而可以採用(Lebesgue 式的想法!)
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img10.gif
括弧中的叫做了 X=x 之頻率 (frequency)。它的意義很明白,遠比它的表達式子容易!事實上我們計算 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img11.gif 的機會更多,因此,把頻率用總頻率 N 去除,叫做相對頻率 (relative frequency),記做 f,則得
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img12.gif
請注意:若 φ 是個 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img13.gif 之函數,用 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img14.gif 代表統計數據
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img15.gif
則 3
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img16.gif
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif6. 我們馬上可以導出一個重要的定理,這定理的內涵太容易了,雖然其表達式反倒較煩。所以我們就用「我們班」的例子來說明: 考試成績,當然在 0 與 100 之間: http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img17.gif;(此地上限 100 不重要)。今設平均為 23 分,則全班 50 人中,分數超過 46 分的,一定不到一半(25 人),全班分數超過 69 分的,一定不到 16.66… 人〔故意這麼寫,人數不能有小數!〕,分數超過 92 分的,不到 12.5人……。 這就是著名的(而且也幾乎無聊的,trivial)Markov 不等式。
定理:若一切 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img18.gif,[單書作 X http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img19.gif 0],http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img20.gif,k>1,則
k\mu\}
當然也有
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img22.gif
我想證明就可以省了;由「我們班」的例子就很明白了! 倒是必須註解一下: 1 定理中,k>1 可以改為 k>0,因為 0$" align=middle src="http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img23.gif" width=71 height=29> 時,這不等式就「無聊地成立!」(trivially true) 2 若不是利用相對頻率 f 之概念,則定理的數學表達式就麻煩了,要寫成
k\mu\}\mbox{ {\fontfamily{cwM1}\fontseries{m}\... ...ily{cwM1}\fontseries{m}\selectfont \char 98} }}{N}
這不但煩(繁),而且意思反倒不清楚!
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img1.gif7. 在上一定理中當然我們必須假定 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img25.gif,(即 http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img18.gif,一切 i)。你該造個例子說明「在 X<0 時,敘述(可以)為誤」,不過,不論 X 為何,令
http://episte.math.ntu.edu.tw/articles/mm/mm_02_3_11/img26.gif
頁:
[1]