Hello~歡迎大家來到3分鐘統計小學堂,
記得上次和大家分享Z分數與T分數,不知道大家還有沒有印象呢?
現在要和大家聊聊常態分配
一、常態分配的定義
在有母數的統計世界裡,常態分配是一個基本的假設,所以不論Z檢定、T檢定、甚至F檢定,
都是以常態分配為基礎,那麼它為何如此重要呢?
其實常態分配是一種自然法則的應用,簡單來說就是『群體的差異大概落在某個範圍』
就拿班級上的學生身高當作例子,假設班上身高平均數是140公分,那麼我們會猜測班上所有人的身高大概落在140附近,
但是這樣說太武斷,所以我們會猜個範圍大概就是:140正負20公分吧!
如果你真的把班上學生的身高畫成長條圖,你會發現"大概"長這樣(這個班人很多喔!):
如果將各點連起來變成折線圖,你會看到一個類似鐘形的曲線:
瞧,是不是有點像一座大鐘呢?
由此可知常態分配的曲線像一座鐘,也被稱作為『鐘型曲線』,由曲線圖可以發現大多數人的身高集中在平均數附近,
越往兩邊走人數越少。這樣的道理其實在生活上很多例子,舉凡薪資收入、會考成績...等,都會有這樣的集中趨勢。
二、常態分配的基本假設
常態分配實際上是由二項分配經過無數次抽樣而得出的結果,有點像是你擲一枚硬幣,擲了無數次,將正面次數記錄下來,
你會發現正面次數大多集中在投擲次數的一半附近(也就是50%的機率)。
當然,因為是統計學,因此理論上樣本數的大小,對於常態分配的形狀來說是非常重要的,
根據中央極限定理要符合常態分配的假設,樣本數至少要大於30,如果抽樣的樣本數太少,曲線容易造成誤差。
三、常態分配的面積比例
假設抽樣的樣本數大於30,理論上次數分配應該會接近常態分配,由於先前提到常態分配的曲線像一座鐘,
基本上這樣的外型是固定的,既然外型固定我們就可以推論這曲線內部面積所佔的比例。
回到一開始舉的例子,要猜測班上所有人的身高範圍,我們會猜平均數正負20公分內,但是這20公分是誰規定的?
實際上這是一個籠統的說法,畢竟統計學是科學,我們通常會用『平均數±幾個標準差』來代表一個範圍,看看下圖:
中間的 x̅ 代表的就是平均數,而σ是標準差,也就是說:
- 平均數正負一個標準差的範圍內,包含了68%的比例
- 平均數正負二個標準差的範圍內,包含了95%的比例
- 平均數正負三個標準差的範圍內,包含了99.7%的比例(幾乎是全部了)
這樣的比例分配應用在生活中很多地方,在教育界最常應用的便是資優鑑定,根據國內身心障礙及資賦優異學生鑑定辦法
第十五條 一般智能資賦優異,指在記憶、理解、分析、綜合、推理及評鑑等方面,較同年齡者具有卓越潛能或傑出表現者。
一、個別智力測驗評量結果在平均數正二個標準差或百分等級九十七以上
按照這個標準資賦優異學生就是在常態分配的極右邊了,而 x̅ +2σ 的標準大概PR值是多少?(贏過多少比例的人)
我們可以這樣算:
先把2個標準差所占的95%比例除以2,以平均數為界分為左右兩半,每個半邊是47.5%,
由於PR值是指贏過的人,實際上平均數以下(左邊全部)都是我們贏過的人,占了50%,
將50%(平均以下贏的)加上47.5%(平均以上贏的)會等於97.5%,也就是資賦優異學生的PR值應為97.5。
恰巧跟法規所規定的97相差無幾。
參考資料: 國家教育研究院雙語詞彙、學術名詞暨辭書資訊網
https://terms.naer.edu.tw/detail/1318729/
留言列表