2024年11月8日 星期五

正負偏態分配


正負偏態分配
在統計學中,偏態(Skewness)是描述數據分布形狀的不對稱性。偏態可以是正的、負的或者接近零,這取決於數據分布的形狀。

一.三種常見的集中趨勢(Central Tendency)度量
1.平均數(Mean): 是最常用的集中趨勢度量,它將所有的數值進行平均,給出了數據集的“平均”水平。但它的缺點是對極端值非常敏感,一個非常大或非常小的數值可以顯著改變平均數。
2.中位數(Median): 是將數據集從小到大排列後位於正中間的值(或者中間兩個值的平均)。中位數不像平均數那樣容易受到極端值的影響,因此當數據集包含異常值時,它是一個更好的選擇。
3.眾數(Mode): 是數據集中出現次數最多的值。當數據是非數字的分類數據時,眾數特別有用,因為在這種情況下,平均數和中位數可能沒有意義或無法計算。此外,眾數也是對多峰分布(即一個數據集中有多個高頻出現的值)的描述。
4.在一個正態分佈(也稱為高斯分佈)中,平均數、中位數和眾數會有相同的值,因為正態分佈是對稱的。但在正偏態或負偏態的分布中,這三個值通常會有所不同。
 (1)在正偏態分布中,通常是眾數〈中位數〈平均數;
 (2)而在負偏態分布中,則是平均數〈中位數〈眾數。

二.皮爾森(Pearson)的偏態度量方法
1.它提供了一種估算正偏態或負偏態分布中眾數位置的方法。這個規則通常被稱為皮爾森的第一偏態係數(Pearson's first coefficient of skewness),它假設在某些情況下,眾數(Mo)、中位數(Md)、和平均數(M)之間存在一定的關係。根據這個方法,對於一個偏態分佈,眾數大約位於中位數和平均數之間的三等分點上。
Mo≈Md−(Md−M)×3/2
2.這是一個估計或近似值,因為真實的眾數位置可能會因為分佈的特定形狀而有所不同。這個規則在實際中是一個近似和通常情況下的經驗法則,對於計算上的方便有一定的應用價值,但它不一定適用於所有類型的偏態分佈。

三.正偏態(Right-skewed distribution):
1.也稱為右偏態或右偏分布,意味著數據的尾部延伸到更高的值方向。在這種分布中,數據的中位數和眾數通常會低於平均值(均值),大部分的數據值分布在平均值的左側。
2.大多數情況下,數據聚集在較低的數值範圍,但有少數值非常高,從而導致整個分布向右偏斜。這種分布的特徵是大部分的數據點位於均值的左側,但是有一個長尾在均值的右側。
3.樂透頭獎:絕大多數人未中獎或只中了小獎,而極少數人中了巨額的頭獎,因此數據分布呈現正偏態。
4.大學學力測驗:多數學生的分數可能集中在一個相對較低的範圍,但是有少數學生可能會取得非常高的分數,導致分布呈現正偏態。

四.負偏態(Left-skewed distribution):
1.在負偏態分布中,也稱為左偏態或左偏分布,大多數數據值都集中在較高的值區域,而較低的值則較少見。這會導致分布的尾部朝向較低的值延伸,從而使得平均數小於中位數,中位數又小於眾數。
2.負偏態分佈在現實生活中可能不如正偏態分佈常見,因為許多自然和社會現象如收入、城市人口等往往由於存在極端的高值而呈現正偏態。然而,在特定情境下,尤其是在性能或質量控制極為嚴格的情況下,負偏態分佈仍然是可能的。
3.試題偏易、高分群多:假如一份考試的試題非常簡單,導致大多數學生都獲得了高分,只有少數學生獲得了較低的分數,那麼這種分數的分佈就會是負偏態。

以上是對 正負偏態分配的重點整理
記得分享、訂閱、小鈴噹。就不會錯過更多的精彩內容。

關鍵字:
By 國考小幫手Youtube頻道


影片內容
正負偏態分配
在統計學的領域中,偏態(Skewness)是描述數據分布形狀的重要概念,主要用來衡量數據分布的對稱性或不對稱性。偏態可以分為正偏態、負偏態以及接近零的情況。理解偏態有助於我們進一步分析數據的性質,從而做出更精確的推斷和決策。

一、三種常見的集中趨勢度量
在討論偏態之前,我們首先需要了解集中趨勢(Central Tendency)的三種常見度量方式:平均數、中位數和眾數。這些度量方式能幫助我們理解數據的整體趨勢,但它們在偏態分布中的表現會有所不同。
1.平均數(Mean):平均數是所有數值的算術平均值。它是一個普遍使用的指標,但對於包含極端值的數據集,平均數可能失去代表性。例如,幾個極端高或低的數值可能會使平均數偏離大多數數據的中心位置。
2.中位數(Median):中位數是將數據集排序後位於中間的數值。中位數的特點是對極端值不敏感,這使它在包含異常值或極端值的數據集中表現更加穩定。
3.眾數(Mode):眾數是數據集中出現頻率最高的數值。當處理分類數據時,眾數尤其有用。眾數還能反映多峰分布的特性,這在某些情況下能提供額外的見解。

在正態分布(也稱為高斯分布)中,數據的平均數、中位數和眾數通常是一致的,因為正態分布具有對稱性。然而,在偏態分布中,這三者會呈現明顯差異。具體來說:
1.在正偏態分布中,通常是眾數 < 中位數 < 平均數。
2.在負偏態分布中,則是平均數 < 中位數 < 眾數。

二、皮爾森(Pearson)的偏態度量方法
皮爾森的偏態度量方法為我們提供了一種估算正偏態或負偏態分布中眾數位置的方式,這對於理解數據的偏態特徵非常有幫助。

1.皮爾森的第一偏態係數:這個方法假設眾數(Mo)、中位數(Md)和平均數(M)之間存在一定的數學關係。具體公式如下:
Mo≈Md−(Md−M)×3/2
這個公式可以估算偏態分布中眾數的位置,提供了計算偏態時的一種近似方法。然而,由於數據分布的多樣性,這一公式並不總是適用,僅在特定情況下有效。

2.估算的局限性:雖然皮爾森的公式提供了計算上的便利,但它只是一個經驗法則。由於真實數據的複雜性,這種估算有時可能與實際偏態分布中的眾數有所差異。因此,我們在應用此方法時應謹慎,並結合具體情境進行分析。

三、正偏態(Right-skewed distribution)
正偏態分布,也稱為右偏態分布,是統計分析中常見的一種不對稱分布形式。在這種分布中,數據的長尾位於數據的右側,數據的眾數和中位數會低於平均數。

1.正偏態的特徵:大多數數據值集中在較低的數值範圍,少數非常大的數值導致分布的右側出現長尾。例如,樂透獎金分布便是一個典型的正偏態分布:絕大多數參與者未中獎或僅中得小額獎金,只有極少數人能贏得頭獎。

2.應用案例:另一個例子是大學學力測驗。大多數學生的分數集中在一個相對較低的範圍,但少數學生取得了非常高的分數,導致分布呈現右偏態。這種分布現象可以幫助教育工作者理解學生群體中的學習差異,從而進一步調整教學策略。

四、負偏態(Left-skewed distribution)
負偏態分布與正偏態相反,其長尾位於分布的左側。這意味著大多數數據值集中在較高的數值範圍,而少數較低的數值導致分布出現左偏態。

1.負偏態的特徵:在負偏態分布中,平均數小於中位數,中位數又小於眾數。這種情況較為少見,但在特定領域中仍然存在。例如,在某些非常簡單的考試中,大多數學生可能獲得較高的分數,而少數學生獲得較低的分數,這導致分布呈現負偏態。

2.應用案例:當一份考試過於簡單時,幾乎所有學生都能取得高分,僅有極少數學生因各種原因未能達到平均水準,這樣的成績分布會顯示出負偏態。這在教育測量中能夠幫助識別試題難度是否適中,從而進行改進。

標籤:

0 個意見:

張貼留言

訂閱 張貼留言 [Atom]

<< 首頁