什麼是置信區間?
在統計學中,置信區間是指總體參數在一定比例的時間內落在一組值之間的概率。
要點
- 置信區間顯示參數落在平均值附近的一對值之間的概率。
- 置信區間衡量抽樣方法的不確定性或確定性程度。
- 它們通常是使用 95% 或 99% 的置信水平構建的。
瞭解置信區間
置信區間衡量抽樣方法的不確定性或確定性程度。它們可以採用任意數量的概率限制,最常見的是 95% 或 99% 的置信水平。置信區間是使用統計方法(例如t 檢驗)進行的。
統計學家使用置信區間來衡量樣本變量的不確定性。例如,研究人員從同一總體中隨機選擇不同的樣本,並計算每個樣本的置信區間,以瞭解它如何代表總體變量的真實值。得到的數據集都是不同的;某些區間包含真實總體參數,而其他區間則不包含。
置信區間 是一個值範圍,其邊界爲統計平均值的上方和下方,可能包含未知的總體參數。置信水平是指多次抽取隨機樣本時置信區間包含真實總體參數的概率或確定性百分比。或者,用白話來說,“我們 99% 確定(置信水平)大多數樣本(置信區間)包含真實的總體參數。”
關於置信區間的最大誤解是它們代表給定樣本中落在上限和下限之間的數據的百分比。例如,人們可能會錯誤地將上述 70 至 78 英寸的 99% 置信區間解釋爲表明隨機樣本中 99% 的數據落在這些數字之間。這是不正確的,儘管存在單獨的統計分析方法來做出這樣的決定。這樣做需要確定樣本的平均值和標準差,並將這些數字繪製在鐘形曲線上。
置信區間和置信水平相互關聯,但並不完全相同。
計算置信區間
假設一組研究人員正在研究高中籃球運動員的身高。研究人員從人羣中隨機抽取樣本,確定平均身高爲 74 英寸。
74 英寸的平均值是總體平均值的點估計值。點估計本身的用處有限,因爲它不能揭示與估計相關的不確定性;您不太清楚這個 74 英寸樣本的平均值與總體平均值的差距有多大。缺少的是這個單一樣本的不確定性程度。
置信區間比點估計提供更多信息。通過使用樣本的均值和標準差建立 95% 置信區間,並假設鐘形曲線表示的正態分佈,研究人員得出包含 95% 時間真實均值的上限和下限。
假設間隔在 72 英寸和 76 英寸之間。如果研究人員從整個高中籃球運動員羣體中隨機抽取 100 個樣本,那麼其中 95 個樣本的平均值應該在 72 到 76 英寸之間。
如果研究人員想要更大的置信度,他們可以將置信區間擴大到 99%。這樣做總是會產生更廣泛的範圍,因爲它爲更多的樣本均值騰出了空間。如果他們將 99% 置信區間確定爲 70 英寸到 78 英寸之間,則可以預期評估的 100 個樣本中的 99 個包含這些數字之間的平均值。
另一方面,90% 的置信水平意味着我們期望 90% 的區間估計包含總體參數,依此類推。
置信區間揭示了什麼?
置信區間是一個值的範圍,其邊界高於和低於統計平均值,可能包含未知的總體參數。置信水平是指多次抽取隨機樣本時置信區間包含真實總體參數的概率或確定性百分比。
如何使用置信區間?
統計學家使用置信區間來衡量樣本變量的不確定性。例如,研究人員從同一總體中隨機選擇不同的樣本,並計算每個樣本的置信區間,以瞭解它如何代表總體變量的真實值。生成的數據集各不相同,其中某些區間包含真實總體參數,而其他區間則不包含。
關於置信區間的常見誤解是什麼?
關於置信區間的最大誤解是它們代表給定樣本中落在上限和下限之間的數據的百分比。換句話說,假設 99% 置信區間意味着隨機樣本中 99% 的數據落在這些界限之間是不正確的。它實際上意味着可以 99% 確定該範圍包含總體平均值。
什麼是 T 檢驗?
置信區間是使用統計方法(例如 t 檢驗)進行的。 t 檢驗是一種推論統計,用於確定兩組均值之間是否存在顯着差異,這可能與某些特徵有關。計算 t 檢驗需要三個關鍵數據值。它們包括每個數據集平均值之間的差值(稱爲均值差)、每組的標準差以及每組數據值的數量。