什么是置信区间?
在统计学中,置信区间是指总体参数在一定比例的时间内落在一组值之间的概率。
要点
- 置信区间显示参数落在平均值附近的一对值之间的概率。
- 置信区间衡量抽样方法的不确定性或确定性程度。
- 它们通常是使用 95% 或 99% 的置信水平构建的。
了解置信区间
置信区间衡量抽样方法的不确定性或确定性程度。它们可以采用任意数量的概率限制,最常见的是 95% 或 99% 的置信水平。置信区间是使用统计方法(例如t 检验)进行的。
统计学家使用置信区间来衡量样本变量的不确定性。例如,研究人员从同一总体中随机选择不同的样本,并计算每个样本的置信区间,以了解它如何代表总体变量的真实值。得到的数据集都是不同的;某些区间包含真实总体参数,而其他区间则不包含。
置信区间 是一个值范围,其边界为统计平均值的上方和下方,可能包含未知的总体参数。置信水平是指多次抽取随机样本时置信区间包含真实总体参数的概率或确定性百分比。或者,用白话来说,“我们 99% 确定(置信水平)大多数样本(置信区间)包含真实的总体参数。”
关于置信区间的最大误解是它们代表给定样本中落在上限和下限之间的数据的百分比。例如,人们可能会错误地将上述 70 至 78 英寸的 99% 置信区间解释为表明随机样本中 99% 的数据落在这些数字之间。这是不正确的,尽管存在单独的统计分析方法来做出这样的决定。这样做需要确定样本的平均值和标准差,并将这些数字绘制在钟形曲线上。
置信区间和置信水平相互关联,但并不完全相同。
计算置信区间
假设一组研究人员正在研究高中篮球运动员的身高。研究人员从人群中随机抽取样本,确定平均身高为 74 英寸。
74 英寸的平均值是总体平均值的点估计值。点估计本身的用处有限,因为它不能揭示与估计相关的不确定性;您不太清楚这个 74 英寸样本的平均值与总体平均值的差距有多大。缺少的是这个单一样本的不确定性程度。
置信区间比点估计提供更多信息。通过使用样本的均值和标准差建立 95% 置信区间,并假设钟形曲线表示的正态分布,研究人员得出包含 95% 时间真实均值的上限和下限。
假设间隔在 72 英寸和 76 英寸之间。如果研究人员从整个高中篮球运动员群体中随机抽取 100 个样本,那么其中 95 个样本的平均值应该在 72 到 76 英寸之间。
如果研究人员想要更大的置信度,他们可以将置信区间扩大到 99%。这样做总是会产生更广泛的范围,因为它为更多的样本均值腾出了空间。如果他们将 99% 置信区间确定为 70 英寸到 78 英寸之间,则可以预期评估的 100 个样本中的 99 个包含这些数字之间的平均值。
另一方面,90% 的置信水平意味着我们期望 90% 的区间估计包含总体参数,依此类推。
置信区间揭示了什么?
置信区间是一个值的范围,其边界高于和低于统计平均值,可能包含未知的总体参数。置信水平是指多次抽取随机样本时置信区间包含真实总体参数的概率或确定性百分比。
如何使用置信区间?
统计学家使用置信区间来衡量样本变量的不确定性。例如,研究人员从同一总体中随机选择不同的样本,并计算每个样本的置信区间,以了解它如何代表总体变量的真实值。生成的数据集各不相同,其中某些区间包含真实总体参数,而其他区间则不包含。
关于置信区间的常见误解是什么?
关于置信区间的最大误解是它们代表给定样本中落在上限和下限之间的数据的百分比。换句话说,假设 99% 置信区间意味着随机样本中 99% 的数据落在这些界限之间是不正确的。它实际上意味着可以 99% 确定该范围包含总体平均值。
什么是 T 检验?
置信区间是使用统计方法(例如 t 检验)进行的。 t 检验是一种推论统计,用于确定两组均值之间是否存在显着差异,这可能与某些特征有关。计算 t 检验需要三个关键数据值。它们包括每个数据集平均值之间的差值(称为均值差)、每组的标准差以及每组数据值的数量。