置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信水平。举例来说,如果在一次大选中某人的支持率为55%,而置信水平0.95以上的置信区间是(50%,60%),那么他的真实支持率有百分之九十五的机率落在百分之五十和百分之六十之间,因此他的真实支持率不足一半的可能性小于百分之5。 如例子中一样,置信水平一般用百分比表示,因此置信水平0.95上的置信空间也可以表达为:95%置信区间。置信区间的两端被称为置信极限。对一个给定情形的估计来说,置信水平越高,所对应的置信区间就会越大。
95置信区间_置信区间 -公式
Pr(c1<=μ<=c2)=1-α
α是显着性水平(例:0.05或0.10)
100%*(1-α)指置信水平(例:95%或90%)
表达方式:interval(c1,c2)――置信区间。
95置信区间_置信区间 -计算步骤
第一步:求一个样本的均值
第二步:计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%;
500个样本的抽样误差为±5%;
1,200个样本时的抽样误差为±3%;
第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
95置信区间_置信区间 -关于宽窄
窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则
置信区间间隔宽窄度表达意思0―100分100宽等于什么要没告诉你30―80分50较窄你能估出大概的平均分了(55分)60―70分10窄你几乎能判定全班的平均分了(65分)95置信区间_置信区间 -其他信息
置信区间与置信水平、样本量的关系
1.样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
实例分析:
经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):
样本量置信区间间隔宽窄度10050%―70%20宽80056.2%―63.2%7较窄1.60057.5%―63%5.5较窄3.20058.5%―62%3.5更窄由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一半(实践证明,样本量要增加4倍,置信区间才能变窄一半),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。
置信区间=点估计±(关键值×点估计的标准差)
通过置信区间的计算公式来验证置信区间与样本量的关系。
样本均值关键值×样本均值的标准误差;即
从上述公式中可以看出:
在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。
2.置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。
实例分析:
美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:
抽样误差置信水平置信区间间隔宽窄度+/―3%95%60%+/―3%=57%―63%6宽+/―2.3%90%60%+/―2.3%=57.7%―62.3%4.6窄由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。