《中国互联网络发展状况统计报告》又发布了,全国网民总数达到2.98亿,高居世界第一,覆盖率达到22.6%,超过世界平均水平。数字是令人振奋的,显然在这个寒冷的冬季,这些数字起码给互联网行业带来一些温暖,一些鼓励和一些安慰。
但,数据是枯燥的,基于职业习惯,我对以往几次报告中的进行了观察,于此就一些疑问和大家进行探讨——探讨基础是《中国互联网络发展状况统计报告》以往各次发布的数据,并假设这些数据的发布是真实的。
百变神通——统计的标准和方法究竟是什么?
从最近四期《中国互联网络发展状况统计报告》的调查方法来看,一直没有稳定的抽样方法和样本分布,每次调查似乎都具有相当的随意性,或许是经济性和可行性的考虑带来这样的结果,不过无论如何这种现象是非常不理想的。
连续性的系列调查最关键的是对指标和概念做稳定、精准的定义,但事实上以往几年中,多次调整和变更对各类网民的定义(例如对手机网民、农村网民的定义)。还有清晰说明调查机构是如何对不同子总体数据进行有效的整合是极其重要的,但发布机构在第23次调查报告却干脆取消了此部分详细论述,让大家去猜。
图表1 CNNIC中国互联网调查样本构成
注1:相关数据摘自CNNIC中国互联网络发展状况统计报告(第20-23期)。
跌落人间——中国网民平均上网时间究竟是多少?
在第22次中国互联网调查报告中,发布机构在2008年上半年短短6个月中让每周上网不到一小时的1000万老网民全部“脱贫”,而且让所有4300万新网民共同“小康”——每周上网在一小时以上。我当时的反映就是:这实在太令人振奋了,也太令人吃惊了,因为从来没有看到过类似的产品或技术应用发展轨迹,由于发布机构未就此结果做出任何说明,于是只有一个解释:中国在互联网应用的普及上已经到了一个令人不可思议的高度。
但,原形很快就露出来了,2008年底的第23次调查报告发布的中国网民每周平均上网时间为16.6 小时,比07年底上升了0.4小时,但与08年上半年的19.0小时相比居然一下子下降了2.4个小时!下半年,中国网民增长4500万(18%),每周在线时长增加1.4亿小时(3%),我这次真的懵了,更让我无法理解的是,发布机构同样选择了不发布网民上网时间分布这项数据,让读者接着去猜。
图表2 CNNIC中国互联网网民每周上网时间分布——可惜未发布第23次的数据
注2:相关数据摘自CNNIC中国互联网络发展状况统计报告(第20,21,22期)
造成上网时间下降的原因可能有多种,有人会猜测是否由于农村网民的大幅度增长造成的,还有人猜测是否是由于低年龄段网民大幅度增长造成的,这些新增网民的网络应用似乎简单、初级一些,报告发布机构正是用的此类解释(与2007年相比,网民在2008年的平均每周上网时间略有提升。但是,由于新增网民上网时长略低的影响,网民的平均上网时间增长有限),但发布机构却给不出足够的理由和证明。
更为可怕的是,如果08年上半年的网民在下半年上网习惯不变,那么按照发布机构的解释,全国新增网民的每周上网时间只有区区3.1小时——难道说全球经济危机让中国那些新网民怕了上网了?如此这般,让我对第23次数据,乃至此前的数据产生莫大的疑问,它们可信吗?
通过对中国农村网民增长数据的简单观察,我们不得不做出猜测:农村网民比例的增加不是去年下半年中国网民上网时间大幅度降低的原因。如果对比网民年龄结构变动与网民上网时间的数据,也找不出合理的解释。反过来,凡是发布机构不发布农村网民数量的时候,中国网民平均上网时间就高——莫非这些时候的中国网民调查范围不能有效覆盖农村地区?!感觉上这有些逼近问题核心了。
图表3 CNNIC中国互联网网民数量与每周上网时间
注3:相关数据摘自CNNIC中国互联网络发展状况统计报告(第20-23期)。
我很赞赏CNNIC连续十年来对中国互联网发展的连续性追踪研究,这不是一般机构可以做到的,很难,很辛苦的。今年第23次调查报告有了很大的创新,增加了对特定网民群体的分析,深入了对网民生活形态的分析,这些都是有益的尝试和创新。不过,一项对中国互联网,全球互联网具有重要地位的调查来讲,多次出现上述类似问题而没有改观是不应该的,也是不恰当的。
常言道:创新是美丽的,但从容和清明才是气质的。以此祝福《中国互联网络发展报告》越来越好。