“伪随机数”不是“假随机数”
“伪随机”数不是“假随机”数
————评奥卡姆剃刀评《天路客评<通过比喻理解“大样本随机双盲对照临床试验”>》
作者:天路客
首先回答关于第二个问题,文章发出后,我觉得有的地方说法欠妥,考虑到文章已发出,就没有及时通知更正作进一步的说明,现在也还没有想好怎么论述这个问题。
至于第一个问题,“随机”的概念严格说来不是统计学的基本概念,但却是更基本的东西。在医学统计学中,对“随机”概念并不作介绍,基本概念中也不介绍,为避免不太了解的朋友产生误会,我略作一下说明。
首先说明一点:计算机不会产生绝对随机的随机数,这是确定的。
那怕计算机技术(这里指据冯诺依曼思想发展起来的电子计算机)发展到什么程度,也只是能够产生一串“伪随机”(pseudo-random)数,不会产生绝对“真”的随机数。其实,设定一个程序后,随机数的计算方法在不同的计算机中是不同的,即使在相同的计算机中安装的不同的操作系统中也是不同的、相同的随机种子在不同计算机或系统中生成的随机数也不同。
计算机的伪随机数是由随机种子根据一定的计算方法算出来的,而随机种子如果没有特殊规定在默认情况下一般来自系统时钟,所以,只要计算方法一定,随机种子一定,那么 产生的随机数就是固定的。
绝对随机的随机数字只是一种理想状态,举个不太恰当的比喻,随机数字序列就像物理学中讲的“质点”,将物体简化后得到的只有质量而不计大小、形状的一个几何点,这是经典力学中常用的理想化模型,是实际物体在一定条件下的科学抽象。
所以说,所谓“伪随机数”只是一种相对的随机数,就是说,是有规律的随机数,也就是奥卡姆剃刀朋友所说的“过足够长的一段后,可能出现与前面完全相同的序列。”
但是,这里所说的“伪”不是“假”,应该理解为“有规律”比较确切,也就是说计算机(例如通过统计软件包SAS等)产生的随机数既是随机的又是有规律的,但说到底还算随机数即使是“伪随机数”,也许将来的计算机会产生基于自然规律的不可重复的“真”随机数,但这里的真还是得加上一个引号。
在生物、医学或工程的常规科研中,伪随机数已经足够用了,只要不搞成假随机。
至于在实验中到处可见的闭着眼睛抓白鼠之类的“随机”我实在看不出有多少益处。
“伪随机数”不是“假随机数”。