发布于: iPhone转发:0回复:0喜欢:0

简单统计学:

我们如何区分正确理论与胡诌之间的区别?有两种有效的良方:常识和新数据。如果某种理论听起来很可笑,那么在看到压倒性的证据之前,我们绝不应该轻信这种理论;即使看到了压倒性的证据,我们也应当保持怀疑的态度。不同寻常的说法需要不同寻常的证据。第二种良方是新数据。当你通过搜刮数据编造出了某种理论时,用同样的数据对这种理论进行检验是一种不明智的做法。既然你编造这种理论是为了迎合数据,那么这些数据当然会支持这种理论!应当使用没有被数据挖掘所污染的新数据对理论进行检验。当你用新数据检验通过数据挖掘形成的理论时,得到的结果常常令人失望,这是意料之中的事情。用启发某种理论的数据对这种理论进行检验的做法显然具有误导性。如果某种理论对新数据的匹配程度不像原始数据那么好,这显然并不奇怪。