就好比我做数据统计老板想知道今年的业绩是上升还是下降,根据几个季度的数据趋势可以看出是上升,而你追求的是具体上升几个点,徒劳无功,这就是搞不清业务需求,此之谓失其本心。
你也许会说,知道这个方程的人才有资格评论它的好坏,但是你得到的就是“知道这个方程的人对这个方程的评价”
同理,你在上海的衡山路贴广告,询问今年房租上涨对你的影响大不大?你觉得你得到的样本,会有多少上海本地土著的回答?
你的样本的采样方式存在非常大的无响应空间,这个误差大到甚至覆盖你全部数据,你却把他当成客观的实际。
就好比我做数据统计老板想知道今年的业绩是上升还是下降,根据几个季度的数据趋势可以看出是上升,而你追求的是具体上升几个点,徒劳无功,这就是搞不清业务需求,此之谓失其本心。
你自己也说了,这种调查方式基本上就没有准确的,所以过峰就代表的是一种快速感染的趋势,并没有要求精确到个位百分比的要求,40%跟50%或者60%都代表快速过峰,业务要求你都不明白一味的苛求准确度,这就是事倍功半。
既然你大学都学的统计,你就应该知道我们讨论的问题根本还没到置信区间相关的位置,你的采样方式在覆盖偏差上已经存在很大的不足,样本本身的质量都堪忧,谈什么置信区间?
我用谷歌,不用百度
一味追求精度和广度,不理解业务的实际需求,就会导致多做无用功,精度0.1%,1%,10%不一样,需要的离散程度根本就不一样。做两年数据统计和数据挖掘就懂了
街头问卷调查也不是被问到的人通常会给一个结果,询问2000个人可能只有400个同意参加调查,那1600个就跟划过微博投票的群众一样不予置评,不给结果的。。。。。有点实践经验好吗
你不会没做过互联网的问卷调查吧。。。。随机向邮箱发放问卷,然后有回复邮件根据回复邮件进行统计。。。。样本的置信区间够大,精度差别10%也可以接受。。。。。我大学学的就是统计,你真的做过问卷调查吗
日活代表实际人数上下一定范围内波动,在置信区间内就行。。。。。做过问卷调查才理解这东西,而不是百度出来的