【修正一下答案】
(1)第一个错误(不应该拿概率算的东西,不能用概率)
在1000个上涨的股票里
老师让A统计pe,让B统计新高
A说:pe小于10的概率是50%,有500个
B说:破20日新高的是60%,有600个
然后老师问C,你认为同时满足Pe小于10,又破20日新高的是有多少个?
C的回答应该是:我要统计一下才知道,这是个统计题,不是概率题,我只能告诉老师您,最少是100个,最多是500个。但老师你如果考我另外一个问题:同时符合2个标准的股票有100个的概率是多少,我能拿概率回答。
相似的例子,有1万个股票(有涨有跌的,总样本库)
老师让A去统计其中pe小于10的,B去统计其中破20日新高的
A说:Pe小于10的共有1000只,其中上涨的500只
B说:突破20日新高的共1000只,其中上涨的600只
然后老师问C,请问这1万只股票里,pe小于10,并且突破20日新高的股票,上涨的概率是多少?
C的回答应该是:这还是一个统计题,依然不是概率题,首先,样本可能是重复的,且不独立的。其次,如果样本不重复,你把A统计的1000个股票放在一个盒子里,B统计的1000个股票放在一个盒子里,我只能告诉老师我从2个盒子里各取一个股票,2个股票同时是上涨的概率是30%。但我依然没法告诉您,1万个股票里,同时符合2个标准的股票上涨概率是多少,这就是一个统计题。
(2)统计问题,不能因果倒置,变成逻辑
1、你发现上涨的股票里,1998年以后上市的占了100%
2、你不能说:1998年以后上市的股票上涨的概率是100%
我们来举一个类似的可以拿概率算的题目,也就是所说的2个独立事件同时发生是相乘关系的例子:
1、一个猩猩随机选股票,选到pe低于10的股票的概率是50%
2、一个猩猩随机选股票,选到突破20日均线的股票概率是60%
请问一个猩猩选到同时满足2个标准的股票概率是?
答案:30%
这个概率算法,是很错误的
一个酗酒的人,活不到30岁的概率是10%
一个抽烟的人,活不到30岁的概率是10%
一个又抽烟又喝酒的人,活不到30岁的概率,肯定不可能比任何其中一个概率低
降低系统复杂度
这个的确是正确的
至少在刚开始,不要妄图建立一个复杂的系统
如果这些指标不是独立的怎么办??