关于频率论和贝叶斯论

发布于: 修改于:雪球转发:0回复:1喜欢:0

这个周的自然语言课中再次提出了关于频率论(frequentist)和 贝叶斯论(bayesian)的讨论。

两种方法都是用来描述一个事件的不确定性,

一个最简单的例子:投掷一枚硬币,为正面的概率?

频率论支持者会重复投掷该硬币多次,统计硬币正面的次数,然后验证硬币正面的概率。

贝叶斯论则会采用一个先验值(prior belief),假设我们认为硬币应该是55开的。后期通过新的测验数据不断更新我们对正面概率的认知。

通过上面的例子,我们可以看出,频率论是客观的,硬币正面的概率应该等于历史投掷硬币正面的概率。

贝叶斯论是主观的,即我们存在一个初始认知,后又获得了一项证据,认知被更新,进而采取新行动。所以硬币正面的概率取决于投掷人对于正面的经验。

投资者在做决策和判断时并非绝对理性,常常受到行为偏差的影响。在制定决策时,人们更倾向于赋予最近发生的事件和最新经验更高的权重。

这种非理性的决策往往会导致市场情绪化的产生,当牛市来临时,似乎人人炒股都可以挣钱,你的投资胜率奇高,经过一段时间后,你认为会自己的决策是十分正确的(即使过去炒股很少赚钱)在这种情况,人人都给予了近期事件过多的权重,过度的影响到了初始认知,导致了股民对于自身投资胜率的误判。

相对,频率论是客观的,我们通过观察历史大盘走向,我们会发现涨跌通常是周期性的,所以未来突然不停上涨到10000点的可能性极低(该结论可能存在问题,马上会提到)。

然而,对于频率论,也存在着很常见的误区。样本数量是结果正确性的关键,假设我们投掷一枚一元硬币2次,都为正面,我们总结投硬币正面概率为100%。这样显然不科学。如果我们再进一步,投掷该硬币1000次,得出来正反为48%-52%,我们就可以总结正面概率为48%了吗?对比前一次尝试,似乎更靠近“正确”答案了一些。但是我们并没有考虑硬币的种类,环境等等因素。一个不够科学的样本,往往会导致结果过拟(overfitting)。

如何验证我们的投掷硬币的结果是否过拟呢,怀着我们对于48%正面的认知,我们去投掷一个五角硬币,如果不出意外,正面概率应该也是48%。可是测试结果正面为51%。这意味着我们48%的概率只能应用于我们用于测试的一元硬币上,并不能合理预测这枚新的五角硬币。

生活中也充满着“过拟”,互联网上的针锋相对,往往都是个人对自己固有观念的倔强,然而他们并没有体会过对方的人生经历(如果没有足够的样本,还能坚称自己的观点是正确的吗?)这个话题放到下一期讨论吧。

(仅为个人观点,欢迎讨论。)

参考:网页链接{贝叶斯公式_百度百科 (baidu.com)}

全部讨论

04-07 15:40

老公你好棒