关于频率论和贝叶斯论这个周的自然语言课中再次提出了关于频率论（frequentist）和贝叶斯论（bayesian）的讨论。两种方法都是用...

这个周的自然语言课中再次提出了关于频率论（frequentist）和贝叶斯论（bayesian）的讨论。

两种方法都是用来描述一个事件的不确定性，

一个最简单的例子：投掷一枚硬币，为正面的概率？

频率论支持者会重复投掷该硬币多次，统计硬币正面的次数，然后验证硬币正面的概率。

贝叶斯论则会采用一个先验值（prior belief），假设我们认为硬币应该是55开的。后期通过新的测验数据不断更新我们对正面概率的认知。

通过上面的例子，我们可以看出，频率论是客观的，硬币正面的概率应该等于历史投掷硬币正面的概率。

贝叶斯论是主观的，即我们存在一个初始认知，后又获得了一项证据，认知被更新，进而采取新行动。所以硬币正面的概率取决于投掷人对于正面的经验。

投资者在做决策和判断时并非绝对理性，常常受到行为偏差的影响。在制定决策时，人们更倾向于赋予最近发生的事件和最新经验更高的权重。

这种非理性的决策往往会导致市场情绪化的产生，当牛市来临时，似乎人人炒股都可以挣钱，你的投资胜率奇高，经过一段时间后，你认为会自己的决策是十分正确的（即使过去炒股很少赚钱）在这种情况，人人都给予了近期事件过多的权重，过度的影响到了初始认知，导致了股民对于自身投资胜率的误判。

相对，频率论是客观的，我们通过观察历史大盘走向，我们会发现涨跌通常是周期性的，所以未来突然不停上涨到10000点的可能性极低（该结论可能存在问题，马上会提到）。

然而，对于频率论，也存在着很常见的误区。样本数量是结果正确性的关键，假设我们投掷一枚一元硬币2次，都为正面，我们总结投硬币正面概率为100%。这样显然不科学。如果我们再进一步，投掷该硬币1000次，得出来正反为48%-52%，我们就可以总结正面概率为48%了吗？对比前一次尝试，似乎更靠近“正确”答案了一些。但是我们并没有考虑硬币的种类，环境等等因素。一个不够科学的样本，往往会导致结果过拟（overfitting）。

如何验证我们的投掷硬币的结果是否过拟呢，怀着我们对于48%正面的认知，我们去投掷一个五角硬币，如果不出意外，正面概率应该也是48%。可是测试结果正面为51%。这意味着我们48%的概率只能应用于我们用于测试的一元硬币上，并不能合理预测这枚新的五角硬币。

生活中也充满着“过拟”，互联网上的针锋相对，往往都是个人对自己固有观念的倔强，然而他们并没有体会过对方的人生经历（如果没有足够的样本，还能坚称自己的观点是正确的吗？）这个话题放到下一期讨论吧。

(仅为个人观点，欢迎讨论。)

参考：网页链接{贝叶斯公式_百度百科 (baidu.com)}

关于频率论和贝叶斯论

作者：HIrasawaYu1

全部讨论