发布于: iPhone转发:0回复:8喜欢:3
回复@ksworder: 受教了…[哭泣]那咋办…感觉,归因分析和无监督学习两者结合有难度啊//@ksworder:回复@Dinny_Sachs:你现在思路有点问题。所有公募基金的数据不代表数据就够。因为你做归因分析。

举个例子,你可以认为基金经理的性别对投资收益有影响。你把所有基金经理的性别拿到了。比如2000个男的,500个女的。然后你分析他们的收益率。最后得出结论男性投资收益高。这个悖论在哪呢?你只分析了现有的2500个数据来评价一个不知道权重的因子。因为你不知道性别对于投资收益的权重究竟有多大。也许性别不重要,学历才重要。这2500个数据出来的结果就会有偶然性。可能刚好有个女的学历很高。

正确做法是怎么分析?把所有基金经理换成男的,观察投资结果,再把所有基金经理换成女的观察投资结果。很显然这是做不到的。现实只有一种结果。那就是只有2000个男的和500个女的。

数据样本足够是要求数据有独立性和可重复性。很显然你的基金数据不满足这个条件。换个角度,我们研究历史指数数据,就满足这个条件,数据可重复,而且独立数据。但是影响他的因素依然很多。举个极端的例子你不能说交易前基金经理吃了个苹果就认为这个对收益有帮助。

这种事情不是没有,罗素就曾经说过:拿破仑在莱比锡的失败,是因为他在德累斯顿战役后吃了一个桃子。

所以用结果来归因的方法是不可行的。有时候会得出错误的结论。就像我们给出假设:假如潘金莲没有打开那扇窗户,假如蝴蝶没有煽动翅膀。这些分析是没有意义,因为你不知道这些影响因子的权重。导致最后的结果有10000个原因,你只挑选出10个原因,然后分析这10个原因对结果的影响。结论的正确性大概只有千分之一。
引用:
2020-03-15 08:51
各位雪球的大神好,本人正在做一篇报告,内容牵涉公募基金业绩归因。
主要的思路为:识别除了择时,选股,资产配置,基金经理性别,特征,MBA与否,学历,基金申赎,等各种学术界已存因素,之外的,一些新的可能影响公募基金业绩的因子。
如果能用到无监督分析,那就更好了,毕竟比较新潮...

全部讨论

无忧城2020-03-15 19:38

他这个都是实战出来的经验,实战关心的就是怎么能赚钱,目前还没有很好的贴合你这个思路的智能算法,无监督分析要求大量的随机模拟数据,然后从中找出策略进行对应,也就是你说的归因。
学术论文应该找相关的参考文献,金融和计算机两个领域都要有,如果你有文献了,再谈新颖,我估计你看到的文献也应该有各种说法,但是显然都不能用来实战,否则就拿诺奖了,所以学术创新和实战是两回事。
资金因素权重很高这种说法无疑来自直觉,要分析起来其实是很难的,这也是目前人工智能这块的瓶颈,当年孙子兵法把直觉划归到那些简单的套路,属于神人级别的操作,包括我们的毛爹爹,背后一套高屋建瓴的神人基因就是生物量子计算机亿万年进化出来的天选之作。
目前人工智能这块的金融应用也不是没有简单的操作思路,比如说一般的博弈坐庄手法并不复杂,所以把业绩归因到坐庄手法的差异上也是可行的,徐翔、巴菲特、西蒙斯这些人成功的秘诀和其它各行各业的成功人士一样,都是对行业博弈平衡点的一个掌握,你说资金也好,你说算法也好,总之他们成功了。
这也没什么新颖的,这就是纳什一般均衡论,人家早得诺奖了,你可以在此基础上设想还能做点什么。当然,如果你足够厉害,可以从数学上解释一般均衡论的不足,这些很多论文都有尝试,但是很难操作,主要是人的智商有限,需要借助量子计算机,而量子计算机且要等些年才有。
所以最后,你的这个想法能让你学到一点东西就很好了,灌水论文估计也不会有人看,而且现在也不奖励了,毕竟学到的东西可都是实实在在的真金白银,可以帮你股票投资的风控上一个台阶。
最后的最后,看在我码字更多的面子上,能不能也打个赏?

无忧城2020-03-15 19:10

学术讨论都能这样就好

Dinny_Sachs2020-03-15 18:38

很开心能够认识你哟

ksworder2020-03-15 18:32

谈不上了,大家互相交流。发论文不感兴趣,我比较关心能不能赚钱

Dinny_Sachs2020-03-15 15:25

真的很受教,虽然有些部分我看不太懂。感觉您很专业,有着非常深刻的思考。我做这个分析的初衷当然是识别一些创新的业绩归因因子。。。但,最主要的目的还是将业绩归因和无监督分析结合起来,弄出来一份看似比较新颖的报告或者说论文。。。因为AI现在不是很火吗。。就一直想在这个领域挖掘点东西。。。不管实际意义有多大。。。先弄了再说,就这个心态啦

ksworder2020-03-15 14:34

谢谢大佬打赏。我也不怎么用这个雪球的功能。别浪费你的钱,大家探讨下投资,交个朋友足以。

你一开始就把投资超额收益归结于基金经理,这就是你的直觉。你把基金经理的权重给的很高。但是你其实并没有数据支撑。然后你还继续分析这个基金经理因子又受什么影响。

首先你要明确基金经理权重究竟有多大。我建议你先做这个分析,基金经理是不是对投资结果有很大影响。你自己有数据可以分析。但是我记得我看过一个人对过去的封闭基金的收益做过分析。最后的结论是价值回归。几乎所有的封闭基金收益都很不错,而且看不到明显的差异。

这有违背我们的常识。巴菲特和别人的收益能一样吗?但是我觉得这个事情没有办法去证伪。最好的办法是国内有一只封闭基金然后让巴菲特去做基金经理投资。这样比较的条件才相似,然后看巴菲特能否拿到超额收益。因为影响收益的因素太多了,他的背景,资金,信息,以及独一无二的优势。这些是不可重复的数据。

所以,每个超额收益的基金经理,你很难挖掘到他背后独特的成功因子。不知道原因你也就很难去知道超额收益会不会突然变成超额亏损。历史都是独一无二的,没法重复。

至于你说的方向问题。我觉得真正有用的数据分析是分析长期效应的结果。收益率取决于价格波动。我们找出了价格波动的规律就有可能拿到高收益。而股价短期波动的背后原因太复杂太难去锁定原因。股价短期都是随机运动,也可以叫布朗运动,但是长期是有规律的。

我以前想做一个资金因素来分析股市波动。这个是最直接的原因。我认为权重很高。分析市场上资金量。或者分析国内国外M2的变化对股价的影响。但是一直很忙,没有做这个工作。你不妨尝试一下这个方向。

Dinny_Sachs2020-03-15 13:38

大神

波特082020-03-15 13:29

用PCA啊,控制其他因子后看有没有超额收益啊,像你那个例子你控制学历的这个因子后再统计看性别有没有差异。参考barra纯因子的构建方法,就是每个因子在某个横截面在上暴露为1,其他因子暴露为0的组合。通过做多高学历组的基金业绩做空低学历组的基金业绩,得出学历因子的收益率,再对比男女分组对这个因子的超额收益率不就得出性别的因子收益率