大数据,关注度分析,策略选择

发布于: 修改于:雪球转发:8回复:13喜欢:10
一般我是不写长文的,一没时间二也比较懒。不过难得做了一些有趣的事情,就写一写吧。
题目是大数据分析,目前股票投资行业比较火的话题。百度有一款基金就是大数据分析,逻辑是通过搜索内容与股票关联,分析这种热度的变化并进行股票投资,关注过一段时间,但不是很稳健。我感觉最主要的问题是由于搜索本身并不能构成完整的投资行为,我想买一只股票,我搜索看看,看看之后觉得行我就买,不行可能就算了,这个搜索转化成购买的转化率很难确定,可能高可能低,所以靠谱程度是依赖于转化率,而转化率需要大量的样本统计才能给出一个估计,还有可能是时变的,会导致结论的不稳定性。于是我就想有没有什么更理想的指标来勾画投资行为,于是我就想着能不能用关注度来作为代理变量,因为每个人在投资之前总是不自觉的先加关注,然后去股吧、雪球各种论坛去搜集信息,之后才会决定买或者不买,关注了不一定会买,但不关注肯定不会买。于是我就沿着这个思路开始研究。本来是打算抓雪球和股吧两个数据的,但是一段时间之后感觉雪球上说来说去就一类股票,科技创新新蓝筹等等,样本有偏差,就没有再用雪球的数据,主要就是研究股吧数据,别瞧不起股吧,股吧总体关注人数有20亿左右(关注人数加总),而且虽然投资人群三教九流都有但是可以更好地代表总体样本,比竟股票买卖也离不开买菜的大妈和抠脚的大叔,光靠“自以为聪明的投资者”肯定不行(玩笑)。虽然使用了这个数据,但是还有一些问题,就是量纲不一致,比如股吧主场东方财富的关注人数一直高居榜首高达1000w~2000w关注,而一些小股票只有4、5w关注,所以需要进行标准化,我使用“今天关注人数/昨天关注人数”-1这个数据来作为关注人数增长量,如果这个值偏大,表明短期关注人数剧增;小于0则表示关注人数降低。需要注意的事,一些冷门股票可能关注度人数不多,增加1w人就带来很大增长,所以需要对数据进行一定的清洗,设定一定的阀值,关注度过低的股票就给踢掉不参加比较了。
好了,废话这么多了,下面才是正经事,通过数据处理之后,得到了每日关注人数增减变动百分比,从8月5号起,做数据回测。大概就是挑选出来每天增长百分比超过10%的股票,第二天以开盘价买入,持仓,冲高之后卖出,这里需要注意两个问题,第一个是最近这段时间大盘走势比较不稳定,这对结论有没有影响,第二个是,持有几天,1天好还是2天好。下面用回测的图来解释这些问题。
1.大盘节奏对结论有何影响?
两个图,分别是8月6号开始执行策略和8月5号开始执行策略。


从图上可以看出来,大盘节奏踏的准还是不准对结论是有显著影响的,如果节奏把握的号,8月到现在大概40%收益,反之基本还在原地踏步,所以大盘的风向还是需要一定判断的。
2.持有几天好
这里只选节奏踏准的持有1天(第一天买,第二天卖)和持有2天(第一天买,第三天卖)进行比较:

忘了加标注了,蓝色的是持有1天,红色是持有2天。原因就是关注度这个事情有回归均值的倾向,出现暴涨之后,过不了几天就会像原水平靠拢(也有少数个例,关注稳步上升),稳妥起见还是不要和股票谈恋爱比较好。
好了,说到这,肯定有人觉得说了这么多等于白说,因为要想挣钱还要踏准大盘节奏,这个比较难。对,这个确实比较难,所以再稳健一些的法子,就是把资金分成两部分,半仓资金今天买、明天卖,半仓资金明天买、后天卖,不要补仓摊成本之类,这半仓资金就是用来对冲大盘风险,手里一直保持半仓股票半仓现金,同时每天买超过10%股票排名最靠前几只(选出满足条件的股票,第二天开盘价格涨幅低于6%,2-3只),分散风险,不要觉得半仓可惜,或者分散持股收益受影响,最主要是分散了风险。采用这种策略收益对比:

如果觉得自己大盘盘感很好,可以满仓干,收益会很理想;胆小一些就按照分散风险的方法做,收益比较平缓;“以为自己盘感很好”可能就会是最下面的那个...
当然这个收益率波动还是比较大的,只能是靠多次连续做用概率取胜,有时候还需要考虑滑点的问题,就是没买到没卖掉,由于是高频的,每次滑点对收益影响还是很大的,这里我设置滑点是2,也就是每次比最理想的状态少赚2%(包含成交费用等),而且资金容量也不能大,10w可能还可以在开盘价上下扫完货,上来就几百万基本得向上走3、5个点才能扫够货,一次也就赚几个点,出货时候也麻烦。这里只是提供一些参考思路,因为我也不知道这个策略会不会随着暴露而失效,总之只是一个心血来潮做的事情,然后把研究的成果拿出来自娱自乐一下。
最后补充一个有趣的内容,就是我发现虽然关注了股票不一定会立刻买,但是卖了股票之后有的人会立刻取关。于是我就逆向找关注下降最厉害的股票,做了一个做空的模拟,模拟结果如下:

一个月怒跌了30%,而且除了中间大盘反弹带起来的一小波,其余时间都在直线往下掉,跟做多比起来,走势是相当稳健。

全部讨论

2015-12-23 07:57

楼主加油,看好你!

2015-09-12 00:37

还行,之前是不是还做过LPPL拟合?好像在知乎上看到过楼主的文章

2015-09-11 21:47

谢谢分享

2015-09-11 21:43

很厉害的分析,如果时间周期长点就完美了,很贴合中国的市场情绪

2015-09-11 21:06

你的想法确实很好,回头我就根据你的想法统计一下热门股票的数据。不过股吧关注度这个数据你是怎么查?有专门的程序吗?

2015-09-11 21:02

这个踏准大盘节奏对数据的影响确实比较大。
8月5日和6日仅仅一天之差就差那么多。
你的想法很好,实际的可操作性也不错。
可以继续挖掘下,比如热门股票,当天买入后收盘价比开盘价高的概率是多少,第二天比前天收盘价冲高的概率有多少。
还有就是热门股票分别在指数上涨以及下跌时候开盘收盘价的总体情况。
这个挖掘下去还有很多统计数据可以做,最后根据数据建立一个赚钱概率更大的交易系统。

2015-09-11 20:48

好文