指数编制排雷清单,这些ETF也许不够好

之前在ETF星推官的雪球群里看到 @六亿居士  发出的信息令人惊讶,保险主题指数中赫然纳入了10%比例的宁德时代,原因很简单,在原指数编制中有这么一个条款:


也就是说,由于保险行业的股票数量不够20个了,所以把参股保险公司金额大于1000万的上市公司纳入样本,而非常巧合的是,宁德时代在之前确实入股了一些保险公司项目,比如:

但就9亿的投入就足以把宁德划入保险主题之中吗?这当然不合理,因为宁德的主营业务并非保险,而且主营部分的业务体量远远大于这笔保险入股金额,也就是说宁德的股价变动和保险行业的波动变化之间关联度是很低很低的,如果加入了10%比例的宁德时代,将极大影响保险主题指数本身的有效程度。

指数编制需要兼顾有效、全面、减少意外发生,尤其对于行业主题的编制过程,是难以完美的,但这种“1000万入股”的明显缺漏,依然让人难以接受,我们需要对ETF进行排雷,以免陷入突发性权重调整和长期性超额损失的圈套。

经过以下步骤进行ETF排雷过程:

1,把所有A股中有基金挂钩的ETF单独选出,总计308个指数;

2,把所有指数的样本空间、选择方式、计算过程、调整方式提取出来;

3,逐个检查定性判断缺漏。

综合绘制以下可能存在问题的排雷清单:

一,挂羊头卖狗肉

这个分类中的问题是已经出现的指数成分和指数定义并不相符的情况,比较容易让投资者买入挂钩指数后对后期走势失去预估性,也很难和真实的市场走势匹配起来,像一条已经失控的渔船,明天可能出海后天可能撞礁,以上证中小000046举例,目前其权重个股总共为450只,其中总市值超过500亿的个股有136只,超过1000亿的个股有52只,更有万亿总市值的建设银行以及中国银行作为成分股,总体来看,指数成分内的大市值个股占比为26.19%,和字面的“上证中小”有不小的差距,为什么这个描述很重要?因为“市值”本身是一个波动变化很大的风格因子,在极端的14-15年,如果按照目前的市值占比,比标准的中小指数编制会天然跑输8-10%。

其他的几只指数也是这个问题,只是有的影响度低一些有的影响度高一些,最离谱的责任指数000048,在其原编制文件中描述是这样的:

我们找了一下该工作通知中对每股社会贡献值的定义:

基本上所有的参数都可以在年报中得到精确数值(除了排污费和清理费,但这项参数影响不大),所以我们可以把最近一个年度的每股社会贡献值做精确的测算,前列排名结果如下:

但是实际上该指数的权重结果为:

只能说毫无关系,也许是一年度的数据没有使用,编制过程中是使用全生命周期的?虽然编制说明书中没有说,但菜馆还是计算了,经过我们的测算,结果也与该权重结果不同,差别不小。也就是说这个指数的权重处理结果与计算标准有很大的偏差,是典型的挂羊头卖狗肉,更值得担心的是背后评估团队的拍脑袋结果是否影响了权重编制。

另外,值得讨论的是,这个每股社会贡献值的计算过程中,影响度比较大的是单年度的利润和业绩,也就是说,上年度业绩非常好的公司异常容易入选样本池,属于一种单年度业绩的追高,而这是非常危险的,因为买入今年业绩特别好的公司持续滚动的结果非常糟糕,所以责任指数000048本身不仅仅是挂羊头卖狗肉的指数,还是参数低效的指数。


二,参数低效

这个问题在A股指数编制中出现的频次可能是最多的,本文收录的仅仅是部分比较有代表性的低效编制,首先以优选消费50(931357)为例,其在编制原文中表述为:

这里使用了ROE标准差,其实是挺有意思的,这代表的是企业是否有稳定的ROE水平,但是以过去一年的ROE标准差来计算其实只有四个参数可以计算:一季报、半年报、三季报、年报,这种ROE的区间变化幅度小统计大概率是没什么用的,剩余的指标参数也是这个问题,时间跨度太短了,索性做了一份这几个年度参数的超额图:

图例的含义就是:ROE-标准差、经营性现金净流量、营业收入的单年度排名不能有效指引股价表现。哪里有这么简单的事?总体来说,如果按照优选消费50(931357)的编制方式,会不断挑选出跑输市场的个股,这就是编制参数低效!

同样的情况也会出现在其他清单指数标的中,持续发展(931268)、CS长三角(931141)、CS京津冀(930701)更是其中低效的佼佼者,而对于中证ESG100(000846)来说,需要讨论的地方有很多。

菜馆之前写过一篇短文Baillie Gifford关于ESG的简要思考,简单来说就是符合ESG定义的公司会在长远发展上有明显超额,但是在目前的国内市场环境中,这种特征没有体现出来,更多地是要求管理人在进行股票选择时更注意社会价值的关注和要求。同时,由于ESG具体的评分标准五花八门,排污差计几分?员工关怀到位计几分?....等等等等不一而足,不同的计分方式会得出不同的ESG评价结果,导致我们就算想给这个参数系列评估超额都难以做到,但是按照目前已公开发行的ESG指数结果来说,目前的编制参数是无法做到明显跑赢市场的,依然属于低效参数。

三,编制隐患

编制隐患是指目前没有出现问题,但没准以后出问题,这种问题可能是权重不符,也可能是长期无超额。

四,编制隐晦

编制隐晦是不透明,不透明的原因可能是指数公司本身投委会、专家团队进行最终决策,也可能是由于指数是以合作、第三方参与的关键参数的形式进行编制,其中比较典型的代表是淘金100(H30537),目前我们尚未找到该指数的公开权重披露,找到最多的是当年发行该指数时浩大的广告攻势,那几年也确实是阿里系数据愿景如日中天的时候, 但在原编制的表述中,所选择的行业个股是:“恒生聚源数据服务有限公司基于蚂蚁金融服务集团旗下支付宝金融信息服务平台数据进行加工后得到的,与网络电商商品类目相关的以下休闲娱乐行业的证券”

实际的挂钩基金权重为:

[吐血] 我甚至怀疑是否是因为恒生聚源不更新该指数信息了,基金公司自己直接变主动管理了,不透明是指数编制过程中最大的错误!

这种案例还有很多,比如清单中浙商证券参与权重定义过程的中证转型成长(H30359),还有一些大学出品的某项研究成果,一些资管公司发布的计算方法等....陷阱可不少。

———————————————————————————————————————

统计梳理的过程是在是太繁杂了,今天我们仅仅是把一些有代表性的指数编制问题案例进行展示,后续在这个基础上缓慢更新吧。

雪球转发:26回复:26喜欢:63

精彩评论

小哇森kk2021-12-23 23:22

要是过两天保险指数上拉是靠宁德,一众保险股拖后腿就贼讽刺

hmhou_20022021-12-24 12:39

选样方法和权重计算是两码事,很多指数为了方面基金跟踪,都是用特定规则选样,但权重计算却是市值加权,比如300价值就是筛选低PE、低PB的300成分股,然后用市值加权,基本面50也是这样,其实并没有体现基本面加权的意义。

全部评论

时空过客V02-01 22:39

没有像你这么系统整理,不过确实碰到过里面的中证环保,因为看etf排名,发现它还挺靠前,觉得不对啊,环保啥时候这么强了,一看持仓,尼玛一水的新能源。。。

Wheat_01-22 23:27

我觉得最好就是直接按市值因子来编制的指数。

伊克塞汀2021-12-30 15:33

它可以看作一个持股比较稳定的主动基金,但最近十年唯一能穿越牛熊的主流宽基就是央视50

伊克塞汀2021-12-30 15:30

最坑爹的指数应该是最近异动880884,不信你们去看看哈哈哈哈

hmhou_20022021-12-27 15:57

其实市值加权最大的好处是换手率低,冲击成本小,让市场慢慢抉择。