因子研究系列之一 -- 估值和资本结构因子

发布于: 修改于: 雪球转发:23回复:22喜欢:138

导语:不同因子的作用折射出每个宽客各自对于金融市场的理解,本文目的在于展现不同因子与市场表现帮助各位看官查看是否有所遗漏,同时提供因子提取和使用的简易实现代码。

本文是一系列因子研究中的第一篇文章。本系列的文章有:

【量化课堂】因子研究系列之一 -- 估值和资本结构因子

【量化课堂】因子研究系列之二 -- 成长因子

【量化课堂】因子研究系列之三 -- 技术因子

因子简介

量化课堂推出了多份因子模型的介绍材料,包括多因子策略入门多因子策略-APT模型Fama-French三因子火锅Fama-French五因子模型CAPM+APT多因子模型等。也包括彼得·林奇的成功投资中的PEG指标,既可以看作是由因子构成的指标,也可以看作一个影响股票价格变动的因子。

每个宽客可能心中都有自己偏好的因子,这也是因子模型的一个好处,广泛可选取的因子指标能够涵盖并刻画股票的众多侧面,通过综合多方面信息可以得到一个选股结果。因子模型的另一个好处就是:“多因子模型的表现相对来说比较稳定,因为在不同的市场情况下,总有一些因子发挥作用(潘凡,2011年1月26日,安信证券《基于有效因子的多因子选股模型》)。”无论是否是高手,对于基础指标变动理解的加深肯定对于股票整个系统的认识是有帮助的。从数据而言,聚宽仅股票财务数据就包括市值数据(12项)、资产负载数据(84项)、现金流数据(57项)、利润数据(41项)和财务指标数据(34项)。

潘凡(2011)的《基于有效因子的多因子选股模型》是一份广泛验证因子有效性的材料,丁鹏《量化投资——策略与技术》中介绍多因子模型部分也援引了该材料。潘凡(2011)文中称“借鉴了包括Barra,Credit Suisse 等多因子模型并参考了国内外各种文献,选取了 30 个因子”。我们社区中@陈小米大牛基于这个材料写过一个实现策略量化选股——多因子模型,基于丁鹏的对应内容,其中结合聚宽数据构成估值、成长性和资本结构三方面的10个因子进行验证。本文同时补充Foster Friess 积极成长策略中给出没包含在前文的因子。本系列文章在充分挖掘聚宽提供的基础财务指标后,提取总计26个因子,给出基础指标说明和单因子策略分析,并在之后进行一系列更深固然的研究。本篇是次列文章中的第一篇,文中将会介绍估值因子(6项)和资本结构因子(3项)。

回测设定简介

使用上证股票池2005年至今数据,选取上一个月(21个交易日)没有停牌的股票为股票池,每个月初第一个交易日进行交易,选取对应指标最大(或最小)1%可行股票池股票总数股票进行仓位调整,股票权重为平均分配。

1.账面市值比 BP=1/pb_ratio

账面市值比为股东权益除以股票市值,在计算中这里使用聚宽财务数据中的pb_ratio(市净率=每股市值/每股净资产)倒数计算得出,前一种方法(股东权益除以)的指标处理可以在Fama-French三因子火锅中获取。由于该指标是比值型,因此每股指标与整体指标得到的因子数值相同,较为常用的比较标准为与1进行比较。BP因子属于估值因子,即通过对于BP值的高低可以直观反映出股票估值是否符合公司价值。结合BP值可以直观表达为:BP值高于1,说明股份对应的公司权益的价值高于股价,也就是说股票的价值被低估了,如果能用市场上的股票价格把公司买下来,按斤卖了也能赚(可以对应理解相反情况)。因为公司包含了制度管理、企业文化、公司商誉、品牌价值等非物质不好度量部分,一般会导致公司的市值高于公司净资产价格。根据中证指数有限公司的数据显示,上海A股的平均BP为59%。个股的BP指标需要同时结合整个股市的BP指标进行解读,同时BP指标也受行业影响。往往在牛市时很多投资者乐于使用BP作为指标,因为这能代表股票的安全边界。

最大1%BP策略为每次选取可行股票池BP值最大1%的股票买入,每月调仓一次。而最小策略选取的BP指标刚好相反,最小的1%。最大1%因子策略中包含了均值回归的逻辑,即高BP可能表示其被低估,在后期有上涨反弹的可能。但是对比两种策略我们反而看到与预期不相符的情况,最低1%估值在同样年限中获利比前者多将近1.9倍。

最大1%

最小1%

最大5%

最小5%
通过中证指数有限公司的网站我们看到2016年11月09日A股全市场BP(市净率倒数)确实存在者行业差别,因此可能在行业内部BP于股票收益呈现有序相关。混合在一起的所有股票中BP与回报率既不是简单的线性关系也不能很好的体现重置逻辑,因此难以简单的适用于均值(BP均值)回归的逻辑。最大1%策略可能的解释是在整体BP值较高的行业中BP值体现出一定的低估值反弹现象,但最小1%策略可能的解释是在低BP行业中(最低为软件与服务行业),行业整体发展和回报领先于市场平均水平。也有部分分析认为BP变动可以看作一个更好的指标,这可能就涉及到有效市场理论了。公司的权益资产是可以看作客官指标的,市场价格的偏离程度在什么程度上反映信息,而这样的偏离是系统性的还是随机性的在不确定市场有效性边界时两者难以分离,那么对于BP的变动到底是会出现回归还是保持趋势就难以判断。

2.盈利收益率 EP=1/pe_ratio

盈利收益率由盈利除以股票市值得到,在计算中我们使用了动态市盈率的倒数,表示的是收益在成本中的占比。由于该指标为比值性指标,因此得到的个股和整体指标应该相一致。这里成本一词可能不是很恰当,因为在理解成本时往往隐含着成本折旧的概念。更广泛的金融资产中,投资的成本可以理解为机会成本,那么EP的分母为机会成本的本金。说的过于抽象不是很好理解的话我们举一个例子来说明。100块钱如果存在银行定期存款每年能得到R元的利息,那么利率简单说年化R%。如果每股每年得到E元,每股价值相当于E/(R%)元定期存款的作用,那么平均的利润水平回报的公司实际的市值就可以被估算粗来了。EP作为价值的一个指标,单个公司EP值大于(小于)平均EP值,就可以直观理解为该公司具有平均水平以上(以下)的盈利能力,股票价格可能被低估(高估)。当然,基于CAPM理论,中间还要考虑回报的风险变动什么的,这里都简化掉了。

当然,这里要重点强调,框架逻辑十分粗糙。具体的EP于股价变动要是这么简单搞定,老么多人就没饭吃了。我们看一下EP指标在实际情况中的反应能发现,最大1%策略和最小1%表明了“好像什么都没表明啊”。这样的情况说明这个因子对于回报的影响不是简单线性关系,而且本文中很多指标好像都是这样。

可以分开两边理解EP指标,EP大说明相对于股票投资成比例回报较高,即单位资金可能回报较高。即使不分红的话,如果不存在极端情况个股收入都是负的比谁负的更少,那么至少有较高盈利能力的个股应该有较为稳定的基本面不至于出现大幅跌损。因为在当前的机制下,明显的估值偏离会被市场主体的获利趋势的行为纠正。同时,可能由于分红配送等利好行为推动股票价格上升,或者本身就存在巨大回报股票较低估值的抄底可能。那么这样的策略带来了还不错的收益。小EP则表明该股票的市场认可,即使单位金额带来的回报没有那么高,但是大家仍然认为它值那个价钱。这样的股票很多时候体现出在估值过程中成长性因素的综合考虑,即使当前EP值很低,但是到未来挣钱增长快会把EP值拉到正常水平甚至更低。

最大1%

最小1%

最大5%

最小5%

对比2008年前的一波行情,低EP高成长的股票没有体现出高EP股票的收益,而在2015年中股票行情中则正好相反。可能市场对于不同股票追捧热点的转移是一个解释,也可能在早期对于高成长股票的发现和认识不足是另一个解释。有兴趣的话,各位看官可以在社区搜索风格板块,进行补充阅读。包括整个社会产业分工发展轮转,适应条件变迁可能行太多太多。下面同样放一个从中证指数有限公司网站上得出2016年11月09日A股全市场的动态市盈率分行业数据。EP最高的是金融地产业,超过10%,而最低的信息技术不到年化2%。同时通过变动情况我们能看出信息技术的公司EP值在一年平均,半年平均和当前最新水平下逐步增大,可能也是市场对于该行业的一个态度吧。

3.PEG PEG=pe_ratior

PEG还用再说么?我们量化课堂里有啊——彼得·林奇的成功投资。还是再说两句,这个指标注重的是公司的成长性,PEG在筛选掉负的市盈率和收益增长率的公司后,与公司的成长性呈负相关。也就是说指标小的比较好,当然也不是绝对,因为计算收益增长需要较早期历史数据的原因,这个指标可能对未来不一定适用。不过可以看出排除负市盈率和收益增长率后,最小PEG明显高过较大PEG股票,但因为去掉了负值影响股票,PEG较大的股票仍然能跑赢大盘不少。

最大1%

最小1%

最大5%

最小5%

4.股息率 DP=dividend_payable/(market_cap⋅100000000)

股息率是公司应付股利除以总市值。与EP指标相似表示,分子指标不同。与EP不同的是,EP表示公司客观而言盈利的能力(或对于盈利而言估值的水平),而DP择时实际的投资收益比例。如果某投资者年初持有该股票并持有一年,理论上应该等于该股票的年内变动加上股票总派息。但是,在一般财务指标中适用的是总派息除以当时市价作为投资收益的简化指标。

股息的多少除盈利外,还与公司的资金结构和计划安排相关。如果公司通过当期的收入调整负债比例或流动性资金比例,则可能导致相同EP公司的DP值不同。相似,如果工资对于未来计划中包含扩大再生产(投资)内容,很可能通过减少收入中的派息占比。理论上,有效市场的话EP和DP在长期可能两者关系恢复均值水平,即盈利的固定比例派发股息。总体而言,公司收入水平高可发股息的空间较大,而盈利水平低或负值还想要啥自行车啊。对于股权投资型机构而言,由于交易过程成本过高和反身性问题,可能对于股息更多偏好,这也是股息派发不能忽视的影响因素。综上,公司需要平衡发展潜力和长期资金支持,股息不能发放太少也不能发放太多。

但公司DP值与EP值面临着相似的问题,就是分母中的股票价格。对于成长性企业,由于高预期带来的高估值影响导致DP过低,尤其是具有高预期的公司可能处于成长初期,自身盈利水平有限,也会在另一方面降低DP指标。我们可以看出最大1%的策略带来了高于基准很多的收益,长期收益水平看起来还不错。尤其是经过一段市场波动洗礼后,高DP策略盈利水平逐渐稳定,可能代表了市场对其的认可增高(用脚投票带来的估值增高)。但低DP策略反映的是高估值选股策略,与低EP相似甚至同期收益率比低EP更高。也不排除低DP股票有更大的再投资安排,从而导致较好的增长情况出现。对比EP和DP可以保守的推断一下可能性,EP和DP同时偏低的股票可能反映的是高估值股票,高估值可能是增长预期推动,具有较好的收益率。但高DP不如高EP一样反映公司更多的盈利能力。

最大1%

最小1%

最大5%

最小5%
同样补充从中证指数有限公司网站上得出的2016年11月09日A股全市场股息率。可以看出股息率最高的时金融地产和公共事业行业,如果不算当期的股票价格变动,年化收益率与一年期定期存款相似。

5.现金收益率 CFP=1/pcf_ratio

现金收益率是公司现金及等价物与股票市值的比例。据体数据处理过程中使用的是聚宽量化平台的“市现率”指标的倒数,市现率指每股市价除以过去12个月每股现金流量的倍数。这一指标成比例形式呈现,因此总量计算和每股计算得到的相同。该指标与之前提及的EP和DP有相互关联之处,同时也反映了其他方面信息。相似之处在于几个指标同时作为估值因子,是股票价格的基本面支撑,反映企业的盈利能力,同时反映市场对其估值的态度。不同之处在于CFP同时反映收入结构问题,即收入中现金和等价物的占比。举个粒子?离子?栗子?如果公司收入中有追缴的其他公司的欠账,但收回的欠账确是一堆电脑,不能简单变现。那么,公司该期核算时折旧、税费和其他支出时,不能用电脑的净值进行抵消,而需要在现金中额外准备一部分来填补差额。因此,虽然非现金部分收入在整体计算过程中导致公司账面还过得去,但实际上可能没有看起来那么美丽。因此,现金等价物的收入在所有收入中是个比较过硬的指标,同时可以经过简单处理得出现金等价物收入占公司营业收入的占比,这些进一步处理的指标对于特定情景的分析都十分有用。

在BP、EP和DP等指标中出现过的的问题也出现在这个指标中,就是并不是只有更大就更好。较低的现金流入很可能是由于公司进行了一些长期投资,在一般逻辑中久期的不确定性和非流动性问题会带来更高的平均回报,那么一期的较低的现金流可能并不能说明公司就不好。一个因子如果很漂亮,那么应该是同时在两段极值处都有很好的区分度,同时两侧的解释一致自洽。不过通过下面的回测我们可以看出,这样的因子在单独使用的情况下都有这么好的表现,我们也不好批评它了。最大1%策略中,CFP应该是收益较好的指标,毕竟人家公司现金流入占市值比例高,说明估值可能不算太高,盈利有保障,同时盈利中真金白银比较多。但我们也看到最小1%策略中,收入也不错,这就可能源自上述分析中的长期投资回报问题。

最大1%

最小1%

最大5%

最小5%

6.市销率 PS=ps_ratio

市销率是指股票价格与每股销售收入之比,市销率越小,通常被认为投资价值越高。上述指标都是根据潘凡的材料中表述构建的,同样的BP指标也经常用作PB指标,一个指标的不同表达方式而已,可能一些同志更习惯其中的某一种形式。潘凡材料中前五个因子都是用的某指标比市价的表达方式,这个就转化为了市价对指标比例构建因子。当然,真正的高手对于这些因子及其影响应该从熟悉转到内化,无论正反都不加思索凭直觉给出影响结论。

这里应该指出,对于EP、BP和CFP等指标而言,一些处于成长期的公司或者业务拓展期的公司,其实市场能力很强,但可能短期没有实现盈利,或盈利水平较低,那么前几个指标虽然不太好看,但是可以预期这样的企业在未来的发展不错。对于这些企业来说,PS指标可以在一定程度上反应成长状况,毕竟,产品卖的好,反正公司不应该太差。那么作为估值指标尤其是可以把前几个指标没表现出来的信息提供出来,这就是PS的作用。但是这个指标的缺陷在于,销售不包含成本问题,就是看着热闹不盈利的情况,比如说大量的补贴带来的销售;此外也有行业差异性存在,不同行业比较难以得出有意义的结论。

通过最小1%策略回测我们可以看出,较小的PS比值可能筛选出具有较好发展(较大销售额度)的公司,所以最终表现的还不错。相对最大1%结果也跑的比大盘好很多,得到的回报率尤其是在近年表现抢眼,在最近大势不是太理想的情况下超额收益率仍然逐步放大。那么问题来了,可能确实存在行业差别导致PS在跨行业的比较中并不是有效。可能,也就是可能,公司的各项能力没有实现销售转化,所以即使PS很大仍有不俗表现。此外预期和市场偏好推动估值过高带来了反向影响,导致虽然销售不低,但是PS更高。

最大1%

最小1%

最大5%

最小5%

7.资产负债率 ARL=total_liability/total_assets

资产负债率指总资产除以总负债,结合我们聚宽的财务指标分别使用“负债合计”和“资产总计”,这一指标反映了总资产中有多大比例是通过借债来筹资的,也可以在极端情况下分析破产清算时股东和债权人各自的损失情况。经常被提及的资不抵债讲的就是ARL大于1的情况,这里一般不考虑隐性因素影响(包括信用、能力等)。在没有爆发破产前,这个因子作为资本结构因子,住要是衡量公司风险的因子,例如某公司在进一步发债投资过程中该指标被衡量其清算能力。进一步延展,高ARL公司可能在未来发债过程中面临者更高的成本,即其再投资成本将上升,算是一个负面影响。从公司角度出发,只要融资成本低于其盈利水平,那么融资成本上升带来的时回报率变动的边际变化(即一阶导数的变化情况),回报绝对额还是上升的,因此对于股东而言回报率还是上升的,股价按理说也受正向影响。

若要进一步深入分析该因子,则应该细分债务的构成情况。比如长期负债较高则公司可能再债务方面不需要进行更多频繁处理,短期负债较多则不利企业保持稳定的经济环境。其次,应该注重负债比例的变动,一方面扩大生产增大再投资过程中债务比例可能会上升,另一方面自由资产减值也会造成债务比例上升。对于不同情况应该有不同的其他因子组合进入策略,以使得选股策略能够真正进行有效识别。

有效识别在潘凡的材料中也有提及,能稳定的跑赢或跑输大盘。如果进一步处理,希望能分清大盘在好的时候和坏的时候分别或同时稳定跑赢(或跑输)大盘。如上述大部分因子一样,我们能看到ALR因子无论最大或最小策略胜率都不低,比较的问题从好坏变成好于更好的区别。ALR最大1%的策略市现率夸张的11年间年化38.5%的收益水平。最小1%ALR的收益其实也还不错了,那么两段收益的逻辑是什么?正常的公司应该保持一定比例负债,一个是为了资金流动的考虑,一个是防止占用大量自由资金的目的,其实两个是一个意思,所谓一体两面。负债太小,如果不是别人不借钱给它,那就很可能被认为开拓不足,没有进一步发展的计划安排。负债太大清算风险问题,另一个就是在不稳定情况下应急举债也受到限制,第三是没有合理控制债务会被视为收支平衡间出现问题。

最大1%

最小1%

最大5%

最小5%

8.固定资产比例 FACR=fixed_assets/total_assets

固定资产占比给出的是公司固定资产比上总资产的比例。资产总计是指企业拥有或可控制的能以货币计量的经济资源,而固定资产是指企业为生产商品、提供劳务、出租或经营管理而持有的,使用寿命超过一个会计年度的有形资产。固定资产比例是个老生常谈的问题,要是追溯起来,那么从古典前期还称不上经济学流派的经济学思想年代对于这个问题就开始讨论了,但资本和资产的影响并没有有效区分。

回到正题,当前的研究中关于固定资本对于企业影响主要从资金周转的角度讨论,当然这个视角从马克思(或更早)的年代就开始了。如果不考虑固定资本仅把资本定义为生产材料,那么周转一圈赚一圈的钱。那么长期而言固定资本比例过高影响了平均的资本周转速度,可就影响人家赚钱了。比如说百度百科上固定资产比率的表述。举个例子,如果企业的资本为A,非固定资本的平均收益率为R,并且由于固定资本的流动性低,所以产生的收益仅为非固定资本的一半,为 0.5R(注意这个 0.5 只是一个例子,实际系数根据企业运营模式而变)。那么企业当期的回报为A·FACR·0.5·R+A·(1−FACR)·R,其中前一半为固定资本带来的回报,后一半为可变资本带来的回报。可以计算回报率为(1−0.5·FACR)·R,FACR为50%的企业回报率为0.75·R,而FACR为80%的企业回报率为0.6·R,可以看出FACR 更低的情况下回报率更高。

又提到异质性问题了,不同行业产业的不同情况。一个产业的附加值更多产生于固定资本还是非固定资本,或者说固定资本和非固定资本的回报率哪个更高?不同的固定资本和非固定资本的结合构成对平均收益率R是否有影响?懵了还是看数据结果吧,数据结果是平均水平上的一个结论展示。

最大1%FACR的回测结果是仅仅跑过大盘。我们可以看到较早的大部分时候其收益都不算太好,但2015年中之后波动较大的情况下反而体现出一些优良的性质。在理论中,较大的FACR不利于资金流转盈利。从相反的方面讲,固定资本占比大也是当前资金使用充分的一个表现,同时较大的固定资本在贷款申请等方面也会产生帮助,因此可能对于抵御波动行情有些许帮助。对应最小1%策略回测中在不同的大盘行情下,其都体现出稳定的超额收益率增长,这与一般的理论预期是相符的。相对于固定资本占用大量资金的企业,轻量型企业具有更好的平均收益水平。

最大1%

最小1%

最大5%

最小5%

9.流通市值 CMC=circulating_market_cap

流通市值(亿元)指在某特定时间内当时可交易的流通股股数乘以当时股价得出的流通股票总价值。实际上上市公司的股份结构中不止有流动股,其中一部分是不能流通的,这就涉及到一些历史成因的问题。当年的逻辑就是要上市流通,盘活周转,但是不能国有资产流失啊,中间就产生了一系列的奇奇怪怪的乱入。有段子说,不知真假,有人当年打算薅羊毛,结果个人囤了很多国有股然后烂在手里不能流通买卖。

一般而言,如果流通股市值较大,那么较小的资金量对其操作带来的反身性就很小,也就是说交易行为和股票价格不会互相产生太大的影响。对于投资者来说,较小的反身性带来了正负两方面影响:因为不易炒作,所以很难出现暴涨机会,因此收益不会太高;反之,当股票被大量空单冲击时,造成暴跌的机会更少,便于控制损失。那么较小流通市值的股票就体现了对立的属性。对于量化投资而言,反身性是比较讨厌的东西,因为会造成较大的冲击成本,导致实际交易和回测结果有很大偏差。

最近我们的社区中有很多讨论小市值的策略研究,比较学院派的内容可以参看Fama-French三因子火锅Fama-French五因子模型。在这两个模型中,可以把小市值解释为:小规模的公司面临更大的风险,因此它的股票理应有更高的风险补偿。

对比CMC最大1%和最小1%可以看出,这个指标相对与前边诸多个,表现出出奇的优良特性,也就是它和超额收益有较好的线性关系,大市值和小市值的超额收益基本是相反的。通过对比其实展现的内容,每个人可能解读有所不同。在我看来,2008年前的一波行情可能真的是波大行情,连大盘股都能带动领涨。但是后来,小市值逐渐显露出特别猛的尽头。一个原因,后来逐渐追捧高成长预期,推动估值增高,这样小盘股这样情况下逐渐被挖掘出来。另一个就是炒作和情绪化的产物,依稀记得有些行情中价格较低的一个个被抬起来,其实很多都没有太好的基本面支撑。小盘股的灵活性被充分调用,造就了小盘股的神话。

最大1%

最小1%

最大5%

最小5%

一个小结

可以看出,很多财务指标在对于收益率影响方式上都不是线性的,至少全部行业混在一起是不是简单的线性关系,这需要在具体策略实际构建时进一步展开分析。本系列的下一篇中我们会展示十个成长因子:ROE、ROE变动、ROA、ROA变动、EPS增长率、主营业务增长率、主营业务利润占比、营业利润比、收入净利率和收入净利率变动,敬请期待。

函数和变量说明书

到JoinQuant查看策略并与作者交流讨论:【量化课堂】因子研究系列之一 -- 估值和资本结构因子

精彩讨论

全部讨论