股票型公募基金分析之序章

发布于: 雪球转发:0回复:0喜欢:0

从上一年开始,很多学生就问我基金的问题,都想让我推荐基金给他们。由于我比较擅长分析底层资产,所以我只能教他们一些分析基金的基本方法,加上我自己也没有时间分析那么多基金公司。最近和一位从事金融行业吃饭的时候谈到国内金融机构内部运作的时候,他的言语勾起了我对研究基金公司的兴趣。考虑到私募基金的内部信息是不公开的,所以本人将公募基金作为本期的主题。本人不在任何金融机构任职,搜索到的信息都是公开披露的信息,研究方法都是总所周知的,如果本人的研究有任何疏漏,请大家见谅并且立刻指出,避免对公众产生误导。

在开始对公募基金进行深入调研之前(说实话,我也没那个能力进行深入调研=)),本人采用一贯的风格,采用大数据对公募基金(以下简称“基金”)进行粗略的量化分析。截至2021年8月19日,国内基金市场一共有175家基金公司,基金管理规模为234749.33亿人民币,其中股票型基金数量为2324只,管理规模为21217.56亿人民币(来源:东方财富Choice数据)。毕竟本人最关心的是股票,所以在本次分析中将以股票型公募基金作为分析对象。

确定了分析对象之后,需要确定分析所需的样本。使用爬虫在天天基金网上收集1672只股票型公募基金的数据(截至2021年6月30日),包括基金公司名称、基金名称、管理规模、基金经理姓名、基金经理从业经历、前十持仓比例。由于部分基金已经清盘或者网站上缺少数据,因此我们所得到的具有有效数据的基金数目为1415只,它们的资金管理规模为13929.23亿人民币,占所有股票型基金管理规模的65.65%。

首先,我们从总体来看这些基金公司总体前二十持仓的是哪些上市公司。

从上述数据,我们可以知道,前十持仓市值为¥1,917.27(占所有样本管理规模13.76%),前二十持仓市值为¥2,657.09(占所有样本管理规模19.08%);其中,第一位是酒业,市值为¥1,121.36(占所有样本管理规模的8.05%);紧随其后的是新能源产业,市值为¥556.10(占所有样本管理规模的3.992%);第三位是医疗行业,市值为¥365.67(占所有样本管理规模2.65%)。

为了了解基金公司的投资策略,我们对样本基金公司的持股相似度进行了聚类分析(本次分析采用Sci-learn库中的KMeans聚类算法)。到目前为止,我们是不知道基金公司的投资策略的,尝试让数据去反映样本基金公司的投资策略。首先,我们根据基金公司前十持仓情况,将这1415只基金划分为5个群落,得到的结果如下:

上述数据表明,将这1415只基金的前十持仓情况划分为5类,我们可以看到这些基金前十持仓的分布差别相当大,其中第3类的基金数量最多,有861家,是拍第二名的第5类的基金数量的三倍以上。为了研究是否存在大量基金集中持有少量上市公司股票,我们将逐步扩大类别的数量,如果某一类别的基金数量与类别数量相关性较低,那么我们将具体研究不同类别数量下基金数量最多的类别的持股情况。我们首先以5个类别开始,然后为了减少电脑计算量每次增加10个类别,最终以140个类别结束,从而观察随着类别数量增加,大致了解基金聚集的变化情况,具体见下图:

上图横坐标是类别的数量,纵坐标是基金数量最多最大类别中的基金数量。根据上图,我们会发现,随着类别数量在45到100之间的时候,基金数量最多最大类别中的基金数量大致保持在550至600。如果将这1415只基金比作是一个宇宙中的星体,我们将类别数量设置为5的话,那么通过聚类分析我们就可以将所有星体分成5个类别,每个类别中的星体都与对应类别的中心距离最近。回到我们分析基金的案例,每只基金的前十持仓就好像是每个基金的坐标,我们试图通过聚类分析,观察基金前十持仓的相似性。我们测试性地将类别数量定为100,得到的结果是基金数量最多的类别中一共有542只基金,前十持仓市值约为505亿人民币;基金数量第二多的类别中一共有173只基金,前十持仓市值约为287亿人民币;基金数量第三多的类别中一共有47只基金,前十持仓市值约为455亿人民币;前三个基金数量类别最多的类别的前十持仓市值约为1248亿人民币。

利用上述方法,我们可以就以下方向进行研究:

1、 通过具体分析每个类别中的基金风格、前十持仓比例、基金经理名称,如果在同一个类别中,某一只主动型基金的前十持仓与同类别的某只被动型基金十分接近,那么我们可以认为,主动型基金的基金经理并没有对该只基金进行主动管理,采用的策略与被动型基金类似。从投资者的角度,投资与该主动型基金处于同一类别的被动型基金更具有成本优势和更低的基金管理风险。

2、 如果位于同一个类别中的主动型基金数量庞大,那么我们有理由怀疑这些基金很有可能采用的是同一种投资策略,从而让我们了解基金的持仓风险。

3、 通过分析主动型基金总体前十持仓比例,了解主动型基金持仓标的的集中程度、持仓风险、管理风险等因素。

在后续几期里面,我们将对持有市值占比较高的几个类别的股票型公募基金公司进行深入了解,不排除在分析研究过程中发现部分基金摸鱼的情况,但是为了避免分析研究中出现疏漏而造成对基金声誉造成影响,继而导致我们暴露在法律风险下,因此,在后续的分析过程中,将不会公布任何基金的名称。