数据实操和量化策略上路的一次分享

假期分享

数据实操和量化策略指引

Tushare线上活动

在新型冠状病毒疫情漫向全国的这个春节里,绝大多数人都被迫自行隔离在家里,吃吃喝喝,躺躺坐坐,浑浑噩噩。

有的人享受这“天上掉下来”的长假,甚是惬意,巴不得且过下去。有的人却是如坐针毡,度日如年,期望能早入回到工作岗位,回归正常的工作生活状态。

但事实是,只能看着新闻刷着微博朋友圈,无奈的继续等待疫情的结束。不外出,不往来,就是在为战胜疫情贡献力量。

大家在社区里讨论着抗艾滋病药物可以抵抗新冠病毒,也看到双黄连可以抑制新冠病毒,后来又发现阿比朵尔、达芦那韦也可以抑制病毒,但大家都感觉很难让每天的新增病例减少。

终于,有人在社群里发出了积压在内心很久的呼唤——学习Python可以抵抗新型冠状病毒。我以惊叹加敬佩的眼神拱手一礼:真他哥的有道理!

在几个爱学习,同时愿为抗击病毒做出贡献的几个用户的怂恿下,在经过了对Tushare社区用户画像分析后,我紧急的搞出了一个学习培训方案。也就是从金融数据的基础业务知识,数据的采集和入库,量化策略的入门实现方面做了一个讲义。当然,借此机会,必然也少不了对Tushare发展历程和理念做一次汇报。

在短短的两天时间里,在付费的情况下报名人数达到了400多,可见大家认真学习的态度,以及对抗击新型冠状病毒的决心。

课程培训从晚上8点开始,直到22点40分才正式结束,期间对金融数据和信息公司,对爬虫实现,对量化投资的历史和2019年现状做了详细解说,中间穿插代码和效果演示,还算是比较成功。

于是,今天再次整理,发布到公众号,希望对有兴趣有需求的小伙伴有所帮助。

一、铺垫部分

量化投资的基础是数据,以及围绕数据的各类信息处理。如果对数据不了解,包括数据的种类,数据的来源,已经数据的采集不熟悉,可能很难真正的做好量化投资。

所以,在第一部分,主要从量化投资常用的数据进行了解说,包括这些数据的特点和难点等关键信息展开了说明。

了解了主要数据及其重要性之后,继续讲解数据的主要渠道来源。以亲身经历和体会例举了国内外常用的数据源供应商,包括这些公司的服务方式,服务特点,以及服务过程中的“潜规则”。

数据之后,我们也延伸到了对量化投资现状的说明,包括2019年市场上私募量化产品的表现以及背后的私募公司做了介绍。

2019年表现较好的私募公司和量化产品情况:

二、数据采集和落地入库实操

在数据采集方面,我们从容易实现,最低成本,以及最优方式角度对数据的提取做了详细介绍。

从针对个人投资者来说,免费数据应该是大家优先考虑的选项。我们介绍了三种形式:

免费数据及落地

● 免费金融终端数据采集

    1、无需编程导出数据

    2、历史数据文件读取

● 金融网站数据爬取

    1、AJAX模式的JSON数据抓取

    2、HTML格式的内容提取

● Tushare数据调取

    1、Tushare接口设计的特点和各类数据说明

    2、Tushare数据的最优调取方法

● 数据入库落地最优方案

    1、入库MySQL的实现

    2、入库MongoDB的实现

以上内容,全部用可运行的源代码进行了讲解和演示。代码也随培训群发送到共享文件夹内,用户可以下载直接运行和扩展使用。

以下是代码目录结构和程序:

相信对绝大数的用户在数据采集和落地方面都会有很大的帮助,最关键是了解为什么。

三、量化投资入门,开发第一个策略

在开发策略之前,首先介绍了国内各大量化平台的特点和各自的现状,以及从亲身经历的互动中讲解了个平台的发展故事。

之后,对实现一个标准量化策略的关键要素进行了说明。帮助用户从最简单的角度理解和实现一个量化策略。

同时,从一个实例出发,演示了策略的开发和运行过程,让用户从最直观的场景理解量化策略,从而可以开始自己的量化投资之旅。

疑问

一些用户问,还可以看培训课程吗?

课程虽然已经结束,但社区小伙伴对培训过程全程录像了,已经发布到培训群文件里。如果还有兴趣,有需求的小伙伴,可以私信“培训”关键字到本公众号(发聊天信息给公众号)获取方法,也算是对Tushare的支持。

另外,给需要新开股票账户以及希望切换最低佣金的券商账户的小伙伴争取到了最低佣金开户(头部券商,万1免5),请私信“开户”关键字。

雪球转发:1回复:2喜欢:4

全部评论

Tushare挖地兔02-08 20:24

谢谢,还可以看视频的

cacool02-05 23:24

兔哥,怎么没在雪球通知一下。错过学习的机会了。。。
另外,有没有收款的渠道让用户支持一些云费用?Tushare功能太强大,免费用户用得不好意思了。