我们现在要检验这个tick数据的正确性,我们可以通过取日数据
df_day = jd.get_price('600769.XSHG',start_date='2018-07-02',end_date='2018-07-10',fq=None)
然后将tick数据按日重采样
d1 = df_tick.price.resample('1D').mean()
d1.dropna(inplace=True)
d2 = pd.concat([d1, df_day.close], join='inner', axis=1)
d3 = d2[abs(d2.price / d2.close - 1) > 0.15].index.astype(str).tolist()
如果tick数据的平均价格和日数据的收盘价价差在15%以上,就认为tick数据有问题,另外还可使用成交量来验证数据
d1 = df_tick.volume.resample('1D').sum()
d1.dropna(inplace=True)
d2 = pd.concat([d1, df_day.volume], join='inner', axis=1)
d3 = d2[abs(d2.volume / d2.volume - 1) > 0.1].index.astype(str).tolist()
如果通过tick统计的成交量和日数据中的成交量有10%以上的差异,同样认为tick数据存在错误,通过这两种方式,可以大体的对tick数据初步验证,为后续模型的正确性做个预防。
原文:网页链接