你好, 我想请教一个关于数据时间戳连续性的问题.
我下载是美国的期货数据,所以没有办法使用rqdata.
下面是一个例子:
很明显并不是每一分钟都有数据.
数据商的说法是, 如果某一分钟没有交易,那么这一分钟就不会提供k线.
我看了两个数据商,貌似都是这样相似的设计.
请问大家, 这样的数据需要填充中间缺失的分钟的数据吗?
非常感谢!
你好, 我想请教一个关于数据时间戳连续性的问题.
我下载是美国的期货数据,所以没有办法使用rqdata.
下面是一个例子:
很明显并不是每一分钟都有数据.
数据商的说法是, 如果某一分钟没有交易,那么这一分钟就不会提供k线.
我看了两个数据商,貌似都是这样相似的设计.
请问大家, 这样的数据需要填充中间缺失的分钟的数据吗?
非常感谢!
是的,需要填充,其实国内也会,可能看交易所,我之前也发现自己录的数据分钟缺少几个bar,后面对比发现是没有交易数据,rqdata和Joinquant都会自动填充。
谢谢!
仔细看了一下vnpy的逻辑,感觉还是有一定的疑问.
按照bargenerator 里面update tick的逻辑, 如果某一分钟没有任何tick数据推送, 那么这一分钟的minute bar就不会合成.
那么如果这样的话, 自己做的1min数据如果强行填充缺失的minute, 就和实盘会不一样.(实盘的minute bar 都是tick 合成的)
另外, 同理如果用下载的tick data 回测, 按照vnpy的bar generator合成k线的逻辑, 也会和自己填充缺失分钟的minute bar数据回测结果不一样.
我现在反倒觉得是不是不应该填充缺失的分钟的数据?
大家怎么看这个问题?
这个设计到数据精度问题,和策略方式。即便是补上的bar,交易量也是为0的。
如果按照cta这样跟指标,按照bar个数计算均线什么,还是补上比较平滑。
当然那段时刻没有成交,可能有挂单,所以其实还有意义。;当然最全面历史数据最好不但成交tick,还包括挂单信息orderbook。
赞, 谢谢你的建议. 我也是感觉不补上cta指标会有问题,这是最担心的.
估计还是那种成交量比较大的合约这个问题比较小. 还是得尽量找流动性高的.
从价格博奕来说,没有成交,说明价格也是多空都接受的;只有价格分歧才引发交易。
当然,其实看挂单表才知道,如果挂单都没几个,真的流动性不足,