Tushare学习与使用(三)
上一篇简单介绍了如何获取一个股票的历史行情数据,因为Tushare对于接口调用次数是有限制的,所以接下来介绍如何高效获取多个股票的历史行情数据以及获取股票分钟级数据。主要参考了Tushare的官网用户手册:https://tushare.pro/document/1?doc_id=230
高效获取行情数据
Tushare的行情等时间序列数据,一般都有两个常用参数:trade_date和ts_code,分别是交易日期和证券代码。如果你是想提取部分个股的历史数据,用ts_code参数,加上开始和结束日期可以方便提取数据。
但是如果是要获取所有历史数据,官方不建议通过ts_code来循环,而是用trade_date来提取,道理很简单,股票有3800多个,需要循环3800多次,每年的交易日也就才220左右,所以效率更高。总的来说,积分越高可以调取的频次会越高。
首先,在循环提取数据时,首先我们可以通过交易日历拿到一段历史的交易日。
#获取20200101~20200401之间所有有交易的日期
df = pro.trade_cal(exchange='SSE', is_open='1',
start_date='20200101',
end_date='20200401',
fields='cal_date')
print(df.head())
然后会得到所有的交易日。
cal_date
0 20200102
1 20200103
2 20200106
3 20200107
4 20200108
循环过程中,为了保持数据提取的稳定性,可以先建立一个专门的函数,实现一个重试机制:
def get_daily(self, ts_code='', trade_date='', start_date='', end_date=''):
for _ in range(3):
try:
if trade_date:
df = self.pro.daily(ts_code=ts_code, trade_date=trade_date)
else:
df = self.pro.daily(ts_code=ts_code, start_date=start_date, end_date=end_date)
except:
time.sleep(1)
else:
return df
然后通过在循环中调取数据:
for date in df['cal_date'].values:
df = get_daily(date)
获取分钟级行情数据
可能有的小伙伴会需要获取更细致的股票、指数、基金、期货、数字货币在内的各类资产交易行情的分钟数据,Tushare也是支持的。
目前分钟频度包括1分、5、15、30、60分数据。如是end_date输入的是不带时分秒的日期,返回的数据不包括end_date当日,即数据返回的是 < end_date的数据。分钟数据时间参数请使用带时分秒的格式,比如:2019-06-04 19:00:00。数据每天收盘后处理更新,时间在17~21点之间完成。
下面以获取股票分钟级数据为例:
import tushare as ts
#获取股票1分钟数据
df = ts.pro_bar(ts_code='600000.SH',
freq='1min',
start_date='2020-01-07 09:00:00',
end_date='2020-01-08 17:00:00')
print(df)
ts_code trade_time open close high low vol
0 600000.SH 2020-01-08 09:31:00 12.41 12.44 12.45 12.41 880140
1 600000.SH 2020-01-08 10:14:00 12.37 12.37 12.38 12.37 61300
2 600000.SH 2020-01-08 10:19:00 12.36 12.36 12.37 12.36 288400
3 600000.SH 2020-01-08 10:29:00 12.34 12.33 12.35 12.33 119100
4 600000.SH 2020-01-08 10:33:00 12.33 12.33 12.34 12.33 218700
5 600000.SH 2020-01-08 10:59:00 12.38 12.37 12.38 12.36 76600
6 600000.SH 2020-01-08 11:09:00 12.37 12.36 12.37 12.36 44777
7 600000.SH 2020-01-08 11:15:00 12.37 12.37 12.38 12.37 67500
8 600000.SH 2020-01-08 13:08:00 12.36 12.37 12.37 12.36 72300
9 600000.SH 2020-01-08 13:10:00 12.36 12.37 12.37 12.36 43300
10 600000.SH 2020-01-08 13:15:00 12.35 12.36 12.36 12.35 46900
11 600000.SH 2020-01-08 13:27:00 12.33 12.34 12.34 12.33 29300
12 600000.SH 2020-01-08 13:31:00 12.33 12.35 12.35 12.33 102301
13 600000.SH 2020-01-08 14:05:00 12.30 12.29 12.30 12.29 88000
14 600000.SH 2020-01-08 14:09:00 12.30 12.30 12.30 12.29 26400
15 600000.SH 2020-01-08 14:15:00 12.28 12.28 12.29 12.28 80926
16 600000.SH 2020-01-08 14:45:00 12.30 12.31 12.32 12.29 226800