教你如何用python爬取A股财务报表(含代码)

 量化交易除了在K线上可以有所应用,还可以用于基本面的操作,在处理数据之前首先要获取数据,网易财经给我们提供了一个方便的API接口,这样就不必在其他资讯网里面使用收钱的API

教你如何用python爬取A股财务报表(含代码)_第1张图片

抓下来的数据都是CSV格式,财务报表有利润表、资产负债表、现金流量表(本来应该还有一个所有者权益表我没找到)。

教你如何用python爬取A股财务报表(含代码)_第2张图片

  在网页和程序当中都使用拼音第一个字母小写代替(lrb,zcfzb,xjllb)

  接下来直接上代码,使用的是python3.6.6环境是用anaconda搭建

import re,urllib
import xlwt from bs4 import BeautifulSoup from time import sleep count = 1 for count in range(600500,603800): url = 'http://quotes.money.163.com/service/lrb_'+str(count)+'.html' while True: try: content = urllib.request.urlopen(url,timeout=2).read() print(content) with open('../利润表/'+str(count)+'lrb.csv','wb') as f: f.write(content) print(count) sleep(1) break except Exception as e: if str(e) =='HTTP Error 404: Not Found': break else: print(e) continue

  ok,就这么简单就完成啦,可以复制改一下路径然后就可以把三个表一起下下来了,这个程序里已经做了容错,所以在抓完所有数据之前不会自动停下(除非手工停止)。

  如果对你有帮助可以收藏点个赞~

你可能感兴趣的:(教你如何用python爬取A股财务报表(含代码))