今天主要给大家介绍的是使用python爬取网易财经模块股票的历史数据.先来介绍一下环境:
原始文档:http://mp.weixin.qq.com/s/18H_MYCKT3MMXM13WQCOqQ
1、版本:python2.7
2、使用beautisoup模块
以仙珺制药(股票代码:002332)为例,首先打开获取历史股票行情的网页,网页地址为:http://quotes.money.163.com/trade/lsjysj_002332.html?year=2017&season=1本文主要获取从上市时间到目前为止所有的行情数据.网页截图为如下:
网页源码如下:下面就是使用python爬取数据信息
爬取数据为分为一下几个步骤:
def down_load(url,try_times=2):
req = urllib2.Request(url)
try:
response = urllib2.urlopen(req)
html = response.read()
return html
except urllib2.URLError as e:
print 'down error',e.reason
html = None
if try_times > 0 :
if hasattr(e, 'code') and 500 <= e.code < 600:
return download(url,try_times-1)
soup_pakge = BeautifulSoup(html)
#解析html先解析表头
#print(HEADERS)
soup_head=soup_pakge.findAll('table','table_bg001 border_box limit_sale')
获取源码请关注公众号(CPPguy),发送:股票.就会接收到下载代码的链接和密码.
原始文档:http://mp.weixin.qq.com/s/18H_MYCKT3MMXM13WQCOqQ