轻松入门Python爬取基金数据

轻松入门Python爬取基金数据_第1张图片

美国疫情越来越严峻,大选也进入了最后阶段,受之影响美股指数也在在下行中。最近的A股也在跟随美股没有什么起色,一直在动荡整理之中。玩股票基金的同学们,最近大家的仓位控制的怎么样?为了更好的科学分析基金,今天将和大家一起学习如何使用Python爬取基金数据。

下面我们将一起学习爬取基金数据,在这之前我们先做一些准备工作,配置好我们的环境。这里需要用到几个Python库需要安装:

  • requests:它是一个HTTP 库,可方便的进行web访问;
    pip install requests
    
  • PyExecJs:它是一个js的执行库,后面我们将会了解到为什么需要这个库;
    pip install PyExecJs
    
  • matplotlib和numpy:这两个库用于图形化数据分析,大家可以根据《数字信号处理没有Matlab?用Python一样很爽》进行安装;
  • 其他:还需要其他库可根据自己需求进行安装。

根据上面的要求环境配置完成后,就可以进行数据爬取了。

天天基金网是国内知名的基金理财网站,日活用户比较高,有较为专业全面的基金数据,数据更新也较为及时。我们今天就使用Python爬取天天基金网上的数据。

天天基金网地址:https://fund.eastmoney.com

我们进入天天基金网,选取一款基金,我这里就选择银河沪深300价值指数(519671)作为例子。

轻松入门Python爬取基金数据_第2张图片

那么问题来了,要爬取基金数据我们要找到数据在哪儿?

在我们选择的银河沪深300价值指数(519671)基金页面里,按F12打开调试窗口。

轻松入门Python爬取基金数据_第3张图片

在调试窗口中选择Network选项,然后再F5重新载入页面,左侧Name栏将会有各种元素列出来,我们找到519671.js?v=20201026224444并选中,我们再右侧将会看到url地址,如下图。这个地址就是我们获取基金数据的接口。其中,519671是基金代码,20201026224444是当前时间。大家可以按照这个格式根据需要对这两个修改即可。

轻松入门Python爬取基金数据_第4张图片

那么,我们需要爬取的数据是什么样的呢?可以选择Preview选项,如下图,我们就可以看到关于基金的详细数据。因为这里的数据是js格式的,因此我们就需要PyExecJs库解析这部分代码。

轻松入门Python爬取基金数据_第5张图片

以上,我们知道了如何获取基金数据的地址和如何解析基金数据,下面我们就开始使用Python实践一下吧。


import requests
import execjs
import numpy as np
from matplotlib import pyplot as plt

url = "http://fund.eastmoney.com/pingzhongdata/519671.js?v=20201026224444"
content = requests.get(url)

jsContent = execjs.compile(content.text)
name = jsContent.eval('fS_name')
code = jsContent.eval('fS_code')

#单位净值走势数据
netWorthTrendData = jsContent.eval('Data_netWorthTrend') 
#累计净值走势数据
ACWorthTrendData = jsContent.eval('Data_ACWorthTrend')

netWorthTrend = [v["y"] for v in netWorthTrendData]
ACWorthTrend = [v[1] for v in ACWorthTrendData]

plt.figure()
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] = False

#单位净值趋势图
plt.subplot(2,1,1)
plt.title(name + " ( " + code + " ) " + "单位净值")
plt.plot(netWorthTrend)

#累计净值趋势图
plt.subplot(2,1,2)
plt.title(name + " ( " + code + " ) " + "累计净值")
plt.plot(ACWorthTrend)

plt.show()

下图就是我们利用爬取的数据画出的单位净值趋势图和累计净值趋势图。

轻松入门Python爬取基金数据_第6张图片

现在我们理解了爬虫了原理,接口中也提供了大量的数据,后面就需要大家根据自己的需求发挥自己的想象,去实现更多丰富的功能,赶快动手试下吧!

特别提醒:投资有风险,入市需谨慎,本文不推荐任何基金或股票,文中所用基金仅供大家学习使用。

感谢大家耐心的阅读,希望都有所收获,也欢迎大家关注微信公众号【Will的大食堂】,一起交流学习。
轻松入门Python爬取基金数据_第7张图片

你可能感兴趣的:(Python)