大数据分析进阶之python财经数据抓取

大数据分析进阶之python财经数据抓取

  • Python常用数据分析包:

    Pandas:数据分析

    Nltk:自然语言处理

    Scikit:人工智能和机器学习

    Numpy/scipy:矢量数据和科学计算

    Sympy:符号计算

    Gpu:并行超速运算

    Opencv:图像视频处理

    TVTK/mayavi:可视化

大数据分析进阶之python财经数据抓取_第1张图片
  • 财经数据接口包

  • Pandas

    Python Data Analysis Library 或 是基于NumPy 的一种工具,是python的一个数据分析包。

    Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。

    Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。

  • 大数据分析进阶之python财经数据抓取_第2张图片


Pandas返回的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。
大数据分析进阶之python财经数据抓取_第3张图片
使用pandas自带财经数据接口,能够获取雅虎财经、世界银行等财经数据。
大数据分析进阶之python财经数据抓取_第4张图片

TuShare

TuShare是一个免费、开源的python财经数据接口包。

主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据,为他们在数据来源方面极大地减轻了工作量,使他们更加专注于策略和模型的研究与实现上。


大数据分析进阶之python财经数据抓取_第5张图片
TuShare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。
大数据分析进阶之python财经数据抓取_第6张图片
使用TuShare自带财经数据接口,能够获取新浪财经的证券、宏观等财经数据。
大数据分析进阶之python财经数据抓取_第7张图片
使用TuShare自带财经数据接口,能够获取即时新浪财经数据、新浪股吧数据、个股信息地雷数据等数据。
大数据分析进阶之python财经数据抓取_第8张图片

接口简单易懂,返回的数据格式规整,非常便于处理分析!

  • 数据挖掘实验室

持续追踪大数据和数据新闻前沿,通过自然语言处理、机器学习、R等大数据处理手段和D3、Echarts等数据可视化方法,玩转大数据驱动新闻。


你可能感兴趣的:(python)