【爬虫数据分析精华笔记】利用Python进行数据分析从零基础到完整实现的笔记整理

一共 15 篇随笔,主要是为了记录数据分析过程中的一些小 demo,分享给其他需要的网友,更为了方便以后自己查看,15 篇随笔,每篇内容基本都是以一句说明加一段代码的方式, 保持简单小巧,看起来也清晰 ,一共可以划分为三个大部分:
第一部分简单介绍数据分析,以一个小例子简单说明了什么是数据分析和 IPython 工具;
第二部分是 NumPy 的基础使用,NumPy 是 Python 包,提供科学计算功能,主要是 ndarray 数组对象;
第三部分是 pandas 的基础使用,主要是 Series 和 DataFrame 对象,这两个对象提供了处理结构化数据相关的数据结构和函数,pandas 的矢量操作对数组来说很方便,可以很轻松地完成很多对数据的处理,比如数据清洗、转换与合并。

第一部分 简单介绍

  • (1) 简单介绍
  • (2) 尝试处理一份JSON数据并生成条形图
  • (3) 使用IPython提高开发效率

第一部分 NumPy基础

  • (4) NumPy基础: ndarray简单介绍
  • (5) NumPy基础: ndarray索引和切片
  • (6) NumPy基础: 矢量计算

第一部分 pandas基础

  • (7) pandas基础: Series和DataFrame的简单介绍
  • (8) pandas基础: Series和DataFrame的基本操作
  • (9) pandas基础: 汇总统计和计算
  • (10) pandas基础: 处理缺失数据
  • (11) pandas基础: 层次化索引
  • (12) pandas基础: 数据合并
  • (13) pandas基础: 数据重塑/轴向旋转
  • (14) pandas基础: 数据转换
  • (15) pandas基础: 字符串操作

其实数据分析不仅仅只有这些,还有其它几个大的方面还没有涉及,比如数据的读取存储和数据的可视化,不过我打算先去学习下数据挖掘的知识,再回过头来继续学习数据分析的知识,我觉得这样更更适合我,所以接下来我会继续记录分享一些数据采集方面的知识,对这方面感兴趣的朋友欢迎关注本博客,也欢迎大家添加评论进行讨论。



文/杨存村長
原文链接:http://www.jianshu.com/p/5eb45f165707


【关于我们】

内推君(微信众号ourpush),专注于国内各大互联网公司社会招聘内推。每天更新最新互联网名企(包括但不限于网易游戏、BAT、网易互联网、小米、京东、乐视、携程等名企)内推信息,有技术岗、有产品岗、有运营岗、有设计岗、有交互岗、有销售岗,更有其他N多相关岗位!更多内推信息请扫描以下二维码关注查阅。


你可能感兴趣的:(大数据与云计算)