Python数据分析学习文章归纳

本文搜集我学习实战过程中看到的好文,和自己学习总结的一些文章,持续更新

数据分析如何入门学习How do I learn data analysis with Python?

虽然是英文的,不过看一遍很大收获(可以用百度翻译看一下)

Numpy使用

  • 快速入门Numpy
  • Stack Overflow Numpy问题汇集
  • 书籍推荐NumPy Cookbook -第二版 by Ivan Idris(用中文版)
  • 8.3 更新,自己的笔记,凑合看下吧,有些我觉得没太重要的就没记上去(也包括Matplotlib的那一部分)
  • 待续

Pandas使用

  • 入门级神作,没错就是10 Minutes to pandas
  • 进阶级神作,没错就是Stack Overflow Pandas问题汇集——>强烈推荐

    Pandas is a Python library for Panel Data manipulation and analysis, e.g. multidimensional time series and cross-sectional data sets commonly found in statistics, experimental science results, econometrics, or finance. IMPORTANT: When asking a question with this tag, please tag your questions: [python]; [pandas]; [dataframe]/[series]; (optional) [groupby]/[merge]/etc., depending on your specific requirements.

  • Pandas神书Pandas Cookbook

  • Pandas数据结构之Series:

    • 【pandas】[1] Series 入门(创建和增删改查)
    • Pandas中兼并数组和字典功能的Series

    Series也就是Numpy的一维数组,很多方法是通用的。以上两篇足以掌握。
    关键是DateFrame使用

  • pandas分块处理大文件
  • drop函数使用————>强烈推荐
  • Pandas GroupBy对象——>强力推荐,系统的讲了groupby对象创建及一系列函数使用
  • Pandas合并与重塑
    • PANDAS 数据合并与重塑(concat篇)
    • PANDAS 数据合并与重塑(join/merge篇)
  • isin()函数用于构建布尔对象,便于删选dateframe的行, pandas中isin()函数及其逆函数使用
  • 建议用loc和iloc选择行
    • loc以行索引和列索引key来选择元素
    • iloc以行列所在的整数索引来选择元素,不过都从0开始
  • 待续
  • matplotlib使用

    • 自己的笔记,凑合看下吧,有些我觉得没太重要的就没记上去(也包括Matplotlib的那一部分)
    • 推荐B站上的一个up主的视频,莫烦·Matplotlib中文视频教程——基于python3,看完差不多就OK了

    Scipy

    因为还不怎么用,所以以后再说吧。。。
    - Scipy Doc

    杂文汇集

    • Python读取文件以及读取大文件
    • gensim之Word2vec使用

    心得:多动手,别只看

    你可能感兴趣的:(Python学习,NLP自然语言处理记录)