提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
小小社畜业余学习过程中的随笔,尽量坚持,加油!
安装Python3.9,Anaconda3,Pycharm,电脑可用空间>5GB,电脑4核以上,不建议用古董机操作,我2013年的双核古董机亲测带不动。
要求具备一定编程基础及Python基础,最好对微积分和统计学常见算法也有所了解。缺编程的补编程,缺数学的边学边补数学。
求大神告诉我数学小白看哪个入门快?
编程小白推荐:黑马程序员Python小白快速入门教程——美女老师版
有基础的建议恶补:
NumPy(Numerical Python)是Python语言的一个扩展程序库,主要用于数组计算。
功能包括:多维数组、线性代数、傅里叶变换、随机数生成等。
两种对象:N维数组对象 ndarray和ufunc函数。
Pandas是Python的一个数据分析包,
它的使用基础是Numpy(提供高性能的矩阵运算),
用于数据挖掘和数据分析,同时也提供数据清洗功能。
Pandas的优势:能读写各种格式的数据源,且返回的对象相同,便于统一处理。并且为时间序列分析提供支持。
Matplotlib 是Python中使用最多的图形绘图库,可以创建静态, 动态和交互式的图表。常与NumPy库结合,广泛用于数据的可视化。
Seaborn是一个Python数据可视化开源库。
建立在matplotlib基础上,并集成了pandas的数据结构。
Seaborn通过更简洁的API来绘制信息更丰富,更具吸引力的图像。
面向数据集的API,与Pandas配合使用起来比直接使用Matplotlib更方便。
sklearn(scikit-learn) 是基于 Python 语言的机器学习工具。
建立在 NumPy ,SciPy 和 matplotlib 基础上。
功能:数据挖掘和数据分析。具体包括数据的加载、划分、预处理、降维。
Jupyter Notebook是一个开源Web应用程序,使用Jupyter Notebook可以创建和共享:
Jupyter Notebook用途
Jupyter Notebook是数据分析学习和开发的首选开发环境。
Jupyter的使用很方便,每次敲好一行或几行,就按一下Shift+Enter键,会自动执行本单元并且在后面新增一个空白区域可以继续输入。
如果写好了很多个代码块,也不需要顺序执行,可以直接单击要运行的地方,选中后按Ctrl+Enter键即可。
Shift-Enter:执行当前单元的代码,并跳转到下一个单元。如果当前是最后一个单元,则在后面新增一个单元并进入。这个操作类似点击主菜单的cell-run,或工具栏中的play运行按钮
Ctrl-Enter : 运行本单元
Alt-Enter : 运行本单元,在其下插入新单元
本文资料来源于互联网和黑马程序员,侵删。