怎么自学Python?学习路线?

Python其实是所有人都应该学习的万能语言,随着互联网的发展,越来越多的人都在学习Python,把Python作为主要的开发语言。

那首先就是因为Python的应用领域非常广泛,像网站开发,数据分析,智能问答,自动化测试,机器人,人脸识别等都有Python的应用,其次是国家正在大力推广Python的学习,小学高中大学都已经引入了python课程,在PYPL编程语言排行榜中也名列前茅,所以学习python是紧跟时代潮流,是未来职业发展不可或缺的一项职业技能。

最后就是Python语言简单易学,开发代码少,精确表达需求逻辑,33个关键词,7中基本数据类型。语法规则简单,接近自然语言。

下面是Python学习路线,可以提供下参考建议哦~

系统地自学Python分为以下五个阶段:

一、Python基础阶段

掌握python脚本、python界面编程能力、数据库、基本爬虫、多线程多进程开发能力,可以胜任基本的python开发工作。知识点:

1.数据的存储:Python概述、进制以及进制转换、原码、反码、补码、第一个Python程序、终端读取与打印等。

2.运算符与表达式:关键字和标识符、算术运算符、python数据类型、赋值运算符、运算符、复合运算符、条件控制语句(if…else…)、逻辑运算符等。

3.循环:循环语句之while、循环语句之for、break与continue语句等。

4.基础数据结构:Number与数学函数操作、String(查找,替换,下标索引、列表(常用)、元祖、字典(常用)、set集合、迭代器与生成器(常用)、函数概述等。

5.函数:函数的调用、简单函数的定义、函数的返回值、传递参数、关键字参数、默认参数、不定长参数、匿名函数、装饰器、偏函数、回调函数、变量的作用域、递归函数、目录遍历、递归遍历目录、栈模拟递归遍历目录(深度遍历)、队列模拟递归遍历目录(广度遍历)等。

6.模块:模块概述使用标准库中的模块使用自定义模块name属性包的概述安装第三方模块virtualenv与时间相关模块。

7.面向对象编程:面向对象思想、类与对象、类的方法与属性、构造函数与析构函数、self的使用、重写__ repr__ 与__str__ 函数、访问限制等。

8.继承、封装、多态 :单继承的实现、多继承的实现、函数重写、人开枪射击子弹小案例、多态、对象属性与类属性、类方法与静态方法等。

9.面向对象高阶:动态添加属性方法、property、运算符重载、发邮件与发短信等。

10.文件操作与异常处理:StringIO与BytesIO、文件的管理操作、文件读写(csv、txt)操作、异常处理等。

11.高阶函数与测试:调试(打印、断言、logging、pdb)

12.排列组合与正则表达:破解密码(排列、组合、排列组合)、正则表达等。

13.网络编程:TCP/IP简介、TCP编程、UDP编程等。

二、Linux和数据库阶段

掌握Linux操作系统管理技术,可以搭建几乎所有Linux环境服务器。知识点:

1.Linux操作系统:常见操作系统、操作系统发展历史、系统的使用、Linux版本、Linux应用领域、虚拟机与Vmware的安装、Linux版本与Ubuntu 16.04、配置自己的Linux系统、编程IDE的安装、apt-get安装软件包。

2.文件系统与用户管理:目录访问、文件与目录的管理、文件的权限、用户管理。

3.文本操作命令:文本命令、文本编辑器Vi/Vim。

4.网路命令、进程管理与服务配置:网络管理命令、系统目录、重要系统文件、设置开机启动与登陆启动、IP配置、服务的启动停止、防火墙配置。

5.Shell编程与bash、源文件编译:基础IO操作、流程控制、定义变量与环境变量、脚本传参、定时任务、定时系统操作。

6.版本控制:Git的安装与配置、GitHub的注册与使用、Clone与Fork、Git常用命令、标签、分支与源、多人协作开发。

7.MySQL基本使用:MySQL的安装、MySQL简介、MySQL基本命令脚本、MySQL与Python的交互。

8.MongoDB的基本使用:MongoDB安装、MongoDB的基本操作。

9.Redis的基本使用:Redis安装、Redis的基本操作、Redis的数据类型、Redis的备份与恢复。

三、Python web开发

掌握Python后端框架,解决前后端Web开发问题,知识点:

1.HelloDjango:BS/CS,MVC/MTV、Django请求流程、Admin管理。

2.Models:ORM、模型字段属性、CRUD、聚合函数,F,Q对象。

3.Models&Templates:模型对应关系、模板加载、静态资源、模板语法。

4.Views:路由规则、反向解析、请求与响应、会话技术cookie,token,ses-sion、文件上传。

5.Advanced:验证码、分页器、类视图、中间件、日志、缓存、信号、Cerlery、用户权限,用户角色。

6.RESTful:REST概念、HelloREST、数据序列化、请求与响应、视图,转换器、关系,超链接、认证和权限。

四、Python爬虫阶段

掌握分布式多线程大型爬虫技术,能开发企业级爬虫程序。

1.多线程原理:同步与异步、串联与并发、线程、开辟一个线程、线程安全与线程锁、多线程队列。

2.协程:线程的局限、协程的定义与原理、协程的实现。

3.爬虫的概念及相关工具:爬虫的概念及作用、HTTP协议原理、工具的安装、使用。

4.Python http libs:urllib的使用、示例requests库的使用、bs4库的使用、xpath语法。

5.爬虫实战:使用requests编写-个简单爬虫、改造requests爬虫为多线程版、利用redis改造多线程版爬虫至分布式。

6.scrapy框架:scrapy安装、创建项目、创建spider文件,编写parse方法、scrapy子命令、运行scrapy爬虫程序、命令行传递参数、进一步解析二级页面、parse方法之前传递参数、导出json、Csv格式的数据、scrapy爬虫的状态保存、item的定义、item的使用、pipeline的使用、使用pipeline将items存储至MySQ、Lscrapy整体架构、downloadermiddleware、使用downloadermiddleware实现IP代理池、spidermiddleware、scrapy插件、scrapy-redis。

7.量化交易:自动化交易理论、Python量化交易框架。

五、Python机器学习阶段

掌握Python数据挖掘分析,入门人工智能。知识点:

1.jupyter入门:jupyter软件安装、jupyter入门、numpy学习。

2.pandas:pandas入门、pandas-Series、pandas数据丢失、pandas索引、pandas数据处理、基于Pandas的人脸识别技术。

3.scipy:scipy学习

4.matpoltlib:数据可视化的概念、可视化图表的绘制、动画及交互渲染、数据的合并与分组。

5.KNN:临近算法、预处理、KNN相关函数。

6.线性回归与逻辑斯蒂回归:线性回归、逻辑斯蒂回归。

7.决策树与贝叶斯:贝叶斯学习、决策树学习。

8.SVM与K均值聚类:SVC学习

9.Kmeans: Kmeans学习

10.机器学习框架TensorFlow:机器学习、权重分配与优选方案、深度学习、自动化神经网络、AI网络的描述。

11.自然语言处理与社交网络处理:文本数据处理、自然语言处理及NLTK、主题模型、LDA、图论简介、网络的操作及数据可视化。

国外Python的使用率非常高,但在国内Python是近几年才火起来,Python正处于高速上升期市场对于Python开发人才的需求量急剧增加,学习Python的前景比较好。

大数据开发方向学习路线~

第一阶段 大数据开发入门

学前导读:从传统关系型数据库入手,掌握数据迁移工具、BI数据可视化工具、SQL,对后续学习打下坚实基础。

1.大数据数据开发基础MySQL8.0从入门到精通

MySQL是整个IT基础课程,SQL贯穿整个IT人生,俗话说,SQL写的好,工作随便找。本课程从零到高阶全面讲解MySQL8.0,学习本课程之后可以具备基本开发所需的SQL水平。

2022最新MySQL知识精讲+mysql实战案例_零基础mysql数据库入门到高级全套教程

第二阶段 大数据核心基础

学前导读:学习Linux、Hadoop、Hive,掌握大数据基础技术。

2022版大数据Hadoop入门教程
Hadoop离线是大数据生态圈的核心与基石,是整个大数据开发的入门,是为后期的Spark、Flink打下坚实基础的课程。掌握课程三部分内容:Linux、Hadoop、Hive,就可以独立的基于数据仓库实现离线数据分析的可视化报表开发。

2022最新大数据Hadoop入门视频教程,最适合零基础自学的大数据Hadoop教程

第三阶段 千亿级数仓技术

学前导读:本阶段课程以真实项目为驱动,学习离线数仓技术。

数据离线数据仓库,企业级在线教育项目实战(Hive数仓项目完整流程)
本课程会、建立集团数据仓库,统一集团数据中心,把分散的业务数据集中存储和处理 ;目从需求调研、设计、版本控制、研发、测试到落地上线,涵盖了项目的完整工序 ;掘分析海量用户行为数据,定制多维数据集合,形成数据集市,供各个场景主题使用。

大数据项目实战教程_大数据企业级离线数据仓库,在线教育项目实战(Hive数仓项目完整流程)

第四阶段 PB内存计算

学前导读:Spark官方已经在自己首页中将Python作为第一语言,在3.2版本的更新中,高亮提示内置捆绑Pandas;课程完全顺应技术社区和招聘岗位需求的趋势,全网首家加入Python on Spark的内容。

1.python入门到精通(19天全)

python基础学习课程,从搭建环境。判断语句,再到基础的数据类型,之后对函数进行学习掌握,熟悉文件操作,初步构建面向对象的编程思想,最后以一个案例带领同学进入python的编程殿堂。

全套Python教程_Python基础入门视频教程,零基础小白自学Python必备教程

2.python编程进阶从零到搭建网站

学完本课程会掌握Python高级语法、多任务编程以及网络编程。

Python高级语法进阶教程_python多任务及网络编程,从零搭建网站全套教程

3.spark3.2从基础到精通

Spark是大数据体系的明星产品,是一款高性能的分布式内存迭代计算框架,可以处理海量规模的数据。本课程基于Python语言学习Spark3.2开发,课程的讲解注重理论联系实际,高效快捷,深入浅出,让初学者也能快速掌握。让有经验的工程师也能有所收获。

Spark全套视频教程,大数据spark3.2从基础到精通,全网首套基于Python语言的spark教程

4.大数据Hive+Spark离线数仓工业项目实战

通过大数据技术架构,解决工业物联网制造行业的数据存储和分析、可视化、个性化推荐问题。一站制造项目主要基于Hive数仓分层来存储各个业务指标数据,基于sparkSQL做数据分析。核心业务涉及运营商、呼叫中心、工单、油站、仓储物料。

全网首次披露大数据Spark离线数仓工业项目实战,Hive+Spark构建企业级大数据平台

你可能感兴趣的:(python,学习,开发语言,大数据,数据挖掘)