一幅图讲清楚Python在大数据与人工智能时代的地位

大数据与人工智能时代,掌握Python基础后,我们可以选择数据分析方向、人工智能方向、全栈开发方向...

一幅图讲清楚Python在大数据与人工智能时代的地位_第1张图片


如果想要追赶 Python 的热潮,应该如何学习呢?除了自学之外,多数人都会选择在线课程作为辅助。选择课程的衡量标准是什么呢?我认为有以下几条坑不能踩:

|| 是否针对零基础入门?

零基础入门分为三种情况:一种是之前接触过计算机编程,但并没有熟练掌握任何一门语言,另一种是有其它编程语言基础,但没有接触过Python,最后一种是没有接触过任何编程语言。

|| 是否可以掌握一项核心的技能?

Python基础;网络爬虫;数据分析等。

|| 是否针对零基础的同学讲解的生动易懂?

不少课程会标注课程所需的知识储备,需要先掌握哪些知识才能看懂这门课,只有少数课才真正是零基础可以学习的,这个是需要注意的。我觉得更多学习在线课程的还是零基础的同学,毕竟有基础的话自己撸文档就好了。

|| 是否配备了高质量的答疑服务?

实际编程会遇到问题被卡住真是太常见的一个事情了,很多程序员没了 stackoverflow 也是无法正常工作的。但初学者很可能是连问题都描述不清楚的,所以有个老师帮初学者即时解决问题的话,能节省很多时间。


专注于人工智能前沿科技的在线教育平台—深蓝学院,联合百度资深算法工程师推出『Python基础入门与网络爬虫实践』、『Python数据分析』两门在线直播课程。两门课程共56学时,课程从Python基础入门开始,实战讲述新闻网站、知乎、京东商城、微信公众号的网络爬虫技术,将爬取的数据清洗整理,直接用于数据分析课程实践。课程在线直播授课,一年内均可在微信答疑群提问答疑,讲师真正做到有问必答。

Python 课程内容


1. Python基础入门

 1.1 Python基础
      1.1.1 Python简介与发展历史
      1.1.2 Python安装与开发环境
      1.1.3 基本类型、运算
 1.2 Python语句与语法及文件操作
      1.2.1 语句与语法包括
      1.2.2 迭代器
      1.2.3 文件操作
 1.3 函数与模块
      1.3.1 函数基础与作用域、参数与返回值、递归
      1.3.2 匿名函数:lambda与函数式编程工具:filter和reduce 
      1.3.3 模块基础
 1.4 面向对象与异常处理
      1.4.1 面向对象(类和对象)
      1.4.2 异常处理
 1.5 多线程、正则表达式的使用
      1.5.1 线程模块、线程同步
      1.5.2 多进程(通信与进程池)
      1.5.3 正则表达式
 1.6 网络编程
      1.6.1 TCP/IP、Socket、C/S架构
      1.6.2 HTTP,FTP以及邮件协议
      1.6.3 RPC

2. Python网络爬虫实践
 2.1 网络爬虫入门
      2.1.1 网络爬虫技术价值
      2.1.2 HTTP协议
      2.1.3 网页的常见构成
      2.1.4 分布式数据存储MongoDB
      2.1.5 实践:单页面的抓取
 2.2 爬虫基础:一个简单的爬虫构成
      2.2.1 静态网站的抓取
      2.2.2 多线程抓取
      2.2.3 多进程抓取
      2.2.4 实践:新闻网站的爬取
 2.3 基于框架的爬虫:Selenium
      2.3.1 自动化爬虫框架PhantomJS+Selenium
      2.3.2 表单,网站登录
      2.3.3 客户端渲染页面的抓取
      2.3.4 实践:知乎网站的抓取
      2.3.5 实践:微信公众号内容的抓取
 2.4 基于框架的爬虫:Scrapy
      2.4.1 框架简介与分析
      2.4.2 框架的核心内容及使用方法
      2.4.3 实践:京东网站的抓取
 2.5 基于框架的爬虫:分布式爬虫
      2.5.1 分布式爬虫的框架
      2.5.2 任务调度的设计
      2.5.3 分布式集群部署的爬虫与百度爬虫简介
      2.5.4 分布式存储框架ElasticSearch搜索引擎
      2.5.5 实践:一个简单的搜索引擎
 2.6 爬虫常见问题
      2.6.1 反爬虫常见问题
      2.6.2 验证码:验证码的识别:实践:识别验证码
      2.6.3 反IP:多IP技术
      2.6.4 移动端(手机端)内容抓取
            i.Fiddle抓包分析
            ii.使用API来进行抓取
            iii.示例:今日头条、快手微视频的抓取

3. Python网络爬虫实践

 3.1 Python数据分析简介
     3.1.1 Python数据分析环境配置(Anaconda)
     3.1.2 Python数据分析的各个模块的作用和关系
     3.1.3 Python数据分析安装配置常见库:NumPy, Pandas, SciPy, Matplotlib
     3.1.4 数据分析应用场景与简要示例 
 3.2 NumPy库的介绍
     3.2.1 NumPy的性能优势

 
    3.2.2 数组对象处理
     3.2.3 矩阵处理
     3.2.4 基本操作与实践案例
 3.3 Pandas库的介绍
     3.3.1 Pandas基本数据结构与功能(Series)
     3.3.2 DataFrame缺失数据处理
     3.3.3 统计功能
     3.3.4 数据合并、分组及比较
     3.3.5 基本操作与实践案例
 3.4 Python文本数据与图像数据分析的常见技术
     3.4.1 文本分析:清洗与常见算法
           a) 正则表达式
           b) 分词与关键字提取
     3.4.2 图像分析:预处理方法(PIL)
           a) 图像数据读取
           b) 图像分析
     3.4.3 基本图像处理的基本流程
     3.4.4 实践:基于微博数据的人物信息的提取、清洗                 
 3.5 数据可视化
     3.5.1 数据可视化简介
     3.5.2 常用可视化方式与图表绘制
     3.5.3 Matplolib
     3.5.4 Seaborn
     3.5.5 实践:基于微博数据的人物信息以及关系的数据可视化
 3.6 Python与机器学习
     3.6.1 什么是机器学习
     3.6.2 scikit-learn介绍
     3.6.3 scikit-learn内常用算法介绍
     3.6.4 机器学习基本流程
     3.6.5 实践:微博人物相似聚类算法
 3.7 Python与深度学习
     3.7.1 深度学习简介
     3.7.2 Tensorflow入门
     3.7.3 Kaggle:简单二分类:猫狗识别
     3.7.4 实践图像分类:微博明星人脸识别
 3.8 Python与社交网络
     3.8.1 图(graph)基础
     3.8.2 社交网络算法(包括PageRank算法、社区发现算法等)
     3.8.3 igraph介绍与network
     

     3.8.4 实践微博社区发现算法:明星关系与可视化

讲师介绍


贺老师,百度资深算法工程师,主要负责基于Python的策略架构,以及基于大数据的人工智能应用落地。曾工作于某知名金融信息公司,负责金融实时数据采集与分析,期间设计并实现基于Spark的非结构化数据处理的领域专用语言(Domain Specific Language; DSL),其核心内容在中国软件开发者大会进行演讲。南开大学计控学院硕士,硕士期间主要研究方向是基于FPGA的并行计算,获得优秀硕士论文。

开课时间及形式

1. 前100名报名者,最高可领取300元优惠券,最低100元;

2. 每周周六、周日晚上在线直播授课;

3. 课程一年可实时查看视频回放;

4. 课程PPT和源程序,会提前公开给学员;

5. 课前、课中和课后,微信群均可答疑。

请添加助教微信咨询

一幅图讲清楚Python在大数据与人工智能时代的地位_第2张图片

你可能感兴趣的:(一幅图讲清楚Python在大数据与人工智能时代的地位)