python是一种动态的,面向对象的解释型脚本语言,他的代码风格“优雅”,“明确”,“简单”;更重要的是它于现在流行的数据分析,人工智能扯上了联系,因此受到广大编程爱好者的喜爱。此时,大家戏称:“人生苦短,我用python”。
目录
【python特性】
【python如何学】
【数据爬虫】
【数据分析】
【机器学习】
【总结】
python的动态性体现在:
class Student(object):
pass
s = Student()
s.name = 'alex'
print(s.name)
对象在定义后可以动态添加属性和方法,实际上上面代码执行的内部原理如下:
s.__setattr__("name","alex")
s.__getattribute__("name")
python是一种面向对象的语言,它支持继承、重载、派生、多继承:
class Filter:
def init(self):
selef.block=[]
#SPAMFilter继承Filter,是Filter的子类
class SPAMFilter(Filter):
def init(self):
selef.block=['SPAM']
class Calculator:
def calculate(self,expression):
self.value=eval(expression)
class Talker:
def talk(self):
print('The value is'+self.value)
# TalkingCalculator同时继承Calculator,Talker
class TalkingCalculator(Calculator,Talker):
pass
tc=TalkingCalculator()
tc.calculate('1+2*3')
tc.talk()
The value is 7
Python语言是类似于javascript的解释型语言,具备js的脚本特性,但脚本语言简单程序设计的任务语言,又是与python无法比拟的。
任何语言的学习都是建立在基础语法的前提下进行的,然后根据python的应用对象选择一个学习方向:web开发,人工智能方向,数据分析,网络爬虫等。
python基础内容,大致包括数据类型,函数,类,文件操作,网络编程,异常处理等基础内容。借用一下百度经验的图:
其他高级应用python提供了大量的基础类库及应用框架,因此代码开发非常简单迅速,以下介绍python在数据爬虫与数据分析,机器学习领域常用的基础类库:
有关这些基础类库和框架的介绍网上都可以找到,以下收录了几个小编在学习过程中学习到的文章,仅供参考:
《python数据分析入门学习笔记》
《Numpy教程》
爬虫是数据源获取方式之一,被定义为:爬取网页数据的程序。
大数据时代数据已成为最重要的资产之一,数据的获取主要通过以下几个方式进行:
爬虫的主要方式为:通过固定的url模拟get或post请求获取html网页数据,再通过数据解析,将数据保存至数据库。数据解析首先要通过网页分析,最常用的抓包工具分析为Fiddler。
数据分析是通过数据统计方法,对现有数据源进行分析,最后常用图表方式展示,为决策制定出谋划策。
数据分析的流程:提出问题--准备数据--分析数据--获得结论--成果可视化。
机器学习是一个自动化过程,百度百科这样介绍:机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。总结来说,就是让数据分析的过程变成自动化,通过数据+算法的方式不断学习,以寻找问题最优解决方案。
python为机器学习提供了大量的基础类库,方便使用者在机器学习过程中简易操作数学函数,更方便的实现算法。
本博文是小编在初学Python过程中的简单整理和看法,旨在为机器学习建立理论体系!为此,小编会在GitHub上持续更新自己的python学习旅程,请大家多多指教!
git地址:https://github.com/whpHarper/pychon.git