数据分析python--1基础篇

in:用来判定一个元素是否在列表/元组中。
range:生成连续数列,range(a,b,c),表示以a为首项,c为公差且不超过b-1的等差数列。
python有4个内建的数据结构:列表List[]、元组Tuple()、字典Dictionary{}、集合Set{},统称为container。
列表可以被修改,元组不可被修改。

a=[1,2 3]
b=a #列表a重命名为b
b=a[:]#复制表a,命名为b

匿名函数lambda:简化函数定义

map()函数:效率高,速度快,用于逐一遍历

    a=[1,2,3]
    b=map(lambda x:x+2,a)#创建一个待运行的命令,首先定义一个函数,然后用map()函数逐一应用到 map列表中的每个元素
    b=list(b)

或者列表解析:

b=(i+2 for i in a)

reduce()函数:用于递归计算

    from functools import reduce
    reduce(lambda x,y:x*y,range(1,n+1))

filter()函数:筛选列表中符合条件的元素

  b=filter(lambda x:x>5 and x<8,range(10))
  b=list(b)

导入库: import 库名 as 别名
from math import exp as e#导入特定函数
from math import * #导入库中所有函数
导入future特征
在3.x版本中,print(a)作为一个函数出现。

python数据分析工具:

(1)Numpy:提供数组支持,以及高效的处理函数。

import numpy as np
a=np.array([2,0,1,5])#创建数组
print(a)
print(a[:3])#引用前三个数字
print(a.min())#输出a的最小值
a.sort()#从小到大排序
print(a)
b=np.array([[1,2,3],[4,5,6]])#创建二维数组
print(b*b)#输出数组的平房阵

(2)Scipy:提供真正的矩阵,以及大量基于矩阵运算的对象与函数。

from scipy.optimize import fsolve#求解方程的函数在scipy.optimize中
def f(x):
    x1=x[0]
    x2=x[1]
    return [2*x1-x2**2-1,x1**2-x2-2]
result=fsolve(f,[1,1])
print(result)

(3)Matplotlib:可视化数据

(4)Pandas:Python下最强大的数据分析和探索的工具(读取、处理和探索)
Pandas基本数据结构:Series(序列,类似于一维数组)和DataFrame(二维表格,类似于二维数组)
pandas.read_excel(‘data.xls’)
pandas.read_csv(‘data.csv’,encoding=‘utf-8’)

(5)StatsModels:注重数据的统计建模分析
(6)Scikit-Learn:机器学习工具包(数据预处理、分类、回归、聚类、预测和模型分析)

from sklearn import datasets#导入数据集
iris=datasets.load_iris()#加载数据集
print(iris.data.shape)#查看数据集大小
from sklearn import svm#导入SVM模型(支持向量机)
clf=svm.LinearSVC()#建立SVM分类器
clf.fit(iris.data,iris.target)#用数据训练模型
clf.predict([[5.0,3.6,1.3,0.25]])#训练好模型之后,输入新的数据进行预测
clf.coef_#查看训练好模型的参数

(7)Keras:搭建神经网络

(8)Gensim:用来处理语言方面的任务

你可能感兴趣的:(数据分析)