Datacamp 学习第一周

Datacamp 学习第一周总结

  • Intro to Python for Data Science
    • 列表
    • numpy
    • package
    • 字典
    • pandas
    • comparision operators
    • loop
    • 随机数

Intro to Python for Data Science

本节对数据科学涉及到的python基本知识进行了初步的介绍,通过学习本节,能对Python的基本语法以及列表、函数、包以及常用的函数Numpy有一个大致的了解。

列表

切片:
list[start,end] = [list[start], list[end]);
#不包括list[end];
list methods:

  1. append();
  2. remove(); 移除匹配到的第一个元素
  3. reverse();
  4. index(); 查看下标
  5. count();

numpy

  1. 导入模块
    import numpy
    import numpy as np
    from numpy import array
  2. 方法
    np.array();生成ndarray对象;存储单一数据类型的多维数组
    np.mean();平均值
    np.median();中位数
    np.std();标准差
    np.corrcoef();.相关系数

package

matplotlib:
pyplot:
scatter("x,y"); 散点图
xscale("log"); 对数坐标轴
hist([],bins= ); 柱状图
xlabel("  "); 横轴坐标
ylabel("  "); 纵轴坐标
title("   "); 图标题
xtick([  ], [    ]); 把横轴的前一个数组替换为后一个数组

字典

删除:del(a[key])

pandas

import pandas as pd
pd.DataFrame(dict); 把二维字典转换为DataFrame格式的列表
brics = pd.read_csv(“cars.csv”,index_col = 0);
把csv文件读为规范格式的列表,下标从0开始
brics.index = [" “,” “,” " ," " ]; 替换下标
brics[ ]; 一维数组
brics[ [ ] ]; Dataframe格式数据
在DataFrame格式数据中选择行列:
loc:通过标题
iloc:通过序号
brics.loc[:, [“country”,“capital”]]
brics.iloc[[1,2,3], [0,1]];

comparision operators

  1. comparators operators
    < > >= <= == !=
  2. boolean operators
    not and or
    在Numpy中:
    np.logical_and() np.logical_or() np.logical_not()
  3. conditional statements
    if else elif

loop

  1. while loop
  2. for loop
    enumerate:输出数组的下标
    eg:
    fam = [2,3,4]
    for index,a in enumerate(fam):
    print(index,a)
  3. loop in dictionary:
    for key, a in d.items( ):
  4. loop in array:
    my_array = [ [ ] ,[ ] ]
  5. loop in DataFrame
    for lab,row in car.iterrows()
    #lab—行标题
    row—行内容

随机数

import numpy as np
np.random.seed(  );设置相同的seed,则每次生成的随机数相同
np.random.rand();生成随机数
np.random,randit(0,2);在一定范围内生成随机数

你可能感兴趣的:(Datacamp 学习第一周)