python机器学习笔记

sudo python -m pip install --upgrade pip

pip升级
  • 判断dataframe每一列的数据类型:
isinstance(part_1_2.ix[:,i],int)

  • 将新建的一列数据,与之前的dataframe合并,并将新建的一列赋予原名称
data_new = pd.concat([data_new, pd.DataFrame(y,columns=[part_1_2.ix[:, i].name])], axis=1)

  • 将数据LabelEncoder
from sklearn.preprocessing import LabelEncoder
y = le.fit_transform(part_1_2.ix[:, i].astype('str')).reshape(-1, 1)

得到的数据是ndarray类型,可以用pd.Series或者pd.Dataframe转换

Series列名为name=;Dataframe为columns=[]



你可能感兴趣的:(python)