python如何匹配CSV文件某一列数据,并根据匹配到的数据的值在后面添加新的一列内容

CSV数据格式如下所示:

分类要求为:AAAI属于AI类,ICDM,SDM和KDD属于DM类,WWW属于NEW类

上图所示第一列为名称,如何根据第一列的名称把前面的类别名称输出到第三列,实际效果为:

如上图所示,第一列为名称,第三列为对应的类别名称,请给出python的实现代码

答案对人有帮助,有参考价值0答案没帮助,是错误的答案,答非所问

可以用pandas里面的map映射字典。

In [1]: import pandas as pd

In [2]: df = pd.DataFrame({'A':['AAAI','ICDM','SDM','WWW','KDD'],
                           'B':[0.88, 0.41,0.22, 0.33, 0.35]})

In [3]: type_dict = {"AAAI":"AI","ICDM":"DM","SDM":"DM","KDD":"DM","WWW":"NEW"}

In [4]: df["C"] = df['A'].map(type_dict)

In [5]: df
Out[5]:
      A     B    C
0  AAAI  0.88   AI
1  ICDM  0.41   DM
2   SDM  0.22   DM
3   WWW  0.33  NEW
4   KDD  0.35   DM

你可能感兴趣的:(机器学习)