2019-12-16 字符串离散化

Example 1  分离逗号文件并改写新列表

2019-12-16 字符串离散化_第1张图片
2019-12-16 字符串离散化_第2张图片
代码

细节解释

2019-12-16 字符串离散化_第3张图片

2.数组合并中join方法 : 默认情况下把行索引相同的数据合并到一起 

merge : 按照列索引来进行合并 xx.merge(xx, on = "条件") 取并集

删除有缺失的为df.dropna(axis = 0)

3.数据的分组聚合

Example 2 统计两个国家的某品牌店面的数量

关键函数   xx = df.groupby("关键字")结果仍为dataframe型数据  聚合方法 xx.count()

2019-12-16 字符串离散化_第4张图片
常用的函数

两组及其他分组聚合方法:

2019-12-16 字符串离散化_第5张图片

如果想返回DataFrame类型,则给取的该列多加一个 [ ]  如 df[ ["Country" ] ]

4.索引和复合索引

简单的索引操作:

获取索引  df.index      指定索引:df.index = ['x','y']     重新设置索引:df.reindex(list("abcd"))      指定某一列作为索引 df.set_index("country",drop = false)             返回index的唯一值   df.set_index("country").index.unique() 相当于去重

5.Example 5

2019-12-16 字符串离散化_第6张图片
代码1


2019-12-16 字符串离散化_第7张图片
代码2

6.Example 6 

统计10000本书中,1.不同年份的书的数量  2.不同书的平均评分

2019-12-16 字符串离散化_第8张图片
示例代码书

你可能感兴趣的:(2019-12-16 字符串离散化)