数据规整化——字符串操作

字符串操作

  • 回顾Python内置的字符串方法
    • 1)strip方法和split方法
    • 2)join方法
    • 3)in判断、index方法、find方法
    • 4)count方法
    • 5)replace方法
  • Python正则表达式
  • pandas矢量化字符串方法

回顾Python内置的字符串方法

数据规整化——字符串操作_第1张图片
数据规整化——字符串操作_第2张图片
在这里插入图片描述

1)strip方法和split方法

在这里插入图片描述

2)join方法

在这里插入图片描述

3)in判断、index方法、find方法

在这里插入图片描述
在这里插入图片描述
index方法与 find方法的区别是,如果找不到字符串,index方法会报错,而find方法会返回一个异常。

4)count方法

在这里插入图片描述

5)replace方法

在这里插入图片描述

Python正则表达式

数据规整化——字符串操作_第3张图片
正则表达式参见博客单独的笔记。

pandas矢量化字符串方法

数据规整化——字符串操作_第4张图片
这些方法都是元素级的方法,且可以有效避免缺失值造成的程序运行错误。虽然一般的map或者applymap方法也能针对Series和Dataframe进行元素级操作,但是一旦有缺失值出现,在没有设置异常处理的情况下,程序就会报错。
数据规整化——字符串操作_第5张图片
在这里插入图片描述
pandas对象的str属性可以调用这些字符串方法,
数据规整化——字符串操作_第6张图片
正则表达式也可以运用在pandas对象的字符串处理上,
数据规整化——字符串操作_第7张图片
矢量化获取元素的两种方法,
数据规整化——字符串操作_第8张图片
对Series而言,可以直接通过所以获取字符串的子串,
数据规整化——字符串操作_第9张图片

你可能感兴趣的:(Pandas)