df1.loc[:,'前部']=df1['班级名称'].str.slice(0,15)
df1.loc[:,'大区']=df1['班级名称'].str.split('-').str[0]
df1.loc[:,'版本']=df1['班级名称'].str.split('-').str[1]
df1.loc[:,'进度']=df1['班级名称'].str.split('-').str[2]
df1.loc[:,'时间']=df1['班级名称'].str.split('-').str[3]
df1.loc[:,'时间1']=df1['时间'].str.split('(').str[0]
常规字符串截取处理
(编辑技巧:mac❀+数字2,设定为目录)
df1.loc[:,'合并']=df1['大区'].str.cat(df1['版本'],sep='-').str.cat(df1['进度'],sep='-')
str.cat可以连接多列,并设定连接符
df1.loc[:,'大区']=df1['班级名称'].str.split('-').str[0]
以上为按‘-’分割某列,并取分割后的第一部分字符串
split('-',expand=True,n=1),expand默认是False,若设置为True则会将列表展开,变成多列,n是设置分列的次数,n=1则分割一次,成2部分
rsplit和split用法一致,只不过是从右边开始分列
df1.loc[:,'1']=df1['合并'].str.partition('-')[2]
如上,partition分割后只能引用0,1,2三个部分,引用形式如代码所示
如果有多个分隔符,也只会按第一个分隔符进行分裂
rpartition和partition类似,只不过会从右往左找第一个分隔符进行分裂
df1.loc[:,'te']=df1['合并'].str.get(2)
如上,获取列的第三个字符方法
df1.loc[:,'截断替换']=df1['合并'].str.slice_replace(0,1,'lingo班课')
把某一列的前两个字符,替换为指定字符串,如上所示
dic=str.maketrans({'A':'啊'})
df1.loc[:,'字母替换']=df1['合并'].str.translate(dic)
把所有的字符“A”替换为指定字符“啊”
df1.loc[:,'数字字母判断']=df1['合并'].str.isnumeric()
df1.loc[:,'开头是']=df1['合并'].str.startswith('A')
str.repeat(2)复制两次
str.strip('-'),按照指定字符从两边、左边、右边删除
df1.loc[:,'规则小时']=df1['小时'].str.zfill(width=2)
结果如下所示:补齐前和补齐后
df['Name'] = df['Name'].str.pad(width=10, side='right')
如果要将一个字符串列补全为特定长度,可以使用str.pad()
方法。该方法接受两个参数:width
和side
。其中width
是希望补全到的长度,side
可以是left
、right
或both
, 分别表示左侧、右侧或两侧补全。默认情况下,side
为right
。