调整字符串中文格式

实际案例

某软件的log文件,其中的日期格式为'yyyy-mm-dd':
  ......
  2016-05-23 10:59:26 ......
  2016-05-23 10:59:26 ......
  2016-05-23 10:59:26 ......
  2016-05-23 10:59:26 ......
  ......
我们想把其中的日期改为国外日期的格式'mm/dd/yyyy',即'2016-05-23'=>'05/23/2016',应如何处理?

解决方案:使用正则表达式re.sub()方法做字符串替换,利用正则表达式的捕获组,捕获每个部分内容,在替换字符串中调整各个捕获组的顺序。该方法代码如下:

# -*- coding: utf-8 -*-

import re

f = open('log.txt').read()

print re.sub('(\d{4})-(\d{2})-(\d{2})', r'\2/\3/\1', f)

其运行结果如下:

05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......            
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......       
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......              
05/23/2016 10:59:26 ......

其中log.txt文件的内容如下:

2016-05-23 10:59:26 ......                   
2016-05-23 10:59:26 ......            
2016-05-23 10:59:26 ......                   
2016-05-23 10:59:26 ......       
2016-05-23 10:59:26 ......                   
2016-05-23 10:59:26 ......              
2016-05-23 10:59:26 ......                       

在代码中,我们根据每个捕获组进行编号,然后按照编号调整捕获组内字符串的格式。除此之外,我们还能对每个捕获组进行命名,然后按照名字调整捕获组内的字符串的格式,其代码如下:

print re.sub('(?P\d{4})-(?P\d{2})-(?P\d{2})', r'\g/\g/\g', f)

其输出结果为:

05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......            
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......       
05/23/2016 10:59:26 ......                   
05/23/2016 10:59:26 ......              
05/23/2016 10:59:26 ......

你可能感兴趣的:(调整字符串中文格式)