ssc项目Python爬虫心得

###今日心得

####time、datetime

1、字符串格式到标准化格式:time.strptime(str, "%Y%m%d")

2、今天的标准化格式:today = datetime.date.today()

3、指定日期:date = datetime.date(year, month, day)。属性:date.year、date.month、date.day

4、标准化格式到字符串格式:datestr = date.strftime(“%Y%m%d”)

5、某日期之后的一天:newdate = date + datetime.timedelta(days=1)

####正则

1、连续数字:\d{3}、[\d|\s]{9}

2、非捕获分组:(?:xxx)

3、模糊空白:\s*

4、多行匹配:re.compile(reg, re.M)

####文件操作

1、读取一个可能不存在的文件,可以用'a+'方式打开,再f.seek(0,0)从头读取

2、'w'、'a'包括'+'方式打开的文件,write都会写入固定位置,无法指定位置

3、如果想修改文件内容,文件内容过大无法全部读入内存,可以先写入另一个文件,再删除原文件、改名

  import os

  os.remove(oldfilename)

  os.rename(newfilename, oldfilename)

####其它

1、2维数组按第一维的某个位置元素进行排序:

  mylist = [["asdasdga", 20], ["asdgasdga", 10], ["fffsdasgsdga", 30],]

  mylist.sort(key=lamda index: index[1]

  

转载于:https://www.cnblogs.com/ForceAwaken/p/9799559.html

你可能感兴趣的:(爬虫,python)