python 小知识点

  • 1 写文件
f = open('text.txt', 'wr')
f.write("hi ok")
  • 2 按行读取
    f = open('test.txt', 'r')
    while 1:
        line = f.readline().strip('\n')
        if not line:
            break
            pass
        print line
        pass

.strip('\n')为去除末尾的回车行
.strip()为去除首尾的空格 Python真是 太方便了 我去

  • 3 去除换行符
line = line.replace('\n', '')
  • 4 字符串分割
b = a.split(',')
print b
  • 5 延迟爬取
import time
time.sleep(1)
  • 6 清理HTML标签,剩下一行一行的文本
[script.extract() for script in soup.findAll('script')]
[style.extract() for style in soup.findAll('style')]
reg1 = re.compile("<[^>]*>")
content = reg1.sub('',soup.prettify())

相当于soup.get_text()

  • 8 生成随机字符串
import random
import string
print ''.join(random.sample(string.hexdigits, 8))
  • 9 截取字符串
print str[0:3]
  • 10 python for循环
for num in range(0,10):
    print num
  • 11 mac安装库
pip install selenium

12 python函数内要用全局变量的话需要加globla跟php一样的。

global globvar

你可能感兴趣的:(python 小知识点)