python爬虫相关

基础知识点
python格式化
         python格式化
                 数字格式化
                 python
                 print("{:.2f}".format(3.1415926))#设置两位小数
                 print("{:.2%}".format(0.25))#百分比
                 print("{:^10}".format("aaaaa"))#居中
                 print("{:<10}".format("aaaaa"))#左对齐
                 print("{:>10}".format("aaaaa"))#右对齐

                  结果
        python
        3.14
        25.00%
        aaaaa
        aaaaa
        aaaaa

中文输出排版

print("{0:{1}^10}".format("感悟",chr(12288)))#居中
print("{0:{1}^10}".format("你是不是",chr(12288)))#居中
print("{0:{1}^10}".format("哈哈哈",chr(12288)))#居中
print("{0:{1}^10}".format("你是环境吗",chr(12288)))#居中
print("{0:{1}^10}".format("很额额哈鸡儿哈酒",chr(12288)))#居中

python爬虫知识点
Beautiful Soup4库
安装BeautifulSoup4库
- 导入:from bs4 import BeautifulSoup
正则表达式
正则表达式是用来简洁表达一组字符串的表达式。
主要用在字符串匹配中
正则表达式常用字符串
. 表示任何单个字符
[] 字符集,对单个字符给出取值范围,例:[abc]表示a,b,c中的一个,[a-z]表示a到z中的一个字符
[^]非字符集,对单个字符给出排除范围,例[^abc]表示非a或b或c的单个字符
前一个字符0次或无线次扩展,例abc*表示ab、abc、abcc、、、
前一个字符1次或无限次扩展,例abc+表示abc、abcc、、、、
? 前一个字符0次或者1次扩展,例abc?表示ab、abc
| 左右表达式任意一个,例abc|def表示abc、def
{m} 扩展前一个字符m次,例ab{2}c表示abbc
{m,n}扩展前一个字符m至n次(含n),例ab{1,2}c表示abc,abbc
^ 匹配字符串开头,例^abc表示abc且在一个字符串的开头
$ 匹配字符串结尾
()分组标记,内部只能使用|操作符,例(abc)表示abc,

你可能感兴趣的:(python,爬虫,开发语言)