Python小知识

个人学习笔记,用于记录使用过程中好用的技巧、好用的库。

1 小知识

1.1 相对路径

Python小知识_第1张图片

1.2 打包Exe文件

命令:

pyinstaller -F main.py

其中-F:覆盖之前打包的文件
mian.py:需要打包的Python文件
PS:使用pyinstaller 5.10.0以上的版本,低于5.10.0以下会出现一些稀奇古怪的问题(Python版本为3.10)

1.3 字符串对齐ljust()|rjust()|center()

在生成C代码时,需要对齐备注等的要求,使用较多。
具体参考:https://blog.csdn.net/qdPython/article/details/111559495

1.4 正则表达式

1.4.1 普通字符

Python小知识_第2张图片Python小知识_第3张图片

1.4.2 非打印字符

Python小知识_第4张图片

1.4.3 特殊字符

Python小知识_第5张图片

1.4.4 限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 * 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6种。
Python小知识_第6张图片

参考资料:https://www.runoob.com/regexp/regexp-syntax.html

2 库

2.1 parsel

parsel这个库可以解析HTML和XML,并支持使用Xpath和CSS选择器对内容进行提取和修改,同时还融合了正则表达式的提取功能。parsel灵活且强大,同时也是python最流行的爬虫框架Scrapy的底层支持。

CSS选择器使用

提取CSDN一个页面下面博客的所有链接。具体步骤如下:

①右键,选择“检查”,查看网页代码
Python小知识_第7张图片
②复制第一篇文件链接,在网页代码中搜索,提取上一级标签的关键字,这里是“column_article_list”
Python小知识_第8张图片
③复制上一级标签关键字,在搜索栏输入“.column_article_list”搜索
这里只会有唯一的一个匹配项
Python小知识_第9张图片
使用空格取下级标签,例如“.column_article_list a”表示取column_article_list下面的a标签,如果还需要往下取,继续加“空格+标签名”
Python小知识_第10张图片
④回到代码
先使用parsel.Selector将响应的数据转换为一个对象,在对象中在使用css选择题提取内容。
这里“::attr(href)”表示去a标签的href属性
.getall():提取整个对象中符合要求的数据
Python小知识_第11张图片

你可能感兴趣的:(Python,python)