关于Python爬虫使用技巧

首先,Python是一种非常流行的编程语言,拥有广泛的应用领域,例如数据分析、人工智能、Web开发等。如果您是初学者,可以开始学习基础的语法和概念,例如变量、数据类型、循环、函数等等。许多在线资源可以提供学习资料。

其次,Python拥有大量的第三方库和框架,可以帮助您提高开发效率并处理各种任务,例如NumPy和Pandas用于数据处理,Scikit-learn和TensorFlow用于机器学习,Django和Flask用于Web开发等等。您可以根据自己的需求选择适合的库和框架。

关于Python爬虫使用技巧_第1张图片

最后,了解良好的编码习惯和软件工程原则也非常重要,这可以帮助您编写可靠、可维护和可扩展的代码。例如,遵循PEP 8的代码风格指南、包管理和版本控制等等。

Python编程需要注意以下几点:

缩进是代码结构的一部分,所以要注意缩进的正确性。

Python是动态类型语言,需要注意变量类型的正确使用。

Python有许多内置函数和库,需要熟悉常用的函数和库,以及它们的用法。

Python是解释型语言,需要注意代码的效率和性能。

Python有许多自带的模块和第三方库可以使用,需要学会模块和库的使用方法。

Python语法基础

1、语法规定

python语言对缩进要求十分严格,使用空白实现缩进,一般通过4个空格表示每一级的缩进。(不建议使用Tab键)

行尾的冒号“:”表示下一行代码缩进的开始

同一层次的代码必须有相同的缩进,每一组这样的语句称为一个块

关于Python爬虫使用技巧_第2张图片

2、注释

单行注释:以#开头,只在一行中显示注释内容

多行注释:被称为成对注释,继承于C语言

3、编码

Python源码文件以UTF-8格式进行编码,所有字符串都是Unicode字符串

开发者可以为源码文件指定不同的编码

encode函数:字符转换成计算机内的字节形式

decode函数:把字节转换成能看的懂的、直观的形式

4、标识符

第一个字符必须是字母或者下划线“_”
区分大小写
Python3.x中,非ASCII标识符也是合法的

5、关键字

在Python标准库中提供了一个关键字模块:keyword module

>>> import keyword #导入名为“keyword”的内置标准库
>>> keyword.kwlist #kwlist 能够列出所有内置的关键字
['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']
>>>

常用关键字具体说明:

and:用于表达式运算中的逻辑与操作
assert:断言,用于判断变量或条件表达式的值是否为真
class:用于定义类
def:用于定义函数或方法
elif:条件语句,与 if 和 else 结合使用
except:包括捕获异常后的操作代码,与 try 和 finally 结合使用
finally:用于异常语句,出现异常后执行 finally 包含的代码块,与 try 和 except 结合使用
global:定义全局变量
import:用于导入模块,与 from 结合使用
is:判断变量是否为某个类的实例
nonlocal:用于表示标识外部作用域的变量
or:用于表达式运算,逻辑或操作
print:打印输出语句
return:用于从函数返回计算结果
while:循环语句
yield:用于从函数依次返回值
以下划线开始或者结束的标识符通常具有特殊含义

以一个下划线开始的标识符
如“foo”:不能用 from module import * 语句导入
前面有两个下划线的标识符
如“
_ bar”:被用来实现类的私有属性

6、声明变量

变量定义

输出变量的值

运行结果:

同时赋值两个变量

对变量a、b进行同时赋值,分别赋值为“0”,“1”,最后输出变量a、b的值,运行结果如下:

7、局部变量

局部变量只能在函数或者代码块内使用的变量,函数或者代码一旦结束运行,局部变量的生命周期也将结束。局部变量只能在被创建的函数或者代码块内有效。

关于Python爬虫使用技巧_第3张图片

8、全部变量

在函数外面定义的变量叫做全局变量,全局变量能够被不同的函数、类或文件共享使用,也可以被文件内的任何函数和外部文件访问。

关于Python爬虫使用技巧_第4张图片

9、实现输入功能

通过调用内置函数 input() 可以实现输入功能

input([prompt])

代码范例:

>>>
>>> name = input('您好,请输入您的名字:')
您好,请输入您的名字:二哥
>>> name
'二哥'
>>>

10、实现输出功能

输出的作用是显示执行的结果,主要通过 print() 函数实现。语法格式如下:

print( value,...,sep=", end='\n') #只展示了部分参数

输出参数具体说明:

value:表示要输出的信息,后面的省略号表示可以有多个输出的信息
sep:表示在多个要输出信息之间的分隔符,默认值是一个空格
end:表示在所有要输出信息之后添加的符号,默认值为换行符
在 print() 函数中可以同时使用多个字符串,在使用时用逗号“,”隔开

函数 print() 还可以打印输出整数或计算结果:

>>> print(300)
300
>>> print(100+200)
300
>>> print('100 + 200 =',100 + 200)
100 + 200 = 300
>>>

代码范例:

关于Python爬虫使用技巧_第5张图片

你可能感兴趣的:(python,爬虫,开发语言,网页爬虫)