python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识

这是一个适用于小白的Python爬虫免费教学课程,只有7节,让零基础的你初步了解爬虫,跟着课程内容能自己爬取资源。

今天开始我们的第三节课《爬虫必备的小知识》吧!啦啦哩啦啦,都看黑板~

1. 字符串(string)

1.1 输入字符串

编写字符串时,既可以用单引号( ' )也可以用双引号( " ):

bfd48e907efe52fa983ca76611e934af.png

对于带有换行符的多行字符串,可以使用三重引号(即 ''' 或 """ ):

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第1张图片

1.2 访问字符串中的值

Python访问子字符串,可以使用方括号来截取字符串,如下实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第2张图片

以上实例执行结果:

e8c9072eb8172eafef08eae6378d7807.png

1.3 字符串的修改

Python中已存在的字符串本身不可以改变:

dc6fff954a833a7ded440afd397fdae3.png

报错:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第3张图片

但可以对已存在的字符串进行修改,然后赋值给另一个变量:

ae9a69b44833a414c2f8323946376dd1.png

以上实例执行结果:

7b34f9c22eba5c2a2e6b43dc9ce7a43c.png

1.4 Python对象转为字符串

许多Python对象都可以用str函数转换为字符串:

7140c6ebca25dbe704b95ed29ee0eb5b.png

以上实例执行结果:

c8962b488a002637d7483e7ecebd2930.png

1.5 字符串当做序列类型处理

由于字符串其实是一串字符序列,因此可以被当做某种序列类型(如列表、元组等)进行处理:

2506bbde810c0c21e1328947d95999c2.png

以上实例执行结果:

5654efa786df82fec1a5a9c143b488b0.png

1.6 Python转义字符

当需要在字符中使用特殊字符时,Python用反斜杠()转义字符,如下表:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第4张图片

1.7 字符串运算符

下表实例变量 a 值为字符串 "Hello",b 变量值为 "Python":

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第5张图片

1.8 字符串常用方法

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第6张图片

2. 元组(tuple)

2.1 元组的创建

元组(tuple)是一种一维的、定长的、不可变的Python对象序列。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可:

592af0de65cf07a6e30cf8d9b617227e.png

创建空元组:

2d4eb361b53c192094083159593d6ffa.png

元组中只包含一个元素时,需要在元素后面添加逗号:

fd1861c84fdf169dd6b7b4d3800840e4.png

通过调用tuple,任何序列或迭代器都可以被转化为元组:

a8771edd65546a57a26c522b6cf8846e.png

结果为:

e973766b4dd4fa9f16e091db5b87699a.png

2.2 访问元组

元组可以使用下标索引来访问元组中的值,如下实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第7张图片

以上实例输出结果:

60a401e8711388291848b02343691be1.png

2.3 修改元组

元组中的元素值是不允许修改的,但我们可以对元组进行连接组合,如下实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第8张图片

结果为:

11ac700e1b8b98ef5bb3bd8aa918e6e6.png

2.4 元组运算符

与字符串一样,元组之间可以使用 + 号和 * 号进行运算。这就意味着他们可以组合和复制,运算后会生成一个新的元组。

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第9张图片

2.5 元组索引与截取

因为元组也是一个序列,所以我们可以访问元组中的指定位置的元素,也可以截取索引中的一段元素,如下所示:

元组:

0adecc597ead9149681958012477182a.png
python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第10张图片

2.6 元组内置函数

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第11张图片

3. 列表(list)

3.1 列表的创建

跟元组相比,列表(list)是变长的,而且其内容也是可以修改的。它可以通过方括号([ ])或者list函数进行定义:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第12张图片

结果为:

b97620b4df67b4a2bf208cb4344c7bd8.png

对已经定义的列表中的内容进行修改:

efdde73240f6bd7653d53c531e61cd02.png

结果为:

4e70f1094e5464230c623d28fadf74ba.png

3.2 访问列表中的值

使用下标索引来访问列表中的值,同样也可以使用方括号的形式截取字符,如下所示:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第13张图片

结果为:

b2c3144a6aca202a38b3a2d764805fd0.png

3.3 更新列表

可以对列表的数据项进行修改或更新,也可以使用append()方法来添加列表项,如下所示:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第14张图片

结果为:

ad999a76e80812e0e53cca6b90d69c5f.png

3.4 删除列表元素

可以使用 del 语句来删除列表的的元素,如下实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第15张图片

结果为:

796f6e6e1437f1e2b4290e1487a78e2b.png

3.5 判断列表中是否存在某个值

通过 in 关键字,可以判断列表中是否含有某个值:

31cd711beeae9fd878f0996efda8a4c5.png

结果为:

0a8a711d4459e3e60e400c99b1c10eb5.png

3.6 列表脚本操作符

列表对 + 和 * 的操作符与字符串相似。+ 号用于组合列表,* 号用于重复列表。

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第16张图片

3.7 列表截取

Python的列表截取与字符串操作类型,如下所示:

48c6e5eb22a37eb16407867c36073c59.png

3.8 列表内置函数&方法

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第17张图片

4. 字典(dict)

4.1 字典的创建

字典是另一种可变容器模型,且可存储任意类型对象。

字典的每个键值(key=>value)对用冒号( : )分割,每个对之间用逗号( , )分割,整个字典包括在花括号( {} )中 ,格式如下所示:

cfdb9ad31ad4e168c9599868fdc04f47.png

键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串、数字或元组。

一个简单的字典实例:

6c1d1904232b86a794fd5557083a6bda.png

也可如此创建字典:

be8e97302ff85886c8f95f01be9ca7e6.png

4.2 访问字典里的值

把相应的键放入方括弧,如下实例:

57dd4f086492d9da78d7bd704d612045.png

以上实例输出结果:

d35c9e4724058e94bb54eba9427d429f.png

如果用字典里没有的键访问数据,会输出错误如下:

4489ce94bccc37e208c131c353f9d573.png

以上实例输出结果:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第18张图片

4.3 修改字典

向字典添加新内容的方法是增加新的键/值对,修改或删除已有键/值对如下实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第19张图片

以上实例输出结果:

2ce744a37fe587aa8387179a5c7ef616.png

4.4 删除字典元素

del 能删单一的元素也能删除字典,clear 可以清空字典。del删除字典和clear清空字典的区别在于,前者是将字典整个删除了,字典不复存在,而后者是清空字典中的内容,留下了一个“空壳子”。

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第20张图片

4.5 字典内置函数&方法

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第21张图片

5. 条件控制

5.1 条件控制流程

Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。可以通过下图来简单了解条件语句的执行过程:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第22张图片

5.2 if 语句

Python中if语句的一般形式如下所示:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第23张图片
  • 如果"condition_1"为True,将执行 "statement_block_1"块语句如果"condition_1"为False,将判断 "condition_2"如果"condition_2"为True,将执行 "statement_block_2"块语句如果"condition_2"为False,将执行"statement_block_3"块语句

注意:

1.每个条件后面要使用冒号(:),表示接下来是满足条件后要执行的语句块。

2.使用缩进来划分语句块,相同缩进数的语句在一起组成一个语句块。

3.在Python中没有switch – case语句。

举一个 if 实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第24张图片

执行程序,输入狗狗的年龄:

37c35c5492524b141fdf520d3c9cc14d.png

程序运行结果:

c3837cedf4554dab12b4bb563d0fadc5.png

输入enter后退出程序。

5.3 常用操作运算符

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第25张图片

5.4 if 嵌套

在嵌套 if 语句中,可以把 if...elif...else结构放在另外一个 if...elif...else 结构中。

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第26张图片

举一个 if 嵌套实例:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第27张图片

输入语句及结果如下:

1a6111b782b4ce0f94b871f7a4f46245.png

6. 循环语句

6.1 循环语句流程

Python中的循环语句有 for 和 while。Python循环语句的控制结构图如下所示:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第28张图片

6.2 while 循环

Python中while语句的一般形式:

1d0da4a51431a22803271d367583a02f.png

同样需要注意冒号和缩进。以下实例使用了 while 来计算 1 到 100 的总和:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第29张图片

执行结果如下:

fdb0c968dc59ed3a333876f125d84a37.png

while 循环使用 else 语句:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第30张图片

执行以上脚本,输出结果如下:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第31张图片

6.3 for 语句

for 循环的一般格式如下:

35c7415e0935b09f6540a7370041facb.png

for 实例中使用 break 语句,break 语句用于跳出当前循环体:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第32张图片

结果如下:

d9c798f63f424974b0d584b7a8b85f76.png

除了在 for 和 while 的循环体中使用 break 语句来跳出循环,我们还可以使用 continue 语句,continue语句被用来告诉Python跳过当前循环块中的剩余语句,然后继续进行下一轮循环。

代码块如下:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第33张图片

结果如下:

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第34张图片

好了,这节课就到这里!

python dataframe 字符串截取_Python爬虫入门 | 3 爬虫必备的小知识_第35张图片

如果觉得对你有用或者是觉得文章不错,可以关注小编,后面会持续更新更多Python类的文章哟~

你可能感兴趣的:(python,dataframe,字符串截取)