Python爬虫学习笔记(一)---Python入门

  • 一、pycharm的安装及使用
  • 二、python的基础使用
    • 1、字符串连接
    • 2、单双引号转义
    • 3、换行
    • 4、三引号跨行字符串
    • 5、命名规则
    • 6、注释
    • 7、 优先级not>and>or
    • 8、列表(list)
    • 9、字典(dictionary)
    • 10、元组(tuple)
    • 11、迭代
    • 12、format方法
    • 13、引入模块
    • 14、文件
    • 15、异常与测试

一、pycharm的安装及使用

pycharm的安装可以自行去搜索教程。

pycharm的使用需要注意:
1、venv文件夹是这个项目的虚拟环境文件,应与代码文件分开。
2、如果运行没有,最后一行是“进程已结束,退出代码为0”,如果最后不是0,那么,就说明运行出错。

二、python的基础使用

1、字符串连接

print("Hello"+"world"+"!")

2、单双引号转义

print括号中使用单引号或者双引号都是可以的。
如果引号中需要打印引号,我们则需要转义。或者外双内单、外单内双都是可以的。

print("He said 'let's go!'")
print("He said \"let\'s go!\"")

3、换行

print("Hello!\nHi!")

每一个print也可以默认换行

4、三引号跨行字符串

隆重介绍"“” XXX"""即可换行

print("""XXXXXX
XXX
XXX
XXX""")

5、命名规则

尽量使用英文变量名,以避免控制台或日记等编码不兼容等问题展现出乱码。

python英文变量名又称是用“下划线命名法”:
1、字母全部小写
2、不同单词用下划线分割
也可以用驼峰命名法,就是用大写字母分割

user_age≠user_Age
python是对大小写敏感的。

同时也不能使用关键词作为变量名,如果打出来是彩色的说明是关键字哦!

6、注释

#是注释,也可以用快捷键“ctrl”+“/”注释。
“”" “”"也可以作为多行注释

7、 优先级not>and>or

8、列表(list)

shopping_list=[]
sp_list=["1", "2"]
sp_list.append("3")

方法是对象.方法名(…)
函数是函数名(对象)

列表是可变的

9、字典(dictionary)

key:value
键:值

键是用来查找值的

dict={"小明":"1",
	  "小花":"2"}
#增加元素
dict["小谭"]="3"
#判断一个键是否在
print("小明" in dict)
#删除元素
del dict["小谭"]

10、元组(tuple)

tp={("张伟",21):"1",
	("张伟",22):"2",
	("张伟",23):"3"}
zw21_phone=tp[("张伟",21)]

11、迭代

dict.keys()   #所以键
dict.values() #所有值
dict.items()  #所有键值对

#写法一
for a,b in dict.items():
	if a>=38:
		print("XXXX")

#写法二:
for temp in dict.items():
	a=temp[0]
	b=temp[1]
	...

range(a,b)表示从a到b-1
range(a,b,c)表示从a开始一直到b-1,步长为c

12、format方法

message="""金{0}贺岁,金{0}敲门,给{1}及家人拜年啦!""".format(year,name)

message="""金{year}贺岁,金{year:.0f}敲门,给{name}及家人拜年啦!""".format(year=year,name=name)

print(f"{message}")
#f+字符串

13、引入模块

import statistics
print(statistic.median([19,-5,36])

#也可以这样子写
from statistics import median
print(median([19,-5,36])

pycharm中,按住control键点击函数名即可查看更详细的介绍。

要安装什么的话,去终端,输入pip install 库名

14、文件

两个等价的代码

f=open("./data.txt") #相对路径
print(f.read())
f.close()

与之等价的是

with open("./data.txt","r",encoding="utf-8") as f:
	print(f.read()) #结束后,会自动关闭文件,释放资源

一些相关操作

f.readline()
f.readlines()
f.read()#文件特别大的时候,最好不要用read(),因为可能爆内存
f.read(10)
f.read(10)#会接着上面继续读

"w":如果文件不存在,会自动创建新文件;如果文件存在,就会把原本的文本清空。
"a":就是一个追加模式。

15、异常与测试

try:
	XXX #放上你觉得可能会报错的代码
except ValueError:#这里ValueError是错误的类型,可以替换成其他的,也可以不写
	print("XX") #可以用来告知客户
except:
	XXX
else: #没有错误时运行
	XXX
finally: #不管有没有错误都会运行
	XXX

'assert'断言

assert 1+2>6 #这里就会报错且不会继续进行下去

unittest专门测试的库


Python爬虫学习笔记(一)---Python入门_第1张图片
继承super()
Python爬虫学习笔记(一)---Python入门_第2张图片
测试,来判断是否与自己的预期相等
Python爬虫学习笔记(一)---Python入门_第3张图片
这表明全部通过测试点
Python爬虫学习笔记(一)---Python入门_第4张图片
有一个测试点错误,还会告诉你具体原因
Python爬虫学习笔记(一)---Python入门_第5张图片
常见的测试方法
Python爬虫学习笔记(一)---Python入门_第6张图片
unittest会返回更加具体的原因。
Python爬虫学习笔记(一)---Python入门_第7张图片

你可能感兴趣的:(2024科研,python,爬虫,学习)