Python爬虫-python语法

  • 元组( )、列表[ ]、字典{ }

tup = ( ),定义一个元组,是一种不可变序列,存储格式为:tup = (1, 2, 3);

list = [ ],定义一个列表,存储格式为:list = ['p', 'y', 't', 'h', 'o', 'n'];

dict = { },定义一个字典,存储格式为:dict = {'author': 'together', 'title': '20191207', 'title': 'python'}。

  • 格式化函数format()

1. 不指定位置,默认顺序填入;

>>>"{} {}".format("hello", "world")    # 不设置指定位置,按默认顺序
'hello world'

2. 指定顺序,按照序号填入;

>>> "{1} {0} {1}".format("hello", "world")  # 设置指定位置
'world hello world'

3. 按照指定参数复制;

>>> print("网站名:{name}, 地址 {url}".format(name="菜鸟教程", url="www.runoob.com"))
网站名:菜鸟教程, 地址 www.runoob.com

4. 通过字典设置参数;

>>> site = {"name": "菜鸟教程", "url": "www.runoob.com"}
>>> print("网站名:{name}, 地址 {url}".format(**site))
网站名:菜鸟教程, 地址 www.runoob.com

5. 通过列表索引设置参数。

>>> my_list = ['菜鸟教程', 'www.runoob.com']
>>> print("网站名:{0[0]}, 地址 {0[1]}".format(my_list))  # "0" 是必须的
网站名:菜鸟教程, 地址 www.runoob.com

该部分选取自RUNOOB.COM网站 Python format 格式化函数,format()函数还可以向str.format()传入对象、用于数字格式化等, 详细介绍可以去该网站详细了解。

  • xlwt写入excel操作

xlwt可实现对excel表格写入数据的操作,创建workbook→worksheet→写入数据→保存,详细内容参照python xlwt写入excel操作。还有xlrd可以实现excel的读取操作,xlutils3实现excel的修改。

#应用xlwt模块
import xlwt

#创建workbook,设置编码格式
book = xlwt.Workbook(encoding = 'utf-8/ascii')

#创建worksheet, cell_overwrite_ok参数表示是否覆盖已操作单元格
sheet1 = book.add_sheet(u'sheet1', cell_overwrite_ok = True)

#写入数据, 参数依次为行数、列数、内容
sheet1.write(0, 1, 'first')    #第0行第1列,写入first
sheet1.write(0, 2, 'second')   #第0行第2列,写入second

#保存表格,路径+文件名
book.save('path\filename.xls')
  • print()

print()用于输出数据,结尾默认添加换行,如果不需要换行,可以用参数end修改分隔符,如:print('p', end = 'o'),将行末的换行符修改为字符‘o’,详细介绍参照print函数用法总结。

你可能感兴趣的:(爬虫,python)