小白学爬虫——第一部分:简单学习Python

学习目录

定义新函数

文件读写

数组

字符串

字典

定义新函数

通过定义函数名和一组语句序列来定义一个新函数,然后在执行时调用这个函数。一旦定义了一个函数,程序中可以重复使用。

def是用来定义函数的保留关键字。函数命名与变量命名的规则基本上是一样的。字母、数字以及一些符号是合法的,但是函数名的第一个字符不能是数字。不能使用保留关键字命名函数,也要避免函数名和变量名相同。

函数名后面的空括号表明这个函数没有指定参数,若有形式参数,写入括号内用逗号隔开。函数定义的第一行叫做函数头,剩余的部分叫做函数体。

函数头必须以冒号结束,函数体必须缩进。按照惯例,一般缩进4个空格。函数体可以包括任意数量的语句。在Python语言中,是严格缩进的,否则会报错,缩进字符会在用Python写代码时主动提示,这一点不必担心。同时,值得注意的是,在if语句,for循环的使用过程中,也要在冒号后再开始写相应代码。


def hello():

    print('Hello World!')

文件读写

读文件

要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标示符:


f = open('/Users/test.txt','r')

f.read()

f.close()

标示符'r'表示读,这样,我们就成功地打开了一个文件。如果文件打开成功,接下来,调用read()方法可以一次读取文件的全部内容。最后一步是调用close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的。

写文件

与读文件类似,先用open()函数打开文件,传入文件名和标识符'w',表示写。你可以调用write()来写入文件,但是务必要调用f.close()来关闭文件。

当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了。


f = open('/Users/michael/test.txt','w')

f.write('Hello, world!')

f.close()

数组

不含任何元素的列表称为空列表,使用空的方括号([])创建一个空列表。列表内的可以是数字,字符串,或者嵌套列表。各元素用逗号隔开,字符串需要加''。


[10, 20, 30, 40]

['crunchy frog', 'ram bladder', 'lark vomit']

可以按照序号来读取数组中的指定序号元素,序号从零开始。x[a:b]表示返回集合中下标a至b(不包括b)的元素集合,x[:b]表示从开始至b(不包括b),x[a:]表示从a至结束。
介绍一些数组的方法:

L.append(var) #追加元素

L.pop(var) #返回最后一个元素,并从list中删除之

L.remove(var) #删除第一次出现的该元素

L.count(var) #该元素在列表中出现的个数

L.index(var) #该元素的位置,无则抛异常

L.extend(list) #追加list,即合并list到L上

L.sort() #排序

L.reverse() #倒序

字符串

字符串是字符的序列,而列表是一系列值的序列。字符列表与字符串是不同的。

如果想把一个字符串分成单独的单词,使用split函数:


s = 'pining for the fjords'

>>> t = s.split()

>>> print t

['pining', 'for', 'the', 'fjords']

>>> print t[2]

the

介绍一些字符串的方法:

S.find(substring, [start [,end]]) #可指范围查找子串,返回索引值,否则返回-1

S.lower() #转小写

S.upper() #转大写

字典

dict = {‘ob1′:’computer’, ‘ob2′:’mouse’, ‘ob3′:’printer’}

每一个元素是pair,包含key、value两部分。key是Integer或string类型,value 是任意类型,key与value之间以冒号隔开。字典中的键(key)是唯一的,而值并不唯一。


>>> items = [('name', 'Gumby'), ('age', 42)]

>>> d = dict(items)

>>> d

{'name': 'Gumby', 'age': 42}

你可能感兴趣的:(小白学爬虫——第一部分:简单学习Python)