python 学习基础笔记

一、 

运行selenium自动化爬取内容

安装Chrome driver 需要权限

http://blog.csdn.net/u012359618/article/details/52556127

 

二、Scrapy框架

安装scrapy

 

三、Python3 默认utf-8

 

四、For只能用于容器

 

五、Lambda简化代码结构

f( lambda x:x+100,100)

 

六、list 数组

list=[1,2,3]

for I in list:

 print (i)

用range模拟for

Range(x)à[0,x-1]

Range(x,y)__>[x,y-1]

Range(x,y,z)à[x,x+z,…

For I in range(len(li))

 

负数索引提高代码效率

List[-1]

 

For I in range(3,-1,-1)

Print(i)

申明:

List=[]

List.append(1)

 

按元素添加数组

Li=[1,2]

Li2=[3,4,5]

li.append(li2)

[1, 2, [3, 4]]

用extend,li.extend(li2)

[1, 2, [3, 4], 3, 4]

 

删除

Li.pop()删除最后一个元素

Li.pop(2)删除指定元素

 

排序

必须先排序再输出

list.sort()

print (list)

 

利用lambda帮助排序

 

七、Set

不重复

 

八、字典

Dictionary

 

For k in di:

   Print(di[k])

 

For k , v in di.items():

   Print(k,v)

 

 

九、切片

数组切片

 

数组

 

字符串是一个特殊的数组

#加字符串

li=list(str)

li[0]='x'

str=''.join(li)

print(str)

str='-'.join(li)

print(str)

 

#切片

s='asd,sdd,dsf'

p1,p2,p3=s.split(',')

print(p1,p2,p3)

 

 

十、object

 

用type 查看对象类型

用dir查看属性和方法

Print(dir(list))

申明成员函数的时候,第一个参数一定是self

 

鸭子类型:Dark type

 

十一、      读取文件两个方法,一般用with

f=open('t_sales_sum.csv','r')

#print(f.readline())

for linein f.readlines():

  print(line.strip())

 

withopen('t_sales_sum.csv') as f:

  for line in f.readlines():

print(line)

 

上级的文件一个个读,read(start,offset,size)

 

 

十二、      多线程

多线程重复

有多少cpu启多少线程

 

十三、      错误和异常处理

 

 

 

 

你可能感兴趣的:(python,爬虫,基础知识)