Python学习日记 16

今天来更新的就比较早了。
因为比较有精神了,发烧也好的差不多了。

so,进入正题。
因为之前格式化了硬盘,所以所有的东西都要重新装一遍。

这里放一个不同办法的解释在这里。

Download Windows x86-64 web-based installer--在线安装
Download Windows x86-64 executable installer--exe程序安装
Download Windows x86-64 embeddable zip file--压缩文件解压缩安装

ok,这次我装的是3.7的版本。

变量设置

和mac不一样的是,windows首先要设置变量,把路径先设置好。

第一次运行

话说windows还是很视觉化的,可以随便放置py文件,只要把路径设置对就可以了。

然后安装PyCharm 。


安装运行完成

然后,首先把之前写的爬虫代码运行一下,先装bs4这库,都要比mac os方便很多。

完美运行

知其然不知其所以然,所以我得一句一句的研究。
先从BeautifulSoup开始。

from bs4 import BeautifulSoup
from lxml import html
import xml
import requests

url = "https://movie.douban.com/chart"
f = requests.get(url)                 #Get该网页从而获取该html内容
#通过requests这个请求把网址里面的源代码拿到

soup = BeautifulSoup(f.content, "lxml")  #用lxml解析器解析该网页的内容, 好像f.text也是返回的html
#print(f.content.decode())
#content = soup.find_all('div',class_="p12" )   #因为calss和关键字冲突,所以改名class_

for k in soup.find_all('div',class_='pl2'):#,找到div并且class为pl2的标签
  #把里面的内容赋予到k这里。

   a = k.find_all('span')       #在每个对应div标签下找span标签,会发现,一个a里面有四组span
   print(a[0].string)            #取第一组的span中的字符串
#string 字符串的意思

我加了一些注释。
勉强解释了一下,明天可以自己写一个来看看。

see you

你可能感兴趣的:(Python学习日记 16)