Python 3.0爬取百度文库文档(一)

Python 3.0爬取百度文库文档(一)

在这里我简单的使用了python的Tkinter实现了一个小的界面,主要是用来显示根据关键字搜索出来的文档,然后可以点击文档名字,就自动爬取所点击的文档到指定的目录下。

第一步:

你要知道什么是Tkinter,它 是 Python 的标准 GUI 库。Python 使用 Tkinter 可以快速的创建 GUI 应用程序。 而其主要流程就是:

  • 导入 Tkinter 模块
  • 创建控件
  • 指定这个控件的 master, 即这个控件属于哪一个
  • 告诉 GM(geometry manager) 有一个控件产生了。

那么现在我们来编辑GUI界面:

from tkinter import *  # 导入 Tkinter 库
from  tkinter import scrolledtext #导入scrolledtext库
import requests #导入resquests库
from bs4 import BeautifulSoup #导入BeautifulSoup库
from urllib.parse import quote

root = Tk()  # 创建窗口对象的背景色

def getsearchword():
    keyword = entry.get()
    word = quote(keyword, 'utf-8')

entry = Entry(root) #文本输入框
entry.grid(row = 0,column = 0,ipadx = 90,padx=10,pady=5,sticky=W)#文本输入框
button = Button(root, text="搜索",command = getsearchword).grid(row=0,column=1,padx=10,pady=5,sticky=E)#搜索按钮
scrolW = 51 # 设置文本框的长度
scrolH = 15 # 设置文本框的高度
listcontent = scrolledtext.ScrolledText(root,width=scrolW, height=scrolH, wrap=WORD)#内容显示列表,使用到了tkinter内置的scrolledtext--滚动文本框
listcontent.grid(column=0, columnspan=2)

#设置基本参数
def setParams():
    root.title('文库小帮手器')#设置title
    root.geometry('400x250')#设置大小

if __name__ == '__main__':
    setParams()
    root.mainloop()  # 进入消息循环

上面主要用到了表中的几个控件

控件 描述
Button 按钮控件;在程序中显示按钮
Entry 输入控件;用于显示简单的文本内容

标准属性
标准属性也就是所有控件的共同属性,如大小,字体和颜色等等。

属性 描述
Dimension 控件大小
Color 控件颜色
Font 控件字体
Anchor 锚点
Relief 控件样式
Bitmap 位图
Cursor 光标

几何管理
Tkinter控件有特定的几何状态管理方法,管理整个控件区域组织,一下是Tkinter公开的几何管理类:包、网格、位置

几何方法 描述
pack() 包装
grid() 网格
place() 位置

如果是 对Python GUI编程(Tkinter)有兴趣的同学,请点击这里

嗯?第一次写博客,有什么错误的地方,请泥萌多多指教吖!(ฅ>ω<*ฅ) 蟹蟹啦~

你可能感兴趣的:(Python爬虫学习)