Z_阳

制作简易python爬虫工具——爬取租房信息（界面搭建-＞功能实现-＞数据抓取）一步到位

文章目录

- 功能使用
- 项目演示
- 一、开始界面
- 二、主界面
- - 1、主界面执行的功能
  - 2、依次获取每个区域对应的信息
  - 3、开始布局
  - 4、数据爬取
- 三、三级界面
- - 1、布局
  - 2、详细信息爬取
  - 3、绘制信息
  - 4、绘制图片
- 四、说明

功能使用

运行start.py的时候启动整个项目，首页的右下角有一个开始按钮，在点击start按钮之后，一级界面会关闭，触发二级界面。二级界面为主要功能界面，在列表下拉框的位置可以选择区域，目前准备四个区域，分别是东城、西城、海淀、朝阳，选择了某一区域之后界面会显示一条该区域的租房信息，可以通过上一条下一条的按钮来实现动态显示租房条目，如果看到感兴趣的房源信息，可以通过点击右下角的详情按钮查看具体信息，如：面积，水电燃气等，详细信息在三级界面显示，左上角的返回按钮可以再次返回二级界面继续进行房源信息查询，如果想要关闭，可按下三级界面的退出按钮，程序结束

项目演示

一、开始界面

整个项目的界面的编写使用到的模块是tkinter，在此基础上加入爬虫的内容，开始界面非常简单，放置一张背景图，再放置一个start按钮。
先使用tkinter创建出窗口对象，自定义窗口大小，将标题写好，使用Label组件将背景加载好，用Button方法将按钮绘制完成，实现按钮的触发，点击了start按钮之后触发二级界面

import tkinter as tk
from PIL import Image, ImageTk
import pygame
import os
# 创建开始界面窗口
window = tk.Tk()
window.geometry('500x500')
window.resizable(0, 0)
window.title('Start')

def index():
	window.destroy()
	os.system('python index1.py')


# 背景
bg = ImageTk.PhotoImage(file = './images/bg.jpg')
bgLab = tk.Label(window, image = bg, width = 700, height = 700)
bgLab.pack()

# start按钮
startImage = ImageTk.PhotoImage(file = './images/start.png')
start = tk.Button(window, image = startImage, width = 100, height = 100, bd = 0, command = index)
start.place(x = 400, y = 400)

window.mainloop()

效果图

二、主界面

1、主界面执行的功能

主界面执行的功能是进行房源信息的爬取，整体的思路是要做链家房源信息的爬取，以东城、西城、海淀、朝阳这四个区域，每个区域爬取五条房源详细信息，首先是先获取房源的区域

2、依次获取每个区域对应的信息

然后依次获取每个区域的前5条最新房源信息，获取图片和相应的简单信息的描述

那么具体的水电租金等信息在三级界面显示
有了具体的目标之后，开始布局

3、开始布局

1、首先二级界面要有一些特定的logo，各个区域要有各自的功能

2、将界面的分布做出来之后进行功能的制作
界面分布代码如下：
主要内容：窗口，背景，提示文字

# 创建开始界面窗口
window = tk.Tk()
window.geometry('900x500')
window.resizable(0, 0)
window.title('Search')

# bg
bg = ImageTk.PhotoImage(file = './images/bg.png')
bgLab = tk.Label(window, image = bg, width = 900, height = 500)
bgLab.pack()

# frame
frame1 = tk.Frame(window, width = 900, height = 200, bg = 'white')
frame1.place(relx = 0, rely = 0)

frame2 = tk.Frame(window, width = 300, height = 280, bg = 'white')
frame2.place(x = 0, y = 200)
# topImg
topImg = ImageTk.PhotoImage(file = './images/index.jpg')
topLab = tk.Label(frame1, image = topImg, width = 700, height = 100)
topLab.place(x = 100, y = 0)

# left
left = ImageTk.PhotoImage(file = './images/index1_left.jpg')
leftLab = tk.Label(frame1, image = left, width = 100, height = 100)
leftLab.place(x = 0, y = 0)

# right
right = ImageTk.PhotoImage(file = './images/index1_right.png')
rightLab = tk.Label(frame1, image = right, width = 100, height = 100)
rightLab.place(x = 800, y = 0)

bottom = ImageTk.PhotoImage(file = './images/bottom.png')
bottomLab = tk.Label(window, image = bottom, width = 900, height = 200)
bottomLab.place(x = 0, y = 400)

# text提醒
text = tk.Label(frame1, text = '请点击左侧下拉列表选择区域', bg = 'white',
				fg = '#B22222', font = ('SimHei', 20))
text.place(x = 400, y = 110)


# 提醒
zhu = tk.Label(window, text = '注：您可以点击详情查看房源具体信息', bg = '#1fa046',
				fg = '#FFFFFF', font = ('SimHei', 15))
zhu.place(x = 260, y = 450)

3、下面是功能性按钮：详情，上一条，下一条
详情的按钮：用来传递参数，启动三级界面，将要显示的房源信息发送到三级界面上，三级界面用于爬取具体信息
上一条按钮：用来控制信息切换，将上一条房源信息显示到界面上
下一条按钮：用来切换下一条信息的显示
按钮要实现功能的跳转，那一定要用到command属性，调用具体函数去执行

def draw_next_text_Button():

	next_text = tk.Button(window, text='下一条', bg='white', fg='#B22222', font=('SimHei', 20), command=lambda :[chooseArea(), add_Ii()])

	next_text.place(x=750, y=350)


def draw_last_text_Button():

	last_text = tk.Button(window, text='上一条', bg='white', fg='#B22222', font=('SimHei', 20), command=lambda :[chooseArea(), sub_Ii()])

	last_text.place(x=650, y=350)

detail = tk.Button(window, text = '详情', bg = 'white', fg = '#000000',
				  font = ('SimHei', 20), command = showDetail)
detail.place(x = 800, y = 425)

(1)上一条和下一条这两个按钮都是要同时启动两个函数
a.函数一是界面的显示chooseArea()

def chooseArea(*args):
	global checkFlag, house_imgUrl, choice
	print(cbox.get())
	choice = cbox.get()
	if choice == '东城':
		get_DC_house_info(1)
		draw_house_info()

	elif choice == '西城':
		get_XC_house_info(2)
		draw_house_info()

	elif choice == '朝阳':
		get_CY_house_info(3)
		draw_house_info()

	elif choice == '海淀':
		get_HD_house_info(4)
		draw_house_info()

	draw_next_text_Button()
	draw_last_text_Button()

b.函数二是显示的具体条目,由于爬取的信息是存在列表当中的，所以通过数字去控制列表当中元素的显示，如果直接用全局变量的话不能很好的解决信息实时更新的问题，而且会出现逻辑紊乱，因此用类属性去代替全局变量是稳妥的做法
但是这样单纯的去增减的话还有一个问题，列表当中的元素个数是有限的，如果不对边界条件加以限制，那么整个程序会因为index超出范围而崩掉

class I():
	i = -1

def add_Ii():
	I.i += 1
	print('add', I.i)
	if I.i >= 4:
		I.i = 0
def sub_Ii():
	I.i -= 1
	print('sub', I.i)
	if I.i == 0:
		I.i = 0

(2)详情的按钮只需要进行窗口关闭和参数传递即可

def showDetail():

	window.destroy()
	os.system('python index2.py %s %s %s %s'%(totalInfo[choice][I.i]['house_link'],totalInfo[choice][I.i]['house_imgUrl'], choice, I.i))

4、以上的分布做完之后还有最关键的一项，如何进行区域的选择，并显示相应信息
用到的内容是ttk模块里面的Combobox装饰，在界面当中设置一个下拉列表，通过点击的值来进行不同区域的控制
首先，先将下拉列表创建出来

# 创建下拉列表
cbox = ttk.Combobox(frame1, width = 30)
cbox['values'] = ['请选择区域', '东城', '西城', '朝阳', '海淀']
cbox['state'] = 'readonly'
cbox.current(0)
cbox.place(x = 50, y = 110)
cbox.bind('<>', chooseArea)

设置好对应的属性之后，绑定函数进行控制，根据捕获到的值，进行不同区域的显示，为了信息不会重合显示，各自区域进行独立显示

def chooseArea(*args):
	global checkFlag, house_imgUrl, choice
	print(cbox.get())
	choice = cbox.get()
	if choice == '东城':
		get_DC_house_info(1)
		draw_house_info()

	elif choice == '西城':
		get_XC_house_info(2)
		draw_house_info()

	elif choice == '朝阳':
		get_CY_house_info(3)
		draw_house_info()

	elif choice == '海淀':
		get_HD_house_info(4)
		draw_house_info()

	draw_next_text_Button()
	draw_last_text_Button()

4、数据爬取

布局做好之后，就要开始根据选择的区域，进行信息的爬取了
在具体爬取之前，要先获取首页当中不同区域的url，对不同的url进行不同的处理
将url进行完整拼接

# 东城 西城 朝阳 海淀
def get_links(url):

	global select_url
	response = requests.get(url, headers = headers)
	response.encoding = 'utf-8'
	soup = BeautifulSoup(response.text, 'lxml')
	divList = soup.find_all('div', class_ = 'filter__wrapper w1150')

	liList = divList[0].find_all('li', class_ = 'filter__item--level2', limit = 5)
	for i in range(len(liList)):
		res = liList[i].find('a')['href'][8:]
		select_url.append(url + res)

get_links(url)

拿到各自区域的url之后，进行详细数据的爬取，以东城为例

在这个界面当中，要获取房屋图片，房源的标题，简单的描述、价格等

将这些信息获取到之后，都是要显示到二级界面上的，为了方便信息的查看，将图片、房屋信息、价格等数据存储到字典当中，一个房源一个字典，将多个房源整理到一个列表当中进行管理

# 东城-DC
DCList = []
def get_DC_house_info(i):


	DC = requests.get(select_url[i], headers = headers)
	DCsoup = BeautifulSoup(DC.text, 'lxml')

	DCDict = {
     }

	divList = DCsoup.find_all('div', class_='content__list--item--main', limit=5)
	imgList = DCsoup.find_all('div', class_ = 'content__list--item', limit = 5)
	for i in range(len(divList)):

		name = divList[i].find('p', class_='content__list--item--title')
		h_imgUrl = imgList[i].find_all('a', class_='content__list--item--aside')
		house_imgUrl = h_imgUrl[0].img.get('data-src')
		DCDict['house_imgUrl'] = house_imgUrl
		DCDict['house_link'] = url + name.a.get('href')[8:]
		DCDict['house_name'] = name.a.get_text().strip()
		DCDict['house_info'] = ''.join(divList[i].find('p', class_='content__list--item--des').get_text().split())
		DCDict['house_price'] = divList[i].find('span', class_='content__list--item-price').get_text()
		DCList.append(DCDict)
		DCDict = {
     }

	totalInfo['东城'] = DCList

房源的各类信息都获取好之后，剩下该思考的问题就是如何显示了，怎么显示图片，怎么显示房屋信息
图片的获取要先拿到具体的url，然后对图片的url发送请求，获取到图片的字节对象，将其写入到本地，画的时候将其打开即可

代码如下

def get_img(url, choice, i):

	response = requests.get(url, headers = headers)
	byte_img = response.content
	with open('./images/'+choice+str(i)+'.png', 'wb') as f:
		f.write(byte_img)

def draw_img(choice, i):

	img = ImageTk.PhotoImage(file = './images/'+str(choice)+str(i)+'.png')
	imgLab = tk.Label(frame2, image = img, width = 250, height = 182)
	imgLab.config(image = img)
	imgLab.image = img
	imgLab.place(x = 50, y = 0)

def draw_info(name, info, price):

	draw_text_bg()

	name_text = tk.Label(window, text = name, bg = 'white', fg = '#37A', font = ('SimHei', 15))
	name_text.place(x = 400, y = 200)

	info1_text = tk.Label(window, text=info[:21], bg = 'white', fg='#37A', font=('SimHei', 15))
	info1_text.place(x = 400, y = 250)

	info2_text = tk.Label(window, text=info[21:], bg='white', fg='#37A', font=('SimHei', 15))
	info2_text.place(x = 400, y = 300)

	price_text = tk.Label(window, text=price, bg = 'white', fg='#37A', font=('SimHei', 15))
	price_text.place(x = 400, y = 350)

def draw_house_info():
	'''
	:param choice: 每一个区域
	:param I.i: 第几条数据
	:return:
	'''

	get_img(totalInfo[choice][I.i]['house_imgUrl'], choice, I.i)  # 获取图片

	draw_img(choice, I.i)  # 绘制图片

	draw_info(totalInfo[choice][I.i]['house_name'], totalInfo[choice][I.i]['house_info'], totalInfo[choice][I.i]['house_price'])

效果图
在这里插入图片描述

三、三级界面

搞定二级界面的基本信息爬取和显示之后，三级界面要做的事情就是要显示对应的房源的具体信息，所以在详情按钮的时候方法一定要将参数传递准确并完整
参数一：对应房源的url
参数二：对应房源照片的url
参数三：选择的区域，后期要根据区域加载对应图片
参数四：具体选择的哪一个房源的index

house_detail = sys.argv[1]
house_imgUrl = sys.argv[2]
house_choice = sys.argv[3]
house_Ii = sys.argv[4]

参数搞定之后，首先开始的也是界面的布局，背景窗口大小和二级界面大小一致，左上角做返回按钮，右下角做退出按钮，中间部分显示房源详细信息，以及房间照片

1、布局

三级界面的布局及功能实现依然使用tkinter，图片的加载需要ImageTk的支持
代码如下：

window = tk.Tk()
window.geometry('900x500')
window.resizable(0, 0)
window.title('Detail')

# bg
bg = ImageTk.PhotoImage(file = './images/index2.png')
bgLab = tk.Label(window, image = bg, width = 900, height = 500)
bgLab.pack()


# topImg
topImg = ImageTk.PhotoImage(file = './images/index.jpg')
topLab = tk.Label(window, image = topImg, width = 700, height = 100)
topLab.place(x = 100, y = 0)

# right
right = ImageTk.PhotoImage(file = './images/index1_right.png')
rightLab = tk.Label(window, image = right, width = 100, height = 100)
rightLab.place(x = 800, y = 0)

# back
back = ImageTk.PhotoImage(file = './images/back1.jpg')
backBtn = tk.Button(window, image = back , bd = 0, width = 100, height = 100,
					command = back_to_second, bg = 'white')
backBtn.place(x = 0, y = 0)

# exit
exit = ImageTk.PhotoImage(file = './images/exit.jpg')
exitBtn = tk.Button(window, image = exit , width = 100, height = 100,
					command = shut_down)
exitBtn.place(x = 800, y = 400)

返回按钮和退出按钮的触发需要额外添加command，分别触发返回二级界面函数和关闭函数

def back_to_second():

	window.destroy()
	os.system('python index1.py')

def shut_down():

	window.destroy()

2、详细信息爬取

分析前段代码，找到对应的标签，详细去查找

我们发现，整个房屋的基本信息是在class值为content__article__info的div标签当中，具体详细信息是在class值为fl oneline的li标签中，拿到详细信息之后，一个房源存入一个字典，多个房源存入列表当中，方便存储管理

# 获取每一个链接下的租房信息
def get_house_info(res):

	global house_list, area, direction, weihu, ruzhu, floor, dianti, chewei, water, elec, ranqi, cainuan, zuqi, kanfang

	# 返回每一个链接的soup对象
	page_res = get_soup(res)

	# 获取单独房屋情况
	# 价格
	money = page_res.find('div', class_='content__aside--title')  # find是获取单条信息
	danwei = page_res.find('div', class_ = 'content__aside--title')

	# 房屋信息
	house_info = page_res.find_all('div', class_ = 'content__article__info')
	house_title = page_res.find('p', class_ = 'content__title')

	# 基本信息
	base_info = page_res.find_all('li', class_ = 'fl oneline')  # 以列表存储
	area = base_info[1].text[3:]  # 面积
	direction = base_info[2].text[3:]  # 朝向
	weihu = base_info[4].text[3:]  # 维护
	ruzhu = base_info[5].text[3:]  # 入住
	floor = base_info[7].text[3:]  # 楼层
	dianti = base_info[8].text[3:]  # 有无电梯
	chewei = base_info[10].text[3:]  # 有无车位
	water = base_info[11].text[3:]  # 用水
	elec = base_info[13].text[3:]  # 用电
	ranqi = base_info[14].text[3:]  # 燃气
	cainuan = base_info[16].text[3:] # 采暖
	zuqi = base_info[18].text[3:]  # 租期
	kanfang = base_info[21].text[3:]  # 看房
	global info
	info = {
     
			"房屋标题":house_title.text,
			"房屋链接":res,
			"价格":money.find('span').text+danwei.text[5:8],
			"面积":area,
			"朝向":direction,
			"维护":weihu,
			"入住":ruzhu,
			"楼层":floor,
			"电梯":dianti,
			"车位":chewei,
			"用水":water,
			"用电":elec,
			"燃气":ranqi,
			"采暖":cainuan,
			"租期":zuqi,
			"看房":kanfang
	}
	house_list.append(info)
	draw_house_info(info)
	return house_list

3、绘制信息

信息的绘制就比较简单了，用Label直接画上去即可，由于信息的条目比较多，所以调用的方法会多一些

def draw_house_info(info):

	area_text = tk.Label(window, text = '面积:'+info['面积'], bg = '#1fa046', fg = '#FFFFFF', font = ('SimHei', 15))
	area_text.place(x = 100, y = 120)

	direction_text = tk.Label(window, text='朝向:'+info['朝向'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	direction_text.place(x=300, y=120)

	weihu_text = tk.Label(window, text='维护:'+info['维护'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	weihu_text.place(x=100, y=170)

	ruzhu_text = tk.Label(window, text='入住:'+info['入住'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	ruzhu_text.place(x=300, y=170)

	floor_text = tk.Label(window, text='楼层:'+info['楼层'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	floor_text.place(x=100, y=220)

	dianti_text = tk.Label(window, text='电梯:'+info['电梯'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	dianti_text.place(x=300, y=220)

	chewei_text = tk.Label(window, text='车位:'+info['车位'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	chewei_text.place(x=100, y=270)

	water_text = tk.Label(window, text='用水:'+info['用水'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	water_text.place(x=300, y=270)

	elec_text = tk.Label(window, text='用电:'+info['用电'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	elec_text.place(x=100, y=320)

	ranqi_text = tk.Label(window, text='燃气:'+info['燃气'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	ranqi_text.place(x=300, y=320)

	cainuan_text = tk.Label(window, text='采暖:'+info['采暖'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	cainuan_text.place(x=100, y=370)

	zuqi_text = tk.Label(window, text='租期:'+info['租期'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	zuqi_text.place(x=300, y=370)

	kanfang_text = tk.Label(window, text='看房:'+info['看房'], bg='#1fa046', fg='#FFFFFF', font=('SimHei', 15))
	kanfang_text.place(x=100, y=420)

4、绘制图片

图片的绘制尤其要注意，路径和二级界面当中爬取图片的路径要完全一致，确保可以找到对应房源的图片

def draw_house_img(house_choice):

	img = ImageTk.PhotoImage(file='./images/'+str(house_choice)+str(house_Ii)+'.png')
	imgLab = tk.Label(window, image=img)
	imgLab.config(image = img)
	imgLab.image = img
	imgLab.place(x = 500, y = 200)

四、说明

该工具只是一个框架，如果想实现更多功能可以在此基础扩展，在爬取的过程当中也要注意反爬的操作，可以多准备一些代理，准备一些ip, 而且要遵循Robots.txt去文明抓取

练手代码之使用Python实现合并PDF文件 Wcowin Python python pdf 前端
如果你有合并PDF的需要，你会怎么办我们无所不能的程序员会选择写一个Python代码来实现（谁会这么无聊？是我），如果真的有PDF操作需要，我推荐你使用PDFExpert这个软件哈~话不多说直接上代码：importosimportPyPDF2fromtkinterimportTkfromtkinter.filedialogimportaskopenfilenamesdefcombine_pdfs(
Python面向对象面试题及参考答案大模型大数据攻城狮 python 面试继承封装接口隔离弱引用元类
目录什么是面向对象编程？Python中的类和对象是什么？什么是继承？Python如何实现继承？什么是多态？Python如何实现多态？Python中的类属性和实例属性有什么区别？类属性和实例属性的访问优先级规则是什么？Python中的实例方法、类方法和静态方法有什么区别？静态方法、类方法、实例方法的参数传递差异是什么？什么是构造函数（init）？解释__init__方法与__new__方法的区别Py
Python中dataframe的to_list和to_list()差距 emmmmXxxy python list
先新建一个dataframe数据框df=pd.DataFrame({'a':[1,2,3],'b':[3,4,5],'c':[5,6,7]})df结果然后看一下两者的区别dataframe的to_list1df['b']结果031425Name:b,dtype:int642df['b'].to_list结果3看一下数据类型type(df['b'].to_list)结果methoddataframe
Python实现观察者模式麦田里走一夜 PYTHON python 观察者模式开发语言
请关注【来玩AI】公众号体验人工智能来玩AI>>>Python实现观察者模式观察者模式python代码实现说明应用场景观察者模式模式是一种常用的设计模式，可以在对象之间建立一对多的依赖关系。Python中实现观察者模式有多种方式，下面给出一种基于类和装饰器的实现方式：python代码实现classObserver:defupdate(self,observable,*args,**kwargs):
web前端常见面试题 JackieDYH 程序猿面试题前端 javascript vue 面试题
html文件开头DOCTYPE作用DOCTYPE（文档类型）是HTML文档的开头，它指定了HTML文档使用的HTML版本及文档类型，告诉浏览器以哪种规范来解析HTML文档。它的作用有以下几个方面：声明HTML版本：DOCTYPE声明可以让浏览器知道使用哪个HTML版本来解析当前文档，从而根据规范来处理文档中的元素和属性。帮助浏览器正确解析文档：DOCTYPE声明可以确保浏览器以标准模式渲染页面，而
自然语言处理系列（5）——情感分析的原理与实战 DoYangTan 自然语言处理人工智能
自然语言处理系列（5）——情感分析的原理与实战情感分析（SentimentAnalysis）是自然语言处理中的一项经典任务，目的是通过分析文本，判断其表达的情感倾向性。情感分析广泛应用于社交媒体监控、市场调研、客户服务等领域，帮助企业和机构快速了解用户的情感态度。在本文中，我们将深入探讨情感分析的基本概念、常用方法，并展示如何使用Python和现代NLP工具实现情感分析任务。1.情感分析的基本概念
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 web安全 CTF 网络安全大赛 python Linux
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
【现代前端框架中本地图片资源的处理方案】 Gazer_S 前端框架前端缓存 javascript chrome
现代前端框架中本地图片资源的处理方案前言在前端开发中，正确引用本地图片资源是一个常见但容易被忽视的问题。我们不能像在HTML中那样简单地使用相对路径，因为JavaScript模块中的路径解析规则与HTML不同，且现代构建工具对静态资源有特殊的处理机制。本文将详细探讨在webpack和Vite等构建工具中处理本地图片引用的各种方法。传统方式的局限性在传统开发中，我们可能习惯这样引用图片：constl
javaweb将上传的图片保存在项目文件webapp下的upload文件夹下 yuren_xia 后端技术前端技术 web app java tomcat eclipse
前端HTML表单(upload.html)首先，创建一个HTML页面，允许用户选择并上传图片。图片上传上传图片注意：表单的method设置为"post"，enctype需设置成"multipart/form-data"2.后端Servlet(UploadServlet.java)接下来，创建一个Servlet来处理文件上传请求，并将上传的图片保存到webapp/load目录下。packagecom
anaconda 创建虚拟环境 yuweififi 环境搭建
1.打开AnacondaPrompt2.创建环境condacreate--nametorchpython=3.62.输入activatetorch安装的anacondapython虚拟环境打开，torch为创建的env名字3.condainfo--env查看所有创建的环境4.关闭环境deactivate切记先激活环境
Cuppa CMS任意文件读取漏洞（CVE-2022-25401）风中追风-fzzf #文件读取安全 web安全
一、漏洞概述CuppaCMSv1.0中文件管理器的复制功能允许将任何文件复制到当前目录，从而授予攻击者对任意文件得读取权限，/templates/default/html/windows/right.php文件存在任意文件读取漏洞。二、影响范围v1.0三、访问页面四、漏洞复现1、访问接口POST接口/templates/default/html/windows/right.phpPOST/temp
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
网络安全工具 AWVS 与 Nmap：原理、使用及代码示例阿贾克斯的黎明网络安全安全 web安全网络
目录网络安全工具AWVS与Nmap：原理、使用及代码示例AWVS：Web漏洞扫描的利器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用AWVSAPI进行扫描）Nmap：网络探测与端口扫描的神器1.工具概述2.工作原理3.使用方法4.代码示例（Python调用Nmap进行扫描）总结在网络安全领域，AWVS（AcunetixWebVulnerabilityScanner）和Nmap是
深入剖析 Weblogic、ThinkPHP、Jboss、Struct2 历史漏洞阿贾克斯的黎明网络安全 web安全
目录深入剖析Weblogic、ThinkPHP、Jboss、Struct2历史漏洞一、Weblogic漏洞（一）漏洞原理（二）漏洞利用代码（Python示例）（三）防范措施二、ThinkPHP漏洞（一）漏洞原理（二）漏洞利用代码（示例，假设存在漏洞的代码片段）（三）防范措施三、Jboss漏洞（一）漏洞原理（二）漏洞利用代码（Java示例，用于构造恶意序列化数据）（三）防范措施四、Struct2漏洞
前端开发中的常见问题与疑惑：解析与应对策略 lina_mua javascript vue.js html 前端 es6
1.引言1.1前端开发的复杂性前端开发涉及HTML、CSS、JavaScript等多种技术，同时还需要考虑性能优化、跨浏览器兼容性、用户体验等问题。随着前端技术的快速发展，开发者面临的挑战也越来越多。1.2本文的目标本文旨在总结前端开发中常见的问题与疑惑，并提供相应的解决方案和应对策略，帮助开发者更好地应对挑战。2.HTML/CSS常见问题2.1布局问题：如何实现复杂的页面布局？问题描述：实现复杂
【Python专栏】Python的发展历程雾岛心情 Python入门到精通 python 开发语言
Python的创始人为吉多·范罗苏姆（GuidovanRossum），人称龟叔1989年，为了打发圣诞节假期，Guido开始写Python语言的编译器。Python这个名字，来自Guido所挚爱的电视剧MontyPython’sFlyingCircus。他希望这个新的叫做Python的语言，能符合他的理想：创造一种C和shell之间，功能全面，易学易用，可拓展的语言。Python的具体发展历史和版
Stable diffusion 3.5本地运行环境配置记录寸先生的牛马庄园扩散模型 stable diffusion
1.环境配置创建虚环境condacreate-nsd3.5python=3.10Pytorch(>2.0)condainstallpytorch==2.2.2torchvision==0.17.2torchaudio==2.2.2pytorch-cuda=12.1-cpytorch-cnvidiaJupyter能使用Anaconda虚环境condainstallipykernelpython-mi
阿里巴巴DIN模型原理与Python实现 eso1983 python 开发语言算法推荐算法
阿里巴巴的DeepInterestNetwork(DIN)是一种用于点击率预测（CTR）的深度学习模型，特别针对电商场景中用户兴趣多样化和动态变化的特性设计。其核心思想是通过注意力机制动态捕捉用户历史行为中与当前候选商品相关的兴趣。1.DIN模型原理1.核心问题传统推荐模型（如Embedding+MLP）将用户历史行为视为固定长度的向量，忽略了用户兴趣的多样性。例如，用户历史行为中可能包含多个互不
pytorch基础-比较矩阵是否相等 yuweififi pytorch 人工智能
1、使用NumPy库NumPy是Python中用于科学计算的常用库，它提供了array_equal和allclose函数来判断矩阵是否相等。array_equal用于精确比较，allclose用于考虑一定误差范围的近似比较，适合浮点数矩阵。importnumpyasnp#创建示例矩阵matrix_a=np.array([[1,2,3],[4,5,6]])matrix_b=np.array([[1,
一学就会：A*算法详细介绍（Python）不去幼儿园人工智能（AI）#启发式算法算法 python 人工智能机器学习开发语言
本篇文章是博主人工智能学习以及算法研究时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅解。文章分类在启发式算法专栏：【人工智能】-【启发式算法】（6）---《一学就会：A*算法详细介绍（Python）》一学就会：A*算法详细介绍（Python）目录A*算法介绍A*算法的核心概念A*算法的特点A*算法示例：迷宫
电竞赛事数据分析：LNG vs BLG的胜利背后烧瓶里的西瓜皮 python 自动驾驶人工智能数据可视化机器学习
电竞赛事数据分析：LNGvsBLG的胜利背后摘要在S14瑞士轮次日，LNG以1:0战胜BLG，取得了开赛二连胜。本文将通过Python进行数据处理与分析，结合机器学习算法预测比赛结果，并使用数据可视化工具展示关键指标。通过对这场比赛的数据深入挖掘，揭示LNG获胜的关键因素。引言电子竞技（Esports）已经成为全球范围内的一项重要娱乐活动，而《英雄联盟》（LeagueofLegends,LoL）作
如何使用Python编程实现捕获笔记本电脑麦克风的音频并通过蓝牙耳机实时传输 winfredzhang python 音视频实时传输蓝牙耳机
在现代的工作和生活环境中，音频传输的需求日益增加。无论是远程会议、在线教育，还是家庭娱乐，音频的实时传输都扮演着至关重要的角色。今天，我将向大家介绍一个简单而实用的应用程序，它能够捕获笔记本电脑麦克风的音频，并通过蓝牙耳机实时传输。这款应用程序特别适用于需要在会议室等场景中远程听取声音的情况。接下来，我将详细讲解这个应用程序的实现过程，并提供完整的代码和使用指南。引言想象一下这样的场景：你需要离开
网络安全加密python代码黑客Ash web安全安全
点击文末小卡片，免费获取网络安全全套资料，资料在手，涨薪更快网络信息安全中遇到的各种攻击是防不胜防的，采取适当的防护措施就能有效地保护网络信息的安全,包括防火墙、入侵检测系统、漏洞扫描技术以及加密技术等多种防护措施。而信息安全的本质就是要保护信息本身和信息系统在存储、传输中的完整性和保密性,保障不被攻击和篡改,上述的主动攻击、被动攻击和病毒袭击都会造成信息的破坏和泄密,我们以信息安全中的基础理论出
Geo3D城市引擎大规模建筑植被渲染苹果园dog WebGL GIS 3d
import*asGeo3Dfrom"../src";importInitHelperfrom"./InitHelper";//3D场景初始化constsceneControl=InitHelper.init3D();constcontainer=document.querySelector("#map")asHTMLElement;container&&sceneControl.render(c
python 商城性能,python商城项目总结 Yvetzy python 商城性能
importhashlib#实例化md5对象md5=hashlib.md5()#md5.update()方法的参数必须是字节型数据md5.update(bytes(request.POST['password'],encoding="UTF-8"))#以16进制格式存储md5.hexdigest()'''这里有个坑必须注意：md5.update()方法会将每次加密的字符进行拼接，所以每次加密前都要
用Python写一个商城系统潮水岩
如果要用Python写一个商城系统，可以先定义需要实现的功能，再按照功能模块分别进行开发。下面是一个简单的开发流程：数据模型设计：需要定义商品、订单、用户等数据模型，并且将它们存储在数据库中。用户模块：用户可以注册、登录、查看个人信息、修改密码等。商品模块：商家可以发布商品、管理商品信息、查看商品列表等；用户可以查看商品详情、加入购物车等。订单模块：用户可以下单、查看订单详情、取消订单、评价订单等
python pandas 读取数据库_Python+Pandas 获取数据库并加入DataFrame的实例 weixin_39955149 python pandas 读取数据库
Python+Pandas获取数据库并加入DataFrame的实例实例如下所示：importpandasaspdimportsysimportimpimp.reload(sys)fromsqlalchemyimportcreate_engineimportcx_Oracledb=cx_Oracle.connect('userid','password','10.10.1.10:1521/dbins
python导出结果_Python连接Oracle数据查询导出结果 weixin_39712821 python导出结果
python连接oracle，需用用到模块cx_oracle，可以直接pip安装，如网络不好，可下载离线后本地安装本人由于工作需要，期望便捷查询所得结果，且固定输出某个格式具体代码如下：#!coding:utf-8importcx_Oracleconn=cx_Oracle.connect('username/password@IP/连接名')cur=conn.cursor()cur.execute
Python—kafka操作蓝魔Y Python编程 kafka
文档结构1、概念简介2、环境搭建3、操作实践1、概念简介2、环境搭建接口手册：https://kafka-python.readthedocs.io/en/master/Python操作kafka的模块为：kafka-python模块安装pipinstallkafka-python3、操作实践=============================================over====
python使用kafka原理详解_Python操作Kafka原理及使用详解形象顧問Aking
Python操作Kafka原理及使用详解一、什么是KafkaKafka是一个分布式流处理系统，流处理系统使它可以像消息队列一样publish或者subscribe消息，分布式提供了容错性，并发处理消息的机制二、Kafka的基本概念kafka运行在集群上，集群包含一个或多个服务器。kafka把消息存在topic中，每一条消息包含键值(key)，值(value)和时间戳(timestamp)。kafk
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro