凯森森讲Python

基于python爬虫技术对于淘宝的数据分析的设计与实现

本篇仅在于交流学习

本文主要介绍通过 selenium 模块和 requests 模块，同时让机器模拟人在浏览器上的行为,登录指定的网站,通过网站内部的搜索引擎来搜索自己相应的信息,从而获取相应关键字的商品信息，并进而获取数据，然后通过csv模块将数据存储到本地库中，接着在通过pandas、jieba、matplotlib 等模块进行分析，得出数据的特征。

本章对本系统设计的功能性需求和非功能性需求进行了详细的分析。把系统所需要的模块进行了整理和划分，明确了各个功能的需求。

设计任务：完成一个基于爬虫的网络页面和数据分析

(1)访问功能：使用爬虫进行页面访问。

(2)查询功能：运用程序在页面上进行自动关键字查询。

(3)爬取功能：对于页面上的信息进行过滤和针对化的爬取。

(4)存储功能：对于信息进行本地化的存储，将爬取数据保存至csv文件内。

(5)数据分析功能：对于本地化数据进行数据分析和数据展示。

构建HTTP伪装

这是针对 Selenium WebDriver 的 ChromeDriver 来设置的一组浏览器参数，以在爬取网站时提高程序稳定性和安全性。这些参数的主要作用如下：

1. '--disable-extensions'：禁用 Chrome 扩展，避免插件对页面渲染产生影响。

2. '--disable-blink-features=AutomationControlled'：禁用自动控制特性，避免被目标网站检测到使用了自动化爬虫。

3. '--no-sandbox'：关闭 Chrome 浏览器的沙盘机制，提高程序的运行速度。

4. '--disable-dev-shm-usage'：禁用 '/dev/shm' 临时文件系统，可避免程序因为内存不足而崩溃。

5. '--disable-gpu'：禁用 GPU 硬件加速，减少程序资源占用。

6. '--start-maximized'：开启浏览器最大化窗口模式，优化用户体验。

7. 'add_experimental_option('excludeSwitches', ['enable-automation'])'：禁用自动化开关，并防止目标网站检测到 WebDriver 的使用情况。

8. 'add_experimental_option('useAutomationExtension', False)'：禁用自动化扩展功能，避免被目标网站检测到使用了自动化爬虫。

9. '--user-agent'：指定浏览器的 User-Agent，在请求目标网站时伪装成一个正常的浏览器访问，避免被目标网站检测到使用了自动化爬虫。

10.'chrome_options.add_argument("--proxy-server=http://{}".format(proxy_address))' 这行代码可以在使用Selenium自动化测试时配置代理服务器。具体来说，'chrome_options' 是chrome浏览器的选项对象，'add_argument()' 方法是向该选项对象中添加参数的方法。

其中， '--proxy-server' 是Chrome浏览器的一个参数，用来设置代理服务器地址。代理服务器地址一般包括 IP 地址和端口号，这里的 'proxy_address' 就是一个包含IP地址和端口号的变量。

使用格式化字符串 '"{}'".format(proxy_address)' 将代理服务器地址插入到参数字符串中，最终生成一个完整的代理服务器地址，然后将其作为参数传递给 'add_argument()' 方法。

这样，启动 Chrome 浏览器时，就会按照传入的代理服务器地址来进行网络请求，并通过该代理服务器获取网页内容。这在需要匿名爬取数据或测试一些需要使用代理的网站时非常有用。

这些设置是为了在爬取目标网站时提高程序稳定性、安全性和隐蔽性。

headers = {

'User-Agent': '自己的请求头'

}

chrome_options = webdriver.ChromeOptions()

# 设置ChromeDriver的options参数，以隐藏自动化控制

chrome_options.add_argument('--disable-extensions')

chrome_options.add_argument('--disable-blink-features=AutomationControlled')

chrome_options.add_argument('--no-sandbox')

chrome_options.add_argument('--disable-dev-shm-usage')

chrome_options.add_argument('--disable-gpu')

chrome_options.add_argument('--start-maximized')

chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])

chrome_options.add_experimental_option('useAutomationExtension', False)

chrome_options.add_argument(f'user-agent={headers["User-Agent"]}')

# 判断是否使用代理IP

proxy_address = get_proxy()

if proxy_address is not None:

chrome_options.add_argument("--proxy-server=http://{}".format(proxy_address)) # 添加代理IP地址和端口号到ChromeOptions中

# 创建ChromeDriver对象

driver = webdriver.Chrome(options=chrome_options)

模拟登录

使用 Selenium WebDriver 实现淘宝网站登录的 Python 函数。其主要实现逻辑如下：

1. 跳转到淘宝登录页面：利用 WebDriver 打开淘宝网站登录页面。

2. 输入账号和密码：使用 'find_element_by_id' 方法找到对应的元素并输入对应的账号和密码。

3. 登录验证：等待用户输入验证码，并点击登录按钮进行验证。如果登录成功，则返回登录成功的浏览器实例，否则打印错误信息并关闭浏览器，返回 None。

该函数仅作为示例参考，在实际爬虫开发中需结合目标网站的特定情况进行调整和优化。

def login_taobao(driver, username, password):

# 跳转到淘宝登陆页面

driver.get('https://login.taobao.com/member/login.jhtml')

# 输入账号和密码

username_input = driver.find_element_by_id('fm-login-id')

password_input = driver.find_element_by_id('fm-login-password')

username_input.click()

username_input.send_keys(username)

password_input.click()

password_input.send_keys(password)

time.sleep(10)

# 登陆验证

try:

# 等待用户输入验证码

time.sleep(20)

# 点击登陆按钮

actions = ActionChains(driver)

actions.move_to_element(driver.find_element_by_class_name('fm-submit'))

actions.click().perform()

print('登录成功')

except Exception as e:

print('登录失败: ', e)

driver.quit()

return None

time.sleep(3)

return driver

信息爬取

使用 Selenium WebDriver 实现淘宝网站商品爬取的 Python 函数。主要实现逻辑如下：

1. 通过 'driver.get()' 方法打开淘宝网站搜索页，并使用通过让程序进行暂停操作逃逸反爬虫检测'time.sleep()' 方法等待网页数据加载完成。

2. 使用 'driver.find_elements_by_xpath()' 方法找到页面上所有需要爬取的商品元素，遍历每个元素，并使用 'find_element_by_xpath()' 方法定位元素中需要爬取的信息。

3. 将爬取到的数据存储为字典格式，并添加到 data 列表中。

4. 如果在遍历过程中出现异常情况，将错误信息打印到控制台。

5. 打印当前已完成的页面数。

def crawl_taobao(driver, keyword, pages):

data = []

for i in range(1, pages+1): # 爬取相应页面的商品信息

url = 'https://s.taobao.com/search?q={}&s={}'.format(keyword, (i-1)*44)

driver.get(url)

time.sleep(5)

products = driver.find_elements_by_xpath('//div[@class="items"][1]/div[contains(@class, "item")]')

for product in products:

try:

# 爬取商品名称、价格、地点、店铺和销量等信息

title = product.find_element_by_xpath(".//div[@class='row row-2 title']/a")

price = product.find_element_by_xpath('.//div[@class="price g_price g_price-highlight"]/strong')

location = product.find_element_by_xpath('.//div[@class="location"]')

shop = product.find_element_by_xpath('.//div[@class="shop"]/a/span[2]')

sales = product.find_element_by_xpath('.//div[@class="deal-cnt"]')

data.append({'Title': title.text.strip(),

'Price': float(price.text.strip()),

'Location': location.text.strip().replace(' ', ''),

'Shop': shop.text.strip(),

'Sales': sales.text.strip()})

except Exception as e:

print('Error:', e)

print('已完成第{}页'.format(i))

# 将数据存储为CSV文件

df = pd.DataFrame(data)

with open(keyword + '.csv', 'w', encoding='utf-8-sig', newline='') as f:

writer = csv.writer(f, quoting=csv.QUOTE_ALL)

writer.writerow(['Title', 'Price', 'Location', 'Shop', 'Sales'])

for item in data:

writer.writerow([item['Title'].replace('"', '""'), item['Price'], item['Location'].replace('"', '""'),

item['Shop'].replace('"', '""'), item['Sales']])

return df

1. 使用 Pandas 库的 'DataFrame()' 方法，将爬取到的商品数据 'data' 转换为 DataFrame 格式。

2. 使用 Python 的 CSV 库打开一个新的 CSV 文件，将数据按照指定格式按行写入文件中。

3. 将 DataFrame 格式的数据返回供后续使用。

数据分析

1. 使用 Pandas 库的 'mean()'、'min()' 和 'max()' 方法，分别计算该 DataFrame 中的价格均值、最低价和最高价，并将结果输出到控制台。

2. 使用 Matplotlib 库的 'hist()' 方法，绘制商品价格的直方图，其中 bins 参数表示划分价格区间的个数，range 参数表示价格区间的范围。

3. 使用 Matplotlib 库的 'boxplot()' 方法，绘制商品价格的箱线图，用于展示价格分布的离散程度，其中 yticks 参数可以调整箱线图的 y 轴标签方向。

4. 使用 Matplotlib 库的 'scatter()' 方法，绘制商品价格和销量的散点图，用于展示两者之间的相关性。

5. 使用 Seaborn 库的 'barplot()' 方法，绘制商品价格的柱形图，其中使用 'pd.cut()' 方法对价格数据进行分组，并可以指定分组区间，以便更好地展示价格分布情况。

生成词云图

1. 将所有的地区名称通过空格拼接成一个字符串，并使用 jieba 库的 'lcut()' 方法对字符串进行分词。

2. 创建 WordCloud 对象，并指定一些参数，例如背景颜色、字体文件路径和停用词列表等。

3. 调用 WordCloud 对象的 'generate()' 方法，根据输入的文本生成词云图。

4. 使用 Matplotlib 库的 'imshow()' 方法，显示生成的词云图，并使用 'axis()' 方法隐藏坐标轴。

# 定义函数分析商品价格

def analyze_price(df):

# 统计均价、最低价和最高价，并显示到控制台

avg_price = round(df['Price'].mean(), 2)

min_price = df['Price'].min()

max_price = df['Price'].max()

print('均价{}元，最低价{}元，最高价{}元'.format(avg_price, min_price, max_price))

# 绘制商品价格的直方图

plt.hist(df['Price'], bins=20, range=(0, 2000))

plt.xlabel('价格', fontsize=14)

plt.ylabel('数量', fontsize=14)

plt.xticks(rotation=45)

plt.yticks(fontsize=14)

plt.title('商品价格分布直方图')

plt.show()

# 绘制商品价格的箱线图

plt.boxplot(df['Price'])

plt.ylabel('价格', fontsize=14)

plt.yticks(fontsize=14, rotation=-45)

plt.title('商品价格分布箱线图')

plt.show()

# 绘制商品价格和销量的散点图

plt.scatter(df['Price'], df['Sales'], s=50, alpha=0.7, c='b', marker='o')

plt.xlabel('价格')

plt.ylabel('销量')

plt.title('商品价格与销量关系散点图')

plt.grid(True)

plt.show()

# 绘制商品价格的柱形图

df_price = df.groupby(pd.cut(df['Price'], bins=[0, 100, 200, 300, 500, 800, 1200, 2000]))['Price'].count()

plt.figure(figsize=(8, 6))

sns.barplot(x=df_price.index.astype(str), y=df_price.values, color='coral')

plt.xlabel('价格区间', fontsize=14)

plt.ylabel('数量', fontsize=14)

plt.xticks(rotation=45)

plt.yticks(fontsize=14)

plt.title('商品价格分布柱形图')

plt.show()

# 定义函数生成地区词云图

def make_location_wordcloud(df):

# 合并所有地区数据为一个字符串

location_str = ' '.join(df['Location'])

# 使用jieba库对字符串进行分词

words = jieba.lcut(location_str)

new_location_str = ' '.join(words)

# 停用词列表

stopwords = ['市', '省', '自治区', '特别行政区']

# 创建WordCloud对象

wc = WordCloud(background_color='white', font_path='msyh.ttc', stopwords=stopwords)

# 生成词云图

wc.generate(new_location_str)

# 显示词云图

plt.imshow(wc, interpolation='bilinear')

plt.axis('off')

plt.show()

添加代理地址判断功能及有关于输入数据判断出错处理

数据判断

1. 使用 Python 的 'while' 循环，一直等待用户输入，直到输入格式正确为止。

2. 使用内置函数 'int()' 将用户输入的字符串转换为整数类型。

3. 如果输入内容不能正常转换为整数，则捕获 'ValueError' 异常，并提示用户重新输入。

4. 如果用户输入正确，将输入的整数作为函数返回值。

代理IP判断

1. 使用 'input()' 函数让用户选择是否使用代理 IP，当输入不为 'Y' 或者 'N' 时，通过 'while' 循环不断重新提示输入直至正确。

2. 如果用户选择使用代理 IP，通过 'input()' 函数获取代理 IP，如果输入不符合规范，通过多层嵌套的 'try...except...' 分别对输入的 IP 和端口号进行校验，分别检查其是否在规定的范围内和是否符合 IPv4 地址格式。

3. 如有输入不符合规范，通过 'print()' 函数及 'input()' 函数让用户选择操作。

4. 如果用户选择重新输入代理 IP，则通过 'continue' 关键字实现循环，反之返回 'None'。

# 定义函数输入数字是否有误

def get_pages():

while True:

try:

pages = int(input('请输入要爬取的页码数：'))

break

except ValueError:

print("请输入数字！")

return pages

# 定义函数是否使用代理IP

def get_proxy():

use_proxy = input('是否需要使用代理IP？(Y/N)：').upper()

# 判断输入是否有误

while use_proxy not in ['Y', 'N']: # 如果输入的字符不是Y或N，则重新提示输入

print('请输入正确的(Y/N)')

use_proxy = input('是否需要使用代理IP？(Y/N)：').upper()

if use_proxy == 'Y':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

# 判断代理IP是否正确

while True:

try:

ip, port = proxy_address.split(':') # 提取IP地址和端口号

if not (0 < int(port) < 65536): # 端口号不在合法范围内

print('代理IP地址和端口号输入有误，请选择操作：')

print('1. 重新输入代理IP地址和端口号')

print('2. 不使用代理IP')

choice = input('请选择操作(1/2)：')

while choice not in ['1', '2']:

print('请输入正确的选项：')

choice = input('请选择操作(1/2)：')

if choice == '1':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

continue

else:

return None

parts = ip.split('.')

if len(parts) != 4 or not all(0 <= int(part) < 256 for part in parts): # IP地址格式不正确

print('代理IP地址和端口号输入有误，请选择操作：')

print('1. 重新输入代理IP地址和端口号')

print('2. 不使用代理IP')

choice = input('请选择操作(1/2)：')

while choice not in ['1', '2']:

print('请输入正确的选项：')

choice = input('请选择操作(1/2)：')

if choice == '1':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

continue

else:

return None

break # 输入合法，跳出循环

except Exception:

print('代理IP地址和端口号输入有误，请选择操作：')

print('1. 重新输入代理IP地址和端口号')

print('2. 不使用代理IP')

choice = input('请选择操作(1/2)：')

while choice not in ['1', '2']:

print('请输入正确的选项：')

choice = input('请选择操作(1/2)：')

if choice == '1':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

else:

return None

return proxy_address

else:

print('不使用代理IP。') # 直接提示用户不使用代理IP

return None

运行结果

完整代码

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

134

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

178

179

180

181

182

183

184

185

186

187

188

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

204

205

206

207

208

209

210

211

212

213

214

215

216

217

218

219

220

221

222

223

224

225

226

227

228

229

230

231

232

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

import csv

import time

from selenium.webdriver.common.proxy import Proxy, ProxyType

import jieba

import matplotlib as mpl

import matplotlib.pyplot as plt

import pandas as pd

from selenium import webdriver

from selenium.webdriver.common.action_chains import ActionChains

from wordcloud import WordCloud

import seaborn as sns

mpl.rcParams['font.family'] = 'SimSun'

mpl.rcParams['font.size'] = 14

# 定义函数模拟登陆淘宝

def login_taobao(driver, username, password):

# 跳转到淘宝登陆页面

driver.get('https://login.taobao.com/member/login.jhtml')

# 输入账号和密码

username_input = driver.find_element_by_id('fm-login-id')

password_input = driver.find_element_by_id('fm-login-password')

username_input.click()

username_input.send_keys(username)

password_input.click()

password_input.send_keys(password)

time.sleep(10)

# 登陆验证

try:

# 等待用户输入验证码

time.sleep(20)

# 点击登陆按钮

actions = ActionChains(driver)

actions.move_to_element(driver.find_element_by_class_name('fm-submit'))

actions.click().perform()

print('登录成功')

except Exception as e:

print('登录失败: ', e)

driver.quit()

return None

time.sleep(3)

return driver

# 定义函数爬取淘宝商品信息

def crawl_taobao(driver, keyword, pages):

data = []

for i in range(1, pages+1): # 爬取相应页面的商品信息

url = 'https://s.taobao.com/search?q={}&s={}'.format(keyword, (i-1)*44)

driver.get(url)

time.sleep(5)

products = driver.find_elements_by_xpath('//div[@class="items"][1]/div[contains(@class, "item")]')

for product in products:

try:

# 爬取商品名称、价格、地点、店铺和销量等信息

title = product.find_element_by_xpath(".//div[@class='row row-2 title']/a")

price = product.find_element_by_xpath('.//div[@class="price g_price g_price-highlight"]/strong')

location = product.find_element_by_xpath('.//div[@class="location"]')

shop = product.find_element_by_xpath('.//div[@class="shop"]/a/span[2]')

sales = product.find_element_by_xpath('.//div[@class="deal-cnt"]')

data.append({'Title': title.text.strip(),

'Price': float(price.text.strip()),

'Location': location.text.strip().replace(' ', ''),

'Shop': shop.text.strip(),

'Sales': sales.text.strip()})

except Exception as e:

print('Error:', e)

print('已完成第{}页'.format(i))

# 将数据存储为CSV文件

df = pd.DataFrame(data)

with open(keyword + '.csv', 'w', encoding='utf-8-sig', newline='') as f:

writer = csv.writer(f, quoting=csv.QUOTE_ALL)

writer.writerow(['Title', 'Price', 'Location', 'Shop', 'Sales'])

for item in data:

writer.writerow([item['Title'].replace('"', '""'), item['Price'], item['Location'].replace('"', '""'),

item['Shop'].replace('"', '""'), item['Sales']])

return df

# 定义函数分析商品价格

def analyze_price(df):

# 统计均价、最低价和最高价，并显示到控制台

avg_price = round(df['Price'].mean(), 2)

min_price = df['Price'].min()

max_price = df['Price'].max()

print('均价{}元，最低价{}元，最高价{}元'.format(avg_price, min_price, max_price))

# 绘制商品价格的直方图

plt.hist(df['Price'], bins=20, range=(0, 2000))

plt.xlabel('价格', fontsize=14)

plt.ylabel('数量', fontsize=14)

plt.xticks(rotation=45)

plt.yticks(fontsize=14)

plt.title('商品价格分布直方图')

plt.show()

# 绘制商品价格的箱线图

plt.boxplot(df['Price'])

plt.ylabel('价格', fontsize=14)

plt.yticks(fontsize=14, rotation=-45)

plt.title('商品价格分布箱线图')

plt.show()

# 绘制商品价格和销量的散点图

plt.scatter(df['Price'], df['Sales'], s=50, alpha=0.7, c='b', marker='o')

plt.xlabel('价格')

plt.ylabel('销量')

plt.title('商品价格与销量关系散点图')

plt.grid(True)

plt.show()

# 绘制商品价格的柱形图

df_price = df.groupby(pd.cut(df['Price'], bins=[0, 100, 200, 300, 500, 800, 1200, 2000]))['Price'].count()

plt.figure(figsize=(8, 6))

sns.barplot(x=df_price.index.astype(str), y=df_price.values, color='coral')

plt.xlabel('价格区间', fontsize=14)

plt.ylabel('数量', fontsize=14)

plt.xticks(rotation=45)

plt.yticks(fontsize=14)

plt.title('商品价格分布柱形图')

plt.show()

# 定义函数生成地区词云图

def make_location_wordcloud(df):

# 合并所有地区数据为一个字符串

location_str = ' '.join(df['Location'])

# 使用jieba库对字符串进行分词

words = jieba.lcut(location_str)

new_location_str = ' '.join(words)

# 停用词列表

stopwords = ['市', '省', '自治区', '特别行政区']

# 创建WordCloud对象

wc = WordCloud(background_color='white', font_path='msyh.ttc', stopwords=stopwords)

# 生成词云图

wc.generate(new_location_str)

# 显示词云图

plt.imshow(wc, interpolation='bilinear')

plt.axis('off')

plt.show()

# 定义函数输入数字是否有误

def get_pages():

while True:

try:

pages = int(input('请输入要爬取的页码数：'))

break

except ValueError:

print("请输入数字！")

return pages

# 定义函数是否使用代理IP

def get_proxy():

use_proxy = input('是否需要使用代理IP？(Y/N)：').upper()

# 判断输入是否有误

while use_proxy not in ['Y', 'N']: # 如果输入的字符不是Y或N，则重新提示输入

print('请输入正确的(Y/N)')

use_proxy = input('是否需要使用代理IP？(Y/N)：').upper()

if use_proxy == 'Y':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

# 判断代理IP是否正确

while True:

try:

ip, port = proxy_address.split(':') # 提取IP地址和端口号

if not (0 < int(port) < 65536): # 端口号不在合法范围内

print('代理IP地址和端口号输入有误，请选择操作：')

print('1. 重新输入代理IP地址和端口号')

print('2. 不使用代理IP')

choice = input('请选择操作(1/2)：')

while choice not in ['1', '2']:

print('请输入正确的选项：')

choice = input('请选择操作(1/2)：')

if choice == '1':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

continue

else:

return None

parts = ip.split('.')

if len(parts) != 4 or not all(0 <= int(part) < 256 for part in parts): # IP地址格式不正确

print('代理IP地址和端口号输入有误，请选择操作：')

print('1. 重新输入代理IP地址和端口号')

print('2. 不使用代理IP')

choice = input('请选择操作(1/2)：')

while choice not in ['1', '2']:

print('请输入正确的选项：')

choice = input('请选择操作(1/2)：')

if choice == '1':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

continue

else:

return None

break # 输入合法，跳出循环

except Exception:

print('代理IP地址和端口号输入有误，请选择操作：')

print('1. 重新输入代理IP地址和端口号')

print('2. 不使用代理IP')

choice = input('请选择操作(1/2)：')

while choice not in ['1', '2']:

print('请输入正确的选项：')

choice = input('请选择操作(1/2)：')

if choice == '1':

proxy_address = input('请输入代理IP地址和端口号(例如：ip:port)：')

else:

return None

return proxy_address

else:

print('不使用代理IP。') # 直接提示用户不使用代理IP

return None

# 创建总方法调用函数

def main():

# 用户输入账号、密码和要搜索的商品关键字

username = input('请输入淘宝账号：')

password = input('请输入淘宝密码：')

keyword = input('请输入要搜索的商品关键字：')

# 输入数字是否有误

pages = get_pages()

# 设置请求头信息

headers = {

'User-Agent': '自己的请求头'

}

chrome_options = webdriver.ChromeOptions()

# 设置ChromeDriver的options参数，以隐藏自动化控制

chrome_options.add_argument('--disable-extensions')

chrome_options.add_argument('--disable-blink-features=AutomationControlled')

chrome_options.add_argument('--no-sandbox')

chrome_options.add_argument('--disable-dev-shm-usage')

chrome_options.add_argument('--disable-gpu')

chrome_options.add_argument('--start-maximized')

chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])

chrome_options.add_experimental_option('useAutomationExtension', False)

chrome_options.add_argument(f'user-agent={headers["User-Agent"]}')

# 判断是否使用代理IP

proxy_address = get_proxy()

if proxy_address is not None:

chrome_options.add_argument("--proxy-server=http://{}".format(proxy_address)) # 添加代理IP地址和端口号到ChromeOptions中

# 创建ChromeDriver对象

driver = webdriver.Chrome(options=chrome_options)

driver = login_taobao(driver, username, password)

# 如果登陆成功，进行商品信息爬取、价格分析和词云制作

if driver is not None:

df = crawl_taobao(driver, keyword, pages)

# 如果爬取到的数据不为空，才进行价格分析和词云制作

if not df.empty:

analyze_price(df)

make_location_wordcloud(df)

# 关闭浏览器

driver.quit()

if __name__ == '__main__':

main()

　结尾

这是根据模拟登陆进行淘宝网内部商品的数据获取和分析制作的一个小工具，考虑到淘宝网内部进行反爬虫技术强面对滑块登录验证还暂且无法做到，但是进行试验还是可以，在使用时需配合ChromeDriver使用，通过与Selenium Webdriver一起使用，来自动化执行各种Web操作。

Python爬虫（57）Python数据可视化全攻略：Matplotlib从入门到三维动态图表（8000字实战教程）一个天蝎座白勺程序猿 Python爬虫入门到高阶实战 python 爬虫信息可视化
目录背景与需求分析第一章：Matplotlib基础与核心工作流1.1环境配置与基础架构1.2基础图表类型实战1.2.1折线图进阶1.2.2分组柱状图第二章：高阶可视化技术2.1子图矩阵与多面板布局2.2动态可视化与动画第三章：行业案例实战案例1：电商用户行为分析案例2：医疗影像数据可视化第四章：可视化美学与工程优化4.1配色方案实战4.2百万级数据渲染优化第五章：交互式扩展方案5.1Matplot
Python多进程编程
Python多任务提升程序性能之一---------多进程#Python的多进程编程的方法是multiprocessing，他是可以在当前的主进程下面去创建n个子进程所以所以他，执行相当于n+1个进程#首先导入multimprocessing包importmultiprocessing#防止执行熟读太快看出出多进程的区别importtime#编写尊卑使用多进程的方法deftest01():fori
python三角网格代码_Python 实现 Delaunay Triangulation weixin_39828457 python三角网格代码
DelaunayTriangulation是一种空间划分的方法，它能使得分割形成的三角形最小的角尽可能的大，关于DelaunayTriangulation的详细介绍，请参考这里，DelaunayTriangulation在很多领域都有应用，科学计算领域它是有限元和有限体积法划分网格的重要方法，除此之外在图像识别、视觉艺术等领域也有它的身影。贴一段有趣的油管视频，用DelaunayTriangula
python-多线程编程 Protein Designer 蛋白质结构 python
文章目录1.多任务介绍2.进程介绍3.使用多进程来完成多任务3.1进程的创建步骤3.2进程执行带有参数的任务3.3获取进程编号3.4多进程编程的注意点主进程会等待所有的子进程执行结束在结束设置守护主进程：**主进程结束后不会再继续执行子进程中剩余的工作**3.5进程池与进程锁3.6进程的通信3.7线程3.8GIL全局锁3.9异步1.多任务介绍多任务是指在同一时间内执行多个任务。定义举例并发在一段时
python之多进程(multiprocessing)
multiprocessing模块提供了一个Process类来代表一个进程对象，multiprocessing模块像线程一样管理进程，这个是multiprocessing的核心，它与threading很相似，对多核CPU的利用率会比threading好的多前言Multiprocessing.Pool可以提供指定数量的进程供用户调用，当有新的请求提交到pool中时，如果池还没有满，那么就会创建一个新
AI人工智能领域深度学习的跨模态检索技术 AI学长带你学AI AI人工智能与大数据应用开发 AI应用开发高级指南人工智能深度学习 ai
AI人工智能领域深度学习的跨模态检索技术关键词：跨模态检索、深度学习、多模态学习、特征提取、相似度计算、注意力机制、Transformer摘要：本文深入探讨了AI领域中基于深度学习的跨模态检索技术。我们将从基础概念出发，详细分析跨模态检索的核心算法原理、数学模型和实际应用。文章包含完整的Python实现示例，展示如何构建一个跨模态检索系统，并讨论当前的技术挑战和未来发展方向。通过本文，读者将全面理
Python-多进程编程 (multiprocessing 模块) Kusunoki_D Python 操作系统 python 进程
目录一、创建进程1.Process的语法结构2.进程不共享全局变量二、进程间通信1.队列通信2.管道通信三、进程池1.常用函数2.进程池中的Queue四、应用：复制文件夹（多进程版）五、守护进程和进程同步六、注意事项通过使用multiprocessing模块，Python程序可以在多核处理器上实现并行处理，提高程序的执行效率和响应速度。一、创建进程要创建一个新的进程，需要实例化multiproce
使用 Python 调用 Instagram API 爬取 Instagram 图片（完整指南） Python爬虫项目 python 开发语言爬虫 selenium beautifulsoup
一、引言在社交媒体平台中，Instagram以其图片和视频为主的独特风格，吸引了全球数十亿用户。无论是旅行博主、美食摄影师，还是品牌推广，Instagram上的数据具有极高的商业和研究价值。为了获取Instagram的公开数据，我们需要使用官方提供的InstagramGraphAPI。通过这个API，我们可以获取以下信息：✅账户基本信息（用户ID、用户名、头像等）✅用户的图片和视频✅用户的评论、点
轻松开发AI应用：Dify、Langchain与Coza全方位对比分析 AI Agent首席体验官人工智能 langchain
1.Dify与Langchain区别Dify和Langchain都是用于开发AI应用的平台，但在设计理念、功能特点及适用场景等方面存在明显差异。以下是两者的详细对比：总体概述Dify：一个开源低代码平台，旨在简化AI应用的开发，提供完整的UI解决方案和无缝的集成能力，适合技术背景不强的用户，帮助他们快速开发和部署AI应用。Langchain：一个灵活的Python开发库，为开发者提供精细控制，适合
python 函数的定义 SFH-松风寒 python 开发语言后端
#函数的定义#定义一个函数#def表示定义函数的关键字#msg表示函数的名称#()里面放置参数可以为空#：函数的固定格式defmsg():#函数体函数里面的代码用于实现函数的特定功能print('Helloworld')#msg（）函数的调用调用函数之后函数中的代码就会被执行#msg是函数本身msg()#函数的简单用法#打印ATM机的提示defselect_func():print('-----请
python——异常程丞Q香 python python 开发语言 pycharm 异常 raise try except
1、定义异常是在代码执行过程中发生的，它会影响到程序的正常运行。python程序不会自动来进行异常处理。python中常见异常父类：Exception。2、常见异常TypeError：类型错误异常。ValueError：值的异常。KeyError：键的异常。IndexError：索引异常。SyntaxError：语法异常。FileNotFoundError：读取文件内容，如果这个文件不存在，就会报
Python爬虫代理IP 巴里巴气 Python爬虫知识记录 python 爬虫 tcp/ip
前言在Python爬虫中,代理IP基本是必备的,因为基本上网站都会有反爬措施,对请求频繁和异常的IP进行自动封锁,拉入黑名单,所以我们需要有代理IP来实现动态IP的效果,保证请求的IP会变化,是动态的,这样网站就不会把我们的IP当作爬虫IP了目录国内代理IP和海外代理IP的现状代理IP最常用最实用的作用使用方法国内代理IP和海外代理IP的现状市面上的代理IP分为国内代理IP和海外代理IP国内代理I
脑机新手指南（十七）EEG-ExPy 新手入门教程（上篇）：基础概念与环境搭建 Brduino脑机接口技术答疑脑机新手指南新手入门算法脑机接口
一、EEG-ExPy是什么？EEG-ExPy是一个基于Python的开源工具包，专为脑电（EEG）实验设计、数据采集和实时分析而开发。它的核心优势在于低门槛易用性和模块化设计，即使是没有编程基础的新手，也能通过简单的代码或图形界面快速搭建EEG实验流程。其功能覆盖：1.自定义实验范式设计（如视觉刺激、运动想象任务）2.实时EEG信号采集与预处理3.简单的脑机接口（BCI）应用开发4.实验数据的存储
RabbitMQ消息发送与接收 VksgShapes rabbitmq ruby 分布式
RabbitMQ是一个功能强大的开源消息代理，用于在应用程序之间传递消息。它实现了AMQP（高级消息队列协议），提供了可靠的消息传递机制，支持多种消息模式和灵活的消息路由。在本篇文章中，我们将详细介绍如何在应用程序中使用RabbitMQ进行消息的发送和接收。我们将使用Python作为示例编程语言，并使用Pika作为RabbitMQ的Python客户端。安装依赖库首先，我们需要安装Pika库。可以使
Python程序设计第6章：函数和函数式编程若北辰 Python程序设计 python 开发语言
Python程序设计Python是全球范围内最受欢迎的编程语言之一，学好Python将对个人职业生涯产生很大的助力，Python在机器学习、深度学习、数据挖掘等领域应用极为广泛。在数据科学家/数据分析师、人工智能工程师、网络安全工程师、软件工程师/全栈工程师、自动化测试工程师等岗位，年入50万，很普遍，学好Python，高薪就业不是问题，因此推出Python程序设计系列文章：Python程序设计第
【Python】函数 Guiat Python python
个人主页：Guiat归属专栏：Python文章目录1.函数的定义1.1基本定义方式1.2函数名和参数2.函数的调用2.1基本调用方式2.2参数传递3.函数的返回值3.1`return`语句3.2返回多个值4.函数的作用域4.1局部变量4.2全局变量5.匿名函数（Lambda函数）5.1定义和使用5.2应用场景6.递归函数6.1定义和原理6.2优缺点正文1.函数的定义1.1基本定义方式在Python
python函数的定义（含扩展） GodGump linux下python编程
python函数的定义deffunc(arg1,arg2,arg3):函数体returnarg4,arg5,arg6补充：如果想给某个参数一个默认值，不用每次都输入的话，可以采用以下方法（以参数arg2默认值设为233为例子）deffunc(arg1,arg2=233,arg3):函数体returnarg4,arg5,arg6还有一点是python支持在函数体内定义全局变量global在函数体内声
深入解析FastAPI：Python高效Web API框架永不放弃yes
本文还有配套的精品资源，点击获取简介：FastAPI是一个专为构建API设计的现代、高性能PythonWeb框架，它利用TypeHinting和Pydantic库简化了数据验证和文档生成。文章深入介绍了FastAPI的核心特性，如异步支持、类型提示、依赖注入、自动化API文档以及错误处理等。还探讨了FastAPI的部署和测试方法，提供了实践案例和代码示例。FastAPI因其简洁、高效、易于测试的特
python实战:在Linux服务器上使用LibreOffice命令行批量接受Word文档的所有修订 Ven% 服务器 python linux LiberOffice 开源办公软件 linux办公软件
在Linux服务器上使用LibreOffice命令行批量接受Word文档的所有修订一、背景与需求1.1常见场景1.2为什么选择LibreOffice二、环境准备2.1安装LibreOffice2.2验证安装三、Python实现代码四、代码解析4.1主要功能4.2错误处理4.3使用灵活性五、高级应用5.1批量处理多个文件5.2与其他工具集成六、注意事项七、总结在实际工作中，我们经常需要处理包含修订标
python学智能算法（十五）|机器学习朴素贝叶斯方法进阶-CountVectorizer多文本处理西猫雷婶人工智能机器学习 python学习笔记机器学习 python 人工智能深度学习 scikit-learn
【1】引言前序学习进程中，已经学习CountVectorizer文本处理的简单技巧，先相关文章链接为：python学智能算法（十四）|机器学习朴素贝叶斯方法进阶-CountVectorizer文本处理简单测试-CSDN博客此次继续深入，研究多文本的综合处理。【2】代码测试首先相对于单文本测试，直接将文本改成多行文本：#引入必要的模块fromsklearn.feature_extraction.te
本地命令行工具libreoffice 完成docx转pdf 陈毛毛虫 pdf 汇编开发语言 wps
文章目录前言一、libreoffice是什么？二、使用步骤1.安装libreoffice2.运行命令行工具总结前言最近忙着编写一些文档，需要转换成pdf，但是WPS的转pdf功能需要付费，上网搜了很久，搜到的不是付费的就是有大小限制的，于是想着本地使用python库转，结果效果不大理想，查阅资料后找到了这一款开源的本地命令行工具libreoffice一、libreoffice是什么？LibreOf
python自动化运维 ZZH1120KQ 运维 python 自动化
1系统性能信息模块psutilpsutl是一个跨平台库，能够轻松实现获取系统运行的进程和系统利用率(包括CPU、内存、磁盘、网络等)信息。它主要应用于系统监控，分析和限制系统资源及进程的管理。#这是一个外部模块，需要下载，通过指定源下载pip3installpsutil-ihttps://mirrors.aliyun.com/pypi/simple/importpsutil1.1内存信息memor
python学智能算法（十六）|机器学习支持向量机简单示例西猫雷婶 python学习笔记人工智能机器学习机器学习 python 支持向量机人工智能深度学习
【1】引言前序学习了逻辑回归等算法，相关文章链接包括且不限于：python学智能算法（十）|机器学习逻辑回归（Logistic回归）_逻辑回归算法python-CSDN博客python学智能算法（十一）|机器学习逻辑回归深入（Logistic回归）_np.random.logistic()-CSDN博客今天在此基础上更进一步，学习支持向量机，为实现较好地理解，先解读一个简单算例。【2】代码解读【2
Python的LibreOffice命令行详解：自动化文档处理的终极指南
在数字化转型的浪潮中，文档处理自动化已成为提升效率的关键。LibreOffice作为开源办公软件的佼佼者，其命令行功能结合Python脚本，可实现从格式转换到复杂文档操作的全面自动化。本文将深入解析如何通过Python调用LibreOffice命令行工具，覆盖从基础操作到高级场景的完整流程。一、环境搭建：三步构建自动化基石1.安装LibreOffice与PythonLinux系统：sudoapti
[Python 基础课程]字符串叶落 Python 基础课程 python python 基础 python 入门
字符串字符串几乎是所有编程语言中最常用的数据类型。在Python中，我们可以使用引号’或"来创建字符串。greeting='Hello,world!'name="Python"empty_string=''number_string="12345"mixed_string="Hello123!"多行字符串如果想让字符串在代码中展示更加清晰，比如展示出json的结构或json样式，可以使用多行字符串
38、Seabor的联合图和成对图的绘制【用Python进行AI数据分析进阶教程】理工男大辉郎 python 人工智能数据分析
用Python进行AI数据分析进阶教程38：Seabor的联合图和成对图的绘制关键词：Seaborn、联合图（JointPlot）、成对图（PairPlot）、数据类型、变量关系摘要：本文介绍了Seaborn库中的联合图（JointPlot）和成对图（PairPlot）的绘制方法。联合图用于展示两个变量之间的关系及各自分布，支持散点图、直方图、核密度估计图等多种类型，适用于连续型变量分析，可自定义
使用【重心坐标】在模型上进行插值来获取纹理上每个像素对应的顶点坐标雨中飞蛾 python blender
前提：纹理在模型上贴好后，能使用blenderpythonapi直接获取的就是，这个模型的每个三角面片上顶点对应的纹理坐标。这其中每个三角面的顶点构成一个三角形(A)，每个三角面的顶点对应的纹理坐标也构成一个三角形(B)。（注：实际上blender常用的是四边形，所以处理时要把四边形分成两个三角形）计算步骤：1、遍历每个像素(P)时，先判断这个像素属于一群B三角形中的哪个三角形。2、然后结合这个像
Github 2024-11-01 开源项目月报 Top19 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本月(2024-11-01统计)共有19个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目9TypeScript项目3JavaScript项目3Svelte项目1JupyterNotebook项目1Ruby项目1HTML项目1Rust项目1Java项目1C++项目1Go项目1Python中的算法实现集合创建周期：2831天
在浏览器中使用TensorFlow.js 魏铁锤chui tensorflow javascript 人工智能
TensorFlow.js简介介绍光学字符识别(OCR)是指能够从图像或文档中捕获文本元素，并将其转换为机器可读的文本格式的技术。如果您想了解更多关于这个主题的内容，本文是一个很好的介绍。TensorFlow.js是一个库，用于使用JavaScript开发和训练机器学习模型，并将其部署在浏览器中或Node.js上。您可以使用现有模型、转换PythonTensorFlow模型、使用迁移学习用您自己的
字节工程师实战传授：用 Go 实现 AI 原生应用全流程 CSDN资讯人工智能 go deerflow eino
作为一名Gopher，你是否也曾在深夜看着Python生态的繁荣而心生羡慕？当LangChain、LlamaIndex等框架层出不穷，我们不禁会想，渴望已久的、专为Go语言打造的顺滑AI开发体验，究竟在哪里？我们常常看到一个个惊艳的AI应用，想用自己最熟悉的Go来复刻，却发现从Agent的定义到复杂的任务编排，每一步都充满着挑战，最终产出的“胶水代码”也难以维护和扩展，距离一个优雅的生产级应用相去
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

基于python爬虫技术对于淘宝的数据分析的设计与实现

本篇仅在于交流学习

你可能感兴趣的:(python,开发语言)