旧人小表弟

Python爬虫，使用selenium爬取动态生成的网页数据 - 旧人笔记 - 旧人学习笔记 - 爬虫笔记 - 网络爬虫大白话

什么是AJAX

AJAX（Asynchronouse JavaScript And XML）异步JavaScript和XML，在后台与服务器进行少量数据交换，Ajax可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下，对网页的某部分进行更新。传统的网页（不使用Ajax）如果需要更新内容，必须重载整个网页页面。

因为传统的在传输数据格式方面，使用的是XML语法，因此叫做AJAX，其实现在数据交互基本上都是使用JSON，很少使用XML了。

使用AJAX加载的数据，即使执行了JS代码将数据渲染到了浏览器中，在右键-查看网页源代码还是不能看到通过ajax加载的数据。

查看源代码看到的是服务器最原始的HTML，不包含ajax生成的HTML元素。

如下图：可以看到页面中引入了很多js文件和css文件，这些文件有的是用来动态生成元素的，有的是其他用途。反正除了这些文件路径和一些JavaScript代码，在页面中获取不到任何有用的网页信息。

而审查元素则可以看到生成的各种HTML元素，这些元素都是浏览器通过对引入的js和css进行解析生成的，生成这些元素使用的是ajax技术。

如下图：

获取ajax数据的方式

1、直接分析ajax调用的接口，然后通过代码请求这个接口，俗称怼加密(找加密、网页js逆向)，需要很强的前端 JavaScript功底。

优点：直接可以请求到数据，不需要做一些解析工作，代码量少，性能高
缺点：分析接口比较复杂，特别是一些通过js混淆的接口，要有一定的js功底；容易被发现是爬虫

2、使用Selenium+chromedriver模拟浏览器行为获取数据，使用代码模拟人工操作，用代码控制浏览器，得到的数据是和审查元素一样的，也就是说浏览器上能看到的都能得到。

优点：直接模拟浏览器的行为，浏览器能请求到的，使用selenium也能请求到；爬虫更稳定
缺点：代码量多，性能低

一般在post请求的时候，比如注册或登陆时，提交数据经常是加密的(一般密码会进行加密)，这种都是需要找出加密方法，并且在post请求的时候模拟出加密数据。

随着慢慢普及，现在js逆向几乎每个人都会一些，只是有些js混淆的厉害，着实难搞。

Selenium+chromedriver获取动态数据

Selenium相当于是一个机器人，可以模拟人类在浏览器上的一些行为，自动处理浏览器上的一些行为，比如点击，填充数据，删除cookie等。

chromedriver是一个驱动Chrome浏览器的驱动程序，使用它才可以驱动浏览器。
当然，针对不同的浏览器有不同的driver。

Chrome：https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox：https://github.com/mozilla/geckodriver/releases
Edge：https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/
Safari：https://webkit.org/blog/6900/webdriver-support-in-safari-10/

安装Selenium和chromedriver

安装Selenium：
Selenium有很多语言的版本，java、ruby、python等。

python版本安装：

pip install selenium

安装chromedriver：
通过上面的地址，下载完成后，放到不需要权限的纯英文目录下就可以了。

快速入门

一个获取百度首页的例子

from selenium import webdriver

# chromedriver所在的绝对路径
driver_path = r'D:\ProgramApp\chromedriver\chromedriver.exe'

# 使用webdriver.Chrome初始化一个对象(driver)，并且指定chromedriver的路径
driver = webdriver.Chrome(executable_path=driver_path)

driver.get("https://www.baidu.com/")   # 请求网页
print(driver.page_source)  # 通过page_source获取网页源代码

selenium常用操作

更多教程请参考：http://selenium-python.readthedocs.io/installation.html#introduction

关闭页面

driver.close()：关闭当前页面
driver.quit()：退出整个浏览器

定位元素

1、根据id查找元素

submitTag = driver.find_element_by_id('su')

# 另一种方式
from selenium.webdriver.common.by import By          # 导入By模块
submitTag1 = driver.find_element(By.ID,'su')

2、根据类名查找元素

submitTag = driver.find_element_by_class_name('su')

# 另一种方式
from selenium.webdriver.common.by import By          # 导入By模块
submitTag1 = driver.find_element(By.CLASS_NAME,'su')

3、根据name属性的值查找元素

submitTag = driver.find_element_by_name('email')

# 另一种方式
from selenium.webdriver.common.by import By          # 导入By模块
submitTag1 = driver.find_element(By.NAME,'email')

4、根据标签名查找元素

submitTag = driver.find_element_by_tag_name('div')

# 另一种方式
from selenium.webdriver.common.by import By          # 导入By模块
submitTag1 = driver.find_element(By.TAG_NAME,'div')

5、根据xpath语法获取元素

submitTag = driver.find_element_by_xpath('//div')

# 另一种方式
from selenium.webdriver.common.by import By          # 导入By模块
submitTag1 = driver.find_element(By.XPATH,'//div')

6、根据css选择器选择元素

submitTag = driver.find_element_by_css_selector('.quickdelete-wrap > input')

# 另一种方式
from selenium.webdriver.common.by import By          # 导入By模块
submitTag1 = driver.find_element(By.CSS_SELECTOR,'.quickdelete-wrap > input')

注意：
find_element是获取第一个满足条件的元素
find_elements是获取所有满足条件的元素，返回列表

如果只是解析获取网页中的数据，可使用driver.page_source获取网页HTML源代码，再将网页代码用lxml解析，因为lxml底层是用c语言执行的，效率高。
而且使用这种方式，只需要打开一次页面获取到HTML源代码后就可以了，使用selenium获取元素的方法有时候还获取不到文本和标签属性的值（使用xpath中的 /text()、/@属性的时候）。

使用driver.page_source获取网页HTML源代码后，还可以使用正则、bs4等其他方法解析数据。

如果需要对网页中的一些元素进行一些操作，如：给文本框输入内容、点击按钮等，就必须使用selenium提供的查找元素方法来操作。

操作表单元素

常见的表单元素（更多可自行学习HTML知识）：

input标签：
文本框：type=“text”/“password”/“email”/“number” ---- typed等于这些的都属于文本框
text 是普通文本框，password是密码输入框，number是数字

button(按钮)：input type=“submit” ---- button也属于input标签，typed=“submit”

checkbox(选择框)：input type=“checkbox” ---- checkbox也属于input标签，type=“checkbox”

select(下拉列表)

1、操作输入框：
第一步：找到元素
第二步：使用send_keys(value)，将数据填充进去

inputTag = driver.find_element_by_id('kw')
inputTag.send_keys('python')

# 使用clear方法可以清除输入框中的内容
inputTag.clear()

2、操作checkbox：
因为要选中checkbox标签，在网页中是通过鼠标左键点击的，所以先选中这个标签，再执行click事件

rememberTag = driver.find_element_by_name("rememberMe")
rememberTag.click()

rememberBth.click()   # 再点一次取消选中选择框

3、选择select：
select元素不能直接点击，因为点击后还需要选中元素，这时候selenium就专门为select标签提供了一个类selenium.webdriver.support.ui.Select

将获取到的元素当成参数传到这个类中，创建这个对象，以后就可以使用这个对象进行选择了

from selenium.webdriver.support.ui import Select
# 选中这个标签，然后使用Select创建对象
selectTag = Select(driver.find_element_by_id('jk'))

selectTag.select_by_index(1)    # 根据索引选择
selectTag.select_by_value("value属性的值")   # 根据value值选择
selectTag.select_by_visible_text("标签中的文本")  # 根据可视的文本选择

selectTag.deselect_all()    # 取消选中所有选项

4、操作按钮 button：
操作按钮有很多种方式，比如单击、右击、双击等。最常用的就是点击，直接调用click方法就可以了

inputTag = driver.find_element_by_id('su')
inputTag.click()

按钮单击跟选择框一样都使用.click()

行为链

有时候在页面中的操作可能要有很多步，这时可以使用鼠标行为链类ActionChains来完成。比如现在要将鼠标移动到某个元素上并执行点击事件。

from selenium.webdriver.common.action_chains import ActionChains

driver.get('https://www.baidu.com')             # 模拟打开百度页面

inputTag = driver.find_element_by_id('kw')      # 获取到百度输入框
submitTag = driver.find_element_by_id('su')     # 获取到百度一下按钮
# 选中这两个元素后再进行下面的行为链ActionChains操作

actions = ActionChains(driver)       # 创建行为链对象，把driver传进去
actions.move_to_element(inputTag)    # 把鼠标移动到inputTag标签上
actions.send_keys_to_element(inputTag,'python')   # 给inputTag发送数据(要搜索的关键词：‘python’)
actions.move_to_element(submitTag)   # 再把鼠标移动到submitBth标签上
actions.click(submitTag)             # 点击submitBth按钮
actions.perform()                    # 停止行为

更多的鼠标相关的操作

click_and_hold(element)：点击但不松开鼠标。
context_click(element)：右键点击。
double_click(element)：双击。

更多方法请参考：http://selenium-python.readthedocs.io/api.html

Cookie操作

获取所有的cookie：

for cookie in driver.get_cookies():
    print(cookie)

根据cookie的key获取value：

value = driver.get_cookie(key)

删除所有的cookie：

driver.delete_all_cookies()

删除某个cookie：

driver.delete_cookie(key)


driver.delete_cookie('PSTM')
print(driver.get_cookie('PSTM'))   # 删除后就获取不到这条cookie了，返回None

页面等待

现在的网页越来越多采用了 Ajax 技术，这样程序便不能确定何时某个元素完全加载出来了。如果实际页面等待时间过长导致某个dom元素还没出来，但代码直接使用了这个WebElement，那么就会抛出NullPointer的异常。

为了解决这个问题，所以 Selenium 提供了两种等待方式：一种是隐式等待、一种是显式等待。

1、隐式等待：调用driver.implicitly_wait。这时在获取元素之前，会先等待

在创建driver时，为浏览器对象创建一个最长等待时间，这个方法是得不到某个元素就等待，直到浏览器所有元素加载完毕(左上角的圈圈不在转了)、拿到元素位置(如果一直拿不到就等到时间截止)，再执行下一步

隐式等待是全局的，设置一次后，所有的元素在加载的时候都会等待，会在那死等，等不到(超时)就抛出异常然后继续执行后面的代码

driver.implicitly_wait(10)  # 10秒

# 请求网页
driver.get("https://www.douban.com")

driver.find_element_by_id('lalala')
# 输入一个错误的id，不设置等待的话会立马抛出异常，设置等待会等待后抛出异常

2、显示等待：显示等待是明确表明某个条件成立后才执行获取元素的操作，可以在等待的时候指定一个最大的时间，如果超过这个时间就抛出一个异常

显示等待应该使用selenium.webdriver.support.excepted_conditions期望的条件和selenium.webdriver.support.ui.WebDriverWait来配合完成

显式等待是根据条件来判断，条件满足就不等了，条件一直不满足就一直等待到超时并抛出异常

WebDriverWait(driver, timeout, poll_frequency=0.5, ignored_exceptions=None)
——driver：WebDriver 的驱动程序(Ie, Firefox, Chrome 或远程)
——timeout：最长超时时间，默认以秒为单位
——poll_frequency：休眠时间的间隔（步长）时间，默认为 0.5 秒
——ignored_exceptions：超时后的异常信息，默认情况下抛 NoSuchElementException 异常

WebDriverWait(driver, 10).until(
    lambda driver: driver.findElement(By.Id("someId")))  # 用这种方式也可以指定期望的条件
# 每隔0.5秒扫描一次检查是否有id为someId的元素，10秒后没找到就不找了抛异常

from selenium.webdriver.common.by import By   # 另一种获取元素的方法  By类
from selenium.webdriver.support.ui import WebDriverWait  # WebDriverWait 显示等待的类
from selenium.webdriver.support import expected_conditions as EC  # 期望条件，太长了所以一般取别名为EC

try:
    element = WebDriverWait(driver, 10).until(   # 传入driver和最大等待时间
        EC.presence_of_element_located((By.ID, 'form_email'))  # 期望的条件(By.ID, 'form_email')
    )
finally:
    driver.quit()

期望的条件只能传递一个参数，所以两个参数要放元组里

.presence_of_element_located()：判断某个元素是否存在当前页面
有form_email这个id表示条件满足，说明要寻找的页面的元素已经加载出来了

更多等待条件：

presence_of_element_located：某个元素已经加载完毕了
presence_of_all_emement_located：网页中所有满足条件的元素都加载完毕了
element_to_be_cliable：某个元素是可以点击了

更多条件请参考：http://selenium-python.readthedocs.io/waits.html

切换页面

有时候窗口中有很多子tab页面，这时肯定是需要进行切换的

selenium提供了driver.execute_script(“window.open(‘url’)”)方法来打开一个新的tab页面

driver.switch_to_window()方法来进行切换，具体切换到哪个页面，可以用driver.window_handles()来实现

# 打开一个新的页面
driver.execute_script("window.open('url')")
# 切换到这个新的页面中
driver.switch_to_window(driver.window_handles[1])

from selenium import webdriver


driver_path = r'D:\PycharmProjects\chromedriver\chromedriver.exe'
# 定义chromedriver.exe所在的绝对路径

driver = webdriver.Chrome(executable_path=driver_path)
# 使用webdriver.Chrome初始化一个对象(driver)，驱动的是Chrome浏览器，指定上面创建路径。


driver.get('https://www.baidu.com')                  # 模拟打开百度页面
# driver.get('https://www.douban.com')
# 模拟打开豆瓣网页面，用这种方式打开多个网址都是在浏览器的一个tab标签页面下的，所以会覆盖前面打开的页面


# 打开一个新的页面
driver.execute_script("window.open('https://www.douban.com')")   # window.open是js里面的方法
print(driver.current_url)
# 虽然在新的tab标签页面下打开了豆瓣网页，但是driver当前所在页面url还是百度
# 如果想要在代码中切换到某个页面并做一些爬虫操作，就需要用到.switch_to_window()来进行切换
# 通过.window_handles取出具体第几个窗口
# .window_handles是一个列表，里面放的是窗口句柄，按照窗口打开时候的顺序进行并排序的


# 切换到这个新的页面中
print(driver.window_handles)        # 查看当前打开的浏览器所有的标签页面窗口句柄

driver.switch_to_window(driver.window_handles[1])  # 切换tab页面
print(driver.current_url)           # 现在的url是豆瓣的了
# print(driver.page_source)           # 通过page_source获取网页源代码。打印出来的是豆瓣的页面HTML代码

driver.switch_to.window(driver.window_handles[0])
print(driver.current_url)           # 现在的url又是百度的了

.switch_to_window()是老版本，被废弃了，会提现下面的错误，但是不影响运行

DeprecationWarning: use driver.switch_to.window instead
self.driver.switch_to_window(self.driver.window_handles[1])

新的版本：.switch_to.window()

设置代理ip

有时候频繁爬取一些网页，服务器发现你是爬虫后会封掉你的ip地址，这时候我们可以更改代理ip

更改代理ip，不同的浏览器有不同的实现方式，这里仅以Chrome浏览器为例

from selenium import webdriver

driver_path = r'D:\PycharmProjects\chromedriver\chromedriver.exe'

options = webdriver.ChromeOptions()    # .ChromeOptions类是设置Chrome浏览器一些请求信息的
options.add_argument('--proxy-server=http://27.203.219.181:8118')   # 在请求信息里设置代理服务器ip

driver = webdriver.Chrome(executable_path=driver_path, chrome_options=options)
# 使用webdriver.Chrome初始化一个对象，指定上面创建路径和代理ip

driver.get('http://httpbin.org/ip')

WebElement元素

from selenium.webdriver.remote.webelement import WebElement类是每个获取出来的元素的所属类

有一些常用的方法属性：

1、get_attribute()：这个标签的某个属性的值
2、screentshot()：获取当前页面的截图，这个方法只能在driver上使用

driver的对象类，也是继承自WebElement

更多请阅读相关文档或源代码

from selenium import webdriver


driver_path = r'D:\PycharmProjects\chromedriver\chromedriver.exe'
# 定义chromedriver.exe所在的绝对路径

driver = webdriver.Chrome(executable_path=driver_path)
# 使用webdriver.Chrome初始化一个对象(driver)，指定上面创建路径。


driver.get('https://www.baidu.com')                # 模拟打开页面

submitBth = driver.find_element_by_id('su')         # 获取到百度一下按钮
print(type(submitBth))        # 类型：
# 通过这个类型可以进行一系列的操作（获取到标签、属性及属性所对应的值，字符串等等...）

print(submitBth.get_attribute('value'))   # 获取到value属性所对应的值：'百度一下'四个字

driver.save_screenshot(r'C:\Users\Administrator\Desktop\baidu.png')    # 截图保存整个网页

你可能感兴趣的:(网络爬虫,python,java,selenium,html,js)

Python自定义鼠标指针工具(支持像素级编辑) 木木黄木木 python 计算机外设开发语言
Python自定义鼠标指针工具(支持像素级编辑)项目简介这是一个基于Python的鼠标指针自定义工具,可以让用户自由创建、编辑和设置Windows系统的鼠标指针。该工具提供了像素级编辑功能,支持多种绘图工具,并且可以直接将设计好的指针应用到系统中。主要功能像素级编辑器支持16x16到64x64多种尺寸铅笔、橡皮擦工具直线、矩形、圆形等几何图形工具填充/空心图形选择取色器功能热点设置可视化热点标记精
JetBrains IDEs和Visual Studio Code的对比 ZhangJiQun&MXP 2021 论文 2021 AI python 教学 vscode ide 编辑器
JetBrainsIDEs和VisualStudioCode的对比JetBrainsIDEs是捷克JetBrains公司开发的一系列集成开发环境（IDE）。以下是具体介绍：IntelliJIDEA是JetBrains公司的一款产品主要产品IntelliJIDEA：一款功能强大且广泛应用的Java集成开发环境，有开源免费的社区版和商业收费的终极版。社区版可开发Java桌面和Android应用，终极版
CSS笔记一 CspecialJ css 笔记前端
一、语法选择器{属性：属性值；属性：属性值}二、书写分类行内样式：直接通过style属性写在标签上123456页内样式：在html页面创建style标签外链样式：三、选择器3.1通用选择器*{padding:0pxmargin:0px}3.2标签选择器p{font-size:20pxwidth:20px}div{width:20pxheight:20px}3.3类选择器.div1{width:20
基于Nodejs的你划我猜词库管理系统+源码+高分项目墨痕_777 python
你划我猜词库管理系统本博文提供了完整的代码和使用教程，适合新入门的朋友参考，完整代码资源文件请转至文末的下载链接。word-manage前端代码npmrunserve运行前端项目npmrunbuild打包生产环境代码npmruntest打包测试环境代码运行系统先打包前端代码npmrunbuild，放在static文件夹nodeapp.js项目运行在2900端口word表设计title词语hard难
如何在Windows 10上安装Python？字节王德发 python windows python 开发语言
在今天的数字时代，Python已经成为了一个非常流行的编程语言。无论你是想做数据分析、网页开发，还是人工智能，Python都能满足你的需求。如果你使用的是Windows10系统，安装Python其实并不复杂。下面就让我带你一步一步走过这个过程，确保你可以顺利地在你的电脑上运行Python。1.准备工作在开始之前，确保你的Windows10系统已经更新到最新版本。打开“设置”，选择“更新与安全”，然
ASP.NET站点配置以及VS2008下C#、JavaScript联合调试(Ajax) ----以最短路径Dijstra最短路问题为例刘一哥GIS 《VS/C/C++/C#》ASP.NET IIS 最短路径 ajax
实验任务描述：用VS2008构造ASP.NET站点开发环境；用ASP.NET完成JavaScript开发调试；用Ext3.0.0完成一个简单的树显示站;WebService程序设计，Dijstra最短路Web服务；JavaScript通过Ajax技术调用WebService;一、Windows下WEB共享设置打开你的WINDOWS，鼠标点开“我的电脑”，寻找下你机器的WINDOWS版本信息，如果你
Dash-FastAPI-Admin 技术文档钟音洋Winona
Dash-FastAPI-Admin技术文档Dash-FastAPI-AdminAgeneralmiddleandbackendmanagementsystemdevelopedpurelyinPythonbasedonDash+FastAPI.基于Dash+FastAPI纯Python开发的一个通用中后台管理系统。项目地址:https://gitcode.com/gh_mirrors/da/Da
AttributeError: ‘NoneType‘ object has no attribute ‘astype‘ 冰虺 python
今天在复现fasterRCNN网络时，出现AttributeError:'NoneType'objecthasnoattribute'astype'报错，如下图所示通过dug,发现im的shape为none,究其原因是因为cv.imread无法读取图像，主要原因是因为我数据集中存在中文名称。更加详细的请参考一下大佬的博客pythoncv2.imread读取中文路径的图片返回为None的问题_陶将的
吊打全网所有精美导航页引导页HTML源码 6v6-博客开源
吊打全网所有精美导航页引导页HTML源码这款精美的导航页引导页HTML源码，自适应手机和电脑，无需后台，上传到网站根目录即可使用。首页内容在index.html中修改，支持双页切换，搭建简单，附带详细修改教程。源码特点自适应设计：完美适配手机和电脑端，用户体验极佳。无后台依赖：纯静态页面，无需数据库或后台支持。双页切换：支持双页切换功能，灵活展示内容。搭建简单：上传到网站根目录即可使用，无需复杂配
Typecho 极致美化：打造与众不同的博客 6v6-博客机器学习
Typecho极致美化：打造与众不同的博客Typecho是一款轻量级的博客系统，但通过一些高级美化技巧，你可以让它变得与众不同。本文将介绍如何通过自定义JS、自定义CSS、自定义侧边栏模块等功能，实现Typecho的极致美化。1.自定义JS：动态效果与交互通过自定义JS，你可以为Typecho添加动态效果和交互功能。示例1：页面滚动动画在header.php中添加以下代码：ScrollReveal
一个神奇 Python 库，PyPDF2帮你在工作中轻松驾驭PDF 代码小念软件测试面试自动化测试 python pdf 职场和发展软件测试面试
大家好，很多人学习Python进行办公自动化，其中一个场景就是处理PDF，PyPDF2是一个非常强大的Python库，它允许你管理和操作PDF文件。不论是分割、合并、旋转还是加密PDF，PyPDF2都能轻松应对。PyPDF2是一个纯Python编写的库，用于读取PDF文件和操作PDF页面。它允许你进行以下操作：•读取PDF:使用PyPDF2读取PDF文件非常简单。首先需要导入库，然后加载PDF文件
RHCE-web篇 2022计科一班唐文前端
一.web服务器Web服务器是一种软件或硬件系统，用于接收、处理和响应来自客户端（通常是浏览器）的HTTP请求。它的主要功能是存储和提供网站内容，比如HTML页面、图像、视频等。Web服务器的主要功能处理请求：当用户在浏览器中输入网址时，浏览器会发送一个HTTP请求到Web服务器。服务器接收到请求后，处理该请求并生成响应。提供内容：Web服务器根据请求的资源类型（例如HTML、CSS、JavaSc
如何利用PyPDF2库轻松提取PDF中的文本？字节王德发 python pdf
在数字化时代，PDF格式的文件随处可见。从电子书到官方文档，PDF是我们经常遇到的一种文件格式。不过，有时候我们需要从这些PDF里提取文本，这就需要一些工具来帮忙了！今天我们就来聊聊Python的一个强大工具——PyPDF2库，它能让我们轻松实现PDF文本提取。PyPDF2库的简介PyPDF2是一个开源的Python库，主要用于处理PDF文件。这个库支持多种操作，包括合并、拆分、加密和解密PDF文
使用MySQL Yum 源在Linux上安装MySQL Run Out Of Brain mysql linux 数据库
OracleLinux、RedHatEnterpriseLinux、CentOS和Fedora的MySQLYum源提供了RPM安装包，用于安装MySQL服务器、客户端、MySQLWorkbench、MySQL实用程序、MySQL路由器、MySQLShell、连接器/ODBC、连接器/Python等在你开始之前作为一种流行的开源软件，MySQL以其原始或重新打包的形式被广泛安装在来自各种来源的许多系
python中的Counter函数算法小菜鸟moon python python 开发语言
在Python中，Counter是collections模块中的一个类，用于统计可迭代对象中元素的出现次数，并以字典的形式返回，键为元素，值为对应的计数。它非常适合处理频率统计问题。用之前必须先导入fromcollectionsimportCounter统计元素的频率ss="helloworld"ss_counter=Counter(ss)print(ss_counter)Counter({'l'
测试江湖：为什么大多数人宁愿吃生活的苦，也不愿意吃学习的苦爱吃香菜软件测试自动化测试职场经验学习软件测试自动化测试测试工具职场经验程序员功能测试
面试求职：「面试试题小程序」，内容涵盖测试基础、Linux操作系统、MySQL数据库、Web功能测试、接口测试、APPium移动端测试、Python知识、Selenium自动化测试相关、性能测试、性能测试、计算机网络知识、Jmeter、HR面试，命中率杠杠的。（大家刷起来…）职场经验干货：软件测试工程师简历上如何编写个人信息（一周8个面试）软件测试工程师简历上如何编写专业技能（一周8个面试）软件测
Python--类墨上烟雨 Python python 开发语言
Python--类一、类的定义方法二、创建类的实例三、创建类的成员1、创建属性创建类属性创建实例属性2、创建方法实例方法类方法四、类成员的访问权限1、保护属性成员2、私有属性成员五、装饰器一、类的定义方法在Python中，类可以通过关键字class来定义。类的定义包含在一个代码块中，并且通常以冒号:结尾。类的定义方法有以下几种：1.空类定义：classMyClass:pass这是一个最简单的类定义
html中box标签的作用,CSS3的box-sizing属性的作用及使用 cocoaitea html中box标签的作用
先用大白话通俗说一下，先给div设置宽高为200px,这是在加上padding：10px;,此时div宽高加上padding值后实际宽高变成了220px(等于上下左右各加了10px的padding),那么我又给div加了一个border1px，此时div的实际宽高变成了221px。此时在给div加上box-sizing:border-box后，div的总宽高就会变为200px,也就是说此时padd
鸿基html转换软件,3.html · 鸿基梦/lenovowolf - Gitee.com weixin_39839726 鸿基html转换软件
狼图/*版本控制*/functionfreshUrl(){varcurUrl=window.location.href;functiontimestamp(url){//vargetTimestamp=Math.random();vargetTimestamp=newDate().getTime();if(url.indexOf("timestamp=")>-1){vartimer=+newDat
【Steg】CTF 隐写术题目解题思路图 D-river CTF 安全网络安全
以下是专门针对CTF隐写术（Steganography）的解题思路与步骤树形图，包含常见分类、工具链和关键方法：CTF隐写术题目解题思路图隐写术（Steganography）├──1.图片隐写（ImageSteg）│├──1.1LSB隐写（最低有效位）││├──步骤：StegSolve逐通道分析，提取LSB数据。││└──工具：StegSolve、zsteg、PythonPIL库。│││├──1.
Android TCP封装工具类 tangweiguo03051987 android tcp/ip 网络协议
TCP通信的封装，我们可以从以下几个方面进行改进：线程池优化：使用更高效的线程池配置，避免频繁创建和销毁线程。连接重试机制：在网络不稳定时，自动重试连接。心跳机制：保持长连接，避免因超时断开。数据缓冲区优化：动态调整缓冲区大小，适应不同数据量。异常处理增强：区分不同类型的异常，提供更详细的错误信息。代码简洁性：减少冗余代码，提高可读性和可维护性。TCP客户端封装（Java）importandroi
python中Counter的用法 V.E. python
Python中，Counter是一个字典子类，用于计算可哈希对象（如列表、元组、字符串）中元素的出现次数。Counter可以用于快速计数元素，而不需要手动循环计算。以下是一些Counter的用法：导入Counter：fromcollectionsimportCountermy_list=[1,2,3,2,4,3,1,2,2]my_counter=Counter(my_list)访问Counter对
Python精进系列：ord 函数进一步有进一步的欢喜 python 开发语言
目录一、引言二、基本概念2.1Unicode编码简介2.2ord函数定义三、使用示例3.1处理ASCII字符3.2处理非ASCII字符四、与chr函数的关系五、实际应用场景5.1字符排序5.2简单加密算法5.3字符验证六、注意事项6.1输入参数要求6.2跨平台兼容性七、总结一、引言在Python编程里，字符和编码的处理是常见的操作。ord函数作为Python内置函数之一，在字符和Unicode编码
Python精进系列：divmod 函数进一步有进一步的欢喜 python
目录一、引言二、基本语法与原理2.1语法格式2.2返回值2.3原理理解三、使用示例3.1整数运算示例3.2浮点数运算示例四、应用场景4.1时间单位转换4.2数据分组4.3循环计数与位置计算五、注意事项5.1除数不能为零5.2浮点数运算的精度问题六、总结一、引言divmod()函数就是其中一个小巧而强大的工具，它能同时进行除法运算并返回商和余数，在很多场景下都能大显身手。本文将对divmod()函数
如何本地运行和开发 Langchain 项目 dgay_hua langchain python
在这篇指南中，我们将详细讲解如何在本地运行Langchain仓库，并提交您的第一个代码变更。如果您希望在开发容器中操作，可参考.devcontainer文件夹中的指南。技术背景介绍Langchain项目是一个高级框架，围绕构建“链”这种概念来组织代码。每个链的基本构件是微型逻辑单元，它们彼此结合，并可通过可编辑的配置文件进行管理。这个项目依托于Python生态，利用了Poetry作为其依赖管理工具
Apollo部署及整合SpringBoot实战 It_BeeCoder SpringBoot
前言：最近在完成毕业设计，题目是《基于微服务的B2C网上商城系统的设计与实现》，整个项目最早是我在看黑马的培训视频时学习JavaWeb做的一个项目，第一次做完大约在去年过年的时候，这个项目前前后后自己改了差不多5、6次了，使用技术不断更新（还有一些小细节的修改比如最早购物车用Session后来用Redis存储），从最早的Servlet+Filter到SSM+Redis到SpringBoot+Thy
Python 基础：类诸葛思颖 python python 开发语言
目录一、类的概念二、定义类三、创建对象并进行访问四、修改属性的值方法一：句点表示法直接访问并修改方法二：通过方法进行修改五、继承继承父类属性和方法重写父类方法六、将实例用作属性七、导入类导入单个类从一个模块中导入多个类导入整个模块导入模块中的所有类八、一些代码编写规范遇到看不明白的地方，欢迎在评论中留言呐，一起讨论，一起进步！本文参考：《Python编程：从入门到实践（第2版）》一、类的概念类是是
‌Visual Studio Code（VS Code）支持的编程语言计算机辅助工程 vscode
‌JavaScript‌：VSCode原生支持JavaScript，提供语法高亮、代码折叠、自动补全等功能。推荐使用ESLint和Prettier进行代码格式化和错误检查‌。‌TypeScript‌：作为JavaScript的超集，TypeScript在VSCode中也得到原生支持，提供类似的编辑功能‌。‌Python‌：通过安装Python扩展，VSCode支持Python编程，提供调试、Int
Python精进系列：Counter 函数进一步有进一步的欢喜 python 编程语言
目录一、Counter函数概述二、基本使用案例（一）列表元素计数（二）字符串字符计数（三）元组计数三、Counter对象的常用方法（一）most_common()方法（二）update()方法（三）subtract()方法（四）elements()方法四、Counter对象的数学运算（一）加法运算（二）减法运算（三）交集运算（四）并集运算五、实际应用场景（一）文本分析（二）数据分析（三）游戏开发应
RK3568笔记六十八：Yolov11目标检测部署测试殷忆枫 RK3568学习笔记笔记 YOLO
若该文为原创文章，转载请注明原文出处。看到yolov11出了，山水无移大佬测试通过，跟个风测试一下效果。使用的是正点原子的ATK-DLRK3568开发板。这里不训练自己的模型了，使用官方模型测试。一、环境搭建1、下载源码ultralytics/ultralytics:UltralyticsYOLO112、创建虚拟环境condacreate-nyolov11_envpython=3.83、激活con
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name