jsoup 框架的使用小结

概述

参考：

官方文档
jsoup的使用
JSoup教程
jsoup 在 GitHub 的开源代码

概念简介

jsoup 是一款基于 Java 的 HTML 解析器，它提供了一套非常省力的 API，不但能直接解析某个 URL 地址、HTML 文本内容，而且还能通过类似于 DOM、CSS 或者 jQuery 的方法来操作数据，所以 jsoup 也可以被当做爬虫工具使用。

jsoup 实现 WHATWG HTML5 规范，并将 HTML 解析为与现代浏览器相同的 DOM。

从 URL，文件或字符串中提取并解析 HTML
查找和提取数据，使用 DOM 遍历或 CSS 选择器
操纵 HTML元素，属性和文本
根据安全的白名单清理用户提交的内容，以防止 XSS 攻击
输出整洁的 HTML

jsoup 的主要类

虽然完整的类库中有很多类，但大多数情况下，需要重点了解下面给出3 个类即可

org.jsoup.Jsoup 类

Jsoup 类是任何 Jsoup 程序的入口点，并将提供从各种来源加载和解析 HTML 文档的方法。

Jsoup 类的一些重要方法如下：

// 创建并返回URL的连接。
static Connection connect(String url)

// 将指定的字符集文件解析成文档。
static Document parse(File in, String charsetName)
// 将给定的html代码解析成文档。
static Document parse(String html)
// 从本地文件中加载文档对象
static Document parse(File in, String charsetName)

// 从输入 HTML 返回安全的 HTML，通过解析输入 HTML 并通过允许的标签和属性的白名单进行过滤。
static String clean(String bodyHtml, Whitelist whitelist)

org.jsoup.nodes.Document 类

该类表示通过 Jsoup 库加载 HTML 文档。

可以使用此类执行适用于整个 HTML 文档的操作。

org.jsoup.nodes.Element 类

HTML 元素是由标签名称，属性和子节点组成。使用 Element 类，可以提取数据，遍历节点和操作 HTML。

注：继承关系为 Document extends Element extends Node

API

Jsoup 类

Jsoup 类的一些重要方法如下：

// 创建并返回URL的连接。
static Connection connect(String url)

// 将指定的字符集文件解析成文档。
static Document parse(File in, String charsetName)
// 将给定的html代码解析成文档。
static Document parse(String html)
// 从本地文件中加载文档对象
static Document parse(File in, String charsetName)

// 从输入 HTML 返回安全的 HTML，通过解析输入 HTML 并通过允许的标签和属性的白名单进行过滤。
static String clean(String bodyHtml, Whitelist whitelist)

Connection 接口

// 将请求作为GET执行，并解析结果
Document get() throws IOException;
// 将请求作为POST执行，并解析结果。
Document post() throws IOException;
// 执行请求。获取内容包含响应码等
Connection.Response execute() throws IOException;
// 将请求方法设置为使用GET或POST。默认为GET
Connection method(Connection.Method method);

// 创建一个新请求，使用此Connection作为会话状态并初始化连接设置（然后可以独立于返回的Connection.request对象）
Connection newRequest();
// 设置要提取的请求URL。协议必须是HTTP或HTTPS
Connection url(URL url);
Connection url(String url);
// 设置头部信息
Connection header(String name, String value);
Connection headers(Map headers);
// 发出请求的用户信息
Connection userAgent(String userAgent);
// 先前网页的地址，当前请求网页紧随其后,即来路
Connection referrer(String referrer);
// 设置用于此请求的HTTP代理。设置为null禁用以前设置的代理。
Connection proxy(Proxy proxy);
Connection proxy(String host, int port);

// 设置总请求超时时间。如果发生超时SocketTimeoutException将被抛出。默认超时为30秒（30000ms）。零超时被视为无限超时。
	// 注意，此超时指定连接时间和读取完整响应时间的组合最长持续时间
Connection timeout(int millis);

// 在关闭连接和截断输入之前，设置从（未压缩）连接读取到正文的最大字节数（即正文内容将被修剪）。
	// 默认最大值为2MB。最大大小为0被视为无限量（仅受机器上可用内存的限制）。
Connection maxBodySize(int bytes);

// 设置是否遵循服务器重定向的连接。默认为true
Connection followRedirects(boolean followRedirects);

// 将连接配置为在发生HTTP错误时不引发异常（4xx-5xx，例如404或500）。默认为false;，如果遇到错误，将引发IOException。
	// 如果设置为true，响应将填充错误正文，状态消息将反映错误。
Connection ignoreHttpErrors(boolean ignoreHttpErrors);

// 分析响应时忽略文档的Content-Type。默认为false，未识别的内容类型将引发IOException。（例如，为了防止试图解析JPEG二进制图像而产生垃圾。）设置为true可强制解析尝试，而不管内容类型如何。
Connection ignoreContentType(boolean ignoreContentType);

// 设置自定义SSL套接字工厂
Connection sslSocketFactory(SSLSocketFactory var1);

// 添加请求数据参数。请求参数在GET的请求查询字符串中发送，在POST的请求正文中发送。一个请求可能有多个同名值。
Connection data(String key, String value);
// 添加输入流作为请求数据参数。
Connection data(String key, String filename, InputStream inputStream);
// 添加输入流作为请求数据参数。对于GET，没有影响，但对于POST，这将上载输入流。filename为文件名，不是路径
Connection data(String key, String filename, InputStream InputStream, String contentType);
Connection data(Collection data);
Connection data(Map data);
Connection data(String... keyvals);
// 获取此密钥的数据KeyVal（如果有）
Connection.KeyVal data(String var1);

// 设置要在请求中发送的cookie
Connection cookie(String name, String value);
Connection cookies(Map cookies);
// 获取此连接使用的cookie存储
Connection cookieStore(CookieStore cookieStore);
// 提供自定义或预先填充的CookieStore，用于此连接发出的请求。
CookieStore cookieStore();

// 提供在分析文档响应时使用的备用解析器
Connection parser(Parser parser);
// 设置请求的数据字符集，默认x-www-form-urlencoded
Connection postDataCharset(String charset);

// 设置连接请求
Connection request(Connection.Request var1);
// 设置POST（或PUT）请求主体
Connection requestBody(String body);
// 获取与此连接关联的请求对象
Connection.Request request();

// 设置连接的响应
Connection response(Connection.Response response);
// 执行请求后，获取响应。
Connection.Response response();

Element（元素）类

org.jsoup.nodes.Element extends Node

Elements 对象提供了一系列类似于 DOM 的方法来查找元素，抽取并处理其中的数据。

查找元素

// 通过 id 来查找元素
public Element getElementById(String id)
// 通过标签来查找元素
public Elements getElementsByTag(String tag)
// 通过类选择器来查找元素
public Elements getElementsByClass(String className)
// 通过属性名称来查找元素，例如查找带有 href 元素的标签
public Elements getElementsByAttribute(String key)

// 获取兄弟元素。如果元素没有兄弟元素，则返回一个空列表
public Elements siblingElements()
// 获取第一个兄弟元素
public Element firstElementSibling()
// 获取最后一个兄弟元素
public Element lastElementSibling()
// 获取下一个兄弟元素
public Element nextElementSibling()
// 获取上一个兄弟元素
public Element previousElementSibling()

// 获取此节点的父节点
public Element parent()
// 获取此节点的所有子节点
public Elements children()
// 获取此节点的指定子节点
public Element child(int index)
    
// 使用 CSS 选择器查找元素
public Elements select(String cssQuery)

获取元素数据

在获得文档对象并且指定查找元素后，就可以获取元素中的数据。

注：这些访问器方法都有相应的 setter 方法来更改数据。

// 获取单个属性值
public String attr(String key) 
// 获取所有属性值
public Attributes attributes()
// 设置属性值
public Element attr(String key, String value)

// 获取文本内容
public String text()
// 设置文本内容
public Element text(String value)

// 获取元素内的 HTML 内容
public String html()
// 设置元素内的 HTML 内容
public Element html(String value)
// 获取元素外 HTML 内容
public String outerHtml()

// 获取数据内容（例如：script 和 style 标签)
public String data()
// 获得 id 值（例如：衣服）
public String id()

// 检查这个元素是否含有一个类选择器（不区分大小写）
public boolean hasClass(String className) 
// 获得第一个类选择器值
public String className()
// 获得所有的类选择器值
public SetclassNames()

// 获取元素标签
public Tag tag()
// 获取元素标签名（例如：``、`
` 等）
public String tagName()

修改数据

在解析了一个 Document 对象之后，可能想修改其中的某些属性值，并把它输出到前台页面或保存到其他地方，jsoup 对此提供了一套非常简便的接口（支持链式写法）。

设置属性的值

以下方法当针对 Element 对象操作时，只有一个元素会受到影响。当针对 Elements 对象进行操作时，可能会影响到多个元素。

// 设置标签的属性值
public Element attr(String key, String value)
// 删除标签
public Element removeAttr(String key)

// 增加类选择器选项
public Element addClass(String className)
// 删除对应的类选择器
public Element removeClass(String className)

代码示例：

Document doc = Jsoup.connect("http://csdn.com").get();
// 复数，Elements
Elements elements = doc.getElementsByClass("text");
// 单数，Element
Element element = elements.first();

// 复数对象，所有 class="text" 的元素都将受到影响
elements.attr("name","goods");
// 单数对象，只有一个元素会受到影响（链式写法）
element.attr("name","shop").addClass("red");

修改元素的 HTML 内容

可以使用 Element 中的 HTML 设置方法，具体如下：

// 在末尾追加 HTML 内容
public Element append(String html)
// 在开头追加 HTML 内容
public Element prepend(String html)
// 在匹配元素内部添加 HTML 文本。这个方法将先清除元素中的 HTML 内容，然后用传入的 HTML 代替
public Element html(String value)
// 对元素包裹一个外部 HTML 内容，将元素置于新增的内容中间
public Element wrap(String value)

示例代码：

Document doc = Jsoup.connect("http://csdn.com").get();
Element div = doc.select("div").first();
div.html("csdn");
div.prepend("a");
div.append("good");
// 输出： a
 csdn
 good

Element span = doc.select("span").first(); span.wrap("

"); // 输出:

csdn

// 清除元素内部的 HTML 内容，然后用提供的文本代替
public Element text(String text)
// 在元素后添加文本节点
public Element prepend(String first)
// 在元素前添加文本节点
public Element append(String last)

 // 
Element div = doc.select("div").first();

div.text(" one "); 
div.prepend(" two ");
div.append(" three ");
// 输出:  two one three

Document doc = Jsoup.connect("http://csdn.com/").get();
String title = doc.title();

Document doc = Jsoup.connect("http://csdn.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(8000)
  .post();

// 获得响应对象
Connection.Response response = Jsoup.connect("http://csdn.com").execute();
// 获取状态码
int code = response.statusCode();

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8");

String html = "First parse"
  + "Parsed HTML into a doc.";
Document doc = Jsoup.parse(html);

String html = "Lorem ipsum.";
Document doc = Jsoup.parseBodyFragment(html);
// doc 此时为： Lorem ipsum.
Element body = doc.body();

// 获取 csdn 首页所有的链接
Document doc = Jsoup.connect("http://csdn.com").get();

Elements elements  = doc.getElementsByTag("body");
Elements contents  = elements.first().getElementsByTag("a");

for (Element content : contents) {
    String linkHref = content.attr("href");
    String linkText = content.text();
}

Document doc = Jsoup.connect("http://csdn.com").get();
// 获取带有 href 属性的 a 元素
Elements elements = doc.select("a[href]");

for (Element content : elements) {
    String linkHref = content.attr("href");
    String linkText = content.text();
}

Document doc = Jsoup.connect("http://www.open-open.com").get();
Element link = doc.select("a").first();

String relHref = link.attr("href");
// 输出：/

String absHref = link.attr("abs:href");
// 输出：http://www.open-open.com/

String unsafe = "Link";
        
String safe = Jsoup.clean(unsafe, Safelist.basic());
// 输出: Link

Connection.Response execute = Jsoup.connect("http://csdn.net/")
					               .proxy("12.12.12.12", 1080)	// 使用代理
					               .execute();

NCU使用指南及模型性能测试（pytorch2.5.1） Jakari cuda gpu ncu python docker 深度学习 pytorch
本项目在原项目的基础上增加了NsightCompute(ncu)测试的功能，并对相关脚本功能做了一些健硕性的增强，同时，对一些框架的代码进行了更改（主要是数据集的大小和epoch等），增加模型性能测试的效率，同时完善了模型LSTM的有关功能。OverviewNsightCompute(NCU)是NVIDIA提供的GPU内核级性能分析工具，专注于CUDA程序的优化。它提供详细的计算资源、内存带宽、指
Spring Cache缓存注解深度解析 coder lei spring 缓存 java
SpringCache缓存注解深度解析一、框架概述SpringCache是Spring框架提供的抽象缓存层，通过注解实现声明式缓存，与具体缓存实现（如Redis、Ehcache）解耦。核心接口CacheManager负责管理不同缓存，@EnableCaching开启注解驱动。二、核心注解详解1.@Cacheable作用：方法结果缓存，首次调用后缓存结果关键参数：@Cacheable(value="
Langchain解锁LLM大语言模型的结构化输出能力（多种实现方案）晨欣 langchain 语言模型人工智能
在LangChain解锁LLM大语言模型的结构化输出能力：调用with_structured_output()方法这篇博客中，我们了解了格式化LLM输出内容的必要性以及如何通过调用langchain框架中提供的with_structured_output()方法对LLM输出进行格式化（三种可选方式：基于TypedDict类（类型化字典）、JSONSchema（JSON模式）和Pydantic类）。
cursor设备ID修改器支持0.45.11版本最稳定 Ai 编码 Ai编码工具 excel pygame 开发语言
文章精选推荐1JetBrainsAiassistant编程工具让你的工作效率翻倍2ExtraIcons：JetBrainsIDE的图标增强神器3IDEA插件推荐-SequenceDiagram，自动生成时序图4BashSupportPro这个ides插件主要是用来干嘛的？5IDEA必装的插件：SpringBootHelper的使用与功能特点6Aiassistant,又是一个写代码神器文章正文当你
【硬件基础】以太网口的类型，接口定义月阳羊硬件基础电路知识网络嵌入式硬件
目录1、RJ45型网线插头（水晶头）2、接线标准1、RJ45型网线插头（水晶头）外观特点：这是最常见的以太网接口类型，外观类似电话接口，但尺寸更大。它有8个引脚，采用模块化设计，方便插拔。应用场景：广泛应用于计算机、路由器、交换机、网络摄像头等设备，用于连接局域网（LAN）和广域网（WAN）。引脚定义：RJ-45接口有8个引脚，每个引脚都有特定的功能。在不同的以太网标准中，引脚的使用情况有所不同。
inux下的du命令用于估算文件和目录的磁盘使用情况 luoluosheng07 linux linux 运维服务器
du（DiskUsage）命令是Linux中的一个常用工具，用于估算文件和目录的磁盘使用情况。以下是详细的讲解，包括常用选项和示例：基本语法du[选项][文件或目录]常用选项-a：显示所有文件和目录的磁盘使用情况，而不仅仅是目录。-h：以人类可读的格式显示大小（例如：K、M、G）。-s：仅显示每个参数的总大小，而不显示子目录的大小。-c：在输出的最后添加一个总计行。-dN：显示目录深度为N级的使用
[Q学习]15 Qt状态机框架——状态机停止 taohe_0 Qt学习 Qt状态机 QState QFinalState
原创文章，可以转载，转载时请以超链接形式保留本文地址、作者信息和本声明。否则将追究法律责任。前几节讲述的都是状态机运行的过程，没有结束状态。任何一个状态机都应该有一个结束状态。那如何停止状态机呢，或者说如何进入终止态呢？Qt状态机框架中，有一个特殊的类QFinalState，这个类定义了状态机的终止状态，我们仅需要简单的将QFinalState的对象A加入到状态机中，然后定义一个状态迁移到该A就可
公共课计算机总复习核心知识点(1) 荣华富贵8 程序员的知识储备1 经验分享
信息的符号化就是数据，所以数据是信息的具体表示形式，信息是数据抽象出来的逻辑意义。信息技术是指人们获取、存储、传递、处理、开发和利用信息资源的相关技术。文化的核心是:观念和价值。计算机文化是人类文化发展的四个里程碑之一（前三个分别为：语言的产生、文字的使用与印刷术的发明）。计算机的特点1）运算速度快2）存储容量大3）通用性强4）工作自动化5）精确性高字长是计算机一次所能处理的实际位数长度，字长是衡
QT状态机框架斜阳日落 qt 开发语言
一、介绍Qt中的状态机框架为我们提供了很多的API和类，使我们能更容易的在自己的应用程序中集成状态动画。这个框架是和Qt的元对象系统机密结合在一起的。比如，各个状态之间的转换是通过信号触发的，状态可被配置为用来设置QObject对象的属性以及调用其方法。可以说Qt中的状态机就是通过Qt自身的事件系统来驱动的。同时，状态机中的状态图是分层次的。一些状态可以被嵌套到另一些状态里，当前的状态机配置是由当
Linux: ASoC 声卡硬件参数的设置过程简析 JiMoKuangXiangQu #声音 &图像 Linux ASoC 声卡硬件参数
文章目录1.前言2.ASoC声卡设备硬件参数2.1将DAI、Machine平台的硬件参数添加到声卡2.2打开PCM流时将声卡硬件参数配置到PCM流2.3应用程序对PCM流参数进行修改调整1.前言限于作者能力水平，本文可能存在谬误，因此而给读者带来的损失，作者不做任何承诺。2.ASoC声卡设备硬件参数ASoC(ALSASystem-on-Chip)声卡驱动框架如下图所示：整个声卡驱动由CPUDAI驱
智能对讲机：5G+AI赋能下的石油工业新“声”态 AORO_BEIDOU 5G 人工智能信息与通信科技安全网络
在浩瀚的能源版图上，中国正以非凡的“深度”探索着石油资源的奥秘。随着5G技术的不断成熟与普及，曾经“满山遍野找信号”的石油工人，如今已步入了一个全新的通信时代。在这个时代里，智能对讲机成为了连接指挥中心与一线工人的桥梁，不仅极大地提升了工作效率，更推动了我国能源产业的高质量发展。AOROM55G智能对讲机智能对讲机，这一基于5G手机通信网络打造的集群对讲设备，彻底改变了传统对讲机的使用方式。它不仅
C++ MySQL ORM接口设计优化：从宏污染到现代流式API C语言小火车 C语言 c++mysql java
（基于编译期反射与链式调用的ORM框架重构实践）在C++中设计一个优雅的MySQLORM接口，既要兼顾易用性，又要保障性能与类型安全。本文针对开发者常见的宏污染、元数据冗余、API臃肿等问题，结合现代C++特性提出一套优化方案，并提供可直接复用的代码示例。一、问题分析：传统ORM接口的痛点1.宏污染严重示例代码问题：通过META_INJECTION等宏手动绑定元信息，导致代码侵入性强、可读性差。维
Qt之QStateMachine等待南瓜大师-阿亮 qt 开发语言
在项目中经常需要等待，我们模拟0-30的数，假如我们其中5，25的数需要进行等待，等待用户处理完自己事情后，按下按钮继续，找Qt的项目中有一个QStateMachineqstatemmachine类提供了一个分层有限状态机。QStateMachine基于Statecharts的概念和符号。qstatemmachine是状态机框架的一部分。状态机管理一组状态（从QAbstractState继承的类）
mall-swarm微服务商城系统实战：Spring Cloud & Alibaba集成应用 Amarantine Lee
本文还有配套的精品资源，点击获取简介：mall-swarm是一套基于微服务架构的电子商务平台，集成SpringCloud框架和阿里巴巴的Nacos、Sentinel等技术，提供了服务发现、配置管理、流量控制等核心功能。本系统通过使用Eureka或Nacos进行服务注册与发现，Sentinel实现服务保护，以及SpringCloudConfig或Nacos进行动态配置管理，展示了如何构建一个高可用的
基于javaweb的流浪宠物管理系统的设计与实现然然学长 java 开发语言 spring boot 毕业设计
运行环境环境说明:开发语言:java框架:springboot，vueJDK版本:JDK1.8数据库:mysql5.7+(推荐5.7，8.0也可以)数据库工具:Navicat11+开发软件:idea/eclipse(推荐idea)Maven包:Maven3.3.9+系统实现5.1个人中心通过设计的个人中心管理功能模块，管理用户可以对相关的个人信息进行管理，比如管理用户可以更新个人账号的密码信息，修
Orleans7.0 游戏服务器全栈开发实战 unity
本课程目标是从零开始搭建一套基于微软Orleans和DotNetty开源方案的游戏服务器框架，框架遵守Actor模型，可以充分利用多核，方便水平扩展。并且使用.NET平台，开发和部署都非常便捷。为了演示功能，也实现了一个简单的Unity客户端框架，最后使用这个框架实现了一个井字棋的对战小案例，来教会大家学以致用。这个案例演示了如何登录、开房间、匹配、对战、结算以及断线重连等一系列回合制游戏的关键节
如何使用DeepSeek进行高效数据挖掘与分析 Small踢倒coffee_氕氘氚笔记经验分享迭代器模式
##摘要随着大数据时代的到来，数据挖掘与分析技术在各行各业中扮演着越来越重要的角色。DeepSeek作为一种先进的数据挖掘工具，能够帮助用户从海量数据中提取有价值的信息。本文将详细介绍DeepSeek的功能、使用方法及其在实际应用中的优势，旨在为用户提供一份全面的使用指南。##关键词DeepSeek、数据挖掘、数据分析、机器学习、大数据##引言###背景在当今信息爆炸的时代，数据已成为企业决策的重
mysql数据库中alter_详解MySQL中ALTER命令的使用寒夜剑鸣 mysql数据库中alter
MySQL的ALTER命令是非常有用的，当想改变表的名称，表的字段，或者如果要添加或删除一个现有的表中的列。让我们开始创建一个表名为testalter_tbl的用例：root@host#mysql-uroot-ppassword;Enterpassword:*******mysql>useTUTORIALS;Databasechangedmysql>createtabletestalter_tbl
【C#】内存的使用和释放 wangnaisheng C#c#
在C#中，内存管理主要是由.NET的垃圾回收器（GarbageCollector,GC）自动处理的。然而，了解如何正确地使用和释放内存对于编写高效且可靠的代码非常重要。以下是一些关键点和最佳实践：1.内存分配托管资源：托管资源是由CLR自动管理的，例如对象实例、字符串等。当创建一个对象时，CLR会从托管堆中分配内存。非托管资源：非托管资源包括文件句柄、数据库连接、GDI+对象等。这些资源需要显式地
c++ std::bind、std::bind_front使用笔记 JANGHIGH C++c++笔记
c++std::bind、std::bind_front使用笔记`std::bind`和`std::bind_front`的使用说明`std::bind`(C++11引入)`std::bind_front`(C++20引入)应用场景应用注意事项应用注意事项的例子std::bind和std::bind_front的使用说明std::bind(C++11引入)std::bind用于创建一个新的可调用对
(c#) 销毁资源和释放内存潘达小新 C#c#销毁释放资源内存
0.什么是资源？.NET框架中如何访问资源？所谓的资源就是程序中可利用的数据，譬如：字符串、图片和任何二进制数据，包括任何类型的文件。在面向对象的环境中，每一个类型都标识为某些程序所用的资源，要想使用这些资源，必须为相应的类型分配一定的内存空间。访问一个资源需要如下几个步骤：1）分配内存空间：调用中间语言（IL）中的newobj指令（使用new操作符时，将产生newobj指令），为某个特定资源的类
数据库操作命令详解：CREATE、ALTER、DROP 的使用与实践还有几根头发呀数据库 oracle 数据库 sql
引言数据库是存储和管理数据的核心工具，而DDL（DataDefinitionLanguage，数据定义语言）是构建和调整数据库结构的基石。本文将通过实际示例，详细讲解CREATE（创建）、ALTER（修改）、DROP（删除）三大核心命令的使用方法、注意事项及典型场景，帮助开发者高效管理数据库。一、CREATE：创建数据库对象1.创建数据库CREATEDATABASEshop_dbDEFAULTCH
Python 如何实现 Markdown 记账记录转 Excel 存储 Ai 编码 python教程 python excel 开发语言
文章精选推荐1JetBrainsAiassistant编程工具让你的工作效率翻倍2ExtraIcons：JetBrainsIDE的图标增强神器3IDEA插件推荐-SequenceDiagram，自动生成时序图4BashSupportPro这个ides插件主要是用来干嘛的？5IDEA必装的插件：SpringBootHelper的使用与功能特点6Aiassistant,又是一个写代码神器7Cursor
Eureka Server与Eureka Client详解：服务注册与发现的交互机制范范0825 eureka 云原生
EurekaServer与EurekaClient详解：服务注册与发现的交互机制Eureka是Netflix开源的一个服务发现框架，它是SpringCloud微服务架构中的核心组件之一。Eureka主要由两个关键组件构成：EurekaServer和EurekaClient。它们之间通过一定的交互机制实现服务的注册与发现功能。在微服务架构中，这一机制可以说是保证系统灵活性和可扩展性的基石。本文将详细
c语言函数注释例子,C语言实例说明廷哥带你小路超车 c语言函数注释例子
原标题：C语言实例说明上一节，我们大致总揽了一个简单C程序的框架，程序如下：123456789#include/*引入头文件*/intmain(void)/*一个简单的C程序*/{intnumber;/*定义个名字叫做number的变量*/number=2014;/*给number赋一个值*/printf("Hello!Iamdotcpp.comn");/*像屏幕打印一句话*/printf("Th
项目开发实践——基于SpringBoot+Vue3实现的在线考试系统(一) bjzhang75 Vue知识学习及项目开发实践项目开发实践 spring boot vue.js 在线考试系统
文章目录一、系统说明二、技术选型三、主要成果展示四、项目框架搭建1、运行环境搭建2、前端框架搭建3、后端框架搭建五、本文代码下载一、系统说明基于SpringBoot+Vue3实现的在线考试系统是为高校打造的一款在线考试平台。系统功能说明1、系统共有管理员、老师、学生三个角色，管理员拥有系统最高权限。2、老师拥有考试管理、题库管理、成绩管理、学生管理四个模块。3、学生可以参与考试、查看成绩、试题练习
如何判断系统是否使用 Log4j，并检测漏洞的存在？ Aishenyanying33 log4j
前言Log4j的漏洞（Log4Shell）是近年来网络安全领域非常严重的问题，它的影响范围极广。为了保护系统安全，我们需要判断自己的系统是否使用了Log4j，以及是否存在相关漏洞。本文将详细介绍如何检测Log4j的使用，并通过输入测试字符串的方式来判断漏洞是否存在。1.如何判断系统是否使用了Log4j？方法1：检查系统代码或依赖查看代码库：在代码中搜索是否引用了Log4j，特别是类似org.apa
java开发之框架基础技术反射 CT随 java 开发语言
什么是反射：在Java开发中，反射是一种强大的技术，允许程序在运行时检查和修改类、方法、字段等结构。它允许程序在没有预先知识的情况下，动态地加载类、创建对象、调用方法以及访问或修改字段。这种能力使得Java程序能够更加灵活和动态，但同时也需要谨慎使用，因为它可能会牺牲一些编译时的类型安全性Java反射常用API有哪些在Java中，反射是由JavaReflectionAPI支持的，它提供了一组类和接
Python 如何实现烟花效果的完整代码 Ai 编码 python教程 python pygame 开发语言
文章精选推荐1JetBrainsAiassistant编程工具让你的工作效率翻倍2ExtraIcons：JetBrainsIDE的图标增强神器3IDEA插件推荐-SequenceDiagram，自动生成时序图4BashSupportPro这个ides插件主要是用来干嘛的？5IDEA必装的插件：SpringBootHelper的使用与功能特点6Aiassistant,又是一个写代码神器7Cursor
NativeScript 8.9.0 发布，跨平台原生应用框架自不量力的A同学 javascript
NativeScript是一个开源框架，可让开发者使用JavaScript或TypeScript来构建iOS和Android应用5。目前NativeScript最新版本为8.8.04，并未发布8.8.0以上版本，以下是NativeScript8.8.0的相关信息：改进的渲染性能：新的渲染引擎进一步优化了UI的绘制速度，使应用响应更快，能为用户提供更流畅的操作体验，在界面切换、元素显示等方面的表现更
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

jsoup 框架的使用小结

目录

概述

概念简介

相关概念简介

jsoup 的主要类

API

Jsoup 类

Connection 接口

Element（元素）类

查找元素

获取元素数据

修改数据

基本使用

获取文档（Document）

DOM 方式

CSS 选择器方式

其他功能

一些常用数据的获取

相对路径转绝对路径

jsoup 使用代理

你可能感兴趣的:(jsoup 框架的使用小结)