嘤嘤嘤

Jsoup

Jsoup官方地址：https://jsoup.org/
中文文档：https://www.open-open.com/jsoup/
Jsoup最新下载：https://jsoup.org/download
Jsoup文档：https://jsoup.org/cookbook/introduction/parsing-a-document
Maven Repository: https://mvnrepository.com/
博客园：http://www.cnblogs.com/
在线运行：https://c.runoob.com/compile/10
其他爬虫：https://www.oschina.net/project/tag/64/spider?lang=19&os=0&sort=view&p=1

Jsoup简介

jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。

我们在爬虫采集网页领域，主要作用是用HttpClient获取到网页后，具体的网页提取需要的信息的时候，就用到Jsoup，Jsoup可以使用强大的类似Jquery，css选择器，来获取需要的数据

jsoup 的主要功能如下：

从一个URL，文件或字符串中解析 HTML
使用DOM或CSS选择器来查找、取出数据
可操作HTML元素、属性、文木

Maven 配置：



    org.jsoup
    jsoup
    1.11.3

入门案例

我们用Jsoup来提取下http://www.cnblogs.com/ 博客园的网页title（标题）和（口号）；

这里我们要用到HttpClient来获取网页内容：

gradle 配置：

//添加 httpclient 支持
// https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient
compile group: 'org.apache.httpcomponents', name: 'httpclient', version: '4.5.7'

//添加 jsoup 支持
// https://mvnrepository.com/artifact/org.jsoup/jsoup
compile group: 'org.jsoup', name: 'jsoup', version: '1.11.3'

maven 项目：



    org.apache.httpcomponents
    httpclient
    4.5.7

 


    org.jsoup
    jsoup
    1.11.3

import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.junit.Test;
import java.io.IOException;

获取一个网页

/**
 * 输入一个网址返回这个网址的字符串
 */
public String getHtml(String str) throws IOException {
    CloseableHttpClient httpclient = HttpClients.createDefault(); // 创建httpclient实例
    HttpGet httpget = new HttpGet(str); // 创建httpget实例
    CloseableHttpResponse response = httpclient.execute(httpget); // 执行get请求
    HttpEntity entity = response.getEntity(); // 获取返回实体
    String content = EntityUtils.toString(entity, "utf-8");
    response.close(); // 关闭流和释放系统资源
    return content;
}

/**
 * 爬取 博客园
 * 1、网页标题
 * 2、口号
 */
@Test
public void test() throws IOException {
    Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象
    Elements elements = doc.getElementsByTag("title"); // 获取tag是title的所有DOM元素
    Element element = elements.get(0); // 获取第1个元素
    String title = element.text(); // 返回元素的文本
    System.out.println("网页标题：" + title);

    Element element2 = doc.getElementById("site_nav_top"); // 获取id=site_nav_top的DOM元素
    String navTop = element2.text(); // 返回元素的文本
    System.out.println("口号：" + navTop);
}

输出：

网页标题：博客园 - 代码改变世界
口号：代码改变世界

/**
 * 获取文章的 url
 */
@Test
public void test5() throws IOException {
    Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

    Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM
    for (Element e : linkElements) {
        System.out.println(e.attr("href"));
    }

}

Jsoup查找DOM元素

Jsoup提供了丰富的API来给我们查找我们需要的DOM元素，常用的如下：

getElementById(Stringid) 根据 id 来查询 DOM 

getElementsByTag(StringtagName) 根据 tag 名称来查询 DOM 

getElementsByClass(StringclassName) 根据样式名称来查询 DOM 

getElementsByAttribute(Stringkey) 根据属性名来查询 DOM 

getElementsByAttributeValue(Stringkey,Stringvalue) 根据属性名和属性值来查询 DOM

/**
 * Jsoup 查找 DOM 元素
 */
@Test
public void test2() throws IOException {
    Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

    Elements itemElements = doc.getElementsByClass("post_item"); // 根据样式名称来查询DOM
    System.out.println("=======输出post_item==============");
    for (Element e : itemElements) {
        System.out.println(e.html());//获取里面所有的 html 包括文本
        System.out.println("\n");
    }

    Elements widthElements = doc.getElementsByAttribute("width"); // 根据属性名称来查询DOM（id class type 等）,用的少一般很难找用这种方法
    System.out.println("=======输出with的DOM==============");
    for (Element e : widthElements) {
        System.out.println(e.toString());//不能用 e.html() 这里需要输出 DOM
    }

    //
    Elements targetElements = doc.getElementsByAttributeValue("target", "_blank");
    System.out.println("=======输出target-_blank的DOM==============");
    for (Element e : targetElements) {
        System.out.println(e.toString());
    }
}

Jsoup使用选择器语法查找DOM元素

我们前面通过标签名，Id，Class样式等来搜索DOM，这些是不能满足实际开发需求的，很多时候我们需要寻找有规律的DOM集合，很多个有规律的标签层次，这时候，选择器就用上了。css jquery 都有，Jsoup支持css，jquery类似的选择器语法。

/**
 * 有层级关系
 */
@Test
public void test3() throws IOException {
    Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

    Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM（范围重小到大）
    for (Element e : linkElements) {
        System.out.println("博客标题：" + e.text());//超链接的内容
    }

    System.out.println("--------------------带有href属性的a元素--------------------------------");
    Elements hrefElements = doc.select("a[href]"); // 带有href属性的a元素
    for (Element e : hrefElements) {
        System.out.println(e.toString());
    }

    System.out.println("------------------------查找扩展名为.png的图片----------------------------");
    Elements imgElements = doc.select("img[src$=.png]"); // 查找扩展名为.png的图片DOM节点
    for (Element e : imgElements) {
        System.out.println(e.toString());
    }

    System.out.println("------------------------获取第一个元素----------------------------");
    Element element = doc.getElementsByTag("title").first(); // 获取tag是title的所有DOM元素
    String title = element.text(); // 返回元素的文本
    System.out.println("网页标题是：" + title);
}

Jsoup获取DOM元素属性值

/**
 * 获取 DOM 元素属性值
 */
@Test
public void test4() throws IOException {
    Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

    Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM
    for (Element e : linkElements) {
        System.out.println("博客标题：" + e.text());//获取里面所有的文本
        System.out.println("博客地址：" + e.attr("href"));
        System.out.println("target：" + e.attr("target"));
    }

    System.out.println("------------------------友情链接----------------------------");
    Element linkElement = doc.select("#friend_link").first();
    System.out.println("纯文本：" + linkElement.text());//去掉 html
    System.out.println("------------------------Html----------------------------");
    System.out.println("Html：" + linkElement.html());
}

/**
 * 获取文章的 url
 */
@Test
public void test5() throws IOException {
    Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

    Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM
    for (Element e : linkElements) {
        System.out.println(e.attr("href"));
    }

}

注意：Element 的几个获取内容的方法区别

text() 获取的是去掉了 html 元素，也就是只用元素内容
toString() DOM
html() 获取里面所有的 html 包括文本

import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.junit.Test;

import java.io.IOException;

public class Main {

    /**
     * 输入一个网址返回这个网址的字符串
     */
    public String getHtml(String str) throws IOException {
        CloseableHttpClient httpclient = HttpClients.createDefault(); // 创建httpclient实例
        HttpGet httpget = new HttpGet(str); // 创建httpget实例
        CloseableHttpResponse response = httpclient.execute(httpget); // 执行get请求
        HttpEntity entity = response.getEntity(); // 获取返回实体
        String content = EntityUtils.toString(entity, "utf-8");
        response.close(); // 关闭流和释放系统资源
        return content;
    }

    /**
     * 爬取 博客园
     * 1、网页标题
     * 2、口号
     */
    @Test
    public void test() throws IOException {
        Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象
        Elements elements = doc.getElementsByTag("title"); // 获取tag是title的所有DOM元素
        Element element = elements.get(0); // 获取第1个元素
        String title = element.text(); // 返回元素的文本
        System.out.println("网页标题：" + title);

        Element element2 = doc.getElementById("site_nav_top"); // 获取id=site_nav_top的DOM元素
        String navTop = element2.text(); // 返回元素的文本
        System.out.println("口号：" + navTop);
    }

    /**
     * Jsoup 查找 DOM 元素
     */
    @Test
    public void test2() throws IOException {
        Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

        Elements itemElements = doc.getElementsByClass("post_item"); // 根据样式名称来查询DOM
        System.out.println("=======输出post_item==============");
        for (Element e : itemElements) {
            System.out.println(e.html());//获取里面所有的 html 包括文本
            System.out.println("\n");
        }

        Elements widthElements = doc.getElementsByAttribute("width"); // 根据属性名称来查询DOM（id class type 等）,用的少一般很难找用这种方法
        System.out.println("=======输出with的DOM==============");
        for (Element e : widthElements) {
            System.out.println(e.toString());//不能用 e.html() 这里需要输出 DOM
        }

        //
        Elements targetElements = doc.getElementsByAttributeValue("target", "_blank");
        System.out.println("=======输出target-_blank的DOM==============");
        for (Element e : targetElements) {
            System.out.println(e.toString());
        }
    }

    /**
     * 有层级关系
     */
    @Test
    public void test3() throws IOException {
        Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

        Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM（范围重小到大）
        for (Element e : linkElements) {
            System.out.println("博客标题：" + e.text());//超链接的内容
        }

        System.out.println("--------------------带有href属性的a元素--------------------------------");
        Elements hrefElements = doc.select("a[href]"); // 带有href属性的a元素
        for (Element e : hrefElements) {
            System.out.println(e.toString());
        }

        System.out.println("------------------------查找扩展名为.png的图片----------------------------");
        Elements imgElements = doc.select("img[src$=.png]"); // 查找扩展名为.png的图片DOM节点
        for (Element e : imgElements) {
            System.out.println(e.toString());
        }

        System.out.println("------------------------获取第一个元素----------------------------");
        Element element = doc.getElementsByTag("title").first(); // 获取tag是title的所有DOM元素
        String title = element.text(); // 返回元素的文本
        System.out.println("网页标题是：" + title);
    }

    /**
     * 获取 DOM 元素属性值
     */
    @Test
    public void test4() throws IOException {
        Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

        Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM
        for (Element e : linkElements) {
            System.out.println("博客标题：" + e.text());//获取里面所有的文本
            System.out.println("博客地址：" + e.attr("href"));
            System.out.println("target：" + e.attr("target"));
        }

        System.out.println("------------------------友情链接----------------------------");
        Element linkElement = doc.select("#friend_link").first();
        System.out.println("纯文本：" + linkElement.text());//去掉 html
        System.out.println("------------------------Html----------------------------");
        System.out.println("Html：" + linkElement.html());
    }


    /**
     * 获取文章的 url
     */
    @Test
    public void test5() throws IOException {
        Document doc = Jsoup.parse(getHtml("http://www.cnblogs.com/")); // 解析网页 得到文档对象

        Elements linkElements = doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM
        for (Element e : linkElements) {
            System.out.println(e.attr("href"));
        }

    }
}

https://blog.csdn.net/osaymissyou0/article/details/49386637

3.19学习总结 2402_88131930 学习
学习了Java中的面向对象的知识点完成一道算法题，找树左下角的值，错误的以为左下角只能是最底层的左节点，但指的是最底层最左边的节点
【从零开始学习JAVA】异常体系介绍 Cools0613 从0开始学Java 学习
前言：本文我们将为大家介绍一下异常的整个体系，而我们学习异常，不是为了敲代码的时候不出异常，而是为了能够熟练的处理异常，如何解决代码中的异常。异常的两大分类：我们就以这张图作为线索来详细介绍一下Java中的异常：1.Exceptions（异常）在Java中，Exception（异常）是一种表示非致命错误或异常情况的类或接口。Exception通常是由应用程序引发的，可以被程序员捕获、处理或抛出。E
android sqlite 数据库简单封装示例（java） mmsx android 作业源码分享 java 数据库 android
sqlite数据库简单封装示例，使用记事本数据库表进行示例。首先继承SQLiteOpenHelper使用sql语句进行创建一张表。publicclassnoteDBHelperextendsSQLiteOpenHelper{publicnoteDBHelper(Contextcontext,Stringname,SQLiteDatabase.CursorFactoryfactory,intvers
java工程师常用开发工具 Monika Zhang 开发工具 java
背景：最近换新电脑，记录下本岗位需要安装的软件，也顺便给大家参考，欢迎各位留言补充1JDK（JavaDevelopmentKit）JDK是Java程序员开发Java应用程序所必需的软件包。下载地址：JavaDownloads|Oracle安装配置教程：window下win10jdk8安装与环境变量的配置（超级详细）_jdk8环境变量配置-CSDN博客目前主流的JDK版本还是JAVA8查看版本命令：
PHP与Java的区别分析 Monika Zhang java 架构设计 php java 开发语言
一、语言特点php：一种的像Python的动态弱语言类型的服务器脚本语言，不需要编译代码；它是专为Web开发目的而开发和设计的，而且简单容易上手。Java：是一种通用的面向对象编程语言，属于强势优选语言类型，在执行前必须先正确编译。是面向对象的和人类可读的；支持服务器端和客户端；可用于开发独立应用程序或基于Web的应用程序，上手比PHP难。二、语法1.PHP是一种脚本语言，代码在服务器上执行，而结
Android 12.0 WiFi连接流程分析之IP地址分配流程安卓兼职framework应用工程师 android 12.0 Rom开发疑难问题分析 android tcp/ip wifi连接 ip地址分配ip
1.前言在12.0的系统rom定制化开发中，对于wifi的定制功能也是比较多的，在关于wifi连接流程模块的分析，了解整个wifi连接流程也是非常重要的，接下来看下wifi的连接流程分析下相关功能实现2.WiFi连接流程分析之IP地址分配流程的核心类frameworks/opt/net/wifi/service/java/com/android/server/wifi/ClientModeImpl
Maven简介 z迦在线 maven java
Maven简介Maven是Apache软件基金会的一个开源项目,是一个优秀的项目构建工具,它用来帮助开发者管理项目中的jar,以及jar之间的依赖关系、完成项目的编译（.java--->.class）、测试、打包（源代码--->.jar文件）和发布等工作。Maven是如何管理项目中的jar文件的？Maven简化了Java项目中的JAR文件管理，主要通过以下几个关键点：POM文件：Maven使用po
Java基础 3.22 anlogic java java 开发语言 jvm
1.break练习//1-100之内的数求和，求当和第一次大于20的当前数ipublicclassBreak01{publicstaticvoidmain(String[]args){intn=0;intcount=0;for(inti=1;i20){n=i;System.out.println("和大于20，退出循环，当前i为"+n);break;}}}}//实现登录验证，有3次机会，如果用户名
《java面向对象(5)》＜不含基本语法＞ java小白板 java 开发语言
本笔记基于黑马程序员java教程整理，仅供参考1.异常1.1异常分类1.1.1Error指系统级别的错误，程序员无法解决，不必理会1.1.2Exception（异常）分为两类：RuntimeException：运行时异常，编译时程序不会报错，运行时报错，如数组越界其他异常：编译时异常，编译时就会报错运行时异常：publicclassText{publicstaticvoidmain(String[
Oracle数据库与Java全栈开发一篇搞定（指南式教学） Aphelios380 Oracle 数据库 oracle java
一、基础操作篇1.数据定义语言（DDL）核心操作1.1表结构设计技巧--电商用户表设计示例CREATETABLEtb_users(user_idNUMBER(10)PRIMARYKEY,usernameVARCHAR2(30)UNIQUENOTNULL,passwordCHAR(32)DEFAULT'e10adc3949ba59abbe56e057f20f883e',emailVARCHAR2(5
Javascript基础 GesLuck javascript 开发语言 ecmascript
目录1.变量声明2.基本数据类型3.复杂数据类型4.字符串方法5.对象方法6.时间方法7.条件（if）8.循环（for/while）9.遍历（forin/of）10.多选（Switch）END1.变量声明const：除非变量需要重新赋值（优先使用）——consta=true;let：需要修改值时使用{大括号内用}（其次使用）——letb="hello"var：除非维护旧代码（避免使用）——varc
Java学习------常用类String 日暮南城故里 Java学习记录 java 学习开发语言 String类
1.介绍Java中的String属于引用数据类型，Java专门在堆中准备了一个字符串常量池。我们在开发时，字符串使用的频率是很高的，因此将这些字符串放在常量池中可以省去对象的创建过程，提高效率。常量池属于一种缓存技术，缓存技术是一种可以提高程序执行效率的手段。Strings1=“hello”;Strings2=“hello”;System.out.println(s1==s2);//这里输出的结果
Eclipse 快捷键 lsx202406 开发语言
Eclipse快捷键Eclipse是一款功能强大的集成开发环境（IDE），广泛应用于Java开发领域。熟练掌握Eclipse的快捷键可以大大提高开发效率。本文将详细介绍Eclipse中一些常用的快捷键，帮助开发者更快地熟悉和使用Eclipse。1.基础操作1.1打开文件Ctrl+O：快速打开文件Ctrl+Shift+O：查找类或文件1.2保存文件Ctrl+S：保存当前文件1.3运行程序Ctrl+F
JavaScript 箭头函数使用总结及注意事项（适合新手到进阶）我真聪明。 javascript 开发语言 ecmascript
箭头函数（=>）是ES6的核心特性之一，它简化了函数写法并改变了this的指向逻辑，但在使用时需要明确其适用场景和限制。以下是详细总结：一、箭头函数核心特点简洁语法：//传统函数constadd=function(a,b){returna+b;};//箭头函数constadd=(a,b)=>a+b;//单行省略returnconstadd=(a,b)=>{returna+b;};//多行需显式re
Spring Boot 3.2+ 升级Mybatis-Plus 3.5.x 兼容性问题与解决方案Invalid value type for attribute ‘factoryBeanObjectT z2637305611 spring boot mybatis 后端
一、当升级遭遇滑铁卢当我们将SpringBoot升级到3.2.0+版本时，熟悉的Invalidvaluetypeforattribute'factoryBeanObjectType':java.lang.String错误突然吞噬了控制台。这个看似神秘的错误频繁出现在整合Mybatis-Plus3.5.x时，甚至会附赠Invalidbeandefinitionwithname'xxxMapper'的
JAVA泛型的作用时光呢 java windows python
‌1.类型安全（TypeSafety）‌在泛型出现之前，集合类（如ArrayList、HashMap）只能存储Object类型元素，导致以下问题：‌问题‌：从集合中取出元素时，需手动强制类型转换，容易因类型不匹配导致运行时错误（如ClassCastException）。//JDK1.4时代：非泛型示例Listlist=newArrayList();list.add("Hello");Integer
使用 React 和 Cypress 进行单元测试 pxr007 单元测试 react.js junit
每个开发人员都希望发布一个没有错误的生产应用程序。为了实现这一点，我们需要考虑如何将测试集成到我们的应用程序中。我们可以使用许多测试工具、框架和测试类型。Cypress是一个现代化的自动化测试套件。它是一个基于JavaScript的完全开源的测试框架，由Mocha和Chai等支持BDD和TDD断言样式的库构建。此外，如果您熟悉用JavaScript编写测试，那么使用Cypress会很容易。Cypr
无锁并发环形队列(Java版) 呆呆的蜗牛数据结构和算法队列 java 多线程
环形队列是顺序队列的一种。普通的顺序队列，当队列不满且tail指针移动到数组的最后位置时，就需要将数组中的元素整体向前搬移，而环形队列却不用。这就提高了入队的效率。无锁并发主要基于CAS原理，在java中Unsafe类中提供了底层的CAS操作。但是我们可以不直接操作Unsafe类，JDK提供了一系列的Atomic类来满足一般的无锁需求。importjava.util.concurrent.atom
Stream 流中 flatMap 方法详解遇见伯灵说 Java 开发语言 java stream流
1.flatMap()到底是啥？flatMap()是Stream里的中间操作，它的作用可以分两步理解：第一步：对流里的每个元素，先**映射（转换）**成一个Stream。第二步：把多个子流拍平成一个大的扁平流。简单记忆：map()是一对一，flatMap()是一对多。️2.基础用法拆解来看个例子：Listlist=List.of("HelloWorld","JavaStream");Listres
双一流软件工程大二听闻 Java 前景堪忧，是否该转C++或人工智能或者读研？程序员yt java c++人工智能
今天给大家分享的是一位粉丝的提问，双一流软件工程大二听闻Java前景堪忧，是否该转C++或人工智能或者读研？接下来把粉丝的具体提问和我的回复分享给大家，希望也能给一些类似情况的小伙伴一些启发和帮助。同学提问：yt老师好，我是双一流软件工程的大二学生，一直在学习java方向，目前掌握了数据库，spring框架等内容，大一暑假在老家一个小公司找了段实习，有蓝桥杯java组b组国一，专业排名前2（保研名
深入解析 Java Stream API：筛选根节点的优雅实现！！！小丁学Java #Lambda表达式 #Stream java Stream Lambda 表达式 Collectors
深入解析JavaStreamAPI：筛选根节点的优雅实现大家好！今天我们来聊聊Java8中一个非常常见的操作：使用StreamAPI从List中筛选出特定条件的元素。具体来说，我们将深入分析以下代码片段：Listroots=inviteCodes.stream().filter(ic->ic.getCreatedBy()==null).collect(Collectors.toList());这段
【架构设计】前置知识 GIS程序媛—椰子架构设计架构设计
架构设计是软件开发的进阶技能，需要结合理论知识和实践经验。以下是掌握架构设计所需的前置知识及其重要性，以及学习路径建议：一、基础编程能力1.编程语言与核心概念掌握至少一门主流语言（如Java、Python、C#、Go等），理解其语法、特性及生态。核心概念：面向对象（OOP）、函数式编程（FP）、并发/异步、内存管理等。示例：通过Java理解接口、多态、设计模式。通过Go学习并发模型（Gorouti
带你了解Java无锁并发CAS 高锰酸钾_ java 并发
带你了解Java无锁并发CAS在多核处理器时代，并发编程已成为提升系统性能的核心手段。传统的同步机制（如synchronized和ReentrantLock）通过互斥锁实现线程安全，但其存在以下关键问题：性能损耗：线程阻塞/唤醒涉及内核态切换，单次操作耗时约1微秒（百万条指令时间）优先级反转：高优先级线程可能被低优先级线程阻塞死锁风险：不正确的锁顺序可能导致系统冻结今天带你了解另一种保证线程安全的
dubbo服务META-INF.dubbo文件夹作用 zhglhy dubbo java apache
META-INF.dubbo文件夹是ApacheDubbo框架中的一个重要目录，通常用于存放Dubbo的SPI（ServiceProviderInterface）扩展配置文件。Dubbo是一个高性能的JavaRPC框架，支持分布式服务治理，而SPI机制是Dubbo实现可扩展性的核心设计之一。1.SPI机制简介SPI是Java提供的一种服务发现机制，允许框架在运行时动态加载实现类。Dubbo对其进行
TreeNode底层实现原理 zhglhy 开发语言 java
TreeNode是树结构的基本单元，通常用于表示树形数据结构中的节点。其底层实现原理涉及以下几个方面：1.TreeNode的基本结构在Java中，TreeNode通常是一个类，包含以下核心属性：数据域：存储节点的数据。子节点引用：指向子节点的引用（对于二叉树，通常是左子节点和右子节点）。父节点引用：指向父节点的引用（可选，取决于具体实现）。以下是一个典型的二叉树节点的实现：classTreeNod
Java设计模式——装饰模式爱吃土豆的程序员 Java设计模式 java 装饰器模式设计模式
目录模式动机模式定义模式结构类图代码分析示例：动态添加功能的流组件接口具体组件装饰抽象类具体装饰类客户端模式分析核心思想动态扩展功能组合优于继承优点动态扩展功能组合优于继承代码复用性高符合开闭原则缺点增加系统的复杂性类的膨胀复杂的调试适用环境动态扩展功能避免继承带来的类爆炸性增长高度可定制化的需求模式应用输入输出流GUI组件日志记录模式扩展多层次装饰结合其他设计模式总结模式动机一般有两种方式可以实
使用Java爬虫按关键字搜索1688商品小爬虫程序猿 java 爬虫开发语言
在电商领域，获取1688商品信息对于市场分析、选品上架、库存管理和价格策略制定等方面至关重要。1688作为国内领先的B2B电商平台，提供了丰富的商品数据。虽然1688开放平台提供了官方API来获取商品信息，但有时使用爬虫技术来抓取数据也是一种有效的手段。本文将介绍如何利用Java按关键字搜索1688商品，并提供详细的代码示例。一、准备工作1.Java开发环境确保你的Java开发环境已经安装了以下必
[从零开始学习JAVA] Stream流 Cools0613 从0开始学Java 学习
前言：本文我们将学习Stream流，他就像流水线一样，可以对我们要处理的对象进行逐步处理，最终达到我们想要的效果，是JAVA中的一大好帮手，值得我们了解和掌握。（通常和lambda匿名内部类方法引用相配合）Stram流：Stream流的核心思想是函数式编程（注意返回值必须是对象本身才能），它倡导将数据处理过程看作是一系列的转换操作。这种思想与传统的命令式编程方式不同，传统的命令式编程方式强调对数据
hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
SSM卫生人员评审专家申报系统浅浅学姐课程设计毕业设计服务器运维 java 开发语言数据库后端
点赞+收藏+关注→添加文档最下方联系方式咨询本源代码、数据库本人在Java毕业设计领域有多年的经验，陆续会更新更多优质的Java实战项目希望你能有所收获，少走一些弯路。关注我不迷路项目视频SSM347的卫生人员项目申报评审管理系统资料介绍一、设计说明1.1研究背景面对大量的信息，传统的管理系统，都是通过笔记的方式进行详细信息的统计，后来出现电脑，通过电脑输入软件将纸质的信息统计到电脑上，这种方式比
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多