Do_GH

【Java】使用Java实现爬虫

文章目录

使用Java实现爬虫
- 一、HttpClient实现模拟HTTP访问
- - 1.1 HttpClient
  - 1.2 引入依赖
  - 1.3 创建简单的请求操作
  - - 1.3.1 创建实例
    - 1.3.2 Jsoup应用
  - 1.4 爬取过程中可能出现的问题
  - - 1.4.1 JS异步加载问题
    - 1.4.2 反爬技术的影响
  - 1.5 爬取需要登录的页面
  - - 1.5.1 在header中直接携带Cookie
    - 1.5.2 模拟登录自动获取Cookie
- 二、HtmlUtil实现JS异步加载页面
- - 2.1 HtmlUtil
  - 2.2 引入依赖
  - 2.3 创建简单的请求操作
  - - 2.3.1 创建实例
    - 2.3.2 模拟浏览器操作
  - 2.4 爬取待登录的页面

使用Java实现爬虫

一、HttpClient实现模拟HTTP访问

1.1 HttpClient

HTTP 协议是 Internet 上使用得最多、最重要的协议之一，越来越多的 Java 应用程序需要直接通过 HTTP 协议来访问网络资源。虽然在 JDK 的 java net包中已经提供了访问 HTTP 协议的基本功能，但是对于大部分应用程序来说，JDK 库本身提供的功能还不够丰富和灵活。HttpClient 是 Apache Jakarta Common 下的子项目，用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。HttpClient 已经应用在很多的项目中，比如 Apache Jakarta 上很著名的另外两个开源项目 Cactus 和 HTMLUnit 都使用了 HttpClient。Commons HttpClient项目现已终止，不再开发。它已被Apache HttpComponents项目里的HttpClient和HttpCore模块取代，它们提供了更好的性能和更大的灵活性。

1.2 引入依赖

<dependency>
    <groupId>org.apache.httpcomponentsgroupId>
    <artifactId>httpclientartifactId>
    <version>${httpclient.version}version>
dependency>
<dependency>
    <groupId>org.jsoupgroupId>
    <artifactId>jsoupartifactId>
    <version>${jsoup.version}version>
dependency>

向项目中引入HttpClient和Jsoup依赖。

Jsoup用于解析获取的HTML文本，可以像JS一样通过id和class获取元素。同时Jsoup也可访问页面。

1.3 创建简单的请求操作

1.3.1 创建实例

public void testLinked() throws Exception {
	// 创建HttpClient对象
   CloseableHttpClient httpClient = HttpClients.createDefault();

   // 创建GET请求
   HttpGet httpGet = new HttpGet("https://blog.csdn.net/weixin_43347659");
   httpGet.setHeader("use-agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36");

   // 获取响应结果
   CloseableHttpResponse response = httpClient.execute(httpGet);

   if (response.getStatusLine().getStatusCode() == 200) {
       String html = EntityUtils.toString(response.getEntity(), "UTF-8");
       System.out.println(html);
   }

   httpClient.close();
   response.close();
}

HttpClient用于创建连接对象，如果请求方式为GET则可以创建HttpGet对象，若为POST请求可创建HttpPost对象，请求的参数为待访问的URL。

可以根据实际请求内容适当的增加header的内容。调用HttpClient的execute()方法发起请求，并创建一个CloseableHttpResponse响应对象，可以通过判断响应状态码确定请求的结果。

根据现在的一些防爬虫设置，可能需要在header添加固定的请求内容，例如host、origin等内容区分人机，可根据实际情况设置。

1.3.2 Jsoup应用

@Test
public void testJsoup() throws Exception {
    // 创建HttpClient
    CloseableHttpClient httpClient = HttpClients.createDefault();

    // 创建GET请求
    HttpGet httpGet = new HttpGet("https://www.cnblogs.com/sam-uncle/category/1469093.html");
    httpGet.setHeader("user-agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36");

    // 获取响应
    CloseableHttpResponse response = httpClient.execute(httpGet);

    // 获取页面内容
    if (response.getStatusLine().getStatusCode() == 200) {
        String html = EntityUtils.toString(response.getEntity(), "UTF-8");

        // 创建Document对象
        Document document = Jsoup.parse(html);

        // 获取博客列表
        Element blog = document.getElementsByClass("entrylist").first();
        Elements blogList = blog.getElementsByClass("entrylistItem");
        for (Element element : blogList) {
            Elements title = element.select("a[class='entrylistItemTitle'] span");
            System.out.println(title.text());
        }
    }

    response.close();
    httpClient.close();
}

通过调用Jsoup的parse(String html)方法即可将原始的HTML页面解析为Document类，这样我们就能够通过getElementById(String attr)、getElementsByClass(String attr)、select(String classAttr)等方式获取页面中的标签元素。

Document类为org.jsoup.nodes.Document注意不要使用错类。

1.4 爬取过程中可能出现的问题

1.4.1 JS异步加载问题

随着前端技术的发展，在页面中应用AJAX、VUE和AngularJS等技术已经很普及，因此在使用HttpClient时会发现，响应的结果与页面不相同，或者响应的页面并没有所需的内容。

因此可以从其他的思路来实现，例如我们可以通过访问内部接口获取响应值，通过这种方法可以跳过对页面的分析，直接获取想要的结果。主要难点在于分析该内容调用的接口。

例如我们查看CSDN的博客页面，点击搜索框可看到CSDN会推送热门的搜索信息，但是如果查看当前页面的网页源码是无法搜索到该内容的。

此时我们可以打开F12，查看页面的所有请求

此时我们可以只选择Fetch/XHR查看页面所有调用的接口，从中找到正确的接口。根据实际请求中携带参数和header的信息，编写代码。

@Test
public void testApi() {
    CloseableHttpClient httpClient = HttpClients.createDefault();

    HttpGet httpGet = new HttpGet("https://silkroad.csdn.net/api/v2/assemble/list/channel/search_hot_word?new_hot_flag=1&channel_name=pc_hot_word&size=20&user_name=weixin_43347659&platform=pc&imei=10_20960811560-1623721797026-245775");
    httpGet.setHeader("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36");
    httpGet.setHeader("Accept", "application/json, text/javascript, */*; q=0.01");
    httpGet.setHeader("Content-Type", "application/json;charset=UTF-8");
    httpGet.setHeader("Origin", "https://blog.csdn.net");
    httpGet.setHeader("Accept-Encoding", "gzip, deflate, br");

    try {
    	CloseableHttpResponse response = httpClient.execute(httpGet);

    	if (response.getStatusLine().getStatusCode() == 200) {
    		System.out.println(EntityUtils.toString(response.getEntity(), "UTF-8"));
		}
    } catch (IOException e) {
    	e.printStackTrace();
    } finally {
        response.close();
    }
    
    httpClient.close();
}

一般勾选保留日志和停用缓存已防止页面发生重定向时丢失以前的请求内容。

1.4.2 反爬技术的影响

具体可查看知乎贴做爬虫怎可不知反爬虫？如何做反反爬虫。

1.5 爬取需要登录的页面

当需要获取登录后的页面信息时，就绕不开Cookie的问题。在请求时携带正确的Cookie值可直接跳过登录操作。该问题可通过两种方案解决。

1.5.1 在header中直接携带Cookie

在设置请求头时，可以直接绑定Cookie值，该Cookie值可以通过实际访问时查看请求内容获取，示例：

@Test
public void testCookie() throws Exception {
    CloseableHttpClient httpClient = HttpClients.createDefault();

    HttpGet httpGet = new HttpGet("https://mall.csdn.net/myorder?spm=1001.2014.3001.5137");
    httpGet.setHeader("user-agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36");
    httpGet.setHeader("Cookie", "yourCookie");

    CloseableHttpResponse response = httpClient.execute(httpGet);
    if (response.getStatusLine().getStatusCode() == 200) {
        System.out.println("==============================开始打印页面==============================");
        System.out.println(EntityUtils.toString(response.getEntity()));
        System.out.println("==============================结束打印页面==============================");
    }

    httpClient.close();
    response.close();
}

对于携带Cookie的方式登录存在一个问题，就是cookie存在有效期，当有效期过了之后就需要重新更换cookie，所以如果需要持续性的自动爬取数据，就存在很大弊端。

1.5.2 模拟登录自动获取Cookie

在发送请求时可以将登录信息添加到HttpPost中去尝试请求登录，如果登录成功，登录后的Cookie会保留在HttpClient中，再请求其他页面时则会跳过登录。

以CSDN的登录为例，通过F12查找登录接口，根据请求头信息，配置HttpPost

@Test
public void testLogin() throws Exception {
    CloseableHttpClient httpClient = HttpClients.createDefault();

    HttpPost httpPost = new HttpPost("https://passport.csdn.net/v1/register/pc/login/doLogin");
    httpPost.setHeader("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36");
    httpPost.setHeader("Accept", "application/json, text/plain, */*");
    httpPost.setHeader("Accept-Encoding", "gzip, deflate, br");
    httpPost.setHeader("Accept-Language", "zh-CN,zh;q=0.9");
    httpPost.setHeader("Content-Type", "application/json;charset=UTF-8");
    httpPost.setHeader("Host", "passport.csdn.net");
    httpPost.setHeader("Origin", "https://passport.csdn.net");
    httpPost.setHeader("Referer", "https://passport.csdn.net/login?code=applets");

    // 配置登录参数
    List<NameValuePair> pairList = new ArrayList<NameValuePair>();
    pairList.add(new BasicNameValuePair("loginType", "1"));
    pairList.add(new BasicNameValuePair("pwdOrVerifyCode", "password"));
    pairList.add(new BasicNameValuePair("uaToken", ""));
    pairList.add(new BasicNameValuePair("userIdentification", "username"));
    pairList.add(new BasicNameValuePair("webUmidToken", ""));

    httpPost.setEntity(new UrlEncodedFormEntity(pairList, HTTP.UTF_8));

    CloseableHttpResponse response = httpClient.execute(httpPost);

    if (response.getStatusLine().getStatusCode() == 200) {
        System.out.println("登录成功");
        // 这里要注销请求，否则会影响后续的请求
        httpPost.abort();

        HttpGet httpGet = new HttpGet("https://mall.csdn.net/myorder?spm=1001.2014.3001.5137");
        httpGet.setHeader("user-agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36");

        CloseableHttpResponse response1 = httpClient.execute(httpGet);
        if (response1.getStatusLine().getStatusCode() == 200) {
            System.out.println("==============================开始打印页面==============================");
            System.out.println(EntityUtils.toString(response1.getEntity()));
            System.out.println("==============================结束打印页面==============================");
        }
        response1.close();
    }

    response.close();
    httpClient.close();
}

该案例为失败案例，由于登录方式多变，可能出现的验证码等人机校验，导致用户登录的难度加大，例如上述案例，直接访问登录接口后，会直接重定向到人机验证界面，导致无法正常登录。有些页面也存在在前端进行密码加密，导致无法获取正确的密码。

因此上述例子只是提供一个思路。

二、HtmlUtil实现JS异步加载页面

2.1 HtmlUtil

htmlunit 是一款开源的java 页面分析工具，读取页面后，可以有效的使用htmlunit分析页面上的内容。项目可以模拟浏览器运行，被誉为java浏览器的开源实现。是一个没有界面的浏览器，运行速度迅速。是junit的扩展之一。

2.2 引入依赖

<dependency>
	<groupId>net.sourceforge.htmlunitgroupId>
	<artifactId>htmlunitartifactId>
	<version>${htmlutil.version}version>
dependency>

2.3 创建简单的请求操作

2.3.1 创建实例

@Test
public void testLinked() {
    try (WebClient webClient = new WebClient(BrowserVersion.CHROME)) {
        webClient.getOptions().setThrowExceptionOnScriptError(false);//当JS执行出错的时候是否抛出异常
        webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);//当HTTP的状态非200时是否抛出异常
        webClient.getOptions().setActiveXNative(false);
        webClient.getOptions().setCssEnabled(false);//是否启用CSS
        webClient.getOptions().setJavaScriptEnabled(true); //很重要，启用JS
        webClient.setAjaxController(new NicelyResynchronizingAjaxController());//很重要，设置支持AJAX

        //开始请求网站
        HtmlPage loginPage = webClient.getPage("https://ent.sina.com.cn/film/");
        webClient.waitForBackgroundJavaScript(30000);//该方法阻塞线程

        System.out.println("=================开始打印页面=================");
        System.out.println(loginPage.asXml());
        System.out.println("=================结束打印页面=================");
    } catch (Exception e) {
        e.printStackTrace();
    }
}

对webClient的配置很重要，尤其是setAjaxController()方法，使得模拟页面可以支持AJAX异步加载。

对于Vue和AngularJS渲染的页面HtmlUtil在其处理上也不是太好，加载JS也只能加载原始页面中包含的内容，

2.3.2 模拟浏览器操作

HtmlUtil可以创建一个无界面的浏览器，所以可以通过代码对文本框赋值和进行点击操作，完成一些简单的操作。示例：

@Test
public void testSearch() {
    WebClient webClient = new WebClient(BrowserVersion.CHROME);

    // 设置当前的AJAX控制器
    webClient.setAjaxController(new NicelyResynchronizingAjaxController());
    // 设置CSS支持
    webClient.getOptions().setCssEnabled(false);
    // 设置JavaScript是否启用
    webClient.getOptions().setJavaScriptEnabled(true);
    // 设置ActiveX是否启用
    webClient.getOptions().setActiveXNative(false);
    // 设置访问错误时是否抛出异常
    webClient.getOptions().setThrowExceptionOnFailingStatusCode(true);
    // 设置JS报错时是否抛出异常
    webClient.getOptions().setThrowExceptionOnScriptError(false);

    try {
        HtmlPage htmlPage = webClient.getPage("https://www.csdn.net/");
        // 阻塞当前线程，直到指定时间后结束
        webClient.waitForBackgroundJavaScript(10*1000);

        // 获取搜索框
        HtmlInput search = (HtmlInput) htmlPage.getByXPath("//*[@id=\"toolbar-search-input\"]").get(0);
        search.setAttribute("value", "HtmlUtil用法");

        // 点击搜索
        HtmlButton button = (HtmlButton) htmlPage.getByXPath("//*[@id=\"toolbar-search-button\"]").get(0);
        HtmlPage newHtmlPage = button.click();

        System.out.println("=============打印页面=============");
        System.out.println(newHtmlPage.asXml());
        System.out.println("=============打印页面=============");
    } catch (IOException e) {
    	e.printStackTrace();
    }

}

该示例通过访问CSDN的首页，为搜索框赋值，操作点击后可获取搜索结果。

由于CSDN的搜索结果是通过Vue框架加载，所以无法获取到最终的结果。

2.4 爬取待登录的页面

操作与2.3.2节类似，主要思路为获取登录页面，为表单元素添加用户名和密码，再通过click()方法点击登录按钮，提交表单，登录成功后会自动将cookie存放在WebClient中，可通过WebClient再次访问其他需要登录的页面。

相较于HttpClient，HtmlUtil可以直接操作页面比访问接口相对容易，但是针对于Vue框架和需要验证码登录的页面还是存在问题。

参考资料：

HtmlUnit 官网

HtmlUtil API文档

HttpClient 官网

HttpClient API文档

jvm分析篇---1、先认识下dump文件布朗克168 jvm jvm java 内存 dump
目录一、简介二、生成方式三、JavaWeb项目配置参数四、最佳实践一、简介Dump文件是JVM在运行过程中生成的内存快照文件，主要用于诊断Java应用的内存问题（如内存泄漏、OOM错误）和线程状态分析。在JavaWeb项目中，常见的dump文件类型包括：堆Dump（HeapDump）记录JVM堆内存中所有对象的详细信息，包括对象类型、引用关系和内存占用。$$\text{文件大小}\approx\t
复习博客：JVM hdzw20 java八股文复习 jvm java intellij-idea spring 后端
复习博客：JVM今日复习内容今天学习Java虚拟机（JVM），它是Java程序运行的基石。理解JVM的工作原理对于优化Java应用性能和排查问题至关重要。主要复习了以下内容：JVM内存模型JVM内存模型（也称为运行时数据区域）主要分为以下几个部分：程序计数器(ProgramCounterRegister)：一块较小的内存空间，是当前线程所执行的字节码的行号指示器。每个线程都有一个独立的程序计数器，
Java 实现 TCP 多发多收通信程序小陈永不服输 java 开发语言 tcp/ip 网络网络协议
在网络通信中，TCP协议的可靠传输特性使其在需要持续交互的场景中被广泛应用。本文将围绕一段实现TCP多发多收功能的Java代码，详细解析其实现原理、运行流程及技术特点，帮助开发者深入理解TCP持续通信的实现方式。核心代码展示以下是实现TCP多发多收通信的完整代码，包含客户端与服务器端两个部分：客户端（Client）代码packagecom.practical.agreement.tcp.tcp_2
抽象文档模式 hello 早上好设计模式开发语言 java
抽象文档模式在软件开发中，我们经常需要处理半结构化数据（如JSON、XML、文档数据库中的文档）。这类数据的特点是结构灵活，可能存在嵌套关系，且字段可能动态变化。传统的面向对象设计可能需要为每种数据结构定义大量类，导致代码冗余和维护困难。这时候，抽象文档模式（AbstractDocumentPattern）就能派上用场。本文将通过一个完整的Java案例，详细讲解抽象文档模式的实现原理、设计思路和实
apache ignite系列（二）：配置 weixin_30521161
ignite有两种配置方式，一种是基于XML文件的配置，一种是基于JAVA代码的配置：这里将ignite常用的配置集中罗列出来了，一般建议使用xml配置。1，基于XML的配置-->org.cord.*-->java.lang.Longcom.palic.demo.data.domain.CommRate-->-->-->-->-->-->-->-->-->-->-->127.0.0.1:48500
ArrayList 与 LinkedList 的区别 BonnenuIt゛浅时光737 Java基础 java 面试
ArrayList与LinkedList的核心区别在Java中，ArrayList和LinkedList是两种常用的列表实现，它们在底层结构、性能特性和适用场景上有显著差异。以下从多个维度详细对比：1.底层数据结构对比项ArrayListLinkedList数据结构动态数组（Object[]）双向链表（每个节点包含前驱和后继指针）存储方式连续内存空间存储元素非连续内存，通过指针关联元素内存占用需预
ArrayList与LinkedList有什么区别萤火12345 java基础 java 数据结构算法面试
总结自知乎用户bravo1988java小册数组与链表ArrayList与LinkedList区别底层数据结构首先要从底层数据结构说起，ArrayList底层数据结构是数组，是一块连续的内存空间LinkedList底层数据结构不是连续的内存空间，是用一个节点记住下个节点的地址串起来的容器特点ArrayList保证数据在内存中是连续的只有保证连续才能使用索引，保证连续导致了操作非尾部数据时，会发生数
打造完美Web登录界面：HTML、CSS与Bootstrap实战 Suvo Sarkar
本文还有配套的精品资源，点击获取简介：登录界面是用户与Web应用程序互动的起点，其设计和实现对用户体验至关重要。本教程将指导开发者如何使用HTML、CSS和Bootstrap框架创建一个功能齐全且视觉吸引力强的登录界面。内容涵盖从基础的表单标签到使用Bootstrap的响应式设计，以及如何结合JavaScript和后端技术来增强界面的业务逻辑和用户验证功能。1.HTML表单标签基础HTML表单标签
java web登录代码_Java Web 登录页面的实现代码实例 KJ(Kan Jia) java web登录代码
代码如下~内有详细解释，最后有照片！functioninuser(){username_mess.style.visibility="visible";}functionoutuser(){//获取name为usesrname的文本u=f1.username.value;f1.username.style.border="1pxsolidaaaaaa";if(u==""){username_mes
Java学习-----Bean 典孝赢麻崩乐急 java 学习 rpc
在Spring框架中，Bean是核心概念之一，它贯穿了整个Spring应用的生命周期，是实现依赖注入（DI）和控制反转（IoC）的基础。理解Bean的原理、作用及使用特点，对于掌握Spring框架至关重要。SpringBean的本质是由SpringIoC容器管理的对象，它的创建、初始化、依赖注入及销毁等过程均由容器控制，而非通过传统的new关键字手动创建。其核心原理可概括为以下两点：1.控制反转（
Java学习----NIO模型典孝赢麻崩乐急 java 学习 nio
在Java的I/O模型中，NIO（Non-BlockingI/O，非阻塞I/O）是对BIO的重要改进。它为高并发场景提供了更高效的处理方式，在众多Java应用中发挥着关键作用。NIO模型的核心在于非阻塞和多路复用，其采用“一个线程处理多个连接”的模式，主要依靠通道（Channel）、缓冲区（Buffer）和选择器（Selector）这三个核心组件协同工作，每个核心组件的功能原理和功能如下：（1）通
Java学习————————ThreadLocal 典孝赢麻崩乐急 java 学习开发语言
ThreadLocal是Java中一个非常重要的线程级别的变量隔离机制，它提供了线程局部变量，使得每个线程都可以拥有自己独立的变量副本，从而避免了多线程环境下的共享变量竞争问题。ThreadLocal的实现原理主要依赖于：（1）ThreadLocalMap：每个Thread对象内部都有一个ThreadLocalMap实例（2）弱引用键：ThreadLocalMap使用ThreadLocal对象作为
【集群】MySQL的主从复制了解吗？会有延迟吗，原因是什么？雪碧聊技术 Java八股文 mysql 数据库 MySQL主从复制
欢迎来到我的Java八股文专栏！各位程序员小伙伴们好呀~我是雪碧聊技术，很高兴能在CSDN与大家相遇！✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点，内容涵盖：Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏？精准定位：直击大厂Java面试高频考点系统全面：从基础到进阶，构建完整知识体系实战导向：理论
【锁】MySQL中有哪几种锁？雪碧聊技术 Java八股文 mysql 数据库锁
欢迎来到我的Java八股文专栏！各位程序员小伙伴们好呀~我是雪碧聊技术，很高兴能在CSDN与大家相遇！✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点，内容涵盖：Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏？精准定位：直击大厂Java面试高频考点系统全面：从基础到进阶，构建完整知识体系实战导向：理论
MySQL的Binlog有几种格式? 雪碧聊技术 Java八股文 mysql 数据库
欢迎来到我的Java八股文专栏！各位程序员小伙伴们好呀~我是雪碧聊技术，很高兴能在CSDN与大家相遇！✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点，内容涵盖：Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏？精准定位：直击大厂Java面试高频考点系统全面：从基础到进阶，构建完整知识体系实战导向：理论
web登录注册页面 m0_67391518 面试学习路线阿里巴巴前端 java html mysql 数据库
目录web登录注册页面效果图结构图Java代码User.javaUserMapper.javaIndexServlet.javaRegisterServlet.javaDButil.javaxml配置文件mybatis-config.xmldb.propertiesweb.xmlhtml与cssindex.jspindex.cssregister.htmlregister.css文章目录web登录
简单WEB登录页面代码实现逆流的飞鱼简单代码 java
longin.html：登录页面，此处action引用**/**类型的地址，JSP可以用${pageContext.request.contextPath}/LS用户名:密码：LoginServlet.java用户和前台WEB页面数据进行交互packageit.tongyou.web.servlet;importjava.io.IOException;importjava.io.PrintWrit
Arraylist与LinkedList区别雪碧聊技术 Java八股文 ArrayList LinkedList
欢迎来到我的Java八股文专栏！各位程序员小伙伴们好呀~我是雪碧聊技术，很高兴能在CSDN与大家相遇！✨专栏介绍这个专栏将专注于分享Java面试中的经典"八股文"知识点，内容涵盖：Java基础核心概念JVM原理与性能调优多线程与并发编程️设计模式实战️常用框架源码解析⚙️系统架构设计思想为什么选择这个专栏？精准定位：直击大厂Java面试高频考点系统全面：从基础到进阶，构建完整知识体系实战导向：理论
聊聊artemis的SlowConsumerReaperRunnable go4it
序本文主要研究一下artemis的SlowConsumerReaperRunnableSlowConsumerPolicyactivemq-artemis-2.11.0/artemis-server/src/main/java/org/apache/activemq/artemis/core/settings/impl/SlowConsumerPolicy.javapublicenumSlowCo
java开发安卓和kotlin对比哈哈皮皮虾的皮 java android kotlin
Java和Kotlin都是用于Android开发的编程语言，它们各自具有独特的特点和优势。以下是对Java和Kotlin在Android开发中的对比：一、语法与简洁性Java：Java的语法相对繁琐，需要编写较多的样板代码。例如，在Java中，每一行代码的末尾都需要一个分号来表示语句的结束。Kotlin：Kotlin的语法更为简洁，支持更多的语法糖，可以减少冗余的代码。在Kotlin中，换行符通常
Android Room使用方法与底层原理详解你过来啊你 android room
Room是一个强大的SQLite对象映射库，旨在提供更健壮、更简洁、更符合现代开发模式的数据库访问方式。核心价值：消除大量样板代码，提供编译时SQL验证，强制结构化数据访问，并流畅集成LiveData、Flow和RxJava以实现响应式UI。一、使用流程(Step-by-StepWorkflow)Room的使用遵循一个清晰的结构化流程：添加依赖：//build.gradle(Module)depe
Java中HashMap的实现原理详解
HashMap是Java集合框架中的核心类，基于哈希表实现键值对（Key-Value）存储，提供O(1)时间复杂度的快速查找。以下从数据结构、哈希机制、冲突解决、扩容策略等角度详细解析其实现原理（基于Java8）。一、核心数据结构：数组+链表+红黑树transientNode[]table;//哈希桶数组staticclassNode{//链表节点finalinthash;finalKkey;Vv
JAVA学习-行为抽象和Lambda.Lambda表达式守护者170 java学习 java 学习开发语言
行为抽象和Lambda表达式是Java8引入的新特性，用于简化代码和提高代码的可读性。一、概述、特点、使用方法以及与其他比较和高级应用的说明：1.行为抽象：它是指将一段代码抽象为一种功能或行为，以便在需要时可以传递给其他方法或对象。行为抽象通常通过接口来定义，其中接口包含一个或多个抽象方法来表示不同的功能。2.Lambda表达式：Lambda表达式是一种简洁的语法，用于实现行为抽象。它可以替代匿名
CodeBuild构建文件复制到特定目录处理亚林瓜子 linux 运维服务器
version:0.2phases:install:runtime-versions:java:corretto17pre_build:commands:-mvn--versionbuild:commands:-mvnclean&&mvnpackage-Dmaven.test.skip=truepost_build:commands:-mkdir-ppackaged-artifact/.ebext
牛客 - 倒置字符串(java)
题目解题思路解题代码题链接题目解题思路解题代码importjava.util.*;publicclassMain{//定义翻转字符数组的方法publicstaticvoidreverse(char[]arr,intstart,intend){while(start
Gson、Fastjson 和 Jackson 对比解析小张0.0 JavaWeb json
目录1.Gson(Google)基本介绍：核心功能：特点：使用场景：2.Fastjson(Alibaba)基本介绍：核心功能：特点：使用场景：3.Jackson基本介绍：核心功能：特点：使用场景：4.对比总结5.选择建议Gson、Fastjson和Jackson这三种都是Java生态中广泛使用的JSON处理库，用于实现Java对象与JSON数据之间的相互转换。在项目中使用不同的方法即可调用不同的J
牛客-倒置字符串小张0.0 OJ算法题题目心得算法 leetcode 动态规划
1.题目描述2.题目链接倒置字符串_牛客题霸_牛客网3.代码解答importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscanner=newScanner(System.in);Strings=scanner.nextLine();//按空格分割单词（处理多个连续空格的情况，split("
使用Meteor构建实时仪表板的完整指南杏花朵朵 Meteor 实时仪表板 Vue组件路由设置集合集成
背景简介随着现代Web应用对实时性和响应性的要求不断提高，开发人员需要使用强大的框架来构建能够满足这些需求的应用程序。Meteor作为一个全栈JavaScript框架，提供了一种快速开发实时Web应用的方法。本文将通过构建一个实时仪表板项目，详细探讨Meteor的特点和使用方法。Meteor简介Meteor是一个全栈JavaScript框架，用于构建Web应用程序。它的主要元素包括Web客户端、基
完善Meteor应用的NPM集成——meteorhacks/npm项目推荐尤峻淳Whitney
完善Meteor应用的NPM集成——meteorhacks/npm项目推荐1.项目基础介绍及编程语言meteorhacks/npm是一个开源项目，旨在为Meteor应用提供完整的NPM模块集成。该项目通过允许在Meteor应用内部使用NPM模块，极大地扩展了Meteor应用的功能性和灵活性。该项目的主要编程语言是JavaScript。2.项目核心功能项目的核心功能是提供一个桥接器，让开发者可以在M
node.js详解思静鱼 node.js node.js
文章目录一、什么是Node.js？二、Node.js的核心组成三、Node.js的运行机制（事件循环）四、常见内置模块（无需安装）五、应用场景六、npm包生态七、Node.js适合哪些人？八、优缺点总结一、什么是Node.js？Node.js是一个基于ChromeV8引擎的JavaScript运行时，用于构建高性能网络应用。由RyanDahl于2009年发布。允许你在服务器端使用JavaScrip
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l