大哥，带带弟弟

HttpClient爬虫入门

文章目录

一、maven引入jar包
二、HttpClient使用
- 1.步骤
- 2.向网页发送GET请求
- 3.向网页发送POST请求
- 4.使用连接池管理请求
三、Jsoup使用
- 1.使用jsoup解析url
- 2.使用jsoup解析字符串
- 3.使用jsoup解析.html文件

什么是HttpClient？

顾名思义，httpclient就是http客户端的意思；在项目中前后台交互是通过HTTP/HTTPS请求、响应来进行的，而HTTP请求是由浏览器生成并发送给后台服务器的，服务器接收request请求处理过后返回前台response响应。HttpClient就是代替并模拟浏览器，由代码生成HTTPrequest请求；请求发送给各个大型网站的服务器，获取其网页内容可以实现网络爬虫的功能。

一、maven引入jar包

<dependency>
	<groupId>org.apache.httpcomponentsgroupId>
	<artifactId>httpclientartifactId>
	<version>4.5.13version>
dependency>

二、HttpClient使用

1.步骤

浏览器发送HTTP请求步骤：

打开个人PC客户端浏览器
输入网址
按下Enter发送GET请求
收到服务器返回的请求

使用HttpClient向网页发送请求本质就是用代码的方式实现了上面“浏览器发送HTTP请求步骤”，即代码代替手工（方便理解）。

2.向网页发送GET请求

查看HttpGet的源码可以发现HttpGet方法有三个构造函数，可以接受URI对象和String字符串。

代码如下（示例）：

/**
 * 使用httpclient发送get请求
 * 并且通过URIBuilder设置带参数的请求(可以不设置，直接发送GET请求)
 * @throws Exception
 */
@Test
public void test2() throws Exception{
     /**
      * CloseableHttpClient:
      * 可以关闭的httpclient客户端，相当于打开一个浏览器
      * 据说是在老版本中httpClient不能及时关闭，造成了资源的浪费，所以有了CloseableHttpClient类。
      */
    CloseableHttpClient closeableHttpClient = HttpClients.createDefault();
    String urlStr = "https://www.huawei.com/cn/searchresult";
    /**
     * 通过URIBuilder设置带参数的get请求
     * 如果有多个参数可以采用链式编程的方法设置多个键值对参数。
     */
    URIBuilder uriBuilder = new URIBuilder(urlStr);
    /**
     * 最终成型样式打印：
     * "GET /cn/searchresult?keywords=p50 HTTP/1.1[\r][\n]"
     */
    uriBuilder.setParameter("keywords","p50");
    /**
     * 构造httpGet请求对象
     * 打印httpGet：GET https://www.huawei.com/ HTTP/1.1
     * 其构造方法可以接受字符串或者是URI实例对象；
     * 即：如果是HttpGet httpGet = new HttpGet(urlStr);
     * 的话是不带参数发送GET请求
     */
    HttpGet httpGet = new HttpGet(uriBuilder.build());
   
    /**
     * 设置请求头，防止多次请求后被网页服务器认定为破坏者给封了
     */
    httpGet.setHeader("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36");

    //  可以关闭的httpClient客户端的响应
    CloseableHttpResponse closeableHttpResponse = null;
    //相当于按下Enter发送请求，然后用closeableHttpResponse 接收返回的响应。
    closeableHttpResponse = closeableHttpClient.execute(httpGet);
    /**
     *  获取status：HTTP/1.1 200 OK  获取状态码：
     *  代码实现：closeableHttpResponse.getStatusLine().getStatusCode();
     */
    /**
     * HttpEntity：
     * 发送请求后获取响应的结果，即获取返回的结果！！！
     * HttpEntity不仅可以作为结果，也可以作为请求的实体参数，他有很多实现。
     * 输出entity：org.apache.http.client.entity.DecompressingEntity@dd3b207
     *  HttpEntity表示http的request和resposne实体，它由消息头和消息体组成。
     *  从HttpEntity中可以获取http请求头和回应头，也可以获取http请求体和回应体信息。
     */
    HttpEntity entity = closeableHttpResponse.getEntity();
    /**
     * EntityUtils是对HttpEntity操作的工具类
     * responseResult就是完整的响应
     */
    String responseResult = EntityUtils.toString(entity,StandardCharsets.UTF_8);
    //System.out.print("测试输出请求的内容："+entity.getContentType().getValue());
    System.out.print(responseResult);
    //关闭流水
    EntityUtils.consume(entity);
    if(closeableHttpClient != null){
        closeableHttpClient.close();
    }
    if(closeableHttpResponse != null){
        closeableHttpResponse.close();
    }
}

对网页手动发出带参数的请求右击查看网页源代码，和下面的对比发现一样。

执行代码，发出请求，打印结果
补充：请求主体的设置

//请求主体的设置,可加在代码中也可不加，记录一下使用方法。
//通过RequestConfig设置，通过httpGet.setConfig将设置添加到http请求中去
HttpGet httpGet = new HttpGet(urlStr);
RequestConfig requestConfig = RequestConfig
     .custom()
     .setConnectTimeout(10000)           //设置链接超时时间为10秒钟，单位是毫秒
     .setConnectionRequestTimeout(1000)  //设置获取连接的最长时间
     .setSocketTimeout(10000)            //设置读取超时时间为十秒钟
     .build();
httpGet.setConfig(requestConfig);

3.向网页发送POST请求

可以设置带参数也可以不带参数，这里直接设置的带参数的post请求，去掉设置请求参数的代码就是不带参数的post请求了；同样可以请求成功。

/**
 * 实现：发送Post请求
 * 步骤：
 * 1.开启客户端
 * 2.找到网址
 * 3.发送GET/POST请求
 * 4.收到response响应
 * 5.处理响应
 * 6.关闭网页，释放资源
 */
@Test
public void testPost() throws  Exception{
    CloseableHttpClient httpClient = HttpClients.createDefault();
    //创建httpPost对象，设置url访问地址
    HttpPost httpPost = new HttpPost("https://www.huawei.com/cn/searchresult");
    //封装表单中的额数据--->声明list集合
    List<NameValuePair> paramsList = new ArrayList<NameValuePair>();
    //设置请求地址是：https://www.huawei.com/cn/searchresult？keywords=p50，是post请求！
    paramsList.add(new BasicNameValuePair("keywords","p50"));
    //创建表单的Entitty的对象
    UrlEncodedFormEntity urlEncodedFormEntity = new UrlEncodedFormEntity(paramsList,StandardCharsets.UTF_8);
    //将表单对象加入到post请求中
    httpPost.setEntity(urlEncodedFormEntity);
    CloseableHttpResponse closeableHttpResponse = httpClient.execute(httpPost);
    //判断是否请求成功，状态码是200说明得到了正确的响应
    if(closeableHttpResponse.getStatusLine().getStatusCode() == 200){
        HttpEntity entity = closeableHttpResponse.getEntity();
        String s = EntityUtils.toString(entity);
        System.out.print(s);
    }
    httpClient.close();
    closeableHttpResponse.close();
}

4.使用连接池管理请求

/**
 * 功能：测试连接池
 * 问：为什么使用连接池？
 * 答：每次使用HttpClient时，需要开启一个可关闭的httpclient客户端(实际是在内存中申请地址获取硬件资源)，使用完后关闭时释放内存资源；
 *    单次使用未有大问题，但是频繁开启httpclient客户端会造成资源的利用不合理。使用连接池可以提前申请好资源，不用频繁开启关闭，使得硬件资源合理利用。
 *
 *  步骤：
 *  1.创建连接池管理器
 *  2.配置连接池
 *  3.使用连接池管理器发起请求
 *
 *  使用连接池和使用HttpClient发起请求的区别：
 *  1.使用连接池管理器创建http请求时不需要使用 HttpClients.createDefault()的方法创建请求
 *  2.请求发起并完成后逇链接不需要关闭，因为有连接池管理器在管理链接。
 */
@Test
public void connPoolMan() throws Exception{
    //1.创建连接池
    PoolingHttpClientConnectionManager pool = new PoolingHttpClientConnectionManager();
    //2.配置连接池
    pool.setMaxTotal(100);//设置最大连接
    pool.setDefaultMaxPerRoute(10);//设置每个主机的最大连接数
    //3.使用连接池发起请求
    conn(pool);
    conn(pool);
 }

public static void conn(PoolingHttpClientConnectionManager pool) throws Exception{
    CloseableHttpClient closeableHttpClient = HttpClients.custom().setConnectionManager(pool).build();
    /**
     * 可以看到两次的请求地址是不一样的：
     * HttpClient客户端地址：org.apache.http.impl.client.InternalHttpClient@19dc67c2
     * HttpClient客户端地址：org.apache.http.impl.client.InternalHttpClient@1e127982
     */
    System.out.println("HttpClient客户端地址："+closeableHttpClient);
    HttpGet httpGet = new HttpGet("https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=parser&fenlei=256&oq=Incompatible%2520types.%2520Found%253A%2520%2526%252339%253Bcom.minGe.SpringSecurityStudy.WeekDay%2526%252339%253B%252C%2520required&rsv_pq=89062b920009f034&rsv_t=c484X67GB9z1uE4WJcPgGer043fTPO5I83E1A7YpLoq%2Fw9NM4JZlWN94GOw&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_btype=t&rsv_sug3=53&rsv_sug1=41&rsv_sug7=100&rsv_sug2=0&inputT=1201&rsv_sug4=2524");
    CloseableHttpResponse execute = closeableHttpClient.execute(httpGet);
    if(execute.getStatusLine().getStatusCode()==200){
        HttpEntity string = execute.getEntity();
        System.out.println("占用了多少字节："+EntityUtils.toString(string).length());
    }
    /**
     * 注意：
     * closeableHttpClient.close()不需要，连接池管理资源，所以不需要再手动去关闭。
     */
    execute.close();
}

三、Jsoup使用

1.使用jsoup解析url

从下图看到Jsoup.parse的构造函数可以接收多种类型的数据，并且其返回的结果只有一种形式，均是Document类型的结果。

@Test
/**
 * 功能：使用jsoup解析url
 * 注意：
 *    从程序中可以看出使用jsoup可以代替HttpClient直接发起请求并且解析数据，而且简单，但是为何不用jsoup爬取数据？
 *    因为在实际开发中需要使用到多线程、连接池、代理等等方式；而jsoup对这些支持不是很好，所以我们吧jsoup仅仅作为html解析工具使用。
 */
public void parseURL() throws Exception{
    //直接解析url地址，返回的是一个Document对象
    Document document = Jsoup.parse(new URL("https://www.huawei.com/cn/searchresult"), 10000);
    //获取解析到的document对象中的第一个title标签下的文字内容
    String span = document.getElementsByTag("title").first().text();
    //打印结果：站内搜索 - 华为
    System.out.println(span);
}

执行结果：

2.使用jsoup解析字符串

//解析字符串
String content = FileUtils.readFileToString(new File("C://Users//minge//Desktop//这就是一段简单html内容.txt"));
Document docu = Jsoup.parse(content);
System.out.println(docu.getElementsByTag("title").text());

使用FileUtils工具类要导commons-io包：

<dependency>
	<groupId>commons-iogroupId>
	<artifactId>commons-ioartifactId>
	<version>2.4version>
dependency>

3.使用jsoup解析.html文件

//直接解析文件,是在Windows系统下解析的文件，Windows系统下的文件默认使用GB2312编码。
Document document = Jsoup.parse(new File("C://Users//minge//Desktop//这就是一段简单html内容.html"), "GB2312");
//打印结果对比：   我嫩爹
   我嫩爹
System.out.println(document.getElementsByClass("wonendie").html());
System.out.println(document.getElementsByClass("wonendie").text());

你可能感兴趣的:(SpringBoot,HttpClient,http,java,爬虫)

美容院管理创新：SpringBoot系统设计与开发杨哥带你写代码 spring boot 后端 java
摘要如今的信息时代，对信息的共享性，信息的流通性有着较高要求，因此传统管理方式就不适合。为了让美容院信息的管理模式进行升级，也为了更好的维护美容院信息，美容院管理系统的开发运用就显得很有必要。并且通过开发美容院管理系统，不仅可以让所学的SpringBoot框架得到实际运用，也可以掌握MySQL的使用方法，对自身编程能力也有一个检验和提升的过程。尤其是通过实践，可以对系统的开发流程加深印象，无论是前
2024年Python最新Python爬虫入门教程27：爬取某电商平台数据内容并做数据可视化 2401_84584609 程序员 python 爬虫信息可视化
‘详情页’])csv_writer.writeheader()forpageinrange(1,26):print(f’正在保存第{page}页数据内容===========')url=f’http://bang.dangdang.com/books/bestsellers/01.00.00.00.00.00-year-2017-0-1-{page}’headers={‘User-Agent’:‘
JavaScript详解十三 ——节点操作遇见~未来 JavaScript JavaScript详解 javascript 开发语言 ecmascript
目录节点操作1、创建节点2、创建文本3、添加节点(先有父母才能生孩子)4、替换节点5、删除节点6、克隆节点7、创建节点另外几种方式（1）、element.innerHTML（2）、element.innerText（3）、document.write()（4）、insertAdjacentHTML()节点操作1、创建节点docment.createElement('节点')参数：标签名字符串这些元
linux制作自定义service服务单元 handsomestWei 后端 linux 后端
linux制作自定义service服务单元服务单元简介在Linux系统中，服务单元通常以.service后缀结尾，并存储在/etc/systemd/system目录下。服务单元文件定义了服务的启动顺序、依赖关系、执行命令等参数。使得系统管理员能够方便地启动、停止、重启和管理系统中的各种服务。java服务单元示例服务单元myJava.service文件示例。注意关闭标准输出，避免日志文件占用磁盘空间
如何利用 Python抓取网页数据其他方式抓取网页数据列举数码小沙 python实例操作 python php 开发语言
在Python中可以使用多种方法抓取网页数据，以下是一种常见的方法，使用requests和BeautifulSoup库。一、安装所需库在命令提示符或终端中执行以下命令安装requests和BeautifulSoup库：pipinstallrequestspipinstallbeautifulsoup4二、抓取网页数据步骤发送请求使用requests库发送HTTP请求来获取网页内容。例如：impor
【新人系列】Python 入门（二十七）：Python 库 Pandaconda #Python 新人系列 python 开发语言后端笔记面试 python库库
✍个人博客：https://blog.csdn.net/Newin2020?type=blog专栏地址：https://blog.csdn.net/newin2020/category_12801353.html专栏定位：为0基础刚入门Python的小伙伴提供详细的讲解，也欢迎大佬们一起交流~专栏简介：在这个专栏，我将带着大家从0开始入门Python的学习。在这个Python的新人系列专栏下，将会
Microi 吾码与 JavaScript：前端低代码平台的强大组合小周不想卷 javascript
目录一、引言二、Microi吾码概述三、JavaScript在Microi吾码前端开发中的应用（一）前端V8引擎与JavaScript（二）接口引擎与JavaScript四、JavaScript在Microi吾码后端开发中的协同（一）与C#后端框架的交互（二）利用gRPC实现跨语言通信五、Microi吾码中JavaScript与数据库的交互六、Microi吾码中JavaScript在表单与模板引擎
【论文投稿】Spring Boot 开发全攻略：从入门到精通小周不想卷艾思科蓝学术会议投稿 spring boot
目录一、SpringBoot简介与优势二、开发环境搭建三、创建SpringBoot项目四、项目结构剖析五、控制器开发六、服务层设计七、数据访问层构建一、SpringBoot简介与优势SpringBoot是一个基于Spring框架的快速开发框架，旨在简化Spring应用的初始搭建以及开发过程。它通过提供一系列的默认配置和约定，使得开发者能够快速地创建出可独立运行的、生产级别的Spring应用程序，极
Node.js 能做什么 yqcoder node.js
一、服务器端开发1.构建Web服务器使用内置的`http`模块或流行的框架（如Express、Koa等）创建Web服务器，处理HTTP请求和响应。可以处理各种类型的请求，如GET、POST、PUT、DELETE等，并返回相应的HTML、JSON或其他数据类型。consthttp=require("http");constserver=http.createServer((req,res)=>{ r
线程池的拒绝策略有哪些？ IsToRestart 线程池
在Java中，线程池的拒绝策略决定了在任务队列已满的情况下，如何处理新提交的任务。当线程池达到最大容量并且任务队列也已满时，拒绝策略就会起作用。Java提供了四种内置的拒绝策略，它们分别是：AbortPolicy-这是默认的拒绝策略，当线程池无法接受新任务时，会抛出RejectedExecutionException异常。这意味着新任务会被立即拒绝，不会加入到任务队列中，也不会执行。通常情况下都是
大量研究SSRF文章和报告的总结渗透小白鼠安全安全 web安全网络安全
资源链接：https://pan.quark.cn/s/a900691a3ec3免责声明由于传播、利用本公众泷羽Sec提供的文章、工具而造成的任何直接或者间接的后果及损失，均由使用者本人负责，公众号泷羽Sec团队及作者不为此承担任何责任，一旦造成后果请自行承担！前言研究大量有关服务器端请求伪造(SSRF)的文章和报告后，输出了一份有关SSRF漏洞的全面概述服务器端请求伪造（SSRF）服务器端请求伪
JavaScript进阶不断学习的码农 javascript javascript 前端 vue.js
一.同步和异步程序同步程序就是从头到尾一一执行异步是同步程序执行完成之后才来执行异步程序js是单线程的一个任务执行完成之后才会执行另外一个二.js的内存结构栈内存和堆内存js分引用类型和原始类型原始类型存储在栈内存中引用类型存储在堆内存中三.什么是闭包闭包就是函数嵌套函数，内部的函数就是闭包正常情况下函数执行完成之后，内部的变量就会被销毁（释放内存）闭包：内部函数没有执行完成，外部函数变量不会被销
Android 右键后无Java class创建不吃凉粉 android java 开发语言
Androidstudio创建javaclass：最近几个月用Androidstudio开发，因为电脑设置了一个新的用户使用，原来的androidstudio,打开之前的正常的项目总是报一些奇奇怪怪的错误，就重新安装了最新的版本问题描述但是新的androidstudio右键后没有javaclass,本来我就不怎么用java和androidstudio,又赶时间，不想花时间用更不了解的kotlin解
Mysql运维篇（五）部署MHA--主机环境配置努力的兜 mysql 运维数据库
一路走来，所有遇到的人，帮助过我的、伤害过我的都是朋友，没有一个是敌人。如有侵权，请留言，我及时删除！大佬博文https://www.cnblogs.com/gomysql/p/3675429.htmlMySQL高可用（MHA）-知乎一、MHA简介：MHA（MasterHighAvailability）目前在MySQL高可用方面是一个相对成熟的解决方案，它由日本DeNA公司youshimaton（
【免费大屏】积木BI大屏与老版的积木大屏对比有哪些优势？数据可视化数据分析
使用我们积木大屏的朋友经常反应，积木大屏只能在线使用或者商业版与JeecgBoot低代码平台一起使用，不能免费本地使用。为此，我们研发了一款新的大屏产品---积木BI大屏。一起来看一下积木BI大屏与老的大屏设计器对比有哪些优势吧！一、免费开源最大的区别来了，新的积木BI大屏支持免费开源部署；支持maven依赖集成。代码下载：https://github.com/jeecgboot/JimuRepo
stm32+w5500实现web服务_【NodeJS】简单静态WEB服务器实现 weixin_39711441
说明利用HTTP模块URl模块Path模块Fs模块创建在项目文件夹下，创建文件夹static,下面创建index.html//引入http模块var http=require('http');//fs模块var fs=require('fs');http.createServer(function(req,res){ //http://localhost:8001/news.html/new
Android 8 Wifi 初始化过程 weixin_34315665 移动开发 java
记录一下wifi初始化过程。packages/apps/Settings/src/com/android/settings/wifi/WifiSettings.javapublicvoidonStart(){super.onStart();//创建WifiEnabler对象//On/offswitchishiddenforSetupWizard(returnsnull)mWifiEnabler=c
LLama3.2-Vision + Gradio + 流式输出未来之星扣寄艾斯 llama vim
这里写自定义目录标题LLama-3.2-11B/90B-Vision-Instruct模型下载环境代码效果LLama-3.2-11B/90B-Vision-Instruct使用Gradio+流式输出+LLama3.2-Vision构建模型推理webdemo模型下载Huggingface：https://huggingface.co/meta-llama/Llama-3.2-11B-Vision-I
深入理解 Java 并发编程中的锁机制向着开发进攻 java并发编程 java 开发语言
深入理解Java并发编程中的锁机制在Java并发编程中，锁是一个至关重要的概念，它用于确保多个线程在访问共享资源时能够遵循正确的顺序和互斥规则。锁机制的设计和使用直接影响到程序的效率、正确性和可维护性。本文将从锁的基本概念讲起，深入分析Java中的锁类型、实现方式以及如何避免常见的并发问题。1.什么是锁？锁是一种同步机制，它用于限制对共享资源的访问，确保在同一时刻只有一个线程能够访问资源。锁的目的
新手安装Arkime不求人 OpenSource SIM 开源 Arkime
Arkime（原名Moloch）是一个开源数据包捕获软件，它可以收集到PCAP数据并对其索引，用于浏览和搜索捕获的并建立索引的网络流量。虽说可以在Arkime官方（https://arkime.com/）下载适用于CentOS（rpm）和Ubuntu（deb）的安装包安装。官网也有非常详细的文档资料（https://arkime.com/learn）。然而项目的压力使得我们无法充分学习技术，而且对
JS宏进阶：Map与Object jackispy JS宏进阶 javascript 开发语言 ecmascript
Object是JavaScript中最基本的数据类型之一，用于创建对象实例。newObject()是创建空对象的一种常见方式。而Map只是一种用于存储键值对的数据结构。相对于Object而言，他没有原型（也就是不能通过原型链的方式添加方法），但也存在自身的优势，某些场景，newMap可能比newObject更好用。下面是其内置方法的详细介绍：一、newMap1、创建新的Map对象，只能使用newM
WEB2.0网站构架分析 kaka_sun 参考文档 web myspace 数据库数据库服务器服务器 youtube
FovWeb拓展你我的视野，关注互联网和网站相关技术与运营。FROM：http://www.fovweb.com/optimizer/web20-site-architecture-analysis/一、web2.0网站常用可用性功能模块分析Web2.0网站是指将传统的网站构架（平台、内容源、用户、传播方式等）转化到以用户为核心的网站构架上来，包括一系列体现web2.0概念的元素、定位和创意。we
逆袭之路（11）——python网络爬虫：原理、应用、风险与应对策略凋零的蓝色玫瑰逆袭之路 php 开发语言 python
困厄铸剑心，逆袭展锋芒。寒苦凝壮志，腾跃绘华章。我要逆袭。目录一、引言二、网络爬虫的基本原理（一）网络请求与响应（二）网页解析（三）爬行策略三、网络爬虫的应用领域（一）搜索引擎（二）数据挖掘与分析（三）金融领域（四）学术研究（五）社交媒体监测四、网络爬虫带来的风险（一）法律风险（二）隐私风险（三）安全风险五、网络爬虫风险的应对策略（一）遵守法律法规（二）加强技术防护（三）提高道德意识六、结论一、引
Java 并发舞台：多线程小精灵的奇幻冒险之旅 guihong004 java面试题 java 开发语言
1.线程池的拒绝策略有哪些？Java中的线程池提供了几种不同的拒绝策略，当线程池无法处理新的任务时（比如因为线程池已满并且工作队列也满了），这些策略会决定如何处理新提交的任务。ThreadPoolExecutor类中定义了以下四种内置的拒绝策略：AbortPolicy：这是默认的拒绝策略。当有新任务提交且线程池无法处理时，它会抛出一个RejectedExecutionException异常。Cal
基于STM32 + W5500的以太网功能开发与时间同步方案嵇英芹
基于STM32+W5500的以太网功能开发与时间同步方案STM32W5500移植NTP更新时间.rar项目地址:https://gitcode.com/open-source-toolkit/60355概述本项目展示了如何在STM32微控制器上集成W5500以太网控制器，实现了网络通信的基础，特别地，通过移植Ethernet相关驱动文件，结合NTP协议，实现了精确的RTC（实时时钟）对时功能。此外
什么是三高架构? java1234_小锋 java 架构 java 微服务
大家好，我是锋哥。今天分享关于【什么是三高架构?】面试题。希望对大家有帮助；什么是三高架构?1000道互联网大厂Java工程师精选面试题-Java资源分享网“三高架构”通常是指高可用性（HighAvailability）、高性能（HighPerformance）和高扩展性（HighScalability）架构。这三个特性是现代计算系统、尤其是在分布式系统和云计算架构中，设计和部署的关键目标。以下是
JavaWeb 开发入门：从基础到应用大梦百万秋知识学爆 java
JavaWeb是基于Java技术构建的Web应用开发体系。得益于Java的跨平台性和强大的生态系统，JavaWeb长期以来一直是企业级开发的首选方案之一。本篇博客将从JavaWeb的基本概念、核心技术到实际项目开发，带你全面了解如何利用JavaWeb构建一个动态网站。什么是JavaWeb？JavaWeb是使用Java技术开发Web应用程序的总称，通常包括动态网页、交互式功能和后端逻辑。它支持开发以
流量分析利器arkime的学习之路（二）---API接口胖哥王老师流量分析学习笔记网络协议学习 arkime API
前文回忆《流量分析利器arkime的学习之路（一）---安装部署》概述注意点Arkime对所有API调用都使用摘要身份验证，因此请确保在库或curl命令中启用摘要身份验证。学习如何进行API调用的最简单方法是打开浏览器的javascript控制台，观察ArkimeUI正在进行的调用，它使用所有相同的API。注意：许多API端点都需要一个数据库字段名称，这与您在搜索表达式中使用的名称不同。查看数据库
通过ssh连接debian 翻滚吧键盘 ssh debian 服务器
使用方法sshusername@ipaddress[inputpasswd]root用户默认无法由ssh连接，可以通过修改配置sudovim/etc/ssh/sshd_config去掉PermitRootLogin前的‘#’,并修改为PermitRootLoginyes重启sshd服务sudosystemctlrestartsshd参考https://linuxconfig.org/enable-
问题大集-02-vue ui 启动时Failed to get response from https://registry.npm.taobao.org/vue-cli-version-marker 会蹦的鱼 vue.js ui 前端
1、问题：Failedtogetresponsefromhttps://registry.npm.taobao.org/vue-cli-version-marker使用VueCLI的图形用户界面（GUI）时遇到这个错误，通常意味着VueCLI在尝试从指定的npm镜像（这里是淘宝的npm镜像https://registry.npm.taobao.org）获取某个包（这里是vue-cli-versio
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他