有多勉为其难

Java爬虫Jsoup的使用

Jsoup的使用

- 0. Jsoup介绍
- 1. Get请求
- 2. Post请求
- 3. 通过document获取元素
- 4. 练习Demo
- - 练习1
  - 练习2:获取所有图片
  - 练习3获取商品
  - 练习4 下载图片
- 5. @PostConstruct

0. Jsoup介绍

jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。

org.jsoup.Jsoup类

方法	描述
static Connection connect(String url)	创建并返回URL的连接。
static Document parse(File in, String charsetName)	将指定的字符集文件解析成文档。
static Document parse(String html)	将给定的html代码解析成文档。
static String clean(String bodyHtml, Whitelist whitelist)	从输入HTML返回安全的HTML，通过解析输入HTML并通过允许的标签和属性的白名单进行过滤。

org.jsoup.nodes.Document类

修饰符和类型	方法	描述
Connection	connection()	返回用于获取此文档的连接（请求/响应）对象（如果有）；否则，一个新的默认 Connection 对象。
Document	connection(Connection connection)	设置用于获取此文档的连接。

org.jsoup.nodes.Element类

修饰符和类型	方法	描述
Element	child(int index)	通过从 0 开始的索引号获取此元素的子元素。
int	childNodeSize()	获取该节点拥有的子节点数。
Elements	children()	获取此元素的子元素。
int	childrenSize()	获取此元素的子节点的数量。
String	className()	获取此元素的“类”属性的字面值，其中可能包含多个类名，以空格分隔。
Set	classNames()	获取所有元素的类名。
String	cssSelector()	获取将唯一选择此元素的 CSS 选择器。
String	data()	获取该元素的组合数据。
Elements	getAllElements()	查找此元素下的所有元素（包括 self 和 children 的 children）。
Element	getElementById(String id)	按 ID 查找元素，包括或在此元素下。
Elements	getElementsByAttribute(String key)	查找具有命名属性集的元素。
Elements	getElementsByAttributeStarting(String keyPrefix)	查找属性名称以提供的前缀开头的元素。
Elements	getElementsByAttributeValue(String key, String value)	查找具有特定值的属性的元素。
Elements	getElementsByAttributeValueContaining(String key, String match)	查找具有其值包含匹配字符串的属性的元素。
Elements	getElementsByAttributeValueEnding(String key, String valueSuffix)	查找具有以值后缀结尾的属性的元素。
Elements	getElementsByAttributeValueMatching(String key, String regex)	查找具有其值与提供的正则表达式匹配的属性的元素。
Elements	getElementsByAttributeValueMatching(String key, Pattern pattern)	查找具有其值与提供的正则表达式匹配的属性的元素。
Elements	getElementsByAttributeValueNot(String key, String value)	查找不具有此属性或具有不同值的元素。
Elements	getElementsByAttributeValueStarting(String key, String valuePrefix)	查找具有以值前缀开头的属性的元素。
Elements	getElementsByClass(String className)	查找具有此类的元素，包括或在此元素下。
Elements	getElementsByIndexEquals(int index)	查找兄弟索引等于提供的索引的元素。
Elements	getElementsByIndexGreaterThan(int index)	查找兄弟索引大于提供的索引的元素。
Elements	getElementsByIndexLessThan(int index)	查找同级索引小于提供的索引的元素。
Elements	getElementsByTag(String tagName)	查找具有指定标记名称的元素，包括并递归地在此元素下。
Elements	getElementsContainingOwnText(String searchText)	查找直接包含指定字符串的元素。
Elements	getElementsContainingText(String searchText)	查找包含指定字符串的元素。
Elements	getElementsMatchingOwnText(String regex)	查找其自身文本与提供的正则表达式匹配的元素。
Elements	getElementsMatchingOwnText(Pattern pattern)	查找其自身文本与提供的正则表达式匹配的元素。
Elements	getElementsMatchingText(String regex)	查找其文本与提供的正则表达式匹配的元素。
Elements	getElementsMatchingText(Pattern pattern)	查找其文本与提供的正则表达式匹配的元素。
Elements	select(String cssQuery)	查找与SelectorCSS 查询匹配的元素，并以该元素作为起始上下文。

1. Get请求


// 方式一
Document document = Jsoup.connect("http://www.baidu.com/").get();
// 方式二
Document parse = Jsoup.parse(new URL("http://www.baidu.com/"), 3000);//3秒

2. Post请求

Document doc = Jsoup.connect("http://example.com")
  .data("query", "Java")
  .userAgent("Mozilla")
  .cookie("auth", "token")
  .timeout(3000)
  .post();

3. 通过document获取元素

	getElementById(String id)：通过id来获取
　　getElementsByTag(String tagName)：通过标签名字来获取
　　getElementsByClass(String className)：通过类名来获取
　　getElementsByAttribute(String key)：通过属性名字来获取
　　getElementsByAttributeValue(String key, String value)：通过指定的属性名字，属性值来获取
　　getAllElements()：获取所有元素

4. 练习Demo

练习1

File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Elements links = doc.select("a[href]"); //带有href属性的a元素
Elements pngs = doc.select("img[src$=.png]");
  //扩展名为.png的图片

Element masthead = doc.select("div.masthead").first();
  //class等于masthead的div标签

Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素

练习2:获取所有图片

		Document documents = Jsoup.parse(new URL(url),3000);
        Elements images = document.select("img[src~=(?i)\\.(png|jpe?g|gif)]");
        for (Element image : images)
        {
            System.out.println("src : " + image.attr("src"));
            System.out.println("height : " + image.attr("height"));
            System.out.println("width : " + image.attr("width"));
            System.out.println("alt : " + image.attr("alt"));
        }

练习3获取商品

package test;

import entity.Commodity;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;
import java.net.URL;
import java.net.URLEncoder;
import java.nio.charset.StandardCharsets;
import java.util.ArrayList;
import java.util.List;

/**
 * 获取商品信息
 * @author 有多勉为其难
 * @version 1.0.0
 * @date 2022/9/6
 */
public class HtmlParseUtils {
    public static void main(String[] args) throws Exception {
        new HtmlParseUtils().getCommodity("鞋子", 10000).forEach(System.out::println);
    }

    private List<Commodity> getCommodity(String keyword, int timeout) throws IOException {
        //设置url编码
        String keywords = URLEncoder.encode(keyword,"utf-8");
        String url = "https://search.jd.com/Search?keyword="+keywords;

        Document document = Jsoup.parse(new URL(url), timeout);

        Element element = document.getElementById("J_goodsList");
        Elements liElements = element.getElementsByTag("li");
        List<Commodity> commodityList = new ArrayList<>();

        for (Element el : liElements) {
            String img = el.getElementsByTag("img").eq(0).attr("data-lazy-img").trim();
            String price = el.getElementsByClass("p-price").eq(0).text().trim();
            String name = el.getElementsByClass("p-name").eq(0).text().trim();
            Commodity commodity = new Commodity();
            commodity.setName(name);
            commodity.setImg(img);
            commodity.setPrice(price);
            commodityList.add(commodity);
        }
        return commodityList;
    }
}

package entity;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

/**
 * 商品实体类
 * @author 有多勉为其难
 * @version 1.0.0
 * @date 2022/9/6
 */
@Data
@NoArgsConstructor
@AllArgsConstructor
public class Commodity {
    private String name;
    private String img;
    private String price;
}

练习4 下载图片

package test;

import entity.Image;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import utils.DownloadUtils;

import java.io.IOException;
import java.net.URL;
import java.net.URLEncoder;
import java.util.ArrayList;
import java.util.List;

/**
 * 找到并下载图片
 *
 * @author 有多勉为其难
 * @date 2022/9/6
 */
public class DownloadImagesUtils {
    public static void main(String[] args) throws IOException {
        String url = "https://www.quanjing.com/creative/topic/1";
        downloadImage(url, "a");
    }

    private static void downloadImage(String url, String keyword) throws IOException {
        //设置url编码
        String keywords = URLEncoder.encode(keyword, "utf-8");
        Document doc = Jsoup.parse(new URL(url + keywords), 3000);
        Element element = doc.getElementById("gallery-list");
        Elements elements = element.getElementsByTag("li");
        List<Image> imageList = new ArrayList<>();
        List<String> urlList = new ArrayList<>();
        for (Element imgElement : elements) {
            String src = imgElement.getElementsByTag("img").eq(0).attr("src");
            String alt = imgElement.getElementsByTag("alt").eq(0).attr("alt");
            Image image = new Image();
            image.setAlt(alt);
            image.setSrc(src);
            imageList.add(image);
            urlList.add(src);
        }
        System.out.println(imageList);
        System.out.println(urlList);

        DownloadUtils.processSync(urlList, keyword);
    }
}

package utils;

import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.List;
import java.util.Objects;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;

/**
 * 图片下载工具类
 *
 * @author 有多勉为其难
 * @version 1.0.0
 * @date 2022/9/6
 */
public class DownloadUtils {
    private String extension = ".jpg";
    private String path;

    private static volatile AtomicInteger suc;
    private static volatile AtomicInteger fails;

    public DownloadUtils() {
        setPath("E:/pipeline/");
        suc = new AtomicInteger();
        fails = new AtomicInteger();
    }

    public void setPath(String path) {
        this.path = path;
    }

    /**
     * 下载
     *
     * @param url
     * @param cate
     * @throws Exception
     */
    private void downloadImg(String url, String cate, String name) throws Exception {
        String path = this.path + "/" + cate + "/";
        File dir = new File(path);
        if (!dir.exists()) {    // 目录不存在则创建目录
            dir.mkdirs();
        }
        // 获取扩展名
        String realExt = url.substring(url.lastIndexOf("."));
        String fileName = name + realExt;
        fileName = fileName.replace("-", "");
        String filePath = path + fileName;
        File img = new File(filePath);
        // 若文件之前已经下载过，则跳过
        if (img.exists()) {
            System.out.println(String.format("文件%s已存在本地目录", fileName));
            return;
        }

        URLConnection con = new URL(url).openConnection();
        con.setConnectTimeout(5000);
        con.setReadTimeout(5000);
        InputStream inputStream = con.getInputStream();
        byte[] bs = new byte[1024];

        File file = new File(filePath);
        FileOutputStream os = new FileOutputStream(file, true);
        // 开始读取 写入
        int len;
        while ((len = inputStream.read(bs)) != -1) {
            os.write(bs, 0, len);
        }
        System.out.println("picUrl: " + url);
        System.out.println(String.format("正在下载第%s张图片", suc.getAndIncrement()));
    }

    /**
     * 多线程处理
     *
     * @param data
     * @param word
     */
    public static void processSync(List<String> data, String word) {
        long start = System.currentTimeMillis();
        int count = 0;
        DownloadUtils downloadUtils = new DownloadUtils();
        // 创建缓存线程池
        /*
        优点：线程池会根据任务数量创建线程池，并且在一定时间内可以重复使用这些线程，产生相应的线程池。
        缺点：适用于短时间有大量任务的场景，它的缺点是可能会占用很多的资源。
        */
        ExecutorService executorService = Executors.newCachedThreadPool();
//        ThreadPoolExecutor executorService = new ThreadPoolExecutor(5, 10, 10, TimeUnit.SECONDS, new ArrayBlockingQueue<>(100));
        for (int i = 0; i < data.size(); i++) {
            String picUrl = data.get(i);
            if (picUrl == null) {
                continue;
            }
            String name = "";
            if (i < 10) {
                name = "000" + i;
            } else if (i < 100) {
                name = "00" + i;
            } else if (i < 1000) {
                name = "0" + i;
            }
            String finalName = name;

            executorService.execute(() -> {
                try {
                    downloadUtils.downloadImg(picUrl, word, finalName);
                } catch (Exception e) {
//                    e.printStackTrace();
                    DownloadUtils.fails.incrementAndGet();
                }
            });
            count++;
        }
        executorService.shutdown();
        try {
            if (!executorService.awaitTermination(60, TimeUnit.SECONDS)) {
                // 超时的时候向线程池中所有的线程发出中断(interrupted)。
                //                executorService.shutdownNow();
            }
            System.out.println("AwaitTermination Finished");
            System.out.println("共有URL: " + data.size());
            System.out.println("下载成功: " + suc);
            System.out.println("下载失败: " + fails);

            File dir = new File(downloadUtils.path + "/" + word + "/");
            int len = Objects.requireNonNull(dir.list()).length;
            System.out.println("当前共有文件： " + len);

            long end = System.currentTimeMillis();
            System.out.println("耗时：" + (end - start) / 1000.0 + "秒");
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

    }

}

5. @PostConstruct

@PostConstruct是Java自带的注解，在方法上加该注解会在项目启动的时候执行该方法，也可以理解为在spring容器初始化的时候执行该方法。

@SpringBootApplication
@ComponentScan(basePackages = {"com.my.spider"})
@MapperScan("com.my.spider.mapper")
public class MySpiderApplication {
    @Autowired
    private SpiderHandle spiderHandle;
    @Autowired
    private ContentNoticeHandle contentNoticeHandle;

    public static void main(String[] args) {
        SpringApplication.run(MySpiderApplication.class, args);
    }

    @PostConstruct
    public void task(){
        contentNoticeHandle.spiderData();
    }/*
    @PostConstruct
    public void task(){
        spiderHandle.spiderData();
    }
*/
}

JVM与Spring Boot核心解析 Java廖志伟 Java场景面试宝典 Java JVM Performance Optimization
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC 框架解析 Java廖志伟 Java场景面试宝典 Spring MVC Web Development Framework Java Web Applications
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC 架构解析 Java廖志伟 Java场景面试宝典 Spring MVC Web Development Java Frameworks
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
python爬虫正则表达式使用说明 yuwinter Python python 爬虫正则表达式
Python爬虫和正则表达式是自动化网络数据提取中常用的两种技术。本文将详细介绍如何使用Python编写爬虫，结合正则表达式提取网页中的数据。一、基础知识点1.安装必要库爬虫通常需要使用库来处理HTTP请求和解析网页，常用库有：requests：用于发送HTTP请求，获取网页内容。re：Python自带的正则表达式库，用于模式匹配和提取数据。BeautifulSoup（可选）：如果你需要更高级的网
web与Java代码保护：混淆、压缩及反编译工具详解
本文还有配套的精品资源，点击获取简介：为保障代码的安全性和保密性，IT行业中开发者采用代码混淆和压缩技术。本文将深入探讨web代码混淆压缩工具和Java代码反编译工具，解释它们的工作原理及应用。混淆工具如UglifyJS和Terser用于混淆JavaScript代码，使其难以理解；压缩工具如YUICompressor和GoogleClosureCompiler减小JavaScript和CSS文件的
nvm:NodeJs版本管理工具下载安装与使用教程天天打码大前端 javascript node.js vue.js
nvm是什么nvm是一个node的版本管理工具，可以简单操作node版本的切换、安装、查看。。。等等，与npm不同的是，npm是依赖包的管理工具。nvm特点node：是一个基于ChromeV8引擎的JS运行环境。npm：是node.js默认的包管理系统（用JavaScript编写的），在安装的node的时候，npm也会跟着一起安装，管理node中的第三方插件。nvm：node版本管理器，也就是说：
深入理解 JavaScript/TypeScript 中的展开运算符（...） ttod_qzstudio TypeScript JavaScript javascript typescript 开发语言
在JavaScript和TypeScript中，...运算符（称为展开运算符，英文SpreadOperator）是一个非常强大且常用的语法。它可以让代码更简洁、更灵活，适用于数组、对象、函数参数等多种场景。本文将详细介绍它的用法，并通过示例帮助你彻底掌握它。1.什么是展开运算符（...）？展开运算符...允许将一个可迭代对象（如数组、字符串、Set、Map等）“展开”成独立的元素。它的核心作用是解
数据库sql转Java实体类大诚子工作记录 java sql 实体类
//功能不是很完善,自动生成以后,没有转换成小驼峰格式,待完善......packagecom.bookingctrip.api.manual.utils;importjava.io.File;importjava.io.FileWriter;importjava.io.IOException;importjava.io.PrintWriter;importjava.sql.Connection;
（转）java.sql包介绍
数据库连接包：实现JDBC的类库；DriverManager类此类用于装载驱动程序，它所有的成员都是静态成员，所以在程序中无须对它进行实例化，直接通过类名就可以访问它。DriverManager类是JDBC的管理层，作用于用户和驱动程序间加载驱动程序Class.forName(“公司名.数据库名.驱动程序名”)如：Class.forName(“sun.jdbc.odbc.jdbcOdbcDrive
开发效率翻倍！一键将 JSON 转换成 Java 实体类的神器来了！ A__tao java
开发效率翻倍！一键将JSON转换成Java实体类的神器来了！在开发Java后端接口时，你是否常常面对这样的烦恼：拿到前端传来的JSON，字段多到眼花缭乱手动敲JavaBean，字段写漏、类型搞错嵌套结构太复杂，写起来痛苦又低效别担心，这些问题通通可以交给它来解决：JSON转Java实体类在线工具为什么推荐这个工具？这个工具由资深开发者打造，功能聚焦于一件事：把你的JSON一键生成JavaBean，
探究 Java SPI 原理与实战_打造高扩展性的应用架构随风九天 java java 架构开发语言 Java SPI
1.引言1.1为什么需要模块化与扩展性设计在大型软件系统中，良好的架构设计是至关重要的。模块化和可扩展性设计使得我们能够：将功能划分为独立的模块；在不修改原有代码的前提下引入新功能；实现松耦合、高内聚的设计目标。Java提供了多种机制来支持这种设计，其中SPI（ServiceProviderInterface）是一种轻量级的服务发现机制，广泛用于构建插件化系统。1.2Java中的常见扩展机制概述扩
一键将 SQL 转为 Java 实体类，全面支持 MySQL / PostgreSQL / Oracle！ A__tao sql java mysql
一键将SQL表结构转为Java实体类，全面支持MySQL/PostgreSQL/Oracle！还在手动根据SQL表结构去写Java实体类？字段一个个敲、类型一个个改、注释一个个补，既浪费时间又容易出错！现在，一款强大而简洁的开发神器来了：SQL转Java实体类在线工具（支持MySQL、PostgreSQL、Oracle）适用人群Java后端开发工程师数据库表结构设计者ORM模型搭建者（如Hiber
MySQL(118)如何使用SSL进行加密连接？
使用SSL进行加密连接可以有效地保护数据在传输过程中的安全性，防止数据被窃取或篡改。下面我们将详细介绍如何在Java应用中使用SSL与MySQL数据库建立加密连接。一.准备工作在开始之前，请确保你已经安装了MySQL，并且有Java开发环境（如JDK和Maven）。二.生成SSL证书生成自签名证书：你可以使用OpenSSL工具来生成自签名证书。以下是生成CA证书、服务器证书和客户端证书的步骤。#生
Spring for kafka系列——1、快速浏览虾条_花吹雪 Spring for Apache Kafka Spring kafka
先决条件：您必须安装并运行ApacheKafka。然后，您必须将SpringforApacheKafka（SpringKafka）JAR及其所有依赖项放在类路径上。最简单的方法是在构建工具中声明依赖关系。如果您没有使用SpringBoot，请在项目中将Springkafka-jar声明为依赖项。org.springframework.kafkaspring-kafka3.3.7使用SpringBo
6，Receiving Messages：@KafkaListener Annotation
@KafkaListener注释用于将bean方法指定为侦听器容器的侦听器。bean被包装在一个配置了各种功能的MessagingMessageListenerAdapter中，例如在必要时转换数据以匹配方法参数的转换器。您可以使用#{…}或属性占位符（${…}）使用SpEL配置注释上的大多数属性。有关更多信息，请参阅Javadoc。RecordListeners@KafkaListener注释为
Spring Boot与MyBatisPlus集成实践：数据库操作简易化
本文还有配套的精品资源，点击获取简介：本项目"mybatisplus-01.zip"旨在探讨如何将SpringBoot与MyBatisPlus集成，以创建高效和便捷的数据库操作应用。MyBatisPlus是MyBatis的增强版，简化了SQL操作并提供了更多功能。SpringBoot则是一个用于快速开发微服务的框架，它预设了许多配置，减少了初始化项目和编写配置文件的工作。本项目详细介绍了Sprin
Android音视频通话
Android音视频通话前言一、准备工作1、编写Jni接口2、通过javah工具生成头文件3、集成speex、webrtc二、初始化工作三、开启socketudp服务四、判断socket是否可读五、发送数据到远端1、视频数据1.1、初始化MediaCodec1.2、通过MediaCodec进行H264编码2、音频数据2.1、webrtc消回声2.2、speex编码压缩六、断开连接前言Android
Java NIO 核心知识总结
NIO简介在传统的JavaI/O模型（BIO）中，I/O操作是以阻塞的方式进行的。也就是说，当一个线程执行一个I/O操作时，它会被阻塞直到操作完成。这种阻塞模型在处理多个并发连接时可能会导致性能瓶颈，因为需要为每个连接创建一个线程，而线程的创建和切换都是有开销的。为了解决这个问题，在Java1.4版本引入了一种新的I/O模型—NIO（NewIO，也称为Non-blockingIO）。NIO弥补了同
java毕业设计图书馆座位预约管理系统维修端源码+lw文档+mybatis+系统+mysql数据库+调试木林网络 mybatis java 数据库
java毕业设计图书馆座位预约管理系统维修端源码+lw文档+mybatis+系统+mysql数据库+调试java毕业设计图书馆座位预约管理系统维修端源码+lw文档+mybatis+系统+mysql数据库+调试本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、
基于JAVA的酒店管理系统的设计与实现代论文网课招代理前端 javascript 开发语言网络数据库
目录绪论3第一章课题研究途径与意义51.1本课题研究途径51.2本课题研究意义6第二章酒店管理系统分析72.1背景介绍72.2现实需求分析81)酒店首页介绍模块92)顾客注册登录模块93)信息查询模块104)预订管理模块105)管理员登录模块106)超级管理员登录模块107)房间信息模块102.3系统环境需求101)系统采用Windows操作系统下MyEclipse开发平台开发；102)程序设计语
MyBatis-Plus：赋能 Java 持久层开发的高效利器 Liudef06小白 mybatis java 服务器
MyBatis-Plus：赋能Java持久层开发的高效利器在现代企业级Java应用开发中，持久层框架扮演着至关重要的角色。MyBatis作为一款优秀的半自动ORM框架，凭借其灵活性与强大SQL控制能力深受开发者喜爱。然而，其相对繁琐的基础CRUD操作配置，催生了强大的增强工具——MyBatis-Plus(MP)。本文将深入探讨MyBatis-Plus的核心特性、应用实践、最佳实践及其在提升开发效率
python笔记-Selenium谷歌浏览器驱动下载 hero.zhong python 笔记 selenium
Selenium谷歌浏览器驱动下载地址：https://googlechromelabs.github.io/chrome-for-testing/#stable下面是遇到的问题：python网络爬虫技术中使用谷歌浏览器代码，报错：OSError:[WinError193]%1不是有效的Win32应用程序：遇到错误OSError:[WinError193]%1不是有效的Win32应用程序通常意味着
面向对象与面向过程程序设计语言：核心概念、对比分析与应用指南咸鱼_要_翻身 C++C Python 开发语言
目录一、面向过程程序设计语言(ProceduralProgramming)1、基本概念2、主要特点3、代表语言4、典型示例(C语言)5、优势6、局限性二、面向对象程序设计语言(Object-OrientedProgramming)1、基本概念2、四大核心特性3、代表语言4、典型示例(Java)5、优势6、局限性三、主要区别对比四、实际应用选择建议五、现代语言趋势一、面向过程程序设计语言(Proce
Elasticsearch 启动失败？从日志分析到最终解决（磁盘空间不足案例） Leaton Lee elasticsearch 大数据搜索引擎
问题背景最近在本地运行一个SpringBoot项目时，突然遇到Elasticsearch(ES)连接超时的问题：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'awardController':Unsatisfieddependencyexpressedthroug
Spring Boot分层架构详解：从Controller到Service再到Mapper的完整流程 Leaton Lee spring boot 架构后端 java
引言：为什么学习SpringBoot分层架构？在现代企业级应用开发中，分层架构是至关重要的。它不仅提高了代码的可维护性，还使得团队协作更加高效。SpringBoot作为Java后端开发的事实标准，其分层架构模式几乎贯穿了所有企业级应用的开发流程。本文将以一个实际案例（用户管理系统）为例，详细解析SpringBoot中Controller、POJO、Mapper、Service、ServiceImp
详解Binlog 和 Redo Log的区别和底层逻辑
引言：为什么你的数据库会“分身术”？想象这样一个场景：你的Java应用突然崩溃，重启后发现数据丢失了一半。这时，你会想起数据库的“时光机”——Binlog，或者它的“安全网”——RedoLog？Binlog（BinaryLog）Binlog是MySQL数据库中的一种日志文件，用于记录所有对数据库执行的数据修改操作（如INSERT、UPDATE、DELETE等）。它以二进制的形式存储，主要用于数据复
Python办公—Excel嵌入图片提取&重命名(包含重复图片) 小庄-Python办公 Python办公自动化 python excel Excel图片获取 Excel批量获取嵌入图片 Excel嵌入图片
目录专栏导读背景解决方案1、背景介绍2、库的介绍①：openpyxl3、库的安装4、核心代码5、完整代码总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础专栏：请点击—
java从服务器EXECL文件下载三思的韦小宝 java 服务器开发语言运维
Java从服务器下载Excel文件的实现在现代软件开发中，经常需要与服务器进行数据交互，其中一种常见的场景是从服务器下载Excel文件。本文将介绍如何在Java中实现从服务器下载Excel文件，并展示相关的代码示例。为什么需要从服务器下载Excel文件Excel文件是一种广泛使用的电子表格格式，它能够存储大量的数据和公式。在企业应用中，经常需要将数据以Excel的形式进行存储和传输。然而，由于Ex
如何防止SpringBoot上传大体积Excel导致内存溢出的思考
SpringBoot上传大体积Excel：防止内存溢出的策略与实践问题背景与原因分析在SpringBoot应用中处理大体积Excel文件时，内存溢出是一个常见的问题。当一个大型的Excel文件被读取时，如果使用传统的读取方式（如一次性加载整个文件到内存），可能会消耗大量的内存资源，尤其是在服务器资源有限的情况下，很容易触发Java堆内存溢出（OutOfMemoryError）。这不仅会导致应用崩溃
SpringBoot服务端在处理大文件Excel任务时的设计 Ceramist spring boot 后端 java
SpringBoot服务端处理大文件Excel任务的设计在构建SpringBoot应用时，处理大文件，尤其是大体积的Excel文件，是一项挑战性的任务。这不仅涉及到数据的高效读取，还需要考虑系统的稳定性、用户体验以及任务的状态跟踪。本篇文章将详细探讨如何设计一个高效、稳定的SpringBoot服务端，以处理大文件Excel任务，涵盖异步处理、状态设计和分步骤响应用户等关键方面。异步处理设计异步处理
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开