丿BAIKAL巛

Java爬虫-使用jsoup爬取数据入门案例（爬取豆瓣电影Top250数据）

有需要用到jsoup来获取数据，因为之前没有用过，所以就想写一个入门案例来巩固一下，这个案例的功能是爬取豆瓣电影Top250的电影数据（电影名称，简介，评分，评价等），并且将数据存到Excel表格中。
这是豆瓣电影Top250的网址，https://movie.douban.com/top250?start=0

文章目录

- 一、前置工作
- - 1.1 技术介绍
  - - Jsoup
    - Apache POI
  - 1.2 依赖导入
  - - Jsoup入门demo
    - Jsoup常用API了解
- 二、代码逻辑分析
- 三、代码的编写
- - 爬虫部分代码：
  - 将集合插入excel表格代码：
  - 电影实体类：
- 四、附录（完整的可以直接运行的代码）

一、前置工作

用到的技术有jsoup和apche poi
jsoup用来获取数据，apche poi用来将获取到的数据存入Excel表格

1.1 技术介绍

Jsoup

Jsoup 是一个用于解析、提取和操作 HTML 文档的 Java 库。它提供了简单且易于使用的 API，使您能够轻松地从 HTML 页面中提取数据。
Jsoup 可以加载 HTML 文档并将其解析为文档对象模型（DOM），能够轻松地遍历和操作文档中的元素和内容。

Apache POI

Apache POI 是一个用于操作 Microsoft Office 格式文件（如 Word 文档、Excel 表格和 PowerPoint 演示文稿）的 Java 库。它提供了一组丰富的 API，使得在 Java 程序中读取、写入和修改 Office 文件变得简单和方便。

1.2 依赖导入


        <dependency>
            <groupId>org.jsoupgroupId>
            <artifactId>jsoupartifactId>
            <version>1.14.1version>
        dependency>


        <dependency>
            <groupId>org.apache.poigroupId>
            <artifactId>poiartifactId>
            <version>5.0.0version>
        dependency>

        <dependency>
            <groupId>org.apache.poigroupId>
            <artifactId>poi-ooxmlartifactId>
            <version>5.0.0version>
        dependency>

Jsoup入门demo

说这么多作用不大，我们直接来实操一下就能明白了。
下面是一个jsoup入门的demo，只需要把jsoup相关的依赖导入即可开始使用。
这个Demo的功能是，获取百度网站的标题：百度一下，你就知道

package com.example;

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import java.io.IOException;

public class Test5 {
    public static void main(String[] args) throws IOException {
        Connection connection = Jsoup.connect("https://www.baidu.com/")
                //这里可以加各种请求头，来模拟真实的请求（根据自己的真实请求来加）
                .header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36")
                .method(Connection.Method.GET);
        Document doc = connection.get();
        //获取标题元素
        Element title = doc.select("head").select("title").first();
        System.out.println(title);
        //获取元素内容
        String titleName = title.text();
        System.out.println(titleName);
    }
}

Jsoup常用API了解

Jsoup 提供了许多常用的 API，使您能够解析、操作和提取 HTML 文档中的数据。以下是一些常用的 Jsoup API：

连接到 URL：使用 connect(String url) 方法可以建立与指定 URL 的连接。例如：

Connection connection = Jsoup.connect("http://www.example.com");

获取文档对象：使用 get() 方法可以获取连接的 URL 对应的文档对象。例如：

Document doc = Jsoup.connect("http://www.example.com").get();

解析 HTML 字符串：使用 parse(String html) 方法可以将 HTML 字符串解析为文档对象。例如：

String html = "Hello, Jsoup!
";
Document doc = Jsoup.parse(html);

选择器：使用选择器可以选择和查找文档中的元素。以下是一些常用的选择器方法：

getElementById(String id): 通过元素的 ID 获取元素。
getElementsByTag(String tagName): 通过标签名获取元素。
getElementsByClass(String className): 通过类名获取元素。
select(String cssQuery): 使用 CSS 选择器选择元素。

例如：

Element element = doc.getElementById("myElement");
Elements elements = doc.getElementsByTag("a");
Elements elements = doc.getElementsByClass("myClass");
Elements elements = doc.select("div.container > p");

元素操作：通过选取元素后，可以进行各种操作，如获取元素的文本内容、属性值、链接、图像地址等。一些常用的方法包括：

text(): 获取元素的文本内容。
attr(String attributeKey): 获取元素指定属性的值。
absUrl(String attributeKey): 获取元素指定属性的绝对路径 URL。

例如：

String text = element.text();
String href = element.attr("href");
String imgUrl = element.absUrl("src");

HTML 清理：使用 clean(String bodyHtml) 方法可以清理 HTML 内容并生成干净和规范的 HTML。例如：

String html = "Hello Jsoup!
";
String cleanHtml = Jsoup.clean(html, Whitelist.basic());

重点关注一下选择器的内容：
选择器是 Jsoup 中非常强大和灵活的功能，它允许您使用类似于 CSS 选择器的语法来选择和查找 HTML 文档中的元素。通过使用选择器，您可以根据元素的标签名、类名、ID、属性等进行定位和筛选。

以下是一些常用的选择器示例：

标签选择器：
使用标签选择器可以选择指定标签名的元素。例如，选择所有的元素：

Elements elements = doc.select("a");

类选择器：
使用类选择器可以选择具有指定类名的元素。例如，选择所有具有 “myClass” 类的元素：

Elements elements = doc.select(".myClass");

ID 选择器：
使用 ID 选择器可以选择具有指定 ID 的元素。例如，选择具有 “myElement” ID 的元素：

Element element = doc.select("#myElement").first();

属性选择器：
使用属性选择器可以根据元素的属性值来选择元素。例如，选择具有 “href” 属性的元素：

Elements elements = doc.select("a[href]");

属性值选择器：
使用属性值选择器可以根据元素的属性值的匹配规则选择元素。例如，选择所有具有 “example.com” 域名的链接：

Elements elements = doc.select("a[href^=http://www.example.com]");

子元素选择器：
使用子元素选择器可以选择某个元素的直接子元素。例如，选择
元素下的所有
元素：

Elements elements = doc.select("div > p");

后代元素选择器：
使用后代元素选择器可以选择某个元素的所有后代元素。例如，选择
元素内的所有
元素：

Elements elements = doc.select("div p");

过滤器方法：
除了基本的选择器语法外，Jsoup 还提供了一些过滤器方法，可以根据特定的条件对元素进行进一步筛选和过滤。例如，根据元素的索引值选择第一个元素：

Element element = doc.select("a").first();

二、代码逻辑分析

我们知道，像页面中是有很多标签的，我们需要从这些标签中分析并取到自己想要的内容。
jsoup中是提供了api来调用取这些元素跟内容的，我们只需要分析页面标签的层级，一层一层去取自己想要的内容就可以了（关于这个案例，可以直接去代码中调试，很容易就能看明白了，使用文字反而不好讲清楚），这个过程类似于dom文档解析。
这里我们可以看到直接取到了25个电影的详情标签元素了，接下来就分析拿数据就可以了。

代码是比较简单的，重要的是分析过程，过程会分析了，就能爬取任何想要的内容了。
我以豆瓣top250电影为例来进行分析：

https://movie.douban.com/top250

我们可以看到这里是标题，下面就是内容列表了

分析方法：
1、直接按F12打开开发者模式，点击这个元素选择，直接在页面上选取你想获取到的内容，就可以看到他在标签中的位置了。
然后就是通过一层一层的标签选择，取到某一个element，然后获取他里面的内容。

2、我们看到的只是当前页面的东西，当前是第1页，那么我们该如何获取所有页，比如10页，100页的全部内容呢？
这时候就需要分析跳转下一页时，当前网站的url变化了
我们可以看到第一页start=0，第二页start=25，因为一页有25条内容，所以每次多25
到这里我们就知道了，获取完当前页内容后，让这个start这个参数的值+25，放到下一次请求的url中就可以了。

三、代码的编写

爬虫部分代码：

public class FinalMovie {


        public static void main(String[] args) throws IOException, ParseException, InterruptedException {
        int num=0;
        String url="https://movie.douban.com/top250?start=";
        //循环获取10页的全部内容
        for (int i = 0; i < 10; i++) {
            getMovie(url+num);
            //睡眠两秒
            Thread.sleep(2000);
            num=num+25;

        }
    }

    /**
     * 获取豆瓣top250电影信息
     * @param url 目标网站网址
     * @throws IOException
     * @throws ParseException
     */
    private static void getMovie(String url) throws IOException, ParseException {
        Connection connection = Jsoup.connect(url)
                //真实的User-Agent
                .header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36")
                .method(Connection.Method.GET);
        Document doc = connection.get();
        //取id为content下面的h1
        Elements select = doc.select("#content > h1");
        String title = select.text();
        //System.out.println(title);
        Elements ol = doc.select("div.article > ol");
        //System.out.println(ol);
        //遍历 ol 中的每个  标签
        List<Movie> movieList=new ArrayList<Movie>();
        for (Element li : ol) {

            //取li标签下的所有
            Elements infos = li.select("div.item").select("div.info");
            //System.out.println(info);
            for (Element info : infos) {
                Movie movie=new Movie();
                //ArrayList nameList=new ArrayList();
                //取所有的div class=hd
                Elements hds = info.select("div.hd");
                //往里进一层，取hd中的a
                Elements as = hds.select("a[href]");
                for (Element a : as) {
                    Element element = a.selectFirst("span.title");
                    String name = element.text();
                    //System.out.println(name);
                    movie.setMovieName(name);
                    //nameList.add(name);
                }
                //取所有的div class=bd
                Elements bds = info.select("div.bd");
                for (Element bd : bds) {
                    Element p = bd.selectFirst("p");
                    String text = p.text();
                    movie.setMovieIntroduce(text);
                    //System.out.println(p);
                    Elements stars = bd.select("div.star");
                    for (Element star : stars) {
                        Element child = star.child(1);
                        //System.out.println(child);
                        String text1 = child.text();
                        movie.setMovieStar(text1);
                    }
                    Element p1 = bd.select("p").last();
                    //System.out.println(p1);
                    String text1 = p1.text();
                    movie.setMovieEvaluate(text1);
                }
                //System.out.println(movie.toString());
                movieList.add(movie);
            }

        }
        for (Movie movie : movieList) {
            System.out.println(movie);
        }
        //将数据写入到excel表中
        writeDataToExcel(movieList,"moviesData.xlsx",true);
        System.out.println("15条数据写入excel成功");
    }
}

将集合插入excel表格代码：

/**
     * 将集合数据写入到Excel中
     * @param dataList 数据集合
     * @param outputPath 输出路径
     * @param append 是否追加数据，true为追加，false为覆盖
     * @throws IOException
     */
    public static void writeDataToExcel(List<?> dataList, String outputPath, boolean append) throws IOException {
        Workbook workbook;
        if (append && new File(outputPath).exists()) {
            workbook = WorkbookFactory.create(new FileInputStream(outputPath));
        } else {
            workbook = new XSSFWorkbook();
        }

        Sheet sheet = workbook.getSheet("Sheet1");
        if (sheet == null) {
            sheet = workbook.createSheet("Sheet1");
        }

        // 获取当前已有数据的最后一行索引
        int lastRow = sheet.getLastRowNum();

        // 创建表头（仅当需要创建新的表格时）
        if (lastRow == 0) {
            Row headerRow = sheet.createRow(0);
            Object firstData = dataList.get(0);
            List<String> propertiesList = getObjectPropertiesList(firstData);
            for (int i = 0; i < propertiesList.size(); i++) {
                Cell cell = headerRow.createCell(i);
                cell.setCellValue(propertiesList.get(i));
            }
        }

        int rowCount = lastRow + 1;

        // 写入数据
        for (Object data : dataList) {
            Row dataRow = sheet.createRow(rowCount++);

            int colCount = 0;
            List<String> propertiesList = getObjectPropertiesList(data);
            for (String property : propertiesList) {
                Cell cell = dataRow.createCell(colCount++);
                Object value = getObjectPropertyValue(data, property);

                if (value != null) {
                    if (value instanceof String) {
                        cell.setCellValue((String) value);
                    } else if (value instanceof Number) {
                        cell.setCellValue(((Number) value).doubleValue());
                    } else if (value instanceof Date) {
                        SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd");
                        cell.setCellValue(dateFormat.format((Date) value));
                    }
                    // 根据需要添加其他数据类型的处理逻辑
                }
            }
        }

        FileOutputStream outputStream = new FileOutputStream(outputPath);
        workbook.write(outputStream);
        workbook.close();
        outputStream.close();
    }

    /**
     * 获取对象的属性列表
     * @param object 对象
     * @return 属性列表
     */
    private static List<String> getObjectPropertiesList(Object object) {
        List<String> propertiesList = new ArrayList<>();
        Field[] fields = object.getClass().getDeclaredFields();
        for (Field field : fields) {
            propertiesList.add(field.getName());
        }
        return propertiesList;
    }

    /**
     * 获取对象的属性值
     * @param object 对象
     * @param property 属性名
     * @return 属性值
     */
    private static Object getObjectPropertyValue(Object object, String property) {
        try {
            Field field = object.getClass().getDeclaredField(property);
            field.setAccessible(true);
            return field.get(object);
        } catch (NoSuchFieldException e) {
            e.printStackTrace();
        } catch (IllegalAccessException e) {
            e.printStackTrace();
        }
        return null;
    }

电影实体类：

（这里我为了方便就简单的都设置成了string类型）

package com.example.domain;

import java.util.Arrays;
import java.util.Date;
import java.util.List;

public class Movie {
    //电影名称
    private String movieName;
    //电影介绍
    private String movieIntroduce;
    //电影评分
    private String movieStar;
    //电影评价
    private String movieEvaluate;

    public Movie() {
    }

    public Movie(String movieName, String movieIntroduce, String movieStar, String movieEvaluate) {
        this.movieName = movieName;
        this.movieIntroduce = movieIntroduce;
        this.movieStar = movieStar;
        this.movieEvaluate = movieEvaluate;
    }

    @Override
    public String toString() {
        return "Movie{" +
                "movieName='" + movieName + '\'' +
                ", movieIntroduce='" + movieIntroduce + '\'' +
                ", movieStar='" + movieStar + '\'' +
                ", movieEvaluate='" + movieEvaluate + '\'' +
                '}';
    }

    public String getMovieName() {
        return movieName;
    }

    public void setMovieName(String movieName) {
        this.movieName = movieName;
    }

    public String getMovieIntroduce() {
        return movieIntroduce;
    }

    public void setMovieIntroduce(String movieIntroduce) {
        this.movieIntroduce = movieIntroduce;
    }

    public String getMovieStar() {
        return movieStar;
    }

    public void setMovieStar(String movieStar) {
        this.movieStar = movieStar;
    }

    public String getMovieEvaluate() {
        return movieEvaluate;
    }

    public void setMovieEvaluate(String movieEvaluate) {
        this.movieEvaluate = movieEvaluate;
    }


}

错误写法：
String text = hd.select(“a[href]”).select(“span.title”).text();
System.out.println(text);
这样就会把所有电影名称放到一块进行输出，就像这样：

四、附录（完整的可以直接运行的代码）

把实体类粘进去即可。

package com.example;

import com.example.domain.Movie;
import com.example.domain.Product;
import org.apache.poi.ss.usermodel.*;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.lang.reflect.Field;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;

public class FinalMovie {


    public static void main(String[] args) throws IOException, ParseException, InterruptedException {
        int num=0;
        String url="https://movie.douban.com/top250?start=";
        //循环获取10页的全部内容
        for (int i = 0; i < 10; i++) {
            getMovie(url+num);
            //睡眠两秒
            Thread.sleep(2000);
            num=num+25;

        }
    }

    /**
     * 获取豆瓣top250电影信息
     * @param url 目标网站网址
     * @throws IOException
     * @throws ParseException
     */
    private static void getMovie(String url) throws IOException, ParseException {
        Connection connection = Jsoup.connect(url)
                //真实的User-Agent
                .header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36")
                .method(Connection.Method.GET);
        Document doc = connection.get();
        //取id为content下面的h1
        Elements select = doc.select("#content > h1");
        String title = select.text();
        //System.out.println(title);
        Elements ol = doc.select("div.article > ol");
        //System.out.println(ol);
        //遍历 ol 中的每个  标签
        List<Movie> movieList=new ArrayList<Movie>();
        for (Element li : ol) {

            //取li标签下的所有
            Elements infos = li.select("div.item").select("div.info");
            //System.out.println(info);
            for (Element info : infos) {
                Movie movie=new Movie();
                //ArrayList nameList=new ArrayList();
                //取所有的div class=hd
                Elements hds = info.select("div.hd");
                //往里进一层，取hd中的a
                Elements as = hds.select("a[href]");
                for (Element a : as) {
                    Element element = a.selectFirst("span.title");
                    String name = element.text();
                    //System.out.println(name);
                    movie.setMovieName(name);
                    //nameList.add(name);
                }
                //取所有的div class=bd
                Elements bds = info.select("div.bd");
                for (Element bd : bds) {
                    Element p = bd.selectFirst("p");
                    String text = p.text();
                    movie.setMovieIntroduce(text);
                    //System.out.println(p);
                    Elements stars = bd.select("div.star");
                    for (Element star : stars) {
                        Element child = star.child(1);
                        //System.out.println(child);
                        String text1 = child.text();
                        movie.setMovieStar(text1);
                    }
                    Element p1 = bd.select("p").last();
                    //System.out.println(p1);
                    String text1 = p1.text();
                    movie.setMovieEvaluate(text1);
                }
                //System.out.println(movie.toString());
                movieList.add(movie);
            }

        }
        for (Movie movie : movieList) {
            System.out.println(movie);
        }
        //将数据写入到excel表中
        writeDataToExcel(movieList,"moviesData2.xlsx",true);
        System.out.println("15条数据写入excel成功");
    }

    /**
     * 将集合数据写入到Excel中
     * @param dataList 数据集合
     * @param outputPath 输出路径
     * @param append 是否追加数据，true为追加，false为覆盖
     * @throws IOException
     */
    public static void writeDataToExcel(List<?> dataList, String outputPath, boolean append) throws IOException {
        Workbook workbook;
        if (append && new File(outputPath).exists()) {
            workbook = WorkbookFactory.create(new FileInputStream(outputPath));
        } else {
            workbook = new XSSFWorkbook();
        }

        Sheet sheet = workbook.getSheet("Sheet1");
        if (sheet == null) {
            sheet = workbook.createSheet("Sheet1");
        }

        // 获取当前已有数据的最后一行索引
        int lastRow = sheet.getLastRowNum();

        // 创建表头（仅当需要创建新的表格时）
        if (lastRow == 0) {
            Row headerRow = sheet.createRow(0);
            Object firstData = dataList.get(0);
            List<String> propertiesList = getObjectPropertiesList(firstData);
            for (int i = 0; i < propertiesList.size(); i++) {
                Cell cell = headerRow.createCell(i);
                cell.setCellValue(propertiesList.get(i));
            }
        }

        int rowCount = lastRow + 1;

        // 写入数据
        for (Object data : dataList) {
            Row dataRow = sheet.createRow(rowCount++);

            int colCount = 0;
            List<String> propertiesList = getObjectPropertiesList(data);
            for (String property : propertiesList) {
                Cell cell = dataRow.createCell(colCount++);
                Object value = getObjectPropertyValue(data, property);

                if (value != null) {
                    if (value instanceof String) {
                        cell.setCellValue((String) value);
                    } else if (value instanceof Number) {
                        cell.setCellValue(((Number) value).doubleValue());
                    } else if (value instanceof Date) {
                        SimpleDateFormat dateFormat = new SimpleDateFormat("yyyy-MM-dd");
                        cell.setCellValue(dateFormat.format((Date) value));
                    }
                    // 根据需要添加其他数据类型的处理逻辑
                }
            }
        }

        FileOutputStream outputStream = new FileOutputStream(outputPath);
        workbook.write(outputStream);
        workbook.close();
        outputStream.close();
    }

    /**
     * 获取对象的属性列表
     * @param object 对象
     * @return 属性列表
     */
    private static List<String> getObjectPropertiesList(Object object) {
        List<String> propertiesList = new ArrayList<>();
        Field[] fields = object.getClass().getDeclaredFields();
        for (Field field : fields) {
            propertiesList.add(field.getName());
        }
        return propertiesList;
    }

    /**
     * 获取对象的属性值
     * @param object 对象
     * @param property 属性名
     * @return 属性值
     */
    private static Object getObjectPropertyValue(Object object, String property) {
        try {
            Field field = object.getClass().getDeclaredField(property);
            field.setAccessible(true);
            return field.get(object);
        } catch (NoSuchFieldException e) {
            e.printStackTrace();
        } catch (IllegalAccessException e) {
            e.printStackTrace();
        }
        return null;
    }

}

你可能感兴趣的:(#,Java爬虫,java,爬虫,开发语言)

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
JAVA 高频八股文 Day03 Conqueror675 java 开发语言
12.TCP和Http的区别是什么TCP是传输层协议，负责建立可靠的点对点连接，确保数据有序、完整地传输（如铁路轨道）；HTTP是应用层协议，基于TCP构建，定义了Web服务交互的报文格式和规则（如货运订单）。TCP关注数据如何可靠送达，通过三次握手建立连接、流量控制等机制保证传输；HTTP关注传输内容的意义，提供请求/响应语义（GET/POST等）和无状态通信。补充：说一下什么是三次握手四次挥手
Python 爬虫实战：视频平台播放量实时监控（含反爬对抗与数据趋势预测）西攻城狮北 python 爬虫音视频
一、引言在数字内容蓬勃发展的当下，视频平台的播放量数据已成为内容创作者、营销人员以及行业分析师手中极为关键的情报资源。它不仅能够实时反映内容的受欢迎程度，更能在竞争分析、营销策略制定以及内容优化等方面发挥不可估量的作用。然而，视频平台为了保护自身数据和用户隐私，往往会设置一系列反爬虫机制，对数据爬取行为进行限制。这就向我们发起了挑战：如何巧妙地突破这些限制，同时精准地捕捉并预测播放量的动态变化趋势
JVM字节码加载与存储中的细节
问题引出：为什么Java定义int型变量为32767时使用的是bipush32767，而定义int型变量为32768时使用的是ldc#4？在Java中，如果这样定义int型变量：publicclassTest{publicstaticvoidmain(String[]args){inti=0;intj=5;intk=6;intm=32768;intn=32767;}}变量对应的字节码文件内容是这样
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
Java中的Tomcat，开启Web应用腾飞【基础版】
目录一、Tomcat初登场：揭开神秘面纱（一）啥是Tomcat（二）为啥要有Tomcat二、Tomcat的安装与启动：开启第一步（一）下载Tomcat（二）启动Tomcat三、Tomcat的目录结构：探秘内部布局（一）核心目录介绍（二）目录间的协同工作四、部署JavaWeb应用到Tomcat：让应用上线（一）打包Web应用为WAR文件（二）部署WAR文件到Tomcat五、Tomcat的配置优化：让
Java Web 之 Session 详解艾伦~耶格尔 java 开发语言后端前端 session
在JavaWeb开发中，Session就像网站的专属记忆管家，为每个用户保管着重要的信息和状态，确保用户在网站的旅程顺畅无阻。场景一：想象你去一家大型超市购物，推着购物车挑选商品。这个购物车就如同Session，它记录了你的购物信息，方便你在结账时一次性结算。场景二：你在玩一个在线游戏，登录账号后，你的游戏进度、等级、装备等信息都会被保存在Session中，即使你中途关闭游戏，下次登录时依然可以继
JavaScript之DOM操作与事件处理详解 AA-代码批发V哥 JavaScript javascript
JavaScript之DOM操作与事件处理详解一、DOM基础：理解文档对象模型二、DOM元素的获取与访问2.1基础获取方法2.2集合的区别与注意事项三、DOM元素的创建与修改3.1创建与插入元素3.2修改元素属性与样式3.2.1属性操作3.2.2样式操作3.3元素内容的修改四、DOM元素的删除与替换4.1删除元素4.2替换元素五、事件处理：实现页面交互5.1事件绑定的三种方式5.1.1HTML属性
requests的使用
一·概念requests作为爬虫的基础库，在我们快速爬取和反爬破解中起到很重要的作用，其中的知识点大概有以下几个方面：二·内容一，request：1-requests.get…get请求获取数据2-requests.post…post请求获取数据二，response:1-response.text.响应体str类型2-response.encoding从HTTPheader中获取响应内容的编码方式
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持