白色灰鸠鹭

Java爬虫简单教程

窥探这个网站已经很久了https://www.mzitu.com/ 最近弄了下爬虫，于是想把这个网站的图片给爬下来。

1.用到jsoup来解析html

2.这个网站有反爬机制，需要简单的爬床伪装

3.要用到递归，我只把页面展示的部分给爬下来了，具体里面的内容需要另外递归，到时候再做交流

需要引入的包，下面最主要的是两个核心包，其他包可以要可不要，比如那个mysql包，我之前爬取了招聘网站吧里面的职位信息都存到了数据库，所以我需要。这个根据你们情况而定。



		
		
			com.alibaba
			fastjson
			1.2.47
		
		
		
			ch.hsr
			geohash
			1.3.0
		

        <这个是核心包，用于http连接的>
		
		
			commons-httpclient
			commons-httpclient
			3.1
		

        <这个核心包是用来解析HTML的>
		
		
			org.jsoup
			jsoup
			1.8.3
		
		
		
		    org.slf4j
		    slf4j-log4j12
		    1.7.25
		    test
		
		
		
		
		   mysql
		   mysql-connector-java
		   5.0.8

包导入后，就是开整了，先看一下我的项目结构

其中 controllerImg.java 才是爬取妹子网站的main函数。其他dao和entity都是我之前爬取招聘网站用到的，这里就不做探讨，哎呀，也就是创建一个实体对象将职位存进去，然后通过JDBC再存到数据库。

现在我们来看看 controllerImg.java 里面的代码，作为一个合格的程序员我把导入的包也加进来了，复制即可用所见即所得。

import java.io.BufferedInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Random;
import java.util.UUID;

import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import com.nf.entity.JobBean;

public class ControllerImg {
	
	private static int count = 0;
	
	//将地址传入解析器
		public static Document getDom(String URL){
			try {
				URL url = new URL(URL);
				Connection connection = Jsoup.connect(URL);
				Document document = connection.get();
				return document;
			} catch (MalformedURLException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
			return null;		
		}
		//获得下一页，然后递归调用地址
		public  void getNextPageInfor(Document document){
			//选择到下一页标签的class名   .bk
			String URL = null;
			Elements pageElement = document.select(".postlist").select(".nav-links").select("a");
			for (Element element : pageElement) {
				System.out.println(element);
				
				if("下一页»".equals(element.text())) {
					URL = element.attr("href");
					System.err.println(URL);
				}
			}
			
			if(URL==null){
				return;
			}
			
			//放入下一页
			Document nextPage = getDom(URL);
			List list = getPageInfor(nextPage);
			System.out.println("---------------"+(++count)+"-------------");
			for (JobBean jobBean : list) {
				System.out.println(jobBean);
			}
			
			try {
				Thread.sleep(1000);
			} catch (InterruptedException e) {
				e.printStackTrace();
			}
			
			getNextPageInfor(nextPage);
		}
	
		public static List getPageInfor(Document document){
			Random r = new Random();
            //伪装的游览器，这里越多越好
			 String[] ua = {"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36 OPR/37.0.2178.32",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.57.2 (KHTML, like Gecko) Version/5.1.7 Safari/534.57.2",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36",
		                "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586",
		                "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko",
		                "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)",
		                "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)",
		                "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0)",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 BIDUBrowser/8.3 Safari/537.36",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36 Core/1.47.277.400 QQBrowser/9.4.7658.400",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 UBrowser/5.6.12150.8 Safari/537.36",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36 TheWorld 7",
		                "Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/60.0"};
			 int i = r.nextInt(14);
			 
			//输入输入流
			FileOutputStream outputStream  = null;
			InputStream inputStream = null;
			BufferedInputStream bis = null;
			
			
			List list = new ArrayList();
			Elements elements = document.select("#pins li");
			elements.remove(0);
			for (Element element : elements) {
				Elements needElements = element.select("a");
				
				//选取图片
				String messageUrl =  needElements.get(0).select("img[src]").attr("data-original");
				
				//每张图片生成UUID
				String outImage = UUID.randomUUID().toString().replaceAll("-", "") + ".jpg";
			
			  try {
				  //创建链接
				  URL imgUrl = new URL(messageUrl);
				  HttpURLConnection connection = (HttpURLConnection) imgUrl.openConnection();

				  //伪装请求，绕过反爬
				  connection.setRequestProperty("User-Agent", ua[i]);
				  //添加来源
				  connection.setRequestProperty("Referer","http://www.mzitu.com/");
				  //添加地址解析
				  connection.setRequestProperty("Host","i.meizitu.net");
				 
				  try {
					Thread.sleep(1000);
				  } catch (InterruptedException e) {
					// TODO Auto-generated catch block
					e.printStackTrace();
				  }
				  
				  //获取输入流 
				  inputStream = connection.getInputStream();
				  
				  //将输入流信息放入缓冲提升读写速度 
				  bis = new BufferedInputStream(inputStream);
				  
				  //获取字节数;
				  byte[] buf = new byte[1024]; 
				  
				  //生产文件
				  outputStream = new FileOutputStream("D:\\meizitu\\"+outImage); int size = 0;
				  while ((size =bis.read(buf)) != -1) {
					  outputStream.write(buf, 0, size);
				  } 
				  
				  	  //刷新文件流
				  	  outputStream.flush(); 
				}catch (MalformedURLException e) {
					  e.printStackTrace(); 
				}catch (IOException e) {
					  e.printStackTrace(); 
				}finally { 
					try {
						  if(outputStream != null){ 
							  outputStream.close(); 
						  } 
						  if(bis != null) {
							  bis.close(); 
						  } 
						  if(inputStream != null) {
							  inputStream.close(); 
						  }
					 } catch(Exception e) {
						 e.printStackTrace(); 
					 }
					 	
				}
			 
				//list.add(jobBean);
			}
			return list;
		}
	
		
		
		
	
		public static void main(String[] args){
			ControllerImg c = new ControllerImg();
			
			String URL = "https://www.mzitu.com/xinggan/";
			Document document = getDom(URL);
			List list = getPageInfor(document);
			System.out.println("---------------"+(++count)+"-------------");
			for (JobBean jobBean : list) {
				System.out.println(jobBean);
				
			}
			c.getNextPageInfor(document);
		}
	
}

接下来解析这个代码，妹子离我们不远了 getDom（String URL）方法

        //将地址传入解析器
	    public static Document getDom(String URL){
			try {
				URL url = new URL(URL);
				Connection connection = Jsoup.connect(URL);
				Document document = connection.get();
				return document;
			} catch (MalformedURLException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
			return null;		
		}

这个是对起始页码的URL转Document对象做了个简单的封装，把目标网址传进来，然后通过Jsoup返回docuemt对象。

docment对象里面装的HTML，非常强大，下面介绍怎么分析页面

页面递归，当第一个页面解析完后，需要进入到下一个页面 getNextPageInfor（Document document）方法

//获得下一页，然后递归调用地址
		public  void getNextPageInfor(Document document){
			String URL = null;
            //选取整个分页栏的  a  标签
			Elements pageElement = document.select(".postlist").select(".nav-links").select("a");

             //a 标签肯定是多个，所有只要找到某个a标签的text（）是下一页就能那到里面的URL
			for (Element element : pageElement) {
				System.out.println(element);
				
				if("下一页»".equals(element.text())) {
					URL = element.attr("href");
					System.err.println(URL);
				}
			}
			
			if(URL==null){
				return;
			}
			
			//放入下一页
			Document nextPage = getDom(URL);
			List list = getPageInfor(nextPage);
			System.out.println("---------------"+(++count)+"-------------");
			for (JobBean jobBean : list) {
				System.out.println(jobBean);
			}
			
			try {
				Thread.sleep(1000);
			} catch (InterruptedException e) {
				e.printStackTrace();
			}
			
			getNextPageInfor(nextPage);
		}

具体注释也已经写到代码里的，上分析图！！！

解释一下为什么要递归

首先我们看妹子图的地址栏

https://www.mzitu.com/xinggan/page/2/ 这是性感妹子专栏的第二页

https://www.mzitu.com/xinggan/page/3/ 第三页

https://www.mzitu.com/xinggan/page/4/ 第四页

每一页只有最后一个参数在变，表示那个参数就是页码参数

然后这个标签里面就有下一页的参数。所有我们只需要做个递归模拟点击下一页的功能即可

锤开F12就能看到具体的HTML内容了，然后通过游览器的选择标签功能选到分页栏，然后就会看到是一个大的DIV包裹着许多小DIV，这里我们就能看到我在上面分析到的很多的 a 标签，这里的每个 a 标签对应的有分页地址，我们只需要找到他的内容时

下一页的做对比就行。对比在上面的代码里，仔细看。

通过递归我吗就拿到每一页的内容了，然后我需要再来一个方法来解析每一页里面的元素 getPageInfor(Document document)方法

public static List getPageInfor(Document document){
			Random r = new Random();
			 String[] ua = {"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36 OPR/37.0.2178.32",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.57.2 (KHTML, like Gecko) Version/5.1.7 Safari/534.57.2",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36",
		                "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2486.0 Safari/537.36 Edge/13.10586",
		                "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko",
		                "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)",
		                "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)",
		                "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0)",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 BIDUBrowser/8.3 Safari/537.36",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36 Core/1.47.277.400 QQBrowser/9.4.7658.400",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 UBrowser/5.6.12150.8 Safari/537.36",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0",
		                "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36 TheWorld 7",
		                "Mozilla/5.0 (Windows NT 6.1; W…) Gecko/20100101 Firefox/60.0"};
			 int i = r.nextInt(14);
			 
			//输入输入流
			FileOutputStream outputStream  = null;
			InputStream inputStream = null;
			BufferedInputStream bis = null;
			
			
			List list = new ArrayList();
			Elements elements = document.select("#pins li");
			elements.remove(0);
			for (Element element : elements) {
				Elements needElements = element.select("a");
				
				//选取图片
				String messageUrl =  needElements.get(0).select("img[src]").attr("data-original");
				
				//每张图片生成UUID
				String outImage = UUID.randomUUID().toString().replaceAll("-", "") + ".jpg";
			
			  try {
				  //创建链接
				  URL imgUrl = new URL(messageUrl);
				  HttpURLConnection connection = (HttpURLConnection) imgUrl.openConnection();

				  //伪装请求，绕过反爬
				  connection.setRequestProperty("User-Agent", ua[i]);
				  //添加来源
				  connection.setRequestProperty("Referer","http://www.mzitu.com/");
				  //添加地址解析
				  connection.setRequestProperty("Host","i.meizitu.net");
				 
				  try {
					Thread.sleep(1000);
				  } catch (InterruptedException e) {
					// TODO Auto-generated catch block
					e.printStackTrace();
				  }
				  
				  //获取输入流 
				  inputStream = connection.getInputStream();
				  
				  //将输入流信息放入缓冲提升读写速度 
				  bis = new BufferedInputStream(inputStream);
				  
				  //获取字节数;
				  byte[] buf = new byte[1024]; 
				  
				  //生产文件
				  outputStream = new FileOutputStream("D:\\meizitu\\"+outImage); int size = 0;
				  while ((size =bis.read(buf)) != -1) {
					  outputStream.write(buf, 0, size);
				  } 
				  
				  	  //刷新文件流
				  	  outputStream.flush(); 
				}catch (MalformedURLException e) {
					  e.printStackTrace(); 
				}catch (IOException e) {
					  e.printStackTrace(); 
				}finally { 
					try {
						  if(outputStream != null){ 
							  outputStream.close(); 
						  } 
						  if(bis != null) {
							  bis.close(); 
						  } 
						  if(inputStream != null) {
							  inputStream.close(); 
						  }
					 } catch(Exception e) {
						 e.printStackTrace(); 
					 }
					 	
				}
			 
				//list.add(jobBean);
			}
			return list;
		}

String[] ua这个里面装的是User-Agent，游览器的参数信息，为什么这样做，因为我们要将我们的JAVA程序的请求伪装成游览器请求，这样别人网站才放心给我们资源嘛。这个里面的参数越多越好

下面代码是从上面代码取下来的好做分析

Elements elements = document.select("#pins li");
			elements.remove(0);
			for (Element element : elements) {
				Elements needElements = element.select("a");
				
				//选取图片
				String messageUrl =  needElements.get(0).select("img[src]").attr("data-original");

document.select("#pins li");这句代码就是在选择元素了，因为前面我吗已经拿到每个页面的HTML，在这里只需要解析拿到元素就行了，下面的图是每一页的图片的HTML

由图可知，每一页的图片是放在下面的，下面有很多的 < li > 标签，所以我代码里添加了

document.select("#pins li") 意思是选取 #pins 下的所里 li 元素，而 li 元素里面的 a 标签存我们需要的 img 资源。选取过后返回的是个 Elements 意思是每个 li 下面可能有多个元素，所有在这里用到了遍历，遍历后选择 a 标签，并拿到 attr 里面的值，就是我们需要的地址了

String messageUrl = needElements.get(0).select("img[src]").attr("data-original");

拿到地址还是不行，因为这个网站做了简单的反爬，所有要做一个简单防反爬，这时要给我们的 img 地址加一层伪装，刚刚的游览器伪装也是必要的，看代码

try {
				  //创建链接
				  URL imgUrl = new URL(messageUrl);
				  HttpURLConnection connection = (HttpURLConnection) imgUrl.openConnection();

				  //伪装请求，绕过反爬
				  connection.setRequestProperty("User-Agent", ua[i]);
				  //添加来源
				  connection.setRequestProperty("Referer","http://www.mzitu.com/");
				  //添加地址解析
				  connection.setRequestProperty("Host","i.meizitu.net");
				 
				  try {
					Thread.sleep(1000);
				  } catch (InterruptedException e) {
					// TODO Auto-generated catch block
					e.printStackTrace();
				  }

这里加了个延时，防止爬取过快被服务器拉黑。

User-Agent 这个是游览器伪装 ua[i] 是上面代码String[] 里面的值 i 是随机生成的，从String[] 里面取

Referer 这个是来源，意思的请求从哪里来，如果我们拿到图片的URL直接访问，是不能多次访问的，因为这个URL的来源不是从规定的官网来的，所有服务求会给你403报错，这个重要

Host 图片的地址和官网地址不一样，这个也是一定要加的

三个加上过后就可以访问地址了，访问了还要通过IO流来下载到本地，呆，看代码，这个就不解释了

 //获取输入流 
				  inputStream = connection.getInputStream();
				  
				  //将输入流信息放入缓冲提升读写速度 
				  bis = new BufferedInputStream(inputStream);
				  
				  //获取字节数;
				  byte[] buf = new byte[1024]; 
				  
				  //生产文件
				  outputStream = new FileOutputStream("D:\\meizitu\\"+outImage); int size = 0;
				  while ((size =bis.read(buf)) != -1) {
					  outputStream.write(buf, 0, size);
				  } 
				  
				  	  //刷新文件流
				  	  outputStream.flush(); 
				}catch (MalformedURLException e) {
					  e.printStackTrace(); 
				}catch (IOException e) {
					  e.printStackTrace(); 
				}finally { 
					try {
						  if(outputStream != null){ 
							  outputStream.close(); 
						  } 
						  if(bis != null) {
							  bis.close(); 
						  } 
						  if(inputStream != null) {
							  inputStream.close(); 
						  }
					 } catch(Exception e) {
						 e.printStackTrace(); 
					 }
					 	
				}

最后main跑一波！！！！！！

public static void main(String[] args){
			ControllerImg c = new ControllerImg();
			
			String URL = "https://www.mzitu.com/xinggan/";
			Document document = getDom(URL);
			List list = getPageInfor(document);
			System.out.println("---------------"+(++count)+"-------------");
			for (JobBean jobBean : list) {
				System.out.println(jobBean);
				
			}
			c.getNextPageInfor(document);
		}

里面的 list 不用管，这是我之前装了职位信息的。也懒得改了，方法里面返回一个null就行。

结果！！！！！

哈哈哈，存到磁盘了，来看看黄金宝库！！！！

吃水不忘挖井人，感谢下面两篇博客

https://blog.csdn.net/qq_36980713/article/details/84868135

https://blog.csdn.net/qq_42982169/article/details/83155040

JavaScript 全面教程：从基础到高级实践幼儿园扛把子\ javascript 开发语言 ecmascript
JavaScript全面教程：从基础到高级实践目录JavaScript全面教程：从基础到高级实践2.JavaScript基础语法2.1变量与数据类型2.1.1变量声明2.1.2数据类型2.2条件语句与循环2.2.1条件语句2.2.2循环2.3函数2.3.1函数定义2.3.2参数默认值3.对象与数组3.1对象3.2数组4.高级特性与最佳实践4.1作用域与闭包4.1.1闭包示例4.2事件循环（Even
VUE前端实现防抖节流 Lodash 2501_91133275 前端 vue.js javascript
写在前面：兄弟们，我手里有个长期项目，考虑接私活的可以看看我GitHub！https://github.com/ccy-233/coder2retire方法一：采用Lodash工具库Lodash是一个一致性、[模块化]、高性能的JavaScript实用工具库。（1）采用终端导入Lodash库$npmi-gnpm$npmi--savelodash（2）应用示例：搜索框输入防抖在这个示例中，我们希望用
一篇文章带你学完Java所有的时间与日期类 MHP小喇叭 java 开发语言
目录一、传统时间与日期类1.Date类构造方法获取日期和时间信息的方法设置日期和时间信息的方法2.Calendar类主要特点和功能常用方法1.获取当前日历对象2.获取日历中的某个信息3.获取日期对象4.获取时间毫秒值5.修改日历的某个信息6.为某个信息增加或者减少值3.SimpleDateFormat类主要用途构造函数模式字符串将日期格式化成日期与时间字符串将时间毫秒值格式化成字符串解析日期示例要
IDEA Reformat Code 避免将多行参数或多行方法链调用合并成一行阿湯哥 intellij-idea java ide
在IntelliJIDEA中，如果你希望在进行代码格式化（ReformatCode）时，避免将多行参数或多行方法链调用合并成一行，可以通过以下步骤进行设置：1.打开设置在IntelliJIDEA中，点击File菜单，然后选择Settings（Windows/Linux）或Preferences（macOS）。2.进入代码格式化设置在设置窗口中，导航到Editor->CodeStyle->Java（
CVE-2017-5645(使用 docker 搭建) JM丫网络安全
介绍:是一个与ApacheLog4j2相关的安全漏洞,属于远程代码执行,它可能允许攻击者通过构造恶意的日志信息在目标系统上执行任意代码Log4j2介绍Log4j2是Apache的一个日志记录工具,属于Java应用的日志框架,它是Log4j的升级版,性能更好,功能更多.它被广泛的适用于Java应用程序中,帮助开发者记录程序运行的时候的日子信息,是Java生态系统中最重要的一个日志框架之一漏洞编号:C
【前端入门】应该了解和知道的几个国内外前端开发资源网站爱上大树的小猪前端
与大家分享一下几个国内外前端开发资源网站国际资源MDNWebDocs(MozillaDeveloperNetwork)用途：MDN是Web技术领域最全面的文档库之一，涵盖了HTML、CSS、JavaScript以及浏览器API等。链接:https://developer.mozilla.orgW3Schools用途：适合初学者学习Web技术，提供从基础到进阶的教程，同时还有在线练习环境。链接:ht
Python（1）Python全方位指南：定义、应用与零基础入门实战一个天蝎座白勺程序猿 Python入门到精通 python 开发语言
背景：为什么Python成为开发者必备技能？‌Python自1991年发布以来，凭借‌“简单高效”‌的设计理念，成为全球增长最快的编程语言。根据TIOBE2023年榜单，Python稳居前三，其核心竞争力包括：‌开发效率高‌：代码量仅为Java的1/5，C++的1/10。‌跨领域通吃‌：从Web开发到AI训练，覆盖90%以上技术场景。‌企业级应用‌：YouTube用Python处理视频推荐，NAS
IntelliJ IDEA 2023.3.1安装指南从下载到配置的完整教程（附资源下载）心灵宝贝 intellij-idea java ide
安装IntelliJIDEA2023.3.1非常简单，以下是详细的安装步骤，适用于Windows、macOS和Linux系统。1.下载IntelliJIDEAIntelliJIDEA下载链接：https://pan.quark.cn/s/3ad975664934选择适合你的操作系统的版本：Ultimate版：功能全面，支持所有开发语言和框架（需付费）。Community版：免费版，适合Java和K
计算机毕业设计springboot教务管理系统 0k1c1源码+系统+程序+lw文档+部署呦呦网络 spring boot java mysql
计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署计算机毕业设计springboot教务管理系统0k1c1源码+系统+程序+lw文档+部署本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5
c++与c语言的区别是什么？ pythoncainiao221 c++c语言开发语言
1、类型不同C语言是面向过程的，而C++是面向对象的。2、函数库不同C语言的标准的函数库很松散，而C++对于大多数的函数都是集成的很紧密。3、结构不同C语言中结构只有成员变量，而在C++中结构中，可以有成员变量和成员函数。它们的区别是c++是在C语言基础上发展起来的，根据开发过程中遇到的需求，它引入了很多新的特性。如果你不走C/C++方向，直接学习Java就可以了，相同的待遇下，选择简单的更好。当
JAVASE（七）关键字this和static，类的结构详解（二）永无魇足 java java
目录一、关键字this和static1.关键字this2.关键字static二、代码块1.定义2.实例代码块和静态代码块一、关键字this和static1.关键字thisthis代表当前对象。（1）当方法里面的局部变量和成员变量同名的时候，就可以使用this。如：publicclassHuman{Stringname;Stringgender;publicHuman(Stringname,Stri
JetBrains IntelliJ IDEA 2024 for Mac v2024.3 中文 Java开发工具 Olive_Sweet java intellij-idea macos
介绍JetBrainsIntelliJIDEA2024mac，是一款Java开发工具，IntelliJIDEA凭借无与伦比的Java和Kotlin支持脱颖而出。从一开始就支持尖IDEA2024.3中文版开发工具端语言功能，保持领先地位。IntelliJIDEA对您的代码了如指掌，利用这些知识在每个上下文中提供相关建议，实现极快的导航和智能体验。效果下载百度网盘:https://pan.baidu.
02、数据结构与算法 - 基础：数组 - 吊打面试官星星学霸数据结构与算法 -吊打面试官 python 开发语言 java 算法数据结构
更多系列教程，每天更新更多教程关注：xxxueba.com星星学霸本篇博客我们介绍数据结构的鼻祖------数组，可以说数组几乎能表示一切的数据结构，在每一门编程语言中，数组都是重要的数据结构，当然每种语言对数组的实现和处理也不相同，但是本质是都是用来存放数据的的结构，这里我们以Java语言为例，来详细介绍Java语言中数组的用法。Java中数组的介绍在Java中，数组是用来存放同一种数据类型的集
Android wifi的开关Settings值异常分析峥嵘life android Android系统 Android网络 android python 开发语言
Androidwifi的开关Settings值异常分析文章目录Androidwifi的开关Settings值异常分析一、前言二、异常分析1、adb或者串口获取Settings的wifi开关值2、代码获取wifi开关值3、根据日志分析代码(1)logcat对应的wifi开启日志的代码①WifiServiceImpl.java②WifiSettingsStore.java3、wifi_on不同的具体原
如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践网罗开发实战实战源码 devops 运维
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Android开源库——RxJava和RxAndroid 松仔log #Android开源库 android 开源 rxjava
RxJava和RxAndroid是什么？RxJava是基于JVM的响应式扩展，用于编写异步代码RxAndroid是关于Android的RxJava绑定RxJava和RxAndroid使用依赖implementation'io.reactivex.rxjava3:rxjava:3.1.0'implementation'io.reactivex.rxjava3:rxandroid:3.0.2'使用过程
java实现卷积神经网络CNN（附带源码） Katie。 Java 实战项目 java
Java实现卷积神经网络（CNN）项目详解目录项目概述1.1项目背景与意义1.2什么是卷积神经网络（CNN）1.3卷积神经网络的应用场景相关知识与理论基础2.1神经网络与深度学习概述2.2卷积操作与卷积层原理2.3激活函数与池化层2.4全连接层与损失函数2.5前向传播、反向传播与梯度下降项目需求与分析3.1项目目标3.2功能需求分析3.3性能与扩展性要求3.4异常处理与鲁棒性考虑系统设计与实现思路
kettle ETL 配置云连山数字化 etl
pdi-ce-9.1.0.0-324配置-CSDN博客3、配置中文字符3.1）spoon支持中文字符，spoon.bat启动文件加-Dfile.encoding=utf-8REM%SPOON_START_OPTION%"%_PENTAHO_JAVA%"%JAVA_ADD_OPENS%%OPT%-jarlauncher\launcher.jar-lib..\%LIBSPATH%%_cmdline%%
深度解析前端面试八股文：核心知识点与高效应对策略赵大仁前端面试职场和发展
深度解析前端面试八股文：核心知识点与高效应对策略1.引言前端面试是每位开发者迈向职业进阶的重要环节，涉及HTML、CSS、JavaScript、性能优化、浏览器原理、网络、安全、框架（Vue/React）等核心知识点。本文不仅会覆盖前端面试的高频八股文，还会结合生动的案例，让你在面试时能够脱离死记硬背，从理解中突破！2.HTML&CSS高频考点2.1HTML语义化问题：什么是HTML语义化？为什么
字符流在处理不同编码文件时的工作原理啊sen丶 java 开发语言
在Java中，字符流是专门用于处理文本数据的IO流，它基于字符（char）操作，能够自动处理字符编码的转换。字符流的核心在于它可以根据指定的字符集（如UTF-8、GBK、ISO-8859-1等）将字节数据解码为字符数据，或者将字符数据编码为字节数据。这种机制使得字符流在处理不同编码的文件时非常灵活，能够有效避免因编码不一致导致的乱码问题。一、字符流的工作原理字符流在内部使用Charset（字符集）
Java中的参数传递机制：值传递与引用传递的真相啊sen丶 java 开发语言
在Java编程中，参数传递机制是每个开发者都必须理解的基本概念之一。然而，关于Java的参数传递机制，常常存在一些误解。很多人会问：“Java是按值传递还是按引用传递？”本文将通过详细的解释和代码示例，帮助你彻底理解Java的参数传递机制。一、值传递与引用传递的基本概念（一）值传递（PassbyValue）值传递是指在调用方法时，将实际参数的值复制一份传递给方法。在方法内部对参数的修改不会影响到原
AJAX PHP：深入理解与实际应用 wjs2024 开发语言
AJAXPHP：深入理解与实际应用引言随着互联网技术的不断发展，前端与后端交互变得更加频繁。AJAX（AsynchronousJavaScriptandXML）和PHP（HypertextPreprocessor）作为两种流行的技术，在实现动态网页和应用程序方面扮演着重要角色。本文将深入探讨AJAXPHP的工作原理、应用场景以及实际开发中的注意事项。AJAXPHP概述AJAXAJAX是一种基于Ja
python代码重构技巧_Python代码重构指南，老师Bryan Beecham完结 weixin_39916479 python代码重构技巧
本套课程由BryanBeecham，全球知名敏捷开发教练主讲的：Python代码重构指南。重构是软件改进的核心，它使软件拥有更好的结构和性能，也使代码更易于理解、修改和扩展。尽管重构并不是新事物，但是软件开发人员仍然会苦恼于如何正确地进行重构。随着敏捷运动的发展，DevOps之类的概念不断追求高质量和精心设计的代码，以实现更快的部署和反馈。不过，现有的很多关于重构的教程都基于Java语言，关于Py
Spring Boot 多级缓存实战：基于 Redis+Redisson 构建高并发解决方案 Isaac_Gao 缓存 spring boot redis
SpringBoot多级缓存实战：基于Redis+Redisson构建高并发解决方案本文适合人群：中高级Java开发工程师、系统架构师、对高并发场景优化感兴趣的技术人员一、为什么需要多级缓存？在百万级并发的电商系统中，我们曾遇到这样的性能瓶颈：本地缓存导致各节点数据不一致单纯依赖Redis造成带宽瓶颈缓存雪崩导致DB被打挂多级缓存架构通过结合本地缓存与分布式缓存的优势，实现了：热点数据纳秒级访问分
Java代码优化提升系统性能种豆走天下 java 开发语言
优化可以涉及许多方面，例如算法优化、内存管理、线程管理、I/O性能等。以下是一些常见的优化建议和技巧：1.优化算法和数据结构选择合适的算法：优化性能的首要步骤是选择正确的算法。例如，使用二分查找代替线性查找，或者使用合适的排序算法来替代简单的冒泡排序。选择合适的数据结构：数据结构的选择对系统的性能有很大影响。例如，如果需要频繁的插入和删除操作，使用LinkedList而不是ArrayList可能会
优化 Java 数据结构选择与使用，提升程序性能与可维护性 chenOnlyOne 学习 java 数据结构开发语言
优化Java数据结构选择与使用，提升程序性能与可维护性引言在软件开发中，数据结构的选择是影响程序性能、内存使用以及代码可维护性的关键因素之一。Java作为一门广泛使用的编程语言，提供了丰富的内置数据结构，如数组、链表、栈、队列、树、图以及集合框架中的各种接口实现（如List,Set,Map等）。然而，面对不同的应用场景，如何合理地选择和优化数据结构，成为了一个值得深入探讨的话题。本文将介绍几种常见
Java语言的WebSocket 穆骊瑶包罗万象 golang 开发语言后端
Java语言的WebSocket详解目录引言WebSocket概述2.1WebSocket的工作原理2.2WebSocket的优势Java中WebSocket的实现3.1JavaEE的WebSocketAPI3.2使用SpringBoot实现WebSocketWebSocket的应用场景WebSocket的优缺点总结1.引言在现代Web开发中，实时通信成为了一个关键需求。传统的HTTP协议是基于请
Spring AOP、Java Agent 与 ASM 的作用和区别潇凝子潇 java spring 后端
SpringAOP、JavaAgent与ASM的作用和区别1.作用技术作用典型应用场景AOP通过分离横切关注点（如日志、事务、权限），在方法调用前后动态注入代码，实现非侵入式功能增强。SpringAOP（基于动态代理）、AspectJ（编译时/运行时增强）JavaAgent基于JVM的InstrumentationAPI，在类加载时或运行时修改字节码，支持对全量类的监控或增强。性能监控（如APM工
Java中队列（Queue）和列表（List）的区别和烨 Java初级学习专栏 java list
文章目录`Java中队列（Queue）和列表（List）的区别`1.基本概念1.1列表（List）1.2队列（Queue）2.主要区别2.1数据结构特性2.2操作方式2.3适用场景3.代码示例3.1列表（List）示例3.2队列（Queue）示例4.总结Java中队列（Queue）和列表（List）的区别在Java中，队列（Queue）和列表（List）是两种常用的数据结构，它们分别用于不同的场景
selenium 等待ajax,如何等待Selenium IDE中的所有ajax请求完成？华西怀 selenium 等待ajax
我有一阵子没用过IDE。这是我用于WebDriver的。但算法翻译;JavaScript是JavaScript。这就是说，这取决于你的框架。对于角度，我用这个：publicbooleanwaitForAngularToLoad(WebDriverdriver,intwaitTimeInSeconds){WebDriverWaitwait=newWebDriverWait(driver,waitTi
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

Java爬虫简单教程

document.select("#pins li");这句代码就是在选择元素了，因为前面我吗已经拿到每个页面的HTML，在这里只需要解析拿到元素就行了，下面的图是每一页的图片的HTML

结果！！！！！

你可能感兴趣的:(java)