天大吴彦祖

Eclipse使用Java Selenium抓取众筹网站的数据

Selenium简介
- 百度百科
- 下载地址
目标网站
代码实现
- 整体架构
- 代码
- - DAO层
  - - LinkDB类
    - TableManage类
  - Model层
  - Selenium包
  - - 更新已存在项目的方法
  - 经验教训
  - - Xpath与正则表达式
    - 关于无法定位元素
    - 持续抓取过程中线程问题
    - 服务器租用与程序设定

Selenium简介

百度百科

Selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。这个工具的主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。

下载地址

我使用的是Chrome浏览器进行数据抓取，不同版本的Chrome需要下载对应的Selenium包。查看自己的Chrome版本可以在右上角的帮助->关于Chrome中看到。具体的Selenium下载地址这里也帮读者附上：http://selenium-release.storage.googleapis.com/index.html

目标网站

这次我需要爬取的网站为疾病众筹网站–轻松筹，在主页上有25个不同的展示窗口，存放了25个不同的案例。我需要获得这25个不同的案例的具体信息，跟踪记录每一个案例的后续情况（后续案例可能不在首页出现，但是仍然可以有url存在，项目会继续传播，爱心人士可以继续捐款）。

点击每一个案例的具体情况是这样的页面，我会抓取每一个具体案例的不同信息，如标题、发起人姓名、目标金额、获得帮助次数等。

代码实现

整体架构

DAO层 ————负责链接数据库与数据库中表的操作方法
Model层————负责实体数据模型实现
Selenium层———负责具体数据的抓取
UrlManage层———负责管理每个项目的URL属于辅助包，后续没有继续应用

代码

DAO层

DAO层中有两个类
LinkDB负责Eclispe与Mysql的连接
TableManage负责具体数据库中表的操作

LinkDB类

package DAO;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.SQLException;
import java.sql.Statement;

public class LinkDB {
	   public static Connection conn=null;
	   public static Statement stmt=null;
	   public LinkDB() {
		   try {
			   Class.forName("com.mysql.jdbc.Driver");
			   System.out.println("成功连接到数据库！");
			  conn= DriverManager.getConnection(
	           "jdbc:mysql://localhost:3306/qsc","root","123456");
			   stmt=conn.createStatement();
		   }catch(ClassNotFoundException e) {
			   e.printStackTrace();
		   }catch(SQLException e) {
			   e.printStackTrace();
		   }
	   }
}

TableManage类

package DAO;

import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.sql.Statement;
import java.util.ArrayList;
import java.util.List;

import Model.Belongings;
import Model.Classifiers;
import Model.DongTai;
import Model.Proofment;
import Model.QscProject;
import Model.TopHelper;

public class TableManage {
	/*
	 * 创建指定名称的表
	 * tablename stmt
	 */
	public String CreateTable(String tablename,Statement stmt)
	   {
		   String creatsql = "CREATE TABLE "+tablename+"("
				            + "title varchar(255) not null,"+"finished int(10),"+
				              "name varchar(255),"+"target varchar(255),"+
				            "already varchar(255),"+"helptimes varchar(255),"
				              +"date varchar(255),"+"des varchar(3000),"+"url varchar(300),"
				            +"zhuanfa varchar(255),"+"inindex int(10)"+")";
		   try {
			  stmt.executeLargeUpdate(creatsql);
			   System.out.println("创建表"+tablename+"成功！");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return tablename;
	   }
	/*
	 * 完结的项目创捷Helper的存储表
	 */
	public String CreateHelperTable(String tablename,Statement stmt)
	   {
		   String creatsql = "CREATE TABLE "+tablename+"("
				            + "name varchar(255) not null,"+
				              "money varchar(255),"+"people_bring varchar(255)"+
				            ")";
		   try {
			  stmt.executeLargeUpdate(creatsql);
			   System.out.println("创建表"+tablename+"成功！");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return tablename;
	   }
	/*
	 * 向Helper表中插入数据
	 */
	public void InsertToHelper(List helpers,String tablename,Connection conn)
	{
		for(int i=0;i GetUrl(String tablename,Connection conn)
	   {
		   List urls=new ArrayList();
		   try {
			   String presql="select url from"+" `qsc`."+"`"+tablename+"`"+"where finished=0";
			   PreparedStatement ps=conn.prepareStatement(presql);
			   ResultSet res=ps.executeQuery();
			   while(res.next()) {
				   urls.add(res.getString(1));
			   }
			   System.out.println("已经获取未完成案例全部url");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return urls;
	   }
   /*
    *  判断项目是否已经结束，取是否结束字段判断
    */
	public boolean IfProjectFinished(String url,Connection conn)
	{
		boolean result=false;
		try {
			String presql="select finished from `qsc`.`qsc_allurls` where url ="+url;
			PreparedStatement ps=conn.prepareStatement(presql);
			ResultSet res=ps.executeQuery();
			if(res.getInt(1)==1)
			{
				result=true;
			}
		}catch(Exception e)
		{
			e.printStackTrace();
		}
		return result;
	}
	/*
	 * 插入名字
	 */
	public void InsertTheName(String url,Connection conn,String name)
	{
		try {
			String presql="update `qsc`.`qsc_allurls` set name=? where url=?";
			PreparedStatement pst=conn.prepareStatement(presql);
			pst.setString(1, name);
			pst.setString(2, url);
			pst.executeUpdate(); 
		}catch(Exception e)
		{
			e.printStackTrace();
		}
	}
	/*
	 * 改变结束状态
	 */
	public void ChangeFinished(String url,Connection conn)
	{
		try {
			String presql="update `qsc`.`qsc_allurls` set finished=? where url=?";
			PreparedStatement pst=conn.prepareStatement(presql);
			pst.setInt(1, 1);
			pst.setString(2, url);
			pst.executeUpdate(); 
		}catch(Exception e)
		{
			e.printStackTrace();
		}
	}
	/*
	 * 获取项目ID
	 */
	public List GetNames(String tablename,Connection conn)
	{
		   List names=new ArrayList();
		   try {
			   String presql="select name from"+" `qsc`."+"`"+tablename+"`";
			   PreparedStatement ps=conn.prepareStatement(presql);
			   ResultSet res=ps.executeQuery();
			   while(res.next()) {
				   names.add(res.getString(1));
			   }
			   System.out.println("已经获取全部url");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return names;
	}
	/*
	 * 创建证明资料的表
	 */
	public String CreateProofTable(String tablename,Statement stmt)
	{
		   String creatsql = "CREATE TABLE "+tablename+"("
				            + "patient varchar(255) not null,"+"patient_des varchar(255),"+"illness varchar(255),"+"illness_des varchar(255),"+
				              "moneygetter varchar(255),"+"moneygetter_des varchar(255)"+
				            ")";
		   try {
			  stmt.executeLargeUpdate(creatsql);
			   System.out.println("创建表"+tablename+"成功！");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return tablename;
	   }
	/*
	 * 向证明表中插入信息
	 */
	public void AddToProof(Proofment proof,Connection conn,String tablename)
	{
		try {
			   String sql= "INSERT INTO `qsc`."+"`"+tablename+"`"+" (`patient`, `patient_des`, `illness`, `illness_des`, `moneygetter`, `moneygetter_des`) VALUES (?,?, ?, ?, ?, ?);";
	           PreparedStatement ps=conn.prepareStatement(sql);
	           ps.setString(1, proof.getPatient());
	           ps.setString(2, proof.getPatient_des());
	           ps.setString(3, proof.getIllness());
	           ps.setString(4, proof.getIllness_des());
	           ps.setString(5, proof.getMoneygetter());
	           ps.setString(6, proof.getMoneygetter_des());
	           ps.executeUpdate();
	           System.out.println("插入了证明信息");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
	}
	/*
	 * 创建财产表
	 */
	public String CreateBelongTable(String tablename,Statement stmt)
	{
		   String creatsql = "CREATE TABLE "+tablename+"("
				            + "house varchar(255) not null,"+"cars varchar(255),"+"insurance varchar(255)"+
				            ")";
		   try {
			  stmt.executeLargeUpdate(creatsql);
			   System.out.println("创建表"+tablename+"成功！");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return tablename;
	   }
	/*
	 * 插入财产数据
	 */
	public void AddToBelong(Belongings belong,Connection conn,String tablename)
	{
		try {
			   String sql= "INSERT INTO `qsc`."+"`"+tablename+"`"+" (`house`, `cars`, `insurance`) VALUES (?,?, ?);";
	           PreparedStatement ps=conn.prepareStatement(sql);
	           ps.setString(1, belong.getHouse());
	           ps.setString(2, belong.getCars());
	           ps.setString(3, belong.getInsurance());
	           ps.executeUpdate();
	           System.out.println("插入了财产信息");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
	}
	/*
	 * 创建动态表
	 */
	public String CreateDongTaiTable(String tablename,Statement stmt)
	{
		   String creatsql = "CREATE TABLE "+tablename+"("
				            + "name varchar(255) not null,"+"text varchar(255),"+"date varchar(255),"+
				            "catchdate varchar(255),"+"des varchar(500)"+")";
		   try {
			  stmt.executeLargeUpdate(creatsql);
			   System.out.println("创建表"+tablename+"成功！");
		   }catch(Exception e)
		   {
			   e.printStackTrace();
		   }
		   return tablename;
	   }
	/*
	 * 向动态表中插入数据
	 */
	public void AddToDongTai(List dongtais,Connection conn,String tablename)
	{
		for(int i=0;i classifiers,Connection conn,String tablename)
	{
		for(int i=0;i

 
  Model层 
  Model层负责创建项目数据结构对象，自我感觉像是在写JSP中的JavaBean。主要实体类为QscProject。内设了一些我需要存储的字段，筹款是否完成，项目是否在网站的首页等等。 
  package Model;

import java.util.List;

public class QscProject {
	    private String name;
	    private String title;
	    private String date;
	    private String desciption;
	    private String phurl;
	    private String target;
	    private String alreadyget;
	    private String helptimes;
	    private String url;
	    private String zhuanfa;
	    private int    if_finish;
	    private int    inindex;
	    private List helpers;
		public String getName() {
			return name;
		}
		public void setName(String name) {
			this.name = name;
		}
		public String getTitle() {
			return title;
		}
		public void setTitle(String title) {
			this.title = title;
		}
		public String getDate() {
			return date;
		}
		public void setDate(String date) {
			this.date = date;
		}
		public String getDesciption() {
			return desciption;
		}
		public void setDesciption(String desciption) {
			this.desciption = desciption;
		}
		public String getPhurl() {
			return phurl;
		}
		public void setPhurl(String phurl) {
			this.phurl = phurl;
		}
		public String getTarget() {
			return target;
		}
		public void setTarget(String target) {
			this.target = target;
		}
		public String getAlreadyget() {
			return alreadyget;
		}
		public void setAlreadyget(String alreadyget) {
			this.alreadyget = alreadyget;
		}
		public String getHelptimes() {
			return helptimes;
		}
		public void setHelptimes(String helptimes) {
			this.helptimes = helptimes;
		}
		public String getUrl() {
			return url;
		}
		public void setUrl(String url) {
			this.url = url;
		}
		public String getZhuanfa() {
			return zhuanfa;
		}
		public void setZhuanfa(String zhuanfa) {
			this.zhuanfa = zhuanfa;
		}
		public int getIf_finish() {
			return if_finish;
		}
		public void setIf_finish(int if_finish) {
			this.if_finish = if_finish;
		}
		public List getHelpers() {
			return helpers;
		}
		public void setHelpers(List helpers) {
			this.helpers = helpers;
		}
		public int getInindex() {
			return inindex;
		}
		public void setInindex(int inindex) {
			this.inindex = inindex;
		}
}

 
  Selenium包 
  重点来了，Selenium包中我只写了一个Getter类，类中有按照需求写的一些方法。
 先来看类中的引用包和属性，类中直接设置了两个静态量，LinkDB和TableManage，负责连接数据库和读写表。 
  import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.Date;
import java.util.List;

import org.openqa.selenium.By;
import org.openqa.selenium.JavascriptExecutor;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;

import UrlManage.*;
import DAO.LinkDB;
import DAO.TableManage;
import Model.QscProject;
import Model.TopHelper;
import Model.*
;public class Getter {
	private static LinkDB mylink=new LinkDB();
	private static TableManage tablemanage=new TableManage();
 
  用于获取首页的项目的方法GetIndex()，方法返回了一个String的List，目的是为了后续判断已经存在数据库中的项目在更新时，判断还是否存在在首页上面。
 代码中设置Selenium的配置代码。driver.get（url）为浏览器打开目标网页。 
  WebDriver driver;
		System.setProperty("webdriver.chrome.driver", "D:\\chromedriver_win32\\chromedriver.exe");
		driver =new ChromeDriver();
		driver.get("https://m2.qschou.com/index_v7_3.html");
 
  GetIndex()全部代码 
   public List GetIndexUrl(){
        List namesinindex=new ArrayList();
		WebDriver driver;
		System.setProperty("webdriver.chrome.driver", "D:\\chromedriver_win32\\chromedriver.exe");
		driver =new ChromeDriver();
		driver.get("https://m2.qschou.com/index_v7_3.html");
		try {
           Thread.sleep(10000);
       } catch (InterruptedException e) {
           e.printStackTrace();
       }
		
		  try {
			  List webElement = driver.findElements(By.xpath("/html/body/div[1]/div[3]/div[2]/div/a"));
			  List webElementName = driver.findElements(By.xpath("/html/body/div[1]/div[3]/div[2]/div/div/a/span[2]"));
			  List  NamesGetted=new ArrayList(tablemanage.GetNames("qsc_allurls", mylink.conn));
			  if( webElement!=null)
				 {
					for(int i=0;i
 
  更新已存在项目的方法 
   public void UpDateProject(List namesinindex)
   {
	    WebDriver driver;
		System.setProperty("webdriver.chrome.driver", "D:\\chromedriver_win32\\chromedriver.exe");
		driver =new ChromeDriver();
	    List  UrlsGetted=tablemanage.GetUrl("qsc_allurls", mylink.conn);
	    try {
	    	for(int i=0;i
 
  经验教训 
  Xpath与正则表达式 
  在这次的数据爬取中，我刻意回避了正则表达式的使用(因为我不会），全程使用Xpath定位网页元素。定位方法为，鼠标移动到目标元素上后右键，点击审查元素。
  
  随后在网页源码中点击Copy Xpath即可。
  
  关于无法定位元素 
  有时候会出现无法定位到目标Xpath的情况，这时候原因有如下的可能：
 1.页面需要加载，还没有加载完全部的元素。
 解决方法：设置程序等待即可。
 2.元素定位出现问题，需要滚动网页的滚动条。
 解决方法：滚动滚动条即可。
 下面的代码给出了设置等待和自动滚动滚动条的代码。等待了2000毫秒，滚动了一个滚动条的长度。 
    Thread.sleep(2000);
		   ((JavascriptExecutor) driver).executeScript("window.scrollTo(0, document.body.scrollHeight)");
		   Thread.sleep(2000);
		   ((JavascriptExecutor) driver).executeScript("window.scrollTo(0, document.body.scrollHeight)");
		   Thread.sleep(2000);
		   ((JavascriptExecutor) driver).executeScript("window.scrollTo(0, document.body.scrollHeight)");
 
  持续抓取过程中线程问题 
  在我的项目中，我需要持续循环运行抓取程序。main方法中的线程不会自动回收，记得将不用的对象及时指向null，并且定期执行系统的垃圾回收。 
   public static void main(String[] args)
   {
	  int count=0;
	  while(true){
		   count++;
		   Getter test=new Getter(); 
		test.UpDateProject(test.GetIndexUrl());
		test=null;
		if(count==100)
		{
		System.gc();
		count=0;
		}
	   }
 
  服务器租用与程序设定 
  这次使用了腾讯云，系统为Windows Server。我只是简单的复制了在本机的操作环境，将Eclipse中的程序简单的移植过去，这种方法较low,请大家不要学习。

JAVA网络通信 MeyrlNotFound java 开发语言
IP地址与InetAddress类在Java网络通信中，IP地址是设备在网络中的唯一标识，而InetAddress类则是Java对IP地址的高层表示，它封装了IP地址和域名的相关信息，并提供了一系列方法来获取和操作这些信息。以下是对IP地址与InetAddress类的详细解析：一、IP地址基础•定义：IP（InternetProtocol）地址是分配给上网设备的唯一标志，用于指明因特网上的一台计算
SpringBoot JVM性能调优 AI天才研究院 Python实战 Java实战自然语言处理人工智能语言模型编程实践开发语言架构设计 spring boot
作者：禅与计算机程序设计艺术1.简介SpringBoot是当前最流行的基于Java的Web框架，它为开发人员提供了很多便利，包括快速配置，强大的自动化特性等。但是，它的默认设置往往会给应用程序带来不小的性能开销。本文将讨论SpringBoot的默认设置，并着重探讨如何优化SpringBoot在JVM上的性能。2.JVM默认设置介绍在SpringBoot中，可以用application.proper
04.文本标签龙哥带你学编程 #html 前端
一、文本简介1、页面组成元素1）以淘宝购物官网为例，分析网页：在淘宝购物官网的首页上，我们可以看到它是由超链接，文字，图片等元素构成。2）页面组成元素①一个静态页面绝大部分由以下四种元素组成：文本图片超链接音频和视频②思考：符合以下特点的网页是静态还是动态页面？带有音频和视频带有flash动画带有css动画带有JavaScript特效不是。动态页面和静态页面区别在于：是否用到了后端技术，以及是否与
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
深度优先搜索（DFS）完全解析：从原理到 Java 实战 my_realmy Java基础知识深度优先 java 算法
深度优先搜索（DFS）完全解析：从原理到Java实战@TOC作为一名程序员，你是否遇到过需要在复杂的图结构中寻找路径、检测环，或者进行树遍历的问题？深度优先搜索（Depth-FirstSearch,DFS）作为一种经典的图遍历算法，能够轻松应对这些场景。在CSDN社区中，技术文章的受欢迎程度往往取决于内容的实用性、代码的可读性以及图文结合的讲解方式。因此，本文将为你带来一篇深入浅出、图文并茂、代码
本地锁 vs 分布式锁详解重生之我在成电转码 java 系统锁分布式锁
一、什么是本地锁？本地锁（LocalLock）指的是单机环境下使用Java/JVM自带的锁机制，实现线程之间的互斥和同步。✅本地锁的常见实现：锁类型说明synchronizedJVM内置，修饰方法或代码块，重量级锁，自动释放ReentrantLockJUC提供，支持可重入、可中断、公平锁、Condition等StampedLock支持读写锁和乐观读，适合读多写少场景ReadWriteLock读写分
【Apache Tomcat信息泄露漏洞】猫饭_ACE 业务所需 tomcat apache java
一、漏洞详情ApacheTomcat是一个流行的开源Web服务器和Java代码的Servlet容器。9月28日，Apache发布安全公告，公开披露了Tomcat中的一个信息泄露漏洞（CVE-2021-43980）。由于某些Tomcat版本中的阻塞式读写的简化实现导致存在并发错误（极难触发），可能使客户端连接共享一个Http11Processor实例，导致响应或部分响应被错误的客户端接收，造成信息泄
springboot 项目linux启停脚本 lovecode2011 linux 运维服务器
shutdown.shjps-lvm|grepxxx|awk'{print$1}'|xargskill-15xxx-进程号或项目名称(或名称关键字)startup.shls|grep"xxx"|grep-iv"bak"|tail-n1|xargs-n1-l{}nohupjava-jar{}-Dspring.config.location=/xxx/xxx/config/application-de
java面试题,什么是动态代理？、动态代理和静态代理有什么区别？说一下反射机制？JDK Proxy 和 CGLib 有什么区别？动态代理的底层述雾学java java 开发语言 java面试题反射 java核心基础
什么是动态代理？动态代理是在程序运行期，动态的创建目标对象的代理对象，并对目标对象中的方法进行功能性增强的一种技术。在生成代理对象的过程中，目标对象不变，代理对象中的方法是目标对象方法的增强方法。可以理解为运行期间，对象中方法的动态拦截，在拦截方法的前后执行功能操作。动态代理的常见使用场景有：统计每个api的请求耗时；统一的日志输出；校验被调用的api是否已经登录和权限鉴定；SpringAOP。动
网络编程、URI和URL的区别、TCP/IP协议、IP和端口、URLConnection 述雾学java Java核心基础 tcp/ip java java基础网络编程
DAY12.1Java核心基础网络编程在互联网时代，网络在生活中处处可见，javaWeb占据了很大一部分那如何实现javaWeb编程呢？Web编程就是运行在同一个网络下面的终端，使得它们之间可以进行数据传输计算机网络基本知识计算机网络是通过硬件设施，传输媒介把不同物理地址上的计算机网络进行连接，形成一个资源共享和数据传输的网络系统两台终端进行连接需要遵守规定的网络协议语法：数据信息的结构语义：描述
Rasa Webchat：开源聊天机器人组件乌昱有Melanie
RasaWebchat：开源聊天机器人组件rasa-webchatAfeature-richchatwidgetforRasaandBotfront项目地址:https://gitcode.com/gh_mirrors/ra/rasa-webchatRasaWebchat是一个开源项目，旨在为Rasa或Botfront开发的虚拟助手提供在任意网站上部署的聊天窗口组件。该项目主要使用JavaScri
贪心算法（10）（java）跳跃游戏奋进的小暄贪心算法 java 游戏
题目：给定一个长度为n的0索引整数数组nums。初始位置为nums[0]。每个元素nums[i]表示从索引i向前跳转的最大长度。换句话说，如果你在nums[i]处,你可以跳转到任意nums[i+j]处:1.0=n-1)//判断是否以经跳到最后一个位置{returnret;}for(inti=left;i<=right;i++)//更新下一层最右端点{maxPos=Math.max(maxPos,n
编写脚本在Linux下启动、停止SpringBoot工程流烟默系统运维 Linux全面入门 linux spring boot shell
【1】启动命令nohupjava-jaryour-application.jar>/dev/null2>&1&>/dev/null2>&1：这条命令将标准输出和标准错误都重定向到/dev/null，这意味着它们不会输出到控制台或任何文件。这样做是因为我们希望所有日志都由Logback处理并写入到配置文件中指定的日志文件里。然而，如果你想要保留控制台输出（例如，对于调试目的），你可以省略这部分重定向
Java类文档化：使用Javadoc注释 AR新视野 Javadoc 文档化类方法数据成员
Java类文档化：使用Javadoc注释背景简介在软件开发过程中，代码的可读性和可维护性是至关重要的。为了帮助其他开发者更好地理解代码的用途和使用方式，编写清晰的文档是非常必要的。在Java中，Javadoc注释提供了一种标准的方式来记录和生成类、方法和数据成员的文档。使用Javadoc注释进行类文档化在Java中，有三种风格的注释，分别是单行注释、多行注释和Javadoc注释。Javadoc注释
Java编程：从入门到实践 AR新视野 Java Scanner类分隔符增量开发字符串操作
背景简介本文将深入探讨Java编程中的标准类使用，特别是Scanner类的实用性和灵活性。通过实例和代码分析，我们将展示如何更有效地使用Scanner类进行用户输入处理，以及如何通过设置分隔符来接收用户输入的完整数据。此外，文章还将介绍增量开发技术在软件开发中的应用，并通过一个简单的Java程序实例，讨论如何设计和实现程序，以及如何在开发过程中考虑到用户体验。使用Scanner类获取用户输入Jav
Python 网络爬虫：从入门到实践一ge科研小菜菜编程语言 Python python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是一种自动化的程序，用于从互联网上抓取数据。Python以其强大的库和简单的语法，是开发网络爬虫的绝佳选择。本文将详细介绍Python网络爬虫的基本原理、开发工具、常用框架以及实践案例。一、网络爬虫的基本原理网络爬虫的工作流程通常包括以下步骤：发送请求：向目标网站发送HTTP请求，获取网页内容。解析内容：提取需要的数据，可以是HTML标签
Java 双亲委派模型（Parent Delegation Model）重生之我在成电转码 java 开发语言 jvm
一、什么是双亲委派模型？双亲委派模型是Java类加载器（ClassLoader）的一种设计机制：✅避免重复加载✅保证核心类安全、避免被篡改✅提高类加载效率核心思想：类加载请求从子加载器逐级向上委托父加载器，只有父加载器加载失败（ClassNotFoundException）后，子加载器才会尝试自己加载。二、双亲委派的加载流程（核心）当某个类加载器接收到类加载请求时：1️⃣先检查自己是否加载过（缓存
java基础--序列化与反序列化的概念是什么？阿硕的技术时间【学习笔记】java 开发语言
经典总结序列化就是把Java对象变成一串字节流，字节流就像是一种“通用语言”，可以在不同的计算机间传递。这样做的主要目的是保存对象的状态，以便以后可以恢复。反序列化则是把这些字节流重新变回Java对象，恢复对象的状态，方便程序继续使用它。详情内容1.什么是序列化？序列化是将Java对象转换为字节流的过程。字节流是一个平台无关的格式，可以在不同的计算机系统间传输。序列化的主要目的是将对象的状态保存下
蓝桥每日打卡--区间移位 xxjiaz 算法蓝桥杯数据结构 java
#蓝桥#JAVA#区间移位题目描述数轴上有n个闭区间：D1,⋯Dn。其中区间Di用一对整数[ai,bi]来描述，满足ai≤bi。已知这些区间的长度之和至少有。所以，通过适当的移动这些区间，你总可以使得他们的"并"覆盖[0,],也就是说[0,]这个区间内的每一个点都落于至少一个区间内。你希望找一个移动方法，使得位移差最大的那个区间的位移量最小。具体来说，假设你将Di移动到[ai+ci,bi+ci]这
分享Python7个爬虫小案例（附源码）人工智能-猫猫爬虫 python 开发语言
在这篇文章中，我们将分享7个Python爬虫的小案例，帮助大家更好地学习和了解Python爬虫的基础知识。以下是每个案例的简介和源代码：1.爬取豆瓣电影Top250这个案例使用BeautifulSoup库爬取豆瓣电影Top250的电影名称、评分和评价人数等信息，并将这些信息保存到CSV文件中。importrequestsfrombs4importBeautifulSoupimportcsv#请求U
Android的Camera架构介绍 live123 android Android JNI UI C#C++
第一部分Camera概述Android的Camera包含取景器（viewfinder）和拍摄照片的功能。目前Android发布版的Camera程序虽然功能比较简单，但是其程序的架构分成客户端和服务器两个部分，它们建立在Android的进程间通讯Binder的结构上。以开源的Android为例，Camera的代码主要在以下的目录中：Camera的JAVA程序的路径：packages/apps/Cam
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
9种JavaScript数组去重的高阶方法 2501_90226133 javascript java 算法
给定一个数组[1,2,2,4,null,null,‘3’,‘abc’,3,5,4,1,2,2,4,null,null,‘3’,‘abc’,3,5,4]去除重复项。letarr=[1,2,2,4,null,null,‘3’,‘abc’,3,5,4,1,2,2,4,null,null,‘3’,‘abc’,3,5,4]1、利用对象的key唯一众所周知，对象的key不可重复，否则后者将覆盖前者。利用该特性
C++和Java相比，哪个更适合初学者学习？ c++java
C++和Java都是非常流行的编程语言，但它们在设计理念、应用场景和学习难度上存在显著差异。对于初学者来说，选择哪种语言更适合，取决于学习目标、兴趣和未来的职业规划。以下是对C++和Java的详细对比，帮助初学者做出选择：一、学习难度C++复杂性高：C++继承了C语言的复杂性，支持多种编程范式（如面向对象、泛型编程等），语法复杂，学习曲线陡峭。内存管理：C++需要手动管理内存，容易出现内存泄漏和悬
Ark-TS 语言：鸿蒙生态的高效开发利器，让我们用大白话说一说 harmonyos-next
Ark-TS（华为专门为鸿蒙系统——就是华为自己的手机、平板、智能设备操作系统——设计的编程语言，基于TypeScript，一种比普通JavaScript更严格、能减少错误的语言）是鸿蒙应用开发的主力工具。它就像给开发者配备了一套趁手的工具包，让写代码又快又稳。简单来说，Ark-TS有几个厉害的地方：静态类型检查（写代码时必须给变量指定类型，比如数字、文字，这样电脑能在运行前就发现类型错误，避免程
适合阅读源码的 Java 优质开源框架、库盘点（初级友好项目、中级进阶项目、高级深入项目）我命由我12345 Java -项目 java 开源开发语言 java-ee spring boot spring intellij-idea
一、初级友好项目1、JUnit5基本介绍：JUnit5是单元测试框架，代码简洁，适合学习测试驱动开发（TDD）和设计模式GitHub地址：https://github.com/junit-team/junit5特点：代码量适中，模块化设计，适合学习测试框架的实现原理2、Guava基本介绍：Guava是Google核心库，包含集合、缓存、字符串处理等工具类GitHub地址：https://githu
单例模式实现后端
一、是什么单例模式（SingletonPattern）：创建型模式，提供了一种创建对象的最佳方式，这种模式涉及到一个单一的类，该类负责创建自己的对象，同时确保只有单个对象被创建在应用程序运行期间，单例模式只会在全局作用域下创建一次实例对象，让所有需要调用的地方都共享这一单例对象，如下图所示：二、实现在javascript中，实现一个单例模式可以用一个变量来标志当前的类已经创建过对象，如果下次获取当
收入突破 5 万，从大专生到大模型开发-第二篇（下）智码工坊 AI编程程序人生
第二篇下：实战案例拆解——我用AI干掉80%重复工作大家好，我是明聪，98年逆袭的大模型研发工程师，前Java转型幸存者，湖北荆州人，毕业武汉某职校。学习心得：突出“普通人破局”的真实挣扎深夜破防：我也想过放弃1：学RAG时，连续3天卡在向量数据库检索效果，甚至想“回去干Java算了”。直到发现LangChain-Chatchat开源项目，直接套用现成框架，才重拾信心。2：第一次面试被质疑“半路出
Java高级技术星星不打輰 Java java 开发语言
Java高级技术单元测试：Junit单元测试框架针对于最小的功能单元：方法，编写测试代码对于其进行正确性测试自动测试全部方法样例：packagejunittest;publicclassStringUtil{publicstaticintgetLength(Stringstr){if(str==null||"".equals(str)){return-1;}returnstr.length();}
JavaScript HTML DOM 节点列表宇哥资料 JavaScript javascript html 开发语言
NodeList对象是一个从文档中获取的节点列表(集合)。NodeList对象类似HTMLCollection对象。一些旧版本浏览器中的方法（如：getElementsByClassName()）返回的是NodeList对象，而不是HTMLCollection对象。所有浏览器的childNodes属性返回的是NodeList对象。大部分浏览器的querySelectorAll()返回NodeLis
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

Eclipse使用Java Selenium抓取众筹网站的数据