reggergdsg

java实现的简单网页爬虫：Servlet + MySQL5.5（二）

在 java实现的简单网页爬虫：Servlet + MySQL5.5 进行了改善，将爬取的网址，进行分类保存。

<span style="font-size:14px;">/*
 * 
 * @author Administrator
 * 
 * 在JavaSpider 1.3 的基础上，对爬取的网址，进行分类存储
 * 
 * 1，把temp_url 临时网址，存储到临时表 temp_url 中；
 * 2，把target_url 目标网址，存储到目标表 target_url 中；
 *
 */</span>

项目中用到的所有文件，可以在资源里面下载：

http://download.csdn.net/detail/reggergdsg/9406609

简单看一下效果图：

关键代码一：JavaSpider_2016/src/com/spider/servlet/SaveToDifferentDatabase_JavaSpider_1_5_Servlet.java servlet控制器类

package com.spider.servlet;

import java.io.IOException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.HashMap;
import java.util.Map;

import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import com.spider.Model.Target_url;
import com.spider.Model.Temp_url;
<span style="font-size:14px;"></span><pre name="code" class="java">import com.spider.java.JavaSpider_1_5;
import com.spider.service.JavaSpider_1_5_Service;
import com.spider.service.impl.JavaSpider_1_5_ServiceImpl;

/**
 * 
 * @author Administrator
 * 
 * 在JavaSpider 1.3 的基础上，对爬取的网址，进行分类存储
 * 
 * 1，把temp_url 临时网址，存储到临时表 temp_url 中；
 * 2，把target_url 目标网址，存储到目标表 target_url 中；
 *
 */

@SuppressWarnings("serial")
public class SaveToDifferentDatabase_JavaSpider_1_5_Servlet extends HttpServlet{

	//定义service层接口对象
	JavaSpider_1_5_Service javaSpider_1_5_Service = new JavaSpider_1_5_ServiceImpl();

	//service层接口对象 的 setter方法 
	public void setJavaSpider_1_5_Service(JavaSpider_1_5_Service javaSpider_1_5_Service) {
		
		//测试输出
		System.out.println("JavaSpider_1_5 版本 JavaSpider_1_5_Service 接口对象 的 setter 方法执行了... ");
		
		this.javaSpider_1_5_Service = javaSpider_1_5_Service;
	}
	
	//实现doPost方法
	public void doPost(HttpServletRequest request,HttpServletResponse response) throws ServletException,IOException{
		
		//设置相应信息的编码方式
		response.setCharacterEncoding("UTF-8");
		
		//定义一个String类型的变量，用来表示用户输入的URL
		String URL = "";
		
		//定义一个String类型的变量，用来表示用户输入的URL
		int LEVEL = 0;
		
		//定义一个String类型的变量，用来表示返回客户端的提示信息
		String message = "";
		
		//生成Temp_url对象
		Temp_url url_temp = new Temp_url();
		
		//生成Target_url对象
		Target_url target_url = new Target_url();
		
		//定义一个Map，用来封装所有的URL网址
		Map<Integer,String> urls = new HashMap<Integer,String>();
		
		//
		Map<Integer,String> urls_rs = new HashMap<Integer,String>();
		
		//生成JavaSpider_1_3_URLParser对象
		JavaSpider_1_5 javaSpider_1_5 = new JavaSpider_1_5();
		
	    //生成日期对象
	    Date current_date = new Date();
	    
	    //设置日期格式化样式为：yyyy-MM-dd
	    SimpleDateFormat  SimpleDateFormat = new SimpleDateFormat("yyyy-MM-dd");
	    
	    //格式化当前日期
	    SimpleDateFormat.format(current_date.getTime());
	    
		//在request请求域中获取参数
	    LEVEL = Integer.parseInt(request.getParameter("LEVEL"));
		URL = request.getParameter("URL");
		
		//测试输出
		System.out.println("在servlet中接收到的用户输入的网址：" + URL);

		if(!"".equals(URL)){
			
			//测试输出
			System.out.println(" 在servlet中 ，!''.equals(URL)：如果URL不为空，进入if语句...");
			
		    //获取所有的URL网址
		    urls = javaSpider_1_5.getFormatCode_1_5(URL);
		    
		    //封装url实体
		    for(int i=0;i<urls.size();i++){
		    	
		    	/*
		    	 * 对网址进行分类存储，如果是临时网址，则保存到临时表；如果是目标网址，则保存到目标表
		    	 */
		    	
		    	//如果是目标网址
		    	if(urls.get(i).toLowerCase().endsWith(".html")){
			    	
		    		target_url.setTempurl(urls.get(i));
		    		target_url.setLevel(LEVEL);
			    	
			    	//调用业务逻辑处理对象，完成数据保存到数据库的业务逻辑
			    	javaSpider_1_5_Service.saveToDatabaseTarget_url(target_url);
			    	
					//测试输出
					System.out.println("目标网址保存到目标数据库  target_url ");
		    		
		    	}
		    	//如果是临时网址
		    	else{
			    	
			    	url_temp.setTempurl(urls.get(i));
			    	url_temp.setLevel(LEVEL);
			    	
			    	//调用业务逻辑处理对象，完成数据保存到数据库的业务逻辑
			    	javaSpider_1_5_Service.saveToDatabase(url_temp);
			    	
					//测试输出
					System.out.println("临时网址保存到临时数据库  url_temp ");
		    		
		    	}
		    	
		    }
				
			message = "文件保存完成...";
				
			//把信息保存到request请求域中，传递到客户端
			request.setAttribute("message", message);
				
			//跳转到SpiderIndex.jsp页面
			request.getRequestDispatcher("WEB-INF/spider/Success.jsp").forward(request, response);

		}
		
		else{
			
			urls_rs = javaSpider_1_5_Service.getAllUrlsOfLevel(LEVEL);
			
		    //封装url实体
		    for(int i=0;i<urls_rs.size();i++){
		    	
		    	urls = javaSpider_1_5.getFormatCode_1_5(urls_rs.get(i));
		    	
		    	//测试输出
		    	System.out.println("查询结果集中的网址 urls_rs.get(i) = " + urls_rs.get(i));
		    	System.out.println("新爬取的网址 urls.get(i) = " + urls.get(i));
		    	
		    	for(int j=0;j<urls.size();j++){
		    		
			    	/*
			    	 * 对网址进行分类存储，如果是临时网址，则保存到临时表；如果是目标网址，则保存到目标表
			    	 */
			    	
			    	//如果是目标网址
			    	if(urls.get(i).toLowerCase().endsWith(".html")){
				    	
			    		target_url.setTempurl(urls.get(i));
			    		target_url.setLevel(LEVEL);
				    	
				    	//调用业务逻辑处理对象，完成数据保存到数据库的业务逻辑
				    	javaSpider_1_5_Service.saveToDatabaseTarget_url(target_url);
			    		
			    	}
			    	//如果是临时网址
			    	else{
				    	
				    	url_temp.setTempurl(urls.get(i));
				    	url_temp.setLevel(LEVEL);
				    	
				    	//调用业务逻辑处理对象，完成数据保存到数据库的业务逻辑
				    	javaSpider_1_5_Service.saveToDatabase(url_temp);
			    		
			    	}
		    		
		    	}
		    }
				
				message = "文件保存完成...";
				
				//把信息保存到request请求域中，传递到客户端
				request.setAttribute("message", message);
				
				//跳转到SpiderIndex.jsp页面
				request.getRequestDispatcher("WEB-INF/spider/Success.jsp").forward(request, response);
			
		}
	}
	

	//实现doGet方法
	public void doGet(HttpServletRequest request,HttpServletResponse response) throws ServletException,IOException{
		
		//设置相应信息的编码方式
		response.setCharacterEncoding("UTF-8");	
		
		this.doPost(request, response);
		
	}
	
}

关键代码二：/JavaSpider_2016/src/com/spider/java/JavaSpiderBase_1_5.java 爬虫核心接口

package com.spider.java;

import java.io.IOException;
import java.util.Map;

import org.apache.http.client.ClientProtocolException;

public interface JavaSpiderBase_1_5 {
	
	//带参数的方法 JavaSpider_1_5版本
	public Map<Integer,String> getFormatCode_1_5(String URL) throws ClientProtocolException, IOException;
	
}

关键代码三：/JavaSpider_2016/src/com/spider/java/JavaSpider_1_5.java 爬虫核心接口实现类

package com.spider.java;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.HashMap;
import java.util.Map;

import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.HttpStatus;
import org.apache.http.client.ClientProtocolException;
import org.apache.http.client.HttpClient;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.DefaultHttpClient;

@SuppressWarnings("deprecation")
public class JavaSpider_1_5 implements JavaSpiderBase_1_5{

	@Override
	public Map<Integer, String> getFormatCode_1_5(String URL) throws ClientProtocolException, IOException {

		
		//创建HttpClient
		HttpClient httpClient = new DefaultHttpClient();
		//获取HttpGet对象
		HttpGet httpGet = new HttpGet(URL);
		//
		@SuppressWarnings("unused")
		StringBuffer stringBuffer = new StringBuffer();
		//
		HttpResponse httpResoponse = httpClient.execute(httpGet);
		//
		BufferedReader bufferedReader;
		//定义一个Map，用来封装所有的URL
		Map<Integer,String> urls = new HashMap<Integer,String>();

		//生成JavaSpider_1_4_URLParser对象
		JavaSpider_1_4_URLParser javaSpider_1_4_URLParser = new JavaSpider_1_4_URLParser();
		
		if(HttpStatus.SC_OK == httpResoponse.getStatusLine().getStatusCode()){
			//
			HttpEntity httpEntity = httpResoponse.getEntity();
			//
			if(httpEntity != null){
				
				bufferedReader = new BufferedReader(new InputStreamReader(httpEntity.getContent(),"UTF-8"));
				
				//bufferedReader按行读取
				String line = "";
				
				//if(httpEntity.getContentLength() > 0 ){
				if(httpEntity.getContent() != null && httpEntity.getContentLength() > 0){

					stringBuffer = new StringBuffer((int) httpEntity.getContentLength());
					
					int z = 0;

					while((line = bufferedReader.readLine()) != null){

						//判断得到的目标网址是否为空
						if(!"".equals(javaSpider_1_4_URLParser.parserURL(line, URL))){
							
							//封装到数组中
							
							urls.put(z, javaSpider_1_4_URLParser.parserURL(line, URL));
							
							System.out.println("if在JavaSpider中测试输出获取到的所有网址：" + urls.get(z));
							
							z++;
						}
					
					}
				}
				
				//如果httpEntity.getContent() != null && httpEntity.getContentLength() == -1
				else{
					//测试输出
					System.out.println("进入if...进入条件：httpEntity.getContent() != null || httpEntity.getContentLength() == -1");

					//stringBuffer = new StringBuffer((int) httpEntity.getContentLength());
					//把长度写死
					stringBuffer = new StringBuffer(1024);
					
					int z = 0;

					while((line = bufferedReader.readLine()) != null){
						
						//判断得到的目标网址是否为空
						if(!"".equals(javaSpider_1_4_URLParser.parserURL(line, URL))){
							
							//封装到数组中
							
							urls.put(z, javaSpider_1_4_URLParser.parserURL(line, URL));
							
							System.out.println("else在JavaSpider中测试输出获取到的所有网址：" + urls.get(z));
							
							z++;
						}
					
					}
				}
			}
			if(httpEntity != null){
				//
				httpEntity.consumeContent();
			}
		}
		
		//返回Map
		return urls;

	}
}

关键代码四：/JavaSpider_2016/src/com/spider/java/JavaSpider_1_5_HTMLParser.java HTML页面抽取工具类

package com.spider.java;

public class JavaSpider_1_5_HTMLParser {
	//
	public String parserHTML(String line){
		
		//定义一个String类型的变量parseredLine，用来表示处理以后的line
		String parseredLine = "";
		//第一次抽取后的子串
		String subString = "";
		//第二次抽取后的子串
		String sub_subString = "";
		//第三次抽取后的子串
		String sub_sub_subString = "";
		int i = line.indexOf('<'); 
		int j = line.lastIndexOf('<');
		int k = line.indexOf('>');

		//1，如果字符<第一次出现的索引和最后一次出现的索引值相等，说明这一行，只有一对<></> 这种闭合的HTML标签；
		//此时只需要把这个标签删除掉就行，我们可以使用String类的subString方法截取我们需要的信息；
		if(i == j && i != -1){
			//这种情况下， 我们还要再判断，这个标签是不是位于行首；
			if(i == 0 ){
				//System.out.println(""); //简化处理
			}
			else{
				//System.out.println("");  //简化处理，暂时不考虑<br>这种单独的标签
			}
				
		}
		//如果字符< 第一次出现的索引和最后一次出现的索引值不相同，说明这一行，有2对<></>或者多对， 这样的闭合的HTML标签；
		//2，如果有2对闭合的HTML标签；此时我们需要删除这2对HTML标签；这里简化步骤，只考虑闭合标签位于首尾的情况；
		else if(i != j){
			//第一次抽取
			subString = line.substring(k+1, j);
			//第二次抽取
			//第二次抽取的时候，需要考虑2个标签的特殊情况，也就是title、link这种标签，虽然符合条件，但是不抽取这种值。
			int y = subString.lastIndexOf('<');
			int z = subString.indexOf('>');
			if(y > -1){
				//此时还要考虑只有3个HTML标签的特殊情况
				if(subString.contains("<title") || subString.contains("<link" )){
					sub_subString = subString.substring(z+1, y);
				}
				else{
					sub_subString = subString.substring(z+1, y);
					if(sub_subString != null && (sub_subString.startsWith("0") || sub_subString.startsWith("1") 
							|| sub_subString.startsWith("2") 
							|| sub_subString.startsWith("3") || sub_subString.startsWith("4") || sub_subString.startsWith("5")
							|| sub_subString.startsWith("6") || sub_subString.startsWith("7") || sub_subString.startsWith("8")
							|| sub_subString.startsWith("9"))){
					}
					else{
						System.out.println(sub_subString);
						parseredLine = sub_subString;
					}
				}
			}
			//第三次抽取
			int A = sub_subString.indexOf('<');
			int B = sub_subString.indexOf('>');
			int C = sub_subString.lastIndexOf('<');
			//如果A<0，说明没有HTML标签了；
			if(A < 0){
				//System.out.println("");
			}
			//如果A>0,说明还有HTML标签，此时需要判断是只有一个，还是有多个；
			else{
				//如果A = C，说明，只有一个HTML标签，此时还有三种情况，HTML标签在首，HTML标签居中，HTML标签在尾；
				if(A == C && A == 0){
					sub_sub_subString = sub_subString.substring(B+1, sub_subString.length());
					System.out.println(sub_sub_subString);
					parseredLine = sub_sub_subString;
				}
				else if(A == C && (B == sub_subString.length() - 1)){
					sub_sub_subString = sub_subString.substring(0, A);
					System.out.println(sub_sub_subString);
					parseredLine = sub_sub_subString;
				}
				else if(A == C && A != 0 && (B != sub_subString.length() - 1 )){
					//如果HTML标签居中，我们这时需要根据java的语法来判断，
					//此时还需要判断，我们需要抽取的内容在哪边，这时我们根据HTML标签内，有没有/来判断
					//如果书写规范的话，没有/，则我们需要抽取的内容在后边；否则在前边；
					//这种情况下，还要进行第四次抽取的判断；
						
					//如果开头是数字，可以判断我们需要抽取的代码在尾部
					if(sub_subString.substring(0, 1).matches("^[0-9]")){
						sub_sub_subString = sub_subString.substring(B+1,sub_subString.length());
						System.out.println(sub_sub_subString);
						parseredLine = sub_sub_subString;
					}
					else{
						sub_sub_subString = sub_subString.substring(0, A);
						System.out.println(sub_sub_subString);
						parseredLine = sub_sub_subString;
					}
				}
			}
		}
		return parseredLine;
	}
}

关键代码五： /JavaSpider_2016/src/com/spider/java/JavaSpider_1_5_URLParser.java HTML网址抽取工具类

package com.spider.java;

public class JavaSpider_1_5_URLParser {
	
	/**
	 * 实现方法：
	 * 
     * 1，直接获取第一个A标签的起始位置，然后截取想要的属性，或者A标签； 
     * 2，然后从剩下的二级子串中，重复进行第一步的操作；
     * 3，以此类推，我们就可以获取所有的A标签了...
     * 
	 * 此方法需要接收以下几个参数：
	 * 1，当前页面的网址current_url，String类型；
	 * 2，当前需要处理的行line，String类型；
	 */
	public String parserURL(String line,String current_url){

	    //目标网址前缀  target_url_prefix
	    String target_url_prefix = "";
	    
	    //目标网址
	    String target_url = "";
	    
	    //目标网址后缀
	    String target_url_suffix = "";
	    
		/*
		 * 第一次抽取
		 */
	    
	    //定义一个int变量，用来表示第一个 A 标签起始位置的索引
	    int a_start = -100;
	    
	    //定义一个int变量，用来表示第一个 A 标签的 href 属性起始位置的索引
	    int href_start = -100;
	    
	    //定义一个int变量，用来表示第一个 A 标签的  第一个双引号 起始位置的索引
	    int double_start = -100;
		
		//定义一个String类型的变量，用来表示截取的子串，我们称之为一级子串
		String sub_String = "";
		
		//定义一个String类型的变量，用来表示截取的子串的子串，我们称之为二级子串
		String sub_sub_String = "";
		
		/*
		 * 首先对当前网址current_url进行处理，获得目标网址前缀
		 */
		int current_url_index = current_url.lastIndexOf("/");
		target_url_prefix = current_url.substring(0, current_url_index+1);
		
		//测试输出
		//System.out.println("当前输入的URL ==== " + current_url);
		//System.out.println("目标网址前缀 target_url_prefix ==== " + target_url_prefix);
		
		//获取第一个A标签的索引
		if(line.contains("<a")){
			
			a_start = line.indexOf("<a");
			sub_String = line.substring(a_start);
			
			//测试输出
			System.out.println("一级子串  sub_String = " + sub_String);
			
			href_start = sub_String.indexOf("href=");
			sub_sub_String = sub_String.substring(href_start+6);
			
			//测试输出
			System.out.println("二级子串  sub_sub_String = " + sub_sub_String);
			
			//如果二级子串非法，也就是href的第一位不是字母
			if(sub_sub_String.startsWith("?") || sub_sub_String.startsWith("/")){
				
				//测试输出
				System.out.println("非法网址，不保存！");
			}
			else{
				
				double_start = sub_sub_String.indexOf("\"");
				target_url_suffix = sub_sub_String.substring(0, double_start);
				
				//测试输出
				System.out.println("目标网址后缀  target_url_suffix = " + target_url_suffix);
			}
		}
		
		//如果目标网址后缀  target_url_suffix 不为空
		if(!"".equals(target_url_suffix)){
			
		    //目标网址为
		    target_url = target_url_prefix + target_url_suffix;
		    
		    //测试输出
		    //System.out.println("当前获得的目标网址为 target_url:" + target_url);
		
		}
		
		//返回目标网址
		return target_url;
	}
}

其他代码，可以在我的资源里面下载：http://download.csdn.net/detail/reggergdsg/9406609

稍后继续更新爬虫1.6

Spring Boot Tomcat 漏洞修复高建伟-joe 后端 spring boot tomcat 后端 java 网络安全
SpringBootTomcat漏洞修复ApacheTomcat远程代码执行漏洞(CVE-2025-24813)Tomcat是一个开源的、轻量级的Web应用服务器和Servlet容器。它由Apache软件基金会下的Jakarta项目开发，是目前最流行的JavaWeb服务器之一。该漏洞利用条件较为复杂，需同时满足以下四个条件：应用程序启用了DefaultServlet写入功能，该功能默认关闭。应用支
Spring上下文工具类 neo_Ggx23 工具类 spring java 后端
文章目录获取ip地址请求上下文相关Spring上下文获取Bean对象获取ip地址publicclassIpUtils{privateIpUtils(){}/***获取请求ip地址**@return{@linkString}*/publicstaticStringgetIpAddress(){HttpServletRequestrequest=RequestContextHolderUtils.ge
2.5 Spring Boot异常处理全局化：@ControllerAdvice实战 Sendingab Spring boot 从入门到精通零基础7天精通Spring Boot spring boot 后端 java
SpringBoot全局异常处理：@ControllerAdvice深度解析一、异常处理机制全景图1.1SpringMVC异常处理流程mermaidgraphTDA[客户端请求]-->B[DispatcherServlet]B-->C{Controller处理}C-->|正常|D[返回数据]C-->|异常|E[ExceptionHandlerResolver]E-->F[查找@ExceptionH
SpringMVC （一）基础小安同学iter SSM框架 java tomcat spring spring boot java-ee intellij-idea
目录SpringMVC一简单使用1新建模块选择指定参数2创建实现类3将项目启动4运行结果：在浏览器当中响应执行二RequestMapping三请求限定SpringMVCSpringMVC是Spring的web模块，用来开发Web应用，SpringMVC应用最终作为B/S，C/S模式下的Server端，Web应用的核心是处理HTTP响应。SpringWebMVC是构建在ServletAPI上的原始W
javaweb中Tomcat，Servlet跳转505错误刷新后404错误原因与解决方案。清新脱俗的单身狗呀 servlet tomcat java
Tomcat在较新版本中使用的Servlet-api已经从原先的javax.servlet-api变为了jakarta.servlet-api如果继续使用javax.servlet-api就会发生对象创建失败。只需要将Maven中的Servlet依赖改为com.guicedee.servicesjakarta.servlet-api1.2.2.1-jre17然后将引入的包也改成相应的名字即可。
JavaWeb+Tomcat+Servlet使用＜c:foreach＞标签时，jsp等网页文件获取不到request域中的数据老东头 tomcat java
自己也是刚学习就遇到了这个问题，上网找了两天，弄清楚了就分享出来我的各个文件都没有报错，而且jdk和jstl的版本，web.xml的版本都没什么问题，而且也能获取数据库中的数据，但是使用时就不能输出数据，而是把代码内容显示出来，比如：我本来是要通过foreach循环遍历表格，输出品牌表的信息，像这样：在页面加上下面这句的前提下，还要加一句这句话的大致意思就是不把${}中的内容当做字符串，如果是tr
Tomcat+Servlet运行后出现404错误解决方案 Midsummer-逐梦解决方案 tomcat servlet
Tomcat+Servlet运行后出现404错误解决方案一、错误效果复现后续的解决方案，仅仅针对我遇到的情况。对不能涵盖大部分情况感到抱歉。二、错误分析先看看源代码？packagecom.example.secondclass.Servlet;importjava.io.*;importjakarta.servlet.ServletException;importjakarta.servlet.a
java中过滤器实现拦截非法访问 Java--成长之路 filter 过滤器 spring
packagecom.hs.filter;importjava.io.IOException;importjava.io.PrintWriter;importjava.util.HashMap;importjava.util.List;importjava.util.Map;importjavax.servlet.Filter;importjavax.servlet.FilterChain;imp
java中过滤器简洁冬冬监听器和过滤器 java
Filter过滤器它的作用是：拦截请求，过滤响应应用场景：权限检查日志操作事务管理web.xml1.配置过滤器2.指定过滤器的url-pattern规则doFilter中如果没有调用继续请求的方法，就停止如果继续访问，filterChain.doFilter(servletRequest,servletResponse)在调用过滤器前，request对象已经被创建并封装request.getReq
Spring boot如何获得客户端ip地址以及根据主机名获得ip地址 raining7989 java spring websocket
目录1、获得访问controller端口的客户端ip地址2、获得访问endpoint端口的客户端ip地址3、根据服务器的主机名获得ip地址，并拼接成可以直接访问的链接1、获得访问controller端口的客户端ip地址importjavax.servlet.http.HttpServletRequest;importorg.springframework.web.context.request.R
Apollo部署及整合SpringBoot实战 It_BeeCoder SpringBoot
前言：最近在完成毕业设计，题目是《基于微服务的B2C网上商城系统的设计与实现》，整个项目最早是我在看黑马的培训视频时学习JavaWeb做的一个项目，第一次做完大约在去年过年的时候，这个项目前前后后自己改了差不多5、6次了，使用技术不断更新（还有一些小细节的修改比如最早购物车用Session后来用Redis存储），从最早的Servlet+Filter到SSM+Redis到SpringBoot+Thy
在Linux下安装部署Tomcat教程波波有料 linux tomcat 运维
摘要Tomcat是由Apache开发的要给Servlet容器，实现了对Servlet和JSP的支持，并提供了作为Web服务器的一些特有功能，如Tomcat管理和控制平台，安全管理和Tomcat阀等。简单来说，Tomcat是一个由WEB应用程序的托管平台，可以让用户编写的WEB应用程序，别Tomcat所托管，并提供网站服务。即让用户安装步骤如下：Tomcat的安装分为2步：安装JDK环境解压并安装T
Spring Boot 3 中集成 Swagger 问题：Type javax.servlet.http.HttpServletRequest not present 我命由我12345 后端 -问题清单 spring boot servlet 后端 java http spring java-ee
问题与处理策略问题描述io.springfoxspringfox-swagger23.0.0io.springfoxspringfox-swagger-ui3.0.0在SpringBoot3中集成Swagger时，报如下错误java.lang.TypeNotPresentException:Typejavax.servlet.http.HttpServletRequestnotpresent#翻译
Spring+SpringMVC项目中的容器初始化过程 m0_74824044 面试学习路线阿里巴巴 spring java 后端
文章目录容器初始化过程初始化过程简单概括初始化过程初始化流程图Filter、Servlet等无法自动注入Bean容器初始化过程web.xml配置文件ssmdemocontextConfigLocation/WEB-INF/spring/spring-context.xml启动spring容器org.springframework.web.context.ContextLoaderListenero
websocket wss_使用wss和HTTPS / TLS保护WebSocket的安全 dnc8371 java python 数据库安全 github
websocketwss这个博客的第50条提示，是的！技术提示＃49说明了如何使用用户名/密码和Servlet安全机制保护WebSocket的安全。本技术提示将说明如何在WildFly上使用HTTPS/TLS保护WebSockets。让我们开始吧！创建一个新的密钥库：keytool-genkey-aliaswebsocket-keyalgRSA-keystorewebsocket.keystore
JavaEE 项目常见错误解决方案一弦一柱 JavaEE 常见错误中文乱码 JSP 404
JavaEE项目常见错误解决方案数据库连接JavaBean获取不到数据库字段值或出现意料之外的值业务中出现null或""404NOTFOUNDGET请求中文乱码form表单提交中文乱码最近的实训中，练了一个比较基础的项目，JSP+Servlet+JavaBean，完成两张表的CRUD操作，前端使用Bootstrap和JQuery，交互使用AJAX，IDE选用Eclipse,在时间比较仓促的情况下完
【Servlet】深入解析 Servlet 启动过程 —— 原理分析、代码实战及在 JDK 和 Spring 中的应用工一木子原理分析 Servlet java servlet
深入解析Servlet启动过程——原理分析、代码实战及在JDK和Spring中的应用在JavaWeb开发中，Servlet是一种用于创建动态Web应用程序的核心技术。作为JavaEE（现在是JakartaEE）的基础，Servlet在处理客户端请求、生成响应等方面发挥着重要作用。理解Servlet的启动过程，不仅能帮助我们调试和优化应用，还能为深入掌握JavaWeb开发的核心原理打下坚实基础。本文
Servlet 服务器 HTTP 响应 wjs2024 开发语言
Servlet服务器HTTP响应引言在JavaWeb开发中，Servlet作为服务器端技术的重要组成部分，扮演着至关重要的角色。Servlet负责处理客户端的请求，并生成响应。HTTP响应是Servlet处理请求后返回给客户端的数据。本文将详细介绍Servlet服务器HTTP响应的相关知识，包括响应状态码、响应头、响应体等。Servlet服务器HTTP响应概述Servlet服务器HTTP响应是指S
基于jsp+servlet+mysql实现增删改查蟹黄味汉堡 mysql servlet jsp
#声明单纯记录学习计算机当中所遇到的问题把解决问题的方法分享给大家希望大佬不要喷我这个小白#链接mysql数据库publicclassBaseDao{publicConnectiongetConnection()throwsClassNotFoundException,SQLException{//url里的demo4为数据库名称Stringurl="jdbc:mysql://localhost:
【＜一＞炼丹初探：JavaWeb 的起源与基础】之 JavaWeb的诞生：从 CGI 到 Servlet 的技术演进 Foyo Designer 改行学it 经验分享程序人生 java web
一、CGI：老黄历里的“笨办法”话说当年，互联网刚起步那会儿，网站开发还是个“摸着石头过河”的活儿。那时候，大家伙儿都用CGI[1]来处理动态内容。CGI这玩意儿，说白了就是个“传话筒”，浏览器发个请求，服务器就找个脚本跑一跑，再把结果扔回去。听着挺简单，但用起来可真是“笨驴拉磨——费劲”。CGI的问题在于，每次请求都得开个新进程，服务器资源就跟“撒芝麻盐”似的，哗哗往外撒。那时候的服务器性能，跟
【＜一＞炼丹初探：JavaWeb 的起源与基础】之 Servlet 与 JSP 的协作：MVC 模式的雏形 Foyo Designer java 改行学it 程序人生经验分享开发语言 servlet mvc
点击此处查看合集https://blog.csdn.net/foyodesigner/category_12907601.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=12907601&sharerefer=PC&sharesource=FoyoDesigner&sharefrom=from_link一、Servlet和JSP：一对
Jsp和Servlet有什么不同 sevevty-seven java servlet 开发语言
JSP（JavaServerPages）和Servlet都是JavaWeb开发中常用的技术，它们的主要区别在于用途和实现方式不同。以下是JSP和Servlet的详细对比：1.主要用途Servlet：主要用于处理业务逻辑，例如接收请求、处理数据、响应数据等。它偏向于后台的逻辑处理，并不擅长直接生成HTML页面。JSP：主要用于生成动态页面内容，偏向于表现层。它允许直接在HTML中嵌入Java代码，通
Java 拦截器实战：从入门到精通（精选）我真的不想做程序员 java java spring 开发语言后端算法
目录一、拦截器基础概念二、实战案例1.用户认证与授权2.请求日志与性能监控3.国际化与本地化三、注册拦截器四、总结在JavaWeb开发中，拦截器是一种强大的工具，它允许开发者在请求处理的各个环节进行拦截和处理。与过滤器类似，拦截器也能够对请求和响应进行操作，但它工作在SpringMVC框架内部，能够访问Spring管理的Bean，与Spring的依赖注入无缝集成。本文将通过实战案例，帮助您深入理解
Java直通车系列20【Spring MVC】（拦截器）浪九天 Java直通车 java spring mvc 开发语言
目录拦截器概述拦截器的工作原理拦截器的使用步骤拦截器接口方法解释场景示例1.创建拦截器类2.配置拦截器3.创建控制器4.测试拦截器其他常见场景拦截器概述在SpringMVC中，拦截器（Interceptor）是一种可以在请求处理的不同阶段进行预处理和后处理的组件。它类似于Servlet中的过滤器（Filter），但拦截器是SpringMVC框架特有的，主要用于对控制器方法的调用进行拦截和处理。拦截
手写tomcat+servlet,浅析原理小新的蜡笔不见了 Tomcat tomact servlet
手写tomcat+servlet,浅析原理概念逻辑手写实现便于管理我就在资源文件夹新建property.properties文件，可以设置端口新建servlet之前可定要先定义Request和Response新建Myservlet，在这之前写一个servlet吧，毕竟有些方法每次都要用需要用到的工具类重头戏回顾最近回头看了servlet，写了一个简易版的tomcat+servlet。代码都上传到了
从零手写Tomcat核心架构：构建简易Servlet容器实战指南 bigH2004 tomcat 架构 servlet
一、自研Tomcat的意义与核心目标在当今分布式架构盛行的时代，理解Web容器底层原理是突破中间件黑盒的关键。本文将基于HTTP协议与Servlet规范，实现一个具备基础Servlet动态请求处理能力的精简版Tomcat（命名为MiniCat），其核心架构目标包括：HTTP通信层：实现TCP连接管理和基础报文解析生命周期管理：支持Servlet的init-service-destroy流程请求分发
JavaWeb开发与代码的编写(十九) wespten Spring全家桶微信小程序 Java全栈开发
JavaWeb开发与代码的编写(十九)监听器(Listener)监听器的概念监听器是一个专门用于对其他对象身上发生的事件或状态改变进行监听和相应处理的对象，当被监视的对象发生情况时，立即采取相应的行动。监听器其实就是一个实现特定接口的普通java程序，这个程序专门用于监听另一个java对象的方法调用或属性改变，当被监听对象发生上述事件后，监听器某个方法立即被执行。监听器案例——监听window窗口
JavaEE定时器 nnn9223643
packagecom.ovi.poi.tool;importjava.util.Timer;//定时器类importjavax.servlet.ServletContextEvent;importjavax.servlet.ServletContextListener;publicclassSysContextListenerimplementsServletContextListener{pri
员工管理系统（简单版） java王不二后端 java
1、项目介绍员工管理系统9功能简单，实现了用户的注册和登录、增删改查用户，适合新手学习2、项目技术后端框架：Servlet、mvc模式前端技术：jsp、css、JavaScript、JQuery3、开发环境JAVA版本：JDK1.8IDE类型：IDEA、Eclipse都可运行tomcat版本：Tomcat7-10版本均可数据库类型：MySql（5.x和8.x版本都可）maven项目：否硬件环境：W
SpringBoot使用注解扫描注册Java Web三大组件呆萌很 spring boot spring boot
使用注解扫描和注册JavaWeb三大组件（Servlet、Filter、Listener）非常方便。1.Servlet注册Servlet是JavaWeb开发的基础组件，用于处理客户端（通常是浏览器）发送的HTTP请求并生成响应。Controller是基于Servlet的封装。可以通过@WebServlet注解来注册Servlet，并使用@ServletComponentScan注解来扫描这些Ser
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

java实现的简单网页爬虫：Servlet + MySQL5.5（二）

你可能感兴趣的:(servlet,javaweb开发,网页爬虫,javaspider)