java从菜鸟到菜鸟

Springboot整合Webmagic实现网页爬虫并实时入库

我的上一篇写的是面试技术AOP，当然，这么多天不在线，总得来点技术干货啊！公司最近需要爬虫的业务，所以翻了一些开源框架最终还是选择国人的开源，还是不错的，定制化一套，从抽取，入库，保存，一应俱全。现在展示一下我找的框架对比吧。

简单demo会如下，抽取要求，定时获取新闻列表，二级页面标题正文等信息。

关于爬虫组件的使用调研

调研简介：因使用爬虫组件抓取网页数据和分页新闻数据，故对各爬虫组件进行调研，通过分析相关组件的功能和技术门槛以及多因素，得出满足项目需求的适宜组件。

功能需求	webmagic	crawler4j	heritrix3	nutch	spiderman2
抓取指定网页数据	√	√	√	√	√
抓取分页新闻数据	√	√	√	√	√
自定义存储抓取的网页数据内容或文件	支持存储至文件和数据库中	支持存储至文件和数据库中	job爬取数据默认存储为warc格式文件；支持存储至文件和数据库中	1.x不支持； 2.x放到了gora中，可以使用多种数据库，例如HBase, Cassandra, MySql来存储数据	支持存储至文件和数据库中
定时抓取网页数据	√	√	√	√	×
是否支持分布式爬取	√	√	√	√	√
性能需求	webmagic	crawler4j	heritrix3	nutch	spiderman2
可视化（1）配置化（2）都不可（0）	（2）提供注解配置	（2）可集成spring做配置	（1）提供webUI配置爬取job	(2) 采用脚本配置抓取	（0）编辑代码配置
使用和查看地址	https://github.com/code4craft/webmagic	https://github.com/yasserg/crawler4j	https://github.com/internetarchive/heritrix3	https://github.com/apache/nutch	https://gitee.com/l-weiwei/Spiderman2
组件热度star(s)和浏览次数（w)	s：7589 w：803	s：3372 w：309	s:1385 w:174	s：1869 w：245	s：1377 w：528
稳定性	稳定	稳定	稳定	稳定	较稳定
用户手册和开发文档	完善	较差没有开放的API，只提供了几个详细的源码事例	完善用户手册和开发文档介绍详细	完善用户手册和开发文档皆有最新版本，且详细	相对缺乏
社区生态	相对较好	一般	较好	较好	相对较差
开发门槛和学习成本	较低	较低	一般有自己的web控制台，操作者可以通过选择Crawler命令来操作控制台，需要学习相关知识，但是是java开发的开源爬虫框架	较高需要编写脚本，安装和使用都需要操作服务器，熟悉相关shell命令	较低
评价	垂直、全栈式、模块化爬虫。更加适合抓取特定领域的信息。它包含了下载、调度、持久化、处理页面等模块。	多数爬虫项目基于此组件进行开发，改造，扩展性和延展性相对较高，但是较基础，生态较差	文档丰富，资料齐全，框架成熟，适合大型爬虫项目，学习成本相对较高	apache下的开源爬虫程序，数据抓取解析以及存储只是其中的一个功能	架构简洁、易用，生态相对较差

综上所述：

认为选择小型框架webmagic相对适宜

选取原因：开发门槛低，简单、易用、容易上手、国内开发人员维护，文档详细，支持全栈式爬虫开发。

现在就拿springboot和webmagic做一个整合。

确定项目的技术要点，maven构建，orm为Spring Data JPA。

引入pom依赖：


        
            org.springframework.boot
            spring-boot-starter-web
        

        
            org.springframework.boot
            spring-boot-starter-test
            test
        
         
            us.codecraft
            webmagic-core
            0.7.3
        
        
            us.codecraft
            webmagic-extension
            0.7.3
        
         
            us.codecraft
            webmagic-selenium
            0.7.3
        
        
            org.springframework.boot
            spring-boot-starter-data-jpa
        
        
            mysql
            mysql-connector-java
            5.1.38

确定项目结构：

#模块介绍

processor模块负责抓取页面信息，执行抽取流程

pipeline模块负责保存抓取的信息

task模块负责设置定时任务，实现定时爬取网站信息

entity模块是实体信息模块

dao模块负责持久化数据

utils模块是工具类模块

我们这里只是做一个简单事例，代码直接贴上；

YangGuangPageContent.class

package com.longcloud.springboot.webmagic.entity;

import java.util.Date;

import javax.persistence.Column;
import javax.persistence.Entity;
import javax.persistence.Id;
import javax.persistence.Table;

/**
 * 新闻内容
 * @author 常青
 *
 */
@Entity
@Table(name = "yang_guang_page_content")
public class YangGuangPageContent {

	//新闻内容id
	@Id
	private String id;
	
	//新闻正文
	private String content;
	
	//新闻作者
	private String author;
	
	//列表的新闻类型
	private String type;
	
	//新闻发表地点
	private String address;
	
	//新闻标题
	private String title;
	
	//新闻的被关注状态
	private String status;
	
	//新闻发表时间
	@Column(name = "publish_time")
	private String publishTime;
	
	//新闻抓取时间
	@Column(name = "created_time")
	private Date createdTime;
	
	//新闻抓取者
	@Column(name = "created_by")
	private String createdBy;
	
	//列表的正文指向url
	@Column(name = "content_url")
	private String contentUrl;
	
	//新闻抓取时间
	@Column(name = "updated_time")
	private Date updatedTime;
	
	//新闻抓取者
	@Column(name = "updated_by")
	private String updatedBy;

	public String getId() {
		return id;
	}

	public void setId(String id) {
		this.id = id;
	}

	public String getContent() {
		return content;
	}

	public void setContent(String content) {
		this.content = content;
	}

	public String getAuthor() {
		return author;
	}

	public void setAuthor(String author) {
		this.author = author;
	}

	public String getPublishTime() {
		return publishTime;
	}

	public void setPublishTime(String publishTime) {
		this.publishTime = publishTime;
	}

	public Date getCreatedTime() {
		return createdTime;
	}

	public void setCreatedTime(Date createdTime) {
		this.createdTime = createdTime;
	}

	public String getCreatedBy() {
		return createdBy;
	}

	public void setCreatedBy(String createdBy) {
		this.createdBy = createdBy;
	}

	public String getType() {
		return type;
	}

	public void setType(String type) {
		this.type = type;
	}

	public String getAddress() {
		return address;
	}

	public void setAddress(String address) {
		this.address = address;
	}

	public String getTitle() {
		return title;
	}

	public void setTitle(String title) {
		this.title = title;
	}

	public String getStatus() {
		return status;
	}

	public void setStatus(String status) {
		this.status = status;
	}

	public String getContentUrl() {
		return contentUrl;
	}

	public void setContentUrl(String contentUrl) {
		this.contentUrl = contentUrl;
	}

	public Date getUpdatedTime() {
		return updatedTime;
	}

	public void setUpdatedTime(Date updatedTime) {
		this.updatedTime = updatedTime;
	}

	public String getUpdatedBy() {
		return updatedBy;
	}

	public void setUpdatedBy(String updatedBy) {
		this.updatedBy = updatedBy;
	}

	
	
}

dao:

package com.longcloud.springboot.webmagic.dao;

import java.util.Date;

import javax.transaction.Transactional;

import org.springframework.data.jpa.repository.JpaRepository;
import org.springframework.data.jpa.repository.Modifying;
import org.springframework.data.jpa.repository.Query;
import org.springframework.stereotype.Repository;

import com.longcloud.springboot.webmagic.entity.YangGuangPageContent;

@Repository
public interface YangGuangPageContentDao extends JpaRepository {

	//根据url查询正文
	YangGuangPageContent findByContentUrl(String url);
	
	//更新部分字段
	@Transactional
	@Modifying(clearAutomatically = true)
	@Query("update YangGuangPageContent set content = ?1 , updated_time = ?2 , updated_by = ?3 where content_url = ?4")
	int updateContent(String content,Date updatedTime,
			          String updatedBy,String contentUrl);
}

抽取逻辑：

抽取新闻list ---YangGuangPageProcessor .class

package com.longcloud.springboot.webmagic.processor;

import java.util.ArrayList;
import java.util.Date;
import java.util.List;

import org.apache.commons.lang3.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;

import com.longcloud.springboot.webmagic.entity.YangGuangPageContent;
import com.longcloud.springboot.webmagic.pipeline.YangGuangPagePipeline;
import com.longcloud.springboot.webmagic.utils.UUIDUtil;
import com.longcloud.springboot.webmagic.vo.YangGuangVo;

import us.codecraft.webmagic.Page;
import us.codecraft.webmagic.Site;
import us.codecraft.webmagic.processor.PageProcessor;
import us.codecraft.webmagic.selector.Selectable;

@Component
public class YangGuangPageProcessor implements PageProcessor {

	@Autowired
	private static YangGuangPagePipeline yangGuangPagePipeline;
	
	private static Logger logger = LoggerFactory.getLogger(YangGuangPageProcessor.class);

    // 正则表达式\\. \\转义java中的\ \.转义正则中的.
    // 主域名
	
	public static final String URL = "http://58.210.114.86/bbs/";
	
    public static final String BASE_URL = "http://58.210.114.86/bbs/forum.php?mod=forumdisplay&fid=2&page=1";

    public static final String PAGE_URL = "http://58.210.114.86/bbs/forum.php?mod=forumdisplay&fid=2&page=1";
    
    //设置抓取参数。详细配置见官方文档介绍 抓取网站的相关配置，包括编码、抓取间隔、重试次数等
    private Site site = Site.me()
            .setDomain(BASE_URL)
            .setSleepTime(1000)
            .setRetryTimes(30)
            .setCharset("utf-8")
            .setTimeOut(5000);
            //.setUserAgent("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_2) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.65 Safari/537.31");

  
    @Override
    public Site getSite() {
        return site;
    }

    @Override
    public void process(Page page) {
        	 String[] pages = page.getUrl().toString().split("page=");
        	 Long size = Long.valueOf(pages[1]);
        	 if(size !=null && size <=2) {
             
        	 YangGuangVo yangGuangVo =  new YangGuangVo();
             //获取所有列表框内容
        	 List list = page.getHtml().xpath("//div[@class='bm_c']/form/table/tbody").nodes();

             //获取当前页面的所有列表
             if(list != null && list.size() > 0){
                 List yangGuangPages = new ArrayList();

                 for(int i = 0; i < list.size(); i++){
                     Selectable s = list.get(i);
                     
                     //正文，地址等信息
                     String contentUrl = s.xpath("//tr/td[@class='icn']/a/@href").toString();
                     String type = s.xpath("//tr/th[@class='common']/em[1]/a/text()").toString();
                     String status = s.xpath("//th[@class='common']/img[1]/@alt").toString();
                     String title = s.xpath("//th[@class='common']/a[@class='s xst']/text()").toString();
                     String author = s.xpath("//td[@class='by']/cite/a/text()").toString();
                     String address = s.xpath("//th[@class='common']/em[2]/text()").toString();
                     String publishTime = s.xpath("//td[@class='by']/em/span/span/@title").toString();
                     if(StringUtils.isEmpty(type)) {
                    	 type = s.xpath("//tr/th[@class='new']/em[1]/a/text()").toString();
                     }
                     if(StringUtils.isEmpty(status)) {
                    	 status = s.xpath("//th[@class='new']/img[1]/@alt").toString();
                     }
                     if(StringUtils.isEmpty(title)) {
                    	 title = s.xpath("//th[@class='new']/a[@class='s xst']/text()").toString();
                     }
                     if(StringUtils.isEmpty(address)) {
                    	 address = s.xpath("//th[@class='new']/em[2]/text()").toString();
                     }
                     if(StringUtils.isNotEmpty(contentUrl)){
                    	 YangGuangPageContent  yangGuangPage = new YangGuangPageContent();
                         yangGuangPage.setId(UUIDUtil.uuid());
                         yangGuangPage.setContentUrl(URL+contentUrl);
                         yangGuangPage.setCreatedBy("system");
                         yangGuangPage.setCreatedTime(new Date());
                         yangGuangPage.setType(type);
                         yangGuangPage.setStatus(status);
                         yangGuangPage.setTitle(title);
                         yangGuangPage.setAuthor(author);
                         yangGuangPage.setAddress(address);
                         yangGuangPage.setPublishTime(publishTime);

                         logger.info(String.format("页面的正文指向路径为：[%s]",contentUrl));

                         yangGuangPages.add(yangGuangPage);
                     }
                     
                 }
                 yangGuangVo.setPageList(yangGuangPages);
             }
             page.putField("yangGuang", yangGuangVo);
             //page.putField("yangGuangHtml", page.getHtml());
          }
        	 page.addTargetRequests(doListUrl());
    }
    
    /*public static void main(String[] args) {
    	Spider spider = Spider.create(new YangGuangPageProcessor());
        spider.addUrl(BASE_URL);
        spider.addPipeline();
        spider.thread(5);
        spider.setExitWhenComplete(true);
        spider.start();
        spider.stop();
	}*/
    
    
    public List doListUrl(){
        List list = new ArrayList();
        for(int i = 2;i<3;i++) {
            list.add("http://58.210.114.86/bbs/forum.php?mod=forumdisplay&fid=2&page=" + i);
        }
        return list;
    }

}

保存新闻list

YangGuangPagePipeline .class

package com.longcloud.springboot.webmagic.pipeline;

import java.util.ArrayList;
import java.util.List;
import java.util.Map;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;

import com.longcloud.springboot.webmagic.dao.YangGuangPageContentDao;
import com.longcloud.springboot.webmagic.entity.YangGuangPageContent;
import com.longcloud.springboot.webmagic.processor.YangGuangPageContentProcessor;
import com.longcloud.springboot.webmagic.vo.YangGuangVo;

import us.codecraft.webmagic.ResultItems;
import us.codecraft.webmagic.Spider;
import us.codecraft.webmagic.Task;
import us.codecraft.webmagic.pipeline.Pipeline;

@Component
public class YangGuangPagePipeline implements Pipeline{

	
	
	@Autowired
	private YangGuangPageContentDao  yangGuangContentDao;
	
	@Autowired
	private YangGuangPageContentPipeline yangGuangPageContentPipeline;

	private Logger logger = LoggerFactory.getLogger(YangGuangPagePipeline.class);
	
	@Override
	public void process(ResultItems resultItems, Task task) {
                YangGuangVo yangGuangVo = (YangGuangVo) resultItems.get("yangGuang");
                
                if(yangGuangVo != null){
                	
                	System.out.println(yangGuangVo);
                	List list = new ArrayList<>();
                	if(yangGuangVo.getPageList()!=null && yangGuangVo.getPageList().size()>0) {
                		list = yangGuangContentDao.save(yangGuangVo.getPageList());
                	}
                	if(list.size()>0) {
                		for(YangGuangPageContent yangGuangPage : yangGuangVo.getPageList()){
                        	logger.info("开始正文内容的抓取");
    	                    //这里我们对后面的页面进行了深度的抓取,获取新闻的二级页面信息
    	                    Spider spider = Spider.create(new YangGuangPageContentProcessor());
    	                    spider.addUrl(yangGuangPage.getContentUrl());
    	                    logger.info("抓取正文的URL："+yangGuangPage.getContentUrl());
    	                    spider.addPipeline(yangGuangPageContentPipeline)
    	                    .addPipeline(new YangGuangFilePipline());
    	                    spider.thread(1);
    	                    spider.setExitWhenComplete(true);
    	                    spider.start();
    	                    spider.stop();
    	                    logger.info("正文内容抓取结束");
                        }
                	}
                    
            }
	}
}

抽取新闻每个列表的正文部分：

YangGuangPageContentProcessor .class

package com.longcloud.springboot.webmagic.processor;

import java.util.Date;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.stereotype.Component;

import com.longcloud.springboot.webmagic.entity.YangGuangPageContent;

import us.codecraft.webmagic.Page;
import us.codecraft.webmagic.Site;
import us.codecraft.webmagic.processor.PageProcessor;

@Component
public class YangGuangPageContentProcessor implements PageProcessor {

	private static Logger logger = LoggerFactory.getLogger(YangGuangPageContentProcessor.class);


	public static final String URL = "http://58.210.114.86/bbs/";
    //设置抓取参数。详细配置见官方文档介绍 抓取网站的相关配置，包括编码、抓取间隔、重试次数等
    private Site site = Site.me()
            .setDomain(URL)
            .setSleepTime(1000)
            .setRetryTimes(30)
            .setCharset("utf-8")
            .setTimeOut(5000);
            //.setUserAgent("Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_2) AppleWebKit/537.31 (KHTML, like Gecko) Chrome/26.0.1410.65 Safari/537.31");
	@Override
	public void process(Page page) {
		//获取正文的各个参数
 			YangGuangPageContent yangGuangPageContent = new YangGuangPageContent();
			String content = page.getHtml().xpath("//div[@id='postlist']/div/table/tbody/tr/td[2]").toString();
			//div[@id='JIATHIS_CODE_HTML4']/div/table/tbody/tr/td/text()正文内容
			System.out.println(content);
			yangGuangPageContent.setContentUrl(page.getUrl().toString());
			yangGuangPageContent.setContent(content);
			yangGuangPageContent.setUpdatedBy("system");
			yangGuangPageContent.setUpdatedTime(new Date());
			page.putField("yangGuangPageContent", yangGuangPageContent);
			//page.putField("yangGuangHtml", page.getHtml());
		
	}

	@Override
	public Site getSite() {
		return site;
	}

}

保存正文部分：

YangGuangPageContentPipeline .class

package com.longcloud.springboot.webmagic.pipeline;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;

import com.longcloud.springboot.webmagic.dao.YangGuangPageContentDao;
import com.longcloud.springboot.webmagic.entity.YangGuangPageContent;

import us.codecraft.webmagic.ResultItems;
import us.codecraft.webmagic.Task;
import us.codecraft.webmagic.pipeline.Pipeline;

@Component
public class YangGuangPageContentPipeline implements Pipeline{

	@Autowired
	private YangGuangPageContentDao yangGuangContentDao;
	
	private static Logger logger = LoggerFactory.getLogger(YangGuangPageContentPipeline.class);
	@Override
	public void process(ResultItems resultItems, Task task) {
				YangGuangPageContent yangGuangPageContent = (YangGuangPageContent) resultItems.get("yangGuangPageContent");
				if(yangGuangPageContent!=null && yangGuangPageContent.getContentUrl()!=null) {
					YangGuangPageContent dbYangGuangPageContent=yangGuangContentDao.findByContentUrl(yangGuangPageContent.getContentUrl());
					//更新列表的正文内容
					if(dbYangGuangPageContent!=null) {
						logger.info(yangGuangPageContent.getContent());
						yangGuangContentDao.updateContent(yangGuangPageContent.getContent(), 
								yangGuangPageContent.getUpdatedTime(), 
								yangGuangPageContent.getUpdatedBy(), 
								dbYangGuangPageContent.getContentUrl());
					
					}
				}else {
					logger.info("此列表无内容");
				}
			
			            	
            
		
	}

}

定时抓取任务

SpingBootWebmagicJob.class

package com.longcloud.springboot.webmagic.task;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.scheduling.annotation.EnableScheduling;
import org.springframework.scheduling.annotation.Scheduled;
import org.springframework.stereotype.Component;

import com.longcloud.springboot.webmagic.dao.YangGuangPageContentDao;
import com.longcloud.springboot.webmagic.pipeline.YangGuangPagePipeline;
import com.longcloud.springboot.webmagic.processor.YangGuangPageProcessor;

import us.codecraft.webmagic.Spider;

@Component
@EnableScheduling
public class SpingBootWebmagicJob {

	private Logger logger = LoggerFactory.getLogger(SpingBootWebmagicJob.class);
	
	public static final String BASE_URL = "http://58.210.114.86/bbs/forum.php?mod=forumdisplay&fid=2&page=1";
	
	@Autowired
	private YangGuangPageContentDao yangGuangContentDao;
	
	@Autowired
	YangGuangPagePipeline yangGuangPagePipeline;
	
	@Scheduled(cron = "${webmagic.job.cron}")
	//@PostConstruct启动项目则开启
	public void job() {
		
     long startTime, endTime;
     System.out.println("【爬虫开始】");
     startTime = System.currentTimeMillis();
     logger.info("爬取地址：" + BASE_URL);
     try {
    	 yangGuangContentDao.deleteAll();
         Spider spider = Spider.create(new YangGuangPageProcessor());
         spider.addUrl(BASE_URL);
         spider.addPipeline(yangGuangPagePipeline);
        // .addPipeline(new YangGuangFilePipline());
         spider.thread(5);
         spider.setExitWhenComplete(true);
         spider.start();
         spider.stop();
     } catch (Exception e) {
         logger.error(e.getMessage(),e);
     }
     endTime = System.currentTimeMillis();
     System.out.println("【爬虫结束】");

     System.out.println("阳光便民任务抓取耗时约" + ((endTime - startTime) / 1000) + "秒，已保存到数据库.");

 }

	
}

别忘了application的配置哦：

server.port=8085
server.context-path=/
#database
spring.datasource.driver-class-name=com.mysql.jdbc.Driver
spring.datasource.url=jdbc:mysql://localhost：3306/scrapy-webmagic?useSSL=false&useUnicode=yes&characterEncoding=UTF-8&zeroDateTimeBehavior=convertToNull&allowMultiQueries=true
spring.datasource.username=root
spring.datasource.password=webmagic123
#connector-pool
spring.datasource.hikari.maximum-pool-size=20
spring.datasource.hikari.minimum-idle=5
#JPA
spring.jpa.database-platform=org.hibernate.dialect.MySQL5InnoDBDialect
spring.jpa.show-sql=true
#cron
#每天凌晨一点爬取一次
webmagic.job.cron=0 0 0 1 * ? *

到此一个定时爬取新闻的技术就完成了。欢迎继续关注我哦！

你可能感兴趣的:(Spring技术)

Spring技术内幕：设计理念和整体架构概述各自安好吧 spring 架构 java 后端
程序员都很崇拜技术大神，很大一部分是因为他们发现和解决问题的能力，特别是线上出现紧急问题时，总是能够快速定位和解决。一方面，他们有深厚的技术基础，对应用的技术知其所以然，另一方面，在采坑的过程中不断总结，积累了很多经验。相信大家都使用过Spring，有些人了解它的核心：IOC和AOP，但只是了解它们的基本概念、使用了反射和动态代理，关于如何管理对象、代理的具体实现了解的比较浅。有些人使用Sprin
Spring技术内幕学习-1 Sunny_damon
Spring的核心：IoC容器和AOP1.IoC基本概念IoC：依赖反转，它可以在对象生成或者初始化时直接将数据注入到对象中，也可以通过将对象注入到对象数据域中的方式来注入对方法调用的依赖。IoC的作用：降低面向对象设计的复杂性（将复杂的依赖关系简单化即起到解耦的作用）、提高系统可测试性。IoC容器注入方式：接口注入、setter注入、构造方法注入2.IoC容器系列设计与实现BeanFactory
阿里云中间件开源往事阿里巴巴中间件中间件阿里云云计算开源
分布式架构和云原生重塑了中间件的游戏规则，这给国内开发者提供了重新定义中间件的历史机遇。在分布式架构流行前，国外IT厂商引领着中间件市场的发展，且以闭源、重商业的服务形式为主；随着云计算和互联网的普及，阿里将RPC框架、消息队列、服务发现、配置中心、分布式事务、限流降级等核心应用中间件技术对外开源，加速了分布式架构在国内的落地，也使得开发者在Spring技术栈以外多了一种选择。而云原生则实现了中间
基于SpringBoot实现的社区疫情管理系统星尘库数据库 java spring boot 后端 java
基于SpringBoot实现的社区疫情管理系统前端采用了Vue+BootStrap技术进行开发,数据库为中小型企业常用的mysql数据库，后台技术采用SpringBoot+Mybaits+Spring技术框架由于老师叫我做的是居民隔离时的物资发放，然后由社区管理者发放物资，居民接收所以第六个功能就特别重要。一、社区用户功能：每日健康上报功能描述每天必须上报否则发送提醒如图1所示：相对应管理员功能：
【Java】Spring入门 Sudo_Wang Java java spring 开发语言
学习目标能够说出Spring的体系结构能够编写IOC入门案例能够编写DI入门案例能够配置setter方式注入属性值能够配置构造方式注入属性值能够理解什么是自动装配一、Spring简介1Spring课程介绍问题导入我们为什么要学习Spring框架？1.1为什么要学Spring技术是JavaEE开发必备技能，企业开发技术选型命中率>90%专业角度简化开发，降低企业级开发的复杂性框架整合，高效整合其他技
初识Spring 小林学习编程 spring java 后端
文章目录1、为什么要学Spring2、Spring家族3、Spring发展史4、Spring核心概念5、IOC入门6、Dl入门1、为什么要学SpringSpring技术是JavaEE开发必备技能，企业开发技术选型命中率>90%专业角度简化开发，降低企业级开发的复杂性框架整合，高效整合其他技术，提高企业级应用开发与运行效率简化开发IOC(控制反转)AOP(面向切面编程)事务处理框架整合MyBatis
不懂源码？来看看阿里P8亲自手码的Spring源码解析整套笔记，高薪offer唾手可得！码农小芷
正文开发人员面对突如其来的变化，无论在架构选型，还是在日常开发中，总会面临各种挑战和考验。唯有系统性地掌握SpringFramework编程思想、设计理念，以及具体的实现方式，方可游刃有余，以免进退失据。作为Spring技术生态的基石，SpringFramework无论在设计，还是在实现上，都是一个优秀的框架，许多细节方面是非常值得我们学习的，包括：Java语言特性的运用，如反射、动态代理、枚举、
Spring第一天 lisus2007 Java spring java 后端
学习目标能够说出Spring的体系结构能够编写IOC入门案例能够编写DI入门案例能够配置setter方式注入属性值能够配置构造方式注入属性值能够理解什么是自动装配一、Spring简介1Spring课程介绍问题导入我们为什么要学习Spring框架？1.1为什么要学Spring技术是JavaEE开发必备技能，企业开发技术选型命中率>90%专业角度简化开发，降低企业级开发的复杂性框架整合，高效整合其他技
初识Spring框架及Spring源码架构 wwwyx12138 spring java 后端
1.Spring框架概念Spring框架是一个开源的JavaEE的应用程序。Spring是众多开源java项目中的一员，基于分层的javaEE应用一站式轻量级开源框架，主要核心是IOC（控制反转/依赖注入）和aop（面向切面编程）两大技术，实现项目开发过程中的轻松解耦，提高项目开发效率。在项目中引用Spring技术可以带来以下好处：降低组件之间的耦合度，实现软件各层之间的解耦。可以使用容器提供的众
Spring技术实战-重新回顾一下异常重试框架Spring Retry的功能指南洛神灬殇
重试机制的业务背景外部服务对于调用者来说一般都是不可靠的，尤其是在网络环境比较差的情况下，网络抖动很容易导致请求超时等异常情况，这时候就需要用失败重试策略重新调用API接口来获取。在分布式系统中，为了保证数据分布式事务的强一致性，大家在调用RPC接口或者发送MQ时，针对可能会出现网络抖动请求超时情况采取一下重试操作。大家用的最多的重试方式就是MQ了，但是如果你的项目中没有引入MQ，那就不方便了。重
2. 示例:Spring Boot 入门我超爱写bug spring boot spring boot 后端 java 开发语言入门
1.1概述SpringBoot是由Pivotal团队提供的全新框架，其设计目的是用来简化新Spring应用的初始搭建以及开发过程。习惯优于配置1.2为什么使用SpringBootJ2EE笨重的开发、繁多的配置、低下的开发效率、复杂的部署流程、第三方技术集成难度大。1.3SpringBoot是什么一站式整合所有应用框架的框架；并且完美整合Spring技术栈；https://spring.io/pro
SpirngMVC的理解和使用杀了小惠 java spring boot
什么是SpirngMVC要了解SpirngMVC，首先要了解MVC模式，MVC模式是指模型(Model)、视图(View)、控制器(Controller)的简写，其核心思想是通过将请求处理控制，业务逻辑，数据封装，数据显示等流程节点分离的思想来组织代码所以，SpringMVC是一款基于MVC设计模式思想实现的MVC框架，属于Spring技术栈的一部分。可以帮助我们进行更加简洁的Web开发，并且天生
SpringBoot 就这一篇全搞定 Dashesand spring boot 后端 java
SpringBoot就这一篇全搞定文章收集在GitHubJavaEgg中，欢迎star+指导JavaEgg——《“Java技术员”成长手册》，包含Java基础、框架、存储、搜索、优化、分布式等必备知识，N线互联网开发必备技能兵器谱。笔记来源尚硅谷教学笔记一、HelloSpringBoot1、SpringBoot简介简化Spring应用开发的一个框架；整个Spring技术栈的一个大整合；J2EE开发
SpringFramework实战指南（二）晴天学长 Java java maven 开发语言
SpringFramework实战指南（二）2.1Spring和SpringFramework概念2.2SpringFramework主要功能模块2.3SpringFramework主要优势2.1Spring和SpringFramework概念Spring-ioc广义的Spring：Spring技术栈（全家桶）广义上的Spring泛指以SpringFramework为基础的Spring技术栈。经过
一、Spring Boot 入门(尚硅谷) 21号新秀_邓肯
感谢尚硅谷的讲解,大家可以去看看1、SpringBoot简介简化Spring应用开发的一个框架；整个Spring技术栈的一个大整合；J2EE开发的一站式解决方案；2、微服务2014，martinfowler微服务：架构风格（服务微化）一个应用应该是一组小型服务；可以通过HTTP的方式进行互通；单体应用：ALLINONE微服务：每一个功能元素最终都是一个可独立替换和独立升级的软件单元；详细参照微服务
各大厂内部超流行的“SpringBoot+ 微服务指南”，理论与实战双管齐下时光_fa6a
img有幸从一位在阿里的朋友那得到Alibaba内部出品强推的“SpringBoot+微服务学习指南”，秉承好东西要分享的原则，今天就来秀一把，试试这份“Springboot+微服务学习指南”是否也能让你的技术能力提升得事半功倍！SpringBoot构建小系统到架构分布式大系统（理论+实战）SpringBoot是目前Spring技术体系中炙手可热的框架之一,既可用于构建业务复杂的企业应用系统，也可
Spring技术内幕笔记之IOC的实现 zhouhaitao_cherry spring java
IOC容器的实现依赖反转：依赖对象的获得被反转了，于是依赖反转更名为：依赖注入。许多应用都是由两个或者多个类通过彼此的合作来实现业务逻辑的，这使得每个对象都需要与其合作的对象的引用，如果这个获取过程需要自身实现，那么这将导致代码高度耦合并且难以测试。----维基百科依赖控制反转有很多实现方式。在Spring中，IOC容器是实现这个模式的载体，它可以在对象生成或初始化时直接将数据注入到对象中，也可以
Spring技术内幕笔记之SpringMvc zhouhaitao_cherry spring java SpringMVC
WebApplicationContext接口的类继承关系org.springframework.web.context.ContextLoader#initWebApplicationContext对IOC容器的初始化SpringMvc如何设计DispatcherServlet类继承关系MVC处理流程图如下：DispatcherServlet的工作大致可以分为两个部分：初始化部分，由initSe
一、为何我决定写Spring Cloud专栏 YourBatman 【方向盘】-Spring Cloud Spring Cloud Spring Boot SC SB Spring Cloud专栏
生命太短暂，不要去做一些根本没有人想要的东西。本文已被https://www.yourbatman.cn收录，里面一并有Spring技术栈、MyBatis、JVM、中间件等小而美的专栏供以免费学习。关注公众号【BAT的乌托邦】逐个击破，深入掌握，拒绝浅尝辄止。代码下载地址：https://github.com/f641385712/spring-cloud-learning目录前言为何我决定写Sp
Spring boot入门饼子_2264
1、SpringBoot简介SpringBoot是简化Spring应用开发的一个框架，整个Spring技术栈的大整合，为J2EE开发提供一站式解决方案，也是为微服务提供快速搭建应用的基础。2、在IDEA中快速地创建SpringBoot项目使用SpringInitializer，选择我们需要的模块，向导会联网创建SpringBoot项目默认生成的SpringBoot项目：1、主程序已经生成好了，我们
Springboot2.6以下版本对cookie的samesite设置的通用方法 aol_aog 安全
通过安全扫描工具对spring技术栈开发的应用进行漏洞检查时，通常会扫描出关于cookie相关的漏洞，其中一个是:CookiewithoutSameSiteattribute，对于其描述通常如下:WhencookieslacktheSameSiteattribute,Webbrowsersmayapplydifferentandsometimesunexpecteddefaults.Itisthe
Spring 实践指南格里菲斯858 JAVA 学习 spring wpf
一.Spring简介「Spring」是指整个SpringFramework生态系统，而「SpringFramework」则是指Spring框架本身1.为什么学？学什么？（1）为什么学？Spring技术是JavaEE开发必备技能，企业开发技术选型命中率>90%简化开发：降低企业级开发的复杂性框架整合：高效整合其他技术，提高企业级应用开发与运行效率（2）学什么？简化开发：IOC:控制反转AOP:面向切
一篇文章带你了解SpringBoot目录结构吃饭睡觉打代码想南南 spring boot 后端 java
前言SpringBoot是整合Spring技术栈的一站式框架，是简化Spring技术栈的快速开发脚手架，是一个能够快速构建生产级别的Spring应用的工具。SpringBoot是目前流行的微服务框架，倡导“约定优于配置”，简化Spring项目搭建及开发过程。springboot提供了很多核心的功能，比如自动化配置、starter简化maven配置、内嵌servlet容器、应用监控等功能。本文就来讲
@Autowired注解原理 Java学习训练营 Java原理 spring boot java
前言使用spring开发时，进行配置主要有两种方式，一是xml的方式，二是javaconfig的方式。spring技术自身也在不断的发展和改变，从当前springboot的火热程度来看，javaconfig的应用是越来越广泛了，在使用javaconfig的过程当中，我们不可避免的会有各种各样的注解打交道，其中，我们使用最多的注解应该就是@Autowired注解了。这个注解的功能就是为我们注入一个定
SpringBoot2.X基础教程：SpringBoot整合JdbcTemplate【附源码】 Java程序鱼 SpringBoot专栏 spring boot spring
微信号：hzy1014211086，如果你正在学习SpringBoot，可以加入我们的Spring技术交流群，共同成长文章目录一、准备数据表二、引入依赖三、配置数据源四、编写领域对象五、新增六、修改七、查询八、删除九、源码JdbcTemplate是Spring自带的JDBC模板组件，底层实现了对JDBC的封装，我们可以借助JdbcTemplate来执行所有数据库操作，例如插入、更新、删除和从数据库
二、SpringFramework 介绍一只小熊猫呀 #Spring Framework SpringFramework
本章概要Spring和SpringFramework概念SpringFramework主要功能模块SpringFramework主要优势2.1Spring和SpringFramework概念https://spring.io/projects广义的Spring：Spring技术栈（全家桶）广义上的Spring泛指以SpringFramework为基础的Spring技术栈。经过十多年的发展，Spri
SpringBoot框架用法解析大全（没有你找不到的）刻苦的樊同学 SpringBoot springboot
本章内容很多，是摘抄的笔记，但是内容很值得同学们学习，如果想深入了解springboot的话可以好好看看。一、SpringBoot入门1、SpringBoot简介简化Spring应用开发的一个框架；整个Spring技术栈的一个大整合；J2EE开发的一站式解决方案；2、微服务2014，martinfowler微服务：架构风格（服务微化）一个应用应该是一组小型服务；可以通过HTTP的方式进行互通；单体
Spring Framework详解 Nuage1225 Spring框架 spring java 后端
学习目标能够说出Spring的体系结构能够编写IOC入门案例能够编写DI入门案例能够配置setter方式注入属性值能够配置构造方式注入属性值能够理解什么是自动装配一、Spring简介1Spring课程介绍问题导入我们为什么要学习Spring框架？1.1为什么要学Spring技术是JavaEE开发必备技能，企业开发技术选型命中率>90%专业角度简化开发，降低企业级开发的复杂性框架整合，高效整合其他技
从头撸到脚，SpringBoot 就一篇全搞定！编码博客控程序员 JAVA Spring Boot spring boot
一、HelloSpringBoot1、SpringBoot简介简化Spring应用开发的一个框架；整个Spring技术栈的一个大整合；J2EE开发的一站式解决方案；2、微服务微服务：架构风格（服务微化）一个应用应该是一组小型服务；可以通过HTTP的方式进行互通；单体应用：ALLINONE微服务：每一个功能元素最终都是一个可独立替换和独立升级的软件单元；3、环境准备jdk1.8：SpringBoot
SpringBoot 就这一篇全搞定编码博客控 SpringBoot SpringBoot
一、HelloSpringBoot1、SpringBoot简介简化Spring应用开发的一个框架；整个Spring技术栈的一个大整合；J2EE开发的一站式解决方案；2、微服务微服务：架构风格（服务微化）一个应用应该是一组小型服务；可以通过HTTP的方式进行互通；单体应用：ALLINONE微服务：每一个功能元素最终都是一个可独立替换和独立升级的软件单元；详细参照微服务文档3、环境准备jdk1.8：S
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found