imxushuai

十次方人工智能笔记一：网络爬虫

爬虫框架WebMagic

架构解析

WebMagic的设计目标是尽量的模块化，并体现爬虫的功能特点。这部分提供非常简单、灵活的API，在基本不改变开发模式的情况下，编写一个爬虫。

WebMagic的结构分为Downloader、PageProcessor、Scheduler、Pipeline四大组件，并由Spider将它们彼此组织起来。这四大组件对应爬虫生命周期中的下载、处理、管理和持久化等功能。而Spider则将这几个组件组织起来，让它们可以互相交互，流程化的执行，可以认为Spider是一个大的容器，它也是WebMagic逻辑的核心。

WenMagic组件：

Downloader

Downloader负责从互联网上下载页面，以便后续处理。WebMagic默认使用了ApacheHttpClient作为下载工具。
PageProcesser

PageProcessor负责解析页面，抽取有用信息，以及发现新的链接。WebMagic使用Jsoup作为HTML解析工具，并基于其开发了解析XPath的工具Xsoup。

在这四个组件中，PageProcessor对于每个站点每个页面都不一样，是需要使用者定制的部分。
Scheduler

Scheduler负责管理待抓取的URL，以及一些去重的工作。WebMagic默认提供了JDK的内存队列来管理URL，并用集合来进行去重。也支持使用Redis进行分布式管理。
Pipeline

Pipeline负责抽取结果的处理，包括计算、持久化到文件、数据库等。WebMagic默认提供了“输出到控制台”和“保存到文件”两种结果处理方案。

API

Spider API

方法	说明	示例
create(PageProcessor)	创建Spider	Spider.create(new GithubRepoProcessor())
addUrl(String…)	添加初始的URL	Spider.addUrl(“http://webmagic.io/docs/”)
thread(n)	开启n个线程	Spider.thread(5)
run()	启动，会阻塞当前线程执行	Spider.run()
start()/runAsync()	异步启动，当前线程继续执行	Spider.start()
stop()	停止爬虫	Spider.stop()
addPipeline(Pipeline)	添加一个Pipeline，一个Spider可以有多个Pipeline	Spider .addPipeline(new ConsolePipeline())
setScheduler(Scheduler)	设置Scheduler，一个Spider只能有一个Scheduler	Spider.setScheduler(new RedisScheduler())
setDownloader(Downloader)	设置Downloader，一个Spider只能有一个Downloader	Spider.setDownloader(new SeleniumDownloader())
get(String)	同步调用，并直接取得结果	ResultItems result = Spider.get(“http://webmagic.io/docs/”)
getAll(String…)	同步调用，并直接取得一堆结果	List results = Spider.getAll(“http://webmagic.io/docs/”,“http://webmagic.io/xxx”)

同时Spider的其他组件（Downloader、Scheduler、Pipeline）都可以通过set方法来进行设置。

Site API

方法	说明	示例
setCharset(String)	设置编码	site.setCharset(“utf-8”)
setUserAgent(String)	设置UserAgent	site.setUserAgent(“Spider”)
setTimeOut(int)	设置超时时间，单位是毫秒	site.setTimeOut(3000)
setRetryTimes(int)	设置重试次数	site.setRetryTimes(3)
setCycleRetryTimes(int)	设置循环重试次数	site.setCycleRetryTimes(3)
addCookie(String,String)	添加一条cookie	site.addCookie(“dotcomt_user”,“code4craft”)
setDomain(String)	设置域名，需设置域名后，addCookie才可生效	site.setDomain(“github.com”)
addHeader(String,String)	添加一条addHeader	site.addHeader(“Referer”,“https://github.com”)
setHttpProxy(HttpHost)	设置Http代理	site.setHttpProxy(new HttpHost(“127.0.0.1”,8080))
setSleepTime	间隔时间设置	site.setSleepTime(100)

PageProcessor

爬取页面全部内容

需求：编写爬虫程序，爬取csdn中博客的内容 https://blog.csdn.net/

创建工程，引入依赖


<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0modelVersion>

    <groupId>com.xushuaigroupId>
    <artifactId>webmagic_demoartifactId>
    <version>1.0-SNAPSHOTversion>


    <dependencies>
        <dependency>
            <groupId>us.codecraftgroupId>
            <artifactId>webmagic-coreartifactId>
            <version>0.7.3version>
        dependency>
        <dependency>
            <groupId>us.codecraftgroupId>
            <artifactId>webmagic-extensionartifactId>
            <version>0.7.3version>
        dependency>
    dependencies>
project>

实现页面爬取

package com.xushuai.magic.spider;

import us.codecraft.webmagic.Page;
import us.codecraft.webmagic.Site;
import us.codecraft.webmagic.Spider;
import us.codecraft.webmagic.pipeline.ConsolePipeline;
import us.codecraft.webmagic.processor.PageProcessor;

/**
 * Spider Class Demo
 */
public class PageProcessorDemo1 implements PageProcessor {


    public void process(Page page) {
        System.out.println(page.getHtml().toString());
    }

    public Site getSite() {
        return Site.me().setSleepTime(100).setRetryTimes(3);
    }

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                .run();
    }
}

Page代表了从Downloader下载到的一个页面——可能是HTML，也可能是JSON或者其他文本格式的内容。Page是WebMagic抽取过程的核心对象，它提供一些方法可供抽取、结果保存等。

Site用于定义站点本身的一些配置信息，例如编码、HTTP头、超时时间、重试策略等、代理等，都可以通过设置Site对象来进行配置。

爬取指定内容

使用xpath来抓去网页指定部分内容

page.getHtml().xpath("//*[@id=\"nav\"]/div/div/ul/li[5]/a");

添加目标地址

添加目标地址，将目标地址中所有的链接添加到待爬取列表

page.addTargetRequests(page.getHtml().links().all());

目标地址正则匹配

需求：只提取博客的文章详细页内容，并提取标题

page.addTargetRequests(page.getHtml()
                .links().regex("https://blog.csdn.net/[a-z 0-9-]+/article/details/[0-9]{8}").all());

Pipeline

ConsolePipeline 控制台输出（省略）

FilePipeline 文件输出

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                // 添加控制台输出管道
                .addPipeline(new ConsolePipeline())
                // 添加文件输出管道
                .addPipeline(new FilePipeline("F:/data"))
                .run();
    }

JsonFilePipeline Json输出

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                // 添加控制台输出管道
                .addPipeline(new ConsolePipeline())
                // 添加文件输出管道
                .addPipeline(new FilePipeline("F:/data"))
                // 添加Json输出管道
                .addPipeline(new JsonFilePipeline("F:/json"))
                .run();
    }

Custom Pipeline 自定义输出

编写自定义管道类

package com.xushuai.magic.pipeline;

import us.codecraft.webmagic.ResultItems;
import us.codecraft.webmagic.Task;
import us.codecraft.webmagic.pipeline.Pipeline;

/**
 * 自定义输出管道
 */
public class CustomPipeline implements Pipeline {
    public void process(ResultItems resultItems, Task task) {
        System.out.println(resultItems.get("title"));
    }
}

添加自定义管道

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                // 添加控制台输出管道
                .addPipeline(new ConsolePipeline())
                // 添加文件输出管道
                .addPipeline(new FilePipeline("F:/data"))
                // 添加Json输出管道
                .addPipeline(new JsonFilePipeline("F:/json"))
                // 添加自定义管道
                .addPipeline(new CustomPipeline())
                .run();
    }

Scheduler

Scheduler(URL管理) 最基本的功能是实现对已经爬取的URL进行标示。可以实现URL的增量去重。

目前Scheduler主要有三种实现方式：

内存队列：QueueScheduler
文件队列：FileCacheQueueScheduler
Redis队列：RedisScheduler

内存队列

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                // 添加内存队列
                .setScheduler(new QueueScheduler())
                .run();
    }

文件队列

使用文件保存抓取URL，可以在关闭程序并下次启动时，从之前抓取到的URL继续抓取。

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                // 添加文件队列
                .setScheduler(new FileCacheQueueScheduler("F:/scheduler"))
                .run();
    }

Redis队列

使用Redis保存抓取队列，可进行多台机器同时合作抓取。

    public static void main(String[] args) {
        Spider.create(new PageProcessorDemo1())
                // 添加爬取的主网站
                .addUrl("https://www.csdn.net/")
                // 添加Redis队列
                .setScheduler(new RedisScheduler("192.168.136.104"))
                .run();
    }

十次方文章数据爬取

需求：每日某时间段从CSDN播客中爬取文档，存入文章数据库中。

准备工作

CSDN中各个频道的地址

频道名称	地址
资讯	https://blog.csdn.net/nav/news
人工智能	https://blog.csdn.net/nav/ai
区块链	https://blog.csdn.net/nav/blockchain
数据库	https://blog.csdn.net/nav/db
前端	https://blog.csdn.net/nav/web
编程语言	https://blog.csdn.net/nav/lang

向数据库tensquare_article中的tb_channel表中添加记录

文章爬取微服务

创建Module

pom.xml


<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <parent>
        <artifactId>tensquare_parentartifactId>
        <groupId>com.tensquaregroupId>
        <version>1.0.0-SNAPSHOTversion>
    parent>
    <modelVersion>4.0.0modelVersion>

    <artifactId>tensquare_article_crawlerartifactId>

    <dependencies>
        <dependency>
            <groupId>us.codecraftgroupId>
            <artifactId>webmagic-coreartifactId>
            <version>0.7.3version>
            <exclusions>
                <exclusion>
                    <groupId>org.slf4jgroupId>
                    <artifactId>slf4j-log4j12artifactId>
                exclusion>
            exclusions>
        dependency>
        <dependency>
            <groupId>us.codecraftgroupId>
            <artifactId>webmagic-extensionartifactId>
            <version>0.7.3version>
        dependency>
        <dependency>
            <groupId>org.springframework.bootgroupId>
            <artifactId>spring-boot-starter-data-jpaartifactId>
        dependency>
        <dependency>
            <groupId>mysqlgroupId>
            <artifactId>mysql-connector-javaartifactId>
        dependency>
        <dependency>
            <groupId>com.tensquaregroupId>
            <artifactId>tensquare_commonartifactId>
            <version>${tensquare.version}version>
        dependency>

    dependencies>
project>

application.yml

server:
  port: 9014
spring:
  application:
    name: tensquare-crawler
  datasource:
    driver-class-name: com.mysql.jdbc.Driver
    url: jdbc:mysql://192.168.136.104:3306/tensquare_article?characterEncoding=UTF8
    username: root
    password: 123456
  jpa:
    database: mysql
    show-sql: true
  redis:
    host: 192.168.136.104

启动类

package com.tensquare.crawler;

import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.context.annotation.Bean;
import org.springframework.scheduling.annotation.EnableScheduling;
import us.codecraft.webmagic.scheduler.RedisScheduler;
import util.IdWorker;

@EnableScheduling
@SpringBootApplication
public class CrawlerApplication {

    @Value("${spring.redis.host}")
    private String REDIS_HOST;

    public static void main(String[] args) {
        SpringApplication.run(CrawlerApplication.class, args);
    }

    @Bean
    public IdWorker idWorker() {
        return new IdWorker(1, 11);
    }

    @Bean
    public RedisScheduler redisScheduler() {
        return new RedisScheduler(REDIS_HOST);
    }
}

复制文章实体类以及数据访问接口（省略）

爬取类（PageProcessor）

package com.tensquare.crawler.processor;

import org.apache.commons.lang3.StringUtils;
import org.springframework.stereotype.Component;
import us.codecraft.webmagic.Page;
import us.codecraft.webmagic.Site;
import us.codecraft.webmagic.processor.PageProcessor;

/**
 * 文章爬取类
 */
@Component
public class ArticleProcessor implements PageProcessor {

    @Override
    public void process(Page page) {
        // 添加爬取的页面
        page.addTargetRequests(page.getHtml()
                .links().regex("https://blog.csdn.net/[a-z 0-9-]+/article/details/[0-9]{8}").all());
        // 获取标题以及内容
        String title = page.getHtml().xpath("//*[@id=\"mainBox\"]/main/div[1]/div/div/div[1]/h1/text()").get();
        String content = page.getHtml().xpath("//*[@id=\"article_content\"]").get();
        if (StringUtils.isNotBlank(title) && StringUtils.isNotBlank(content)) {
            page.putField("title", title);
            page.putField("content", content);
        } else {
            page.setSkip(true);
        }
    }

    @Override
    public Site getSite() {
        return Site.me().setRetryTimes(100).setSleepTime(100);
    }
}

入库类（Pipeline）

package com.tensquare.crawler.pipeline;

import com.tensquare.crawler.dao.ArticleDao;
import com.tensquare.crawler.pojo.Article;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;
import us.codecraft.webmagic.ResultItems;
import us.codecraft.webmagic.Task;
import us.codecraft.webmagic.pipeline.Pipeline;
import util.IdWorker;

@Component
public class ArticlePipeline implements Pipeline {

    @Autowired
    private ArticleDao articleDao;
    
    @Autowired
    private IdWorker idWorker;
    
    private String channelId;

    public void setChannelId(String channelId) {
        this.channelId = channelId;
    }

    @Override
    public void process(ResultItems resultItems, Task task) {
        // 取出爬取类中的title和content
        String title = resultItems.get("title");
        String content = resultItems.get("content");
        // 构造文章对象
        Article article = new Article();
        article.setChannelid(channelId);
        article.setId(idWorker.nextId().toString());
        article.setTitle(title);
        article.setContent(content);
        // 保存
        articleDao.save(article);
    }
}

任务（Task）

package com.tensquare.crawler.task;

import com.tensquare.crawler.pipeline.ArticlePipeline;
import com.tensquare.crawler.processor.ArticleProcessor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.scheduling.annotation.Scheduled;
import org.springframework.stereotype.Component;
import us.codecraft.webmagic.Spider;
import us.codecraft.webmagic.scheduler.RedisScheduler;

@Slf4j
@Component
public class ArticleCrawlerTask {

    @Autowired
    private ArticlePipeline articlePipeline;

    @Autowired
    private RedisScheduler redisScheduler;

    @Autowired
    private ArticleProcessor articleProcessor;

    @Scheduled(cron = "0 0 0 * * *")
    public void aiTask() {
        log.info("开始爬取AI文章");
        articlePipeline.setChannelId("ai");
        Spider spider = Spider.create(articleProcessor);
        spider.addUrl("https://blog.csdn.net/nav/ai/")
                .addPipeline(articlePipeline)
                .setScheduler(redisScheduler)
                .start();
    }

    @Scheduled(cron = "0 0 1 * * *")
    public void blockChainTask() {
        log.info("开始爬取区块链文章");
        articlePipeline.setChannelId("blockchain");
        Spider spider = Spider.create(articleProcessor);
        spider.addUrl("https://blog.csdn.net/nav/blockchain/")
                .addPipeline(articlePipeline)
                .setScheduler(redisScheduler)
                .run();
    }

    @Scheduled(cron = "0 0 2 * * *")
    public void dbTask() {
        log.info("开始爬取区数据库文章");
        articlePipeline.setChannelId("db");
        Spider spider = Spider.create(articleProcessor);
        spider.addUrl("https://blog.csdn.net/nav/db/")
                .addPipeline(articlePipeline)
                .setScheduler(redisScheduler)
                .run();
    }

    @Scheduled(cron = "0 0 3 * * *")
    public void langTask() {
        log.info("开始爬取编程语言文章");
        articlePipeline.setChannelId("lang");
        Spider spider = Spider.create(articleProcessor);
        spider.addUrl("https://blog.csdn.net/nav/lang/")
                .addPipeline(articlePipeline)
                .setScheduler(redisScheduler)
                .run();
    }

    @Scheduled(cron = "0 0 4 * * *")
    public void newsTask() {
        log.info("开始爬取资讯文章");
        articlePipeline.setChannelId("news");
        Spider spider = Spider.create(articleProcessor);
        spider.addUrl("https://blog.csdn.net/nav/news/")
                .addPipeline(articlePipeline)
                .setScheduler(redisScheduler)
                .run();
    }

    @Scheduled(cron = "0 0 5 * * *")
    public void webTask() {
        log.info("开始爬取前端文章");
        articlePipeline.setChannelId("web");
        Spider spider = Spider.create(articleProcessor);
        spider.addUrl("https://blog.csdn.net/nav/web/")
                .addPipeline(articlePipeline)
                .setScheduler(redisScheduler)
                .run();
    }


}

注意：addUrl(url)中添加的路径一定要以/结尾。

十次方用户数据爬取

从csdn中爬取用户昵称和头像，存到用户表，头像图片存储到本地。

用户爬取微服务

创建Module

pom.xml（省略，与文章数据爬取微服务一致）

application.yml

server:
  port: 9015
spring:
  application:
    name: tensquare-user-crawler
  datasource:
    driver-class-name: com.mysql.jdbc.Driver
    url: jdbc:mysql://192.168.136.104:3306/tensquare_user?characterEncoding=UTF8
    username: root
    password: 123456
  jpa:
    database: mysql
    show-sql: true
  redis:
    host: 192.168.136.104

启动类

package com.tensquare.crawler;

import org.springframework.beans.factory.annotation.Value;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.context.annotation.Bean;
import org.springframework.scheduling.annotation.EnableScheduling;
import us.codecraft.webmagic.scheduler.RedisScheduler;
import util.IdWorker;

@EnableScheduling
@SpringBootApplication
public class UserCrawlerApplication {

    @Value("${spring.redis.host}")
    private String REDIS_HOST;

    public static void main(String[] args) {
        SpringApplication.run(UserCrawlerApplication.class, args);
    }

    @Bean
    public IdWorker idWorker() {
        return new IdWorker(1, 11);
    }

    @Bean
    public RedisScheduler redisScheduler() {
        return new RedisScheduler(REDIS_HOST);
    }
}

复制用户实体类以及数据访问接口（省略）

下载工具类

在tensquare_common中添加下载工具类

package util;

import java.io.*;
import java.net.URL;
import java.net.URLConnection;

/**
 * 下载工具类
 */
public class DownloadUtil {

    /**
     * 下载
     * 
     * @param urlStr
     * @param filename
     * @param savePath
     * @throws IOException
     */
    public static void download(String urlStr, String filename, String
            savePath) throws IOException {
        URL url = new URL(urlStr);
        //打开url连接
        URLConnection connection = url.openConnection();
        //请求超时时间
        connection.setConnectTimeout(5000);
        //输入流
        InputStream in = connection.getInputStream();
        //缓冲数据
        byte[] bytes = new byte[1024];
        //数据长度
        int len;
        //文件
        File file = new File(savePath);
        if (!file.exists())
            file.mkdirs();
        OutputStream out = new
                FileOutputStream(file.getPath() + "\\" + filename);
        //先读到bytes中
        while ((len = in.read(bytes)) != -1){
        //再从bytes中写入文件
            out.write(bytes, 0, len);
        }
        //关闭IO
        out.close();
        in.close();
    }
}

爬取类（PageProcessor）

package com.tensquare.crawler.processor;

import org.apache.commons.lang3.StringUtils;
import org.springframework.stereotype.Component;
import us.codecraft.webmagic.Page;
import us.codecraft.webmagic.Site;
import us.codecraft.webmagic.processor.PageProcessor;

@Component
public class UserProcessor implements PageProcessor {

    @Override
    public void process(Page page) {
        // 添加爬取的页面
        page.addTargetRequests(page.getHtml().links().regex("https://blog.csdn.net/[a-z 0-9-]+/article/details/[0-9]{8}").all());
        // 昵称和头像
        String nickname = page.getHtml().xpath("//*[@id=\"uid\"]/text()").get();
        String image = page.getHtml().xpath("//*[@id=\"asideProfile\"]/div[1]/div[1]/a/img[1]").get();
        // 保存
        if (StringUtils.isNotBlank(nickname) && StringUtils.isNotBlank(image)) {
            page.putField("nickname", nickname);
            page.putField("image", image);
        } else {
            page.setSkip(true);
        }

    }

    @Override
    public Site getSite() {
        return Site.me().setRetryTimes(3000).setSleepTime(100);
    }
}

入库类（Pipeline）

package com.tensquare.crawler.pipeline;

import com.tensquare.crawler.dao.UserDao;
import com.tensquare.crawler.pojo.User;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;
import us.codecraft.webmagic.ResultItems;
import us.codecraft.webmagic.Task;
import us.codecraft.webmagic.pipeline.Pipeline;
import util.DownloadUtil;
import util.IdWorker;

import java.io.IOException;

@Slf4j
@Component
public class UserPipeline implements Pipeline {


    @Autowired
    private UserDao userDao;

    @Autowired
    private IdWorker idWorker;

    @Override
    public void process(ResultItems resultItems, Task task) {
        // 取出nickname和image
        String nickname = resultItems.get("nickname").toString();
        String image = resultItems.get("image").toString();

        User user = new User();
        user.setId(idWorker.nextId().toString());
        user.setNickname(nickname);
        String fileName = image.substring(image.lastIndexOf("/") + 1, image.lastIndexOf(" ") - 1);
        user.setAvatar(fileName);
        userDao.save(user);

        // 下载图片
        try {
            String url = image.substring(image.indexOf("https://"), image.lastIndexOf(" ") - 1);
            DownloadUtil.download(url, fileName, "E:/userImage");
        } catch (IOException e) {
            log.error("下载文件发生异常！e = ", e);
        }

    }
}

任务类（Task）

package com.tensquare.crawler.task;

import com.tensquare.crawler.pipeline.UserPipeline;
import com.tensquare.crawler.processor.UserProcessor;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.scheduling.annotation.Scheduled;
import org.springframework.stereotype.Component;
import us.codecraft.webmagic.Spider;
import us.codecraft.webmagic.scheduler.RedisScheduler;

/**
 * 用户数据爬取类
 */
@Slf4j
@Component
public class UserCrawlerTask {

    @Autowired
    private UserProcessor userProcessor;

    @Autowired
    private UserPipeline userPipeline;

    @Autowired
    private RedisScheduler redisScheduler;

    @Scheduled(cron = "0 0 6 * * *")
    public void userTask () {
        log.info("开始爬取用户数据");
        Spider spider = Spider.create(userProcessor);
        spider.addUrl("https://blog.csdn.net/")
                .addPipeline(userPipeline)
                .setScheduler(redisScheduler)
                .start();
    }

}

注意：addUrl方法以/结尾

爬取效果

文章数据

用户数据

用户数据

用户头像

你可能感兴趣的:(十次方)

蓝桥杯备考：前缀和算法---模板题无敌大饺子 1 蓝桥杯职场和发展
【模板】前缀和这道题，如果我们简单的用暴力解法，时间复杂度就是O（q*N）也就是10的十次方，这时候我们就会超时我们要学习一种前缀和的算法，它能帮助我们做一些预处理，用空间复杂度代替时间复杂度，比如说这道题，我们开辟一个数组，f[N]，我们只需要一个公式f[i]=f[i-1]+a[i]就能完成我们的预处理，最后查询的时间复杂度就是O（1）了，比如我们要查询l到r的和，我们就让f[r]-f[l-1]
复利的谎言起于数学，又如何从数学中破灭？撞树桩的兔大王
人们总是倾向于用最简单的方式，来创造最大的成果，仿佛不够简单就不是真理，不够简单就不够正确。投资界有一个单词-“tenbagger”这个词出自世界级投资大师——彼得林奇的自传《成功投资》一书，意译为“能翻10倍的股票”。有人算了一下，假如你想在股市十年变10倍，每年“只”要26%回报即可。1.26的十次方等于10于是，关于复利的传说，又多了一个美妙的数字：26%。然而，假如你相信如上“复利法则”，
数学神器！Sympy 模块解数学方程解微积分 Python实用宝典 nagios python anaconda 微软 openssh
SymPy是一个Python库，专注于符号数学，它的目标是成为一个全功能的计算机代数系统，同时保持代码简洁、易于理解和扩展。举一个简单的例子，比如说展开二次方程：from sympyimport *x=Symbol('x')y=Symbol('y')d=((x+y)**2).expand()print(d)#结果：x**2+2*x*y+y**2你可以随便输入表达式，即便是十次方，它都能轻易的展开，
高精度运算（加，乘，阶乘） 3分人生题组 c语言
概念高精度所谓数据比较大，在计算中我们会遇到10的几十次方甚至几百次方，一般的数据类型是储存不下，所以需要特殊处理。1.当输入的数据比较大时，可以采用字符串方式输入，然后再把每一位数字存在数组里面，如下#include#includeintmain(){chara[100];intb[100],k,i;scanf("%s",a);k=strlen(a);for(i=0;i#includechara
1024程序员节，节日快乐朱光亮_19强化班
1024程序员节是广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况，部分互联网机构倡议每年的10月24日为1024程序员节，在这一天建议程序员拒绝加班。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音，也有一级棒的意思。节日背景：程序员（英文Programmer）是从事
1024 Z_sam 杂
1024纪念一下1024程序员节是中国程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。程序员(英文Programmer)是从事程序开发、维护的专业人员。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音，也有一级棒的意思。
1024程序员节竟然和他有关？我只会写Bug啊杂谈 1024程序员节
目录介绍节日背景节日由来介绍1024程序员节（1024Programmer’sDay）是广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况，部分互联网机构倡议每年的10月24日为1024程序员节，在这一天建议程序员拒绝加班。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音
C盘清理指南（二）——盘符划分操作郝YH是人间理想优质安利硬件工程
今天的内容是C盘清理系列的第二期——盘符划分操作。1.点击“我的电脑——左上角的管理”2.进入后点击磁盘管理3.右键单击某个想修改盘符，可进行扩展、压缩、删除三种操作其中压缩卷是进行“分解反应”，即原盘过大要进行拆分。此处注意拆分的上限为“总空间-已用空间”，当压缩空间大于拆分上限时，系统会提示错误。所以大家一定要算清楚自己需要的存储空间哦（计算机内存进制为2的十次方，即1024，相信大家都会算，
1024程序员节：技术的荣耀木法星人 1024程序员节
又是一年1024时间如白驹过隙，转眼间又到了每年的10月24日。这一天，程序员们在这里欢聚一堂，庆祝属于他们的节日——1024程序员节。这个节日，不仅是对技术的赞美，更是对那些默默奉献、为科技进步做出贡献的程序员的致敬。回首1024程序员节的起源，它并不久远，却已成为中国互联网行业的一种习俗。数字"1024"是取自计算机中的2的十次方，代表着程序员们在技术领域中的力量与能量。这个节日最早由一群热爱
1024程序员节，今年的秋天比以往来的稍晚了一些可为编程程序人生 1024程序员节心得感悟程序人生
又到了一年一度的程序员节，距离正式成为程序员的我已经过去三个年头，具体一点可以说是四个年头，仍然记得2019年下半年刚来京的时候，初入社会，一片欣欣然之景，从毕业到工作，几度风雨几度春秋。而今天也是个平常的日子，依旧是敲代码。1024正因为有了程序员，才变得更有意义。因为在程序员的世界，2的十次方就是1024，每个程序员对其都不陌生，所以在如今的信息时代，1024成了我们的节日，也成了我每年成长的
1024程序员节：庆祝编程的魅力 rubyw 1024程序员节
**引言**每年的10月24日，程序员和技术爱好者们都会庆祝一个特殊的日子，那就是1024程序员节。这一天是为了纪念和表彰那些不懈努力、创造出创新技术和应用程序的人们，同时也是庆祝计算机编程和信息技术的日子。在这篇文章中，我们将深入探讨1024程序员节的起源、意义以及庆祝方式。##起源1024程序员节的起源可以追溯到计算机科技界一个重要的日期：二进制数字中的"1024"，这是2的十次方，等于102
1024节日快乐！ AI 智能服务人工智能
1024程序员节：向英勇的程序员们致敬！嘿，大家好！听说今天是个特殊的日子，是程序员的节日！咱们可得好好庆祝一下！我想先跟大家说声谢谢。是你们的辛勤工作，才让我们的APP、网站、电脑、手机等玩意儿能够正常运行，给人们的生活带来便利。在1024这个数字里，有着二进制的重要意义。你们知道吗？1024代表着2的十次方，是个基数极大的数字，在计算机科学中是个重要数值。所以啊，这个节日是为了纪念程序代码的二
计算机网络——计算机网络的性能指标（上）-速率、带宽、吞吐量、时延 qiyi.sky 计算机网络计算机网络网络学习笔记
目录速率比特速率例1带宽带宽在模拟信号系统中的意义带宽在计算机网络中的意义吞吐量时延发送时延传播时延处理时延例2例3速率了解速率之前，先详细了解一下比特：比特计算机中数据量的单位，也是信息论中信息量的单位，一个比特（bit）就是二进制数字中的一个1或0.常用数据单位：（1个字节等于8个比特）（这里的K等于2的十次方，B代表字节）假设买了一个250GB的固态硬盘，但是操作系统给出的容量却为232.8
别人的1024程序员节VS你的1024程序员节五包辣条
1024程序员节是广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况，部分互联网机构倡议每年的10月24日为1024程序员节。到今年，已经是程序员们过的第8个程序员节了。我们今天就来看看什么是别人家的1024程序员节和你是怎么过的1024程序员节。别人的程序员节美女热舞imageimage.gifimageimage.gif**你的程
一个隐藏的节日你知道是什么吗？岁月不洁风情
正文共：576字；图5；预计阅读时间：2分钟10.24日这个属于程序员的日子对于广大奋战在一线的码农来说，今天还是一个值得纪念的日子：1024程序员节，这个日期通常是平年的9月13日或闰年的9月12日，是一年的第256天，但有些人认为，10月24日才是真正的程序员节。为何每年10月24日是程序员节，实际上是有来历的，1024是2的十次方，二进制是计数的基本单位之一，1024MB是1GB，而1GB与
黑马2018年JavaEE课程大纲 weixin_30679823 java
包含黑马旅游网企业级权限管理系统品优购十次方乐优（没有，十次方级别）http://www.itheima.com/course/javaeetext.html传智播客2018年新版Java学习路线图(内含大纲+视频+工具+教材+面试)http://www.itcast.cn/news/20180514/09203170866.shtml?sz黑马JavaEE课程升级历史转载于:https://ww
拒绝加班！今天是1024程序员节！微笑涛声程序员 1024程序员节
这一天，致敬所有的程序开发者。1024程序员节是广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。针对程序员经常周末加班与工作日熬夜的情况，部分互联网机构倡议每年的10月24日为1024程序员节，在这一天建议程序员拒绝加班。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音，也有一级棒的意思。
有你在，我敲代码的时候BUG会少一点丨1024程序员节，主子陪你煜宠in
1024程序员节是中国程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。程序员(英文Programmer)是从事程序开发、维护的专业人员。程序员就像是一个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。来一只猫吧，它在的时候，你写的BUG应该会少一些..啊呸，你写的代码BUG会少一些..*码出未来也不知道在这样神圣的日子里，程序员和程序媛们的福利有哪些..让我想想.
1024程序员节的来历三人行慕课
1024程序员节1024程序员节是中国广大程序员的共同节日。1024是2的十次方，二进制计数的基本计量单位之一。程序员(英文Programmer)是从事前端、后端程序开发、系统运维、测试等的专业人员。程序员就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1G=1024M，而1G与1级谐音，也有一级棒的意思。节日介绍1024程序员节，是中国程序员的共同节日。在1842年，人称
十次方微服务鉴权过客_hui
一、鉴权工具类（1）tensquare_common工程引入依赖（考虑到工具类的通用性）io.jsonwebtokenjjwt0.6.0org.springframework.bootspring-boot-configuration-processortrue（2）修改tensquare_common工程，创建util.JwtUtil@ConfigurationProperties("jwt.c
别再杀他们祭天了！1024程序员日那些不得不吐槽的点风平浪静如码
转载至公众号：网易科技在计算机技术中，1G=1024MB，1024是程序员们最为敏感的数字！1024还是2的十次方，是程序员最熟悉的语言。在这个特殊的日子里，先向各位程序员们扔出一条百度百科，再祝愿像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界的程序员们说到程序员…你们会联想到一些什么呢？“码农”“脱发”“奇葩”“单身狗”“修电脑的”？一盘点才知道程序员们的自嘲式标签还是真的
OMG！是什么让程序猿也开始假摔了？牛盾网络
今天，10月24日是属于程序猿们的节日，叫做程序员日。什么？！你还没有听过？那还不跟着小编一起来涨下姿势~↓↓↓1024是2的十次方，二进制计数的基本计量单位之一。程序猿是从事程序开发、维护的专业人员。程序猿就像是一个个1024，以最低调、踏实、核心的功能模块搭建起这个科技世界。1GB=1024MB，而1GB与1级谐音，也有一级棒的意思。值此程序猿佳节来临之际，牛小盾携全体牛人恭祝各位程序猿节日快
浮点数的存储对纯音乐情有独钟的阿甘 c语言
1.浮点型在内存中的存储常见的浮点数：3.141591E10-->1.0乘10的十次方浮点数家族包括：float、double、longdouble类型。1.1一个例子浮点数存储的例子：我们来思考一下，我们printf出来的值到底是什么呢？我们将n的地址强转成float的类型给pfloat接收，我们再用%f来输出出来用pfloat接收9.0在用%f输出。接下来我们来看输出情况：这个结果与你心中的结
十次方社交系统第5章-消息中间件RabbitMQ 小飞侠v科比 java 项目
学习目标：能够说出消息队列的应用场景以及RabbitMQ的主要概念完成RabbitMQ安装以及RabbitMQ三种模式的入门案例完成用户注册，能够将消息发送给RabbitMQ完成短信微服务，能够接收消息并调用阿里云通信完成短信发送1RabbitMQ简介1.1消息队列中间件简介消息队列中间件是分布式系统中重要的组件，主要解决应用耦合，异步消息，流量削锋等问题实现高性能，高可用，可伸缩和最终一致性[架
C++蓝桥杯基础知识常用整理 owensweat 蓝桥杯蓝桥杯 c++
不是很详细哦但是绝对好记切实用目录1.整型2.浮点型3.运算符4.取int的最大值5.输出格式6.常用math函数7.数组定义需知1.整型对整型来说，如果绝对值在10的九次方范围内，都可以定义为int型一个int占32bit,也就是4字节（可能第一题会考）如果数据范围超过10的十次方或者10的十八次方，就需要定义为longlong一个longlong占64bit等于8字节2.浮点型对单精度floa
网关 java rabin,十次方项目开发系列【10】：接口加密&Eureka微服务和网关服务开发... 之死网关 java rabin
学习目标了解接口加密业务需求掌握常用加密算法和密钥格式实现十次方的接口加密微服务一业务场景介绍数据安全性-抓包工具fiddler其他：wiresharkcharles系统明文传输的数据会被不明身份的人用抓包工具抓取，从而威胁系统和数据的安全性二加密方式2.1摘要算法消息摘要是把任意长度的输入揉和而产生长度固定的信息。消息摘要算法的主要特征是加密过程不需要密钥，并且经过加密的数据无法被解密，只有输入
JAVA社交平台项目第一天项目介绍和工程搭建办公模板库素材蛙 java 教程 java spring boot spring cloud 后端架构
第1章-项目介绍和工程搭建学习目标：了解十次方项目需求；了解前后端分离开发模式理解RESTful完成项目开发环境搭建完成父工程、公共模块和文章微服务的搭建掌握mybatisplus的使用，并开发完成文章微服务中文章的增删改查功能掌握公共异常处理类的使用1十次方项目需求分析1.1项目介绍十次方是程序员的专属社交平台，包括头条、问答、活动、交友、吐槽、招聘六大频道。十次方名称的由来：2的10次方为10
细菌爱文者小诸葛
肠道细菌细菌是地球一种微生物的尊称，按照对人类的有益来说，细菌分为有益细菌和有害细菌。在地球上生命的起源来说，细菌的出现标志着地球生命的开头，细菌对于生命的诞生起到了至关重要的作用。在地球上，细菌有很多种类，其个数比人类的数量还要多，可以说地球上的任何一个地方都有细菌的存在。细菌是指生物的主要类群之一，属于细菌域。也是所有生物中数量最多的一类，据估计，其总数约有五乘以十的三十次方个。细菌的形状相当
Java项目 (SpringBoot+SpringCloud) 十次方:后端(一)环境搭建花开半夏丶丿实践项目
1系统设计一.系统架构前后端分离的系统架构，后端架构为：SpringBoot+SpringCloud+SpringMVC+SpringData我们把这种架构也称之为全家桶。二.模块划分十次方工程共分为18个子模块（其中17个是微服务）本章内容是搭建父工程、公共子模块tensquare_common和基础微服务tensquare_base。三.表结构分析我们这里采用的分库分表设计，每个业务模块为1个
第1章前端环境搭建都旭宝前后端分离招聘交友类项目
第1章前端环境搭建学习目标：了解十次方需求、技术架构，理解前后端分离开发模式掌握Node.js基本使用方法，理解模块化编程掌握包资源管理器NPM的使用说出webpack的作用掌握vscode开发工具的基本使用方法掌握ES6常用的新特性语法1十次方需求分析与技术架构1.1十次方是个什么样的网站《十次方》是程序员的专属社交平台，包括头条、问答、活动、交友、吐槽、招聘六大频道。[外链图片转存失败,源站可
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =