某-人

一个简单的爬取查询数据的springboot项目

一、项目建模

二、执行流程

单个实例执行流程：

从PoolingHttpClientConnectionManager连接池中得到CloseableHttpClient 的一个客户端实例来访问目标网址，首先模拟登录，登录成功后保存状态，发送进销存查询请求，通过页面抓取或发送导出文件请求的方式来获取数据，紧接着处理数据，将数据按照自定义模板生成。

三、最终效果

Windows10自带的录屏 win+G打开xbox的录屏，设置一下对所有应用捕获，然后在线转换gif 免费直接下载超好用

四、项目细节

1.HttpClient

<!-- https://mvnrepository.com/artifact/org.apache.httpcomponents/httpclient -->
        <dependency>
            <groupId>org.apache.httpcomponents</groupId>
            <artifactId>httpclient</artifactId>
        </dependency>

这部分都是参考HttpClient整理资料和HttpClient高级进阶，自己去细看理解。

HttpClient执行Http请求的步骤：

创建HttpClient
创建Request
使用HttpClient来执行Request请求，得到相应的Response
处理Response
关闭HttpClient

（1)、创建HttpClient

目前最新版的HttpClient的实现类为CloseableHttpClient。创建CloseableHttpClient实例有两种方式：

（1）使用CloseableHttpClient的工厂类HttpClients的方法来创建实例。最简单的实例化方式是调用HttpClients.createDefault()。

	//使用自定义配置
	public static HttpClientBuilder custom() {
        return HttpClientBuilder.create();
    }
	//使用默认配置
    public static CloseableHttpClient createDefault() {
        return HttpClientBuilder.create().build();
    }
	//使用一个预设策略的系统HttpClient对象
    public static CloseableHttpClient createSystem() {
        return HttpClientBuilder.create().useSystemProperties().build();
    }
/**
* 	if (this.systemProperties) {
*               String s = System.getProperty("http.keepAlive", "true");
*                if ("true".equalsIgnoreCase(s)) {
*                    s = System.getProperty("http.maxConnections", "5");
*                    int max = Integer.parseInt(s);
*                    poolingmgr.setDefaultMaxPerRoute(max);
*                    poolingmgr.setMaxTotal(2 * max);
*                }
*            }
*/

	//使用极简HttpClient对象，只是封装了最基本的HTTP过程，提供最直接的客户端服务器交互，不支持代理，不支持在各种情况下的重试（重定向，权限校验，IO异常等）
    public static CloseableHttpClient createMinimal() {
        return new MinimalHttpClient(new PoolingHttpClientConnectionManager());
    }
	//自定义HttpClientConnectionManager的极简HttpClient对象
    public static CloseableHttpClient createMinimal(HttpClientConnectionManager connManager) {
        return new MinimalHttpClient(connManager);
    }

更多相关：关于MinimalHttpClient

HttpClient4.5基础

（2）使用CloseableHttpClient的builder类HttpClientBuilder，先对一些属性进行配置(采用装饰者模式，不断的.setxxxxx().setxxxxxxxx()就行了)(这里所说的装饰者模式，我觉得不对，参考装饰者模式或装饰者模式2,装饰者模式更多地应用在拓展子类行为上)，再调用build方法来创建实例。上面的HttpClients.createDefault()实际上调用的也就是HttpClientBuilder.create().build()。

build()方法最终是根据各种配置来new一个InternalHttpClient实例（CloseableHttpClient实现类）。IternalHttpClient的定义如下：

class InternalHttpClient extends CloseableHttpClient implements Configurable {
    private final Log log = LogFactory.getLog(this.getClass());
    private final ClientExecChain execChain;
    private final HttpClientConnectionManager connManager;
    private final HttpRoutePlanner routePlanner;
    private final Lookup<CookieSpecProvider> cookieSpecRegistry;
    private final Lookup<AuthSchemeProvider> authSchemeRegistry;
    private final CookieStore cookieStore;
    private final CredentialsProvider credentialsProvider;
    private final RequestConfig defaultConfig;
    private final List<Closeable> closeables;

其中需要注意的有HttpClientConnectionManager、HttpRoutePlanner和RequestConfig。

(i)HttpClientConnectionManager

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1IpLOeMn-1582271452679)(C:\Users\user\Desktop\crawler\HttpClientConnectionManager.png)]

HttpClientConnectionManager，顾名思义，这是Http请求的管理者，该接口有两个实现类。

1.BasicHttpClientConnectionManager

public class BasicHttpClientConnectionManager implements HttpClientConnectionManager, Closeable {
    private final Log log;
    private final HttpClientConnectionOperator connectionOperator;//实际调度者
    private final HttpConnectionFactory<HttpRoute, ManagedHttpClientConnection> connFactory;
    private ManagedHttpClientConnection conn;//一个Connection
    private HttpRoute route;//一个route
    private Object state;
    private long updated;
    private long expiry;
    private boolean leased;
    private SocketConfig socketConfig;
    private ConnectionConfig connConfig;
    private final AtomicBoolean isShutdown;
    
    synchronized HttpClientConnection getConnection(HttpRoute route, Object state) {
        。。。
            
            
      if (this.conn == null) {
          //若连接为空，则由HttpConnectionFactory去新建一个连接
       this.conn = (ManagedHttpClientConnection)this.connFactory.create(route, this.connConfig);
        }
    }
    
    public synchronized void releaseConnection(HttpClientConnection conn, Object state, long keepalive, TimeUnit timeUnit) {
        Args.notNull(conn, "Connection");
        //判断是否是相同连接
        Asserts.check(conn == this.conn, "Connection not obtained from this manager");
        。。。
       
        
    public void connect(HttpClientConnection conn, HttpRoute route, int connectTimeout, HttpContext context) throws IOException {
        Args.notNull(conn, "Connection");
        Args.notNull(route, "HTTP route");
        Asserts.check(conn == this.conn, "Connection not obtained from this manager");    			HttpHost host;
        if (route.getProxyHost() != null) {
            host = route.getProxyHost();
        } else {
            host = route.getTargetHost();
        }

        InetSocketAddress localAddress = route.getLocalSocketAddress();
        //由HttpClientConnectionOperator调度去执行连接
        this.connectionOperator.connect(this.conn, host, localAddress, connectTimeout, this.socketConfig, context);

BasicHttpClientConnectionManager每次只管理一个Connection。不过，虽然它是thread-safe的，但由于它只管理一个连接，所以只能被一个线程使用，由Operator去调度执行。它在管理连接的时候如果发现有相同route的请求，会复用之前已经创建的连接，如果新来的请求不能复用之前的连接，它会关闭现有的连接并重新打开它来响应新的请求。

HttpClientConnectionOperator只有一个实现类DefaultHttpClientConnectionOperator

 public void connect(ManagedHttpClientConnection conn, HttpHost host, InetSocketAddress localAddress, int connectTimeout, SocketConfig socketConfig, HttpContext context) throws IOException {
        Lookup<ConnectionSocketFactory> registry = this.getSocketFactoryRegistry(context);
        ConnectionSocketFactory sf = (ConnectionSocketFactory)registry.lookup(host.getSchemeName());//从Context中获取SocketFactory，可以看到，根据Scheme（是否是Https）不一样会有不同
        if (sf == null) {
            throw new UnsupportedSchemeException(host.getSchemeName() + " protocol is not supported");
        } else {
            InetAddress[] addresses = host.getAddress() != null ? new InetAddress[]{host.getAddress()} : this.dnsResolver.resolve(host.getHostName());
            int port = this.schemePortResolver.resolve(host);

            for(int i = 0; i < addresses.length; ++i) {
                InetAddress address = addresses[i];
                boolean last = i == addresses.length - 1;
                Socket sock = sf.createSocket(context);
                sock.setSoTimeout(socketConfig.getSoTimeout());
                sock.setReuseAddress(socketConfig.isSoReuseAddress());
                sock.setTcpNoDelay(socketConfig.isTcpNoDelay());
                sock.setKeepAlive(socketConfig.isSoKeepAlive());
                if (socketConfig.getRcvBufSize() > 0) {
                    sock.setReceiveBufferSize(socketConfig.getRcvBufSize());
                }

                if (socketConfig.getSndBufSize() > 0) {
                    sock.setSendBufferSize(socketConfig.getSndBufSize());
                }

                int linger = socketConfig.getSoLinger();
                if (linger >= 0) {
                    sock.setSoLinger(true, linger);
                }

                conn.bind(sock);
                InetSocketAddress remoteAddress = new InetSocketAddress(address, port);
                if (this.log.isDebugEnabled()) {
                    this.log.debug("Connecting to " + remoteAddress);
                }

                try {
                    sock = sf.connectSocket(connectTimeout, sock, host, remoteAddress, localAddress, context);
                    conn.bind(sock);//将Socket绑定到Connection
               ...

ConnectionOperator 是来处理Connection和Socket的关系，而HttpClientConnection是怎么来的呢？

HttpClientConnection继承自HttpConnection，HttpConnection由HttpConnectionFactory接口生成，

HttpConnectionFactory有一个实现类ManagedHttpClientConnectionFactory,它是来生成ManagedHttpClientConnection。

  public ManagedHttpClientConnection create(HttpRoute route, ConnectionConfig config) {
        ConnectionConfig cconfig = config != null ? config : ConnectionConfig.DEFAULT;
        CharsetDecoder charDecoder = null;
        CharsetEncoder charEncoder = null;
        Charset charset = cconfig.getCharset();
        CodingErrorAction malformedInputAction = cconfig.getMalformedInputAction() != null ? cconfig.getMalformedInputAction() : CodingErrorAction.REPORT;
        CodingErrorAction unmappableInputAction = cconfig.getUnmappableInputAction() != null ? cconfig.getUnmappableInputAction() : CodingErrorAction.REPORT;
        if (charset != null) {
            charDecoder = charset.newDecoder();
            charDecoder.onMalformedInput(malformedInputAction);
            charDecoder.onUnmappableCharacter(unmappableInputAction);
            charEncoder = charset.newEncoder();
            charEncoder.onMalformedInput(malformedInputAction);
            charEncoder.onUnmappableCharacter(unmappableInputAction);
        }

        String id = "http-outgoing-" + Long.toString(COUNTER.getAndIncrement());
        return new LoggingManagedHttpClientConnection(id, this.log, this.headerLog, this.wireLog, cconfig.getBufferSize(), cconfig.getFragmentSizeHint(), charDecoder, charEncoder, cconfig.getMessageConstraints(), this.incomingContentStrategy, this.outgoingContentStrategy, this.requestWriterFactory, this.responseParserFactory);
    }

2.PoolingHttpClientConnectionManager

public CPool(ConnFactory<HttpRoute, ManagedHttpClientConnection> connFactory, int defaultMaxPerRoute, int maxTotal, long timeToLive, TimeUnit timeUnit) {
        super(connFactory, defaultMaxPerRoute, maxTotal);
        this.timeToLive = timeToLive;
        this.timeUnit = timeUnit;
    }


 public AbstractConnPool(ConnFactory<T, C> connFactory, int defaultMaxPerRoute, int maxTotal) {
        this.connFactory = (ConnFactory)Args.notNull(connFactory, "Connection factory");
        this.defaultMaxPerRoute = Args.positive(defaultMaxPerRoute, "Max per route value");
        this.maxTotal = Args.positive(maxTotal, "Max total value");
        this.lock = new ReentrantLock();
        this.condition = this.lock.newCondition();
        this.routeToPool = new HashMap();
        this.leased = new HashSet();
        this.available = new LinkedList();
        this.pending = new LinkedList();
        this.maxPerRoute = new HashMap();
    }

对于PoolingHttpClientConnectionManager, 涉及到对象池化的概念。
在常用的Apache Commons Pool 中可以是这样定义的：
PoolableObjectFactory用于管理被池化的对象的产生、激活、挂起、校验和销毁；
ObjectPool用于管理要被池化的对象的借出和归还，并通知PoolableObjectFactory完成相应的工作；
我们来看看PoolingHttpClientConnectionManager是如何来定义对象池的。正常的Pool管理中有一个Factory，从代码中可以看出来，是InternalConnectionFactory。同时还有一个ObjectPool，在这里是CPool，但是它基本是个空的封装，继承自AbstractConnPool。其实PoolingHttpClientConnectionManager看上去结构简单，也能做很多事情，但是最终还是落到了CPool上。而CPool又落到了AbstractConnPool上。

public PoolingHttpClientConnectionManager(HttpClientConnectionOperator httpClientConnectionOperator, HttpConnectionFactory<HttpRoute, ManagedHttpClientConnection> connFactory, long timeToLive, TimeUnit timeUnit) {
        this.log = LogFactory.getLog(this.getClass());
        this.configData = new PoolingHttpClientConnectionManager.ConfigData();
        this.pool = new CPool(new PoolingHttpClientConnectionManager.InternalConnectionFactory(this.configData, connFactory), 2, 20, timeToLive, timeUnit);//默认连接池配置
        this.pool.setValidateAfterInactivity(2000);
        this.connectionOperator = (HttpClientConnectionOperator)Args.notNull(httpClientConnectionOperator, "HttpClientConnectionOperator");
        this.isShutDown = new AtomicBoolean(false);
    }

在PoolingHttpClientConnectionManager的配置中有两个最大连接数量，分别控制着总的最大连接数量和每个route的最大连接数量。如果没有显式设置，默认每个route只允许最多2个connection，总的connection数量不超过20。这个值对于很多并发度高的应用来说是不够的，必须根据实际的情况设置合适的值，思路和线程池的大小设置方式是类似的，如果所有的连接请求都是到同一个url，那可以把MaxPerRoute的值设置成和MaxTotal一致，这样就能更高效地复用连接。

更多参考HttpClient源码解析系列：第四篇：Connection是怎么生成和管理的

(ii)HttpRoutePlanner

HttpClient不仅支持简单的直连、复杂的路由策略以及代理。HttpRoutePlanner是基于http上下文情况下，客户端到服务器的路由计算策略，一般没有代理的话，就不用设置这个东西。这里有一个很关键的概念—Route：在HttpClient中，一个Route指运行环境机器->目标机器host的一条线路，也就是如果目标url的host是同一个，那么它们的route也是一样的。

(iii)RequestConfig

RequestConfig是对request的一些配置。里面比较重要的有三个超时时间，默认的情况下这三个超时时间都为0（如果不设置request的Config，会在execute的过程中使用HttpClientParamConfig的getRequestConfig中用默认参数进行设置），这也就意味着无限等待，很容易导致所有的请求阻塞在这个地方无限期等待。这三个超时时间为：

a、connectionRequestTimeout—从连接池中取连接的超时时间

这个时间定义的是从ConnectionManager管理的连接池中取出连接的超时时间，如果连接池中没有可用的连接，则request会被阻塞，最长等待connectionRequestTimeout的时间，如果还没有被服务，则抛出ConnectionPoolTimeoutException异常，不继续等待。

b、connectTimeout—连接超时时间

这个时间定义了通过网络与服务器建立连接的超时时间，也就是取得了连接池中的某个连接之后到接通目标url的连接等待时间。发生超时，会抛出ConnectionTimeoutException异常。

c、socketTimeout—请求超时时间

这个时间定义了socket读数据的超时时间，也就是连接到服务器之后到从服务器获取响应数据需要等待的时间，或者说是连接上一个url之后到获取response的返回等待时间。发生超时，会抛出SocketTimeoutException异常。

(2)、创建一个Request对象

HttpClient支持所有的HTTP1.1中的所有定义的请求类型：GET、HEAD、POST、PUT、DELETE、TRACE和OPTIONS。对使用的类为HttpGet、HttpHead、HttpPost、HttpPut、HttpDelete、HttpTrace和HttpOptions。Request的对象建立很简单，一般用目标url来构造就好了。下面是一个HttpPost的创建代码：

HttpPost httpPost = new HttpPost(url);

一个Request还可以addHeader、setEntity、setConfig等，一般这三个用的比较多。

RequestConfig这个类比较关键，就是request的配置，除了上面说到的三个超时时间外，还有一些可能有助于理解处理过程的配置：

staleConnectionCheckEnabled：这个配置默认为true，HttpClient的execute方法中有下面的代码，也就是说如果这个设置为true的话，是会自动关闭那些状态为stale的managed connection所管理的connection和socket（和remote ip）

(3)、执行Request请求

执行Request请求就是调用HttpClient的execute方法。最简单的使用方法是调用execute(final HttpUriRequest request)。

HttpClient允许http连接在特定的Http上下文中执行，HttpContext是跟一个连接相关联的，所以它也只能属于一个线程，如果没有特别设定，在execute的过程中，HttpClient会自动为每一个connectionnew一个HttpClientHttpContext。

HttpClientContext localcontext = HttpClientContext.adapt(context!=null?context:newBasicHttpContext());

整个execute执行的常规流程为：

new一个http context

取出Request和URL

根据HttpRoute的配置看是否需要重写URL

根据URL的host、port和scheme设置target

在发送前用http协议拦截器处理request的各个部分

取得验证状态、user token来验证身份

从连接池中取一个可用的连接

根据request的各种配置参数以及取得的connection构造一个connManaged

打开managed的connection（包括创建route、dns解析、绑定socket、socket连接等）

请求数据（包括发送请求和接收response两个阶段）

查看keepAlive策略，判断连接是否要复用，并设置相应标识

返回response

用http协议拦截器处理response的各个部分

(3)、处理Response

HttpReaponse是将服务端发回的Http响应解析后的对象。CloseableHttpClient的execute方法返回的response都是CloseableHttpResponse类型。可以getFirstHeader(String)、getLastHeader(String)、headerIterator（String）取得某个Header name对应的迭代器、getAllHeaders()、getEntity、getStatus等，一般这几个方法比较常用。

在这个部分中，对于entity的处理需要特别注意一下。

一般来说一个response中的entity只能被使用一次，它是一个流，这个流被处理完就不再存在了。

先response.getEntity()再使用HttpEntity#getContent()来得到一个java.io.InputStream，然后再对内容进行相应的处理。

有一点非常重要，想要复用一个connection就必须要让它占有的系统资源得到正确释放。释放资源有两种方法：

a、关闭和entity相关的content stream

如果是使用outputStream就要保证整个entity都被write out，如果是inputStream，则再最后要记得调用inputStream.close()。或者使用EntityUtils.consume(entity)或EntityUtils.consumeQuietly(entity)来让entity被完全耗尽（后者不抛异常）来做这一工作。EntityUtils中有个toString方法也很方便的（调用这个方法最后也会自动把inputStream close掉的），不过只有在可以确定收到的entity不是特别大的情况下才能使用。

做过实验，如果没有让整个entity被fully consumed，则该连接是不能被复用的，很快就会因为在连接池中取不到可用的连接超时或者阻塞在这里（因为该连接的状态将会一直是leased的，即正在被使用的状态）。所以如果想要复用connection，一定一定要记得把entity fully consume掉，只要检测到stream的eof，是会自动调用ConnectionHolder的releaseConnection方法进行处理的（注意，ConnectionHolder并不是一个public class，虽然里面有一些跟释放连接相关的重要操作，但是却无法直接调用）。

b、关闭response

执行response.close()虽然会正确释放掉该connection占用的所有资源，但是这是一种比较暴力的方式，采用这种方式之后，这个connection就不能被重复使用了。

从源代码中可以看出，response.close()调用了connectionHolder的abortConnection方法，它会close底层的socket，并且release当前的connection，并把reuse的时间设为0。这种情况下的connection称为expired connection，也就是client端单方面把连接关闭。还要等待closeExpiredConnections方法将它从连接池中清除掉（从连接池中清除掉的含义是把它所对应的连接池的entry置为无效，并且关掉对应的connection，shutdown对应socket的输入和输出流。这个方法的调用时间是需要设置的）。

关闭stream和response的区别在于前者会尝试保持底层的连接alive，而后者会直接shut down并且丢弃connection。

socket是和ip以及port绑定的，但是host相同的请求会尽量复用连接池里已经存在的connection（因为在连接池里会另外维护一个route的子连接池，这个子连接池中每个connection的状态有三种：leased、available和pending，只有available状态的connection才能被使用，而fully consume entity就可以让该连接变为available状态），如果host地址一样，则优先使用该connection。

如果希望重复读取entity中的内容，就需要把entity缓存下来。最简单的方式是用entity来new一个BufferedHttpEntity，这一操作会把内容拷贝到内存中，之后使用这个BufferedHttpEntity就可以了。

(4)、关闭HttpClient

调用httpClient.close()会先shut down connection manager，然后再释放该HttpClient所占用的所有资源，关闭所有在使用或者空闲的connection包括底层socket。由于这里把它所使用的connection manager关闭了，所以在下次还要进行http请求的时候，要重新new一个connection manager来build一个HttpClient（也就是在需要关闭和新建Client的情况下，connection manager不能是单例的）。

简单的用HttpClient实现GET、POST等我就不演示了，大佬写好的例子百度一搜就有，直接套用就是了。

接下来，应该先是持久层开发。

2.配置文件读取

因为是一个简单的项目，没有用数据库，这里直接读取的是json配置文件的数据。

创建实体类Customer,然后配置好json文件再解析，这里我用的是fastjson解析

		<dependency>
            <groupId>com.alibaba</groupId>
            <artifactId>fastjson</artifactId>
            <version>1.2.61</version>
        </dependency>

{
  "customers": [
    {
      "orgcode": "W702067",
      "orgname": "青岛百洋医药股份有限公司",
      "params": {
        "user": "240",
        "password": "Welcome103"
      },
      "website": "http://www.baheal.com/Flow/Home/Index",
      "dailyTime": "0/30 * 19 * * ?",
      "merge": false,
      "status": true,
      "type": "N",
      "action": "cn.eli486.imp.Demo"
    },
    {
      "orgcode": "W169027",
      "orgname": "聚善堂（福建）医药集团有限公司",
      "params": {
        "txtadmin": "57",
        "txtpwd": "1"
      },
      "website": "http://218.86.35.195:8008/default5.aspx",
      "dailyTime": "0/20 * 19 * * ?",
      "merge": false,
      "status": true,
      "type": "N",
      "action": "cn.eli486.imp.Demo3"
    }
  ]
}

		 //加载json获取定时任务
//            File f = new File (this.getClass ().getResource ("/customer.json").getPath ());
ClassPathResource resource = new ClassPathResource ("customer.json");
            StringBuilder builder =new StringBuilder ();
            InputStreamReader inputStreamReader=new InputStreamReader (resource.getInputStream (),"utf-8");
            BufferedReader bufferedReader=new BufferedReader (inputStreamReader);
            String s = null;
            while ((s=bufferedReader.readLine ())!=null) {
                    builder.append (s);
            }
            bufferedReader.close ();
            JSONObject parse = JSON.parseObject (builder.toString ());
            JSONArray customers = parse.getJSONArray ("customers");
            String customersStr = customers.toJSONString ();

            List<Customer> customersList = JSON.parseArray (customersStr, Customer.class);
            this.mapCustomers = new HashMap<> ();
            for (Customer customer : customersList
            ) {
                this.mapCustomers.put (customer.getOrgcode (), customer);
            }

这里解析配置文件要注意的是获取resources路径下文件，原来用this.getClass ().getResource ("/customer.json").getPath ()运行时总报找不到那个文件异常，查了之后才知道要用resource.getInputStream ()来获取。

3.查询数据处理

接下来应该算是业务层开发，我们要对查询到的数据进行保存处理。

因为是要保存到Excel中，所以导入操作Excel相应的jar包,主要是poi和jxl

  <!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>4.1.1</version>
        </dependency>
        <!-- https://mvnrepository.com/artifact/org.apache.poi/poi-ooxml -->
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>4.1.1</version>
        </dependency>
         <!-- https://mvnrepository.com/artifact/net.sourceforge.jexcelapi/jxl -->
        <dependency>
            <groupId>net.sourceforge.jexcelapi</groupId>
            <artifactId>jxl</artifactId>
            <version>2.6.12</version>
            <exclusions>
                <exclusion>
                    <artifactId>log4j</artifactId>
                    <groupId>log4j</groupId>
                </exclusion>
            </exclusions>
        </dependency>

首先要考虑存储方式。原来是以数组的形式将每行数据保存起来，表头封装成一个对象或者存在是一个数组中，根据对象属性去填充各行的数据。但表头是不确定的，每次修改表头就要重写一个对象或者更换数组，那么怎样存储才便于插入和删除呢，这里我选择了双向链表。

public class Title<T>{
	/**
	 * 内部构造节点类
	 * 
	 * @param 
	 */
	private class Node<T> {
		private T data;
		private Node<T> next; // 指向下一个节点的引用
		private Node<T> prev; // 指向前一个节点的引用

		public Node(T data) {
			this.data = data;
		}
	}
	/**
	 * 模拟头结点
 	 */
	private Node<T> head;
	/**
	*模拟尾部节点
	 */
	private Node<T> last;
	/**
	 * 暂定一个临时节点，用作指针节点
 	 */
	private Node<T> other;
	private int length;

	/**
	 * 链表是否为空
	 * 
	 * @return boolean
	 */
	public boolean isEmpty() {
		return length == 0;
	}

	/**
	 * 普通添加，往链表尾部添加
	 * 
	 * @param data
	 */
	public void append(T data) {
		// 链表为空，新创建一个链表
		if (isEmpty()) {
			head = new Node<T>(data);
			last = head;
			length++;
		} else {
			other = new Node<T>(data);
			other.prev = last;
			// 将新的节点与原来的尾部节点进行结构上的关联
			last.next = other;
			// other将成为最后一个节点
			last = other;
			length++;
		}
	}

	/**
	 * 在指定的数据后面添加数据
	 * 
	 * @param data
	 * @param insertData
	 */
	public void addAfter(T data, T insertData) {
		other = head;
		// 我们假定这个head是不为空的。
		while (other != null) {
			if (other.data.equals(data)) {
				Node<T> t = new Node<T>(insertData);
				t.prev = other;
				// 对新插入的数据进行一个指向的定义
				t.next = other.next;
				other.next = t;

				if (t.next == null) {
					last = t;
				}
				length++;
			}
			other = other.next;
		}
	}

	/**
	 * 删除，删除指定的数据
	 * 
	 * @param data
	 */
	public void remove(T data) {
		// 我们假定这个head是不为空的。
		other = head;
		while (other != null) {
			if (other.data.equals(data)) {
				other.prev.next = other.next;
				length--;
			}
			other = other.next;
		}

	}

	/**
	 * 测试打印数据
	 */
	public void printList() {
		other = head;
		for (int i = 0; i < length; i++) {
			System.out.print(other.data + "  ");
			other = other.next;
		}
	}
	public int len() {
		return length;
	}
	
	/**
	 * 以数组的形式返回节点数据
	 */
	public Object[] show() {
		Object[] data = new String[length];
		other = head;
		for (int i = 0; i < length; i++) {
			data[i]=other.data;
			other = other.next;
		}
		return data;
	}
	
	/**
	 * 建立map
	 * 存储title的位置-表头名称
	 */
	public Map<Integer,String> local() {
		Map<Integer, String> map = new HashMap<> ();
		Object[] data = new String[length];
		other = head;
		int loc = 0;
		for (int i = 0; i < length; i++) {
			data[i]=other.data;
			map.put(i, (String) data[i]);
			other = other.next;
		}
		return map;
	}

更多可以参考双向链表，当然肯定也有别的选择方案。

4.定时任务配置

因为无验证码的网站登录不会被拦截，只要传入用户名密码等参数就可以直接抓到数据，那么我们可以考虑将此做出定时任务去执行无需人工操作。

具体采用哪种可以自行决定spring boot 几种定时任务的实现方式

我这用的就是springboot自带的定时任务注解@Scheduled，主要实现参考spring定时任务实现动态定时任务（启停，周期修改)

public class DailyTask implements Runnable {
    private String cron;
    private String classname;
    private Customer customer;
    private boolean status;

    public DailyTask (Customer customer) {
        this.customer = customer;
        this.classname = customer.getAction ();
        this.cron = customer.getDailyTime ();
        this.status = customer.isStatus ();
    }

    @Override
    public void run () {
        try {

            ExcelDemo excelDemo = (ExcelDemo) Class.forName (classname).newInstance ();
            excelDemo.setMerge (customer.isMerge ());

            CloseableHttpClient client = WebUtil.getHttpClient ();
            Set<String> strings = customer.getParams ().keySet ();
            Iterator<String> iterator = strings.iterator ();
            if(iterator.hasNext ()) {
                String next = iterator.next ();
                //区分多账号
                if (next.contains ("@@")) {
                    String[] para1 = next.split ("@@");
                    String[] para2 = customer.getParams ().get (next).split ("@@");
                    for (int i = 0; i < para1.length; i++) {
                        Map<String, String> params = new HashMap<> ();
                        params.put (para1[i], para2[i]);
                        excelDemo.exec (client, params, customer.getOrgcode (), customer.getOrgname ());
                    }
                } else {
                    Map<String, String> params = new HashMap<> ();
                    params.putAll (customer.getParams ());
                    excelDemo.exec (client, params, customer.getOrgcode (), customer.getOrgname ());
                }
            }

        } catch (Exception e) {
            e.printStackTrace ();
        }
    }

5.前端页面

前端主要是Thymeleaf搭建的，主要说一下验证码页面遇到的问题。

我是根据网站验证码图片地址，抓取保存到resources目录下

 		HttpGet get = new HttpGet (url);
        try {
            HttpResponse response = client.execute (get);

            if (HttpStatus.SC_OK != response.getStatusLine ().getStatusCode ()) {
                return;
            }

            HttpEntity entity = response.getEntity ();
            if (entity == null) {
                return;
            }
            File storeFile = new File (fileName);
            FileOutputStream output = new FileOutputStream (storeFile);
            entity.writeTo (output);
            output.close ();

但在页面执行任务时，发现总是登录失败，debug看了是验证码错误，我每次点击生成验证码，得到的是上一次的验证码图片，只有刷新项目文件夹才生成新的，这是为什么呢。百度了半天，跟session缓存问题差不多，这是项目缓存的原因，我的问题这样解决了–>Springboot 上传图片到项目路径下不能访问，需要重启

@Configuration
public class ResourceConfigAdapter extends WebMvcConfigurerAdapter {
 
    @Override
    public void addResourceHandlers(ResourceHandlerRegistry registry) {
        //获取文件的真实路径 work_project代表项目工程名 需要更改
        String path = System.getProperty("user.dir")+"\\work_project\\src\\main\\resources\\static\\pciture\\";
        String os = System.getProperty("os.name");
        if (os.toLowerCase().startsWith("win")) {
            registry.addResourceHandler("/picture/**").
                    addResourceLocations("file:"+path);
        }else{//linux和mac系统 可以根据逻辑再做处理
            registry.addResourceHandler("/picture/**").
                    addResourceLocations("file:"+path);
        }
    }
}

至此就算简单完成了这个web项目，当然还有很多不足，如果要爬取更多的网站，并发安全问题、缓存问题等都没细细考虑，前端页面也可以添加更多功能，如任务进度条、执行日志展示、对数据修改等，与数据库连接来搭建也不会太难。这里推荐另一个适合学习的博客搭建项目，SpringBoot开发博客系统，感兴趣可以试试，我先去学学。

记录问题：

在用iterator遍历HashMap集合时，出现异常concurrentmodificationexception

 Set<String> strings = customer.getParams ().keySet ();
            Iterator<String> iterator = strings.iterator ();
            while (iterator.hasNext ()) {
                String next = iterator.next ();
                //以@@来分隔多账号
                if (next.contains ("@@")) {
                    String[] para1 = next.split ("@@");
                    String[] para2 = customer.getParams ().get (next).split ("@@");
                    for (int i = 0; i < para1.length; i++) {
                        Map<String, String> params = new HashMap<> ();
                        params.put (para1[i], para2[i]);
                        excelDemo.exec (client, params, customer.getOrgcode (), customer.getOrgname ());
                    }
                } else {
                    //这里要new一个新的map，要不然每个实例直接用登录参数进行修改页面展示也会变
                    Map<String, String> params = new HashMap<> ();
                    params.putAll (customer.getParams ());
                    //在子类中有修改Map中的值所以出现异常
                    excelDemo.exec (client, params, customer.getOrgcode (), customer.getOrgname ());
                }
            }

百度一下大多数是对集合list、map等进行了删改才出现异常，debug试了下，synchronized锁住方法块并没有解决问题，最后还是把customer的params存储类型换成ConcurrentHashMap才成功。

还有一个由于devtools导致的，就是同一个类转换报claacastexcepetion，这是由于devtools用连个不同的ClassLoader去加载而造成的。

你可能感兴趣的:(java)

单例模式详解（java）搞不懂语言的程序员重拾java java基础知识单例模式 java 开发语言
以下是一个线程安全、防反射攻击、防序列化破坏的单例模式完整实现，结合真实场景问题解决方案，附带逐行中文注释：importjava.io.Serializable;importjava.lang.reflect.Constructor;/***单例模式终极实现方案（解决：线程安全、反射攻击、序列化破坏问题）*/publicclassUltimateSingletonimplementsSeriali
Java学习--关键字月色很柔 Java 学习 java
Java学习--关键字前言关键字finalstaticsuperthis实现前言本文主要参考：here;若需要可直接前往学习。关键字final、Static、super、this…final区分final、finally、finalize：理解final的含义：final意为最终的含义，用来修饰类、方法和变量。修饰类：publicfinalclassClassName{}被final修饰的类不能被
【Java】ReadWriteLock浅谈风起云涌~ java 开发语言 jvm
一，概述在多读少写的场景下，可以使用读写锁优化性能。读锁本质是一种共享锁，即，如果ReadLock获取锁成功，只会阻塞WriteLock锁的获取，不会阻塞其它线程ReadLock锁的获取。而写锁就是正常的独占锁。二，简单实例一个简单demo，读者可体会。publicstaticvoidmain(String[]args){ReadWriteLocklock=newReentrantReadWrit
【Java】StampedLock浅谈风起云涌~ java 开发语言
1，概述在多读少写的环境，相比于ReadWriteLoock，StampedLock性能更胜一筹。试着想一下，如果使用ReadWriteLoock，当1万个读请求过来时，写的操作插入，就会被阻塞。但StampedLock不会，后者不基于AQS实现，它采用乐观锁的思维。所谓的乐观，即读取的时候，不会阻塞当前线程，相应会返回一个邮票，state。读取完毕后，只要验证手上的邮票判断数据是否变化即可，随后
java------方法的覆盖[重写],super和final关键字从未止步.. JavaSE基础 java 开发语言 jvm
方法覆盖（也称为方法的重写，Override）定义：它是多态性的重要体现之一，是动态多态性的表现形式，他是指子类中可以定义名称，参数列表，返回值类型均与父类中某个方法完全相同的方法，我们就说子类中定义的这个方法覆盖了父类中的同名方法。举例：//anmial为父类packageanmial;publicclassAnimal{publicvoidshow
Android 面试（Java 篇）约翰先森不喝酒面试 java 面试 android
Android面试（Java篇）一Java的继承机制二进程跟线程，以及线程的创建三简述wait()和sleep()的区别四如何终止一个线程五Synchronized（内置锁，线程同步）六Synchronized修饰的静态和非静态方法时为什么可以异步执行？七线程同步除了Synchronized还有别的方法么，区别在哪里八死锁产生的原因以及预防措施九Synchronized和Lock的区别十Handl
Android 高频面试必问之Java基础 2401_83641443 程序员 android 面试 java
BootstrapClassLoader：Bootstrap类加载器负责加载rt.jar中的JDK类文件，它是所有类加载器的父加载器。Bootstrap类加载器没有任何父类加载器，如果调用String.class.getClassLoader()，会返回null，任何基于此的代码会抛出NUllPointerException异常，因此Bootstrap加载器又被称为初始类加载器。ExtClassL
Java学习------static、final、this、super关键字日暮南城故里 Java学习记录 java 学习
1.static关键字static修饰的变量叫做静态变量。当所有对象的某个属性的值是相同的，建议将该属性定义为静态变量，来节省内存的开销。静态变量在类加载时初始化，存储在堆中。static修饰的方法叫做静态方法。所有静态变量和静态方法，统一使用“类名.”调用。静态方法中不能使用this关键字。因此无法直接访问实例变量和调用实例方法。静态代码块在类加载时执行，一个类中可以编写多个静态代码块，遵循自上
YARN 的任务提交流程是怎样的？思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
YARN的任务提交流程是一个复杂但有序的过程，它涉及到多个组件之间的交互。以下是详细的任务提交流程描述、思维导图结构化描述以及Java代码示例，帮助你理解如何在YARN中提交任务。YARN任务提交流程客户端提交应用程序客户端通过YARN的API向ResourceManager提交一个新应用程序。提交时需要提供ApplicationMaster的启动信息（如JAR包路径、主类名等）以及其他配置参数。
Android第三次面试（Java基础）每次的天空面试职场和发展 java android
面试题一：在Android里，Array和ArrayList区别？定义与大小：数组声明时要指定大小，之后固定；ArrayList动态，无需提前定大小。性能：二者访问元素快，时间复杂度O(1)；数组插入删除繁琐，ArrayList尾部添加快，其他位置操作慢。数据类型：数组能存基本类型和对象，ArrayList只能存对象，存基本类型需用包装类。方法功能：数组自身方法少，靠Arrays类；ArrayLi
基于 ArkTS 的混合式开发示例：静态页面与本地数据交互 qq_55376032 harmonyos 华为鸿蒙
一、实现效果1、H5段混合式开发效果图2、静态页面与本地数据交互效果图二、技术栈分析ArkTS：用于构建页面结构和逻辑，支持声明式UI和组件化开发。WebView：通过@ohos.web.webview调用H5页面，支持JavaScript交互。资源管理：使用@kit.ArkTS的util模块读取并解析本地JSON文件。自定义对话框：通过@CustomDialog实现自定义弹窗，支持动态数据加载。
如何用Java轻松解析DNS报文字节王德发 java技术 java python 开发语言
在网络编程中，DNS（域名系统）是一个至关重要的部分。它负责将人类易于记忆的域名转换为计算机可以识别的IP地址。了解如何解析DNS报文，对于网络开发和调试都很有帮助。今天，我们就来聊聊如何利用Java来解析DNS报文，帮助你轻松理解这一过程。DNS报文的基本结构在开始之前，先简单介绍一下DNS报文的结构。DNS报文分为请求和响应两种类型，通常包含以下几个部分：头部（Header）：包含一些基本信息
如何在Spring Boot中配置和使用MyBatis-Plus 字节王德发 java技术 spring boot mybatis 后端
在当今的Java开发中，SpringBoot已经成为了一个非常流行的框架，而MyBatis-Plus则是一个强大的ORM框架，为开发人员提供了更简便的数据库操作方式。很多开发者都在使用SpringBoot和MyBatis-Plus的组合来快速构建高效的应用。今天就来聊聊如何在SpringBoot项目中配置和使用MyBatis-Plus，帮助你更好地理解这两者的结合。创建SpringBoot项目首先
【Spring Boot 中 `@Value` 注解的使用】武帝为此前后端 spring boot python 后端
文章目录一、前言二、@Value注解简介三、@Value注解的常见用法1.读取`application.properties`或`application.yml`配置值（1）配置文件示例（2）Java代码示例（3）测试输出2.使用`@Value`设置默认值3.读取系统环境变量和Java运行时参数4.结合SpringExpressionLanguage(SpEL)（1）基本SpEL表达式（2）引用B
结构型模式之桥接模式：解耦抽象和实现菜就多练少说设计模式桥接模式 java 网络
在面向对象设计中，我们经常遇到需要扩展某些功能，但又不能修改现有代码的情况。为了避免继承带来的复杂性和维护难度，桥接模式（BridgePattern）应运而生。桥接模式是一种结构型设计模式，旨在解耦抽象部分和实现部分，使得两者可以独立变化。通过桥接模式，可以避免由于功能扩展而导致的类爆炸问题。本文将详细介绍桥接模式，讲解其概念、应用场景、优缺点，并通过Java代码示例帮助大家理解如何在实际开发中使
2025年毕设ssm校园二手电瓶车交易网站论文+源码 SSM毕设程序源码JAVA 课程设计
本系统（程序+源码）带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于校园二手交易平台的现有研究，多以综合类商品交易或书籍循环为主，而专门针对电瓶车这类高价值、强监管的校园二手交易研究较少。当前高校内电瓶车交易存在信息不对称、交易流程不规范、车牌管理脱节等问题，缺乏系统化的解决方案。部分高校虽尝试通过论坛或社群进行交易，但存在用户身份难核实、
JavaScript基础-获取元素難釋懷 javascript 开发语言
在Web开发中，使用JavaScript动态地访问和操作网页上的元素是一项基本技能。通过获取页面上的特定元素，我们可以对其进行各种操作，比如修改内容、样式或属性等。本文将详细介绍几种获取DOM元素的方法，并探讨它们的特点及适用场景。一、为什么需要获取元素？在现代Web应用中，交互性是关键。无论是响应用户的输入、更新页面内容还是实现动画效果，首先都需要定位到相关的HTML元素。掌握不同的获取元素的方
LeetCode——1864. 构成交替字符串需要的最小交换次数(Minimum Number of Swaps to Make the Binary...)[中等]——分析及代码（Java）江南土豆数据结构与算法 LeetCode Java 题解
LeetCode——1864.构成交替字符串需要的最小交换次数[MinimumNumberofSwapstoMaketheBinaryStringAlternating][中等]——分析及代码[Java]一、题目二、分析及代码1.模拟（1）思路（2）代码（3）结果三、其他一、题目给你一个二进制字符串s，现需要将其转化为一个交替字符串。请你计算并返回转化所需的最小字符交换次数，如果无法完成转化，返回
让人感到疑惑的const 浪裡遊 javascript 开发语言 ecmascript 前端
const关键字在不同的编程语言中有着不同的含义和限制，但通常它被用来声明一个常量或只读变量。然而，在JavaScript中，const的行为有时可能会让人感到困惑，因为它并不总是意味着“不可变”（immutable）。让我们详细探讨一下这个问题。JavaScript中的const在JavaScript中，当你使用const声明一个变量时，你实际上是创建了一个不能重新赋值的绑定。这意味着一旦给这个
(LeetCode每日一题) 1963. 使字符串平衡的最小交换次数(贪心、双指针) 岁忧 java版刷题 LeetCode leetcode 算法职场和发展 java c++
题目：1963.使字符串平衡的最小交换次数方法一：对于符合要求的字符串，需要任何[0,i]部分，“[”都不比“]”少。[视为+1，]视为-1，那么任何前缀和sum都不能出现sum0){sum--;}else{while(s[j]!='['){j--;}s[j]=']';sum++;ans++;}}}returnans;}};JAVA版本：classSolution{publicintminSwap
JavaScript 性能优化实战：数据结构选择对性能的影响 deying0865423 开发语言 javascript
目录数组（Array）特点与适用场景性能短板链表（LinkedList）特点与适用场景性能短板集合（Set）特点与适用场景性能短板映射（Map）特点与适用场景性能短板栈（Stack）与队列（Queue）特点与适用场景性能短板在JavaScript开发中，数据结构的选择如同搭建房屋时选择合适的建筑材料，对程序性能起着决定性作用。合理的数据结构能显著提升代码执行效率，减少资源消耗，反之则可能导致性能瓶
JavaScript 性能优化实战：优化 DOM 操作提升交互响应 deying0865423 javascript 开发语言 ecmascript
目录一、理解DOM操作的性能损耗二、减少DOM操作次数（一）批量操作DOM（二）缓存DOM查询结果三、优化DOM查询（一）使用更高效的查询方法（二）利用事件委托四、减少回流与重绘（一）批量修改样式（二）使用requestAnimationFrame在现代Web应用开发中，JavaScript与DOM（文档对象模型）的交互极为频繁。无论是创建动态界面、响应用户操作，还是更新页面内容，DOM操作都扮演
Java方法详解 NaclarbCSDN java 开发语言
Java方法详解方法基本概念 packagecom.arbedu.method; publicclassDemo01{ //main方法 publicstaticvoidmain(String[]args){ inta; intb; intsum=add(1,2);//实际参数，用来调用传递的参数 System.out.println(sum);
【华为OD-E卷 -123 判断一组不等式是否满足约束并输出最大差 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java javascript c++
【华为OD-E卷-判断一组不等式是否满足约束并输出最大差100分（python、java、c++、js、c）】题目给定一组不等式，判断是否成立并输出不等式的最大差(输出浮点数的整数部分)要求:不等式系数为double类型，是一个二维数组不等式的变量为int类型，是一维数组;不等式的目标值为double类型，是一维数组不等式约束为字符串数组，只能是:“>”,“>=”,“<”,“<=”,“=”，例如，
【华为OD-E卷 -122 字符统计及重排 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享 python 华为od java c++javascript
【华为OD-E卷-字符统计及重排100分（python、java、c++、js、c）】题目给出一个仅包含字母的字符串，不包含空格，统计字符串中各个字母（区分大小写）出现的次数，并按照字母出现次数从大到小的顺序。输出各个字母及其出现次数。如果次数相同，按照自然顺序进行排序，且小写字母在大写字母之前输入描述输入一行，为一个仅包含字母的字符串输出描述按照字母出现次数从大到小的顺序输出各个字母和字母次数，
【华为OD-E卷-02 最多提取子串数目100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-最多提取子串数目100分（python、java、c++、js、c）】题目给定[a-z]，26个英文字母小写字符串组成的字符串A和B，其中A可能存在重复字母，B不会存在重复字母，现从字符串A中按规则挑选一些字母，可以组成字符串B。挑选规则如下：同一个位置的字母只能挑选一次被挑选字母的相对先后顺序不能被改变求最多可以同时从A中挑选多少组能组成B的字符串。输入描述输入为2行，第1行输
【华为OD-E卷 - 高频题目全览（关注、收藏）通过率100%以上题目可达95%（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享纯小白编程入门教程（新手必看）计算机相关操作技巧（新手必看）华为od c++c语言 java python js javascript
注意：如果发现代码有用例覆盖不到的情况，欢迎反馈！会在第一时间修正，更新。解题不易，如对您有帮助，欢迎点赞/收藏E卷题目全览一键跳转详情题目详情跳转01补种未成活胡杨点此跳转详情02最多提取子串数目点此跳转详情03ai面板识别点此跳转详情04流浪地球
JavaScript基础-DOM 简介難釋懷 javascript 开发语言
在现代Web开发中，JavaScript与HTML和CSS一起构成了网页的核心技术。而在这三者之中，DOM（DocumentObjectModel，文档对象模型）作为浏览器处理网页内容的一种接口，扮演着至关重要的角色。通过DOM，JavaScript能够动态地访问和操作网页的内容、结构以及样式。本文将介绍DOM的基本概念、核心组成部分以及如何使用JavaScript来操作DOM。一、什么是DOM？
JAVA中List数组与泛型 Yeauty java 泛型
去除ArrayList中重复字符串元素方式A:案例演示需求：ArrayList去除集合中字符串的重复值(字符串的内容相同)思路：创建新集合方式/***A:案例演示*需求：ArrayList去除集合中字符串的重复值(字符串的内容相同)*思路：创建新集合方式*/publicstaticvoidmain(String[]args){ArrayListlist=newArrayList();list.ad
### 深入解析：如何构建三角形并求解自顶向下的最小路径和的基础—（构建三角形）小学仔 leetcode 动态规划 java 算法
####一、问题分析给定一个三角形`triangle`，要求找出自顶向下的最小路径和。每次移动只能到下一行相邻的节点（当前下标`i`或`i+1`）。例如，三角形如下时：```2346574183```####二、代码框架搭建#####1.输入处理与三角形构建```javaScannersc=newScanner(System.in);List>triangle=newArrayListrow=ne
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep