陌陌大大

记录用nodejs爬虫爬取汽车之家遇到的一些坑

因为某些原因需要爬取一些数据，自己就用nodejs来试试爬取数据，当然我在这方面也是一个小白,因为也是刚用nodejs来爬取数据，走了不少弯路，先说说我写爬虫的过程把。

我用的是express框架，先安装cheerio与https以及request，因为爬取数据的地址协议是https，request是用来请求网址的。

首先我主要是爬取经销商的信息，请求网址是https://dealer.autohome.com.cn/hefei#pvareaid=2113612，这里要分三个点，1.一个是要爬取所有城市里面的经销商。2.第二个是每个城市经销商都是有分页的，所有要求分页的处理。3.第三个是每个经销商里面还有一个页面，要在里面获取到经销商其他的信息(比如营业执照等)。这里就截取一小段图。

需要获取这些信息，然后就开始寻找网页的规律吧。

每一个城市的地址如下：。其中每一个城市改变的只有红色部分的地方，然后再来看看分页。分页也只是改变红色的部分，这里能看出来爬取的数据量也挺大的，到这里的时候，我就在思考这里是用同步爬取还是用异步的方式爬取，但整个nodejs是异步进行的，我也就暂时没考虑同步的，先暂时用着异步请求的方式试试，这也是之后我在写爬虫在此耽误两天的原因。这之后在详细说吧。

那么就先贴上代码：

let express = require('express');
let cheerio = require('cheerio');
let iconv = require('iconv-lite');//防止乱码
let router = express.Router();
let https = require("https");
let originRequest = require('request');

https.get('https://dealer.autohome.com.cn/DealerList/GetAreasAjax?provinceId=0&cityId=0&brandid=0&manufactoryid=0&seriesid=0&isSales=0', (res) => {
    let chunk = '';
    res.on('data', (d) => {
  	    let html = (iconv.decode(d , 'gb2312'));
  	    chunk+= html;
    });

    res.on('end' , () => {

    })
})

module.exports = router;

这里的https://dealer.autohome.com.cn/DealerList/GetAreasAjax?provinceId=0&cityId=0&brandid=0&manufactoryid=0&seriesid=0&isSales=0地址是什么地址呢？我在前面的时候，发现请求获取不了所有的城市，然后在xhr中发现这里面的城市是请求后台拿到的，那么我这里其实也是获取到所有的信息的。这里很清晰的能看出，请求的数据，那么我们也只用请求这个数据就好了。

上面代码部分获取到了这里请求的数据，我就遇到第一个问题，这里面拿到的是text格式的数据，然后我再怎么转化成json也不行，网上查了很多资料，比如：json.uncode、转化数组等我都试过，无法用xx.xx的格式获取到信息。后面就在想php是以echo输出到页面，而前台是获取到页面的数据，那么这些数据一定也是string格式的，既然是string格式的情况下，那么我将数据先存入json文件中，再取出json文件中的数据，应该就可以获取到json格式的信息了。而事实上也是如此，废话不多说，先贴上代码。

fs.writeFile('./routes/data.json',chunk,(err) => {  //写入同目录下的Data.txt文件
	 if(err) 
	     throw err;  
	 console.log('write info into json');  
});

fs.readFile('./routes/data.json',(err,data) => {
    console.log(data);
})

到这里我们就能获取到所有城市的地址了，然后我对数据进行了整理，只要想要的数据，这里代码就不贴上来了，整理数据的格式如下：[[['北京','北京'],['beijing','beijing'],[352,352]],[['安徽','合肥'],['anhui','hefei'],[443,211]],[['xx'],['xx'],[231]]]这样的，前面是用来筛选直辖市，中间是为了处理不重复处理省级,最后是筛选出市级,做好这些准备之后我们就可以开始请求地址了。贴出代码

for(let num in filterData){
	    		if(filterData[num][0].length == 2){
	    			locateName = filterData[num][0][0]; //获得省份
	    		}
	    		for(let filterDataNum in filterData[num][1]){
    			    if(filterData[num][2][filterDataNum] % 15 != 0){
				    	dataNum = Math.floor(filterData[num][2][filterDataNum] / 15) + 1;
				    }else{
				    	dataNum = filterData[num][2][filterDataNum] / 15;
				    }
				    if(dataNum != 0){
				    	let url = "https://dealer.autohome.com.cn/"+ filterData[num][1][filterDataNum] +"#pleteaid=2113612";
				    	let filterDataNumF;
				    	if(filterData[num][0].length == 2){
				    		filterDataNumF = 1;
				    	}else{
				    		filterDataNumF = 0;
				    	}
				    	request(url,(err , res , body) => { 
                            	var html = iconv.decode(body, 'gb2312');
				 		    	var $ = cheerio.load(html, {decodeEntities: false});
                                $(".list-box").find(".list-item").each((index , obj) => {
				 		    		dealerName = $(obj).find(".link span").text();
				 		    		address = $(obj).find(".info-addr").text();
				 		    		brand = $(obj).find("em").text();
				 		    		tel = $(obj).find(".tel").text();
				 		    		shopUrl = $(obj).find(".shop").attr("href");
				 		    		shopUrlArg.push(shopUrl);
				 		    	})
                        })
				    }
				}
	    	}

let request = (url, callback) => {  
  let headers = {  
	  'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.65 Safari/537.36',
      'Connection': 'keep-alive',
      'Accept-Encoding': '',
      'Accept-Language': 'en-US,en;q=0.8'
  }
  let options = {
    url: url,
    encoding: null,
    headers: headers
  }
  originRequest(options, callback)
}

这里就遇上的第二个问题，乱码，网上查阅的使用iconv-lite，然后事实上在使用之后，虽然中文没有变成乱码，但却变成了编码，这也不是我想要的结果，再花了两三个小时的网上查阅，总算是找到问题的关键，再填上header之后，这些问题也都迎刃而解了，这里也要提醒自己，在写请求的时候一定要加上header。然而这个问题解决了，下个问题就将是困扰我两天的问题了。

使用for循环请求接口，request因为会是异步进行的，会导致线程处于等待状态，但当for循环执行完成之后，才会执行request请求，request请求因为是异步的，处理请求会随机选择几个或者十几个等待的请求同时处理，这里将会导致两个问题：

1.这里请求出来的数据是随机的，没有任何顺序可言

2.这里请求的太多，同一时间请求次数过多会导致网址会限制你的请求，也就会让你获取不到body的信息。(这个问题在处理分页和进入店铺的情况下尤其严重)

在暂不考虑的顺序的情况下，处理一下第二个问题吧。在出现这个问题的时候，我考虑了三种解决的方案，这里要首先排除promise的方式，因为promise是以异步的方式同步进行，所以这里也会导致第二个问题得不到解决。先说说我的三个方案吧。

1.使用数组的map，map因为是用链表的方式来遍历数据的，这里也会使循环的时候同步执行代码循环，等待请求完成后再执行下一个循环

2.利用nodejs的mapLimit来限制请求次数

3.整个程序执行改为同步的方式(async、await来控制)

先说说使用map的情况会出现什么吧。在使用urlArg.map(data => {})的时候，第一次使用request确实没有什么问题，请求的时候很完美，但当继续请求店铺中的信息之后，会出现 Last few GC这个错误，意思是内存溢出，可能是我某个地方有导致内存泄漏的地方，但确实花了几个小时没有排查出来，到这里说明这个办法已经走不通了。如果各位大神用这个能行的，可以评论告诉我，我再尝试一次。

然后我又试了试第二种方法，虽然能限制请求个数，在请求第一层网址的时候，请求个数在5个以内是没有问题的，但是在请求第二层店铺信息的时候，数据同样疯狂undefined，我表示很无奈啊。最后我也只能利用同步的方式来试试，原因是我对async和await虽然学习过，但不熟悉啊，但原理还是懂的，利用await使线程处于阻塞状态，看来只有临阵磨枪了。

前面的就不贴代码了，代码太过于丑陋，就把最后一种成功的代码放上来吧。

dealResult(urlArg);
async function dealResult(urlArg){//得到指定所有数据
	let getData = await getTolData(urlArg);
	let trunkSql = "truncate table mainData";
	query(trunkSql);
	for(let i = 0; i < getData.length ; i ++){
       let sql = 'insert into mainData Values(null,?,?,?,?,?,?,?,?,?)' ;
       query(sql , [getData[i][0][0],getData[i][0][1],getData[i][0][2],getData[i][0][3],getData[i][0][4],getData[i][0][5],getData[i][0][6],getData[i][0][7],getData[i][0][8]]);
	}
}
async function getTolData(urlArg){  //获取店面信息和分页所有信息
	let data = await getData(urlArg);
	let tolDataArg = [];
	for(let i = 0 ; i < data.length ; i ++){
		for(let k = 0 ; k < data[i].length ; k ++){
			let tolData = await getDealer(data[i][k]);
			tolDataArg.push(tolData);
		}
	}
	return tolDataArg
}
async function getData (urlArg){  //处理分页
	let getDataArg = [];
	for(let i = 0 ; i < urlArg.length ; i ++){//urlArg.length
		let url = urlArg[i][0];
		let locateName = urlArg[i][1];
		let dataNum = urlArg[i][2];
		let cityName = urlArg[i][3];
		let cityPinYinName = urlArg[i][4];
		for(let k = 1 ; k <= dataNum ; k ++){//dataNum
			let ReData = [];
			if(k == 1){
				ReData = await runAsync(url,locateName,dataNum,cityName);
				getDataArg.push(ReData);
			}else{
				let invitePage = "https://dealer.autohome.com.cn/"+ cityPinYinName +"/0/0/0/0/"+ k +"/1/0/0.html";
				ReData = await runAsync(invitePage,locateName,dataNum,cityName);
				getDataArg.push(ReData);
			}
		}
	}
	return getDataArg;
}
async function runAsync(url,locateName,dataNum,cityName){ //获取数据
	let myVal = getLocData(url,locateName,dataNum,cityName);
	return myVal;
}
function getLocData(url,locateName,dataNum,cityName){	//处理经销商信息
    return new Promise(function(resolve,reject){
        let shopUrlArg = [];
		request(url , function(err , response , body){
			if(err){
				console.log(err, "这是获取经销商信息错误");
				resolve();
			}
	    	let dealerName,address,brand,tel,shopUrl;
			var html = iconv.decode(body, 'gb2312');
	    	var $ = cheerio.load(html, {decodeEntities: false});
	    	$(".list-box").find(".list-item").each((index , obj) => {
	    		dealerName = $(obj).find(".link span").text();
	    		address = $(obj).find(".info-addr").text();
	    		brand = $(obj).find("em").text();
	    		tel = $(obj).find(".tel").text();
	    		shopUrl = $(obj).find(".shop").attr("href");
	    		shopUrlArg.push([dealerName,address,brand,tel,locateName,cityName,shopUrl]);
	    	})
	    	console.log(shopUrlArg+"这是获取经销商信息");
	    	resolve(shopUrlArg);
	    });
    });
}

代码写的不好就多指教一下，说一下这个的思想吧。这个是将每一个request里面的数据用await拿出来，不在request中继续回调，代码中也有注解，就不多说了，而事实上，利用同步的思想，会导致爬取的速度非常慢，但优点就是非常的稳定。目前已经爬了7个小时了，文章就到这里吧

Python - 深夜数据结构与算法之 DP 串讲 BIT_666 夜深人静写算法 Python python 开发语言 DP
目录一.引言二.DP知识点回顾1.递归2.分治3.动态规划三.DP经典题目回顾1.Climb-Stairs[70]2.Unique-Paths[62]3.House-Robber[198]4.Min-Path-Sum[64]5.Best-Time-Sell-Stock[121]6.Min-Cost-Climb[746]7.Edit-Distance[72]8.Longest-Sub-Seq[300
Heroic Climb：jump higher June_39f9
Inthegame,weneedtocontrolourheroicheroicupwardclimb,therewillbesomeagencytraponthemountainwall,weneedtoavoidthemandgetthegoldcoinsonthewaytogethertojumpoutofyournewheight!Tel:+8615267845452Email:weizh
LeetCode-070-爬楼梯刻苦驴哝
假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？注意：给定n是一个正整数。示例1：输入：2输出：2解释：有两种方法可以爬到楼顶。1阶+1阶2阶示例2：输入：3输出：3解释：有三种方法可以爬到楼顶。1阶+1阶+1阶1阶+2阶2阶+1阶来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/climb
2018-12-30 每日一词 Sam_333
Uphill英英释意：somethingthatisdifficulttodoandneedsalotofdeterminationAdj.“上坡的”，引申为“艰难的，费力的”Difficult/hard/tough/demanding搭配：task/struggle/fight/battle/climb例句：1.中国男足和欧洲球队比赛时胜率很小It'sanuphillfightforChines
英语字母什么时候不发音？ 05453af106a3
有的字母在英语中是不发音的，来看看下边这些就知道了。1.b出现在词尾，在字母m之后不发音如：bomb[bɒm]炸弹climb[klaɪm]攀登comb[kəʊm]梳子crumb[krʌm]面包屑dumb[dʌm]哑的lamb[læm]羔羊limb[lɪm]枝干plumb[plʌm]垂直thumb[θʌm]拇指tomb[tuːm]坟墓2.c出现在字母s或者x之后不发音如：adolescence[æd
Climb Tall Building Madelines
Thewallclimbingrobotisclimbinganinfinitebuildingandcannotbestoppedintheprocess,otherwiseitwillbedestroyedbythelaser.Youneedtousetherobotarmassoonaspossibletohelptherobotavoidobstacles,traps,mines,etc.
小学英语必考单词分类大全（带音标）动词（verb.）疏桐0071
动词（verb.）play/plei/玩swim/swim/游泳skate/skeit/溜冰fly/flai/飞jump/dʒʌmp/跳walk/wɔ:k/走run/rʌn/跑climb/klaim/爬fight/fait/打架swing/swiŋ/荡秋千eat/i:t/吃sleep/sli:p/睡觉like/laik/喜欢have/hæv/有buy/bai/买take/teik/拍（照），带li
APM源码分析之油门跟踪 jxw3000 飞行控制 APM APM 飞控 pid 无人机
这篇文章的目的是跟踪从遥控到电机输出的过程，已定高模式为例。代码结构油门电机输出AP_Motors::set_throttle:_rc_throttle.servo_outAP_Motors::output()->output_armed()->_rc_throttle.calc_pwm():_rc_throttle.radio_out油门量计算（定高模式）target_climb_rate=ge
PHP设计模式篇-简单工厂详解木桥的博客 PHP 设计模式工厂方法模式
设计模式篇什么是设计模式？在软件开发过程中，经常出现的典型场景的典型解决方案，称为设计模式，生活中也有很多设计模式,例如泡妞技术,下象棋中当头炮马一跳等等固定章法等等。学会了设计模式可以帮助我们了解框架底层代码的实现也可以提高我们的编程水平。一、说说多态在正式了解设计模式前需要聊聊多态，多态字面上理解，同一物种表现出的多种心态，在面向对象中某种对象的实例的不同表现形态代码如下（示例）：climb(
算法题目10：33台阶法玲儿珑
实现方式（一）：递归法functionclimb(n){if(n==1){return1}elseif(n==2){return2}else{returnclimb(n-1)+climb(n-2)}}climb(33)弊端：当n值较大时，算法执行次数过大，会奔溃。实现方式二：functionclimb(n){if(n==1){return1}else{letfn_2=1letfn_1=2for(l
算法时间 IV TAsama
1.爬楼梯假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？解题思路：递归法解决，上n级台阶的解法，等于（n-1）+（n-2）/***@param{number}n*@return{number}*/varclimbStairs=function(n){if(n<=3){returnn;}returnclimbStairs(n-1)+climb
Chatgpt solve | 井底之蛙丁丁猫 Codeye 后端
这是一个经典的物理问题，我们可以使用Python来解决它。青蛙每分钟爬升4米，然后滑下2米，所以每分钟净爬升2米。我们可以编写一个循环来模拟这个过程，直到青蛙爬出井口。下面是一个Python程序来解决这个问题：def time_to_reach_top(initial_climb, slip, well_height): total_climb = 0 # 初始爬升高度为0 minu
英语学习打卡第83天美人志_8cdd
climb攀登bite咬sidebyside肩并肩side在一旁attention专心risk风险intime及时gald高兴的hit命中corner角落round圆的appear出现pale苍白的dry干land陆地while但是deep深的thinkabout考虑field田野pocket衣袋
High Flyer G Unit 1 Lesson 4 六六大叔
课程内容:复习词汇:fall，run，save，climb，fly，swim，grow，throw，win，wear，liftwonderful，strong，weak，horrible，brave，evil复习语法和句型：(过去式)regularverbs：climb–climbed,lift–lifted，irregularverbs：fall–fell,fly–flew,grow–grew,
latex_4_一篇中文会议自定义模板登风其它开发语言编辑器
latex_4_一篇中文会议自定义模板模板链接：https://gitee.com/climb-the-wind/others/blob/master/EnglishWork/EnglishWork.zip模板内容：\documentclass[a4paper,11pt,onecolumn,twoside]{article}\usepackage{ctex}\bibliographystyle{u
2016年6月天然小番薯
news新闻newspaper报纸rising增大的discussion讨论educational教育的，有教育意义的educator教育家instruction教学tobeready做好准备multiple多重的，多种的program项目，节目，程序voluntary自愿的works产生效果gains利润，效果，利益sustain维持，持续steep急剧升降的，陡峭的climb攀山，上升cons
脑智前沿科普｜虚拟现实如何欺骗你的大脑人工智能学家人工智能编程语言机器学习大数据计算机视觉
来源：公众号（脑与心智毕生发展研究中心CLIMB）编辑：Yezi审阅：mingzlee7虚拟现实(Virtualreality,VR)就像被神奇地传送到另一个世界。这是一项令人兴奋的技术，但当我们戴上耳机后，我们很少停下来问：为什么它看起来如此真实？在这篇文章中，我们将探索使VR如此令人信服的一些概念和技术。我们会发现VR有效模拟了我们的体验和周围真实世界的特征。无论是在现实世界还是虚拟世界中，我
《测试驱动开发与设计模式》- 为什么选择测试驱动开发？ RonZheng2010
1攀岩的启示攀岩第一级：人工岩壁（休闲运动，学习场地，有保护设施）climb_basic.jpeg攀岩第二级：天然岩壁，顶绳攀登（极限运动，野外场地，已有保护设施）climb_protected_1.jpeg攀岩第三级：天然岩壁，先锋攀登（极限运动，野外场地，攀登过程中自己加入保护设施）climb_protected_2.jpeg攀岩第四级：天然岩壁，徒手攀登（啥运动?野外场地，无保护设施）cli
leetcode 算法相关 javascript
1.快速排序取出数组第一个元素，以这个数为基准，比它小的放左边，比它大的放右边，然后对左右两边的数组分别递归，得到一个升序数组：constquickSort=(arr)=>{if(arr.length{if(n===1)return1if(n===2)return2//如果要爬到第n层，可以分为从第n-1层爬上去或者n-2层直接爬上去两种returnclimb(n-1)+climb(n-2)}co
特质、抽象类、继承、重写、实现等 lehuai
packageday03/***特质、抽象类、继承、重写、实现等*/objectClassDemo{defmain(args:Array[String]):Unit={valhuman=newHumanprintln(human.name)println(human.climb)println(human.fight)}}/***特质*/traitFlyable{//声明一个没有值的字段valdi
带你一起观赏《The Climb》最新的风景截图品锋网Pnphone
在今年早些时候当Crytek公司宣布它们的第一款VR游戏《TheClimb》将在OculusRift上发布时，很多人都关注到这款虚拟现实游戏的操控将主要是集中在手部，使用Xbox手柄将会更加有吸引力和身临其境的感觉。幸运的是，为了搭配OculusRift的头显，Oculus公司已经决定发行OculusTouch控制器，Crytek公司也宣布将会更新游戏，以支持新的游戏操控设备。在上周洛杉矶召开的E
异常使用指南你听___
1.合理使用异常问题先来看一个反例：try{inti=0;while(true){range[i++].climb();}}catch(ArrayIndexOutOfBoundsException){}在上面这个企图利用数组越界的异常从而跳出死循环。如果针对的是数组遍历的场景，这么做的目的是企图利用Java异常机制，来跳过遍历中每次都需要检查是否越界来达到性能优化。但是，这种用法显然是不合理的，那
带你一起观赏《The Climb》最新的风景截图晓晓13号
在今年早些时候当Crytek公司宣布它们的第一个VR游戏《TheClimb》将在OculusRift上发布的时候，很多人都在考虑这个虚拟现实的游戏主要是集中在手部的动作，使用Xbox手柄可能会更加有吸引力和身临其境的感觉。不过幸运的是，为了搭配OculusRift的头显，Oculus公司已经决定发行OculusTouch控制器，Crytek公司也宣布将会更新游戏，以支持新的游戏设备。在上周洛杉矶召
Oculus 最新版视频邀您体验游戏—《The Climb》晓晓13号
只言片语不足以形容Crytek所研发的游戏《TheClimb》中全部的美丽奇观。我们可以从测试中的游戏环境了解到，用户以一个攀岩者的视角，根据他们自己的方式进行登山，并且努力达到最高点，当你到达山顶的时候，你将会独揽令人惊叹的景色。Oculus公司为《TheClimb》发布了一条新的广告，它竟有这样的一片风景。在视频中，我们可以体验到戴上OculusRift之后的感觉，一个年轻女子开启电脑并沉浸在
Go-接口类型详解（定义、实现、接口继承比较等） lady_killer9 Go go 接口 golang
目录简介结构体声明/定义实现与使用实现多接口实现接口继承空接口结构体切片排序接口和继承比较注意项全部代码截图参考简介Go语言中的接口是一种内置的类型，它定义了一组方法的签名，体现了程序设计的高内聚低耦合的特点，本篇文章会介绍接口及基本使用，下篇文章介绍类型断言。结构体定义Monkey结构体，具有climb方法。typeMonkeystruct{Namestring}func(m*Monkey)cl
JavaScript中对象调用其他函数/对象成员 dancheng_work #JavaScript
1、调用其它函数varmingzi="dancheng";functionsay(){console.log('名字'+this.mingzi+'在演讲');}varcat={mingzi:'kitty',eat:'fish'};cat.express=say;cat.express();varcat={name:'tom',climb:function(){console.log(this.na
个人记录 LeetCode 爬楼梯 qq_41329410 java 算法 leetcode 动态规划
假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢？注意：给定n是一个正整数。示例1：输入：2输出：2解释：有两种方法可以爬到楼顶。1阶+1阶2阶示例2：输入：3输出：3解释：有三种方法可以爬到楼顶。1阶+1阶+1阶1阶+2阶2阶+1阶来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/climb
年会葡萄兰姆酒
昨天是公司的年会，我唯一一次喝多了的年会。想想自己参加过的年会也不少了，一路走来，有那么多的相似又有那么多的不同。第一家公司是在北京的中国电力科学院实习期间，那年的年会大家去了九华山庄泡温泉，作为通讯所里的小实习生一枚，我第一次泡温泉，第一次带领大家跳了健美操，第一次给大官敬酒，第一次感到好像自己很渺小，但是很想证明自己。那时候的自己很稚嫩，但是很勇敢。第二家公司就是日本的CLIMB了，在日本大家
uphill 松果_
uphill:somethingthatisverydifficulttodoandneedsalotofeffortanddetermination,艰难的，费力的，hard/difficult/tough/demanding常用搭配：anuphillstruggle/battle/task/climb/fight例句：1.WhenevertheChinesenationalfootballte
Unit 1 Lesson 2 六六大叔
课程内容:复习词汇：fall，run，save，climb，fly，swim，grow，throw，win，wear，lift复习语法和句型：*(过去式)regularverbs：climb–climbed,lift–lifted，irregularverbs：fall–fell,fly–flew,grow–grew,,run–ran,save–saved，throw–threw,wear–wor
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

记录用nodejs爬虫爬取汽车之家遇到的一些坑

你可能感兴趣的:(climb)