MorphLing_

一个细致入微的nodejs爬虫项目介绍（上）

为了完成作业以及让自己看上去没有真的在划水，决定开始写博客了。

*5.1：给代码们加上了分号，改掉了一些拼错的代码。

虽然说写博客这件事的出发点是为了交作业，但博客这种形式说到底是为了给别人看的，是为了尽可能让别人理解的。如果只是自顾自地讲，而不以“让别人理解”为目标，写博客这件事就沦为一种自我满足，其实也就没有什么意义了。所以，既然是要写出来，放到网上的，那么在介绍的过程中，我会尽可能指出所有可能产生疑惑的点，并尽可能还原我在项目过程中遇到的各种问题以及解决的思路（在保证脉络清晰的前提下）。以这种姿态来描述，这只是为了让更多像我这样的初学者明白我在说的是什么，而这也是让读者理解的前提。

这篇博客分成以下部分：

项目介绍
实现过程

模块引用

1.1 Node.js模块系统介绍
1.2 回调函数相关

爬取种子网页

2.1 获取种子网页源码
2.2 网页编码（中文乱码问题）
2.3 手动分析源代码
2.4 获取新闻网页URL
- 2.4.1 cheerio模块
- 2.4.2 完善URL
- 2.4.3 用正则表达式筛选URL

爬取新闻网页

3.1 数据存储方式
3.2 cheerio选择器
3.3 数据处理
3.4 将数据保存到本地

代码完善和优化

4.1 避免程序崩溃的方法
4.2 代码模块化
4.3 代码效率计算和优化

项目介绍

简而言之，把各种新闻网页的内容爬取到本地，再自己建一个网站，要有搜索和热度分析的功能。当然，作为入门项目，还有一个重要目的应该是通过这个项目来熟悉js、html语法，各种模块的用法以及语言特性吧。

篇幅原因，这里先介绍前半部分，即爬虫部分。

实现过程

1. 模块引用

1.1 Node.js模块系统介绍

模块通常定义了一些外部接口，我们可以通过调用模块内的成员函数实现需要的功能，这一点和类是相似的。

为了实现爬虫功能，通常要在代码头部用require函数引入request、cheerio、iconv-lite和fs四个模块，其中fs是node.js内置的，其他三个需要安装，安装命令如下：

npm install request cheerio iconv-lite

在代码头部引入模块：（各个模块的基本功能将随实现过程逐个介绍）

var myRequest = require('request');
var myIconv = require('iconv-lite');
var myCheerio = require('cheerio');
var fs = require('fs');

reference：https://www.runoob.com/nodejs/nodejs-module-system.html

1.2 回调函数相关

在开始爬取之前我想先讨论一下回调函数是怎么一回事。
比如说在调用request时，常见的形式是这样的

myRequest(url,function(err,res,body){
    ...
    ...
})

myRequest需要传入两个参数，第一个url是将要发送请求的网址，问题是第二个参数，它是一个函数，也就是所谓的回调函数(callback)，初一看可能不太容易理解。

但是我们知道在编程语言中变量和函数是同级的。我们传入一个变量参数，是为了在需要的时候获取变量的值，那么类似地，传入一个函数参数，则是为了在需要的时候调用这个函数。不妨这样通俗地理解，我们提前规定了myRequest在获取了err,res,body三个变量的信息后应该执行的操作，把这一系列操作用回调函数的形式保存下来，那么myRequest就会在执行过程中按照要求执行回调函数了。（至于具体在什么时候执行，可能需要查看request模块的源码）

从作用上来说，回调函数直接体现了node.js异步编程的特性，能加快代码运行的速度。根据我的理解，因为执行回调函数的过程被视作为request的一部分，并且程序不必等request执行完毕就可以往后执行，那么回调函数的内容就是非阻塞的，对整体时间影响非常小。

reference：https://www.runoob.com/nodejs/nodejs-callback.html

2. 爬取种子网页

2.1 获取种子网页编码

如上所述，爬取网页内容使用的是request模块。request模块的第一个参数可以是一个对象，除了url属性是必须的，我们还可以根据需要添加其他的属性来控制爬取的方法，例如定义一个options对象，将其作为myRequest的参数

var options={
    url:myURL,      //设置目标网页的url
    encoding:null,  //设置编码方式，null即不进行编码，将编码工作交给iconv模块，详见2.2
    headers:headers,//设置header，用于防止爬虫被屏蔽，对于大多数网页可以缺省
    timeout:10000   //设置等待时间，单位为ms，超过等待时间err返回值为错误
}
myRequest(options,function(err,res,body){
    console.log(body);
}

这样一来，myRequest就能通过一些~~神奇的操作~~将网页的源码存储到body变量中了。如果在options中设置过编码方式为null，那么此时执行console.log(body)会看到一串神秘代码：

这是进行编码前网页源码的形式，要进一步加工，首先要用iconv进行编码

2.2 网页编码（中文乱码问题）

要对网页进行编码，首先要确定目标网页的编码方式。最直接的方法是打开浏览器->进入目标网页->F12->Console控制台->输入document.charset即可查看。应该也可以从网页head标签中的charset中查看，但有些网站好像和实际不符合，所以还是用控制台比较好。

常见的编码方式有"UTF-8",“GBK”,"Unicode"等，在不设置编码方式的情况下，request默认以utf-8的方式编码，但request不支持GBK格式的编码，因此如果网页是GBK格式的，我们就需要用iconv来完成转码工作。

var myEncoding='UTF-8'  //设置为目标网页编码方式
...
myRequest(options,function(err,res,body){
    var html=myIconv.decode(body,myEncoding);
}

不同编码方式最主要的区别在于对于汉字的表示方式不同，utf-8编码属于国际标准，用三个字节表示汉字，而GBK编码只用两个字节，是专门用来解决中文编码的。如果用错误的方式进行编码，不仅中文汉字无法正常显示，整个源码的结构也会发生变化，导致源码不可读。

下图是用utf-8对GBK格式的网页编码的结果，汉字显示为乱码。

改成用GBK格式编码后汉字可以正常显示。

2.3 手动分析源码

获取到的源码包含了页面中的全部信息，往往很长，而我们需要的仅仅包含新闻链接的那几行代码，因此在开始爬取之前，我们首先要手动分析源码，观察新闻url的存储位置。好在网页的源码都遵循HTML语言的格式，并且大多数结构清晰。我们也可以在浏览器审查元素（F12）中，查看网页的每一个元素所对应的代码。当然，审查元素中的代码并不是源码，而是源码经过js渲染之后生成的，因此有些网页中会出现不一致的情况，此时应该以源码（右键->查看网页源代码）为准。

分析源码也就是分析它的层级结构。比如下图中的新闻url我们可以通过标签href属性的值来定位url的位置，如果需要更准确的定位，可以把

也作为查找的条件。

2.4 获取新闻url

2.4.1 使用cheerio模块

cheerio模块囊括了对html页面的解析，分块，提取等多个功能，是实现爬虫功能最主要的工具。

cheerio模块用法很多也很灵活，由于我目前也只使用了其中的一些功能，不太理解它底层的实现原理，暂时只是把它作为一种工具去使用。避免误导，在此就不过多议论了。

由于cheerio和jQuery很多的用法是一样的，遇到问题时可以参考jQuery参考手册：https://www.w3school.com.cn/jquery/jquery_reference.asp 以及JS权威指南第19章的内容。

以下给出了一段获取新闻url的代码。

var $=myCheerio.load(html);    //解析html文件，将解析后的DOM结构存储在$中
var newsDiv=$('a');            //根据a标签进行分块
newsDiv.each(function(i,e){     //cheerio元素特有的遍历方式，回调函数中：i为计数器，e为当前元素
    news_url=$(e).attr('href');  //获取每个分块中的url链接，以字符串形式存入变量
});

2.4.2 完善URL

爬取到的新闻url的格式可能有以下几种，有些url需要完善之后才能使用：

以"//“开头的url，需要在前面加上"http:”

//channel.chinanews.com/cns/cl/yl-mxnd.shtml

以’/'开头的相对路径url，需要在前面加上种子页面的url

/gj/2020/04-17/9159939.shtml

一些可能没有实际意义的js代码，忽略即可

javascript:void(0)

完整的绝对路径url，可以直接使用

http://magazine.caijing.com.cn/20190605/4593837.shtml

完善url涉及到了JS中的字符串操作。我们可以使用.startsWith判断字符串是否以某子串为开头。以下给出一个示例：

if (news_url==="javascript:void(0)"||news_url===undefined) return;//如果url为"javascript:void(0)"或者不包含url，直接查看下一个
    if (news_url.startsWith("http://"))//分类三类情况完善url，将其转化为一个绝对路径
        news_url=news_url;
    else
        if (news_url.startsWith("//"))
            news_url="http:"+news_url;
        else
            if (news_url.startsWith("/"))
                news_url=myURL+news_url;

除了以上列举的几种，爬取到的url也可能出现别的情况，需要根据情况进行完善，尽可能将所有新闻url都转换成可用的格式。更多关于字符串操作的方法可以在参考手册中查询：https://www.w3school.com.cn/jsref/jsref_obj_string.asp

2.4.3 正则表达式筛选URL

种子页面除了新闻页面的url，也包含了很多其他网站的链接、广告链接等不需要的url，要筛选出需要的url，最方便的方法是利用正则表达式（一种用来匹配字符串的工具）。

首先还是手动分析url，找出其中最适合作为筛选条件的，具有特征的片段。

http://www.ecns.cn/news/2020-04-18/detail-ifzvpqct5600213.shtml
http://www.ecns.cn/video/2020-04-16/detail-ifzvpqct5598595.shtml
http://www.ecns.cn/hd/2020-04-17/detail-ifzvpqct5598937.shtml
http://www.ecns.cn/news/2020-04-18/detail-ifzvpqct5600277.shtml

新闻url种通常都会包括日期信息、和一串作为新闻id的字符串。
比如说选取"2020-04-18"的日期片段，可以看成

“数字*4” + “-” + “数字*2” + “-” + “数字*2”

用正则表达式的语法来表示则是

var news_reg=/\d{4}-\d{2}-\d{2}/;

又或者用“detail-ifzvpqct5600213”来筛选

“detail-” + “字母*8” + “数字*7”，用正则表达式表示一下：

var news_reg=/detail-\w{8}\d{7}/;

可供选择的正则表达式还有很多，检查标准是比较宽松的，只要确保不遗漏，不误筛就可以了。

使用正则表达式的test方法，如果为真，就可以把它作为新闻页面的url，开始爬取了。

if (news_reg.test(new_url))
    ··· //开始爬取新闻页面
    ···

reference: https://www.w3school.com.cn/jsref/jsref_obj_regexp.asp

3. 爬取新闻页面

3.1 数据存储方式

在开始爬取之前，先定义一个对象来保存信息，并将其中每一个属性都初始化为空串。

var Info={
    id:'',title:'',resource:'',author:'',editor:'',
    content:'',keywords:'',pubtime:'',fetchtime:'',url:''
    }
};

用一个对象来存储，在最后我们只需要导出这个对象，就可以导出所有的信息了。

3.2 cheerio选择器

对新闻页面的爬取过程其实与爬取种子页面完全是一个原理——用request模块获取页面信息，用iconv-lite模块完成转码，最后用cheerio解析、分块、提取。不同之处只在于，从提取一个信息（url）变成了要提取多个信息。

虽说如此，实际操作的时候，有些信息（比如title）我们可以简单地通过一个标签来获取，但有些信息的提取（比如content）可能就会变得格外复杂。（嗯。。尤其在爬取一些结构本来就不太清晰的新闻页面时）这时候就更需要好好分析源码结构，并且选择合适的cheerio选择器了。以下是一个给出一个根据源码对应爬取方式的示例（注释内是html源码，紧跟着对应的爬取方式）：

//
Info.title=$('h1#j_data').attr('data-title');

//
//  要爬取的内容
Info.resource=$('div.quote-content').children('a').text();

//要爬取的内容
Info.author=$('div.subhead').text();

//
//  要爬取
//  的内容
 
Info.content=$('div.quote-content').children('div,p').text();

//
//  标签1
//  标签2
//  标签3 
var keywordsDiv=$('div.basketballTobbs_tag').children('a');
keywordsDiv.each(function(i,e){
    Info.keywords=Info.keywords+','+$(e).text();
})//这样写是为了在每个标签后面加一个逗号

//要爬取的内容
//不想要的内容
//不想要的内容
Info.pubtime=$('span.stime').eq(0).text();//eq(0)来选择第一个元素

Info.fetchtime=new Date()
Info.fetchtime=Info.fetchtime.toFormat("YYYY-MM-DD-HH-MM-SS")//获取当前时间并转化格式(需要'date-utils')

当然，选择器的使用方式远不止这些，应该在实际使用中边做边掌握，遇到无法处理的情况可以查询cheerio（或者jQuery）的参考手册。

3.3 数据处理

到了这一步，所有需要从网页上爬取的内容都已保存在本地了，但通常还需要对信息做最后一步加工，删除不要的内容，删除其中的换行符、制表符等等，本质上是对字符串的处理，所以在这个过程中其实也能熟悉JS的各种字符串操作。这里介绍几种我遇到过的处理方法。

1.直接替换：利用replace方法，直接用字符、字符串或正则表达式进行查找，用给定的字符替换或删除

Info.content=Info.content.replace(/[\n\r\t]/g,'');//删除每一个换行符和制表符

2.先提取出要删除的子串，再用replace查找并替换掉

var temp=$('otitle').text();    //otitle标签中存储了文章的原标题
Info.content=Info.content.replace(temp,'');//删除原标题

3.先用indexOf找到某标志字符串的起始位置，再用substring或slice方法把需要的内容截取出来

//Info.author="作者：xxx"
Info.author=Info.author.substring(Info.author.indexOf("作者：")+3);//如果"作者："起始位置是x，那么作者姓名的起始位置就是x+3

最后的数据处理一般是花费时间最多的地方，毕竟每个网站新闻的格式都不同，甚至同一个种子网站下的两个新闻页面也可能是截然不同的，但这一步往往也决定了爬取数据质量的高低。数据的格式越规范、统一，那么在我们后续使用这些数据来搭建网站时就会相对越轻松。这就需要我们一点一点耐心地把关键信息过滤出来，去掉无意义的空格、符号，使用同样的分隔符（逗号or空格）。

3.4 将数据保存到本地

最后，只需要先设置文件名（json后缀），再用fs模块将Info对象保存到本地即可（默认和代码在同一个目录下）

var filename="Id"+Info.id+"_"+Info.fetchtime+'_'+resouce_website+".json";
fs.writeFileSync(filename,JSON.stringify(Info));

爬虫部分到此可以算完成了，但这个代码其实还有很多需要（或者说必须）完善和优化的地方。

4.代码完善和优化

4.1 避免程序崩溃的方法

嗯。。更优雅的说法是“提升代码稳定性”，然而我只是单纯地不想让它崩溃掉而已。。

首先，如果我们在程序中对一个没有定义过的（undefined）变量进行操作，或者将它作为一个参数，那么程序崩溃的可能性会非常大。怎么避免这种情况发生呢?

1.变量初始化：

对变量初始化是很重要的。比如执行以下代码：

var a;
var b='';
console.log(typeof a);
->undefined
console.log(typeof b);
->string

尽管变量b只是被赋值成了一个空串，但这一步初始化声明了它的类型是string，可以正常地作为一个字符串来使用。但如果把a作为字符串使用就会导致程序立刻崩溃。

2.随时检查error参数和response参数：

在很多回调函数中都有一个error参数，比如request模块：

request(url,function(err,response,body){
    ...
}

假如request对页面的申请失败了，error参数就会为真，同时，如果访问被跳转到其他页面，response.statusCode就不等于200了。而实际上，由于这是一个对网络发送的请求，单次访问失败的概率其实是非常高的。一旦访问失败，body参数就无法被正常赋值了，结果是undefined，如果我们继续操作下去，比如用iconv对body编码，程序也会立刻崩溃。所以爬虫代码中，对回调函数err参数的检查是必须的。

request(url,function(err,response,body){
    if (err || response.statusCode!==200){
        console.log("页面访问出错~~")
        return;
    }
    ...
})

3.对存在报错可能性的代码，使用try…catch

这个写法的好处在于不仅可以避免程序崩溃，也可以显示出程序崩溃的原因，因此我觉得也可以作为一种不错的调试方法。

用法如下：

var flag=1;
try{
    flag=2;
    abcdefg;
    flag=3;
}
catch(err){
    console.log(err.message);
}
console.log(flag);
->abcdefg is not defined
->2

从flag的值也可以看出，一旦运行出错就不再往下执行，而是直接跳出try所在的代码块。

4.2 代码模块化

这里我想表达的是，尽管爬取不同网站、不同页面具体的方式不一样，但总归在大体框架上还是有很多相同之处的。那么，在爬取一个新网站时能否把相同的框架部分保留下来，只去修改特定的几处呢？

其中一个方法就是以字符串形式将爬取某个元素时的代码提前预设好，并用eval函数来执行代码，比如示例中的：

var keywords_format = "$('meta[name=\"keywords\"]').eq(0).attr(\"content\")"
var title_format = "$('title').text()"
var date_format = "$('#pubtime_baidu').text()"
var author_format = "$('#editor_baidu').text()"
var content_format = "$('.left_zw').text()"
var desc_format = " $('meta[name=\"description\"]').eq(0).attr(\"content\")"
var source_format = "$('#source_baidu').text()"
...
...
fetch.keywords = eval(keywords_format);
fetch.title = eval(title_format);
fetch.author = eval(author_format);
fetch.content = eval(content_format);
fetch.source = eval(source_format);
fetch.desc = eval(desc_format);

但是关于eval的使用似乎普遍有一定的争议。。而且很多时候一行代码也不足以提取出想要的元素，因此我更倾向于用一个函数来代替eval实现模块化，举个例子：

Info.title=get_title($)
Info.content=get_content($)
...
function get_title($){
    var title=''
    title=$('title').text()
    return title;
}
function get_content($){
    var content=''
    content=$('div#article_body').text();
    content=content.replace(/\n|\t|\r/g,'');
    content=content.replace(/点击播放 GIF  \d.\dM/g,'');
    content=content.replace(/视频：/g,'');
    tmp=$('div.jsx-4284531154.isom').text()
    if (tmp!=undefined)
        content=content.replace(tmp,'')
    return content;
}

也就是将$作为参数，将爬取和处理后的结果作为返回值。不同网站爬取方式的差异都只在在函数中体现，而原来的程序则不需要作任何的改动即可运行，整体框架会比较清晰。

4.3 代码效率计算和优化

这一部分是我比较疑惑的。。写代码的时候发现，有些功能可以用好几种不同的方法来实现，其中肯定存在效率上的差异。但是具体哪一种效率更高我也不知道。。虽然有些钻牛角尖，但还是希望能得到解答吧。

在解析种子页面的时候，进行分块操作之后进行遍历，准备提取url，有三种方法：

以cheerio元素e作为选择器

var newsDiv=$('a')  //分块
//用cheerio元素e作为选择器
newsDiv.each(function(i,e){
    news_url=$(e).attr('href')
}

以计数器i作为选择器，选择第i个元素

var newsDiv=$('a');  //分块
//以计数器i作为选择器，选择第i个元素
newsDiv.each(function(i,e){
    news_url=$('*').eq(i).attr('href');
}

重新解析元素e得到$_，再提取$_的属性

var newsDiv=$('a')  //分块
//用cheerio元素e作为选择器
newsDiv.each(function(i,e){
    var $_=myCheerio.load(e);
    news_url=$_('*').attr('href');
}

看别人的代码似乎第一种是最为普遍的写法。。但在我看来，第一种写法需要从整张页面匹配出整个DOM块，效率最低，第二种写法只需要匹配出第i个元素，效率比较快，第三种写法不需要每次都从整张页面去匹配，效率高，但时间可能会花费在对分块的再解析上。emmm说到底还是因为对cheerio模块的底层原理不了，所以完全不知道怎么计算三种写法的效率。

结语

最后还是再把几个链接发一下吧。。边做边查应该学起来是最快的

W3school的JS参考手册：https://www.w3school.com.cn/jsref/index.asp

RUNOOB的Node.js教程：https://www.runoob.com/nodejs/nodejs-tutorial.html

cheerio中文文档：https://www.jianshu.com/p/629a81b4e013

你可能感兴趣的:(一个细致入微的nodejs爬虫项目介绍（上）)

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他