星河阅卷

Nodejs爬虫（定时爬取）

l 前言

Node.js是一个Javascript运行环境(runtime)。实际上它是对Google V8引擎进行了封装。V8引擎执行Javascript的速度非常快，性能非常好。Node.js对一些特殊用例进行了优化，提供了替代的API，使得V8在非浏览器环境下运行得更好。

Node.js是一个基于Chrome JavaScript运行时建立的平台，用于方便地搭建响应速度快、易于扩展的网络应用。Node.js使用事件驱动，非阻塞I/O 模型而得以轻量和高效，非常适合在分布式设备上运行数据密集型的实时应用。

l 使用NodeJs写网页爬虫的优势

大家都知道，我们要写一个网页爬虫，爬取网页上的信息，实际上就是将目标网站的页面html下载下来，然后通过各种方式（如正则表达式）获取我们想要的信息并保存起来。从这点看来，使用Nodejs来写网页爬虫便有着相当大的优势。

n Nodejs采用了Javascript的语法规则，是前端开发人员能够很容易上手

n Nodejs写爬虫可以避免写一大堆正则表达式去匹配元素，我们可以用jquery的语法直接获取dom对象，方便快捷，可读性强。

n Nodejs解决了Javascript无法直接操作系统文件的短板，让我们可以轻松操作系统中文件。

l NodeJs写网页爬虫需要准备的环境

1．首先，如果你的电脑没有安装nodejs,那么，你需要到nodejs的官网中下载一个nodejs安装包并安装（安装过程跟普通程序无异，这里就不再赘述）。

Nodejs的官方网址为：

https://nodejs.org/en/

2．安装好NodeJs之后，我们就可以在我们的项目空间中创建我们的项目目录，并通过npm命令对项目进行初始化，并安装以下插件（具体安装过程不再赘述，大家可百度一下npm安装插件的方法）。

"bufferhelper":"^0.2.1",
"cheerio":"^0.20.0",
"http":"^0.0.0",
"https":"^1.0.0",
"iconv-lite":"^0.4.13",
"node-schedule":"^1.1.1",
"path":"^0.12.7",
"request":"^2.74.0",
"url":"^0.11.0"

3．然后，我们可以全局安装一下express模块，命令如下：

npm install -g express-generator

或

cnpm install -g express-generator

4．安装好express模块之后呢，我们就可以通过express创建一个新的爬虫项目啦，具体命令如下：

express spider

命令执行完后我们就可以看到这样的一个项目啦：

项目构建好之后，我们还要为项目安装依赖，命令如下：

npm install

做完上面的步骤，我们的环境就算是搭建好了，接下来，我们就来看一下我们的爬虫系统涉及到了那些模块。

1) 文件系统（./module/File.js）

/**
* 常用文件操作模块
* Created by 汤文辉 on 2016-08-02.
*/

var fs = require('fs'),//文件操作
    mkdirp = require("mkdirp");//目录操作

var File= function(options) {

    this.path= options.path|| "";
    this.filename= options.filename|| "";
    this.encoding= options.encoding|| "UTF-8";

};

/**
* 修改文件内容并保存
* @paramcontent   文件内容
* @parambAppend   是否追加模式
* @paramencoding 文件编码，默认为UTF-8
*/
File.prototype.save= function(content,bAppend,encoding) {

    varself = this;

    varbuffer = newBuffer(content,encoding || self.encoding);

    vardoFs =function () {

        fs.open(self.path+self.filename,bAppend ? 'a': 'w',"0666",function (err,fd) {
            if(err) {
                throwerr;
            }
            varcb2 =function (err) {
                if(err){
                    throwerr;
                }

                fs.close(fd,function(err){
                    if(err){
                        throwerr;
                    }
                    console.log('文件成功关闭...');
                })
            };
            fs.write(fd,buffer,0,buffer.length,0,cb2);
        });

    };

    fs.exists(self.path,function (exists) {
        if(!exists) {
            self.mkdir(self.path,"0666",function () {
                doFs();
            });
        }else {
            doFs();
        }
    });

};

/**
* 递归创建目录
* @parampath      目录路径
* @parammode      模式默认使用 0666
* @paramfn        回调
* @paramprefix    父级菜单
*/
File.prototype.mkdir= function(path,mode,fn,prefix) {

    sPath = path.replace(/\\+/g,'/');
    varaPath = sPath.split('/');
    prefix = prefix ||'';
    varsPath = prefix + aPath.shift();
    varself = this;
    varcb =function () {
        fs.mkdir(sPath,mode,function (err) {
            if((!err) || ( ([47,-4075]).indexOf(err["errno"]) > -1 )) {//创建成功或者目录已存在
                if(aPath.length> 0) {
                    self.mkdir(aPath.join('/'),mode,fn,sPath.replace(/\/$/,'') +'/');
                }else {
                    fn();
                }
            } else{
                console.log(err);
                console.log('创建目录:'+ sPath + '失败');
            }
        });
    };
    fs.exists(sPath,function (exists) {
        if(!exists) {
            cb();
        }else if (aPath.length> 0) {
            self.mkdir(aPath.join('/'),mode,fn,sPath.replace(/\/$/,'') +'/');
        }else {
            fn();
        }
    });

};

module.exports= File;

2) URL系统(./module/URL.js)

/**
* URL处理类
* Created by 汤文辉 on 2016-08-02.
*/

var urlUtil = require("url");
var pathUtil = require("path");

var URL= function(){

};

/**
* @desc获取URL地址路径部分不包含域名以及QUERYSTRING
*
* @paramstring url
*
* @returnstring
*/
URL.getUrlPath= function(url){

    if(!url){
        return'';
    }
    varoUrl = urlUtil.parse(url);
    if(oUrl["pathname"] && (/\/$/).test(oUrl["pathname"])){
        oUrl["pathname"] +="index.html";
    }
    if(oUrl["pathname"]){
        returnoUrl["pathname"].replace(/^\/+/,'');
    }
    return'';

};

/**
* @desc判断是否是合法的URL地址一部分
*
* @paramstring urlPart
*
* @returnboolean
*/
URL.isValidPart= function(urlPart){
    if(!urlPart){
        return false;
    }
    if(urlPart.indexOf("javascript") > -1){
        return false;
    }
    if(urlPart.indexOf("mailto") > -1){
        return false;
    }
    if(urlPart.charAt(0) === '#'){
        return false;
    }
    if(urlPart ==='/'){
        return false;
    }
    if(urlPart.substring(0,4) === "data"){//base64编码图片
        return false;
    }
    return true;
};

/**
* @desc修正被访问地址分析出来的URL 返回合法完整的URL地址
*
* @paramstring url 访问地址
* @paramstring url2 被访问地址分析出来的URL
*
* @returnstring || boolean
*/
URL.prototype.fix= function(url,url2){
    if(!url || !url2){
        return false;
    }
    varoUrl = urlUtil.parse(url);
    if(!oUrl["protocol"] || !oUrl["host"] || !oUrl["pathname"]){//无效的访问地址
        return false;
    }
    if(url2.substring(0,2) === "//"){
        url2 = oUrl["protocol"]+url2;
    }
    varoUrl2 = urlUtil.parse(url2);
    if(oUrl2["host"]){
        if(oUrl2["hash"]){
            deleteoUrl2["hash"];
        }
        returnurlUtil.format(oUrl2);
    }
    varpathname = oUrl["pathname"];
    if(pathname.indexOf('/') > -1){
        pathname = pathname.substring(0,pathname.lastIndexOf('/'));
    }
    if(url2.charAt(0) === '/'){
        pathname = '';
    }
    url2 = pathUtil.normalize(url2);//修正 ./ 和 ../
    url2 = url2.replace(/\\/g,'/');
    while(url2.indexOf("../") > -1){//修正以../开头的路径
        pathname = pathUtil.dirname(pathname);
        url2 = url2.substring(3);
    }
    if(url2.indexOf('#') > -1){
        url2 = url2.substring(0,url2.lastIndexOf('#'));
    }else if(url2.indexOf('?') >　-1){
        url2 = url2.substring(0,url2.lastIndexOf('?'));
    }
    varoTmp = {
        "protocol": oUrl["protocol"],
        "host": oUrl["host"],
        "pathname": pathname +'/' + url2
    };
    returnurlUtil.format(oTmp);
};

module.exports= URL;

3) Robot系统（即爬虫系统主体）

/**
* 网页爬虫
* Created by 汤文辉 on 2016-08-02.
*/

var File = require("./File.js");
var URL = require("./URL.js");
var http = require("http");
var https = require("https");
var cheerio = require('cheerio');
var iconv = require('iconv-lite');
var BufferHelper = require("bufferhelper");
var request = require('request');

var oResult = {
    aNewURLQueue: [],//尚未执行爬取任务的队列
    aOldURLQueue: [],//已完成爬取任务的队列
    aTargetURLList: [],//目标对象URL集合
    oTargetInfoList: {},//目标对象集合
    oRetryCount:{},//失败重试记录
    iCount:0,//爬取url总数
    iSuccessNum:0//爬取成功数
};

/**
* 爬虫程序主体
* @paramoptions
* @constructor
*/
var Robot= function(options) {

    varself = this;
    this.domain= options.domain|| "";//需要爬取网站的域名
    this.firstUrl= options.firstUrl|| "";//需要爬取网站的url
    this.id= this.constructor.create();//唯一标识符
    this.encoding= options.encoding|| "UTF-8";//页面编码
    this.outputPath= options.outputPath|| "";//爬取内容存放路径
    this.outputFileName= options.outputFileName|| "result.txt";//结果保存文件名
    this.timeout= options.timeout|| 5000;//超时时间
    this.retryNum= options.retryNum|| 5;//失败重试次数
    this.robots= options.robots|| true;//是否读取robots.txt文件

    this.debug= options.debug|| false;//是否开启调试模式

    this.file= newFile({
        path:this.outputPath,
        filename:this.outputFileName
    });

    oResult.aNewURLQueue.push(this.firstUrl);//将第一个url添加进队列之中

    this.handlerComplete= options.handlerComplete|| function(){//队列中所有的url均抓取完毕时执行回调
            console.log("抓取结束...");

            varstr = "",i=0,len=oResult.aTargetURLList.length;

            for(i=0;i;i++){

                url = oResult.aTargetURLList[i];
                str+="（"+oResult.oTargetInfoList[url].name+"） : "+url+"\n"

            }
            this.file.save(str,true);

            this.file.save("\n抓取完成...\n",true);
        };

    this.disAllowArr= [];//不允许爬取路径

    varrobotsURL = this.firstUrl+"robots.txt";

    request(robotsURL,function(error,response,body){
        if(!error && response.statusCode== 200) {
            this.disAllowArr= self.parseRobots(body);
        }

    });

};

//默认唯一标识
Robot.id= 1;

/**
* 累加唯一标识
* @returns{number}
*/
Robot.create= function() {
    return this.id++;
};

/**
* 解析robots.txt
* @paramstr
* @returns{Array}
*/
Robot.prototype.parseRobots= function(str){

    varline = str.split("\r\n");

    vari= 0,len=line.length,arr = [];

    for(i=0;i;i++){

        if(line[i].indexOf("Disallow:")!=-1){

            arr.push(line[i].split(":")[1].trim())

        }

    }

    returnarr;

};

/**
* 判断当前路径是否允许爬取
* @paramurl
* @returns{boolean}
*/
Robot.prototype.isAllow= function(url){

    vari= 0,len=this.disAllowArr.length;
    for(i=0;i;i++){

        if(url.toLowerCase().indexOf(this.disAllowArr[i].toLowerCase())!=-1){
            return false;
        }

    }

    return true;

};

/**
* 开启爬虫任务
*/
Robot.prototype.go= function(callback) {

    varurl = "";

    if(oResult.aNewURLQueue.length>0){

        url = oResult.aNewURLQueue.pop();

        if(this.robots&&this.isAllow(url)){

            this.send(url,callback);

            oResult.iCount++;

            oResult.aOldURLQueue.push(url);

        }else{

            console.log("禁止爬取页面："+url);

        }

    }else{

        this.handlerComplete.call(this,oResult,this.file);

    }

};

/**
* 发送请求
* @paramurl   请求链接
* @paramcallback 请求网页成功回调
*/
Robot.prototype.send= function(url,callback){

    varself = this;

    vartimeoutEvent;//由于nodejs不支持timeout,所以，需要自己手动实现

    varreq = '';
    if(url.indexOf("https") > -1){
        req = https.request(url);
    }else {
        req = http.request(url);
    }

    timeoutEvent = setTimeout(function() {
        req.emit("timeout");
    },this.timeout);

    req.on('response',function(res){
        varaType = self.getResourceType(res.headers["content-type"]);
        varbufferHelper = newBufferHelper();
        if(aType[2] !== "binary"){
        } else{
            res.setEncoding("binary");
        }
        res.on('data',function(chunk){
            bufferHelper.concat(chunk);
        });
        res.on('end',function(){//获取数据结束
            clearTimeout(timeoutEvent);

            self.debug&& console.log("\n抓取URL:"+url+"成功\n");

            //将拉取的数据进行转码，具体编码跟需爬去数据的目标网站一致
            data= iconv.decode(bufferHelper.toBuffer(),self.encoding);

            //触发成功回调
            self.handlerSuccess(data,aType,url,callback);

            //回收变量
            data= null;
        });
        res.on('error',function(){
            clearTimeout(timeoutEvent);
            self.handlerFailure(url);
            self.debug&& console.log("服务器端响应失败URL:"+url+"\n");
        });
    }).on('error',function(err){
        clearTimeout(timeoutEvent);
        self.handlerFailure(url);
        self.debug&& console.log("\n抓取URL:"+url+"失败\n");
    }).on('finish',function(){//调用END方法之后触发
        self.debug&& console.log("\n开始抓取URL:"+url+"\n");
    });
    req.on("timeout",function() {
        //对访问超时的资源，进行指定次数的重新抓取，当抓取次数达到预定次数后将不在抓取改url下的数据
        if(oResult.oRetryCount[url]==undefined){
            oResult.oRetryCount[url] =0;
        }else if(oResult.oRetryCount[url]!=undefined&&oResult.oRetryCount[url]retryNum){
            oResult.oRetryCount[url]++;
            console.log("请求超时，调度到队列最后...");
            oResult.aNewURLQueue.unshift(url);
        }
        if(req.res) {
            req.res.emit("abort");
        }

        req.abort();
    });

    req.end();//发起请求

};

/**
* 修改初始化数据，须在调用go方法前使用方能生效
* @paramoptions
*/
Robot.prototype.setOpt= function(options){

    this.domain= options.domain|| this.domain||"";//需要爬取网站的域名
    this.firstUrl= options.firstUrl|| this.firstUrl|| "";//需要爬取网站的url
    this.id= this.constructor.create();//唯一标识符
    this.encoding= options.encoding|| this.encoding|| "UTF-8";//页面编码
    this.outputPath= options.outputPath|| this.outputPath|| "";//爬取内容存放路径
    this.outputFileName= options.outputFileName|| this.outputFileName|| "result.txt";//结果保存文件名
    this.timeout= options.timeout|| this.timeout|| 5000;//超时时间
    this.retryNum= options.retryNum|| this.retryNum|| 5;//失败重试次数
    this.robots= options.robots|| this.robots|| true;//是否读取robots.txt文件

    this.debug= options.debug|| this.debug|| false;//是否开启调试模式

    this.file= newFile({
        path:this.outputPath,
        filename:this.outputFileName
    });

    oResult.aNewURLQueue.push(this.firstUrl);//将第一个url添加进队列之中

    this.handlerComplete= options.handlerComplete|| this.handlerComplete|| function(){
            console.log("抓取结束...");

            varstr = "",i=0,len=oResult.aTargetURLList.length;

            for(i=0;i;i++){

                url = oResult.aTargetURLList[i];
                str+="（"+oResult.oTargetInfoList[url].name+"） : "+url+"\n"

            }
            this.file.save(str,true);

            this.file.save("\n抓取完成...\n",true);
        };

};

/**
* 数据拉取成功回调
* @paramdata 拉取回来的数据
* @paramaType 数据类型
* @paramurl   访问链接
* @paramcallback 用户给定访问成功回调，抛出给用户做一些处理
*/
Robot.prototype.handlerSuccess= function(data,aType,url,callback){

    if(callback){

        var$ = cheerio.load(data);
        callback.call(this,$,aType,url,oResult.aNewURLQueue,oResult.aTargetURLList,oResult.oTargetInfoList);

        oResult.iSuccessNum++;
        this.go(callback);
    }else{
        this.go();
    }

};

/**
* 失败后继续执行其他爬取任务
* @paramurl
*/
Robot.prototype.handlerFailure= function(url){

    //oResult.aNewURLQueue.indexOf(url)==-1&&oResult.aNewURLQueue.unshift(url);
    this.go();

};

/**
* @desc判断请求资源类型
*
* @paramstring Content-Type头内容
*
* @return[大分类,小分类,编码类型] ["image","png","utf8"]
*/
Robot.prototype.getResourceType= function(type){
    if(!type){
        return'';
    }
    varaType = type.split('/');
    aType.forEach(function(s,i,a){
        a[i] = s.toLowerCase();
    });
    if(aType[1] && (aType[1].indexOf(';') > -1)){
        varaTmp = aType[1].split(';');
        aType[1] = aTmp[0];
        for(vari = 1;i < aTmp.length;i++){
            if(aTmp[i] && (aTmp[i].indexOf("charset") > -1)){
                aTmp2= aTmp[i].split('=');
                aType[2] =aTmp2[1] ?aTmp2[1].replace(/^\s+|\s+$/,'').replace('-','').toLowerCase() : '';
            }
        }
    }
    if((["image"]).indexOf(aType[0]) > -1){
        aType[2] ="binary";
    }
    returnaType;
};

module.exports= Robot;

上面的功能都实现后，我们就可以开始来使用我们的爬虫系统了，首先，在app.js中调用我们的Robot模块

/**
* Created by 汤文辉 on 2016-08-03.
*/
var express = require("express");
var Robot = require("./module/robot.js");
var schedule = require("node-schedule");

function getTime(){
    vardate = newDate();
    vary = date.getFullYear();
    varm = date.getMonth()+1;
    vard = date.getDate();
    varh = date.getHours();
    varmi = date.getMinutes();
    vars = date.getSeconds();

    m = m<10?"0"+m:m;
    d = d<10?"0"+d:d;
    h = h<10?"0"+h:h;
    mi = mi<10?"0"+mi:mi;
    s = s<10?"0"+s:s;

    returny+"_"+m+"_"+d+"_"+h+"_"+mi+"_"+s;

}

var options = {
    domain:"dytt8.net",
    firstUrl:"http://www.dytt8.net/",
    outputPath:"./output/testRobot/",
    outputFileName:"test.txt",
    encoding:"GBK",
    timeout:6000,
    robots:true,
    debug:true,
    handlerComplete:function(oResult,file){

        console.log("抓取结束...");

        file.save("\n抓取完成...\n总共访问网页数为"+oResult.iCount+"条，其中成功访问网页数"+oResult.iSuccessNum+"条",true);

    }
};
var robot =new Robot(options);
var reg1 =/\/html\/[a-z0-9]+\/[a-z0-9]+\/[\d]+\/[\d]+\.html/gmi;
var reg2 =/\/html\/[a-z0-9]+\/index\.html/gmi;
//var reg3 = /(ftp|http):\/\/.+\.(rmvb|mp4|avi|flv|mkv|3gp|wmv|wav|mpg|mov)/gmi;

function start(){

    robot.go(function($,aType,url,aNewURLQueue,aTargetURLList,oTargetInfoList){

        varself = this;
        varpUrl = url;
        if(url===options.firstUrl){

            varaA = $("a");

            aA.each(function(){

                varhref = $(this).attr('href');

                if(href.indexOf("http://")==-1){

                    href = options.firstUrl+href.substring(1);

                }

                varres = reg1.exec(href);

                if(res){

                    aNewURLQueue.indexOf(href)==-1&&aNewURLQueue.push(href);

                }

            });

        }else{

            $('a').each(function(){

                varhref = $(this).attr('href');
                varres2 = reg2.exec(href);

                console.log("页面["+pUrl+"]二级页面：【"+ href + "】");

                if(href.indexOf("thunder://")!=-1){

                    varurl = $(this).text().trim();
                    console.log("\n目标链接【"+$("h1").text().trim()+"】："+url+"\n");
                    varname = $("h1").text().trim();
                    if(aTargetURLList.indexOf(url)){
                        aTargetURLList.push(url);
                        oTargetInfoList[url] = {
                            name:name
                        };
                    }

                    self.file.save(url+"\n",true);

                }else if(href.indexOf("ftp://")!=-1){
                    varurl = $(this).attr("href");
                    console.log("\n目标链接【"+$("h1").text().trim()+"】："+url+"\n");
                    varname = $("h1").text().trim();
                    if(aTargetURLList.indexOf(url)){
                        aTargetURLList.push(url);
                        oTargetInfoList[url] = {
                            name:name
                        };
                    }
                    self.file.save(url+"\n",true);

                }else if(res2){
                    if(href.indexOf("http://")==-1){

                        href = options.firstUrl+href.substring(1);

                    }

                    varres = reg1.exec(href);

                    if(res){

                        aNewURLQueue.indexOf(href)==-1&&aNewURLQueue.push(href);

                    }
                }

            });

        }

    });
}

var rule =new schedule.RecurrenceRule();

rule.dayOfWeek= [0,new schedule.Range(1,6)];

rule.hour= 19;

rule.minute= 45;

console.log("定时爬取任务，下次爬取时间为"+rule.hour+"时"+rule.minute+"分");

var j = schedule.scheduleJob(rule,function(){

    robot.setOpt({
        outputFileName:getTime()+"-"+"电影天堂.txt"
    });
    console.log("开始定时爬取任务...");
    start();

});

然后，我们在命令行中输入

node app.js

运行即可，爬虫将会在星期一~星期天的晚上19：45分定时爬取电影天堂电影下载链接，并输出到output目录中

你可能感兴趣的:(nodejs)

Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
vue 创建项目报错：command failed: npm install --loglevel error 那鱼、会飞 vue.js vue-cli3
这个问题其实很好解决，只是很多种情况，逐一排除即可。稳下心来~vuecli3创建项目我的node版本是node14.15.0，（永远不要尝试最新版本）node各种版本下载地址：以往的版本|Node.js(nodejs.org)vue/[email protected]@vue/[email protected]（注意vue/cli2和vue/cli3的下载命名有所改变，2是-形式，3是/形式）其实报错
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
Vue 项目运行时，报错 Error: Cannot find module ‘node:path‘ 周bro vue.js 前端 javascript node.js npm
node-v是否显示nodenpm-v报错Error:Cannotfindmodule‘node:path'是因为node版本和npm版本不匹配安装相对应的版本node版本10.16.0对应npm版本[email protected]执行该命令即可匹配版本官网https://nodejs.org/en/about/previous-releases
探索Zebra4J：构建高效企业级Web应用的微服务框架叶准鑫Natalie
探索Zebra4J：构建高效企业级Web应用的微服务框架ZebraZebra4J/Zebra4Js基于SpringBoot的JavaWeb/Nodejs框架项目地址:https://gitcode.com/gh_mirrors/zebra/Zebra项目介绍在当今快速发展的技术环境中，构建高效、可扩展的企业级Web应用是每个开发团队的追求。Zebra4J作为一款基于SpringBoot的全新微服务
计算机毕设Node.js+Vue校园易购二手交易平台（程序+LW+部署） Node程序源码强子 vue.js 课程设计 node.js
项目运行环境配置：Node.js最新版+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
node初奶瓶SAMA
www.nodejs.org下载nodejs的安装文件,然后就直接下一步，下一步，下一步傻瓜式安装（打开命令符widow+r输入cmd）node-v查单当前node的版本号安装nodejs时，会自动安装npm包管理工具npm-v查看npm的版本可以直接在黑窗口中输入node然后点击回车以后，就可以输入javascripnt的代码了既然在浏览器鼠标右键中console和在黑窗口中输入node点击回车
计算机毕业设计Node.js+Vue基于Java的医院预约挂号系统(程序+源码+LW+部署) Nodejs洋洋程序 java vue.js 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：Node.js+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
黄狄樊实训项目1.2.3 明年的牛肉干
.安装nodejs2.安装git3.下载vue-element-admin建议本项目的定位是后台集成方案，不太适合当基础模板来进行二次开发。因为本项目集成了很多你可能用不到的功能，会造成不少的代码冗余。如果你的项目不关注这方面的问题，也可以直接基于它进行二次开发。集成方案:vue-element-admin基础模板:vue-admin-template桌面终端:electron-vue-admin
基于nodejs+vue的美妆彩妆网站的设计与实现(源码+LW+调试文档+讲解等) 程序员gelei nodejs毕业设计项目 vue.js 前端 javascript
目录：博主介绍：完整视频演示：系统技术介绍：后端Java介绍前端框架Vue介绍具体功能截图：部分代码参考：Mysql表设计参考：项目测试：项目论文：为什么选择我：源码获取：博主介绍：博主：程序员gelei：全网拥有20W+粉丝、CSDN作者、博客专家、全栈领域优质创作者、平台优质Java创作者、专注于Java、小程序、python、安卓技术领域和毕业项目实战✌Java精品实战案例《1000套》20
解决nodejs mysql Error: Connection lost The server closed the connection echozzi node mysql javascript node.js 数据库
Node连接MySql，会出现几分钟无动作则自动关闭连接，导致Node服务器Down掉。报错信息：解决方法：将sql文件修改为连接池的写法，查询语句也是。参考链接：https://www.npmjs.com/package/mysql2具体实现：原连接写法(db.js)：写法没错，但因为数据库无操作断开机制所以还是有问题。看了其他的博客，尝试做了异常处理，还是会出现报错。constmysql=re
计算机毕业设计选题推荐-基于Python框架项目推荐（中）计算机毕设大佬 Java毕设实战项目 Python毕设实战项目爬虫+大数据毕设实战项目 python 计算机毕业设计 django 计算机毕业设计如何选题 25届计算机毕业设计如何选题计算机毕业设计选题推荐 24届计算机毕设选题推荐
博主介绍：✌十余年IT大项目实战经验、在某机构培训学员上千名、专注于本行业领域✌技术范围：Java实战项目、Python实战项目、微信小程序/安卓实战项目、爬虫+大数据实战项目、Nodejs实战项目、PHP实战项目、.NET实战项目、Golang实战项目。主要内容：系统功能设计、开题报告、任务书、系统功能实现、功能代码讲解、答辩PPT、文档编写、文档修改、文档降重、一对一辅导答辩。获取源码可以联系
Vue3: Node安装下载 QGC二次开发 vue.js vue node.js 开发语言信息可视化
目录一.Node网站链接二.安装node三.查看node安装是否成功一.Node网站链接Node.js中文网(nodejs.cn)下载20.17.0文档（长期支持版本）二.安装node一直next三.查看node安装是否成功安装成功后cmd打开本机终端，输入node查看是否安装成功。
nodejs清空文件内容不cong明的亚子前端小技巧 javascript 前端 node.js
话不多说，直接上代码constfs=require("fs");constpath=require("path");functionclearFile(filename){//写入文件是异步过程，需要使用promise保证文件操作完成returnnewPromise(resolve=>{letstr=path.join(__dirname,`./${filename}`);fs.writeFile
Gitbook 本地安装教程 simple哇书籍 gitbook
Gitbook本地安装教程安装node[nodejs的v10.21.0版本，下载地址：https://nodejs.org/dist/v10.21.0/node-v10.21.0-x64.msi]其他版本有问题npmnpminstall-ggitbook-cligitbookinit[初始化目录结构]gitbookbuild[编译]gitbookserve[运行]插件在根目录新建book.json
fastapi 大型应用_FastAPI使用小结行走的VCD fastapi 大型应用
以一个实际构建API的例子介绍FastAPI在已有数据情况下的简单应用简介FastAPI是一个现代、快速(高性能)的Web框架，基于标准Python类型提示，使用Python3.6+构建API。主要特征是：高速：与NodeJS和Go相当，拥有高性能。现有最快的Python框架之一。快速编码：将功能开发速度提高约200％至300％。更少的Bug：减少约40％的人为(开发人员)导致的错误。直观：更好的
【nvm】误操作npm install npm@latest -g如何回退纳米小川 nodejs nvm npm 前端 node.js npm nvm
加入电脑原来的node版本是14.19.1，那误操作npminstallnpm@latest-g后的npm版本已经不适用node版本了，此时要做回退操作1、查看当前可下载nodejs的最高版本nvmlistavailable2、下载最新的node版本nvminstall20.16.03、使用最新的node版本nvmust20.16.04、查看node14.19.1对应的npm版本npm6.x:通常
Linux中设置vue项目服务自启动 ADONGS_CODER linux vue.js 运维
一、摘要vue项目服务启动是进入到根目录，然后使用npmrundev启动环境，服务器由于重启或者网络波动等原因，会无辜的停止这个服务，如果是自己搭建的项目想自动启动，则需要搭建自启动服务。二、操作1.安装nvm管理包nvm管理包，据我目前的理解，大概就是像conda一样的一个容器，可以管理各种版本的nodejs和npm，这样就容易处理版本冲突问题。推荐下载curl-o-https://raw.gi
【ttf压缩】网页开发中引入字体文件过大，加载缓慢的解决办法【字蛛】【web Font】 Luckstar_wei 技术 css html 字体 ttf压缩中文字体压缩
yueyemoyanweb中文字体演示与工具使用请前往主页：http://font-spider.org/需要安装node.js输入以下命令：npminstallfont-spider-g运行安装成功之后就开始压缩了我的目录是这样的我的css文件开头是这样的这里要确保ttf文件一定要有，其他的不管在你的html中也引用了相应的css文件接下来就是最后一步了生成新的字体库nodejs命令行输入fon
[1286]python执行js代码方法汇总(PyExecJS、Js2Py、py-mini-racer) 周小董 Python前行者 python javascript
文章目录js2py简介及使用js2py简介js2py模块的使用js2py快速入门js代码翻译js代码中使用函数python执行js代码，学会这几个方法就够了楔子常见的Python调用JavaScript的方式使用nodejs命令PyExecJS方法通过Web浏览器DrissionPage方式playwright方式selenium方式Js2Py方式py-mini-racer方式小结js2py简介及
【itchat+python】24年从0搭建微信聊天机器人全过程分享捕捉阳光微信聊天机器人 python 微信机器人
文章目录前言开整准备部署方法1部署方法2代码demo异常小结（含数据结构/心跳修改的源码位置）前言初学python，很多都并不是很熟练。就搞了好几天。目前初步已经搭建完成。之前使用的wechaty的uos版本感觉并不是很稳定，总是宕机，那个是nodejs的版本我并不会调整。nodejs我更加不会。所以就重新找个尝试。想尝试之前的版本的请阅读：【python+wechaty+docker+nodej
CentOS 7 安装Node.js V14.15 @Link.Note Linux基础环境配置 centos node.js linux
1.下载nodejs安装文件wgethttps://nodejs.org/dist/v14.15.4/node-v14.15.4-linux-x64.tar.xz若虚需要安装其他版本，直接将V14.15.4更换即可2.安装unzip应用yum-yinstallunzipziptar-xvfnode-v14.15.4-linux-x64.tar.xzmkdir-p/usr/local/nodejsm
ClickHouse安装与使用指南富艾霏
ClickHouse安装与使用指南clickhouseNodeJSclientforClickHouse项目地址:https://gitcode.com/gh_mirrors/clic/clickhouse项目介绍ClickHouse是由Yandex开发的一个用于在线分析处理(OLAP)的列式数据库管理系统(DBMS)。此开源项目位于https://github.com/TimonKK/click
【前端Vue】06 - VueCLI 脚手架 itlu
1.VueCLI介绍CLI是Command-LineInterface,翻译为命令行界面,但是俗称脚手架。VueCLI是一个官方发布vue.js项目脚手架，使用vue-cli可以快速搭建Vue开发环境以及对应的webpack配置。2.使用VueCLI需要做的准备2.1安装NodeJS下载地址。默认情况下自动安装Node和NPM。2.2安装符合要求的Node版本Node环境要求8.9以上或者更高版本
module.exports 与 exports.xxx 的区别 InterestAndFun nodejs nodejs module.exports exports
1.原理解析NodeJS中使用了CommonJS的模块化标准，Node内部提供一个Module构建函数。所有模块都是Module的实例。每个模块内部，都有一个module对象，代表当前模块。而这个module对象中，就存在一个成员exports，该成员也是一个对象。也就是说，如果你需要对外导出成员，只需要把导出的成员挂载到module.exports上就可以了，最终module对象中会执行retr
Node.js Google Cloud Natural Language API 教程江奎钰
Node.jsGoogleCloudNaturalLanguageAPI教程nodejs-languageThisrepositoryisdeprecated.Allofitscontentandhistoryhasbeenmovedtogoogleapis/google-cloud-node.项目地址:https://gitcode.com/gh_mirrors/no/nodejs-langua
实时聊天应用开发指南：基于React与WebSocket 江奎钰
实时聊天应用开发指南：基于React与WebSocketreact-real-time-chat-appAreal-timechatapplicationbuiltusingReact(CreateReactApponthefrontend)andNodeJS/Express/Socket.ioBackend项目地址:https://gitcode.com/gh_mirrors/re/react-
nodejs笔记总结是张鱼小丸子鸭 node.js javascript vue.js 前端
nodejs的概念：nodejs是一个基于ChromeV8引擎的JavaScript运行环境。Node.js使用了一个事件驱动、非阻塞式I/O的模型，使其轻量又高效。Node.js的包管理器npm，是全球最大的开源库生态系统。node组成：Ecmascript模块模块的分类：内置模块：fshttppathurl自定义模块：commonjs规范第三方模块（npm下载）常见的模块指令：npmnodep
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam