爱_莲说

【Web编程实践课第一次作业】体育新闻爬虫

僕の世界から君を無くしたら　　　如果我的世界没有你
意味が無いから　　　　　　　　　无论何事都尽失意义
君の世界まで僕が向かうから　　　我会向着你的世界奔去
待っててくれるかな　　　　　　　请你等着我好吗
——《君のいない夜を越えて》
~~跑错片场了。~~

2020年3月12日上午8:00~9:30，通过微信群平台，我们完成了Web编程第一次实践课；而在13日，我也完成了第一次作业的编程任务。

实验内容

此次实验的内容是，通过Node.js实现一个新闻爬虫，从3~5个新闻网站中爬取新闻信息，同时提取出标题、摘要、内容、时间、作者、来源等等信息。

要求是，必须使用Node.js实现爬虫，用Node.js实现网络后端，用HTML实现前端，且不使用任何前端框架。

实验效果

先看最终的效果如何——

前端效果：

单关键词搜索效果：

多关键词搜索效果：

准备

首先使用npm安装cheerio和request包，方法是，在控制台输入

npm install -g cheerio
npm install -g request

但事实证明，npm给我扔了一个EINVALIDPACKAGENAME异常，百度后得知，国家有一堵伟大的墙挡住了我学习的脚步。

于是我在用户文件夹下的.npmrc文件中加入了如下几行：

proxy=null
registry=https://registry.npm.taobao.org/
disturl=https://npm.taobao.org/dist

使用了淘宝的镜像站，成功下载了cheerio和request依赖包。

分析页面

虎扑

首先在程序中敲入如下代码：

'use strict';   //使用严格模式

var http = require('http');         //http包
var myRequest = require('request'); //request包
var myCheerio = require('cheerio'); //cheerio包，用法与jQuery极其相似
var fs = require('fs');                 //fs包，用于读文件

function getNewsPage(url, callback) {       //请求新闻导航页
    var options = {
        url: url, encoding: null, headers: null
    }
    myRequest(options, callback);
}

function request(url, callback) {           //请求某一新闻帖页面
    var options = {
        url: url,
        encoding: null,
        headers: null
    }
    myRequest(options, callback);
}

//标题、内容、编者、来源、时间以及新闻地址
var Titles = new Array();
var Contexts = new Array();
var Editor = new Array();
var ComeFrom = new Array();
var ComeURLs = new Array();
var DateTime = new Array();
var URLs = new Array();

接着，我们进入虎扑的四个新闻网站：

https://voice.hupu.com/soccer
https://voice.hupu.com/nba
https://voice.hupu.com/china
https://voice.hupu.com/cba

按F12审查元素，观察他们的前端代码：

我们得到一个结论：进入这些新闻页面的链接，都在每个h4标签中的a子标签的href属性之中。
接下来，我们点开一个页面进入，并查看源码：

可以看到，新闻的标题正好是网页的标题title的内容，正文则是div[class=“artical-main-content”]标签下的内容，编者、来源、时间等分别来自于span[id=“editor_baidu”]、span[class=“comeFrom”]的a子标签、span[id=“pubtime_baidu”]。

顺便吐槽一句，为什么命名为baidu呢，和百度公司有关系吗？

那么虎扑新闻网的爬虫也就写好了：

var hupuSpider = {
    NewsURLs : [
        "https://voice.hupu.com/soccer",
        "https://voice.hupu.com/nba",
        "https://voice.hupu.com/china",
        "https://voice.hupu.com/cba"
    ],                                          //虎扑的几个新闻网页
    GetURL: function (err, res, body) {         //从新闻总页获取统一资源定位器，并爬取信息
        var BuildDataset = function (err, res, body) {
            if (err || res.statusCode != 200) {     //失败
                Titles.push(`新闻抓取失败-${err}`);
                Contexts.push('暂无内容');
                Editor.push('暂无编者');
                ComeFrom.push('暂无来源');
                ComeURLs.push('');
                DateTime.push('暂无时间')
            } else {
                let html = body;                    //网页源码，送入cheerio解析
                let $ = myCheerio.load(html, { decodeEntities: false });
                //console.log($.html());            //Debug代码，输出网页源码

                URLs.push(res.request.uri.href);    //将解析的信息塞进数组
                Titles.push($('title').text());
                Contexts.push($('div[class="artical-main-content"]').text());
                Editor.push($('span[id="editor_baidu"]').text());
                ComeFrom.push($('span[class="comeFrom"]').children("a").text());
                ComeURLs.push($('span[class="comeFrom"]').children("a").attr("href"));
                DateTime.push($('span[id="pubtime_baidu"]').text());
            }
        };

        if (err || res.statusCode != 200) {     //err不为null，说明出现了异常
            console.log(`新闻抓取失败-${err}`);
        } else {
            let html = body;                    //网页源码，送入cheerio解析
            let $ = myCheerio.load(html, { decodeEntities: false });
                                                //找到第cnt个标签中的href属性
            let cnt = 0;                        //新闻子页面的计数器
            let h4Arr = $("h4").eq(cnt);
            let str = h4Arr.children("a").attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                h4Arr = $("h4").eq(cnt);
                str = h4Arr.children("a").attr("href");
            }
        }
    }
};

球天下

由于期望获取到的信息更加多元化 ~~（其实是不满虎扑爬取难度过低）~~ ，3月23日，我为爬虫添加了球天下这一新闻获取渠道。

比起虎扑，球天下的爬取难度略微高一些。

球天下主要有两个新闻网页：

https://www.qtx.com/
https://www.qtx.com/others

这两个网页虽然看起来并不一样，但前端代码还是有几分相似的。

首先，观察发现，所有新闻内容都在div[class=“baseNewsList”]之中：

其次，所有的链接都在h3、h4、div[class=“media-body”]、a这四种标签之中。所以，只要用cheerio定位这些标签就可以。

接下来就是每个新闻网页中内容的提取了，随便点开一个网页：

我们发现，其网页标题依然是新闻标题，正文位于div[class=“artContent”]标签中。编者反而位于右侧，是球天下的注册用户，其用户名位于div[class=“bzhead”]标签下的p子标签中。来源和时间都在div[class=“mes”]标签中，需要根据空格来分离开。

那么球天下的爬虫也可以写好了：

var qtxSpider = {
    NewsURLs: [
        "https://www.qtx.com/others",
        "https://www.qtx.com/"
    ],                                          //球天下新闻网页
    GetURL : function (err, res, body) {        //从新闻总页获取统一资源定位器，并爬取信息
        var BuildDataset = function (err, res, body) {
            if (err || res.statusCode != 200) {     //失败
                Titles.push(`新闻抓取失败-${err}`);
                Contexts.push('暂无内容');
                Editor.push('暂无编者');
                ComeFrom.push('暂无来源');
                ComeURLs.push('');
                DateTime.push('暂无时间')
            } else {
                let html = body;                    //网页源码，送入cheerio解析
                let $ = myCheerio.load(html, { decodeEntities: false });
                //console.log($.html());            //Debug代码，输出网页源码

                URLs.push(res.request.uri.href);    //将解析的信息塞进数组
                Titles.push($('title').text());
                Contexts.push($('div[class="artContent"]').text());
                Editor.push($('div[class="bzhead"]').children('p').text());
                ComeFrom.push($('div[class="mes"]').text().split(" ")[0]);
                ComeURLs.push($('div[class="mes"]').children("a").attr("href"));
                DateTime.push(($('div[class="mes"]').text().split(" ")[1] + $('div[class="mes"]').text().split(" ")[2]).toString().replace("年", "-").replace("月", "-").replace("日", " "));
            }
        };

        if (err || res.statusCode != 200) {     //err不为null，说明出现了异常
            console.log(`新闻抓取失败-${err}`);
        } else {
            let html = body;                    //网页源码，送入cheerio解析
            let $ = myCheerio.load(html, { decodeEntities: false });
            let baseNewsList = $('div[class="baseNewsList"]');
                                                //找到news列表中的第cnt个标签中的href属性
            let cnt = 0;                        //新闻子页面的计数器
            let h3Arr = baseNewsList.children("h3").eq(cnt);
            let str = h3Arr.children("a").attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                h3Arr = baseNewsList.children("h3").eq(cnt);
                str = h3Arr.children("a").attr("href");
            }
                                                //找到news列表中的第cnt个标签中的href属性
            cnt = 0;
            let h4Arr = baseNewsList.children("h4").eq(cnt);
            str = h4Arr.children("a").attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                h4Arr = baseNewsList.children("h4").eq(cnt);
                str = h4Arr.children("a").attr("href");
            }
                                                //找到news列表中的第cnt个标签下标签中的href属性
            cnt = 0;
            let divArr = baseNewsList.children("div").eq(cnt).children("div");
            str = divArr.children("a").attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                divArr = baseNewsList.children("div").eq(cnt).children("div");
                str = divArr.children("a").attr("href");
            }
                                                //找到news列表中的第cnt个标签的href属性
            cnt = 0;
            let aArr = baseNewsList.children("a").eq(cnt);
            str = aArr.attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                aArr = baseNewsList.children("a").eq(cnt);
                str = aArr.attr("href");
            }
        }
    }
};

搜狐体育

搜狐体育是我最想吐槽的新闻网站，没有之一。

好吧。3月24日我为了挑战自己，为爬虫增加了搜狐体育的渠道。

这一渠道的第一个问题则是导航页过多：

https://sports.sohu.com/s/integrated
https://sports.sohu.com/s/csl
https://sports.sohu.com/s/cnmenfootball
https://sports.sohu.com/s/ccl
https://sports.sohu.com/s/afccl
https://sports.sohu.com/s/premierleague
https://sports.sohu.com/s/bundesliga
https://sports.sohu.com/s/laliga
https://sports.sohu.com/s/ligue1
https://sports.sohu.com/s/seriea
https://sports.sohu.com/s/uefacl
https://sports.sohu.com/s/nba
https://sports.sohu.com/s/cba
https://sports.sohu.com/s/tcb
https://sports.sohu.com/s/wcba
https://sports.sohu.com/s/badminton
https://sports.sohu.com/s/pingpong
https://sports.sohu.com/s/billiards
https://sports.sohu.com/s/swimming
https://sports.sohu.com/s/running
https://sports.sohu.com/s/volleyball
https://sports.sohu.com/s/golf
https://sports.sohu.com/s/e_sport
https://sports.sohu.com/s/tennis
https://sports.sohu.com/s/chess
https://sports.sohu.com/s/boxing
https://sports.sohu.com/s/racing
https://sports.sohu.com/s/bicycle
https://sports.sohu.com/s/uefael
https://sports.sohu.com/s/womenfootball
https://sports.sohu.com/s/cfac
https://sports.sohu.com/s/sailing
https://sports.sohu.com/s/euro2020
https://sports.sohu.com/s/afac
https://sports.sohu.com/s/fifa

所有新闻都在ul[class=“news-list first”]和ul[class=“news-list second”]两个列表的li标签中。

然而这些导航页的链接，让爬虫报错了——我的爬虫发现无法访问到这些链接。

无奈之下查看了网页源代码，望着这只有一行的网页源码，我捡起了掉在键盘上的那把头发。

结果发现，这些链接，有的是变量不全，有的没有“https:”……

于是我在爬取过程中，对这些不合法的链接进行清洗。

终于完成了导航页的问题，接下来是新闻页面：

可以发现，新闻标题依然是网页标题；而内容在article[class=“article”]中；作者在左侧div[class=“user-info”]下的h4子标签中；时间则在span[class=“time”]之中。

那么接下来就可以写好搜狐体育新闻爬虫啦！

var sohuSpider = {
    NewsURLs: [
        "https://sports.sohu.com/s/integrated",
        "https://sports.sohu.com/s/csl",
        "https://sports.sohu.com/s/cnmenfootball",
        "https://sports.sohu.com/s/ccl",
        "https://sports.sohu.com/s/afccl",
        "https://sports.sohu.com/s/premierleague",
        "https://sports.sohu.com/s/bundesliga",
        "https://sports.sohu.com/s/laliga",
        "https://sports.sohu.com/s/ligue1",
        "https://sports.sohu.com/s/seriea",
        "https://sports.sohu.com/s/uefacl",
        "https://sports.sohu.com/s/nba",
        "https://sports.sohu.com/s/cba",
        "https://sports.sohu.com/s/tcb",
        "https://sports.sohu.com/s/wcba",
        "https://sports.sohu.com/s/badminton",
        "https://sports.sohu.com/s/pingpong",
        "https://sports.sohu.com/s/billiards",
        "https://sports.sohu.com/s/swimming",
        "https://sports.sohu.com/s/running",
        "https://sports.sohu.com/s/volleyball",
        "https://sports.sohu.com/s/golf",
        "https://sports.sohu.com/s/e_sport",
        "https://sports.sohu.com/s/tennis",
        "https://sports.sohu.com/s/chess",
        "https://sports.sohu.com/s/boxing",
        "https://sports.sohu.com/s/racing",
        "https://sports.sohu.com/s/bicycle",
        "https://sports.sohu.com/s/uefael",
        "https://sports.sohu.com/s/womenfootball",
        "https://sports.sohu.com/s/cfac",
        "https://sports.sohu.com/s/sailing",
        "https://sports.sohu.com/s/euro2020",
        "https://sports.sohu.com/s/afac",
        "https://sports.sohu.com/s/fifa"
    ],                                          //搜狐新闻网页
    GetURL: function (err, res, body) {         //从新闻总页获取统一资源定位器，并爬取信息
        var BuildDataset = function (err, res, body) {
            if (err || res.statusCode != 200) {     //失败
                Titles.push(`新闻抓取失败-${err}`);
                Contexts.push('暂无内容');
                Editor.push('暂无编者');
                ComeFrom.push('暂无来源');
                ComeURLs.push('');
                DateTime.push('暂无时间')
            } else {
                let html = body;                    //网页源码，送入cheerio解析
                let $ = myCheerio.load(html, { decodeEntities: false });
                //console.log($.html());            //Debug代码，输出网页源码

                URLs.push(res.request.uri.href);    //将解析的信息塞进数组
                Titles.push($('title').text());
                Contexts.push($('article[class="article"]').text());
                Editor.push($('div[class="user-info"]').children('h4').text());
                ComeFrom.push($('a[id="backsohucom"]').text());
                ComeURLs.push($('a[id="backsohucom"]').attr("href"));
                DateTime.push($('span[class="time"]').text());
            }
        };

        if (err || res.statusCode != 200) {     //err不为null，说明出现了异常
            console.log(`新闻抓取失败-${err}`);
        } else {
            let html = body;                    //网页源码，送入cheerio解析
            let $ = myCheerio.load(html, { decodeEntities: false });
                                                //找到news列表中的第cnt个标签下标签中的href属性
            let cnt = 0;                        //新闻子页面的计数器
            let newsList = $('ul[class="news-list first"]');
            let liArr = newsList.children("li").eq(cnt);
            let str = liArr.children("a").attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                str = "https://" + str.split("//")[1].split("?")[0];    //在此强烈谴责某狐程序员
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                liArr = newsList.children("li").eq(cnt);
                str = liArr.children("a").attr("href");
            }
                                                //找到news列表中的第cnt个标签下标签中的href属性
            cnt = 0;
            newsList = $('ul[class="news-list second"]');
            liArr = newsList.children("li").eq(cnt);
            str = liArr.children("a").attr("href");
            while (str) {                       //如果找得到，那么输出并继续寻找下一个
                str = "https://" + str.split("//")[1].split("?")[0];    //再次强烈谴责某狐程序员
                console.log(str);
                request(str, BuildDataset);
                ++cnt;
                liArr = newsList.children("li").eq(cnt);
                str = liArr.children("a").attr("href");
            }
        }
    }
};

这之后，我们的数组中已经包含了所有信息。接下来就看如何呈现出来。

前端设计

我期望的效果是，网页主要有一个表格构成，这个表格展示了所有新闻的标题、内容、编者、来源、时间，同时可以点击新闻标题和来源跳转至相应网站。此外，表格头部还要有一个搜索框，用于筛选新闻。

表格，众所周知，需要用到table标签，其中每一行都是一个tr标签，该行每个单元格都是一个td标签。

同时每一行需要一个id属性，便于搜索时隐藏无关信息。

而检索算法则是，通过空格分隔关键词，然后对所有新闻进行匹配，如果某一新闻不包含这些关键词中的任意一个，那么它将会被隐藏。否则将会将其保留显示。

这里可以做一些优化，比如用jieba分词，然后再进行匹配。这样代码就稍显复杂，下面则是我的实现方法：

for (let x in hupuSpider.NewsURLs) {
    getNewsPage(hupuSpider.NewsURLs[x], hupuSpider.GetURL);
}                                               //根据虎扑导航页获取新闻信息

for (let x in qtxSpider.NewsURLs) {
    getNewsPage(qtxSpider.NewsURLs[x], qtxSpider.GetURL);
}                                               //根据球天下导航页获取新闻信息

for (let x in sohuSpider.NewsURLs) {
    getNewsPage(sohuSpider.NewsURLs[x], sohuSpider.GetURL);
}                                               //根据搜狐导航页获取新闻信息

let $ = myCheerio.load(`


    
        
        体育新闻爬取结果
    
    
        
        
        
        
    

`);                                             //网页标题与输入框

$("table").append(`
序号
标题
内容
编辑
来源
时间
`);                                        //表头


http.createServer(function (req, res) {         //建立网站
    for (let x in URLs) {                       //完善表格
        $("table").append(`
            ${x}">
                ${x}
                ${URLs[x]}" id="t${x}">${Titles[x]}
                ${x}">${Contexts[x]}${Editor[x]}
                ${ComeURLs[x]}">${ComeFrom[x]}
                ${DateTime[x]}
            
        `);                                     //表格中插入一行
    }

    $("body").append(`
        
    `);                                         //搜索关键词代码

    let body = $.html();                        //将cheerio处理的html设置为网页源码
    res.writeHead(200, {'Content-type': 'text/html'});
    res.end(body);
}).listen(3000);                                //监听3000端口

后端——数据库

4月1日，我用数据库代替了数组，完善了爬虫程序。

首先是引入MySQL：

//database包
var mysql = require("mysql");                   //mysql包，存放数据
var pool = mysql.createPool({
    host: 'localhost',
    port: 3306,
    user: 'root',
    password: 'root',
    database: 'newslist'
});
var query = function (sql, sqlparam, callback) {
    pool.getConnection(function (err, conn) {
        if (err) {
            callback(err, null, null);
        } else {
            conn.query(sql, sqlparam, function (qerr, vals, fields) {
                conn.release();                 //释放连接 
                callback(qerr, vals, fields);   //事件驱动回调 
            });
        }
    });
};
var query_noparam = function (sql, callback) {
    pool.getConnection(function (err, conn) {
        if (err) {
            callback(err, null, null);
        } else {
            conn.query(sql, function (qerr, vals, fields) {
                conn.release();                 //释放连接 
                callback(qerr, vals, fields);   //事件驱动回调 
            });
        }
    });
};
exports.query = query;
exports.query_noparam = query_noparam;

然后定义两个函数：

var database = require('./database');   //自定义database包，与数据库交互
//MySQL语句
function query_and_request(str, BuildDataset) {
    database.query('select URL from fetches where URL=?', [str], function (qerr, vals, fields) {
        if (qerr) {
            console.error(`数据库查重失败-${qerr}`);
        } else {
            if (vals.length > 0) {
                console.log(`\t-查重到${vals.length}条信息`);
            } else {
                request(str, BuildDataset);
            }
        }
    });
}

function query_and_insert(myFetch) {
    database.query('INSERT INTO fetches(URL,Title,Content,Editor,ComeFrom,ComeURL,DateTime) VALUES(?,?,?,?,?,?,?)',
      [myFetch.URL, myFetch.Title, myFetch.Content, myFetch.Editor, myFetch.ComeFrom, myFetch.ComeURL, myFetch.DateTime],
      function (qerr, vals, fields) {
        if (qerr) {
            console.error(`数据库插入失败-${qerr}`);
        }
    });
}

然后在所有调用request的位置，修改为：

query_and_request(str, BuildDataset);

每个爬虫的BuildDataset函数也要重写，以虎扑爬虫为例，其代码应修改为：

var BuildDataset = function (err, res, body) {
    if (err || res.statusCode != 200) {     //失败
        console.error(`新闻页面抓取失败-${err}`);
    } else {
        let html = body;                    //网页源码，送入cheerio解析
        let $ = myCheerio.load(html, { decodeEntities: false });
        //console.log($.html());            //Debug代码，输出网页源码
        var myFetch = {};                   //抓取信息
                                            //将解析的信息塞进数组
        myFetch.URL = res.request.uri.href;
        myFetch.Title = $('title').text();
        myFetch.Content = $('div[class="artical-main-content"]').text();
        myFetch.Editor = $('span[id="editor_baidu"]').text();
        myFetch.ComeFrom = $('span[class="comeFrom"]').children("a").text();
        myFetch.ComeURL = $('span[class="comeFrom"]').children("a").attr("href");
        myFetch.DateTime = new Date($('span[id="pubtime_baidu"]').text());

        query_and_insert(myFetch);
    }
};

主函数则是一个让我调了两天的回调地狱：

for (let x in hupuSpider.NewsURLs) {
    getNewsPage(hupuSpider.NewsURLs[x], hupuSpider.GetURL);
}                                               //根据虎扑导航页获取新闻信息

for (let x in qtxSpider.NewsURLs) {
    getNewsPage(qtxSpider.NewsURLs[x], qtxSpider.GetURL);
}                                               //根据球天下导航页获取新闻信息

for (let x in sohuSpider.NewsURLs) {
    getNewsPage(sohuSpider.NewsURLs[x], sohuSpider.GetURL);
}                                               //根据搜狐导航页获取新闻信息

                                                //网页标题与输入框
let $ = myCheerio.load(fs.readFileSync("./html/index.html"));

$("table").append(`
序号
标题
内容
编辑
来源
时间
`);                                        //表头
                                                //完善表格
var cnt = 0;
http.createServer(function (req, res) {         //建立网站
    database.query_noparam("SELECT * from fetches", function (qerr, vals, fields) {
        if (qerr) {
            console.error(`数据库查询失败-${qerr}`);
            return;
        }
        cnt = vals.length;
        for (var x = 0; x < cnt; ++x) {
            var myFetch = vals[x];
            $("table").append(`
${x}">
     ${x}
     ${myFetch.URL}" id="t${x}">${myFetch.Title}
     ${x}">${myFetch.Content}${myFetch.Editor}
     ${myFetch.ComeURL}">${myFetch.ComeFrom}
     ${myFetch.DateTime}

            `);                                 //表格中插入一行
        }

        $("body").append(`
        
        `);                                     //搜索关键词代码

        let body = $.html();                    //将cheerio处理的html设置为网页源码
        res.writeHead(200, { 'Content-type': 'text/html' });
        res.end(body);

        console.log("成功建立网站！");
    });
}).listen(3000);                                //监听3000端口

网页html我也是单独放在了一个文件index.html之中：


<html>
    <head>
        <meta charset="utf-8">
        <title>体育新闻爬取结果title>
    head>
    <body>
        <input type="text" name="keyword" style="width:1000px;" value="震惊！华东师范大学信息学部足球队门将刘冬煜竟开发出这种网站……" id="SearchText">
        <input type="button" value="搜索" onclick="SearchForKeyword()">
        <table border="1">
        table>
    body>
html>

于是我们的爬虫就大功告成啦！

测试

3月14日

至于实时爬取，3月14日我再次截图：

输入关键词“鲁能”、“佩莱”：

3月21日

武磊于今日确诊的消息已经刷屏了空间微博朋友圈。再度爬取新闻，希望磊哥挺住！

3月23日

昨日山东增加了一例输入病例，出乎我意料的是，这位患者正是鲁能泰山队的中场外援费莱尼。今日我再次爬取新闻，并关注因为疫情造成的欧洲五大联赛的消息。

3月24日

增加了新闻获取渠道，再次爬取，并提取出关于国足归化的消息。

4月1日

今年愚人节，我完成了数据库的编写工作，并以愚人节为关键词再度搜索：

心得体会

这一次实验课让我近距离接触了最基本的前后端设计与开发，一直在算法岗工作的我，面对迎面而来的很多困难，一时不知如何下手。

起初，我不知如何下载依赖，即使使用npm也无法下载成功，报错连连。百度后才知道需要使用镜像站才能成功。

接着，我开始使用的建站方法是：

res.writeHead(200, {'Content-Type': 'text/plain; charset=utf-8'});

但事实证明它并不能显示html代码所表示的界面。多方查资料才知道需要使用：

res.writeHead(200, {'Content-type': 'text/html'});

构建缓冲区、完成Header的搭建，然后才能显示前端界面。

后来，我发现点击新闻的标题，跳转的链接和标题并不匹配，因为我将：

URLs.push(url);

写在了request函数中，由于Node.js的异步特性，每个网站的响应时间不同，使得url与内容未必匹配。最终我将它放到了request的回调函数中。

最后，我未把向表格中插入行写在createServer的回调函数中，结果因为Node.js的异步特性，网站并未能像我预期的那样展示所有新闻项。直到百度后才渐渐理解了回调函数对运行同步的贡献。

前后端开发并没有我想象中那么容易，所谓鄙视链也只是业界玩笑而已。

这次爬虫项目比较成功，今后我也将继续努力。

希望疫情早些过去。武汉加油，中国加油，世界加油！

你可能感兴趣的:(Web编程作业)

.net 4.0 webServices 的使用，从前端到后端，代码超全。静静香甜 .net 前端后端 c#
1、创建webServices：创建之后会生成两个文件，分别是：SecurityWebService.asmx，SecurityWebService.asmx.csSecurityWebService.asmx代码：SecurityWebService.asmx.cs代码：usingNewtonsoft.Json;usingNewtonsoft.Json.Linq;usingSystem;usin
A Software as a Service (SaaS) W_X_99515681 数据结构
IntroductionThisfinalprojectisacomprehensiveassignmentdesignedtoassessyourmasteryofwebdevelopmentconceptscoveredthroughoutthecourse.Itisasignificantundertakingthatwillrequiresubstantialtimeanddedicati
QGIS结合天地图API实现批量经纬度转地址的完整指南网优随笔 QGIS 开源软件
一、技术背景与工具选择地理编码（Geocoding）是将地址转换为地理坐标的过程，反向地理编码（ReverseGeocoding）则是将经纬度坐标转换为结构化地址。QGIS作为开源GIS平台，通过插件扩展可实现批量地理编码操作。天地图作为我国权威地理信息服务平台，其API提供高精度的地理编码服务。本文将以QGIS3.22+版本为基础，结合天地图Web服务API，实现5000条级数据的批量反向地理编
应用程序编程接口API的类型与结构恶霸不委屈 API 程序人生
应用程序编程接口，ApplicationProgrammingInterface是一组定义不同软件组件如何相互交互的规则和协议。它为不同的软件应用程序提供了一种接口，使得它们能够相互通信和交互，而无需了解其内部实现细节。目录API的主要类型API的组成部分API的作用和优势使用API的例子如何使用API总结API的主要类型WebAPI：这是最常见的一种API类型，通常用于通过网络与远程服务器进行通
uni-app 与webView 互相传值九亿少女无法触及的梦ى uni-app
uni-app向webView传值在uni-app传值有多种实现方式，主要推荐evalJS，次要webSorcket重点：1.webView要找到正确的children！如果页面中只有一个webView标签则直接可以currentWebview.children()[0]2.H5页面中的监听function必须写在全局，不要写在任何load事件中！//index.vueletcurrentWebv
AJAX（Asynchronous JavaScript and XML）详解与应用风亦辰739 javascript ajax xml
一、什么是AJAX？AJAX（AsynchronousJavaScriptandXML，异步JavaScript和XML）是一种用于创建异步Web应用程序的技术。它可以在不重新加载整个网页的情况下，与服务器进行数据交换，从而提供更好的用户体验。1.1AJAX的核心特点异步通信：数据请求不会阻塞页面，提升用户体验。减少服务器负担：只获取需要的数据，减少流量。提升用户体验：网页响应速度更快，减少页面刷
ASP.NET Web的 Razor Pages应用，配置热重载，解决.NET Core MVC 页面在更改后不刷新坐望云起开发语言 asp.net 前端后端 Razor Pages mvc .net core
RazorPages应用，修改页面查看修改效果，如果没有热重载，改一句话跑一次，这个活就没法干了。1、VS2022中的NuGet中安装RuntimeCompilationMicrosoft.AspNetCore.Mvc.Razor.RuntimeCompilation需要配套你的.netsdk版本，我这里用的是6.0，所以这个也用了6.0.0。2、找到你的Properties\launchSett
Unity 与 JavaScript 的通信交互：实现跨平台的双向通信 Front_Yue 3D技术实践指南 unity javascript 3d
前言在现代游戏开发和Web应用中，Unity和JavaScript的结合越来越常见。Unity是一个强大的跨平台游戏引擎，而JavaScript是Web开发的核心技术之一。通过Unity和JavaScript的通信交互，开发者可以实现从Unity到Web页面的功能扩展，或者从Web页面控制Unity的行为。这种双向通信的能力为开发者提供了更多的可能性，例如在Unity中嵌入Web视图，或者在Web
【Rust日报】 2020-02-17 WASM向量图形 --wasm_svg_graphics 0.3.0 Rust语言中文社区
WASM向量图形--wasm_svg_graphics0.3.0一个用于通过WASM渲染SVG图形的Rust库它提供了快速有效的方法，可以使用WebAssembly与SVG进行交互。它能够：声明形状和样式以用于这些形状使用SVG标签将这些形状渲染到DOM自动检测两个形状是否相同，因此只有一个SVG将添加到DOM中声明已命名的项目/容器，以便以后进行例如隐藏，重新显示和重新放置之类的调整。声明开发团
Trunk：Rust WASM 应用的终极打包工具徐天铭Paxton
Trunk：RustWASM应用的终极打包工具trunkBuild,bundle&shipyourRustWASMapplicationtotheweb.项目地址:https://gitcode.com/gh_mirrors/tr/trunk项目介绍Trunk是一款专为Rust语言设计的WASM网页应用打包工具。它能够帮助开发者轻松构建、打包并发布Rust编写的WASM应用到Web平台。Trunk
高德地图API详解芯作者 DD：日记云计算人工智能机器学习
高德地图API是一款基于Web的服务，为开发者提供了丰富的地理数据服务和功能。以下是对高德地图API的详细介绍：一、主要功能地图显示：支持全球范围各地的地图显示，包括街道、建筑物、自然地理等，用户可以将高德地图以图片形式嵌入自己的网页或应用中。地理/逆地理编码：提供结构化地址与经纬度之间的相互转化的能力。地理编码是将具体的地址转换为经纬度坐标的过程，逆地理编码则是通过经纬度获取地址信息。路线规划：
【Rust基础】使用Rust和WASM开发的图片压缩工具勇敢牛牛_ rust wasm 开发语言图片压缩
图片压缩工具使用rust+wasm开发了一个简易版的图片压缩工具，支持JPG、PNG、GIF、WEBP等图片格式，不限制大小，无需上传图片，完全在浏览器中执行。工具地址：https://eai.coderbox.cn/image-compression实现方式JPEG对原图进行量化，通过指定质量参数，控制压缩质量。PNG同样的进行量化，并重新将rgba颜色（如果原图是rgba）调整为8位索引颜色，
为什么后端路由需要携带 /api 作为前缀？前端如何设置基础路径 /api？ z2637305611 前端
一、为什么后端路由需要携带/api作为前缀？1.区分API端点与其他路由在Web应用程序中，后端不仅需要处理API请求，还可能需要处理静态资源（如HTML、CSS、JS文件）或其他服务（如WebSocket）。通过为API路由添加/api前缀，可以清晰地将其与其他请求区分开来，避免路由冲突。例如：API请求：https://example.com/api/users静态资源请求：https://e
JavaScript反爬技术解析与应对不做超级小白 web逆向知识碎片 web前端 javascript 开发语言 ecmascript
JavaScript反爬技术解析与应对前言在当今Web爬虫与数据抓取的生态环境中，网站运营方日益关注数据安全与隐私保护，因此逐步采用多种反爬技术来限制非授权访问。本文从JavaScript角度出发，深入剖析主流反爬策略的技术原理，并探讨相应的绕过方案，以期为研究者和开发者提供系统性的理解与实践指导。1.JavaScript反爬技术概述1.1右键禁用与开发者工具防护部分网站采用JavaScript拦
宝塔安装mayfly-go mayans005 数据库
mayfly-go:web版linux(终端文件脚本进程)、数据库(mysqlpgsql)、redis(单机哨兵集群)、mongo统一管理操作平台。1、终端执行命令下载程序包wgethttps://gitee.com/objs/mayfly-go/releases/download/v1.3.0/mayfly-go-linux-amd64.zip2、在宝塔新建一个MySQL数据库，将下载程序包中的
GIS三维可视化进阶：Three.js集成Cesium引擎实现全球地形LOD与OGC标准服务调用贝格前端工场 javascript 开发语言 ecmascript
Three.js与Cesium引擎基础介绍Three.js是一款基于JavaScript的开源三维图形库，它提供了丰富的API用于创建和操作三维场景、物体、材质等。在Web端的三维可视化领域应用广泛，因其能够在浏览器中高效渲染复杂的三维模型和场景，大大降低了开发人员创建三维交互内容的门槛。通过简单的代码，即可实现如创建三维几何体（立方体、球体等）、为物体添加材质（如纹理材质、光照材质）以及设置相机
Go语言常用框架及工具介绍半桶水专家 golang入门 golang 开发语言后端
在Go语言开发中，框架和工具的选择能够显著提升开发效率和项目可维护性。以下是Go生态中常用的框架分类及详细介绍：一、Web框架Gin特点：轻量级、高性能，基于httprouter实现快速路由。优势：适合API开发，中间件支持丰富（如日志、CORS、JWT等），社区活跃。适用场景：高并发API服务、微服务、中小型Web应用。示例：r:=gin.Default()r.GET("/ping",func(
开源项目推荐：Mayfly-go 周风队
开源项目推荐：Mayfly-gomayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-goMayfly-go是一个基于浏览器的统一管理操作平台，它支持多种数据库和系统管理功能。该项目主要使用Go语言和前端框架
推荐项目：Mayfly-Go - 高性能的时间序列数据库齐游菊Rosemary
推荐项目：Mayfly-Go-高性能的时间序列数据库mayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-go项目简介是一款由Dromara团队开发的高性能、轻量级时间序列数据库（TimeSeriesData
Mayfly-Go 开源项目教程方蕾嫒Falcon
Mayfly-Go开源项目教程mayfly-goweb版linux(终端文件脚本进程)、数据库(mysqlpgsql高斯达梦)、redis(单机哨兵集群)、mongo统一管理操作平台。项目地址:https://gitcode.com/gh_mirrors/ma/mayfly-go项目介绍Mayfly-Go是一个基于Go语言开发的开源项目，旨在提供一个轻量级、高性能的微服务框架。该项目由Dromar
自用基于 TypeScript 的 WebSocket 客户端封装 Luke Paul Na typescript websocket javascript
代码本体exportinterfaceIWSOptions{url?:string;sendContent?:string|object;token?:string;reconnectInterval?:number;heartbeatInterval?:number;heartbeatContent?:string|object;onOpen?:()=>void;onMessage?:(data
「JavaScript深入」Socket.IO：基于 WebSocket 的实时通信库八了个戒 JavaScript系列面试宝典大前端 javascript websocket 开发语言前端
Socket.IOSocket.IO的核心特性Socket.IO的架构解析Socket.IO的工作流程Socket.IO示例：使用Node.js搭建实时聊天服务器1.安装Socket.IO2.服务器端代码（Node.js）3.客户端代码（HTML+JavaScript）4.房间功能高级功能实现1.命名空间2.中间件3.二进制传输性能优化策略1.负载均衡2.资源管理3.监控与调试安全与可靠性1.安全
uniapp 和 webview 之间的通信 DT—— 其他 uni-app
1.背景应用使用了uniapp开发跨端应用，在uniapp中内嵌webview页面实现页面热更新效果，不需要用户单独重新安装软件即可实现页面的版本更新。2.webview通知uniapp在开发过程中我们难会遇到需要uniapp和webview来实现数据通信的场景，接下来介绍一种可行的uniapp和webview的数据通信方案。在webview中我们可以使用当前webview实例的postMessa
简单小程序代码_如何制作微信小程序 weixin_39804641 简单小程序代码
微信小程序的流量红利对商家有很大吸引力，如何制作一个小程序，打开小程序营销渠道呢？关于如何制作微信小程序的步骤：先要下载微信官方的微信Web开发者工具。打开微信公众平台，找到右下方的小程序模块，点击「开发」按钮；点击顶部导航栏的「工具」按钮，在新页面的左侧栏中找到「下载」。可以看到，开发工具提供Windows32位、Windows64位和Mac三个版本。可根据实际情况，选择适合自己电脑的开发工具。
[ Linux 命令基础 ] Linux 命令大全-命令前置知识-系统管理-文件和目录管理-文本处理命令-网络管理命令-权限和用户管理命令-磁盘管理命令 _PowerShell shell脚本入门到精通 Linux 命令大全 linux命令前置知识 linux系统管理 linux文件和目录管理 linux文本处理命令 linux网络管理命令 linux权限和用户管理命令
博主介绍‍博主介绍：大家好，我是_PowerShell，很高兴认识大家~✨主攻领域：【渗透领域】【数据通信】【通讯安全】【web安全】【面试分析】点赞➕评论➕收藏==养成习惯（一键三连）欢迎关注一起学习一起讨论⭐️一起进步文末有彩蛋作者水平有限，欢迎各位大佬指点，相互学习进步！我们搞网络安全需要经常用到linux命令，比用拿到linux的shell，需要使用linux命令。再比如sh脚本，我们经常
StockTV 全球股票、外汇、期货、加密货币 API 接口文档详解 CryptoRzz python 金融数据分析 java websocket
概述StockTV提供了全球范围内的股票、外汇、期货和加密货币的实时数据接口，支持HTTP和WebSocket两种对接方式。本文将详细介绍如何使用StockTV的API接口获取实时数据，并重点介绍印度数据源的使用。接口文档1.获取Key在使用StockTV的API接口之前，您需要先获取一个Key。请通过以下方式联系我们获取Key：联系我们获取Key2.调用API在调用API时，请将获取到的Key添
Midscene.js自然语言驱动的网页自动化全指南 Hello.Reader 前端技术人工智能 javascript 自动化开发语言
一、概述网页自动化在数据抓取、UI测试和业务流程优化中发挥着重要作用。然而，传统工具如Selenium和Puppeteer要求用户具备编程技能，编写复杂的选择器和脚本维护成本高昂。Midscene.js通过自然语言接口革新了这一领域，用户只需描述任务（如“点击登录按钮”或“提取产品价格”），AI即可自动执行，大幅降低技术门槛。Midscene.js由web-infra-dev团队开发，开源于Git
golang jwt挖坑 qiang527052 golang个人笔记 golang jwt
golangjwt使用golangjwt使用中遇到的一个坑，特此记录。具体描述：因为公司需要，现有架构jwt生成token的代码是java实现的，然后现在在golang中需要对此token进行解析。java用到的jar包：io.jsonwebtoken.jjwt0.9.0golang用到的库：github.com/dgrijalva/jwt-gojava生成token测试代码如下：publicst
【网络】数据流（Data Workflow）Routes（路由）、Controllers（控制器）、Models（模型）和 Middleware（中间件）一袋米扛几楼98 网络工程/安全中间件
在图片中，数据流（DataWorkflow）描述了应用程序中数据的流动过程，涉及Routes（路由）、Controllers（控制器）、Models（模型）和Middleware（中间件）。作为初学者，理解这些组件及其联系是掌握Web应用程序开发的关键。以下是对每个技术点的详细解释，以及它们如何相互关联的分析。1.Routes（路由）定义：路由定义了应用程序的URL端点（Endpoints）以及服
Python 用户账户(让用户拥有自己的数据) 钢铁男儿 Python 从入门到精通 python 数据库 sqlite
Web应用程序的核心是让任何用户都能够注册账户并能够使用它，不管用户身处何方。在本章中，你将创建一些表单，让用户能够添加主题和条目，以及编辑既有的条目。你还将学习Django如何防范对基于表单的网页发起的常见攻击，这让你无需花太多时间考虑确保应用程序安全的问题。然后，我们将实现一个用户身份验证系统。你将创建一个注册页面，供用户创建账户，并让有些页面只能供已登录的用户访问。接下来，我们将修改一些视图
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文