Aquarius_祈

从零开始的Node.js新闻爬虫实验项目（四）东方财富网、网易新闻、Pixiv的爬取思路

这是计划的第3步
有了前篇雪球网新闻的爬取代码，可以同样的爬取其他各类网站

1）东方财富网

1、一级页面

在这里，选择信息较为集中，内容丰富的“右边部分”开始分析。
观察到每一条消息均在各自的 li 项下的 a 中，于是主体部分非常好写

        var item = $('.nlist', 'div').find('li').children('a')
        item.map(function (idx, element) {
     
            var news = {
     };
            news.title = $(element).text();
            news.link = $(element).attr('href');
            console.log(news);
        })

输出非常漂亮

2、二级页面

可以看到，我们感兴趣的内容均在class=“newsContent”下，可以分类爬取信息，爬取二级地址内容的代码如下：

    rp(options).then(function ($) {
     
    var item = $('.newsContent', 'div');
    news.time = item.find('.time', 'div').first().text();
    news.editor = item.find('.author', 'div').first().text();
    news.source = item.find('.source', 'div').text();
    var source = news.source;
    news.source = source.replace(/\s*/g, '');
    news.comment = item.find('.num', 'span').text();
    news.contain = item.find('.b-review', 'div').text();
    var maintext = '';
        $('.newsContent', 'div').find('.Body', 'div').children('p').each(function (idx, element) {
     
            maintext = maintext.concat($(element).text());
        })
    news['texts'] = maintext;
    console.log(news);
})

绝大部分网页可以正确爬取，部分网页链接至其他网站，故html结构有所不同，不做考虑。

2）网易新闻

1、一级页面

注意，该网站采用的是GBK编码，需要使用iconv-lite转码，与此同时，options中将encoding设置为null，如下

var options = {
     
    uri: 'https://news.163.com',
    encoding: null,
    transform: function (body) {
     
    body = iconv.decode(body, 'gbk');
        return cheerio.load(body);
    }
}

       var item = $('.mod_top_news2', 'div').find('li');
        item.map(function (idx, element) {
     
            var news = {
     };
            news.title = $(element).find('a').text();
            news.link = $(element).find('a').attr('href');
            console.log(news);
        })

使用类似的办法，同样爬取出标题和二级页面url

2、二级页面

简明扼要；非常好处理

    rp(options).then(function ($) {
     
    var item = $('.post_content_main', 'div');
    news.time = item.find('.post_time_source', 'div').text().slice(0, 36).replace(/\s*/g, '');
    news.editor = item.find('.ep-editor', 'span').text();
    news.source = item.find('.post_time_source', 'div').children('a').first().text();
    news.comment = item.find('.post_cnum_tie', 'a').text();
    var maintext = '';
        $('.post_text', 'div').children('p').each(function (idx, element) {
     
            maintext = maintext.concat($(element).text()).replace(/\s*/g, '');
        })
    news['texts'] = maintext;
    console.log(news);

吐槽一下用了两次去除字符串中的空字符的方法 .replace(/\s*/g, ‘’)

3）Pixiv

1、一级页面

Pixiv是一个图片网站，这里不再对主页进行爬取，而是直接对某个关键词的搜索页进行爬取
https://www.pixiv.net/tags/比那名居天子/artworks?s_mode=s_tag
我们随机挑一个关键词进行搜索，可以看见url的组成方式非常简单，可以直接利用字符串操作
在这里插入图片描述
同样是每张图片都在各自 class=sc-prOVx jMjpVy 中


然而事与愿违，这是因为Pixiv是需要代理的。同时，pixiv需要登录才能使用会员搜索等功能。

a. 使request使用代理

首先安装ss5代理需要的模块

npm install socks5-https-client

然后你需要一个可以使用的 socks 代理，并且先测试一下代理是否能生效，首先选取登录界面的一段文字尝试爬取

var cheerio = require('cheerio')
var rp = require('request-promise')
var Agent = require('socks5-https-client/lib/Agent');
var headers = {
     
    "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.65 Safari/537.36'
}
var options = {
     
    strictSSL: true,
    agentClass: Agent,
    agentOptions: {
     
        socksHost: '*.*.*.*', //代理的IP或者域名！
        socksPort: *, //代理的端口！
        socksUsername: '*', //代理的用户名！
        socksPassword: '*' //该用户的密码！
    },
    uri:'https://www.pixiv.net/',
    headers: headers,
    transform: function (body) {
     
        return cheerio.load(body);
    }
}

rp(options).then(function ($) {
     
            console.log('Tip: ' + $('.signup-form__catchphrase', 'div').text());
        })

代理成功生效！

b. 对某个搜索结果的爬取

    uri: encodeURI('https://www.pixiv.net/tags/'+tag),

首先，我们写的tag都是汉字形式，需要利用 encodeURI 函数转化为UTF-8格式

    console.log($('body').html());

然而，在获取整个 body 的时候，发现里面的内容是空的。如果用浏览器直接打开这个页面，会发现内容是分步骤加载的，也就是动态加载的，直接request页面，是缺少了很多信息的。

打开控制台的 Network ，选择 XMR ，可以发现网站向四个不同的url发送了请求。在一个个尝试之后，发现其中一个页面： https://www.pixiv.net/ajax/search/top/比那名居天子是如下json内容：

通过敏锐的嗅觉不难发现，选中的 “id”：“80511208”正是搜索结果中的图片的ID，实际打开之后也确实如此，于是我们改为爬取 “https://www.pixiv.net/ajax/search/top/ + tag” 的内容。
这里另外找到了一个json更加简洁的页面 “https://www.pixiv.net/ajax/search/manga/” + tag + “?word=” + tag + “&order=date_d&mode=all&p=1&s_mode=s_tag_full&type=manga”

丢到 https://www.bejson.com/ 上去格式化一下，可以看见每个id都在“data”内每个对象中的“id”属性内。

rp(options).then(function ($) {
     
    var str = $('body').html(); //将body中的json内容转换为字符串
    str = str.replace(/"/g,'"'); //json中的所有引号都显示为了"，在此处替换回来
    var json = JSON.parse(str); //将字符串转换为json对象
    var data = json.body.manga.data; //每个对象内存着一个id的data数组
    for(var element in data)
    {
     
        console.log(data[element].id); //遍历data数组内的所有对象的id
    }
})

id就顺利的都爬取了下来

c. 爬取每个id下的图片

容易发现，每个ID下的图片均为 “https://www.pixiv.net/artworks/” + id
同样地，该网站也是动态加载的，并且在XHR中难以找到图片对应的url，不过，我们可以观察到每一张图片的命名规律：
https://i.pximg.net/img-original/img/2020/02/08/19/09/08/79355941_p0.png
主要信息为日期、时间和id，重新检查上图中的json文件，可以看到这些信息都有很好地保存。

    for(var element in data){
     
        var id = data[element].id;
        var url = data[element].url;
        if (url!=undefined) {
     
            url = url.replace(/c\/250x250_80_a2\/img-master/g,'img-original');
            url = url.replace(/_square1200.jpg/g,'.png');
            console.log(url);
        } 
    }

图片的地址已经正确的爬取下来了，然而网站直接打开是403，这是因为服务器还验证了用户是从哪个页面转来的，即下图中的referer。

headers: {
     
	'referer': 'http://www.pixiv.net/member_illust.php?mode=big&illust_id=' + id，
	"Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
	'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.75 Safari/537.36'
},

在headers中加上了referer之后，便不报403了

var writeStream = fs.createWriteStream('image.png');
var readStream = request(ne_options);
readStream.pipe(writeStream);
writeStream.on("finish", function() {
     
    console.log("下载成功！！");
    writeStream.end();
});
//临时加上一段通过request下载图片的代码

图片下载成功了，从文件夹打开之后，也发现图片可以正常显示。

d. 使各种格式的图片都能正确下载，优化下载体验

网站上的大部分图片都有JPG和PNG两种格式的URL，但是部分图片只含其中一种。这里的笨办法是两种后缀URL都进行访问，通过判断返回的状态码是否是404，来判断URL是否有效

function download(Jpg_options, Png_options, id) {
     
    request(Jpg_options, function (error, response, body) {
     
        var now_options = Jpg_options;
        if(response.statusCode!=404) {
     
            var name = id + '_0.jpg';
            var writeStream = fs.createWriteStream("./images/"+name);
            var readStream = request(now_options);
            readStream.pipe(writeStream);
            writeStream.on("finish", function() {
     
                downloading++;
                console.log("第 " + downloading + '/' + downloadAmount + " 张下载成功！");
                writeStream.end();
            });
        }
        else{
     
            request(Png_options, function (error, response, body) {
     
                var now_options = Png_options;
                if(response.statusCode!=404) {
     
                    var name = id + '_0.png';
                    var writeStream = fs.createWriteStream("./images/"+name);
                    var readStream = request(now_options);
                    readStream.pipe(writeStream);
                    writeStream.on("finish", function() {
     
                        downloading++;
                        console.log("第 " + downloading + '/' + downloadAmount + " 张下载成功！");
                        writeStream.end();
                    });
                }
            });
        }
    });
}

通过简单地if判断来进行下载，Png_options 和 Jpg_options 分别含有这两种后缀的url

function finishDownload() {
     
    //console.log(listArr);
    var finallist=JSON.stringify(listArr, '', '\t');
    fs.writeFileSync("./images/list.json", finallist);
    console.log('全部下载完毕！共抓取到 ' + total + " 张，计划下载 " + downloadAmount + " 张，其中 " + downloaded + " 张已存在，下载成功 " + success + " 张，下载失败 " + fail + " 张。");
    if(fail>0) {
     
        console.log('下载失败：' + fails);
    }
    process.exit();
}

将结束下载重构为函数，并且添加一个文件，用来存储所有下载过的图片的id，以免重复下载图片。同时加入几个变量，用于记录抓取总数、下载计划数、已下载数、下载成功数和下载失败数。最后输出如下：

下载失败的原因可能是链接已失效。完整代码在：
https://github.com/AquariusAQ/Web-Crawler-in-Node.js

你可能感兴趣的:(nodejs)

计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW) Python毕设源码程序高学长 python 课程设计 uni-app
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW)该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+uni+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+UNI等等组成，B/S模式+pychram管理
Python-Django毕业设计养老院老人日常生活管理系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
mysql.createPool(db)_nodejs解决mysql和连接池(pool)自动断开问题会咕咕咕的小夫爷
最近在做一个个人项目，数据库尝试使用了mongodb、sqlite和mysql。分享一下关于mysql的连接池用法。项目部署于appfog，项目中我使用连接池链接数据库，本地测试一切正常。上线以后，经过几次请求两个数据接口总是报503。一直不明就里，今天经过一番排查终于顺利解决了。1.mysql链接普通模式varmysql=require('mysql'),env={host:'localhost
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
解决报错：node:internal/errors:496 ErrorCaptureStackTrace(err)； lvchaoq debug vue
报错信息我使用npminitvue@latest创建项目时出现如下报错node:internal/errors:496ErrorCaptureStackTrace(err);^TypeError[ERR_IMPORT_ASSERTION_TYPE_MISSING]:Module“file:///D:/develop/nodejs/node_cache/_npx/2f7e7bff16d1c534/n
nodejs中process讲解
虽然node对操作系统做了很多抽象的工作，但是你还是可以直接和他交互，比如和系统中已经存在的进程进行交互，创建工作子进程。node是一个用于事件循环的线程，但是你可以在这个事件循环之外创建其他的进程（线程）参与工作。进程模块process模块允许你获得或者修改当前node进程的设置，不想其他的模块，process是一个全局进程(node主进程)，你可以直接通过process变量直接访问它。proc
Nodejs中process有哪些常用方法？
在Node.js中，process是一个全局对象，提供了与当前Node.js进程互动的接口。它包含了一系列的方法和属性，可以帮助你获取系统信息，处理命令行参数，以及控制进程的行为等。以下是一些process对象的常用方法：process.argv：这不是一个方法，而是一个包含命令行参数的数组。第一个元素是’node’，第二个元素是正在执行的JavaScript文件的路径，接下来的元素则是任何其他命
nodejs值process.kill
在Node.js中，process.kill()是一个核心方法，用于向指定进程发送信号以控制其行为（如终止、暂停或恢复）。它不仅限于终止进程，还能通过不同信号实现精细化的进程管理。以下从功能、参数、信号类型、使用场景、注意事项及示例等方面进行全面解析：一、核心功能process.kill(pid[,signal])的主要作用是向目标进程（通过pid指定）发送信号，从而控制其生命周期或状态。其名称中
CSS面试题及详细答案140道之（101-120）还是大剑师兰特前后端面试题 css 大剑师 CSS面试题
《前后端面试题》专栏集合了前后端各个知识模块的面试题，包括html，javascript，css，vue，react，java，Openlayers，leaflet，cesium，mapboxGL，threejs，nodejs，mangoDB，MySQL，Linux…。前后端面试题-专栏总目录文章目录一、本文面试题目录101.解释`text-indent`属性的作用。102.如何在CSS中实现响应
vue2 面试题及详细答案150道（121 - 130）
《前后端面试题》专栏集合了前后端各个知识模块的面试题，包括html，javascript，css，vue，react，java，Openlayers，leaflet，cesium，mapboxGL，threejs，nodejs，mangoDB，MySQL，Linux…。前后端面试题-专栏总目录文章目录一、本文面试题目录121.Vue2中如何实现组件的动态样式绑定？122.Vue2中如何处理跨域请求
nodeJs笔记（五） a_xiaotaotao nodeJs 笔记
os操作系统模块主要作用导入模块常用方法1.系统信息与标识os.platform()作用:返回值:用途:os.arch()作用:返回值:用途:os.type()作用:返回值:用途:os.release()作用:返回值:用途:os.version()(Node.jsv13.0.0+)作用:返回值:用途:os.hostname()作用:返回值:用途:os.uptime()作用:返回值:用途:2.用户信
nodeJs笔记（一） a_xiaotaotao nodeJs 笔记前端
nodeJs笔记（一）基础知识什么是nodejs？nodejs的生态系统结构nodejs的工作原理V8JavaScript引擎：libuv：异步I/O与事件循环引擎：事件循环(EventLoop)的详细阶段：非阻塞I/O的工作流程(以fs.readFile为例)：单线程与高并发：核心依赖库：工作原理全景图关键点：node.js的优缺点核心优势(优点)高性能与高并发(I/O密集型场景)：核心原理：结
js运行，控制台显示乱码 wangsrc javascript linux 开发语言
"code-runner.executorMap":{ "javascript":"C:\\ProgramFiles\\nodejs\\node.exe" //node.js的安装路径}参考文章：https://blog.csdn.net/m0_63785629/article/details/129432129
VUE解决Error: error:0308010C:digital envelope routines::unsupported的四种解决方案
问题描述：报错：Error:error:0308010C:digitalenveloperoutines::unsupported报错原因：主要是因为nodeJsV17版本发布了OpenSSL3.0对算法和秘钥大小增加了更为严格的限制，nodeJsv17之前版本没影响，但V17和之后版本会出现这个错误。我的node版本是v18+报错详细信息：rror:error:0308010C:digitale
如何解决 NPM proxy，当我们在终端nodejs应用程序时出现代理相关报错
Thisisaproblemrelatedtonetworkconnectivity.npmERR!networkInmostcasesyouarebehindaproxyorhavebadnetworksettings.在使用npminstall下载包的时候总是报以下错误:在控制台或VisualStudioCode终端中运行以下命令：npmconfigrmproxynpmconfigrmhttp
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Ubuntu基础（Python虚拟环境和Vue） aaiier ubuntu python linux
Python虚拟环境sudoaptinstallpython3python3-venv进入项目目录cdXXX创建虚拟环境python3-mvenvvenv激活虚拟环境sourcevenv/bin/activate退出虚拟环境deactivateVue安装Node.js和npm#安装Node.js和npm（Ubuntu默认仓库可能版本较旧，适合入门）sudoaptinstallnodejsnpm#验
NodeJS VM2沙箱逃逸漏洞分析【CVE-2023-29199】 R3s3arcm NodeJS漏洞分析 node.js 安全安全威胁分析
NodeJSVM2沙箱逃逸漏洞分析【CVE-2023-29199】简介Node.js是一个基于V8引擎的开源、跨平台的JavaScript运行环境，它可以在多个操作系统上运行，包括Windows、macOS和Linux等。Node.js提供了一个运行在服务器端的JavaScript环境，使得开发者可以编写并发的、高效的服务器端应用程序。Node.js使用事件驱动、非阻塞I/O模型来支持并发运行。它
node.js、npm是什么？服务器脚本语言有哪些？
文章目录1.node和nodejs有区别吗:2.Node.js是什么3.NPM4.安装Node.js和npm5.使用appium之前为什么安装node.js？6.Vue.js一定要安装node.js吗？7.开发环境：1.node和nodejs有区别吗:node和nodejs之间没有区别，node全称就是nodejs。nodejs是一个基于ChromeV8引擎的JavaScript运行环境，一个让J
CentOS7安装nvm与node
在我们的日常开发中经常会遇到这种情况：手上有好几个项目，每个项目的需求不同，进而不同项目必须依赖不同版的NodeJS运行环境。如果没有一个合适的工具，这个问题将非常棘手。由此nvm应运而生。nvm是一个node管理工具。使用nvmNode版本管理器安装Node.JS。nvm允许您在同一台计算机上安装多个Node.JS版本。并且自由切换node版本。1.安装安装指令，这个是一键式的，这个如果执行成功
【亲测免费】如何构建适用于Android的Node.js：从零到实践陈宜旎Dean
如何构建适用于Android的Node.js：从零到实践build-nodejs-for-androidBuildnodejsforandroid(arm,arm64,x86,x64,mipsel)perfectlyandprovideprebuiltbinaries,andadockerimageasworkbench.项目地址:https://gitcode.com/gh_mirrors/bu
android nodejs cike110120
本文参照了http://www.blogjava.net/jelver/articles/143082.html，http://www.blogjava.net/athrunwang/archive/2011/09/28/359680.html，《androidSDK开发范例大全(第2版)》上次做了一个demo，试验如何用node.js响应getpost请求，http请求使用的浏览器。我现在正在学
java组件化设计_构建之路—谈谈组件化后端构建和实现
前言这一篇文章，准备了很久，构思了很久，草稿了很久。从个人编程至今，历经了C，C++，Java，到现如今的NodeJS。也后端到前端，再回到后端。更从学校里的学生信息管理系统到大型商业系统构建，是的，我曾一直以为编程也就是如此了，由瀑布模型，敏捷开发，设计模式等等组成的软件工程大致就是如此了。相信可能很多人也会有和我类似的想法，是否也都曾迷茫过？幸运的是，伴随着对前端的接触和深入，云雾散开。前端组
jenkins 自动化部署之后，不允许在工具上查看源代码小疯仔 jenkins 自动化运维
先来展示一下最终的效果在没有如何操作之前的时候，这个Jenkins部署完成之后会在工具上留有源代码，能点击进去，部署到甲方的服务器上的时候会被看到，这样就会造成源码泄露解决方案可以在Jenkinsfile文件中加入以下代码pipeline{agentanytools{nodejs'nodejs16.20.2'}//步骤stages{}//新增post阶段：在流水线结束后清理工作区post{alwa
使用CocoaPods做依赖管理(淘宝源更换为HTTPS)--转自唐巧技术博客 q364385155 cocopods 依赖管理 OC iOS
CocoaPods简介每种语言发展到一个阶段，就会出现相应的依赖管理工具，例如Java语言的Maven，nodejs的npm。随着iOS开发者的增多，业界也出现了为iOS程序提供依赖管理的工具，它的名字叫做：CocoaPods。CocoaPods项目的源码在Github上管理。该项目开始于2011年8月12日，经过多年发展，现在已经成为iOS开发事实上的依赖管理标准工具。开发iOS项目不可避免地要
iOS CocoaPods（依赖管理）安装和使用教程 Andyjicw iOS 移动开发 cocoapods ios 开发教程依赖
参考资料CocoaPods简介每种语言发展到一个阶段，就会出现相应的依赖管理工具，例如Java语言的Maven，nodejs的npm。随着iOS开发者的增多，业界也出现了为iOS程序提供依赖管理的工具，它的名字叫做：CocoaPods。CocoaPods项目的源码在Github上管理。该项目开始于2011年8月12日，经过多年发展，现在已经成为iOS开发事实上的依赖管理标准工具。开发iOS项目不可
NodeJS全栈WEB3面试题——P1基础知识：区块链与Web3原理穗余 Web3 web3 区块链
1.1区块链的基本组成有哪些部分？它们的作用是什么？区块链主要由以下几个部分组成：区块（Block）：区块是数据的基本存储单元，每个区块包含一批交易记录和一些元数据（如时间戳、前一个区块的哈希等）。链（Chain）：区块通过哈希指针连接形成链条，保证数据的不可篡改性。节点（Node）：参与网络的计算机，每个节点维护区块链的完整或部分副本。共识机制（ConsensusMechanism）：用于节点间
250706-在局域网中搭建 SvelteKit 项目并允许其他设备访问 GuokLiu Web Linux NPM Svelte
本文记录了如何从零开始创建一个SvelteKit项目，并配置使得局域网内的其它设备可以访问开发服务器（如用于移动设备调试）。一、准备开发环境1.安装Node.js和npmSvelte项目依赖Node.js（建议版本≥16）。#macOS安装方式brewinstallnode#或者官网下载：https://nodejs.org/验证是否安装成功：node-vnpm-v二、创建SvelteKit项目S
【vue】用conda配置nodejs，一键开通模版使用权温择之 conda
特此鸣谢我的好同学@重中之重的特级教学，非常之好用一、conda环境下载安装二、创建包含nodejs的conda环境创建一个新环境：condacreate-n【自定义环境名字】python=3.9condacreate-nmy_nodejs_envpython=3.9激活新环境：condaactivate【环境名字】condaactivatemy_nodejs_env下载安装nodejs：cond
（部署服务器系列四）部署Vue步骤（使用nodejs）玄尺_007 #个人博客项目 #前端服务器 vue.js 运维
1.构建项目（打包Vue）：构建前设置main.js//关闭开发模式提示Vue.config.devtools=falseVue.config.productionTip=false设置指向的服务端后端ip和端口，我的常量属性统一放在了constants.jsexportconstAIOS_BASE_URL="http://192.168.0.111/api"exportconstIMG_BASE
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他