JokerKon

Phantomjs+Nodejs+Mysql数据抓取（1.数据抓取）

概要：
这篇博文主要讲一下如何使用Phantomjs进行数据抓取，这里面抓的网站是太平洋电脑网估价的内容。主要是对电脑笔记本以及他们的属性进行抓取，然后在使用nodejs进行下载图片和插入数据库操作。

先进行所有页面的内容进行抓取

var page =require('webpage').create();
var address='http://product.pconline.com.cn/server/';
var fs = require('fs');
var mypath = 'version/server/server.txt';
var count = 2;
var pageSize=0;
  phantom.outputEncoding="gbk";
  page.settings.userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko";


function loadController(status){
  loadComputerList(address);
}

function loadComputerList(url){
  console.log('loading '+url);

  page.onLoadFinished = function loadListsucc(status){
    console.log("loadlistSucc ["+url+"] =======================Status:"+status);
  };

  page.open(url,function(status){
    setTimeout(function(){
      console.log(status);
      var content='';
      content = page.evaluate(function(){
      var cont='';
      var listComputer = document.querySelectorAll('div.item-title>h3>a');
      var listPrice =document.querySelectorAll('div.price');
      for(var j=0;jvar computer = listComputer[j].innerText;
          var price = listPrice[j].innerText;
          var url = listComputer[j];
          cont += computer+'\t\t价格:'+price+','+url+'\r\n';
      }
      return cont;
    });
    console.log(content);
    console.log('========== write to file !============');
    try{
      fs.write(mypath, content, 'a');
    }catch(e){
      console.log(e);
    }
    console.log('========== begin loading next page!============');
    var nextUrl = page.evaluate(function(){
          var url = '';
          var next =  document.querySelectorAll('div.pager a[class=page-next]');
          var cont = '';
          url = next[0];
          cont += url;
          return cont;
                });
        console.log(nextUrl);

    if(count <= pageSize){
      console.log(nextUrl);
      count++;
      console.log(count);
      loadComputerList(nextUrl);
    }else{
        console.log(count);
    phantom.exit();
    }
    }, 100);
  });
}

page.open(address,function(status){
  // page.onLoadFinished = loadController;
  page.render('computer.jpeg');
  pageSize = page.evaluate(function(){
    var cont='';
    var size =document.querySelector('div.pager>em>i').innerText;
    cont += size;
    return cont;
  });
  console.log(pageSize);
  loadController(status);
});

上面部分代码可以直接抓取到

http://product.pconline.com.cn/server/

这个页面中所有分页的信息

下面进行代码分析：

page.open(address,function(status){
  // page.onLoadFinished = loadController;
  page.render('computer.jpeg');
  pageSize = page.evaluate(function(){
    var cont='';
    var size =document.querySelector('div.pager>em>i').innerText;
    cont += size;
    return cont;
  });
  console.log(pageSize);
  loadController(status);
});

这部分代码是Phantomjs的入口，也是我们进行数据抓取的开始部分。

 var size =document.querySelector('div.pager>em>i').innerText;

这里抓到的信息是所有页面的页数，用来作为循环判断的次数依据

然后观察代码就可以发现从入口结束之后就跳转到了LoadContriller函数中去，然后再调用loadComputerList这个函数，然后就可以进行数据抓取了

我们再看一下

 var listComputer = document.querySelectorAll('div.item-title>h3>a');
 var listPrice =document.querySelectorAll('div.price');

这两段代码，就是我们要抓取的电脑URL以及价格的信息。
再抓到我们想要的信息之后，我们再对其进行拼接

for(var j=0;j<listComputer.length;j++){
          var computer = listComputer[j].innerText;
          var price = listPrice[j].innerText;
          var url = listComputer[j];
          cont += computer+'\t\t价格:'+price+','+url+'\r\n';
      }

然后获得一行具有基本信息的电脑属性。
然后接下来的工作就是要把这些信息进行存储，我们这里因为不能直接存入数据库，所以要先存入文本中，代码如下：

var fs = require('fs');


try{
      fs.write(mypath, content, 'a');
    }catch(e){
      console.log(e);
    }

再PhantomJS中有API种有相应的读写文件讲解，这里就不多说了，上述代码就是在请求获得之后，将我们拼接好的内容写入文件中，采用的方式是’a’是添加的意思

经过上述过程，我们已经能够将第一个页面中的所有基本信息抓下来了，接下来的问题就是我们该如何跳转到下一个页面中，去抓取接下来的内容

代码如下：

var nextUrl = page.evaluate(function(){
          var url = '';
          var next =  document.querySelectorAll('div.pager a[class=page-next]');
          var cont = '';
          url = next[0];
          cont += url;
          return cont;
                });
        console.log(nextUrl);

    if(count <= pageSize){
      console.log(nextUrl);
      count++;
      console.log(count);
      loadComputerList(nextUrl);
    }else{
        console.log(count);
    phantom.exit();
    }

这里面获取下一个页面Url用到的js语句是：

var next =  document.querySelectorAll('div.pager a[class=page-next]');

朋友们可以使用开发者工具去该网站中看一下点击下一页按钮对应的dom节点是什么，然后就明白这段代码的含义了

再这里面，我们获取了下一页的按钮之后，还需要进行判断现在的循环次数，由于下一页的按钮是一直存在的，我们并不能通过判断是否为空来结束任务，所以我这里用了一个比较蠢得办法来解决这个问题。

抓取所有页面的内容就基本上完成了，这段脚本代码比较简单，如果需要抓同一个网站，只需要修改两部分就可以了，一个是address这个入口，还有就是写文件的路径。

抓取详细信息

再上面我们已经抓到了一些基本信息了，但是页面中并没有为我们提供比如电脑cpu,内存，显卡这些内容，所以我们的抓取工作并没有完成。那么接下来的工作就是要通过我们刚才有抓到的url进入到电脑商品的详细信息页面中去，然后再抓下我们所需要的详细信息。
代码如下：

var page =require('webpage').create();
var address='http://product.pconline.com.cn/server/';
var fs = require('fs');
var mypath='version/Server/server_page.txt';
var stream = null;
var steams = null;
var K=1;
var line ='';
var cate ='';
var url = '';
var dragPath='version/Server/server_detail.txt';
phantom.outputEncoding="gbk";
page.settings.userAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko";



function start(url){
  console.log(url);
  page.open(url,function(status){
    setTimeout(function(){
    if(status == 'success'){
    console.log('open success!');
    console.log('==========begin work!=============');
    stream = page.evaluate(function(){
        var name = document.querySelector('.pro-tit>h1').innerText;
        name = name.replace('参数','');
        var listComputer = document.querySelectorAll('div.pannel>ul .title');
        var listParameter = document.querySelectorAll('[itemid]');
        var price = document.querySelector('.r-price').innerText;
        price = price.replace(/\n/g,'');
        var cont= name+'|&|'+price+'|&|产品特性：';
        for(var j=0;jvar computer = listComputer[j].innerText;
            computer = computer.replace(' ','');
            cont += computer+' ';
          }
        for( var j = 0;jvar parameter = listParameter[j].innerText;
          parameter = parameter.replace(/\n/g,'');
          parameter = parameter.replace('\t',' ');
          if(j1){
              cont += parameter+"|&|";
            }else{
              cont += parameter+'';
            }
          }

          return cont+'\r\n';
    });
    try{
      fs.write(dragPath, stream, 'a');
    }catch(e){
      console.log(e);
    }
    console.log(stream);
  }else{
    console.log('page open fail!');
  }
    before();
            }, 100);
  });
}

function readFile(status){
    streams = fs.open(mypath,'r');
    before();
}

function before(){
  console.log('=========work in befor==========='+K);
  K++;
  if(!streams.atEnd()){
    console.log('=========work in befor get Next Line===========');
        line = streams.readLine();
        cate = line.split(',');
    console.log(cate[1]);
    var pcUrl = cate[1].replace('.html','_detail.html');
    console.log(pcUrl);
        start(pcUrl);
    }else{
    console.log('end!!!!!!!!!!!!');
    phantom.exit();
    }

}




page.open(address,function(status){

  readFile(status);

})

我们继续来分析下代码，Phantomjs的开始入口我们就不讲了，每次启动phantomjs都是由这个入口开始，然后再到我们想要的操作中去。

function readFile(status){
    streams = fs.open(mypath,'r');
    before();
}

这里我们成功打开文件，并且把文件中的内容缓存到了streams中去，这里设置的是全局变量，所以直接跳到before这个函数中去

function before(){
  console.log('=========work in befor==========='+K);
  K++;
  if(!streams.atEnd()){
    console.log('=========work in befor get Next Line===========');
        line = streams.readLine();
        cate = line.split(',');
    console.log(cate[1]);
    var pcUrl = cate[1].replace('.html','_detail.html');
    console.log(pcUrl);
        start(pcUrl);
    }else{
    console.log('end!!!!!!!!!!!!');
    phantom.exit();
    }

}

这里面进行的操作主要是在抓文件前，我们需要对我们刚才读进来的内容进行分析，比如：

line = streams.readLine();
cate = line.split(',');
var pcUrl = cate[1].replace('.html','_detail.html');

这三部分，首先就是实现了逐行读取的功能，将每一行的内容读出来，然后通过分隔符获得Url，这里由于我们获得的url并不是我们要的详细信息url，所以我们要进行拼接。

http://product.pconline.com.cn/server/lenovo/514943.html
http://product.pconline.com.cn/server/lenovo/514943_detail.html

这里提供两段实例，读者可以进去看一下，就明白我们为什么要这么拼接url了

stream = page.evaluate(function(){
        var name = document.querySelector('.pro-tit>h1').innerText;
        name = name.replace('参数','');
        var listComputer = document.querySelectorAll('div.pannel>ul .title');
        var listParameter = document.querySelectorAll('[itemid]');
        var price = document.querySelector('.r-price').innerText;
        price = price.replace(/\n/g,'');
        var cont= name+'|&|'+price+'|&|产品特性：';
        for(var j=0;jvar computer = listComputer[j].innerText;
            computer = computer.replace(' ','');
            cont += computer+' ';
          }
        for( var j = 0;jvar parameter = listParameter[j].innerText;
          parameter = parameter.replace(/\n/g,'');
          parameter = parameter.replace('\t',' ');
          if(j1){
              cont += parameter+"|&|";
            }else{
              cont += parameter+'';
            }
          }

          return cont+'\r\n';
    });

这部分代码就是我们要获取详细信息的代码了，读者可以研究一下，其实原理就是找到节点，然后取出来，进行拼接，最后获得一个详细的信息，实例：

联想ThinkServer TS130 S1225/2G/500O|&|￥5417|&|产品特性：产品型号 TS130 S1225/2G/500O|&|产品类型 塔式|&|产品结构 4U|&|CPU系列 至强处理器E3系列,Intel|&|CPU核心 四核|&|总线规格 DMI 5GT/s|&|CPU型号 E3-1225|&|CPU主频 3.1GHz|&|三级缓存 6M|&|标配CPU数目 1个|&|主板插槽 1×PCIE 2.0 x161×PCIE 2.0 x12×PCI 32/33|&|内存类型 DDR3|&|标配内存 2G|&|最大内存容量 32G|&|硬盘接口类型 SATAⅢ|&|标配硬盘 500G|&|最大硬盘容量 4TB|&|硬盘转速 7200转|&|硬盘阵列 Raid 0,Raid 1|&|光驱 DVD-ROM光驱|&|显示芯片 集成显卡|&|网卡 双端口千兆网卡|&|工作环境 工作温度：10℃-35℃，工作湿度：10%-80%|&|存储环境 储存温度：-40℃-70℃，储存湿度：10%-90%|&|电源 1个80PLUS单电源|&|最大功率 280W|&|操作系统 Windows 2003 R2 SP2简体中文标准版(32位/64位) Windows 2003 R2 SP2简体中文企业版(32位/64位)Windows Server 2008 简体中文基础版(64位) Windows Server 2008 简体中文标准版(32位/64位)Windows Server 2008 简体中文企业版(32位/64位)Windows Server 2008 R2 简体中文基础版(64位)Windows Server 2008 R2 简体中文标准版(64位) Windows Server 2008 R2 简体中文企业版(64位) Windows Small Business Server 2011 Essential Windows XP 简体中文专业版,SP2Windows Vista Business 简体中文商业版Windows 7简体中文专业版(32位/64位)Windows 7简体中文旗舰版(32位/64位)|&|尺寸 406×377×174mm

上面这部分就是我们获取到的详细的电脑信息内容，然后再拼接完信息之后，我们要做的就是写入文件中去，这里和上面是相似的，我就不重复了。

如何在无头模式下运行WebDriver 爱码小士
如何在无头模式下运行WebDriver？如果您的CI工具（例如Jenkins）不支持UI，则可能需要这样做。在无头模式下运行WebDriver自动测试在测试执行速度和更轻松地集成到CI管道方面具有优势。下面，我们将使用PhantomJS和ChromeDriver以无头模式运行SeleniumWebDriver测试。PhantomJS要使用PhantomJS以无头模式运行WebDriver测试，首先
Phantomjs生成PDF遇到的问题芭拉拉小魔仙 js javascript 前端 node.js
最近使用Phantomjs生成PDF，其中遇到一些问题，导致PDF生成失败，如出现空白文件或一页数据量太大，都是由于没有设置好格式导致。特别是分页问题，感觉资料很少，除了在StackOverflow上看到些许资料外，中文社区基本看不到，附上修改后的rasterize.js来做讲解：varpage=require('webpage').create(),system=require('system'
Ambari——编译——解决解决windows和linux下phantomjs链接超时问题空了虾摸索 Ambari ambari-排错 ambari windows linux
您的支持是我继续创作与分享的动力源泉!!!您的支持是我继续创作与分享的动力源泉!!!您的支持是我继续创作与分享的动力源泉!!!错误日志：[INFO]CopyingextractedfolderC:\Users\LENOVO\AppData\Local\Temp\phantomjs\phantomjs-2.1.1-windows.zip-extract-1786692611821\phantomjs
python 爬虫 selenium_Python爬虫获取cookie：利用selenium weixin_39861905 python 爬虫 selenium
下载、安装selenium下载地址：https://pypi.python.org/pypi/selenium目前的版本是：3.0.0b2支持：Firefox,Chrome,InternetExplorer,PhantomJSjar包的下载：selenium-3.0.0b2.tar.gz解压selenium-3.0.0b2.tar.gz，进入selenium-3.0.0b2目录，执行pythons
【Java】电子凭证-Java生成PDF hkk666123 Java HTML 转 PDF htmlTOPDF
文章目录背景实现思路技术方案图TemplateEngines(模板引擎)`Thymeleaf``ApacheFreemarker``GroovyTemplates``velocity``HTMLTOPDF`技术各实现对比表WKhtmlTOpdfiTextPhantomJS技术核心:HTML生成PDF背景在某些业务场景中，需要提供相关的电子凭证，比如网银/支付宝中转账的电子回单，签约的电子合同等。方
Python学习之路-爬虫提高:selenium geobuins python 学习爬虫
Python学习之路-爬虫提高:selenium什么是seleniumSelenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，Selenium可以直接运行在浏览器上，它支持所有主流的浏览器（包括PhantomJS这些无界面的浏览器），可以接收指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏PhantomJS的介绍PhantomJS是一个基于Webkit的“无界面”(h
Vue2.x源码：开启源码调试环境 HaanLen vue源码解析 vue.js javascript 前端
gitHub上克隆或者直接下载压缩包链接：https://github.com/vuejs/vue此次源码版本为[email protected]#安装依赖npmi#安装rollup:npmi-grollup发现npmi安装失败（在Mac上操作存在）；执行[email protected]再执行npmi执行安装成功package.json文件修
Ubuntu 16.04 安装PhantomJS Sirius1215
下载PhantomJShttp://phantomjs.org/download.html找到对应的压缩包，一般是phantomjs-2.1.1-linux-x86_64.tar.bz2上传到服务器，并解压#tar-xjvf/home/portal/software/phantomjs-2.1.1-linux-x86_64.tar.bz2解压后的文件会放到服务器根目录下，使用mv命令移动到想要放置
爬虫框架Scrapy之模拟登录淘宝 whele
模拟登录淘宝Selenium+PhantomJSfromseleniumimportwebdriverdriver=webdriver.PhantomJS()driver.get(“https://login.taobao.com/member/login.jhtml“)driver.find_element_by_id("TPL_username_1").clear()driver.find_e
python 爬虫 Oppenheim
之前写过一些简单的爬虫就是爬一下最新的公告，直接用requests库Get一下然后beautifulsoup去找就可以找到了，其他的处理就是处理html的东西了。但是昨天有个任务是，按原来的方法打开，啥也看不到，原来是个动态网站靠js注入执行的，想到以前的东西了，无头浏览器。phantomJS，然后稍微配置了一下运行，发现webdriver已经放弃phantomJS了。在动态网页的解析上还是考we
三十一. Selenium + PhantomJS的配合使用橄榄的世界
Selenium：用于模拟真实用户在浏览器中操作。对于一些采用异步加载技术的网页，如果难以用抓包来构造爬虫，可以通过Selenium让浏览器自动加载页面，从而获取所需的数据。PhantomJS：无界面浏览器，相比Chrome，Firefox等浏览器，意味着开销小，速度快。可直接在官网上下载：http://phantomjs.org/1.PhantomJS的安装①下载PhantomJS文件后，解压并
python echarts 热力图_pyecharts日历热力图 weixin_39851279 python echarts 热力图
pyecharts是一个用于生成Echarts图表的类库Echarts是百度开源的一个数据可视化JS库pyecharts中文文档pyecharts已发布1.0版本，绘图部分代码已经重构，文中的代码虽然能用但已经落伍了，随缘更新一、安装pyechartspipinstallpyecharts在安装pyecharts之后，需要安装pyecharts-snapshot包，还需要配置phantomjs环境
解决npm安装phantomjs失败 ziyue7575 npm 前端 node.js
失败信息Progress:resolved102,reused102,downloaded0,added0,done.pnpm/[email protected]/node_modules/phantomjs:Runninginstallscript,failedin21.3s.../node_modules/phantomjsinstall$nodeinstall.js│PhantomJSnotfo
SPA单页面的讲解（超级详细）贫僧法号依平 css3 vue.js html5 前端前端框架 html
目录一、什么是SPA二、SPA和MPA的区别单页应用与多页应用的区别单页应用优缺点三、实现一个SPA原理实现hash模式history模式四、题外话：如何给SPA做SEOSSR服务端渲染静态化使用Phantomjs针对爬虫处理一、什么是SPASPA（single-pageapplication），翻译过来就是单页应用SPA是一种网络应用程序或网站的模型，它通过动态重写当前页面来与用户交互，这种方法
Failed at the [email protected] install script. Webgiserin 前端
[email protected]
selenium phantomjs 获取链接 VictorChi
获取链接属性importtimefromseleniumimportwebdriverdriver=webdriver.Chrome()driver.maximize_window()driver.implicitly_wait(6)driver.get("https://www.baidu.com")time.sleep(1)#获取多个链接forlinkindriver.find_element
老司机要开车了！用Selenium+PhantomJS来抓取煎蛋网妹子图云飞学编程
那天有朋友找我一起抓妹子图片，像我这么正派的人，肯定是要抱着学习的目的......打开网页，哇！又...又要上火了。。。。话不多说，先看看网页吧！熟练的打开网页，找到妹子图，然后F12打开开发者工具，定位，ok，图片地址找到了，soeasy~!，我们写入代码看看WTF~!返回了个空列表？加了header也是这样，为啥呢，来打开源码看看原来是js数据，这就麻烦了，难道先去学习下js语法，拿js文件，
爬亚马逊评论-2018-10-16 11的雾
如果需要模拟浏览器点击效果则：driver=webdriver.Chrome('/cygene/script/test/chromedriver')#ordriver=webdriver.PhantomJS('/cygene/software/phantomjs-2.1.1-linux-x86_64/bin/phantomjs')##################################
Phantomjs+Java+springboot实现后端截图芭比萌妹服务器端网页截图 java spring boot 开发语言
一、phantomjs介绍（1）一个基于webkit内核的无界面浏览器，即没有UI界面，即它就是一个浏览器，只是其内的点击、翻页等人为相关操作需要程序设计实现。（2）提供javascriptAPI接口，即通过编写js程序可以直接与webkit内核交互，在此之上可以结合java语言等，通过java调用js等相关操作，从而解决了以前c/c++才能比较好的基于webkit开发优质采集器的限制。（3）提供
OSError: [Errno 9] Bad file descriptor 海上的程序猿 python python selenium phantomjs
在使用selenium+PhantomJS时遇到这个问题，为了自己将来再次遇到可以方便查找，也为了方便他人，故记下此事。driver.quit()和driver.close()仅仅会关闭Pythondriver进程，而留下PhantonJS进程仍在继续进行。Github讨论上有关这个问题的讨论，有兴趣的可以去看一下。当前对我来说，最便捷的解决方案是：importsignaldriver.servi
ELK 分离式日志伍dLu elk
目录一.ELK组件ElasticSearch：Kiabana：Logstash：可以添加的其它组件：ELK的工作原理：二.部署ELK节点都设置Java环境:每台都可以部署Elasticsearch软件：修改elasticsearch主配置文件：性能调优参数：修改内核参数文件：访问页面查看节点信息及状态：每台安装Elasticsearch-head插件：安装phantomjs：安装Elasticse
无界面自动化测试（IDEA+Java+Selenium+testng）(PhantomJS) 清冬暖雪 Web自动化 intellij-idea selenium java
自动化测试（IDEA+Java+Selenium+testng）(PhantomJS)_phantomjs怎么写js脚本idea-CSDN博客上述连接是参考：现在如果按照如上链接进行操作大概率会失败，下面会针对如上链接的部分步骤做出修改1、在pom.xml文件中需要使用低版本selenium-java依赖包，目前我使用的是4.13.0版本的所以在运行时铁定失败，目前除了降低selenium-jav
爬虫漫游指南：无头浏览器puppeteer的检测攻防 AI视客
1.引言许多爬虫初学者在接触到无头浏览器的时候都会有一种如获至宝的感觉，仿佛看到了爬虫的终极解决方案。无论是所有爬虫教程中都会出现的PhantomJS、Selenium，亦或是相对冷门的Nightmare，到后来居上的Puppeteer，都能够作为爬虫工程师的利刃，撕开反爬的一道道屏障。无头浏览器难道就是爬虫的终点了吗？那必然不是，否则各位爬虫工程师就只值3000块一个月了。首先，无论多强大多轻便
记录学习phantomjs+echarts-convert.js 生成图表图片过程 33cd82ad2276
转载自：http://www.5180it.com/bbs/admin/1/126060.html最近项目中要生成统计报表，并导出word，但是我们一般的报表都是通过echarts在浏览量生成，所以我们无法直接导出，所以这里借助了phantomjs帮我生成，此处都是使用最新的版本phantomjs-2.1.1，特此记录1.Phantomjs：下载：https://phantomjs.org/dow
Docker安装PhantomJS给网页截图严北
环境Docker安装拉取PhantomJS(后面简称PJS)镜像(第三方):dockerpullwernight/phantomjs:2截图代码打开https://baidu.com,截图并保存为test.pngscreenshot.jsvarpage=require('webpage').create();page.open('https://baidu.com',function(){page
C#Selenium WebDriver备忘录李建军 c#selenium 开发语言
初始化//谷歌浏览器usingOpenQA.Selenium.Chrome;IWebDriverdriver=newChromeDriver();//火狐浏览器usingOpenQA.Selenium.Firefox;IWebDriverdriver=newFirefoxDriver();//PhantomJS浏览器usingOpenQA.Selenium.PhantomJS;IWebDriver
BurpSuite-PhantomJS搭配xssValidator进行自动化xss测试小浪崇礼
安装PhantomJShttps://phantomjs.org/download.html下载Windows版本，目前官网最新版本是2.1.1-17.4MB，下载之后解压，建议单独放在一个目录然后配置系统环境变量，我这里测试的目录是C:\tools\phantomjs-2.1.1-windows\bin通过github下载xssValidatorgitclonehttps://github.co
基于python的音乐数据分析可视化程序员奇奇 python实战100例 python pandas 数据分析爬虫
MacOSSierra10.12.1Python2.7selenium3.4.3phantomjs前言发现自己有时候比挖掘别人来的更加有意义，自己到底喜欢谁的歌，自己真的知道么？习惯不会骗你搭建爬虫环境1.安装seleniumpipinstallselenium#anaconda环境的可用condainstallselenium#网速不好的可用到https://pypi.python.org/py
安装node_sass遇到的问题潇豪
方法一：使用淘宝镜像macOS系统直接运行下面的命令即可：SASS_BINARY_SITE=https://npm.taobao.org/mirrors/node-sass/npminstallnode-sass在项目内添加一个.npmrc文件：sass_binary_site=https://npm.taobao.org/mirrors/node-sass/phantomjs_cdnurl=ht
npm常见错误程序员 Hasity 52bug npm 前端 node.js
三个方面1.npmERR!codeELIFECYCLEnpmERR!errno1npmERR!codeELIFECYCLEnpmERR!errno1npmERR!phantomjs-prebuilt@2.1.15install:`nodeinstall.js`npmERR!Exitstatus1npmERR!npmERR!Failedatthephantomjs-prebuilt@2.1.15in
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

Phantomjs+Nodejs+Mysql数据抓取（1.数据抓取）

抓取详细信息

你可能感兴趣的:(PhantomJs)