node - cheerio模块

cheerio 是nodejs特别为服务端定制的,能够快速灵活的对JQuery核心进行实现,工作于DOM模型上,并且解析、操作、呈送都很高效

//示例
var html = '
    ' + '
  • Apple
  • ' + '
  • Orange
  • ' + '
  • Pear
  • ' + '
';
  • .load引入我们要解析的html
var cheerio = require('cheerio');
$ = cheerio.load(html);
  • 选择器(selectors)

$(selector,[context],[root])(context、root通常会省略)

$('.apple') 
//选择器定位到class=“apple”

$('ul .pear') 
//选择器定位到ul中class = “pear”

$('li[class = orange]')
//选择器定位到liclass=“orange”
  • 属性操作(attr)
    .attr(name[,value])获取和设置属性
    第二个参数是可选的。当第二个参数不存在时表示获取属性的值,当有带有第二个参数时,表示设置属性的值。如果设置一个属性的值设置为null ,则删除该属性
$('ul').attr('id');
//获取ul的id属性名

$('apple').attr('id','favorite').html;
//class为apple的添加了个id为favorite

.removeAttr(name)移除属性

  • class操作
    .hasClass(className)判断元素class中是否包含className
    .addClass(className)给元素添加className的样式名
    removeClass(className)将元素上className的样式名移除,当className为空时则移除所有样式名
  • DOM操作
    .append(content)作为最后一个子元素插入
    prepend(content)作为第一个子元素插入
    .after(content)插入某一元素后面
    .before(content)插入某一元素前面
    .empty()清空节点,移除所有字节点
    .html()获取节点的html内容,传入参数时设置该元素的html结构
    .text()获取节点的所有文本内容

查找元素
.find()查找符合选择条件的元素

$('#fruits').find('li').length;  //=> 3

.parent()获取元素的父元素
.next()获取元素的下一个兄弟元素
.perv()获取元素的上一个兄弟元素
.children([selector])获取元素的孩子节点
.siblings()获取元素的所有同级元素(包括本身)

.filter(seletor/function(index))在cheerio对象集合中进行条件筛选
.fist()获取cheerio集合中第一个cheerio对象
.last()cheerio最后一个对象
.eq(i)根据索引值i获取cheerio的对象(i为负值时表示从尾部开始索引)
.clone()对cheerio对象进行复制

.eacn(function(index,element){……})遍历每个元素
.map(function(index,element){……})对每一个元素进行处理并返回一个值

$.root 对顶级DOM进行操作
$.contains(container,contained)判断container是否有contained

你可能感兴趣的:(node - cheerio模块)