与朋友们分享飞库网小说采集规则

转:http://bbs.dedecms.com/read.php?tid=71497&keyword=%B2%C9%BC%AF%B9%E6%D4%F2

 

前些天为一个陌生的朋友写的,现在与大家分享!
  是针对飞库网小说的,具体地址: http://bbs.dedecms.com/goto.php?url=http%3A%2F%2Fwww.feiku.com%2FBook%2FLN%2F134.html
    仅为测试交流,不可多采集!



    前段时间分享的自动采集插件autocollect的gb2312版,地址: http://bbs.dedecms.com/read.php?tid=64443&fpage=0&toread=&page=1
感谢大家分享!



@飞库网小说
@网谈WebTalks.cn分享论坛Beach
@080613



{!-- 节点基本信息 --}

{dede:item name='飞库网小说'
    imgurl='/upimg' imgdir='../upimg' language='gb2312'
    isref='no' refurl='' exptime='10'
    typeid='1' matchtype='string'}
{/dede:item}

{!-- 采集列表获取规则 --}

{dede:list source='var' sourcetype='list'
          varstart='' varend=''}
  {dede:url value='http://www.feiku.com/Book/LN/134.html'}{/dede:url}   
  {dede:need}shtm{/dede:need}
  {dede:cannot}{/dede:cannot}
  {dede:linkarea}<div id="CrListText">[var:区域]<div id="_ctl0_pager" class="mypager"{/dede:linkarea}
{/dede:list}

{!-- 网页内容获取规则 --}

{dede:art}
{dede:sppage sptype='none'}{/dede:sppage}
 
  {dede:note field='dede_archives.title' value='[var:内容]' comment='文章标题'
  isunit='' isdown=''}
   
    {dede:match}<div id="TextTitle"><span class="newstitle">[var:内容]</span></div>{/dede:match}
        {dede:trim}</div>{/dede:trim}

    {dede:function}{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_addonarticle.body' value='[var:内容]' comment='文章内容'
  isunit='' isdown=''}
   
    {dede:match}<div id="BookText">[var:内容]</div><font style="display:none">[飞库网 http://bbs.dedecms.com/goto.php?url=http%3A%2F%2Fwww.feiku.com]</font>{/dede:match}
        {dede:trim}<span(.*)>{/dede:trim}
    {dede:trim}<!--link(.*)link-->{/dede:trim}
    {dede:trim}</span>{/dede:trim}
    {dede:trim}<TBODY(.*)>{/dede:trim}
    {dede:trim}</TBODY>{/dede:trim}
    {dede:trim}<iframe(.*)</iframe>{/dede:trim}
    {dede:trim}<table(.*)>{/dede:trim}
    {dede:trim}</table>{/dede:trim}
    {dede:trim}<tr(.*)>{/dede:trim}
    {dede:trim}</tr>{/dede:trim}
    {dede:trim}<td(.*)>{/dede:trim}
    {dede:trim}</td>{/dede:trim}
    {dede:trim}<style(.*)</style>{/dede:trim}
    {dede:trim}<script(.*)</script>{/dede:trim}
    {dede:trim}<option(.*)</option>{/dede:trim}
    {dede:trim}<select(.*)</select>{/dede:trim}
    {dede:trim}<a(.*)>{/dede:trim}
    {dede:trim}<a>{/dede:trim}
    {dede:trim}<STRONG(.*)>{/dede:trim}
    {dede:trim}</STRONG>{/dede:trim}
    {dede:trim}<div(.*)>{/dede:trim}
    {dede:trim}</div>{/dede:trim}
    {dede:trim}<FONT(.*)>{/dede:trim}
    {dede:trim}</FONT>{/dede:trim}
    {dede:trim}<P style="TEXT-INDENT: 2em"></P>{/dede:trim}
    {dede:trim}<P align=right>{/dede:trim}
    {dede:trim}<NOBR(.*)>{/dede:trim}
    {dede:trim}</NOBR>{/dede:trim}
    {dede:trim}<P></P>{/dede:trim}

    {dede:function}{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_archives.writer' value='未知' comment='文章作者'
  isunit='' isdown=''}
   
    {dede:match}{/dede:match}
   
    {dede:function}{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_archives.source' value='飞库网小说' comment='文章来源'
  isunit='' isdown=''}
   
    {dede:match}{/dede:match}
   
    {dede:function}{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_archives.pubdate' value='[var:内容]' comment='发布时间'
  isunit='' isdown=''}
   
    {dede:match}{/dede:match}
   
    {dede:function}if(@me!="") @me = GetMkTime(@me);
else @me = time();{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_archives.sortrank' value='[var:内容]' comment='排序级别'
  isunit='' isdown=''}
   
    {dede:match}{/dede:match}
   
    {dede:function}@me = time();{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_archives.litpic' value='[var:内容]' comment='缩略图'
  isunit='' isdown=''}
   
    {dede:match}{/dede:match}
   
    {dede:function}@me = @litpic;{/dede:function}
   
  {/dede:note}
 
  {dede:note field='dede_archives.senddate' value='[var:内容]' comment='录入时间'
  isunit='' isdown=''}
   
    {dede:match}{/dede:match}
   
    {dede:function}@me = time();{/dede:function}
   
  {/dede:note}
{/dede:art}

 

你可能感兴趣的:(分享)