正则表达式

1.直接从实战开始,抓取新东方在线课程http://www.koolearn.com/

  • 找到所有要抓取的分类,组成数组,比如
    $cat_url =array (
    array (
    'cat_id' => '101',
    'cat_name' => 'TOEFL',
    'url' => 'http://www.koolearn.com/toefl/',
    ),
    array (
    'cat_id' => '108',
    'cat_name' => 'GMAT',
    'url' => 'http://www.koolearn.com/gmat/',
    ),
    );
    $base_url = 'http://www.koolearn.com';

cat_id ,cat_name 对应本地数据库里的数据。

  • 记录抓取的日志,如在laravel3里可以简单写个函数
    function _log($info, $pre='===') {
    $info = $pre.$info."\n";
    echo $info;
    File::append('storage/logs/get.log', $info);
    return;
    }

  • 开始抓取

你可能感兴趣的:(正则表达式)