python 爬虫 智联招聘

本方法使用cookie的方法下载智联招聘的职位。主要就是要先登录智联招聘,然后将对应的cookie作为爬虫访问的header。代码如下:

import requests
import re
import xlwt

def parse_one_page(html):
    '''
    解析HTML代码,提取有用信息并返回
    '''
    # 正则表达式进行解析
    pattern = re.compile('(.*?).*?'
                         '(.*?).*?'
                         '

\\n\s+(.*?)\\n.*?' '

  • (.*?)
  • '
    , re.S) # 匹配职位信息

    你可能感兴趣的:(Python,爬虫,python)