火狐火狐

Python爬虫拉勾网招聘爬取

运行平台： Windows
Python版本： Python3.6
IDE： Sublime Text
其他工具： Chrome浏览器

文章目录

Python爬虫拉勾网招聘爬取
- 0、打开搜索页
- 1、找到职位连接
- 2、打开职位详情页面，解析职位详情信息
- - 2.1、详情页面解析
  - 2.2 、代码实现
- 3、将获得数据写入CSV或TXT文件
- - 3.1、求出平均工资
- 4、数据分析
- - 4.1 工资统计
  - 4.2 工作经验统计
  - 4.3 职位词频描述
  - 4.3.1 读取TXT文件
  - 4.3.2 调用stopword，添加自定义字典和词频统计
  - 4.3.3 词频可视化：词云
- 邮件发送
- 其他想法
- 完整代码

0、打开搜索页

首先需要安装selenium库 pip install selenium
运用selenium工具，打开搜索页

实现代码如下

self.driver = webdriver.Chrome()
self.url = 'https://www.lagou.com/jobs/list_python?px=default&city=%E5%85%A8%E5%9B%BD#filterBox'

1、找到职位连接

为了得到详情页面，我们需要在搜索完成后，找到职位详情页面的连接，操作如下

运用xpath工具找到该连接：

def page_list_details(self, source):
        html = etree.HTML(source)
        links = html.xpath('//a[@class="position_link"]/@href')
        for link in links:
            self.request_details(link)
            time.sleep(2)

2、打开职位详情页面，解析职位详情信息

2.1、详情页面解析

由第一步得到的页面URL地址，打开详情页面，在游览器打开后，找到我们所需要的数据：

在开发者项并运用xpath工具检验能否得到数据：

2.2 、代码实现

首先需要具备xpath语法知识，安装lxml库： pip install lxml

    def request_details(self, link):
        self.driver.execute_script("window.open('%s')" % link)
        self.driver.switch_to_window(self.driver.window_handles[1])
        source = self.driver.page_source
        html = etree.HTML(source)
        WebDriverWait(self.driver, timeout=5).until(
            EC.presence_of_element_located((By.XPATH, '//span[@class="name"]'))
            )
        name = html.xpath('//span[@class="name"]/text()')[0].strip()
        company = html.xpath('//h2[@class="fl"]/text()')[0].strip()
        # salary = html.xpath('//span[@class="salary"]/text()')
        job_request = html.xpath('//dd[@class="job_request"]//span/text()')
        salary = job_request[0].strip()
        city = re.sub(r'[\s/]', '', job_request[1])
        experience = job_request[2]
        experience = re.sub(r'[\s/]', '', experience)
        education = re.sub(r'[\s/]', '', job_request[3])
        job_desc = ''.join(html.xpath('//dd[@class="job_bt"]//text()')).strip()
        position_detail = {
            'name': name,
            'city': city,
            'company': company,
            'salary': salary,
            'experience': experience,
            'education': education,
            # 'job_desc': job_desc
        }
        self.write_text(job_desc)
        self.position_details.append(position_detail)
        self.write_csv_rows(self.headers, position_detail)
        self.driver.close()
        self.driver.switch_to_window(self.driver.window_handles[0])

3、将获得数据写入CSV或TXT文件

将职位描述写入TXT文件，便于词频统计，其余信息写入CSV文件

    def write_csv_headles(self, headers):
        with open('lagou_positions.csv', 'a', encoding='utf-8', newline='') as f:
            position_headline = csv.DictWriter(f, headers)
            position_headline.writeheader()
        
    def write_text(self, job_desc):
        with open('lagou_position_details.txt', 'a', encoding='utf-8') as f:
            f.write('\n------------------------------------------------' + '\n')
            f.write(job_desc)

    def write_csv_rows(self, headers, position_detail):
        with open('lagou_positions.csv', 'a', encoding='utf-8', newline='') as f:
            position_headlines = csv.DictWriter(f, headers)
            position_headlines.writerow(position_detail)

3.1、求出平均工资

读取CSV文件，获得所有工资信息
工资只有一种形式 ×k-×k,取出数值求平均，乘以1000即可

def read_lagou_information(self, column):
        with open('lagou_positions.csv', 'r', encoding='utf-8', newline='') as f:
            salary_reader = csv.reader(f)
            return [row[column] for row in salary_reader]

		sal = self.read_lagou_information(3)
        for i in range(len(sal)-1):
            requre_sal = sal[i+1]
            requre_sal = re.sub(r'k', '', requre_sal)
            inx = requre_sal.find('-')
            average_sal = (int(requre_sal[0:inx]) + int(requre_sal[inx+1:]))/2
            requre_sal = average_sal * 1000

4、数据分析

4.1 工资统计

运用饼状图显示各个工资阶层的分布情况

def analyse_industry_salary(self):
        sal = self.read_lagou_information(3)
        for i in range(len(sal)-1):
            requre_sal = sal[i+1]
            requre_sal = re.sub(r'k', '', requre_sal)
            inx = requre_sal.find('-')
            average_sal = (int(requre_sal[0:inx]) + int(requre_sal[inx+1:]))/2
            requre_sal = average_sal * 1000
            if requre_sal < 2000:
                self.salaries_distribute['2k以下'] += 1
            elif requre_sal < 5000:
                self.salaries_distribute['2k-5k'] += 1
            elif requre_sal < 10000:
                self.salaries_distribute['5k-10k'] += 1
            elif requre_sal < 25000:
                self.salaries_distribute['10k-25k'] += 1
            elif requre_sal < 50000:
                self.salaries_distribute['25k-50k'] += 1
            else:
                self.salaries_distribute['50k以上'] += 1
        plt.rcParams['font.sans-serif'] = ['SimHei']
        # print(self.salaries_distribute)
        labels = list(self.salaries_distribute.keys())
        values = list(self.salaries_distribute.values())
        # explode = (0.5, 0.5, 0, 0, 0, 0.1)
        plt.pie(values, labels=labels, autopct='%2.0f%%', labeldistance=1.1,
                startangle=90, pctdistance=0.8)
        plt.axis('equal')
        plt.legend(loc='upper right', bbox_to_anchor=(1.1, 1.1))
        plt.grid()
        plt.show()

4.2 工作经验统计

运用饼状图显示工作经验分布

    def analyse_work_experience(self):
        work_experience = self.read_lagou_information(4)
        for i in range(len(work_experience)-1):
            requre_experience = work_experience[i+1]
            if requre_experience == '经验不限' or requre_experience == '经验应届毕业生':
                self.experience_distribute['应届毕业生'] += 1
            elif requre_experience == '经验1-3年' or requre_experience == '经验1年以下':
                self.experience_distribute['3年及以下'] += 1
            elif requre_experience == '经验3-5年':
                self.experience_distribute['3-5年'] += 1
            elif requre_experience == '经验5-10年':
                self.experience_distribute['5-10年'] += 1

        plt.rcParams['font.sans-serif'] = ['SimHei']
        # print(self.salaries_distribute)
        labels = list(self.experience_distribute.keys())
        values = list(self.experience_distribute.values())

        plt.pie(values, labels=labels, autopct='%2.0f%%', labeldistance=1.1,
                startangle=90, pctdistance=0.8)
        plt.axis('equal')
        plt.legend(loc='upper right', bbox_to_anchor=(1, 1.1))
        plt.grid()
        # plt.title('经验分布图')
        plt.show()

4.3 职位词频描述

对职位的任职要求进行词频分析，可以便于应届生找工作和需要换工作的人群，提前了解工作技能基本要求和加分项，检验自己是否符合岗位要求；提前做好就业和跳槽准备

词频统计用到了 jieba、numpy、pandas、scipy库。如果电脑上没有这两个库，执行安装指令：
pip install jieba
pip install pandas
pip install numpy
pip install scipy

4.3.1 读取TXT文件

将以保存的项目描述TXT文件，读取出来：

def read_lagou_details(self):
    with open('lagou_position_details.txt', 'r', encoding='utf-8', newline='') as f:
       return f.read()

4.3.2 调用stopword，添加自定义字典和词频统计

在此处调用停用表stopword，即为剔除职位描述中不需要的词语。自定义字典是为了，添加jieba词库里面没有的词，提高新词匹配正确率。 停用表stopword.txt 百度自行下载

    def demand_technology_rock(self):
        content = self.read_lagou_details().strip()
        content = re.sub(r'\s', '', content)
        jieba.load_userdict('config/usercorpus.txt')
        segment = jieba.lcut(content)
        word_segment = pd.DataFrame({'segment': segment})
        stopwords = pd.read_csv('config/stopwords.txt', index_col=False, quoting=3, sep=' ', names=['stopword'], encoding='utf-8')
        global word_rock
        word_segment = word_segment[~word_segment.segment.isin(stopwords.stopword)]
        word_rock = word_segment.groupby(by=['segment'])['segment'].agg({'计数':numpy.size})
        word_rock = word_rock.reset_index().sort_values(by=['计数'], ascending=False)
        print(word_rock)
        self.request_technogies_ciyun()


### 运行结果
       segment   计数
504         开发  103
806         经验   64
257         优先   55
551         技术   47
873         设计   40
235         产品   38
793         系统   37
86      Python   35
578         描述   34
843         良好   32
832         能力   32
857         要求   26
648         服务   25
667         框架   24
492          年   24
273         使用   24
607         数据   24
402         团队   23
817         编程   23
254         任职   23
610        数据库   22
258         优化   21
317         分析   18
686         沟通   18
720       熟练掌握   18
302         具备   17
196         业务   17
491         平台   16
737         理解   16
249       以上学历   16
..         ...  ...
539        战斗力    1
540         战略    1
541         截止    1
542         户外    1
146       pep8    1
145        nsq    1
546         扩展    1
547         找到    1
144      nginx    1
550         技巧    1
147    product    1
530         想法    1
154       saas    1
527         总结    1
506       开发工具    1
507       开发技术    1
510         引入    1
152  pythonweb    1
512         弹性    1
150     pylint    1
149       pyQT    1
517         影响    1
518          微    1
519         心情    1
520         必备    1
522         思想    1
523         思维    1
524         思路    1
525          性    1
486         带领    1

从上面打印的结果可以看出，还是有某些词语是不需要的，我们可以自行在stopword里自行添加。
同理，我们也可以在自定义字典里，添加重要的新词，来达到更加完美的效果。

4.3.3 词频可视化：词云

最后，进行词频可视化。

    def request_technogies_ciyun(self):
        color_mask = imread('config/timg.jpg')
        wordcloud = WordCloud(
            font_path='simhei.ttf',
            background_color='white',
            max_words=100,
            mask=color_mask,
            max_font_size=100,
            random_state=42,
            width=1000,
            height=860,
            margin=2
        )
        word_rock_requence = {x[0]: x[1]for x in word_rock.head(100).values}
        # word_rock_requence_dict = {}
        # for key in word_rock_requence:
        #     word_rock_requence_dict[key] = word_rock_requence[key]

        wordcloud.generate_from_frequencies(word_rock_requence)
        image_colors = ImageColorGenerator(color_mask)
        wordcloud.recolor(color_func=image_colors)
        wordcloud.to_file('config/rock_key.png')
        plt.imshow(wordcloud)
        plt.axis('off')
        plt.show()

邮件发送

将岗位分析结果，通过邮件发送的形式，发送给他人：

        my_sender = '×××××××@163.com'    # 发件人邮箱账号
        my_pass = '××××××××'              # 发件人邮箱密码
        my_user = '×××××××@163.com'      # 收件人邮箱账号，我这边发送给自己
        ret = True
        try:
            msg = MIMEMultipart()
            msg.attach(MIMEText('工作分析结果请看附件','plain','utf-8'))
            # msgAlternative = MIMEMultipart('alternative')
            # msg.attach(msgAlternative)
            msg['From']=formataddr(["FromRunoob", my_sender])  # 括号里的对应发件人邮箱昵称、发件人邮箱账号
            msg['To']=formataddr(["FK",my_user])              # 括号里的对应收件人邮箱昵称、收件人邮箱账号
            msg['Subject']="拉钩网职业分析"                # 邮件的主题，也可以说是标题

            csv_att = MIMEText(open('lagou_positions.csv', 'rb').read(), 'base64', 'utf-8')
            csv_att["Content-Type"] = 'application/octet-stream'
            # 这里的filename可以任意写，写什么名字，邮件中显示什么名字
            csv_att["Content-Disposition"] = 'attachment; filename="lagou.csv"'
            msg.attach(csv_att)

            # mail_msg = """
            # Python 邮件发送测试...
            # 菜鸟教程链接
            # 图片演示：
            # 
            # """
            # msgAlternative.attach(MIMEText(mail_msg, 'html', 'utf-8'))
            # msg.attach(MIMEText(mail_msg, 'plain', 'utf-8'))
            sendimagefile = open('config/rock_key.png', 'rb')
            image = MIMEImage(sendimagefile.read())
            image.add_header('Content-ID', '')
            msg.attach(image)

            txt_att = MIMEText(open('test.txt', 'rb').read(), 'base64', 'utf-8')
            txt_att["Content-Type"] = 'application/octet-stream'
            # 这里的filename可以任意写，写什么名字，邮件中显示什么名字
            txt_att["Content-Disposition"] = 'attachment; filename="test.txt"'
            msg.attach(txt_att)

            server=smtplib.SMTP_SSL("smtp.163.com", 465)  # 发件人邮箱中的SMTP服务器，端口是25
            server.login(my_sender, my_pass)  # 括号中对应的是发件人邮箱账号、邮箱密码
            server.sendmail(my_sender,[my_user,],msg.as_string())  # 括号中对应的是发件人邮箱账号、收件人邮箱账号、发送邮件
            server.quit()  # 关闭连接

实现结果如图

其他想法

我们可以自定义配置文件，然后所有IT行业在全国各地，各地热门行业等进行分析。

完整代码

from selenium import webdriver
from lxml import etree
import re
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
import time
import csv
import pandas as pd
import matplotlib.pyplot as plt
import jieba
import numpy
from scipy.misc import imread
from wordcloud import WordCloud, ImageColorGenerator


class LagouSpider(object):
    headers = ['name', 'city', 'company', 'salary', 'experience', 'education']
    position_details = []
    salaries_distribute = {'2k以下': 0, '2k-5k': 0, '5k-10k': 0, '10k-25k': 0, '25k-50k': 0, '50k以上': 0}
    experience_distribute = {'应届毕业生': 0, '3年及以下': 0, '3-5年': 0, '5-10年': 0}

    def __init__(self):
        # self.driver = webdriver.Chrome()
        self.url = 'https://www.lagou.com/jobs/list_python?px=default&city=%E5%85%A8%E5%9B%BD#filterBox'

    def run(self):
        self.demand_technology_rock()
        self.analyse_industry_salary()
        self.analyse_work_experience()
        # self.driver.get(self.url)
        # self.write_csv_headles(self.headers)
        # while True:
        #     source = self.driver.page_source
        #     self.page_list_details(source)
        #     WebDriverWait(self.driver, timeout=10).until(
        #         EC.presence_of_element_located((By.XPATH, '//div[@class="pager_container"]/span[last()]'))
        #     )
        #     pager_next = self.driver.find_element_by_xpath('//div[@class="pager_container"]/span[last()]')
        #     if 'pager_next_disabled' in pager_next.get_attribute('class'):
        #         break
        #     else:
        #         pager_next.click()
        #     time.sleep(2)

    def page_list_details(self, source):
        html = etree.HTML(source)
        links = html.xpath('//a[@class="position_link"]/@href')
        for link in links:
            self.request_details(link)
            time.sleep(2)
            # break

    def request_details(self, link):
        self.driver.execute_script("window.open('%s')" % link)
        self.driver.switch_to_window(self.driver.window_handles[1])
        source = self.driver.page_source
        html = etree.HTML(source)
        WebDriverWait(self.driver, timeout=5).until(
            EC.presence_of_element_located((By.XPATH, '//span[@class="name"]'))
            )
        name = html.xpath('//span[@class="name"]/text()')[0].strip()
        company = html.xpath('//h2[@class="fl"]/text()')[0].strip()
        # salary = html.xpath('//span[@class="salary"]/text()')
        job_request = html.xpath('//dd[@class="job_request"]//span/text()')
        salary = job_request[0].strip()
        city = re.sub(r'[\s/]', '', job_request[1])
        experience = job_request[2]
        experience = re.sub(r'[\s/]', '', experience)
        education = re.sub(r'[\s/]', '', job_request[3])
        job_desc = ''.join(html.xpath('//dd[@class="job_bt"]//text()')).strip()
        position_detail = {
            'name': name,
            'city': city,
            'company': company,
            'salary': salary,
            'experience': experience,
            'education': education,
            # 'job_desc': job_desc
        }
        self.write_text(job_desc)
        self.position_details.append(position_detail)
        self.write_csv_rows(self.headers, position_detail)
        self.driver.close()
        self.driver.switch_to_window(self.driver.window_handles[0])

    def write_csv_headles(self, headers):
        with open('lagou_positions.csv', 'a', encoding='utf-8', newline='') as f:
            position_headline = csv.DictWriter(f, headers)
            position_headline.writeheader()
        
    def write_text(self, job_desc):
        with open('lagou_position_details.txt', 'a', encoding='utf-8') as f:
            f.write('\n------------------------------------------------' + '\n')
            f.write(job_desc)

    def write_csv_rows(self, headers, position_detail):
        with open('lagou_positions.csv', 'a', encoding='utf-8', newline='') as f:
            position_headlines = csv.DictWriter(f, headers)
            position_headlines.writerow(position_detail)

    def read_lagou_information(self, column):
        with open('lagou_positions.csv', 'r', encoding='utf-8', newline='') as f:
            salary_reader = csv.reader(f)
            return [row[column] for row in salary_reader] 

    def analyse_industry_salary(self):
        sal = self.read_lagou_information(3)
        for i in range(len(sal)-1):
            requre_sal = sal[i+1]
            requre_sal = re.sub(r'k', '', requre_sal)
            inx = requre_sal.find('-')
            average_sal = (int(requre_sal[0:inx]) + int(requre_sal[inx+1:]))/2
            requre_sal = average_sal * 1000
            if requre_sal < 2000:
                self.salaries_distribute['2k以下'] += 1
            elif requre_sal < 5000:
                self.salaries_distribute['2k-5k'] += 1
            elif requre_sal < 10000:
                self.salaries_distribute['5k-10k'] += 1
            elif requre_sal < 25000:
                self.salaries_distribute['10k-25k'] += 1
            elif requre_sal < 50000:
                self.salaries_distribute['25k-50k'] += 1
            else:
                self.salaries_distribute['50k以上'] += 1
        plt.rcParams['font.sans-serif'] = ['SimHei']
        # print(self.salaries_distribute)
        labels = list(self.salaries_distribute.keys())
        values = list(self.salaries_distribute.values())
        # explode = (0.5, 0.5, 0, 0, 0, 0.1)
        plt.pie(values, labels=labels, autopct='%2.0f%%', labeldistance=1.1,
                startangle=90, pctdistance=0.8)
        plt.axis('equal')
        plt.legend(loc='upper right', bbox_to_anchor=(1.1, 1.1))
        plt.grid()
        # plt.title('经验分布图')
        plt.show()

    def analyse_work_experience(self):
        work_experience = self.read_lagou_information(4)
        for i in range(len(work_experience)-1):
            requre_experience = work_experience[i+1]
            if requre_experience == '经验不限' or requre_experience == '经验应届毕业生':
                self.experience_distribute['应届毕业生'] += 1
            elif requre_experience == '经验1-3年' or requre_experience == '经验1年以下':
                self.experience_distribute['3年及以下'] += 1
            elif requre_experience == '经验3-5年':
                self.experience_distribute['3-5年'] += 1
            elif requre_experience == '经验5-10年':
                self.experience_distribute['5-10年'] += 1

        plt.rcParams['font.sans-serif'] = ['SimHei']
        # print(self.salaries_distribute)
        labels = list(self.experience_distribute.keys())
        values = list(self.experience_distribute.values())

        plt.pie(values, labels=labels, autopct='%2.0f%%', labeldistance=1.1,
                startangle=90, pctdistance=0.8)
        plt.axis('equal')
        plt.legend(loc='upper right', bbox_to_anchor=(1, 1.1))
        plt.grid()
        # plt.title('经验分布图')
        plt.show()

    def read_lagou_details(self):
        with open('lagou_position_details.txt', 'r', encoding='utf-8', newline='') as f:
            return f.read()

    def demand_technology_rock(self):
        content = self.read_lagou_details().strip()
        content = re.sub(r'\s', '', content)
        jieba.load_userdict('config/usercorpus.txt')
        segment = jieba.lcut(content)
        word_segment = pd.DataFrame({'segment': segment})
        stopwords = pd.read_csv('config/stopwords.txt', index_col=False, quoting=3, sep=' ', names=['stopword'], encoding='utf-8')
        global word_rock
        word_segment = word_segment[~word_segment.segment.isin(stopwords.stopword)]
        word_rock = word_segment.groupby(by=['segment'])['segment'].agg({'计数':numpy.size})
        word_rock = word_rock.reset_index().sort_values(by=['计数'], ascending=False)
        print(word_rock)
        self.request_technogies_ciyun()

    def stopwordslist(self):
        stopwords = [line.strip() for line in open('config/stopwords.txt', 'r', encoding='utf-8').readlines()]
        return stopwords

    def request_technogies_ciyun(self):
        color_mask = imread('config/timg.jpg')
        wordcloud = WordCloud(
            font_path='simhei.ttf',
            background_color='white',
            max_words=100,
            mask=color_mask,
            max_font_size=100,
            random_state=42,
            width=1000,
            height=860,
            margin=2
        )
        word_rock_requence = {x[0]: x[1]for x in word_rock.head(100).values}
        # word_rock_requence_dict = {}
        # for key in word_rock_requence:
        #     word_rock_requence_dict[key] = word_rock_requence[key]

        wordcloud.generate_from_frequencies(word_rock_requence)
        image_colors = ImageColorGenerator(color_mask)
        wordcloud.recolor(color_func=image_colors)
        wordcloud.to_file('config/rock_key.png')
        plt.imshow(wordcloud)
        plt.axis('off')
        plt.show()


if __name__ == "__main__":
    lagouspider = LagouSpider()
    lagouspider.run()

node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
ARM驱动学习之基础小知识 JT灬新一 ARM 嵌入式 arm开发学习
ARM驱动学习之基础小知识•sch原理图工程师工作内容–方案–元器件选型–采购（能不能买到，价格）–原理图（涉及到稳定性）•layout画板工程师–layout（封装、布局，布线，log）（涉及到稳定性）–焊接的一部分工作（调试阶段板子的焊接）•驱动工程师–驱动，原理图，layout三部分的交集容易发生矛盾•PCB研发流程介绍–方案，原理图(网表)–layout工程师（gerber文件）–PCB板
《大兴安岭猎人传说》今年最好看的东北鬼怪故事，很优秀一部电影
《大兴安岭猎人传说》是最新上映于愚人节的网剧，别看是网剧却远超出我的个人预料。该片由民俗故事改编，这点就很吸引人，因为民俗故事口口相传，比那些编造而成的鬼故事更具有了真实性，网大做的电影还不错哦，如果可以我打四星好评。大兴安岭的故事我们经常听老人提起，那里有原始大森林，物产丰富，更流传着精灵怪物的传说。什么红黄白柳灰，出马仙、人参娃娃的故事层出不穷，以大兴安岭为背景的故事真不少。可很多鬼片看到最后
红手套节马小媛为中国城市环卫者公益发声：今天我手红疏狂君
#红手套节#公益活动，线头公益以及同多方资源的共同努力我们邀请到了线头公益大使马小媛马小媛，1993年5月3日出生于江苏省南京市，中国内地新生代女演员。2015年马小媛参演网剧《余罪》，饰演警校校花安嘉璐的闺蜜。2016年马小媛主演系列电影《丽人保镖》中女一号林欢馨，正式出道。此后，马小媛陆续接演了电视剧《警花与警犬2》，在网剧《你美丽李美丽》中担任女主角李美丽。拂晓，当你还在睡梦中时，这座城跟你
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
天猫返利网哪个最好?天猫返利网站有哪些? 优惠券高省
关于哪个返利网站好用，今天汐儿给大家介绍以下十大网站，可以作为参考：1、高省网【高省APP】（邀请码：668666）全网佣金最高。手机应用商店搜索“高省”即可免费下载安装，填写高省邀请码：668666，直升2皇冠，享更高佣金及分红奖励。高省APP全网佣金最高，手机应用商店搜索“高省”即可下载，高省邀请码：668666，此码注册，直升2皇冠，佣金更高！送万元推广大礼包，教你如何1年做到百万团队。其实
误落尘网中，一去三十年不会功夫的谭大侠
图片发自App图片发自App图片发自App《财富自由之路》中开篇就讲述了财富自由的目的是为了时间自由，高中觉得每个月一千块是财富自由，大学觉得每个月两千块是财富自由，毕业时觉得每个月五千是财富自由，现在感觉每个月一万都不一定自由。思来想去，货币贬值也没有这么快，还是自己欲望太大了，欲壑难填。大学有一个梦想去西藏，当时觉得两千块就能去，现在感觉有一万都不够。膨胀了啊！曾经想过时间自由了干什么，我就半
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
每日OJ_牛客_马戏团（模拟最长上升子序列） GR鲸鱼 c++算法开发语言牛客数据结构
目录牛客_马戏团（模拟最长上升子序列）解析代码牛客_马戏团（模拟最长上升子序列）马戏团__牛客网搜狐员工小王最近利用假期在外地旅游，在某个小镇碰到一个马戏团表演，精彩的表演结束后发现团长正和大伙在帐篷前激烈讨论，小王打听了下了解到，马戏团正打算出一个新节目“最高罗汉塔”，即马戏团员叠罗汉表演。考虑到安全因素，要求叠罗汉过程中，站在某个人肩上的人应该既比自己矮又比自己瘦，或相等。团长想要本次节目中的
python爬取微信小程序数据,python爬取小程序数据 2301_81900439 前端
大家好，小编来为大家解答以下问题，python爬取微信小程序数据，python爬取小程序数据，现在让我们一起来看看吧！Python爬虫系列之微信小程序实战基于Scrapy爬虫框架实现对微信小程序数据的爬取首先，你得需要安装抓包工具，这里推荐使用Charles，至于怎么使用后期有时间我会出一个事例最重要的步骤之一就是分析接口，理清楚每一个接口功能，然后连接起来形成接口串思路,再通过Spider的回调
淘宝网优惠券，你的购物神器，你知道吗？氧惠超好用
淘宝网作为中国最大的综合性网络零售平台，吸引了无数消费者的目光。在淘宝网上，我们不仅可以找到丰富多样的商品，还可以通过各种促销活动享受到购物的乐趣。其中，淘宝网优惠券就是一项备受消费者喜爱的福利。那么，淘宝网优惠券究竟有何魅力，能够让我们在购物时更加得心应手呢？淘宝网优惠券作为一种促销手段，为消费者提供了实实在在的购物优惠。无论是店铺优惠券、平台优惠券还是特定商品优惠券，都能在一定程度上降低购物成
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
靠谱的海淘APP大全可以海淘的软件有哪些氧惠评测
96KaiFa为您整理了可以海淘的软件有哪些，分别有海淘、ZOZO日本海淘、海淘铺、美芽海淘、海淘1号海外购、高乐高海淘、海淘美瞳、海淘返利网、海淘拼单、豌豆公主海淘，下面一起来看靠谱的海淘APP大全吧！购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多
metaRTC8.0，一个全新架构的webRTC SDK库 metaRTC webrtc 音视频
概述metaRTC8.0是metaRTC开源以来架构变化最大的一个版本，是metaIPC3.0等高性能的基础。metaRTC8.0是一个全新架构版本，并非在metaRTC7.0版本上简单升级，在QOS/语音对讲/内存占用/视频文件录制读取等方面新增多个模块，在弱网对抗/语音对讲/内存优化等效果上有显著提升。metaRTC8.0在一年多的开发中进行了近200次迭代，metaRTC8.0社区版计划在2
“无”，有大用我若盛开
2021/7/7日更36/100网图，侵删《道德经》节选解析“三十辐，共一毂；当其无，有车之用。埏埴以为器，当其无，有器之用。凿户牖以为室，当其无，有室之用。故有之以为利，无之以为用。”译文：三十根辐条汇集到一根毂的孔洞当中，有了车毂中空的地方，才有车的作用。揉和陶土做成器皿，有了器具中空的地方，才有器皿的作用。开凿门窗建造房屋，有了门窗四壁内的空虚部分，才有房屋的作用。所以，“有”只是提供了条件
学会这招！用python爬取微博评论（无重复数据） Python白白白白
python爬取微博评论（无重复数据）前言一、整体思路二、获取微博地址1、获取ajax地址2、解析页面中的微博地址3、获取指定用户微博地址三、获取主评论四、获取子评论1、解析子评论2、获取子评论五、主函数调用1、导入相关库2、主函数执行3、结果写在最后Tip:本文仅供学习与交流，切勿用于非法用途！！！前言前段时间微博上关于某日记的评论出现了严重的两极分化，出于好奇的我想对其中的评论以及相关用户做一
当当网图书优惠码怎么领取?当当网有没有优惠券? 高省APP珊珊
当当优惠码的免费领取可以通过以下几种方式：【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，2000万用户信赖的四年老平台，稳定可靠。高省APP佣金更高，模式更好，终端用户不流失。高省是公认的返利最高的软件。珊珊导师高省邀请码666123，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。在当当APP的首页界面，点击“领券中心”按钮，进入领券中心页面。在领券中心
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台网顺技术团队成品程序项目 java vue.js 汽车课程设计 spring boot
基于JavaWeb开发的Java+SpringMvc+vue+element实现上海汽车博物馆平台作者主页网顺技术团队欢迎点赞收藏⭐留言文末获取源码联系方式查看下方微信号获取联系方式承接各种定制系统精彩系列推荐精彩专栏推荐订阅不然下次找不到哟Java毕设项目精品实战案例《1000套》感兴趣的可以先收藏起来，还有大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人文章目录基
云防火墙和Web应用防火墙（WAF）区别快快小毛毛前端网络
随着互联网的进一步发展，Web应用防火墙（WAF）和云防火墙步入大家的视野。防火墙针对web应用拥有很好的保护作用，由硬件和软件组合，在内部网和外部网、专用网和公共网之间形成一道强有力的保护屏障，使用者可配置不同保护级别的防火墙，高级别的保护会阻止运营一些服务。那么，我们如何理解这两种防火墙，他们有什么区别？一、web防火墙Web应用防火墙,属于硬件级别防火墙（WebApplicationFire
爬虫之隧道代理：如何在爬虫中使用代理IP？ 2401_87251497 python 开发语言爬虫网络 tcp/ip 网络协议
在进行网络爬虫时，使用代理IP是一种常见的方式来绕过网站的反爬虫机制，提高爬取效率和数据质量。本文将详细介绍如何在爬虫中使用隧道代理，包括其原理、优势以及具体的实现方法。无论您是爬虫新手还是有经验的开发者，这篇文章都将为您提供实用的指导。什么是隧道代理？隧道代理是一种高级的代理技术，它通过创建一个加密的隧道，将数据从客户端传输到代理服务器，再由代理服务器转发到目标服务器。这样不仅可以隐藏客户端的真
《女子监狱》系列，Netflix自此走上牛B之路 IMTVS_cc
文|温水排版|不二今天小编要给大家推荐的是让Netflix大方打上“原创剧集”这个牛气标签，也让HBO这些老牌电视网倒吸一口凉气的美剧《女子监狱》。剧集播出后，IMDB得分在9分徘徊，媒体评价持续走高。从收视率及口碑上来看，《女子监狱》是网飞当之无愧的王牌，自上线以来斩获金球奖等重要奖项6次、提名19次，网络话题数不胜数。《女子监狱》的英文原名是“Orangeisthenewblack”，直译过来
吃不了读书的苦，只能吃更多生活的苦海一样的脾气
《少年派》即将大结局，电视也真真实实的还原了高考前学生冲刺的状态，全力以赴的学子们为了上课不瞌睡，自觉站在教室后排听课，课间走廊里走动着背书的人群，看到这些画面我眼睛有些湿润，曾经的高三生活重现眼前，艺术来源于生活而高于生活，演的很好，曾经刻苦学习的同学获得了相应的回报，进入更高更好的学府深造，进而开启不一样的人生，曾经不知学习为何物的同学们，而今也许在用生活的苦偿还曾经的偷过的懒。早几年的时候网
python抓取网页内容401应该用哪个库_python3使用requests模块爬取页面内容入门坂田月半
python的爬虫相关模块有很多，除了requests模块，再如urllib和pycurl以及tornado等。相比而言，requests模块是相对简单易上手的。通过文本，大家可以迅速学会使用python的requests模块爬取页码内容。1.Requests唯一的一个非转基因的PythonHTTP库，人类可以安全享用。官网：http://cn.python-requests.org/zh_CN/
SpringBoot整合ES搜索引擎实现网站热搜词及热度计算码踏云端 springboot Elasticsearch spring boot elasticsearch 后端热搜词热度计算 java
博主简介：历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于
题解 | #完全数计算#不知道为什么没超时的暴力解法 huaxinjiayou java
兄弟们，坚持就是胜利啊，找工作从去年秋招就开始找，到五月底才收到第一个offer星环的，然后六月初t咋六月了还有面试啊，有兄弟了解这个部门吗面完了家人们，纯纯kpi啊，上来就是一道题是打印多个字符串的华为接头人话术指南：欲投华为，必看此贴!引流华为招聘提前批【奖】这个夏天，和牛牛一起打卡刷题~Java面试实战项目25届本科找暑期实习的历程飞猪旅行运营岗面经百度视觉算法一面面经感谢牛友们，腾子pcg
【Python爬虫】百度百科词条内容 PokiFighting 数据处理 python 爬虫开发语言
词条内容我这里随便选取了一个链接，用的是FBI的词条importurllib.requestimporturllib.parsefromlxmlimportetreedefquery(url):headers={'user-agent':'Mozilla/5.0(WindowsNT6.1;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/80.
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

Python爬虫 拉勾网招聘爬取

Python爬虫 拉勾网招聘爬取

文章目录

0、打开搜索页

1、找到职位连接

2、打开职位详情页面，解析职位详情信息

2.1、详情页面解析

2.2 、代码实现

3、将获得数据写入CSV或TXT文件

3.1、求出平均工资

4、数据分析

4.1 工资统计

4.2 工作经验统计

4.3 职位词频描述

4.3.1 读取TXT文件

4.3.2 调用stopword，添加自定义字典和词频统计

4.3.3 词频可视化：词云

邮件发送

其他想法

完整代码

你可能感兴趣的:(Python爬虫 拉勾网招聘爬取)

Python爬虫拉勾网招聘爬取

Python爬虫拉勾网招聘爬取

你可能感兴趣的:(Python爬虫拉勾网招聘爬取)