tbigdipper

一个简单的Ajax加载post请求的爬虫实例)

一个简单的Ajax加载post请求的爬虫实例

内容简介![在这里插入图片描述](https://img-blog.csdnimg.cn/20191023161729301.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDc4MTQ2NA==,size_16,color_FFFFFF,t_70)
爬虫简介
- URL分析
- 请求分析
- 重要代码解释
完整代码

内容简介

上图1是我们学校的校招网站，没有反爬机制，但是是Ajax加载并且是post的请求方式并且需要将上图2信息抓取下来

爬虫简介

URL分析

一、首先分析一级URL：

http://job.cqupt.edu.cn/portal/home/calendar-page.html?fairDate=2019-10-08%2000:00
http://job.cqupt.edu.cn/portal/home/calendar-page.html?fairDate=2019-10-09%2000:00
http://job.cqupt.edu.cn/portal/home/calendar-page.html?fairDate=2019-10-10%2000:00

可以发现变化的只有fairDate中的日期，因此构建URL的时候只需要改变日期就可以了

二、接着分析一下二级URL：

http://job.cqupt.edu.cn/portal/home/special-recruitment-detail.html?level2MenuId=1200&menuId=60&type=1&id=3219

http://job.cqupt.edu.cn/portal/home/special-recruitment-detail.html?level2MenuId=1200&menuId=60&type=1&id=3251

http://job.cqupt.edu.cn/portal/home/special-recruitment-detail.html?level2MenuId=1200&menuId=60&type=1&id=3191

分容易发现改变的只有id这一个元素，但是分析了多个二级URL，还是没有找到id变化规律，因此最后决定直接在网页当中抓取二级URL，但是后来发现这是一个Ajax加载的网页，并且请求的方式为post请求。

请求分析

上图可以发现在第一个网站当中可以直接在源代码中抓取到我们需要构建的二级URL，同时我也发现了这个网址是一个Ajax加载的
如上图，这是一个Ajax加载的，并且为post请求方式，而且在后期发现是由Form Data 改变参数得到的，因此需要在请求的时候用其他的处理方式。

重要代码解释

results = []
    num = 0
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0(Windows NT 10.0;Win64;x64)'
                          + ' AppleWebKit/537.36 (KHTML,like Gecko)'
                          + 'Chrome/73.0.3683.103 Safari/537.36',
        }
        for first_url in first_urls_list:
            response = requests.get(first_url, headers=headers)
            html = etree.HTML(response.text)
            if response.status_code == 200:
                panduan = html.xpath('//ul[@id = "fair-timeline"]/li')
                if panduan:
                    url = first_url  # 赋予网址
                    # 构建请求头
                    for a in range(1, 11, 1):
                        formdata = {
                            "fairDate": '2019-09-25 00:00',
                            "pageIndex": a
                        }
                        data = parse.urlencode(formdata).encode(encoding='UTF8')
                        # 全局取消证书验证
                        ssl._create_default_https_context = ssl._create_unverified_context
                        request = urllib.request.Request(url, data=data, headers=headers)
                        # 返回结果
                        response = urllib.request.urlopen(request).read()
                        # utf-8解码
                        text = response.decode('utf-8', 'ignore')
                        html_text = etree.HTML(text)
                        if panduan:
                            list_makes = html_text.xpath('//h4[@class = "timeline-title"]/a/@href')
                            num = num + len(list_makes)
                            for list_make in list_makes:
                                # list_makes 是界面当中抓取下来的url后缀列表
                                # 这个for循环是给爬取下来的URL加工
                                url_1 = 'http://job.cqupt.edu.cn' + str(list_make)
                                results.append(url_1)
                        else:
                            break
                    print(str(day_info['月份']) + "月" + str(day_info['起始日期']) + "日有发布" + str(num) + "信息")  # 后台输出有反馈
                    day_info['起始日期'] = int(day_info['起始日期']) + 1
                    num = 0 #初始化num参数
                else:
                    print(str(day_info['月份']) + "月" + str(day_info['起始日期']) + '日无发布信息')  # 后台输出无反馈
                    day_info['起始日期'] = int(day_info['起始日期']) + 1
            else:
                print("访问错误主网页错误")
                return None
        return results
    except RequestException:
        return None

上图是我创建二级URL的一个函数，其中

formdata = {
“fairDate”: ‘2019-09-25 00:00’,
“pageIndex”: a
}
data = parse.urlencode(formdata).encode(encoding=‘UTF8’)
# 全局取消证书验证
ssl._create_default_https_context = ssl._create_unverified_context
request = urllib.request.Request(url, data=data, headers=headers)
# 返回结果
response = urllib.request.urlopen(request).read()
# utf-8解码
text = response.decode(‘utf-8’, ‘ignore’)
html_text = etree.HTML(text)

这一个代码块用来处理Ajax加载的post请求，如果对Ajax加载不清楚的可以参考 lPython 解决Ajax动态加载问题(二十六).现在很多的网页都使用了AJAX加载，但是AJAX一般返回的是JSON，直接对AJAX地址进行post或get，就返回JSON数据了。但是需要我们自己写一个请求数据，就比如

formdata = {
“fairDate”: ‘2019-09-25 00:00’,
“pageIndex”: a
}
data = parse.urlencode(formdata).encode(encoding=‘UTF8’)

之后直接获取返回的结果就行了，因为我们学校的这个网站是我们学生自己搭建的，所以我怕证书有问题还取消了证书验证验证。在这个函数当中有一个参数叫做panduan，因为不是每一天都会有公司来学校招聘，因此爬取前进行一个if判断，如果发现panduan为空的话就证明今天没有校招，就直接将这个一级网址抛弃。

    try:
        headers = {
            'User-Agent': 'Mozilla/5.0(Windows NT 10.0;Win64;x64)'
                          + ' AppleWebKit/537.36 (KHTML,like Gecko)'
                          + 'Chrome/73.0.3683.103 Safari/537.36',
        }
        for url_list in url:
            response = requests.get(url_list, headers=headers)
            if response.status_code == 200:
                html = etree.HTML(response.text)
                article_title = html.xpath('//h1[@class = "article_title"]/text()')
                The_company_name = html.xpath('//tr/td[@class = "tl"]/text()')
                place = html.xpath('//tr//td[@class = "tl" and@colspan="2"]/text()')

                results_zhiwei = []
                results_xueyuan = []
                results_zhuanye = []
                results_renshu = []
                results_gangweizhize = []
                results_yaoqiu = []
                results_xinchou = []
                results_leibie = []
                active = True
                while active:
                    for a in range(2, 50, 1):
                        bef = '//table[@class = "page-table" ]//tr['
                        aft_zhiwei = ']//td[1]/text()'
                        aft_xueyuan = ']//td[3]/text()'
                        aft_zhuanye = ']//td[4]/text()'
                        aft_renshu = ']//td[5]/text()'
                        aft_gangweizhize = ']//td[6]/text()'
                        aft_yaoqiu = ']//td[7]/text()'
                        aft_xinchou = ']//td[8]/text()'
                        aft_leibie = ']//td[9]/text()'

                        url_zhiwei = bef + str(a) + aft_zhiwei
                        url_xueyuan = bef + str(a) + aft_xueyuan
                        url_zhuanye = bef + str(a) + aft_zhuanye
                        url_renshu = bef + str(a) + aft_renshu
                        url_gangweizhize = bef + str(a) + aft_gangweizhize
                        url_yaoqiu = bef + str(a) + aft_yaoqiu
                        url_xinchou = bef + str(a) + aft_xinchou
                        url_leibie = bef + str(a) + aft_leibie

                        zhiwei = html.xpath(url_zhiwei)
                        xueyuan = html.xpath(url_xueyuan)
                        zhuanye = html.xpath(url_zhuanye)
                        renshu = html.xpath(url_renshu)
                        gangweizhize = html.xpath(url_gangweizhize)
                        yaoqiu = html.xpath(url_yaoqiu)
                        xinchou = html.xpath(url_xinchou)
                        leibie = html.xpath(url_leibie)

                        results_zhiwei.append(zhiwei)
                        results_xueyuan.append(xueyuan)
                        results_zhuanye.append(zhuanye)
                        results_renshu.append(renshu)
                        results_gangweizhize.append(gangweizhize)
                        results_yaoqiu.append(yaoqiu)
                        results_xinchou.append(xinchou)
                        results_leibie.append(leibie)

                        if zhiwei:
                            pass
                        else:
                            active = False
                            break
                    del results_zhiwei[-1]  #最后一个为空，删除掉
                    del results_xueyuan[-1]  # 最后一个为空，删除掉
                    del results_zhuanye[-1]  # 最后一个为空，删除掉
                    del results_renshu[-1]  # 最后一个为空，删除掉
                    del results_gangweizhize[-1]  # 最后一个为空，删除掉
                    del results_yaoqiu[-1]  # 最后一个为空，删除掉
                    del results_xinchou[-1]  # 最后一个为空，删除掉
                    del results_leibie[-1]  # 最后一个为空，删除掉
                    #print(str(henduo))

                results = {
                    "标题": article_title[0],
                    "公司名字": The_company_name[0],
                    "地点": place[0],
                    "负责老师": place[1],
                    "招聘职位": results_zhiwei,
                    "学院": results_xueyuan,
                    "专业": results_zhuanye,
                    "需求人数": results_renshu,
                    "岗位职责": results_gangweizhize,
                    "专业技能要求": results_yaoqiu,
                    "薪酬": results_xinchou,
                    "职位类别": results_leibie,
                    "详细信息网址": url_list,
                }

                print(results)
            else:
                print("访问失败")
        return results

    except RequestException:
        return None

上面这段代码是我通过上一个代码得到的二级URL进行的一些操作，取得这些子网页当中的我所需要的信息。都是一些常规操作，在这里我同样用了一个叫做zhiwei的参数来判断是由需要接着抓取，因为每一家公司可能同时提供多个职位，每个公司提供的职位个数不同，所以需用通过一个参数告诉计算机，这家公司的已经爬取完啦，你可以开始进行下一个公司的爬取了。

完整代码

import requests
import json
import ssl
import urllib.request
from urllib import parse
from lxml import etree
from requests.exceptions import RequestException

def  make_info(url):
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0(Windows NT 10.0;Win64;x64)'
                          + ' AppleWebKit/537.36 (KHTML,like Gecko)'
                          + 'Chrome/73.0.3683.103 Safari/537.36',
        }
        for url_list in url:
            response = requests.get(url_list, headers=headers)
            if response.status_code == 200:
                html = etree.HTML(response.text)
                article_title = html.xpath('//h1[@class = "article_title"]/text()')
                The_company_name = html.xpath('//tr/td[@class = "tl"]/text()')
                place = html.xpath('//tr//td[@class = "tl" and@colspan="2"]/text()')

                results_zhiwei = []
                results_xueyuan = []
                results_zhuanye = []
                results_renshu = []
                results_gangweizhize = []
                results_yaoqiu = []
                results_xinchou = []
                results_leibie = []
                active = True
                while active:
                    for a in range(2, 50, 1):
                        bef = '//table[@class = "page-table" ]//tr['
                        aft_zhiwei = ']//td[1]/text()'
                        aft_xueyuan = ']//td[3]/text()'
                        aft_zhuanye = ']//td[4]/text()'
                        aft_renshu = ']//td[5]/text()'
                        aft_gangweizhize = ']//td[6]/text()'
                        aft_yaoqiu = ']//td[7]/text()'
                        aft_xinchou = ']//td[8]/text()'
                        aft_leibie = ']//td[9]/text()'

                        url_zhiwei = bef + str(a) + aft_zhiwei
                        url_xueyuan = bef + str(a) + aft_xueyuan
                        url_zhuanye = bef + str(a) + aft_zhuanye
                        url_renshu = bef + str(a) + aft_renshu
                        url_gangweizhize = bef + str(a) + aft_gangweizhize
                        url_yaoqiu = bef + str(a) + aft_yaoqiu
                        url_xinchou = bef + str(a) + aft_xinchou
                        url_leibie = bef + str(a) + aft_leibie

                        zhiwei = html.xpath(url_zhiwei)
                        xueyuan = html.xpath(url_xueyuan)
                        zhuanye = html.xpath(url_zhuanye)
                        renshu = html.xpath(url_renshu)
                        gangweizhize = html.xpath(url_gangweizhize)
                        yaoqiu = html.xpath(url_yaoqiu)
                        xinchou = html.xpath(url_xinchou)
                        leibie = html.xpath(url_leibie)

                        results_zhiwei.append(zhiwei)
                        results_xueyuan.append(xueyuan)
                        results_zhuanye.append(zhuanye)
                        results_renshu.append(renshu)
                        results_gangweizhize.append(gangweizhize)
                        results_yaoqiu.append(yaoqiu)
                        results_xinchou.append(xinchou)
                        results_leibie.append(leibie)

                        if zhiwei:
                            pass
                        else:
                            active = False
                            break
                    del results_zhiwei[-1]  #最后一个为空，删除掉
                    del results_xueyuan[-1]  # 最后一个为空，删除掉
                    del results_zhuanye[-1]  # 最后一个为空，删除掉
                    del results_renshu[-1]  # 最后一个为空，删除掉
                    del results_gangweizhize[-1]  # 最后一个为空，删除掉
                    del results_yaoqiu[-1]  # 最后一个为空，删除掉
                    del results_xinchou[-1]  # 最后一个为空，删除掉
                    del results_leibie[-1]  # 最后一个为空，删除掉
                    #print(str(henduo))

                results = {
                    "标题": article_title[0],
                    "公司名字": The_company_name[0],
                    "地点": place[0],
                    "负责老师": place[1],
                    "招聘职位": results_zhiwei,
                    "学院": results_xueyuan,
                    "专业": results_zhuanye,
                    "需求人数": results_renshu,
                    "岗位职责": results_gangweizhize,
                    "专业技能要求": results_yaoqiu,
                    "薪酬": results_xinchou,
                    "职位类别": results_leibie,
                    "详细信息网址": url_list,
                }

                print(results)
            else:
                print("访问失败")
        return results

    except RequestException:
        return None

def make_main_URL():
    the_mon = input("输入需要查询的月份:")
    start_day = input("输入需要查询的起始日期:")
    finish_day = input("请输入需要查询的结束日期:")
    text_1 = int(finish_day)
    text_2 = text_1 + 1  # 结束日期+1 不然在循环时会少循环一次
    day_info = {
        "月份": the_mon,
        "起始日期": start_day
    }
    first_urls_list = []
    if start_day == finish_day:
        befor_url = 'http://job.cqupt.edu.cn/portal/home/calendar-page.html?fairDate=2019'
        after_url = '%2000:00'
        first_urls_list = []
        first_url = befor_url + '-' + the_mon + '-' + str(start_day) + after_url
        first_urls_list.append(first_url)
        url = make_all_URL(first_urls_list, day_info)
        make_info(url)

    else:
        # first_urls_list 是第一个URL及有20个子网页的URL
        for x in range(int(start_day), text_2, 1):
            befor_url = 'http://job.cqupt.edu.cn/portal/home/calendar-page.html?fairDate=2019'
            after_url = '%2000:00'
            first_urls = befor_url + '-' + the_mon + '-' + str(x) + after_url
            first_urls_list.append(first_urls)
        url = make_all_URL(first_urls_list, day_info)
        make_info(url)

def make_all_URL(first_urls_list, day_info):
    # 通过传输进来的URL列表生成每一个URL里面的子URL及公司校招详细信息网
    # return位置不对 导致输出无发布有些有有些没有。貌似return后该函数就不执行下面的了
    results = []
    num = 0
    try:
        headers = {
            'User-Agent': 'Mozilla/5.0(Windows NT 10.0;Win64;x64)'
                          + ' AppleWebKit/537.36 (KHTML,like Gecko)'
                          + 'Chrome/73.0.3683.103 Safari/537.36',
        }
        for first_url in first_urls_list:
            response = requests.get(first_url, headers=headers)
            html = etree.HTML(response.text)
            if response.status_code == 200:
                panduan = html.xpath('//ul[@id = "fair-timeline"]/li')
                if panduan:
                    url = first_url  # 赋予网址
                    # 构建请求头
                    for a in range(1, 11, 1):
                        formdata = {
                            "fairDate": '2019-09-25 00:00',
                            "pageIndex": a
                        }
                        data = parse.urlencode(formdata).encode(encoding='UTF8')
                        # 全局取消证书验证
                        ssl._create_default_https_context = ssl._create_unverified_context
                        request = urllib.request.Request(url, data=data, headers=headers)
                        # 返回结果
                        response = urllib.request.urlopen(request).read()
                        # utf-8解码
                        text = response.decode('utf-8', 'ignore')
                        html_text = etree.HTML(text)
                        if panduan:
                            list_makes = html_text.xpath('//h4[@class = "timeline-title"]/a/@href')
                            num = num + len(list_makes)
                            for list_make in list_makes:
                                # list_makes 是界面当中抓取下来的url后缀列表
                                # 这个for循环是给爬取下来的URL加工
                                url_1 = 'http://job.cqupt.edu.cn' + str(list_make)
                                results.append(url_1)
                        else:
                            break
                    #num = num + len(results)
                    print(str(day_info['月份']) + "月" + str(day_info['起始日期']) + "日有发布" + str(num) + "信息")  # 后台输出有反馈
                    day_info['起始日期'] = int(day_info['起始日期']) + 1
                    num = 0 #初始化num参数
                else:
                    print(str(day_info['月份']) + "月" + str(day_info['起始日期']) + '日无发布信息')  # 后台输出无反馈
                    day_info['起始日期'] = int(day_info['起始日期']) + 1
            else:
                print("访问错误主网页错误")
                return None
        return results
    except RequestException:
        return None

if __name__ == '__main__':
    make_main_URL()
    print("爬取完毕")

2022年4月23日《儿童纪律教育》开心心心心心
胡开心春蕾八幼孩子情绪发生变化时，家长要多关注孩子的具体情况，比如看孩子是否采取某些暴力的行为或者过激的行为等，但是不能溺爱孩子。要及时和孩子进行语言交流以及身体上的安慰，但是不能一味地满足孩子不当的要求，否则会造成孩子情绪变化更加剧烈；家长要平心静气地了解孩子发脾气的原因，并表示理解孩子发脾气的出发点。同时要将孩子放在平等的位置帮助其分析事情的利弊，教会孩子如何多角度看待问题。不要纵容孩子随意乱
关于虚伪和真实 Lehtinen雨小田
有一次疗愈班上，一个母亲带着她20岁的女儿来复训。女儿是刚刚做完个案，正在走出抑郁症的状态。几天的训练下来，我感受到了妈妈身上的状态和问题，在一次分享中我说了句“我觉得妈妈很虚伪。”说完我就后悔了（当时刚入行资质太浅，说话太直接，有些心灵脆弱的人是无法突然接受真相的），也看到了她眼里的惊讶，然后是黯淡。最后一天结束时，这个妈妈绷不住了，终于哭了出来，她说我说她虚伪，她很难过，她从来都待人真诚，没有
python网络爬虫(第一章/共三章：网络爬虫库、robots.txt规则（防止犯法）、查看获取网页源代码)
python网络爬虫(第一章/共三章：网络爬虫库、robots.txt规则（防止犯法）、查看获取网页源代码)学习python网络爬虫的完整路径：（第一章即此篇文章）（第二章）python网络爬虫(第二章/共三章：安装浏览器驱动，驱动浏览器加载网页、批量下载资源)-CSDN博客https://blog.csdn.net/2302_78022640/article/details/149431071?
《情商3.0》折页一RIA 顽伴高振裕
R：I：每个人每天都需要感受一下自己的情绪，分析一下情绪的来源，这样才能更好的链接自己。如果不去感受自己情绪，身体也可能会出现问题，比如焦虑不安、头痛等。所以要后天的培养自我意识，寻找更深层次的自己。A1：之前的工作强度很大，也不懂放权，很多事情觉得别人做得不好，就自己解决自己上。结果很少有自己的时间，晚上又特别多应酬。很长一段时间都是很暴躁的状态。有时候想想，为什么会这样？这不是我希望的我，一直
封装---统一处理接口与打印错误信息寻觅~流光封装工具前端 javascript 开发语言 typescript
一.简介我在重构代码时突然想到一个想法并实现出来:封装一个统一处理接口与打印错误信息,控制显示错误信息在控制台,接口请求时loading效果展示等等这个只是个人想法,而且比较简略,不太清楚实际工作是否这样写,但是我认为只要有这个想法就要去实现,总比没实现好,欢迎大家的建议与指导介绍我在项目中如何封装一个统一的API请求函数，解决每个接口都要写try...catch的繁琐问题，并实现自动错误日志、t
Xcode9.2 编译在iOS8.1 以下版本图片显示异常 iOS收藏家
问题截图.png问题排查前一段时间看到运营反馈了一个图片显示成这样的问题，我们开发看了之后也是一脸的懵（bi）啊。因为之前修改需求并没有这个地方的需求变更，而且我们在自己的开发测试机上都是没有出现类似的问题。我们联系了一下出现这个问题的用户，问清楚了手机的系统版本和我们app的版本。我们用同样的app版本在其他手机上运行都没有这样的问题，然后猜测是iOS系统的版本。我们运行在8.1系统的模拟机上然
CentOS 连接wifi Vekaco
查看是否需要安装固件大多无线网卡还需要固件。内核一般会自动探测并加载两者，如果您得到类似SIOCSIFFLAGS:Nosuchfileordirectory的输出，意味着您得手动加载固件。若不确定，用dmesg查询内核日志，看看有没有来自无线网卡的固件请求，命令如下：dmesg|grepfirmware查看无线网口iwdevInterface后面即为无线网络接口的名称，也可通过ip命令进行查看。i
macOS 字体管理全攻略：如何查看已安装字体及常见字体格式区
macOS字体管理全攻略：如何查看已安装字体及常见字体格式区别在设计、开发、排版或日常使用中，我们常常会遇到字体相关的问题，比如：我系统中有哪些可用字体？字体.ttf、.otf、.ttc有什么区别？如何查看或安装新字体？本文将系统性地整理在macOS下查看字体的方法，以及常见字体格式的区别与使用建议，帮助你更好地管理和选择字体。一、如何查看macOS已安装的字体✅方法1：使用「字体册」App（推荐
Redis分布式锁深度剖析：从原理到高可用实践 JouJz redis 分布式 wpf
Redis分布式锁深度剖析：从原理到高可用实践引言：分布式环境下的锁之殇在分布式系统中，共享资源互斥访问是保证数据一致性的核心挑战。传统单机锁（如synchronized）在跨进程场景下完全失效，这就是分布式锁的用武之地。Redis凭借其高性能、原子操作等特性，成为实现分布式锁的主流方案。本文将深入解析Redis分布式锁的实现原理、典型问题及工业级解决方案。一、分布式锁的本质要求1.1必须满足的核
为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
【LeetCode 热题 100】24. 两两交换链表中的节点——（解法一）迭代+哨兵 xumistore LeetCode leetcode 链表算法 java
Problem:24.两两交换链表中的节点题目：给你一个链表，两两交换其中相邻的节点，并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题（即，只能进行节点交换）。文章目录整体思路完整代码时空复杂度时间复杂度：O(N)空间复杂度：O(1)整体思路这段代码旨在解决一个经典的链表操作问题：两两交换链表中的节点(SwapNodesinPairs)。问题要求将链表中每两个相邻的节点进行交换
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
《分片终章的哈希裂痕：藏在数据拼接里的隐形逻辑》前端
在大文件分片传输里，有一个令人费解的现象：当所有分片的校验都显示正常，拼接后的整体文件却与源文件的哈希值不符，而问题往往精准地指向最后一片。这并非偶然的技术故障，而是数据传输链条中多重隐形逻辑交织的必然结果，如同钟表的齿轮在最后一圈突然出现难以察觉的错位。文件被切割成固定大小的分片时，最后一片往往是规则的例外。它如同拼图中形状特异的收尾piece，尺寸可能小于其他分片，却承担着衔接整体的关键作用。
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
docker安装node部分问题自律的蜗牛 docker 容器 node.js
sudonlatestsudo:n:commandnotfound如果运行sudonlatest时出现：sudo:n:commandnotfound说明n版本管理工具未安装或未添加到PATH环境变量。解决方案1️⃣先检查n是否已安装运行：whichn或者：command-vn如果有输出/usr/local/bin/n，说明n已安装，但可能需要sudo访问。如果没有任何输出，说明n没有安装，跳到方法
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
前端 NPM 包的依赖可视化分析工具推荐前端视界前端艺匠馆前端 npm arcgis ai
前端NPM包的依赖可视化分析工具推荐关键词：NPM、依赖管理、可视化分析、前端工程、包管理、依赖冲突、性能优化摘要：本文将深入探讨前端开发中NPM包依赖可视化分析的重要性，介绍5款主流工具的使用方法和特点，并通过实际案例展示如何利用这些工具优化项目依赖结构、解决版本冲突问题以及提升构建性能。文章将帮助开发者更好地理解和掌控项目依赖关系，提高开发效率和项目可维护性。背景介绍目的和范围本文旨在为前端开
cesium添加原生MVT矢量瓦片方案 zhu_zhu_xia cesium vue arcgis cesium webgl javascript
项目中需要基于cesium接入mvt格式的服务并支持属性拾取查询，通过一系列预研测试，最后选择cesium-mvt-imagery-provider开源插件完成，关键源码信息如下：npmicesiumcesium-mvt-imagery-provider//安装依赖包//加载图层importCesiumMVTImageryProviderfrom"cesium-mvt-imagery-provid
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc