沙漏在下雨

深夜爬虫，我很抱歉，附微信 “ 网抑云” 公众号爬虫教程!

最近真的是被 网抑云 这个梗刷爆了，到处都是，生而为人，我很抱歉，哈哈哈，碰巧最近学习了一波微信公众号的爬取方式，想试一试，特地在此献丑了。我是沙漏，不定期更新爬虫教学，其余时间学java和linux中。八月，继续加油。

文章目录

资料参考：
工具：
打开fiddle，开始抓包
构造基本参数：
请求网址，通过json包，分割出标题和网址：
读入本地文件，下载html，转换pdf
打开pdf，深夜了，打开 '网抑云' 。
全部代码：

关注我哟！！！

资料参考：

7月微信爬虫
本篇博客，基于她的思想之中，改编于我自己，我自己动手敲了一下，发现还是存在很大的不同，也是存在一点问题的，所以这篇博客，我用我自己的话讲一下这次爬虫的思路，用简单的话说明白。

工具：

抓包工具 Fiddle 官网下载，有点慢
第三方包:

import requests
import json
from urllib.parse import urlencode
import pdfkit
# wkhtmltopdf  github : https://github.com/JazzCore/python-pdfkit/wiki/Installing-wkhtmltopdf
import os
import warnings  # 关闭警告

关于pdfkit 这是一个三方库，它可以将html转换为pdf 或者 image 图像，他需要一个软件的支持，就是wkhtmltopdf wkhtmltopdf官网说一下，官网我下了半小时都没动一下，不知道是不是我个人原因，推荐还是去第三方网站随便下一个，绝对比这个快！

下载之后，在 bin 目录下可以看到 wkhtmltopdf.exe 这个工具，先记下路径，后面需要用到。

打开fiddle，开始抓包

关于fiddle的基础配置，在下载的时候，都会提到，这里就不提了。
打开fiddle 随意打开一个微信公众号。往下拖动微信下拉条，让他加载更多文章，就像这样。

微信公众号的包很好分别的，主要他是一个json包，而且通过网址我们也可以很好的认出来，这张截图上注意的点我都标出来了。

其实这也可以理解成一个ajax请求吧，我们只要构造一个字典参数加入，就可以构造成一个请求网址，这样就可以实现多页爬取了。原理我觉得差不多，主要还是构造参数 params 的甄别了，这个很重要，有些参数没构造成功就不能正确的访问进去。
关于ajax的我也写了一篇博客，可以进去看看 = =
女生勿扰，只适合男孩子的python爬虫，里面东西不给钱统统白送。
博主其他文章

那下面我们就开始编写爬虫吧！

构造基本参数：

一般我们所讲的基本参数也就是浏览器的请求头，还有一些请求参数， cookies之类的，这里额外加一个请求参数params ，看代码：
图方便，这里也可以先构造一个文件 to_pdf
to_pdf.py

# -*- coding :  utf-8 -*-
# @Time      :  2020/8/6  18:31
# @author    :  沙漏在下雨
# @Software  :  PyCharm
# @CSDN      :  https://me.csdn.net/qq_45906219
## to_pdf.py

# 目标公众号标识
biz = 'MzA4NDQwMTczOA=='
# 微信登录后的一些标识参数
pass_ticket = 'DdDXKrOnQztW4p81Nm3nRQQ/EAFMCDz5MZO5KeBYdedjaZPH4nLFHL2LWE1uxHVJ'
appmsg_token = '1073_tnlzQTEqvlr9EgXQdC6zALGHfcJw4By9Bx69bQ~~'
uin = 'Mzc2MDg4MzgxNA=='
key = '360754e56e033319af5321321189d5b230b2bfe570313f76e4ed2ef0cd8a1fcfd087786d9da1d826ed30da55f477215359ba761e2a2af5f92213b05c17d89153631a537e35fc91f6d7fb3009e7113958'
# 安装的wkhtmltopdf.exe文件路径  这个是保存为pdf的 其实他还有保存为文件
wkhtmltopdf_path = r'D:\wkhtmltox\wkhtmltopdf\bin\wkhtmltopdf.exe'

上面提到一些 biz , passticket 之类参数的，我们可以在这里看到。

    def __init__(self):
        """spider the wxChat station"""
        self.session = requests.session()
        self.offset = 0  # 偏移量 
        self.json_name = 'wxChat.json'  # 保存json文件名
        self.down_path = 'D:/wxChatPDF/'  # 下载地址
        self.__initGetBaseData()
    def __initGetBaseData(self):
        """
        input some BaseParams about the requests session
        """
        self.headers = {
            'Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.5;q=0.4',
            "User-Agent": 这个太长了，在fiddle上面直接复制就可以
            'X-Requested-With': 'XMLHttpRequest'
        }
        self.cookies = {
            'wxtokenkey': '777',
            "wxuin": "3760883814",
            "devicetype": "android - 29",
            "version": "27000",
            "lang": "zh_CN",
            "pass_ticket": to_pdf.pass_ticket,
            "wap_sid2": "COaQqoEOElxramROblROTTRtTktEa29yU3drdExUODg4RjZCaVVsX3lycHV0VUJ"
                        "3aWtmMl9xNDlJVFN0YTZJY0NxdzZsTXdfaHJxMmZyTTRUZGlGdTZHNVEtNzh5REVFQUFBfjDDsK / 5BTgNQJVO"

        }
        self.profile_url = "https://mp.weixin.qq.com/mp/profile_ext?"
        self.session.headers.update(self.headers)  # 更新headers
        self.session.cookies.update(self.cookies)  # 更新cookies
        self.params = {
            'action': 'getmsg',
            '__biz': to_pdf.biz,
            'f': 'json',
            'offset': '10',  # 若需要多页爬取， 构造 : str(self.offset)
            'count': '10',
            'is_ok': '1',
            'scene': '124',
            'uin': to_pdf.uin,
            'key': to_pdf.key,  # 这个好像二十分钟就会失效， 需要隔段时间更换
            'pass_ticket': to_pdf.pass_ticket,
            'wxtoken': '',
            'appmsg_token': to_pdf.appmsg_token,
            'x5': '0',

        }

这里讲一下 self.profile_url 这个参数，我们在fiddle上面获得的网址是很长的一段，其实只要卡到？这里就可以了，可以试试的。

请求网址，通过json包，分割出标题和网址：

上面我们构造了一些参数，然后就可以正常的请求网址了，如下：

 def run(self):
        """提取出标题和网址，
        保存到json包 然后下载转换为Pdf"""
        items = {}
        for jsons in self.get_json():
            json_list = jsons.get('general_msg_list')
            json_list = json.loads(json_list)  # 转换为json 类型
            json_list1 = json_list.get('list')
            for json_one in json_list1:
                # 遍历这个列表字典  先解析最外层标题和网址
                json_list_info = json_one.get('app_msg_ext_info')
                title = json_list_info.get('title')
                content_url = json_list_info.get('content_url')
                items[title] = content_url  # 装入字典
                json_list_info1 = json_list_info.get('multi_app_msg_item_list')
                for json_two in json_list_info1:  # 解析第二层标题和网址
                    title2 = json_two.get('title')
                    content_url2 = json_two.get('content_url')
                    items[title2] = content_url2
        # 转换字典类型
        items_json = json.dump(items, ensure_ascii=False, indent=4,
                               fp=self.json_name)  # ensure_ascii=False(输出中文)， indent=4(缩进为4)
        # 先写入文件，避免占用太多内存消耗
        with open(self.json_name, 'a+', encoding='utf-8') as fw:
            fw.write(items_json)
            print('dump the wxChat.json is successful!')
        # 下载ok之后， 就开始下载
        self.down()

    def get_json(self):
        """得到所有文章的链接
        构造一个office偏移量 不断的请求构造网址 分析Json包
        """
        print('【ps】 spider the wxChart is starting!')
        for i in range(1, 2):
            print(f'The SpiderDemo is spider doing {i} pages')
            # self.offset += 10 * i  # 开启这个 表示 多页爬取
            # 对比了很多次 构造网址 和 原网址 还是有很多的区别 在这里改一改才能正确的成功
            self.profile_url += (urlencode(self.params) + '&f=json HTTP/1.1')
            self.profile_url = self.profile_url.replace('%3D%3D&f=json', '==&f=json', 1)
            r = self.session.get(self.profile_url, verify=False)
            yield r.json()

这里发现了一个很大的问题，不管是在 get() 里面构造字典，还是先构造字典，都发现我不能正确的获取到数据，最后打印了一下构造网址，发现存在很大问题。

我构造的
https://mp.weixin.qq.com/mp/profile_ext?action=getmsg&__biz=MzA4NDQwMTczOA%3D%3D&f=json&offset=10&count=10&is_ok=1&scene=124&uin=Mzc2MDg4MzgxNA%3D%3D&key=9a979acccbefb6032e6ea1a3ed3fbe82a67e7244eb884c9b4fd497550577b4c57f82cb7c0998ef8dc91cf1dca069ca16fe8cce902f238a72294726745094a68c5efb99f91df5e2592c7540ec90d5b09b&pass_ticket=DdDXKrOnQztW4p81Nm3nRQQ%2FEAFMCDz5MZO5KeBYdedjaZPH4nLFHL2LWE1uxHVJ&wxtoken=&appmsg_token=1073_tnlzQTEqvlr9EgXQdC6zALGHfcJw4By9Bx69bQ~~&x5=0&f=json

从fiddle上面复制的
https://mp.weixin.qq.com/mp/profile_ext?action=getmsg&__biz=MzA4NDQwMTczOA==&f=json&offset=10&count=10&is_ok=1&scene=124&uin=Mzc2MDg4MzgxNA%3D%3D&key=9a979acccbefb6032e6ea1a3ed3fbe82a67e7244eb884c9b4fd497550577b4c57f82cb7c0998ef8dc91cf1dca069ca16fe8cce902f238a72294726745094a68c5efb99f91df5e2592c7540ec90d5b09b&pass_ticket=D2Ir2BvSw4lli9ZReGdqnsFacl0N6Lnpmj9h4EE4CBdqV7cd7co7eRRnOBO4EsG%2F&wxtoken=&appmsg_token=1073_o%252FrQqQ5kpRJZNWMKabr8tLelugCSKx8mIN5IGQ~~&x5=0&f=json HTTP/1.1

对比了一下，发现我自己的url 第一个 == 变成了 %3D%3D , 后缀也少了很多。然后进行了修改，最后成功进入了。
如下：

self.profile_url += (urlencode(self.params) + '&f=json HTTP/1.1')
self.profile_url = self.profile_url.replace('%3D%3D&f=json', '==&f=json', 1)

上面的代码包括很多json的拆分，这个我推荐一个网址，很好用。

可以在线解析 json 包，在线解析json

读入本地文件，下载html，转换pdf

上面我们代码中讲到，为了减少内存的占用，我把文件先保存到本地了，那么现在就可以直接读取本地文件，代码如下：

 def pathisok(self, path):
        """判断目录是否存在， 不存在就创建 进入文件"""
        if not os.path.exists(self.down_path):
            os.mkdir(self.down_path)

    def down(self):
        """
        打开json包，根据标题，网址开始下载，
        爬取之后保存的格式可以很多种，这里我使用一下之前学到的一个新工具 to_pdf
        将网页转换为html页面
        """
        self.pathisok(self.down_path)
        with open(self.json_name, 'r', encoding='utf-8') as fr:
            for index in fr:
                if ':' in index:  # 判断是否是不是标题和网址
                    title = index.strip().split(':')[0]
                    url = ''.join(index.strip().split(':')[1:]).strip(',')
                    # 对网址进一步处理
                    url = url.replace('http', 'https:')
                    # 如果不修改文件名称 一定会报错 OsError的错误 找了很久
                    title = title.replace('\\', '').replace('/', '').replace(':', '').replace('：', '') \
                        .replace('*', '').replace('?', '').replace('？', '').replace('“', '') \
                        .replace('"', '').replace('<', '').replace('>', '').replace('|', '_')
                    print('- ' * 40)
                    print(f'The title is {title} starting spider')
                    print('- ' * 40)
                    # print(os.path.join(self.down_path, title + '.pdf'))
                    pdfkit.from_url(url, os.path.join(self.down_path, title + '.pdf'),
                                    configuration=pdfkit.configuration(wkhtmltopdf=to_pdf.wkhtmltopdf_path))
                    # pdfkit.from_url(value, os.path.join(self.savedir, key + '.pdf'),
                    #                 configuration=pdfkit.configuration(wkhtmltopdf=self.cfg.wkhtmltopdf_path))
                    print('- ' * 40)
                    print(f'The title is {title} spider is successful')
                    print('- ' * 40)
                else:
                    pass

这里要注意一点的，关于文件的名称，有的时候爬虫我们给文件起名称不会在意很多细节，如果文件名中有特殊符号，或者其他不允许的符号，那么创建文件或者目录就会报错，大致就是IOError 之类的错误了。所以我们需要对 Title 进行再一次的修改，确保不会出现问题。

打开pdf，深夜了，打开 ‘网抑云’ 。

好了，这就是本次爬虫的全部过程了，说实话，看其他的文章也会让自己学到很多，在此多谢 北海以北的等待，没有关注我的，可以点个关注哟。

全部代码：

# -*- coding :  utf-8 -*-
# @Time      :  2020/8/6  17:00
# @author    :  沙漏在下雨
# @Software  :  PyCharm
# @CSDN      :  https://me.csdn.net/qq_45906219
import requests
import json
from urllib.parse import urlencode
import pdfkit
# wkhtmltopdf  github : https://github.com/JazzCore/python-pdfkit/wiki/Installing-wkhtmltopdf
import os
import warnings

warnings.filterwarnings('ignore')


class wxChatSpider(object):
    def __init__(self):
        """spider the wxChat station"""
        self.session = requests.session()
        self.offset = 0
        self.json_name = 'wxChat.json'
        self.down_path = 'D:/wxChatPDF/'  # 下载地址
        self.__initGetBaseData()

    def run(self):
        """提取出标题和网址，
        保存到json包 然后下载转换为Pdf"""
        items = {}
        for jsons in self.get_json():
            json_list = jsons.get('general_msg_list')
            json_list = json.loads(json_list)  # 转换为json 类型
            json_list1 = json_list.get('list')
            for json_one in json_list1:
                # 遍历这个列表字典  先解析最外层标题和网址
                json_list_info = json_one.get('app_msg_ext_info')
                title = json_list_info.get('title')
                content_url = json_list_info.get('content_url')
                items[title] = content_url  # 装入字典
                json_list_info1 = json_list_info.get('multi_app_msg_item_list')
                for json_two in json_list_info1:  # 解析第二层标题和网址
                    title2 = json_two.get('title')
                    content_url2 = json_two.get('content_url')
                    items[title2] = content_url2
        # 转换字典类型
        items_json = json.dump(items, ensure_ascii=False, indent=4,
                               fp=self.json_name)  # ensure_ascii=False(输出中文)， indent=4(缩进为4)
        # 先写入文件，避免占用太多内存消耗
        with open(self.json_name, 'a+', encoding='utf-8') as fw:
            fw.write(items_json)
            print('dump the wxChat.json is successful!')
        # 下载ok之后， 就开始下载
        self.down()

    def get_json(self):
        """得到所有文章的链接
        构造一个office偏移量 不断的请求构造网址 分析Json包
        """
        print('【ps】 spider the wxChart is starting!')
        for i in range(1, 2):
            print(f'The SpiderDemo is spider doing {i} pages')
            # self.offset += 10 * i  # 开启这个 表示 多页爬取
            # 对比了很多次 构造网址 和 原网址 还是有很多的区别 在这里改一改才能正确的成功
            self.profile_url += (urlencode(self.params) + '&f=json HTTP/1.1')
            self.profile_url = self.profile_url.replace('%3D%3D&f=json', '==&f=json', 1)
            r = self.session.get(self.profile_url, verify=False)
            yield r.json()

    def pathisok(self, path):
        """判断目录是否存在， 不存在就创建 进入文件"""
        if not os.path.exists(self.down_path):
            os.mkdir(self.down_path)

    def down(self):
        """
        打开json包，根据标题，网址开始下载，
        爬取之后保存的格式可以很多种，这里我使用一下之前学到的一个新工具 to_pdf
        将网页转换为html页面
        """
        self.pathisok(self.down_path)
        with open(self.json_name, 'r', encoding='utf-8') as fr:
            for index in fr:
                if ':' in index:  # 判断是否是不是标题和网址
                    title = index.strip().split(':')[0]
                    url = ''.join(index.strip().split(':')[1:]).strip(',')
                    # 对网址进一步处理
                    url = url.replace('http', 'https:')
                    # 如果不修改文件名称 一定会报错 OsError的错误 找了很久
                    title = title.replace('\\', '').replace('/', '').replace(':', '').replace('：', '') \
                        .replace('*', '').replace('?', '').replace('？', '').replace('“', '') \
                        .replace('"', '').replace('<', '').replace('>', '').replace('|', '_')
                    print('- ' * 40)
                    print(f'The title is {title} starting spider')
                    print('- ' * 40)
                    # print(os.path.join(self.down_path, title + '.pdf'))
                    pdfkit.from_url(url, os.path.join(self.down_path, title + '.pdf'),
                                    configuration=pdfkit.configuration(wkhtmltopdf=to_pdf.wkhtmltopdf_path))
                    # pdfkit.from_url(value, os.path.join(self.savedir, key + '.pdf'),
                    #                 configuration=pdfkit.configuration(wkhtmltopdf=self.cfg.wkhtmltopdf_path))
                    print('- ' * 40)
                    print(f'The title is {title} spider is successful')
                    print('- ' * 40)
                else:
                    pass

    def __initGetBaseData(self):
        """
        input some BaseParams about the requests session
        """
        self.headers = {
            'Accept-Language': 'zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.5;q=0.4',
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36"
                          " (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36 QBCore/4.0.1301.400 "
                          "QQBrowser/9.0.2524.400 Mozilla/5.0 (Windows NT 6.1; WOW64)"
                          " AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2875.116"
                          " Safari/537.36 NetType/WIFI MicroMessenger/7.0.5 WindowsWechat",
            'X-Requested-With': 'XMLHttpRequest'
        }
        self.cookies = {
            'wxtokenkey': '777',
            "wxuin": "3760883814",
            "devicetype": "android - 29",
            "version": "27000",
            "lang": "zh_CN",
            "pass_ticket": to_pdf.pass_ticket,
            "wap_sid2": "COaQqoEOElxramROblROTTRtTktEa29yU3drdExUODg4RjZCaVVsX3lycHV0VUJ"
                        "3aWtmMl9xNDlJVFN0YTZJY0NxdzZsTXdfaHJxMmZyTTRUZGlGdTZHNVEtNzh5REVFQUFBfjDDsK / 5BTgNQJVO"

        }
        self.profile_url = "https://mp.weixin.qq.com/mp/profile_ext?"
        self.session.headers.update(self.headers)  # 更新headers
        self.session.cookies.update(self.cookies)  # 更新cookies
        self.saveDir = 'D:/wxChatSpider'
        self.params = {
            'action': 'getmsg',
            '__biz': to_pdf.biz,
            'f': 'json',
            'offset': '10',  # 若需要多页爬取， 构造 : str(self.offset)
            'count': '10',
            'is_ok': '1',
            'scene': '124',
            'uin': to_pdf.uin,
            'key': to_pdf.key,  # 这个好像二十分钟就会失效， 需要隔段时间更换
            'pass_ticket': to_pdf.pass_ticket,
            'wxtoken': '',
            'appmsg_token': to_pdf.appmsg_token,
            'x5': '0',

        }


if __name__ == '__main__':
    import to_pdf

    # 里面是第三方库的配置， 以及一些微信公众号的参数
    spider = wxChatSpider()
    spider.run()

Python之JSON数据结构 CL.LIANG python基础 python json 数据结构
JSON数据结构介绍JSON（JavaScriptObjectNotation）优势：1.易于阅读和编写JSON的结构直观、简单，类似于键值对的形式，易于人类阅读和编写。与XML等数据格式相比，JSON的语法更简洁，没有复杂的标记符号。2.轻量化JSON格式相比其他数据格式（如XML），更简洁，没有多余的标记，数据体积较小，这使得数据传输更加高效，尤其是在网络应用中。3.与JavaScript天然
基于Python的天气数据可视化平台 q.q 1102255374 python 信息可视化开发语言
摘要：随着社会多元化的不断发展，天气数据问题不可被简单的理解为是科学问题，更多的是环境问题，可以直接影响到人民的日常生活，甚至对一个国家的政治经济带来影响，由此可见，天气预测是一项非常重要的行业。基于此，我们就需要开发一个可视化的、综合的、方便人们查看的项目。基于Python的天气数据可视化设计与实现，通过使用基于Python的网络爬虫技术,能在短时内提取有价值的信息数据。然后根据数据的形式进行整
华为OD机试E卷 --连续字母长度--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 java python 华为od javascript c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述给定一个字符串，只包含大写字母，求在包含同一字母的子串中，长度第k长的子串的长度，相同字母只取最长的那个子串。输入描述第一行有一个子串(1<长度<=100)，只包含大写字母。第二行为k的值输出描述输出连续出现次数第k多的字母的次数。用例输入AAAAHHHBBCDHHHH3输出
【Flask】以一种访问权限不允许的方式做了一个访问套接字的尝试。ERROR conda.cli.main_run:execute(49): `conda run python 1.py` fail HEX9CF Flask python flask conda
问题描述当尝试启动Flask程序时，出现了启动失败的情况。fromflaskimportFlaskapp=Flask(__name__)@app.route('index.php')defhello():return"Helloworld"if__name__=='__main__':app.run(host='127.0.0.1',port=80)并给出了如下错误提示：*ServingFlask
Python3 字典：解锁高效数据存储的钥匙李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享编程实战趣味编程编程技巧
Python3字典：解锁高效数据存储的钥匙内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助读
Python 深度学习实战：生成对抗网络 AI天才研究院深度学习实战 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍生成对抗网络（GenerativeAdversarialNetwork，GAN）是近年来较火热的深度学习模型之一，其在图像合成、视频生成、文本数据生成等领域均取得了不俗的效果。与传统的机器学习模型不同，GAN可以生成真实有效的数据，无需人工标注数据。它由两部分组成：生成器（Generator）和判别器（Discriminator）。生成器通过学习，根据噪声或随机变量（latentvar
(c/c++)——C++和python的异常处理想要躺平的一枚 C++python c语言 c++
目录一、C++的异常处理二、python的异常处理——自定义异常一、C++的异常处理C++中选择用throw来抛出异常，catch来捕捉异常和处理try{//可能发生异常的语句//throw异常对象}catch(类型1){//发生类型1异常时的处理代码}catch(类型2){//发生类型2异常时的处理代码}catch(...){//不管什么异常，都在这里统一处理。}throw抛出异常对象，异常对象
【自动化】使用PlayWright+代理IP实现多环境隔离青塬科技 Python
Playwright是由微软公司2020年初发布的新一代自动化测试工具，相较于目前最常用的Selenium，它仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作。对各种开发语言也有非常好的支持。常用的NodeJs、Java、python都有支持，且有丰富的文档参考。Python环境下的安装使用1、安装依赖库pipinstallplaywright2、安装
python3.10运行moviepy失败 fendouweiqian Python python
运行异常：Nomodulenamed‘moviepy.editor’python版本为：3.10.12修复方案：pipuninstallmoviepypipinstallmoviepy==1.0.3
ROS VScode 使用笔记 zhanglianzhao 机器人技术基础 c++vscode
ROSVScode使用笔记编译快捷方式修改功能包下CMakeList.txt136行和149-151行程序如果C++文件返回的日志信息乱码，可以在程序main中开头添加下面内容在写C++程序时如果不能自动提示，需要在.vscode目录下的c_cpp_properties.json文件中的name下一行添加下面代码编译快捷方式Ctrl+Shift+B，选择第二个的小齿轮，将以下代码替换掉原先内容，保
【Origin+Python】使用External Python批量出图代码参考2 kkkkkkkkk_1201 绘图 python 开发语言
目录前情提要进阶代码1批量绘制曲线图2曲线图设置3批量绘制相同设置的曲线图去除水印前情提要基础教程见链接:【Origin+Python】使用ExternalPython批量出图代码参考这里主要介绍一些进阶代码以及使用盗版origin要如何去除水印的方法！#############################################################进阶代码########
Python面向对象编程：精雕细琢对象的“名片”——重写 `__str__()` 和 `__repr__()` 方法清水白石008 Python题库 python python 开发语言
Python面向对象编程：精雕细琢对象的“名片”——重写__str__()和__repr__()方法在Python中，当我们使用print()函数打印一个对象，或者在交互式解释器中直接输入对象并回车时，Python会尝试将该对象转换为字符串进行显示。这个转换过程涉及到两个特殊方法：__str__()和__repr__()。正确地重写这两个方法，可以让我们更好地控制对象的字符串表示形式，提高代码的可
基于Springboot用axiospost请求接收字符串参数为null的解决方案呀243 spring boot 后端 java
问题今天在用前端post请求后端时发现，由于是以Json对象的形式传输的，后端用两个字符串形参无法获取到对应的参数值前端代码如下：axios.post('http://localhost:8083/test/postParams',{a:'1',b:'2'},{'Content-Type':'application/json'}).then(response=>{console.log(respo
【Java】常用工具类方法：树形结构、获取IP、对象拷贝、File相关、雪花算法等 PlanOne_A java 算法
1、生成子孙树/***生成子孙树**@paramdataArray遍历所有数据,每个数据加到其父节点下*@return子孙树json*/publicstaticJSONArraymakeTree(JSONArraydataArray){List>data=newArrayListmap=newHashMap>res=newArrayList>map=newHashMapvo:data){map.p
origin软件有python好用吗_Origin 2021大大改进了与Python的交互 weixin_39922534
经常收到同学咨询如何在Origin中管理下载Python包的问题，可以翻看上期专栏Origin2021对使用Python编程进行了重大改进。这些改进主要包括：新的originpro程序包，可使用Python语言轻松访问Origin对象和数据Python代码编辑器IDE现支持自动补完和调试功能可通过脚本或图形用户界面来安装和管理Python包设置列值，拟合函数和文本对象中使用Python函数从Lab
origin和python有什么不同_python爬虫之git的使用（origin说明） weixin_39878760
1、首先我们回忆两个命令#gitremoteaddorigin远程仓库链接#gitpush-uoriginmaster我们一起看看这个命令，git是git的一级命令，push就是下载，-u应该使用用账户验证maser就是分支的名字(前面我们说过)，那么这个origin是个什么鬼？大家看看下面的这个5毛钱图，就能发现，其实origin就是远程仓库的名称。如果不相信在看看我的配置文件#vi.git/c
tensorflow对应的python版本_tensorflow + python + keras 版本对应关系 weixin_39912303
TensorFlow2.2tensorflow-2.2TensorFlow2.2.0+Keras2.3.1onPython3.7.TensorFlow2.1tensorflow-2.1TensorFlow2.1.0+Keras2.3.1onPython3.6.TensorFlow2.0tensorflow-2.0TensorFlow2.0.0+Keras2.3.1onPython3.6.Tenso
python中shutil.copyfile的用法_python shutil.copy()用法 weixin_39678103
shutil.copyfile(src,dst)：复制文件内容（不包含元数据）从src到dst。DST必须是完整的目标文件名;如果src和dst是同一文件，就会引发错误shutil.Error。dst必须是可写的，否则将引发异常IOError。如果dst已经存在，它会被替换。特殊文件，例如字符或块设备和管道不能使用此功能，因为copyfile会打开并阅读文件。src和dst的是字符串形式的路径名。
【爬虫】使用 Scrapy 框架爬取豆瓣电影 Top 250 数据的完整教程 m0_74825360 面试学习路线阿里巴巴爬虫 scrapy
前言在大数据和网络爬虫领域，Scrapy是一个功能强大且广泛使用的开源爬虫框架。它能够帮助我们快速地构建爬虫项目，并高效地从各种网站中提取数据。在本篇文章中，我将带大家从零开始使用Scrapy框架，构建一个简单的爬虫项目，爬取豆瓣电影Top250的电影信息。Scrapy官方文档：ScrapyDocumentation豆瓣电影Top250：豆瓣电影Top250本文的爬虫项目配置如下：系统：Windo
【Mac】Python相关知识经验水银嘻嘻 Python macos python 开发语言
一、给Python3安装第三方库mac下给Python3安装第三方库pillow，处理图片【安装方式】：终端中输入命令：python3-mpipinstallpillow按回车，等待pillow下载安装NOTE:其他模块同理，如pytesseract二、Python版本升级1.终端执行命令：brewinstallpython32.安装Python3版本成功后，系统默认的仍旧是之前的版本，注意不要去
Python shutil.copy 函数 song_cai_csdn python
shutil.copy(source-path,dest-path)source-path中包含目录，对导致IOError:[Errno13]Permissiondenied异常
（三）python网络爬虫（理论+实战）——爬虫与反爬虫阳光宅男xxb 30天学会python网络爬虫 python 大数据爬虫
系列文章目录（1）python网络爬虫—快速入门（理论+实战）（一）（2）python网络爬虫—快速入门（理论+实战）（二）序言本人从事爬虫相关工作已8年以上，从一个小白到能够熟练使用爬虫，中间也走了些弯路，希望以自身的学习经历，让大家能够轻而易举的，快速的，掌握爬虫的相关知识并熟练的使用它，避免浪费更多的无用时间，甚至走
（详细整理！！！！）Tensorflow与Keras、Python版本对应关系！！！今天不想Debug tensorflow keras 人工智能
小伙伴们大家好，不知道大家有没有被tensorflow框架困扰过今天我就给大家整理一下tensorflow和keras、python版本的对应关系大家这些都可以在官网找到，下面我把官网的连接给大家放在这里：在Windows环境中从源代码构建|TensorFlow(google.cn)但是为了方便大家，我给大家列在下面啦！！！下面这个是我给大家总结的（也是为我自己整理的，嘿嘿~~~）（然后后面我也把
华为OD机试E卷 --分苹果 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python js c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下
Package ‘importlib-metadata‘ requires a different Python: 3.6.10 not in ‘＞=3.7‘ zy_whynot python python 开发语言后端
报错ERROR:Package'importlib-metadata'requiresadifferentPython:3.6.10notin'>=3.7'WARNING:Youareusingpipversion20.0.2;however,version21.3.1isavailable.Youshouldconsiderupgradingviathe'/usr/local/bin/pytho
Python设计模式 - 工厂方法模式 mofei12138 设计模式 python python 设计模式工厂方法模式
定义工厂方法模式是一种创建型设计模式，它定义一个创建对象的接口，让其子类来处理对象的创建，而不是直接实例化对象。结构抽象工厂（Factory）：声明工厂方法，返回一个产品对象。具体工厂类都必须实现该方法。具体工厂（ConcreteFactory）：实现工厂方法以创建具体的产品对象。抽象产品（Product）：定义产品对象的接口。具体产品（ConcreteProduct）：实现产品接口的具体产品对象
正则表达式的艺术：轻松驾驭 Python 的 re 库傻啦嘿哟 mysql 数据库 java
目录一、正则表达式的基本概念二、Python的re库简介三、正则表达式的元字符四、正则表达式的贪婪与非贪婪模式五、实战案例六、总结正则表达式（RegularExpression）是文本处理中不可或缺的工具，它强大而灵活，能够帮助我们高效地匹配、查找、替换复杂的文本模式。Python的re库为我们提供了便捷的正则表达式操作接口。本文将带你领略正则表达式的艺术，通过简洁明了的代码和案例，轻松驾驭Pyt
python广告点击率预测_常见计算广告点击率预估算法总结 weixin_39850143 python广告点击率预测
欢迎大家前往腾讯云技术社区，获取更多腾讯海量技术实践干货哦~作者：导语：本文讨论了CTR预估模型，包括工业界使用比较广的比较经典模型和学术界最新的结合DeepLearning的一些工作。前言谈到CTR，都多多少少有些了解，尤其在互联网广告这块，简而言之，就是给某个网络服务使用者推送一个广告，该广告被点击的概率，这个问题难度简单到街边算命随口告诉你今天适不适合娶亲、适不适合搬迁一样，也可以复杂到拿到
python 菜单调用_Python Tkinter Menu菜单（窗口菜单和右键菜单）使用详解 weixin_39997311 python 菜单调用
Tkinter为菜单提供了Menu类，该类既可代表菜单条，也可代表菜单，还可代表上下文菜单（右键菜单）。简单来说，Menu类就可以搞定所有菜单相关内容。程序可调用Menu的构造方法来创建菜单，在创建菜单之后可通过如下方法添加菜单项：add_command()：添加菜单项。add_checkbutton()：添加复选框菜单项。add_radiobutton()：添加单选钮菜单项。add_separa
游戏引擎架构第二版中文pdf_Allen Kashiwa的游戏开发信息 weixin_39811166 游戏引擎架构第二版中文pdf
0本文首发于我的github和我的博客，欢迎大家与我交流。1基础知识与通用技能1.1语言相关1.1.1C/C++C++Primer1.1.2C#C#编程指南CLRviaC#（第4版）1.1.3LuaProgramminginLua1.1.4Python廖雪峰的Python教程1.2语言无关1.2.1算法算法图解DataStructureVisualizations算法可视化visualgoIntr
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

深夜爬虫， 我很抱歉 ， 附微信 “ 网抑云” 公众号爬虫教程!