谷歌地图poi数据采集

国家税务总局发票查验平台爬虫

文章目录

- 1.安装根证书
- 2.反调试
- - 2.1.无限debugger
  - - 第一种方案
    - 第二种方案
  - 2.2.防止代码格式化
- 3.请求参数整体分析
- 4.key9参数解密
- 5.flwq39参数解密
- 6.fplx参数解密
- 7.url地址来源
- 8.验证码应对方案
- - 8.1 验证码获取
  - 8.2 验证码识别
- 9.主要代码实现

20210219更新—flwq39的定位
网站更新后, 无法按照以前的思路定位到flwq39，现推荐一大佬写得浏览器内存漫游工具进行快速定位, 欢迎给这位大佬star ast-hook-for-js-RE

一顿修改定位操作后

发现加密函数位于
https://inv-veri.chinatax.gov.cn/js/92da1b9c13d7432c8eae5aa66e641262.js, 打上断点

又看到了beforeSend，调试堆栈即可看到flwq39

1.安装根证书

选择手动安装

2.反调试

2.1.无限debugger

第一种方案

打开控制台发现出现断点

根据右侧堆栈查找debugger产生位置

可以看到有debugger字样, 该wlop.js文件是经过sojson混淆的，可以直接用猿人学ob一键反混淆 进行代码还原, 后面会发现几乎所有js文件都是混淆过后的, 所以建议用到一个还原一个, 便于静态分析和调试。

经过还原的js片段

function _0x2a9a84(_0x2f02e9) {
    function _0x58bb61(_0xf32887) {
        if (typeof _0xf32887 === "string") {
            return function(_0x4791b5) {}
            ["constructor"]("while (true) {}")["apply"]("counter");
        } else {
            if (("" + _0xf32887 / _0xf32887)["length"] !== 1 || _0xf32887 % 20 === 0) {
                (function() {
                    return true;
                }
                )["constructor"]("debugger")["call"]("action");
            } else {
                (function() {
                    return false;
                }
                )["constructor"]("debugger")["apply"]("stateObject");
            }
        }

        _0x58bb61(++_0xf32887);
    }

    try {
        if (_0x2f02e9) {
            return _0x58bb61;
        } else {
            _0x58bb61(0);
        }
    } catch (_0x51accc) {}
}

我们可以将本地文件的debugger字符串替换成其他不会执行的字符串，比如替换为debugger111，然后用fidder映射本地js文件就可以轻松过掉无限debugger了

fiddler如何替换本地文件参考下面链接https://blog.csdn.net/weixin_42156283/article/details/106731989

第二种方案

直接在debugger处Never pause here，也可以过掉debugger，使用该方案页面调试起来比较卡顿，本案例不建议这种方案

2.2.防止代码格式化

经过上面的处理, 发现已经过掉debugger了，但是有个问题，就是当输完发票号码后验证码不会正常请求（正常情况输完发票号码，输入框失去焦点会自动请求验证码），这与检测了代码格式化有关，导致程序流程异常（可能导致不按正确流程请求或chrome内存暴增），可以按照下面方式改写。

在ast还原的后脚本中搜索RegExp这个关键字符, 其原理就是通过正则判断代码有没有格式化，所有涉及RegExp正则检测的都要修改，并通过fiddler映射本地js文件，然后就可以过掉代码格式化的检测了

修改前代码片段

(function() {
	_0x46b8fc(this, function() {
		var _0x184400 = new RegExp("function *\\( *\\)");

		var _0x151658 = new RegExp("\\+\\+ *(?:_0x(?:[a-f0-9]){4,6}|(?:\\b|\\d)[a-z0-9]{1,4}(?:\\b|\\d))","i");

		var _0x62282b = _0x2a9a84("init");

		if (!_0x184400["test"](_0x62282b + "chain") || !_0x151658["test"](_0x62282b + "input")) {
			_0x62282b("0");
		} else {
			_0x2a9a84();
		}
	})();
}
)();

// 此处检测是否被格式化
var _0x25be9c = function() {
	return "dev";
}
  , _0x5f344a = function() {
	return "window";
};

var _0x24cfbd = function() {
	var _0x4a338d = new RegExp("\\w+ *\\(\\) *{\\w+ *['|\"].+['|\"];? *}");

	return !_0x4a338d["test"](_0x25be9c["toString"]());
};

var _0x4eeb79 = function() {
	var _0x5c58a6 = new RegExp("(\\\\[x|u](\\w){2,4})+");

	return _0x5c58a6["test"](_0x5f344a["toString"]());
};

修改后

(function() {
	_0x46b8fc(this, function() {
		var _0x184400 = new RegExp("function *\\( *\\)");

		var _0x151658 = new RegExp("\\+\\+ *(?:_0x(?:[a-f0-9]){4,6}|(?:\\b|\\d)[a-z0-9]{1,4}(?:\\b|\\d))","i");

		var _0x62282b = _0x2a9a84("init");

		if (!true || !true) {
			_0x62282b("0");
		} else {
			_0x2a9a84();
		}
	})();
}
)();


var _0x25be9c = function() {
	return "dev";
}
  , _0x5f344a = function() {
	return "window";
};

var _0x24cfbd = function() {
	var _0x4a338d = new RegExp("\\w+ *\\(\\) *{\\w+ *['|\"].+['|\"];? *}");

	return !true;
};

var _0x4eeb79 = function() {
	var _0x5c58a6 = new RegExp("(\\\\[x|u](\\w){2,4})+");

	return true;
};

即将所有正则判断改为true

_0x184400["test"](_0x62282b + "chain")  → true
_0x151658["test"](_0x62282b + "input")  → true
_0x4a338d["test"](_0x25be9c["toString"]())  → true
_0x5c58a6["test"](_0x5f344a["toString"]())  → true

3.请求参数整体分析

1.验证码请求参数

fpdm              发票代码
fphm              发票号码
v                 版本号
callback          比当前时间减1分钟, 1分钟可以随机
_                 记录验证码请求的次数, 每次加1, 可以固定写死
r                 随机数
nowtime           当前时间戳
publickey         当前时间戳
key9              加密参数
flwq39            加密参数

2.查询请求参数

callback          比当前时间减1分钟, 1分钟可以随机
key1              发票代码
key2              发票号码
key3              开票日期
key4              校验码
fplx              加密参数
yzm               验证码
yzmSj             当前时间
index             验证码请求响应值中解析
publickey         当前时间
key9              加密参数
_                 记录验证码请求的次数, 每次加1, 可以固定写死
flwq39            加密参数

4.key9参数解密

1.输入发票代码，发票号码弹出验证码

2.全局搜索key9, 并在相应位置打上断点, 然后刷新验证码, 断点断在下图位置

3.选中$[_0x419b(‘0x10’)][_0x419b(‘0x11’)]跳入匿名函数

4.直接打上断点进行并进入调试，建议用ast还原后的代码进行替换调试，调试过程没有难点，缺什么补什么就可以了

还原前代码

还原后代码

上述为验证码请求时key9生成过程，查询请求key9生成类似，不再赘述！

5.flwq39参数解密

flwq39并未在上述提交的参数列表中，全局搜索也未能搜索到，原因可能是代码被混淆后导致参数无法搜索到，将相关js文件还原后发现在emwrs.js文件中找到


打上断点发现断下来，正是flwq39参数生成的地方, 然后缺什么补什么，过程中没有难点

最后发现为JSEncrypt库的rsa加密，直接调用加密库即可，加密库代码参考javascript加密库jsencrypt.js，RSA.js用法

上述为验证码请求时key9生成过程，查询请求key9生成类似，不再赘述！

通过上面的分析可以总结一下：加密参数可以通过ajax beforeSend函数中添加，可以通过直接搜索beforeSend快速定位

6.fplx参数解密

全局搜索fplx，并打下断点，此时点击查询按钮并不会断下来，需要清空输入的数据，单独输入发票代码，输入框失去鼠标焦点后会断下来

**跳入加密函数，即为生成fplx的函数 **

7.url地址来源

上述获取fplx过程中发现对发票代码进行了一系列的校验，其中关键函数getSwjg对不同地区对应的url进行的匹配获取

可以直接改为python代码

def get_fpdm_area(fpdm):

    citys = [{
        'code': '1100',
        'sfmc': '北京',
        'Ip': 'https://fpcy.beijing.chinatax.gov.cn:443/NWebQuery',
        'address': 'https://fpcy.beijing.chinatax.gov.cn:443'
    }, {
        'code': '1200',
        'sfmc': '天津',
        'Ip': 'https://fpcy.tjsat.gov.cn:443/NWebQuery',
        'address': 'https://fpcy.tjsat.gov.cn:443'
    }, ......
    
    swjginfo = []

    if len(fpdm) == 12:
        dqdm = fpdm[1: 5]
    else:
        dqdm = fpdm[0: 4]

    if dqdm != "2102" and dqdm != "3302" and dqdm != "3502" and dqdm != "3702" and dqdm != "4403":
        dqdm = dqdm[0: 2] + "00"

    for info_dict in citys:
        if dqdm == info_dict['code']:
            swjginfo.append(info_dict['sfmc'])
            swjginfo.append(info_dict['Ip'].replace(':443', ''))

    return swjginfo

8.验证码应对方案

8.1 验证码获取

图片数据是响应数据的key1值，只需将replaceStr函数抠出即可

8.2 验证码识别

本案例通过训练识别难度很大，我们可以将验证码处理后交给打码平台处理

从js文件中得知验证码共分为4类：输入所有验证码，输入红色字体，输入黄色字体，输入蓝色字体

if (_0x1c1133 == "00") {
	$("#yzminfo")["text"]("请输入验证码文字");
} else {
	if (_0x1c1133 == "01") {
		$("#yzminfo")["html"]("请输入验证码图片中红色文字");
	} else {
		if (_0x1c1133 == "02") {
			$("#yzminfo")["html"]("请输入验证码图片中黄色文字");
		} else {
			if (_0x1c1133 == "03") {
				$("#yzminfo")["html"]("请输入验证码图片中蓝色文字");
			}
		}
	}
}

图片处理思路：新生成一张空白图片，添加相关文字说明，然后再和验证码合成一张图片，效果如下：

测试打码平台为超级鹰，测试20张图片，识别率100%

9.主要代码实现

# -*- coding: utf-8 -*-
import time
import execjs
import random
import requests
import urllib3
import re
import base64
import json
from datetime import datetime, timedelta
import cv2
from PIL import ImageFont, ImageDraw, Image
import numpy as np
import os
from get_area import get_fpdm_area
from chaojiying import Chaojiying_Client


chaojiying_obj = Chaojiying_Client('你自己的信息', '你自己的信息', '你自己的信息')

urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

s = requests.session()
s.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'}

with open('./key9.js', encoding='utf-8') as f1:
    ctx1 = execjs.compile(f1.read())

with open('./flwq39.js', encoding='utf-8') as f2:
    ctx2 = execjs.compile(f2.read())

with open('./get_capture_data.js', encoding='utf-8') as f3:
    ctx3 = execjs.compile(f3.read())

with open('./fplx.js', encoding='utf-8') as f4:
    ctx4 = execjs.compile(f4.read())

capture_dict = {
    '00': ['所有', (0, 0, 0)],
    '01': ['红色', (0, 0, 255)],
    '02': ['黄色', (0, 200, 200)],
    '03': ['蓝色', (255, 0, 0)]
}


def generate_capture(color, rgb, capture_name, temp_capture_name, final_capture_name):
    """处理验证码图片, 添加说明文字, 使其符合打码平台要求"""

    # 生成一张空白图片
    img = Image.new('RGB', (90, 20), (255, 255, 255))
    img.save(temp_capture_name)
    bk_img = cv2.imread(temp_capture_name)

    # 设置需要显示的字体
    fontpath = "simsun.ttc"
    font = ImageFont.truetype(fontpath, 12)
    img_pil = Image.fromarray(bk_img)
    draw = ImageDraw.Draw(img_pil)

    # 绘制文字信息
    draw.text((0, 3),  "请输入", font=font, fill=(0, 0, 0))
    draw.text((38, 3),  color, font=font, fill=rgb)
    draw.text((65, 3),  "文字", font=font, fill=(0, 0, 0))
    bk_img = np.array(img_pil)
    cv2.imwrite(temp_capture_name, bk_img)

    # 合并图片
    photo_one = cv2.imread(temp_capture_name)
    photo_two = cv2.imread(capture_name)

    photo = np.vstack((photo_one, photo_two))
    cv2.imwrite(final_capture_name, photo)


timestamp = int(round(time.time() * 1000))
timestamp_pre = str((timestamp / 1000 - 60) * 1000).replace('.0', '')

# 验证码请求
fpdm = '011001900311'  # 发票代码
fphm = '26540678'  # 发票号码
v = 'V2.0.04_004'  # 版本号
callback = 'jQuery110209376690644705499_{}'.format(timestamp_pre)  # 比当前时间减1分钟(1分钟可以随机)
_ = str(int(timestamp_pre) + 1)  # 记录验证码请求的次数(每次加1, 可以固定写死)
r = '0.' + ''.join(str(random.choice(range(10))) for _ in range(16))  # 随机数
nowtime = str(timestamp)
publickey = str(timestamp)
key9 = ctx1.call("key9_yzm", fpdm, fphm, nowtime)
flwq39 = ctx2.call("flwq39_yzm", fpdm, fphm, nowtime)

area = get_fpdm_area(fpdm)
if not area:
    print('发票代码错误')

area_url = area[1]
capture_url = f'{area_url}/yzmQuery?' \
              f'callback={callback}&' \
              f'fpdm={fpdm}&fphm={fphm}&' \
              f'r={r}&' \
              f'v={v}&' \
              f'nowtime={nowtime}&' \
              f'publickey={publickey}&' \
              f'key9={key9}&' \
              f'_={_}&' \
              f'flwq39={flwq39}'

print(capture_url)
resp = s.get(url=capture_url, verify=False)

data = re.findall('data":"(.+?)"', resp.text)[0]
data = ctx3.call("replaceStr", data, nowtime)
data = base64.b64decode(data)
data_dict = json.loads(data.decode('utf-8'))
print(data_dict)

key1 = data_dict['key1']
image_data = base64.b64decode(key1)

random_num = ''.join(str(random.choice(range(10))) for _ in range(10))
capture_name = 'capture_{}.png'.format(random_num)
temp_capture_name = 'temp_capture_{}.png'.format(random_num)
final_capture_name = 'final_capture_{}.png'.format(random_num)

with open(capture_name, 'wb') as f:
    f.write(image_data)

capture_type = data_dict['key4']
capture_info = capture_dict[capture_type]
color = capture_info[0]
rgb = capture_info[1]

# 处理验证码图片, 生成新的验证码图片
generate_capture(color, rgb, capture_name, temp_capture_name, final_capture_name)

# 发送验证码到打码平台
with open(final_capture_name, 'rb') as f:
    capture_content = f.read()
code_dict = chaojiying_obj.PostPic(capture_content, 6004)
code = code_dict['pic_str']
print('获取验证码成功:', code)

# 删除验证码图片
os.remove(capture_name)
os.remove(temp_capture_name)
os.remove(final_capture_name)

# 查询请求
callback = 'jQuery1102030589417870189517_{}'.format(timestamp_pre)
key1 = '011001900311'
key2 = '26540678'
key3 = '20190708'
key4 = '316342'
fplx = ctx4.call("fplx", key1)
yzm = code
yzmSj = (datetime.utcnow() + timedelta(hours=8)).strftime("%Y-%m-%d %H:%M:%S")
index = data_dict['key3']
publickey = yzmSj
key9 = ctx1.call("key9_vat", fpdm, fphm, yzmSj)
_ = str(int(timestamp_pre) + 1)
flwq39 = ctx2.call("flwq39_vat", fpdm, fphm, yzmSj)

query_url = f'{area_url}/vatQuery?' \
            f'callback={callback}&' \
            f'key1={key1}&' \
            f'key2={key2}&' \
            f'key3={key3}&' \
            f'key4={key4}&' \
            f'fplx={fplx}&' \
            f'yzm={yzm}&' \
            f'yzmSj={yzmSj}&' \
            f'index={index}&' \
            f'publickey={publickey}&' \
            f'key9={key9}&' \
            f'_={_}&' \
            f'flwq39={flwq39}'

print(query_url)

resp = s.get(url=query_url, verify=False)
res_json = re.findall('\((.+?)\)', resp.text)[0]
res_dict = json.loads(res_json)
print(res_dict)

"""
{
    "key1": "001",
    "key2": "6≡20190708≡江苏圆周电子商务有限公司北京分公司≡91110302585816506R≡北京市北京经济技术开发区荣华中路7号院3号楼十层1015 62648622≡交行北京海淀支行 110060576018150114912≡北方工业大学≡1211000040086596XB≡≡≡78875685883799316342≡0.00≡69.49≡≡661620039941≡69.49≡0≡≡",
    "key3": "*印刷品*人月神话（40周年中文纪念版）█无██0.000█69.50000000█69.50█1.00000000█0.00█1█1060201019900000000≡*印刷品*人月神话（40周年中文纪念版）███0.000██-0.01██0.00█1█1060201019900000000",
    "key4": "订单号:99127168673",
    "key5": "1"
}
"""

# 解析数据
final_summarys = []
summarys = res_dict['key3'].split('≡')
for index, summary in enumerate(summarys):
    summary_list = summary.split('█')
    summary_dict = dict()
    summary_dict['index'] = index + 1  # 序号
    summary_dict['name'] = summary_list[0]  # 名称
    summary_dict['type'] = summary_list[1]  # 规格型号
    summary_dict['unit'] = summary_list[2]  # 单位
    summary_dict['amount'] = summary_list[6]  # 数量
    summary_dict['priceUnit'] = summary_list[4]  # 单价
    summary_dict['priceSum'] = summary_list[5]  # 金额
    summary_dict['taxRate'] = '免税'  # 税率
    summary_dict['taxSum'] = '***'  # 税额
    final_summarys.append(summary_dict)


key2_list = res_dict['key2'].split('≡')

item = dict()
item['check_num'] = key2_list[10]  # 校验码
item['machine_num'] = key2_list[14]  # 机器编号
item['sum_price'] = key2_list[15]  # 合计金额
item['sum_tax'] = key2_list[16]  # 合计税额
item['order_num'] = res_dict['key4'].replace('订单号:', '')  # 订单号
item['buyer'] = {
    'name': key2_list[6],  # 名称
    'taxpayer_identification_num': key2_list[7],  # 纳税人识别号
    'address_phone': key2_list[8],  # 地址、电话
    'bank_and_num': key2_list[9],  # 开户行及账号
}

item['seller'] = {
    'name': key2_list[2],  # 名称
    'taxpayer_identification_num': key2_list[3],  # 纳税人识别号
    'address_phone': key2_list[4],  # 地址、电话
    'bank_and_num': key2_list[5],  # 开户行及账号
}

item['summarys'] = final_summarys  # 具体事项

print(item)

python爬虫爬百度云盘的资源 oaa608868 百度云爬虫 python
最近百度云盘不知道为啥不提供资源检索，正好最近看了一下python，正好来练练手，写歌爬虫爬一下百度云盘的资源。分析了一下百度云盘的网友源码和js文件，里面有大量ajax的东西，利用json传输数据，前端显示。话说，这样数据爬去就方便多了，也不要用scrapy啥的，直接解析json数据就好。分析js文件提炼了下面三个链接：URL_SHARE='http://yun.baidu.com/pclo
PHP爬虫实战指南：获取淘宝商品详情爬虫程序猿 php 爬虫 android
在电商领域，淘宝作为中国最大的在线零售平台之一，拥有海量的商品信息。对于开发者、市场分析师以及电商研究者来说，能够从淘宝获取商品详情信息，对于市场分析、价格比较、商品推荐等应用场景具有重要价值。本文将详细介绍如何使用PHP编写爬虫程序，以合法合规的方式获取淘宝商品的详情信息，并提供详细的代码示例。一、准备工作（一）注册淘宝开放平台账号在使用淘宝API之前，需要在淘宝开放平台注册账号并创建应用。注册
如何禁止GPTBot等爬虫爬取网站内容：保护数据安全的实用指南淮橘√ 人工智能
引言随着人工智能技术的快速发展，网络爬虫（如OpenAI的GPTBot、GoogleBot、Anthropic的ClaudeBot等）被广泛用于抓取网站数据以训练AI模型或索引内容。然而，部分网站管理员可能不希望自己的内容被爬虫抓取，原因包括保护原创内容、降低服务器负载或防止数据被滥用。一、为什么需要禁止爬虫？网络爬虫可能带来以下问题：内容盗用风险：原创内容可能被AI模型或其他服务未经授权使用。服
Python - 爬虫；Scrapy框架之插件Extensions（四） MinggeQingchun Python Python 爬虫 Scrapy extensions
阅读本文前先参考https://blog.csdn.net/MinggeQingchun/article/details/145904572在Scrapy中，扩展（Extensions）是一种插件，允许你添加额外的功能到你的爬虫项目中。这些扩展可以在项目的不同阶段执行，比如启动、关闭、处理请求、处理响应等。Extensions官网文档：Extensions—Scrapy2.12.0document
LeetCode高频100题刷题记录之——二叉树的中序遍历巍巍微澜 Leetcode刷题记录 leetcode 算法 python 二叉树
1问题描述给定一个二叉树，按照左，中，右的顺序遍历这棵树。2代码实现思路很简单，从左到右遍历这颗二叉树即可。2.1递归代码实现#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=right#
mysql中有大量sleep进程的原因与解决办法 \光辉岁月/ php 数据库
mysql中有大量sleep进程的原因与解决办法mysql服务器中有大量的sleep进程，本文分析下mysql出现大sleep进程原因分析与解决方法。可能的原因：造成睡眠连接过多的原因？1.使用了太多持久连接（个人觉得，在高并发系统中，不适合使用持久连接）2.程序中，没有及时关闭mysql连接3.数据库查询不够优化，过度耗时。当然，更根本的方法，还是从以上三点排查之：1.程序中，不使用持久链接，即
【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Retrieval组件）Text Splitters详解？
【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Retrieval组件）TextSplitters详解？【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Retrieval组件）TextSplitters详解？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十四章（LangChain与Re
Python 爬虫实战：从图片网站抓取图片并进行特征提取（2025 最新版） Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 github chrome 数据库
一、引言在当今的数字时代，图像数据在各个领域中扮演着至关重要的角色。无论是计算机视觉、机器学习，还是数据分析，图像数据的获取和处理都是基础。然而，获取大量高质量的图像数据并非易事。幸运的是，互联网上充斥着丰富的图像资源，只需借助合适的工具和技术，我们就能高效地从中获取所需的图像数据。本文将详细介绍如何使用Python构建一个完整的爬虫系统，从图片网站抓取图像，并对其进行特征提取。我们将涵盖从网页分
vben 之 axios 封装 aha-凯心 vben admin启航前端学习 javascript
vben之axios封装axios封装，这是一个从新手入门就要开始做的一件事情，现在让我们看一下vben中是如何实现axios的封装的。vben中axios的封装vben中的axios封装的代码在packages\effects\request\src\request-client\request-client.ts我们简单介绍一下这个封装，首先，vben使用class，然后类中有一些属性//方法
Android之提示Failed to load WebView provider: No WebView installed 码莎拉蒂 . Andriod 积累 Android Failed to load WebView No WebView installed
1问题FatalException:android.util.AndroidRuntimeException:android.webkit.WebViewFactory$MissingWebViewPackageException:FailedtoloadWebViewprovider:NoWebViewinstalledatandroid.webkit.WebViewFactory.getPro
Android15音频进阶之HIDL与宏代码调试(一百二十五) Android系统攻城狮 Android Audio工程师进阶系列音视频 Android15 Audio
简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列【原创干货持续更新中……】优质视频课程：AAOS车载系统+AOSP14系统攻城狮入门视频实战课
微电网系列之微电网的故障检测与接入标准云纳星辰怀自在微电网微电网标准微电网保护配置微电网前沿技术
个人主页：云纳星辰怀自在座右铭：“所谓坚持，就是觉得还有希望！”微电网的故障检测与接入标准微电网保护的核心挑战分布式电源引入微电网后，使得微电网系统的保护与常规配电网存在较大差异，主要可表现为：Table17微电网保护的核心挑战（与传统配电网对比）差异维度传统配电网含分布式电源微电网技术影响故障电流5-10倍额定电流1.5-2倍额定电流过流保护灵敏度不足潮流方向单向流动双向流动传统方向保护失效运行
RISC-V设计之Decoder的封装与函数(二)
RISC-V设计之封装与函数(SV)写在前面：今天去见了导师，他强烈要求我把设计中的decoder删去，去掉宏定义引入局部变量，使用封装的函数来取而代之。并在其他运算模块调用函数的返回值，提高代码简洁度和清晰度，避免全局变量污染环境，下面是根据导师的主页总结的设计笔记。-----2025/7/1示例代码：这个opcodes包是为一个简单的处理器设计的辅助模块，作用是封装指令解析相关的功能，供CPU
python汉语编程，将关键字与文言文对应 xinhuanjieyi 汉语编程 python
以下是将Python3.13的35个关键字与宋词中的典雅字词（或意象化表达）进行创意关联的版本，力求保留宋词意境的同时与关键字语义形成朦胧呼应：宋词风关键字映射谧（mì）-False（取自“静谧”，喻“假”之空寂，如“谧夜无痕”）缈（miǎo）-None（“缥缈”之虚，如“空山缈云踪”）瑧（zhēn）-True（“瑧”通“真”，喻“真”之确然，如“瑧意自昭昭”）俦（chóu）-and（“俦侣”喻“
宽带选择大揭秘：200兆与1000兆，谁才是家庭真刚需？
目录一、宽带速度知多少二、200兆宽带：日常够用的性价比之选2.1适用场景2.2实际体验2.3成本优势三、1000兆宽带：高速网络的极致体验3.1高速需求场景3.2性能优势体现3.3未来拓展性四、影响选择的关键因素4.1网络使用习惯4.2家庭设备情况4.3经济预算考量五、做出明智选择一、宽带速度知多少在开始探讨200兆和1000兆宽带哪个更适合家用之前，我们先来明确一下它们的理论速度。这里的200
Python Web开发之“基于flask的轻量级Web应用” 诚威_lol_中大努力中夏令营复习 python 前端 flask
参考文章1：https://cloud.tencent.com/developer/article/2373503参考文章2：基于Flask的自定义网站设计与实现（代码全文+讲解V1.0）_flask框架制作网页-CSDN博客参考文章3：Python+Flask+MysqL设计网页-李明惠-博客园(cnblogs.com)最基本的例子来源-参考文章1：说明：导入Flask类——>app=Flask
【python数据分析】数据建模之Kmeans聚类斑点鱼 SpotFish python 数据建模聚类 python 数据分析
K-means聚类：最常用的机器学习聚类算法，且为典型的基于距离的聚类算法。K均值：基于原型的、划分的距离技术，它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度Kmeans聚类案例分析：make_blobs聚类数据生成器#导入模块from sklearn.cluster import KMeansfromsklearn.datasetsimportmake_blobs#创建数据x,y_tr
智能新纪元：大语言模型如何重塑电商“人货场”经典范式黑巧克力可减脂 AIGC 语言模型人工智能自然语言处理
开篇引言“善战者，求之于势，不责于人。”——《孙子兵法·兵势篇》当全球电商交易额突破6.3万亿美元（Statista2024），增长引擎却显露疲态。流量红利消退、同质化竞争加剧、消费者需求碎片化——传统“人货场”理论正遭遇前所未有的挑战。而大语言模型（LLM）的出现，恰似一柄重铸商业逻辑的“科技之锤”，正在为电商领域开启一场静水深流的革命性变革。基石重塑：当“人货场”遇见大模型智能经典理论再审视：
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
Django REST framework - 设置 djangopython
settings.py命名空间是个绝妙的主意，让我们多用用吧！——《Python之禅》DjangoREST框架的配置都放在一个命名空间内，即Django的一个设置，名为REST_FRAMEWORK。例如，项目的settings.py文件可能包含类似以下内容：REST_FRAMEWORK={'DEFAULT_RENDERER_CLASSES':['rest_framework.renderers.J
Python 爬虫实战：抓取哔哩哔哩收藏夹视频（API 逆向 + 视频分类整理）西攻城狮北 python 爬虫音视频
引言哔哩哔哩（B站）作为国内知名的视频分享平台，拥有丰富多样的视频资源和活跃的用户社区。对于视频创作者、数据分析人员或爬虫学习者来说，抓取B站收藏夹中的视频数据，不仅能帮助我们更好地了解用户喜好和视频内容，还能为创作和研究提供有力支持。本文将深入浅出地讲解如何通过Python爬虫实现抓取哔哩哔哩收藏夹视频，并对其进行分类整理，涵盖从环境搭建、API逆向分析到数据处理与存储等关键步骤，旨在为读者提供
微软服务器安全问题国际云1688 微软云云计算服务器云原生运维 azure
微软云服务器安全深度解析：挑战、应对与未来展望——构建韧性“安全之盾”的持续博弈！在当今数字化时代，云计算已成为众多企业和组织运行业务的核心基础设施和“数字生命线”，而微软云（Azure）作为全球领先的云服务提供商之一，其安全性无疑是全球数十万企业客户最为关注的焦点。然而，近年来，我们不得不承认，微软云服务器却频繁出现安全事故，从配置错误引发的数据泄露到DDoS攻击下的防护困境，再到软件更新导致的
Python 爬虫实战：动态数据+定时任务+价格预测全链路解析西攻城狮北 python 爬虫开发语言
一、动态数据捕获技术栈1.1目标网站分析（以某OTA平台为例）实现原理：本节演示如何使用Selenium自动化浏览器访问机票查询页面。选择Selenium而非直接请求API的原因在于：目标网站采用JavaScript动态渲染价格数据需要模拟用户操作（如选择日期、舱位）触发数据加载需处理反爬机制（如Cookie验证、行为检测）fromseleniumimportwebdriverfromseleni
抓取HTTP请求与响应头，分析网站请求逻辑：Python爬虫实战指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫网络 selenium 开发语言信息可视化
引言在爬虫开发过程中，分析和理解网站的请求和响应逻辑是非常重要的。通过抓取HTTP请求与响应头，我们不仅可以获取网站内容，还可以帮助我们更好地绕过反爬虫机制、模拟真实用户的行为。HTTP请求和响应头提供了关于请求的数据、服务器的状态以及网页加载过程中的详细信息，掌握这些信息可以让我们在抓取数据时更加高效、灵活。本文将详细介绍如何抓取和分析HTTP请求与响应头，揭示网站请求的底层逻辑，并提供相应的P
.net实现内容推荐算法代码
.NET实现内容推荐算法代码在当今信息爆炸的时代，内容推荐算法变得至关重要。它能够根据用户的偏好和行为，为用户精准地推荐感兴趣的内容，提高用户体验。本文将详细介绍如何使用.NET（C#）实现一个简单的基于内容的推荐算法，并探讨其扩展优化方向。内容推荐算法简介内容推荐算法主要依据物品的属性匹配程度来进行推荐，适用于文章、商品等各类内容的推荐场景。其核心思想是通过分析用户的偏好和内容的特征，找出两者之
飞算JavaAI：开启智能化新纪元，力臻开发之本真，破 AI 代码之繁琐，传统项目一键生成 Loving_enjoy 计算机学科论文创新点人工智能经验分享深度学习 facebook
#飞算JavaAI：开启Java开发智能化的新纪元##引言：当Java开发遇见AI革命在数字化转型的浪潮中，Java作为企业级开发的"常青树"语言，依然保持着强大的生命力。然而，传统的Java开发模式正面临着效率瓶颈——据统计，开发者平均有30%-40%的时间花费在重复性的样板代码编写上。飞算JavaAI应运而生，它不仅是代码生成工具，更是**开发理念的革命**，让Java开发者从繁琐中解放，真正
ASP MVC 架构由浅入深电商api接口开发 mvc mvc 架构
MVC是一种用于构建Web应用程序的软件设计模式，它将应用程序分为三个主要部分：模型（Model）、视图（View）和控制器（Controller）。下面由浅入深地介绍ASP.NETMVC架构。1.基础概念理解模型（Model）：代表应用程序的数据和业务逻辑。它负责处理数据的存储、检索和验证等操作。例如，在一个博客应用中，模型可以是表示文章、评论等的数据类，以及与之相关的数据库操作方法。视图（Vi
磁链转种子，种子转磁链 CILIFA 爬虫
前段时间做DHT爬虫，，奈何大量INFOHASH无法转换为种子文件，网络上所提供的几种方法也基本上已经失效（/效率低下）未测试DHT009协议，遂通过该思路借助迅雷实现。git地址:https://github.com/ZRory/magnet-torrent测试地址：https://www.orboss.com
设计模式之适配器模式 yimeixiaolangzai 设计模式设计模式适配器模式
在软件开发过程中，我们经常会遇到这样的情况：需要使用一个已经存在的类，但它的接口并不符合我们的需求。适配器模式（AdapterPattern）就是为了解决这一问题而设计的。它可以将一个类的接口转换成客户希望的另一个接口，从而使原本由于接口不兼容而无法一起工作的类可以协同工作。本文将详细解析适配器模式的基本原理、实现方法、应用场景及其优缺点，并通过具体示例演示如何在实际项目中应用适配器模式。基本原理
【软考中级·软件评测师】下午题·面向对象测试之架构考点全析：分层、分布式、微内核与事件驱动 June bug 软考中级：软件评测师知识架构分布式职场和发展学习方法经验分享软考测试
一、分层架构：分层独立与质量特性的双向约束分层架构通过“垂直分层（表示层→服务层→业务逻辑层→数据层）”实现职责隔离，是Web应用、企业级系统的主流架构模式。1.父类成员函数重测场景子类继承父类时，若父类已测成员函数需在子类重测，触发条件分两类：场景1：继承的成员函数在子类中被修改（如逻辑分支新增、算法替换）；场景2：成员函数调用了被修改的子类成员函数（父类函数依赖子类重写方法，需验证调用逻辑）。
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟