胡建飞

Python爬虫实战经验分享， siki学院视频下载

爬取并解密某学院在线视频

开始之前，先了解下pyppeteer和asyncio

pyppeteer和selenium一样都是模拟浏览器行为

1、模拟登录

然后F12或者右键点击检查，选择模拟手机浏览器(这样会简单一点，在这安利一个小技巧，一般网站设置为手机访问有些参数可能会变简单)

点击登录，查看浏览器地址栏，找到登录地址http://www.sikiedu.com/login?goto=/

找到微信扫码登录按钮元素

找到登录二维码

和找登录按钮一样，找到二维码图片

然后简单一点就直接将元素截图，然后保存，之后打开图片扫码登录

这里为了更炫酷的效果，所以将二维码图片识别后，获取真实登录地址，最后用终端将包含真实登录地址的二维码显示出来

async def login():
        browser = await launch(headless=True, executablePath="C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe")  # 这里选择新版edge浏览器， 真的很棒， 还能一键导入chrome浏览器的书签和cookie， 建议更新
        
        page = await browser.newPage() # 创建一个新标签页
        # 老规矩设置一下user-agent
        await page.setUserAgent("Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1 Edg/87.0.4280.88")
        
        # 访问登录页
        await page.goto('http://www.sikiedu.com/login')
        
        # 点击微信登录
        await page.click('a.social-weixin')
        
        # 等到二维码出现
        qrcode = await page.waitForSelector("div.wrp_code > img")
        await page.waitFor(500)  # 等待图片加载
        with TemporaryDirectory() as tmpdirname:
            await qrcode.screenshot({
     "path": os.path.join(tmpdirname, self.qrcode_file)})
            # logger.info("等待扫码")
            self.show_qrcode(os.path.join(tmpdirname, self.qrcode_file))
        await page.evaluate('''() => {
        var wx_scan_interval = setInterval(() => {
            if ($("#wx_after_scan").is(':visible')) {
                $("#wx_after_scan").after('');
                clearInterval(wx_scan_interval);
            }
        }, 200);
    }''')
        await page.waitForSelector("#scaned")
        os.system("cls")
        logger.info("扫码成功")
        await page.waitForSelector(".navbar-user")
        logger.info("登录成功")
        cookies = await page.cookies("http://www.sikiedu.com")
        await browser.close()  # 关闭浏览器‘
        # 获取cookie， 至此就不用pyppeteer了， 用pyppeteer是为了简化登录， 之后用aiohttp爬取， 异步爬取速度优势
        self.cookies.update({
     cookie["name"]: cookie["value"]
                             for cookie in cookies})

有了cookie，不难找出获取课程列表等接口，这里就不一一讲解了，在最后自己看完整代码

2、下载并解析视频

打开一个自己课程中的任意一个视频

我们还能发现这里有一个AES解密需要的IV 偏移量

然后我们在找到第一个m3u8地址是哪个请求获取的

下面分析解密视频

现在key和iv都找到了，解密就简单了，随便网上找一个AES解密

3、最后完整代码

运行环境

edge最新版

用到的库

pyppeteer # 模拟浏览器

PIL

pyzbar # 识别二维码

qrcode # 在终端中打印二维码

aiohttp # 异步请求

lxml # 解析html

loguru # 更方便的日志第三方库

tqdm # 简洁在终端显示进度

prettytable # 终端打印表格

import asyncio
from asyncio.locks import Semaphore
from typing import List
from pyppeteer import launch
import os
from PIL import Image
from pyzbar import pyzbar
import qrcode
from tempfile import TemporaryDirectory
import os
from aiohttp import ClientSession
from lxml import etree
from loguru import logger
import re
import os
from Crypto.Cipher import AES
import re
from tqdm import tqdm
import json
from prettytable import PrettyTable  # 终端打印表格
logger.add(f"{os.path.expanduser('~')}\AppData\Local\siki\log\log.log", level='DEBUG', format='{time:YYYY-MM-DD HH:mm:ss.SSS} | {level: <8} | {name}:{function}:{line} - {message}', encoding="UTF-8", rotation="1 MB", retention="5 days")

class Siki(object):
    def __init__(self) -> None:
        self.qrcode_file = "qrcode.png"
        self.cookies = {
     }
        self.base_url = "http://www.sikiedu.com"
        self.qxd = "高清"
        self.headers = {
     
            "Host": "www.sikiedu.com",
            "Origin": "http://service-cdn.qiqiuyun.net",
            "user-agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1 Edg/87.0.4280.88"
        }
        self.max_worker = 80

    def show_qrcode(self, file):
        url = pyzbar.decode(Image.open(os.path.join(file)), symbols=[
                            pyzbar.ZBarSymbol.QRCODE])[0].data.decode()
        q = qrcode.QRCode()
        q.add_data(url)
        q.make()
        q.print_ascii()

    async def login(self):
        browser = await launch(headless=True, executablePath="C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe")
        page = await browser.newPage()
        await page.setUserAgent("Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1 Edg/87.0.4280.88")
        await page.goto('http://www.sikiedu.com/login')
        await page.click('a.social-weixin')
        qrcode_img = await page.waitForSelector("div.wrp_code > img")
        # 直接获取二维码url
        # qrcode_url = await (await qrcode_img.getProperty("src")).jsonValue()
        
        
        # 也可以获取图片然后识别内容
        await page.waitFor(500)
        with TemporaryDirectory() as tmpdirname:
            await qrcode_img.screenshot({
     "path": os.path.join(tmpdirname, self.qrcode_file)})
            # logger.info("等待扫码")
            self.show_qrcode(os.path.join(tmpdirname, self.qrcode_file))
        
        # 等待扫码完成
        await page.evaluate('''() => {
        var wx_scan_interval = setInterval(() => {
            if ($("#wx_after_scan").is(':visible')) {
                $("#wx_after_scan").after('');
                clearInterval(wx_scan_interval);
            }
        }, 200);
    }''')
        await page.waitForSelector("#scaned")
        os.system("cls")
        logger.info("扫码成功")
        await page.waitForSelector(".navbar-user")
        logger.info("登录成功")
        
        # 获取cookie， 至此就不用pyppeteer了， 用pyppeteer是为了简化登录， 之后用aiohttp爬取， 异步爬取速度优势
        cookies = await page.cookies("http://www.sikiedu.com")
        await browser.close()
        self.cookies.update({
     cookie["name"]: cookie["value"]
                             for cookie in cookies})
        

    async def main(self):
        await self.login()
        # print(self.cookies)
        # 这里手动设置cookie， 便于测试
        # self.cookies = 

        async with ClientSession(cookies=self.cookies, headers=self.headers) as session:
            self.session: ClientSession = session
            learning_list = await self.get_learning_list()
            
            # 选择下载课程
            tb = PrettyTable()
            tb.field_names=["序号", "课程名", "课程ID"]
            for index, course in enumerate(learning_list):
                tb.add_row([index, course['name'], course['courseid']])
            print(tb)
            xh = int(input("输入序号:"))
            os.system("cls")
            # 选择下载集
            tb.clear()
            tb.field_names = ["序号", "标题", "ID", "时长"]
            tb.title = f"[{learning_list[xh]['courseid']}]{learning_list[xh]['name']}"
            course_detail_list = await self.get_course_detail_list(learning_list[xh]['courseid'], learning_list[xh]['name'])
            for index, t in enumerate(course_detail_list):
                tb.add_row([index, t['name'], t['taskid'], t['activityLength']])
            tb.add_row(["", "", "", ""])
            tb.add_row(["总计", f"{len(course_detail_list)}个", "", ""])
            print(tb)
            d_list_i = self.get_input_list(input("输入序号:"))
            logger.info(f"一共选择 {len(d_list_i)} 个视频")
            for i in d_list_i:
                # logger.info(f"正在下载 {t['name']}")
                await self.download_task(**course_detail_list[i])

    async def get_learning_list(self):
        url = "http://www.sikiedu.com/my/courses/learning"
        response = await self.session.get(url)
        html = etree.HTML(await response.text())
        course_divs = html.xpath("//div[contains(@class, 'my-course-item ')]")
        course_infos = []
        for course_div in course_divs:
            try:
                name = course_div.xpath(
                    ".//a[@class='cd-link-major']/text()")[0]
                url = course_div.xpath(
                    ".//div[@class='my-course-item__btn']/a/@href")[0]
                course_infos.append(
                    {
     "name": name, "courseid": url.split("/")[-1]})
            except Exception as e:
                logger.debug(e)
        return course_infos

    async def get_course_detail_list(self, courseid, coursename):
        url = f"http://www.sikiedu.com/my/course/{courseid}"
        response = await self.session.get(url, headers={
     "Referer": "http://www.sikiedu.com/my/courses/learning", "user-agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.137 Safari/4E423F"})
        html = etree.HTML(await response.text())
        tasks = json.loads(html.xpath(
            "//div[@class='hidden js-hidden-cached-data']/text()")[0].strip())
        task_infos = []
        for task in tasks:
            if task.get("type") == "video":
                task_infos.append({
     
                    "name": task["title"],
                    "taskid": task["taskId"],
                    "activityLength": task['activityLength'],
                    "courseid": courseid,
                    'coursename': coursename
                })
        return task_infos

    async def download_task(self, *, courseid, taskid, name, coursename, **kwargs):
        logger.info(f"准备下载 {name}")
        # 第一层
        logger.debug("解析第一层")
        activity_show_response = await self.session.get(f"http://www.sikiedu.com/course/{courseid}/task/{taskid}/activity_show")
        HTML = etree.HTML(await activity_show_response.text())
        info_div = HTML.xpath("//div[(@data-file-global-id)]")[0]
        # file_global_id = info_div.xpath("./@data-file-global-id")[0]
        data_url = info_div.xpath("./@data-url")[0]

        # 第二层
        logger.debug("解析第二层")
        response = await self.session.get(data_url)
        m3u8info = {
     }
        lines = (await response.text()).split('\n')
        i = 0
        url = ""
        while i < len(lines):
            result = re.match(
                r"#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=(?P\d+?),NAME=(?P\w+)", lines[i].strip())
            if result:
                i += 1
                url = lines[i].strip()
                m3u8info[result.group("name")] = lines[i].strip()
            i += 1

        if self.qxd in m3u8info:
            url = m3u8info[self.qxd]

        # 第三层
        logger.debug("解析第三层")
        with TemporaryDirectory() as tempdir:
            response = await self.session.get(url)
            all_content = await response.text()
            if "#EXTM3U" not in all_content:
                raise BaseException("非M3U8的链接")

            file_line = all_content.split("\n")
            match = re.search(
                r"#EXT-X-KEY:METHOD=AES-128,URI=\"(?P.*?)\",IV=(?P0x[\d\w]*)", all_content)
            key_uri = match.group("uri")
            response = await self.session.get(key_uri)
            key = (await response.text()).strip()

            iv = match.group("iv")
            iv = int(iv, 16).to_bytes(length=16, byteorder='big')
            cryptor = AES.new(key, AES.MODE_CBC, key)

            tasks = []
            i = 0
            sem = Semaphore(self.max_worker)
            async with ClientSession(headers={
     "user-agent": "user-agent"}) as session:
                for url in file_line:
                    if url.startswith("http"):
                        tasks.append(self.download(session, url, i, sem))
                        i += 1
                    if url.startswith("#EXT-X-ENDLIST"):
                        break
                logger.info("开始下载")
                for task in tqdm(asyncio.as_completed(tasks), total=len(tasks)):
                    num, content = await task
                    with open(os.path.join(tempdir, f"{num}.ts"), "wb") as f:
                        f.write(cryptor.decrypt(content))
            # 合并
            logger.debug("合并中")
            coursename = re.sub(r"[^\d\w]", "", coursename)
            if not (os.path.exists(f"./{coursename}") and os.path.isdir(f"./{coursename}")):
                os.mkdir(f"./{coursename}")

            with open(f"./{coursename}/{name}.mp4", "wb") as f:
                for num in tqdm(range(i)):
                    with open(os.path.join(tempdir, f"{num}.ts"), "rb") as ff:
                        f.write(ff.read())

    async def download(self, session, url, num, sem) -> bytes:
        async with sem:
            response = await session.get(url)
            content = await response.content.read()
            return num, content
    def get_input_list(self, r_input):
        """解析选择的序号
        Args:
            r_input (str): [原始输入]
        >>> get_input_list("1, 2, 3")
        [1, 2, 3]
        >>> get_input_list("1-3")
        [1, 2, 3]
        >>> get_input_list("1-4,5,6-8")
        [1, 2, 3, 4, 5, 6, 7, 8]
        """
        result = []
        r_input = re.sub(r"[^\d\-\,]", "", r_input)  # 去掉多余不支持的符号
        d_s: List[str] = r_input.split(",")  # 先按照都好分隔
        for d in d_s:
            if d.isdigit():
                result.append(int(d))
            elif "-" in d:
                start, end = d.split("-")
                result += list(range(int(start), int(end)+1))
        return result

if __name__ == "__main__":
    try:
        asyncio.run(Siki().main())
    except Exception as e:
        logger.error(f"{e}")
    finally:
        os.system("pause")

4、运行效果

5、一些小问题

如果终端显示二维码像这样

设置一下等宽字体就行了，同样在cmd或者powershell也是一样，设置字体，百度设置等宽字体

6、声明

仅供学术交流，请勿违法使用，如有不足之处或更多技巧，欢迎指教补充。

负载均衡策略之轮询策略 Time-Traveler Python 算法与数据结构
本文转自:https://mozillazg.com/2019/02/load-balancing-strategy-algorithm-weighted-round-robin.html#hidround-robin,尊重原创前言:本文简单介绍一下轮询(RoundRobin)这个负载均衡策略。轮询选择(RoundRobin):轮询选择指的是从已有的后端节点列表中按顺序依次选择一个节点出来提供服务
文本转语音常用的几个python库天蓝海乡 python 开发语言人工智能 nlp 语音识别
在Python编程领域，文本到语音（Text-to-Speech,TTS）的转换是一个常见的需求，尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库，它们可以帮助开发者实现文本到语音的转换，并且有的可以将转换后的语音保存为MP3文件。gTTS(GoogleText-to-Speech)gTTS是一个依赖于Google的文本转语音API的Python库。它能够将文本转换为自然听起
P2P下载器项目我的sun&shine 项目
1.项目介绍该项目完成一个在局域网中进行附近文件共享下载功能的工具；能够进行搜索匹配局域网中运行工具的主机；获取到局域网在线主机列表；能够获取指定主机所共享的文件信息列表（指定的共享目录下的文件信息）；能够对指定主机上的指定文件进行多进程分块下载来提高传输效率。2.项目使用的技术Socket套接字编程（了解最基本线程池版本任务处理的tcp服务端程序）HTTP协议格式（了解最基本的http服务器中数
CAD二次开发踩过的坑我的sun&shine CAD二次开发 c++
CAD二次开发踩过的坑CAD二次开发踩过的坑一、3D图形编译不过二、智能指针三、多文档操作规范流程四、CAD系统变量（参数）大全五、细节注意CAD图纸在软件中出现许多连接线线怎么关闭C++try无法展开无调试信息：重新生成变量已被优化掉,因而不可用两个列表中选中第一个再选第二个时第一个的选中见了预览时无法找到k3DDrawing无法缩放：静态框的通知打开intersectWith无法求交点对话框老
FPGA实战1-流水灯实验verilog 马志高 FPGA fpga开发
1.实验要求（1）设计一个流水灯的实验，实现12位流水灯的依次点亮，（2）流水灯的流转时间是（500ms/2Hz），（3）系统时钟位50MHz，（4）定义12个寄存器ledtemp保存12个状态，（5）寄存器的初始值位12'b0000_0000_0001，（6）当移位到12‘b1000_0000_0000时，ledtemp的值回到12'b0000_0000_0001,2.设计代码//coding/
SNMP协议以及JAVA实战代码展示 potato_h java
SNMP协议以及代码实现主要是为了实现：Java通过SNMP协议和交换机进行交互JAVA开发SNMP明细第一步：（1）首先安装SNMP服务。（控制面板→添加与删除工具→添加与删除组件→管理和监视工具→详细信息→选择“简单网络管理协议”→确定）。（2）启动snmp服务。（3）下载snmp4j.jar（4）新建项目，加如snmp4j.jar，编写代码编写的代码中需要的内容：（1）枚举网元类型（目前只有
python之pyttsx3实现文字转语音播报 l8947943 python问题语音识别人工智能 pyttsx3 python朗读
1.pyttsx3是什么pyttsx3是Python中的文本到语音转换库，可以实现文本的朗读功能。2.pyttsx3的安装pipinstallpyttsx33.pyttsx3的demoimportpyttsx3pyttsx3.speak("Areyouok?")pyttsx3.speak("最近有许多打工人都说打工好难")戴上耳机直接跑即可。是不是很简单！那如果我们想对读音的速率，中英文问题进行自
如何用Function Calling解锁OpenAI的「真实世界」交互能力？（附Node.js 实战） hongkid AI编程
一、FunctionCalling：大模型的「手脚延伸器」1.1核心定义FunctionCalling是OpenAI在2023年6月13日推出的革命性功能（对应模型版本gpt-3.5-turbo-0613和gpt-4-0613），允许开发者通过自然语言指令触发预定义函数，实现大模型与现实世界系统的交互。如同给语言模型安装「手脚」，使其不仅能思考，还能执行具体操作。openai官方说明：https:
Python报错解决：img2pdf.AlphaChannelError: Refusing to work on images with alpha channel 定星照空 python 人工智能
img2pdf.AlphaChannelError:Refusingtoworkonimageswithalphachannel-solved解决img2pdf模块不能上传含alpha通道透明度的图片的问题解决img2pdf模块PNG图片转PDF文件因alpha通道报错问题文章目录前言一、AlphaChannelError为什么出现？二、该种报错解决方法1.方法一：转化其他格式图片2.方法二：去除
基于PyCATIA的工程图视图锁定工具开发实战解析 Python×CATIA工业智造 CATIA二次开发 python 自动化
引言本文针对CATIA工程图设计中视图误操作问题，基于PySide6与PyCATIA库开发了一款轻量化视图锁定工具。通过Python二次开发实现全视图/选定视图快速锁定、非模态交互界面及状态实时反馈功能，有效提升大型装配体工程图操作效率。文章深度解析代码架构设计、关键技术实现及工程应用价值，提供完整的开发方法论。一、工具功能与工程应用场景1.1核心功能模块功能模块技术指标应用场景全视图锁定批量操作
Python中Pyttsx3库实现文本转化成语音MP3格式文件定星照空 python
Pyttsx3库介绍pyttsx3库是一个功能强大且使用方便的Python本地文本转语音库。它不仅能在离线下将文本转换为语音MP3格式文件，也能在Windows、MacOS和Linux等多个操作系统上实现语音播报。同时，还可以调整语音播报的语速、音量和音色。安装与基本使用安装：cmd命令行中执行pipinstallpyttsx3。基本使用示例：importpyttsx3#初始化语音引擎engine
计算机毕业设计指南晴天毕设课程设计毕业设计 java 毕设开发语言
毕业设计是计算机专业学生展示综合能力的重要环节，不仅是对所学知识的总结，也是进入职场或深造前的实战演练。本文将从选题、需求分析、系统设计、编码实现、测试优化、论文撰写、答辩准备等方面，为你提供一份详细的毕业设计指南。如果有其他问题，可以点击文章末尾名片咨询，可免费分享源码1.选题阶段选题是毕业设计的起点，直接影响后续工作的难度和完成质量。选题原则兴趣驱动：选择自己感兴趣的方向，能够激发研究动力。创
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
openai-agents 中custom example agent ZHOU_CAMP oi_agents 人工智能
代码pipshowopenai-agentsName:openai-agentsVersion:0.0.4Summary:OpenAIAgentsSDKHome-page:https://github.com/openai/openai-agents-pythonAuthor:Author-email:OpenAILicense-Expression:MITLocation:d:\soft\ana
Python 向量检索库Faiss使用懒大王爱吃狼 python python 开发语言自动化 Python基础 python教程
Faiss（FacebookAISimilaritySearch）是一个由FacebookAIResearch开发的库，它专门用于高效地搜索和聚类大量向量。Faiss能够在几毫秒内搜索数亿个向量，这使得它非常适合于实现近似最近邻（ANN）搜索，这在许多应用中都非常有用，比如图像检索、推荐系统和自然语言处理。以下是如何使用Faiss的基本步骤和示例：1.安装Faiss首先，你需要安装Faiss。你可
Python 应用部署云端实战指南 —— AWS、Google Cloud 与 Azure 全解析清水白石008 python Python题库 python aws azure
Python应用部署云端实战指南——AWS、GoogleCloud与Azure全解析在当下云计算飞速发展的时代，将Python应用部署到云平台已成为大多数开发者和企业的首选。无论是构建Web服务、API接口，还是自动化任务调度，云平台都能为我们提供高可靠性、弹性伸缩与简便管理的优势。本文将详细阐述如何将Python应用分别部署到AWS、GoogleCloud与Azure，并介绍各平台下涉及的部署工
Python编程：为什么使用同步原语林十一npc Python语言 python 开发语言
Python编程：为什么使用同步原语1.同步原语同步原语：计算机科学中用于实现进程或线程之间同步的机制。目的：提供一种方法来控制多个进程或线程的执行顺序，确保他们以一致的方式访问共享资源在多线程/多进程编程中，多个执行单元可能同时访问共享资源，导致竞态条件。同步原语通过协调执行顺序，确保数据一致性和操作原子性2.Python核心同步原语同步原语作用适用场景模块Lock（互斥锁）确保同一时间只有一个
python函数闭包和递归_闭包和递归_个人文章 - SegmentFault 思否 weixin_39830313 python函数闭包和递归
js变量的作用域:全局作用域(全局变量):在函数外面声明的变量**生命周期(变量从声明到销毁)：页面从打开到关闭.局部作用域(局部变量):在函数里面声明的变量**生命周：开始调用函数到函数执行完毕1.闭包使用介绍1.闭包介绍(closure)1.1闭包：是一个可以在函数外部访问函数内部变量的函数->闭包是函数1.2闭包作用：可以在函数外部访问函数内部变量->延长局部变量的生命周期1.3闭包语法：-
python函数闭包和递归_python函数基础3--闭包 + 递归 + 函数回调 weixin_39532019 python函数闭包和递归
一、闭包1.函数嵌套defouter():print("外层函数")definner():print("内层函数")returninner()outer()函数嵌套流程图2.闭包闭包的表现形式：函数里面嵌套函数，外层函数返回内层函数的函数名，这种情况就称之为闭包defouter():print("外层函数")definner():print("内层函数")returninnerret=outer(
AWS WAF实战指南：从入门到精通 ivwdcwso 安全 aws 网络云计算 WAF 安全
1.引言AmazonWebServices(AWS)WebApplicationFirewall(WAF)是一款强大的网络安全工具，用于保护Web应用程序免受常见的Web漏洞攻击。本文将带您从入门到精通，深入探讨AWSWAF的实际应用策略，并提供具体案例，帮助您更好地保护您的Web应用程序。2.AWSWAF基础2.1什么是AWSWAF？AWSWAF是一种Web应用程序防火墙，可以帮助保护您的Web
使用 Selenium 控制现有 Edge 窗口以规避爬虫检测秋叶原の黑猫数据库
在网络爬虫开发中，网站的防爬机制常常会检测自动化工具（如Selenium）启动的浏览器实例。为了绕过这种检测，一种有效的方法是利用Selenium连接到手动打开的现有浏览器窗口，而不是每次都启动一个新的实例。本文将详细介绍如何使用Selenium控制现有的MicrosoftEdge浏览器窗口，并结合代码示例展示实现过程。1.背景介绍：为什么需要控制现有窗口？传统的Selenium脚本会通过WebD
python中的递归、回调函数以及闭包总结敲代码敲到头发茂密 Python成长之路 python 开发语言
这里写目录标题一、递归例1：利用递归函数计算1到10的和例2：利用递归函数计算10的阶乘二、回调函数特别注意：在函数中的调用函数分为以下情况：1、同步回调2、异步回调三、闭包一、递归作用：在函数内部调用自己若干次例1：利用递归函数计算1到10的和defsum_num(num):ifnum>=1:sum=num+sum_num(num-1)else:sum=0returnsumprint(sum_n
使用Pygame实现记忆拼图游戏点我头像干啥 Ai pygame python 开发语言
引言记忆拼图游戏是一种经典的益智游戏，玩家需要通过翻转卡片来匹配相同的图案。这类游戏不仅能够锻炼玩家的记忆力，还能带来很多乐趣。本文将详细介绍如何使用Pygame库来实现一个简单的记忆拼图游戏。我们将从Pygame的基础知识开始，逐步构建游戏的各个部分，最终完成一个完整的游戏。1.Pygame简介Pygame是一个用于编写视频游戏的Python库，它基于SDL库（SimpleDirectMedia
《Python实战进阶》No28: 使用 Paramiko 实现远程服务器管理带娃的IT创业者 Python实战进阶 python 服务器开发语言
No28:使用Paramiko实现远程服务器管理摘要在现代开发与运维中，远程服务器管理是必不可少的一环。通过SSH协议，我们可以安全地连接到远程服务器并执行各种操作。Python的Paramiko模块是一个强大的工具，能够帮助我们实现自动化任务，如代码部署、批量命令执行和文件传输。本集将深入讲解Paramiko的核心功能，并通过实战案例展示如何高效管理远程服务器。核心概念和知识点SSH协议的基本原
.gitlab-ci.yml 配置文件详解程序媛夏天 Git gitlab ci/cd .gitlab-ci.yml
个人主页：不爱吃糖的程序媛‍♂️作者简介：前端领域新星创作者、CSDN内容合伙人，专注于前端各领域技术，成长的路上共同学习共同进步，一起加油呀！✨系列专栏：前端面试宝典、JavaScript进阶、vue实战资料领取：前端进阶资料以及文中源码可以在公众号“不爱吃糖的程序媛”领取git工具文档说明：https://docs.gitlab.com/ee/ci/yaml/gitlab_ci_yaml.ht
python八股（—） --FBV，CBV suohanfjiusbis 数据库 python
引言FBV是面向函数的视图。defFBV(request):ifrequest.method=='GET':returnHttpResponse("GET")elifrequest.method=='POST':returnHttpResponse("POST")CBV是面向类的视图。classCBV(View):defget(self,request):returnHttpResponse("G
新书速览|云原生Kubernetes自动化运维实践全栈开发圈云原生运维 kubernetes
《云原生Kubernetes自动化运维实践》本书内容：《云原生Kubernetes自动化运维实践》以一名大型企业集群运维工程师的实战经验为基础，全面系统地阐述Kubernetes（K8s）在自动化运维领域的技术应用。《云原生Kubernetes自动化运维实践》共16章，内容由浅入深，逐步揭示K8s的原理及实际操作技巧。第1章引领读者踏入Kubernetes的世界，详细介绍其起源、核心组件的概念以及
05.列表标签龙哥带你学编程 #html css
一、列表简介列表是网页中最常用的一种数据排列方式。有序列表：有先后顺序之分无序列表：无先后顺序之分定义列表：带有特殊含义的列表二、有序列表1、语法格式有序列表中的各个列表项是有顺序的…列表项列表项注意：ol和li是配合一起使用的，不可以单独使用；ol的子标签只能是li标签，不能是其他标签。2、基本特征有序列表是由有顺序的列表项组成的有序列表一般采用数字或字母作为顺序，默认采用数字顺序是块元素独占一
【纯职业小组——思维】 Kent_J_Truman 蓝桥杯算法
题目思路第十五届蓝桥杯省赛PythonB组H题【纯职业小组】题解（AC）_蓝桥杯纯职业小组-CSDN博客代码#includeusingnamespacestd;usingll=longlong;intmain(){ios::sync_with_stdio(0);cin.tie(0);intt;cin>>t;while(t--){intn;llk;cin>>n>>k;unordered_maph;f
第十五届蓝桥杯省赛PythonB组B题【数字串个数】题解（AC）信奥郭老师蓝桥杯职场和发展
设n=10000n=10000n=10000。法一枚举333的个数以及777的个数，假设333的个数为iii，777的个数为jjj，那么非3,73,73,7的个数即为n−i−jn-i-jn−i−j。在长度为nnn的字符串中选取iii的方案数为CniC^i_nCni，在剩余n−in-in−i个位置选取jjj个的方案数为Cn−ijC^j_{n-i}Cn−ij，剩余位置个数为n−i−jn-i-jn−i−
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><