懷淰メ

python3GUI--实用！B站视频下载工具（附源码）

文章目录

一．准备工作
二．预览
- 1.启动
- 2.解析
- 3.下载中
- 4.下载完成
- 5.结果
三．设计流程
- 1.bilibili_video_spider
- 2.视频json的查找
四．源代码
- 1.Bilibili_Video_Downloader-GUI
- 2.bilibili_video_spider
五．总结

由于B站没有PC客户端，电脑下载视频很不方便，遂使用Tk编写一款B站视频下载工具，输入一个网址选择清晰度之后就能够下载对应的视频，可以下载单P、合集、合集单P，使用可视化GUI图形界面，交互性更强，来吧，展示~

一．准备工作

tkinter、os系统模块、re正则模块、subprocess新的进程模块、还有本次比较重要的ffmpeg.exe用于视频和音频的合并，关于ffmpeg请参考：

ffmpeg - 百度百科

二．预览

1.启动

2.解析

解析出多个清晰度视频以供下载

3.下载中

4.下载完成

分别下载完视频和音频后，对它们进行合并，最后输出一个完整的视频文件

5.结果

1080P+，针不戳

三．设计流程

1.bilibili_video_spider

2.视频json的查找

首先查看网页源代码
在网页的这个js里，能够找到关于视频的相关视频、音频、视频质量、长度、格式…等信息，直接正则截取就好啦
紧接着，下面这个js里，就是视频的aid、分P信息、up主信息、相关视频推荐信息，也用正则就能截取

四．源代码

1.Bilibili_Video_Downloader-GUI

from tkinter import *
from tkinter import ttk
from tkinter import messagebox
import os
import threading
from bilibili_video_spider import Bibili_Video_Spider as sp2
import re
from my_util import My_Util
"""
GUI+Spider
"""
class App:
    def __init__(self):
        self.base_dir = './bilibili_videos/'
        self.start_flag=''
        self.has_more_flag=''
        self.spider=sp2()
        self.create_widget()
        self.set_widget()
        self.place_widget()
        self.window.mainloop()

    def create_widget(self):
        self.window = Tk()
        self.window.title('Bilibili_Video_Downloader-v1.0')
        width = 450
        height = 520
        screen_width = self.window.winfo_screenwidth()
        screen_height = self.window.winfo_screenheight()
        left = (screen_width - width) / 2
        top = (screen_height - height) / 2
        self.window.geometry("%dx%d+%d+%d" % (width, height, left, top))
        self.window.resizable(0, 0)
        self.l1 = ttk.Label(self.window, text='请输入视频链接地址：')
        self.e1_var=StringVar()
        self.e1 = ttk.Entry(self.window, width=90,textvariable=self.e1_var)
        self.l5 = ttk.Label(self.window, text='选择清晰度：')
        self.combobox=ttk.Combobox(self.window,state='readonly',width=15,justify='center')
        self.l2 = ttk.Label(self.window, text='当前状态：')
        self.t1 = Text(self.window, width=80, height=20)
        self.l3_var=StringVar()
        self.l3 = ttk.Label(self.window, text='当前下载进度：',textvariable=self.l3_var)
        self.progress=ttk.Progressbar(self.window,orient=HORIZONTAL,length=400,mode='determinate',value=0,maximum=100)
        self.l4_var = StringVar()
        self.l4_var.set('0.0%[未下载]')
        self.l4 = ttk.Label(self.window, textvariable=self.l4_var)
        self.b1 = ttk.Button(self.window, text='解析', command=lambda: self.thread_it(self.pre_analysis))
        self.b2 = ttk.Button(self.window, text='下载', command=lambda: self.thread_it(self.donwload_video))

    def set_widget(self):
        self.window.protocol('WM_DELETE_WINDOW', self.quit_window)
        self.window.bind('', self.escape)
        self.e1.bind('', self.enter)
        self.b2.config(state=DISABLED)
        self.combobox.config(value=['--请先解析--'])
        self.combobox.current(0)

    def place_widget(self):
        self.l1.pack(anchor="w")
        self.e1.pack(anchor="w", padx=20)
        self.l5.pack(anchor="w",pady=5)
        self.combobox.pack(anchor="center")
        self.l2.pack(anchor="w")
        self.t1.pack(anchor="w", padx=20)
        self.l3.pack(anchor="w",pady=5)
        self.progress.pack(pady=5)
        self.l4.pack()
        self.b1.pack(side='left', padx=90)
        self.b2.pack(side='left', padx=10)

    def pre_analysis(self):
        input_video_link = self.e1.get()
        input_video_link=input_video_link.strip()
        if input_video_link.startswith(r'https://www.bilibili.com/video/'):
            if '&' in input_video_link:
                raw_link=input_video_link.split('&')[0]
            else:
                raw_link=input_video_link
            try:
                #av 转 bv
                av_number = int(re.findall('https://www.bilibili.com/video/av(\d+)?', raw_link)[0])
                url=raw_link.replace(av_number,My_Util().av_convert_bv(av_number))
            except IndexError:
                url=raw_link
            self.spider.set_start_url(url)
            self.spider.get_page_html()
            self.video_number = self.spider.get_video_number()
            base_title = self.spider.get_video_title()
            if re.match('https://www.bilibili.com/video/.*\?p=\d+',url):
                current_num=re.findall('https://www.bilibili.com/video/.*\?p=(\d+)',url)
                self.has_more_flag=True
                self.current_video_title=self.spider.part_name_list[int(current_num[0])]
            else:
                self.has_more_flag=False
                self.current_video_title=base_title
            self.entrace_url=url
            self.analysis_videos(url)
            if self.start_flag!=True:
                self.b2.config(state=NORMAL)
            # self.b1.config(state=DISABLED)
        else:
            messagebox.showwarning('警告', '请输入正确的分享链接！')
            self.e1_var.set('')

    def analysis_videos(self,url):
        """
        :param url:
        :return:
        """
        My_Util().do_makedirs(self.base_dir)
        self.video_item_ = self.spider.get_video_and_audio(self.spider.get_video_detail_json())
        video_quality_list=[]
        for video_detail in self.video_item_['video_detail']:
            for data in video_detail.items():
                video_quality_list.append(data[0])
        self.combobox.config(value=video_quality_list)
        self.combobox.current(0)
        self.t1.delete(0.0,END)
        self.insert_to_t1(f'[视频标题]：{
       self.current_video_title}')
        self.insert_to_t1(f'[视频时长]：{
       self.video_item_["video_length"]}')
        self.insert_to_t1(f'[视频清晰度]：{
       "  ".join(video_quality_list)}')
        self.insert_to_t1(f'请选择清晰度后点击下载按钮---------------',time_str=False)

    def donwload_video(self):
        self.start_flag=True
        self.b2.config(state=DISABLED)
        if self.has_more_flag:
            ret = messagebox.askyesno('提示', '此视频包含多P，是否下载全集？')
            if ret:
                download_more=True
            else:
                download_more=False
        else:
            download_more=False
        for i in range(self.video_number):
            if download_more:
                begin_url = self.entrace_url.split('?')[0] + f'?p={
       i+1}'
                self.spider.video_title = self.spider.part_name_list[i]
                current_title=self.spider.part_name_list[i]
            else:
                begin_url=self.entrace_url
                self.spider.video_title = self.current_video_title
                current_title =self.current_video_title
            self.insert_to_t1(f'开始下载{
       current_title}---------------')
            self.l3_var.set('视频下载进度：')
            self.spider.set_start_url(begin_url)
            video_item_ = self.spider.get_video_and_audio(self.spider.get_video_detail_json())
            video_url_list=[]
            for video_detail in video_item_['video_detail']:
                for data in video_detail.items():
                    video_url_list.append(data[1])
            download_url = video_url_list[self.combobox.current()]
            current_video_name=self.spider.part_name_list[i]
            for progrees, speed in self.spider.down_video(download_url,):
                self.progress['value'] = progrees
                self.l4_var.set(f'进度：%.1f%% 速度：%s' % (progrees, speed))
                self.progress.update()
            self.insert_to_t1(f'[{
       current_video_name}视频下载完成...')
            self.l4_var.set('100%[下载完成]')
            self.insert_to_t1('-' * 30)
            audio_url = video_item_['audio_url']
            self.insert_to_t1(f'开始下载{
       current_title}音频---------------')
            self.l3_var.set('音频下载进度：')
            for progrees, speed in self.spider.downlonad_autio(audio_url,):
                self.progress['value'] = progrees
                self.l4_var.set(f'进度：%.1f%% 速度：%s' % (progrees, speed))
                self.progress.update()
            self.insert_to_t1(f'[{
       current_video_name}音频下载完成...')
            self.l4_var.set('100%[下载完成]')
            self.insert_to_t1('-' * 30)
            self.insert_to_t1(f'开始合并视频---------------')
            if (self.spider.mix_video()):
                self.insert_to_t1(f'清理临时视频文件完成---------------')
                self.insert_to_t1(f'清理临时音频文件完成---------------')
                self.insert_to_t1(f'合并视频完成---------------')
            else:
                self.insert_to_t1(f'发生了异常错误！---------------')
            if not download_more:
                break
        self.b1.config(state=NORMAL)
        self.b2.config(state=NORMAL)

    def insert_to_t1(self,line,time_str=True):
        if time_str==True:
            time_string=My_Util().get_time_string()
            self.t1.insert(END,f'[{
       time_string}]'+line+'\n')
        else:
            self.t1.insert(END,line+'\n')
        self.t1.yview_moveto(1)

    def open_dir(self):
        abs_path = os.path.abspath(self.base_dir)
        # 使用绝对路径打开文件夹
        os.startfile(abs_path)

    def quit_window(self):
        ret = messagebox.askyesno('提示', '是否要退出？')
        if ret == True:
            self.window.destroy()

    def escape(self,event):
        self.quit_window()

    def connect_author(self):
        messagebox.showinfo('联系作者', '作者QQ：懷淰メ')

    def enter(self,event):
        self.thread_it(self.pre_analysis)

    def thread_it(self,func, *args):
        t = threading.Thread(target=func, args=args)
        self.window.update()
        t.setDaemon(True)  # 设置守护，主线程结束，子线程结束
        t.start()

if __name__ == '__main__':
    App()
    """
    test         https://www.bilibili.com/video/BV1ML411J7es
    """

2.bilibili_video_spider

import json
import requests
import re
import os
import subprocess
from my_util import My_Util
import time

"""
版本2分别下载音频和视频，通过ffmpeg合并

三种情况
1.单P
2.多P下载单集
3.多P下载全集

"""
class Bibili_Video_Spider(object):
    def __init__(self,):
        self.s=requests.session()
        self.headers={
     
            'Content-Range': 'bytes 0-xxxxxx',
            "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
        }
        self.util=My_Util()

    def set_start_url(self,start_url):
        self.start_url=start_url
        self.get_page_html()

    def get_video_title(self):
        """
        起始视频标题，作为下载视频的目录名
        :return:
        """
        regx='name="keywords" content="(.*?),'
        title=re.findall(regx,self.srart_html)
        title=title[0]
        return title

    def get_page_html(self):
        """
        获取网页源代码
        :return:
        """
        headers={
     
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',
        'Content-Range': 'bytes 0-xxxxxx',
        'Referer': self.start_url
    }
        r=self.s.get(self.start_url,headers=headers)
        if r.status_code==200:
            r.encoding='utf-8'
            self.srart_html=r.text

    def get_video_number(self):
        """
        是否含有多P，若含有分P，则将所有分P名字存入list
        :return:
        """
        html_part = re.findall('window.__INITIAL_STATE__=(.*?) , self.srart_html)
        part_json_str = html_part[0].split(';(function(){var')[0]
        part_json = json.loads(part_json_str.strip())
        pages = part_json['videoData']['pages']
        self.part_name_list = [part_name['part'] for part_name in pages]
        if len(pages)!=1:
            part_number=len(pages)

        else:
            part_number=1
        return part_number

    def get_video_detail_json(self):
        """
        获取视频详情json,里面包括视频m4a地址，以及audio音频，版本2主要依赖此Json
        :return:
        """
        regx='window.__playinfo__=(.*?)


    
        你可能感兴趣的:(python爬虫,GUI,python小工具,python,gui,爬虫,接口)
        
            
                
                    Python类中魔术方法(Magic Methods)完全指南：从入门到精通
                        盛夏绽放
python开发语言
                        文章目录Python类中魔术方法(MagicMethods)完全指南：从入门到精通一、魔术方法基础1.什么是魔术方法？2.魔术方法的特点二、常用魔术方法分类详解1.对象创建与初始化2.对象表示与字符串转换3.比较运算符重载4.算术运算符重载5.容器类型模拟6.上下文管理器7.可调用对象三、高级魔术方法1.属性访问控制2.描述符协议3.数值类型转换四、魔术方法最佳实践五、综合案例：自定义分数类Pyt
                    
                    Python面向对象编程(OOP)详解：通俗易懂的全面指南
                        盛夏绽放
python开发语言有问必答
                        前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章目录Python面向对象编程(OOP)详解：通俗易懂的全面指南一、OOP基本概念1.什么是面向对象编程？2.OOP的四大支柱3.核心概念对比表二、类和对象1.类(Class)vs对象(Object)2.类结构详解三、OOP三大特性详解1.封装(Encapsulation)2.继承(Inherita
                    
                    〖Python 数据库开发实战 - Redis篇②〗- Linux系统下安装 Redis 数据库
                        哈哥撩编程
#⑤-数据库开发实战篇Python全栈白宝书python数据库数据库开发实战linux安装redis
                        订阅Python全栈白宝书-零基础入门篇可报销！白嫖入口-请点击我。推荐他人订阅，可获取扣除平台费用后的35%收益，文末名片加V！说明：该文属于Python全栈白宝书专栏，免费阶段订阅数量4300+，购买任意白宝书体系化专栏可加入TFS-CLUB私域社区。福利：加入社区的小伙伴们，除了可以获取博主所有付费专栏的阅读权限之外，还有机会加入星荐官共赢计划，详情请戳我。作者：不渴望力量的哈士奇(哈哥)，
                    
                    python分布式爬虫打造搜索引擎--------scrapy实现
                        weixin_30515513
爬虫python开发工具
                        http://www.cnblogs.com/jinxiao-pu/p/6706319.html最近在网上学习一门关于scrapy爬虫的课程，觉得还不错，以下是目录还在更新中，我觉得有必要好好的做下笔记，研究研究。第1章课程介绍1-1python分布式爬虫打造搜索引擎简介07:23第2章windows下搭建开发环境2-1pycharm的安装和简单使用10:272-2mysql和navicat的安装
                    
                    上传文件csv并解析list_基于PyQt5表格控件TableWidget的csv文件内容显示
                        

                        (70后红太阳2020年4月写于成都)一、配置环境开发环境：Win7；开发工具：Python3.8.2IDLE，QtDesigner5.13.2；Python安装目录：D:python；文件保存目录：D:python基于PyQt5表格控件TableWidget的csv文件内容显示；路径配置：在cmd下，运行path=%path%;Dpythonpython38-32scripts;D:python
                    
                    Duckdb处理excel文件
                        __风__
duckdbexcel
                        duckdb通过xlsx扩展读写excel文件，但是不支持xls格式。具体可以参考https://duckdb.org/docs/stable/guides/file_formats/excel_importhttps://duckdb.org/docs/stable/guides/file_formats/excel_export常用测试例子：使用duckdbcli工具将PG的数据导入到exce
                    
                    【OpenGL ES】绘制正方形
                        LittleFatSheep

                        1前言【OpenGLES】绘制三角形中介绍了绘制三角形的方法，本文将介绍绘制正方形的方法。OpenGL以点、线段、三角形为图元，没有提供绘制正方形内部的接口。要绘制正方形内部，必须通过三角形拼接而成，如下图，是通过GL_TRIANGLE_FAN模式绘制正方形。img绘制的坐标点如下，由于此坐标是以画布中心为坐标原点，水平向右为x轴正方向，竖直向上为y轴正方向，其值是相对画布宽度和高度的比值。一般而
                    
                    马斯克整出的半仙儿，Chat GPT会让多少白领失业？可能会带来哪些变化？
                        良辰美景5566

                        这几天，ChatGPT火了，是美国一家叫OpenAI的高科技公司研发的，背后的投资人是谁？——埃隆马斯克！这哥们儿只要一出手，注定就和新奇呀伟大呀啥的绑在一起了，他搞的项目，比如特斯拉、星链、脑机接口，光听名字就透着不俗。很多人纳闷儿，他这次搞得ChatGPT是个啥玩意儿？简单说就是一个人工智能聊天软件，这个软件比以往的智能聊天软件强在哪儿？这么说吧，这简直就是个半仙儿啊。如果您是一位老人，这个C
                    
                    告别内存焦虑！用Dask打开Python大数据并行计算的“任意门“
                        小张在编程
python大数据开发语言
                        引言当你在Jupyter里用Pandas读取20GB的CSV文件，看到内存占用率从10%飙升到90%，最后弹出"MemoryError"时；当你想对亿级数据做分组聚合，却发现单线程计算要等上半小时——这些场景是不是像极了用小推车搬运万吨货物？Python生态中，Dask库就像一台"并行计算推土机"，能把大数据拆分成小块并行处理，让你的普通电脑也能拥有分布式计算的能力。本文将从原理到实战，带你掌握这
                    
                    网络爬虫-07
                        YEGE学AI算法
Python-网络爬虫
                        网络爬虫-07）**Spider06回顾****scrapy框架****完成scrapy项目完整流程****我们必须记住****爬虫项目启动方式****数据持久化存储****Spider07笔记****分布式爬虫****scrapy_redis详解****腾讯招聘分布式改写****机器视觉与tesseract****补充-滑块缺口验证码案例****豆瓣网登录****Fiddler抓包工具****移
                    
                    Django项目运行报错：ModuleNotFoundError: No module named ‘MySQLdb‘
                        

                        解决方法：在__init__.py文件下，新增下面这段代码importpymysqlpymysql.install_as_MySQLdb()注意：确保你的python有下载pymysql库，没有的话可以使用pipinstallpymysql安装原理：用pymysql来代替mysqlLab__init__.py文件大致位置在：
                    
                    抽象类与接口详解
                        晚•夜
java基础知识开发语言
                        抽象类与接口1.抽象类1.定义抽象类2.抽象方法3.继承抽象类4.实例化子类5.抽象类的作用2.接口1.定义接口2.实现接口3.接口的作用4.默认方法与静态方法3.相同点与不同点1.相同点：2.不同点（区别）：1.抽象类抽象类是面向对象编程中的一个重要概念，它用于定义不能被实例化的类。抽象类主要用于建立类的继承关系和定义公共的属性和方法，它为子类提供了一个共同的模板。下面是一些关于抽象类的介绍：1
                    
                    [Py026]Snakefile灵活传递param
                        安哥生个信

                        snakemake是用python编写的，最近串流程用的比较频繁，所以也归纳在python实用技巧里面。现在需要实现的一个功能是——根据每一个input自身的特点，返回一个值（可能是固定，也可能是随机）；然后将这个返回值传递给下面的运行代码。举例：现在有两个fastq文件20192.fastq.gz20193.fastq.gz，需要通过seqkit转换为fasta文件；如果文件名是奇数，则转换出来
                    
                    Python日志终极指南：深入探索logging日志管理模块
                        c01dkit
pythonpython开发语言
                        在任何一个严谨的软件开发项目中，日志（Logging）都是不可或缺的一环。它不仅是调试代码的利器，更是线上问题追踪、性能分析和数据监控的重要依据。相比于随处可见的print()语句，Python内置的logging模块提供了更为强大、灵活且标准化的解决方案。[1][2]这篇博客将带你由浅入深，全面掌握logging模块的使用，从基础配置到高级技巧，再到企业级项目的最佳实践。一、告别print()：
                    
                    爬虫初认识
                        老杨玩python
python
                        关于爬虫你是否在夜深人静的时候，想看一些让你更睡不着的图片你是否在考试前夕或者面试前夕，想看一些具有针对性的题目和面试题你是否想在杂乱的网络世界中获取你想要的数据什么是爬虫：通过编写程序，模拟浏览器，去互联网上抓取我们想要的数据的过程爬虫的合法性爬虫不被法律禁止快播王欣技术本无罪但有法律风险爬虫干扰被访问网站的正常运营爬取受法律保护的特定类型的数据和信息如何避免法律风险时常优化爬虫程序，避免干扰网
                    
                    python大数据论文_大数据环境下基于python的网络爬虫技术
                        weixin_39775976
python大数据论文
                        软件开发大数据环境下基于python的网络爬虫技术作者/谢克武，重庆工商大学派斯学院软件工程学院摘要：随着互联网的发展壮大，网络数据呈爆炸式增长，传统捜索引擎已经不能满足人们对所需求数据的获取的需求，作为搜索引擎的抓取数据的重要组成部分，网络爬虫的作用十分重要，本文首先介绍了在大数据环境下网络爬虫的重要性，接着介绍了网络爬虫的概念，工作原理，工作流程，网页爬行策略，python在编写爬虫领域的优势
                    
                    【Python爬虫(26)】Python爬虫进阶：数据清洗与预处理的魔法秘籍
                        奔跑吧邓邓子
Python爬虫python爬虫开发语言数据清洗预处理
                        【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、数据清洗的重要性二、数据清洗的常见任务2.1去除噪声数据2.2
                    
                    117、Python机器学习：数据预处理与特征工程技巧
                        多多的编程笔记
python机器学习开发语言
                        Python开发之机器学习准备：数据预处理与特征工程机器学习是当前人工智能领域的热门方向之一。而作为机器学习的核心组成部分，数据预处理与特征工程对于模型的性能有着至关重要的影响。本文将带领大家了解数据预处理与特征工程的基本概念，以及它们在实际应用场景中的重要性。数据预处理数据预处理是机器学习中的第一步，它的主要目的是将原始数据转换成适合进行机器学习模型训练的形式。就像我们在做饭之前需要清洗和准备食
                    
                    如何通过linux黑窗口实现对远程服务器的操作
                        

                        ①选择合适的云平台进行设备的租用并复制好远程设备的IP地址②使用管理员权限打开黑窗口③输入命令连接远程的设备：ssh用户名@服务器IP地址，此时得到的是一个什么都没有的设备④由于该设备什么都没有，故先：sudoaptupdate，然后安装gcc编译器：sudoaptinstallbulid-essential，再然后安装python：sudoaptinstallpython-3.8，再然后安装mi
                    
                    Redis——API的理解和使用
                        莫问以

                        一、全局命令1、查看所有键keys*下面插入了3对字符串类型的键值对：127.0.0.1:6379>sethelloworldOK127.0.0.1:6379>setjavajedisOK127.0.0.1:6379>setpythonredis-pyOKkeys*命令会将所有的键输出：127.0.0.1:6379>keys*1)"python"2)"java"3)"hello"2、键总数dbsi
                    
                    PYTHON对接第三方验证码短信接口
                        短信接口开发

                        PYTHON短信接口对接demo#接口类型：互亿无线触发短信接口，支持发送验证码短信、订单通知短信等。#账户注册：请通过该地址开通账户http://user.ihuyi.com/?DKimmu#注意事项：#（1）调试期间，请使用用系统默认的短信内容：您的验证码是：【变量】。请不要把验证码泄露给其他人。#（2）请使用APIID及APIKEY来调用接口，可在会员中心获取；#（3）该代码仅供接入互亿无线
                    
                    第二十四篇 Requests+BeautifulSoup，秒抓网站信息！你的智能信息收集器！
                        爱分享的飘哥
日常效率自动化beautifulsoupPython爬虫Requests数据抓取办公自动化信息收集
                        python爬虫序言：手动复制粘贴网页数据？效率太低了1.网页数据抓取基础：HTTP请求与网页结构速览1.1HTTP请求：浏览器如何和网页交互？1.2网页结构：HTML，信息的载体2.Requests库：发送网络请求的利器2.1安装与基础用法：你的第一个HTTP请求2.2处理请求头与参数：模拟浏览器访问3.BeautifulSoup：解析网页的利器3.1安装与基础用法：快速解析HTML内容3.2精
                    
                    Redis 安全加固：从密码保护到高级安全配置
                        Seal^_^
数据库专栏#数据库--Redisredis安全数据库Redis安全加固
                        Redis安全加固：从密码保护到高级安全配置一、Redis安全概述二、密码认证配置1.设置Redis密码临时设置（重启后失效）永久设置（修改配置文件）2.密码认证流程3.Python连接示例三、网络层安全加固1.绑定内网IP2.修改默认端口3.防火墙配置四、危险命令禁用1.禁用敏感命令2.命令禁用前后对比五、高级安全配置1.TLS加密传输2.客户端证书认证3.ACL细粒度权限控制（Redis6.0
                    
                    【python库对比】路径专题 os.path和pathlib对比
                        尚未想好
python高频库对比python开发语言vscode
                        专栏收录：python高频库对比本专栏将持续更新在工程领域高频使用的python库之间的对比文章概览：简单介绍路径处理常用的python库及特点对比os.path和pathlib的异同结合代码示例说明两个库的差异.补充：os.path和pathlib高频使用接口见os.path和pathlib高频使用接口及示例1.简介Python中处理路径的库有很多，其中一些常用的包括：os.path模块：os.
                    
                    【自动化从入门到进阶】Playwright 实战指南，提升测试效率必修课！
                        朱公子的Note
pythonPlaywright自动化
                        你是否也有过“页面点击没反应，接口明明没问题”的糟心经历？就算写再多单元测试，也无法覆盖复杂的用户交互。而Playwright的出现，正为前端开发者和QA带来一剂“提效良方”：跨浏览器、强校验、自动重试、不再依赖Selenium！在2025年的软件开发浪潮中，Web应用的复杂性和用户期望持续攀升，单页应用（SPA）和跨浏览器兼容性让测试变得更加关键。想象一下，您的电商平台上线后因未发现的UI错误导
                    
                    如何解决pip安装报错ModuleNotFoundError: No module named ‘flask’问题
                        万粉变现经纪人
全栈Bug解决方案专栏pipflaskpythonpycharmscrapypandas后端
                        【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘flask’问题摘要在使用PyCharm进行Python开发时，常常需要通过pip安装第三方包以满足项目依赖。但在控制台执行pipinstallflask后，依旧可能出现ModuleNotFoundError:Nomodulenamed
                    
                    如何解决pip安装报错ModuleNotFoundError: No module named ‘sqlalchemy’问题
                        万粉变现经纪人
全栈Bug解决方案专栏pippandaspythonpycharmscipybeautifulsoupnumpy
                        【Python系列Bug修复PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘sqlalchemy’问题摘要在使用PyCharm控制台执行pipinstallsqlalchemy后，仍然在代码中提示ModuleNotFoundError:Nomodulenamed'sqlalchemy'，让许多开发者头疼。本文将
                    
                    04、抽象类与接口
                        想带你从多云到转晴
java开发语言
                        内容多，第二次复习时写的一、抽象类1、本质：当一个类不能描述一个具体对象时我们把它叫做抽象类2、与普通类的区别：它跟普通类一样可以定义成员方法和变量，但是不能实例化，它可以和普通类一样实现多态、向上转型、动态绑定以及拥有构造方法等等(它的主要作用就是用来继承的）这里举个实现的例子：publicabstractclassShape1{publicabstractvoiddraw();}publicc
                    
                    selenium后续！！
                        paid槮
selenium测试工具
                        小项目案例:实现批量下载网页中的资源根据15.3.2小节中的返回网页内容可知,用户只有获取了网页中的图片url才可以将图片下载到*在使用selenium库渲染网页后,可直接通过正则表达式过滤出指定的网页图片，从而实现批量下载接下来以此为思路来实现一个小项目案例。项目任务实现批量下载人民邮电出版社官网中与Python相关的图书封面图片。项目实步骤步骤1，获取人民邮电出版社官网中与Python相关的图
                    
                    Python爬虫博客：使用Selenium模拟登录并抓取需要身份验证的网站内容
                        Python爬虫项目
2025年爬虫实战项目python爬虫selenium信息可视化开发语言百度测试工具
                        引言在爬虫开发的过程中，我们常常遇到需要身份验证才能访问的网站。例如，很多社交媒体、新闻网站、电商平台等都要求用户登录才能访问一些特定内容。如何模拟登录并抓取这些需要身份验证的网页内容成为了一个非常重要且常见的需求。Selenium，作为一个强大的浏览器自动化工具，不仅可以模拟用户的浏览行为，还能够模拟用户输入用户名和密码、点击登录按钮等操作，突破了普通爬虫工具（如requests）无法处理的Ja
                    
                                java线程Thread和Runnable区别和联系
                                    zx_code
javajvmthread多线程Runnable
                                    我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。 
 
模拟窗口买票，第一例子继承thread，代码如下 
 
package thread;

public class ThreadTest {
	
	public static void main(String[] args) {
		
		Thread1 t1 = new Thread1(
                                
                                【转】JSON与XML的区别比较
                                    丁_新
jsonxml
                                    1.定义介绍 
(1).XML定义 
扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 
XML是标
                                
                                c++ 实现五种基础的排序算法
                                    CrazyMizzz
C++c算法
                                    #include<iostream>
using namespace std;


//辅助函数，交换两数之值
template<class T>
void mySwap(T &x, T &y){
	T temp = x;
	x = y;
	y = temp;
}

const int size = 10;

//一、用直接插入排
                                
                                我的软件
                                    麦田的设计者
我的软件音乐类娱乐放松
                                         这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
                                
                                linux awk命令详解
                                    被触发
linux awk
                                    awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 
awk处理过程: 依次对每一行进行处理，然后输出 
awk命令形式: 
awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file 
 [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
                                
                                各种语言比较
                                    _wy_
编程语言
                                                           Java Ruby PHP   擅长领域                      
                                
                                oracle 中数据类型为clob的编辑
                                    知了ing
oracle clob
                                    public void updateKpiStatus(String kpiStatus,String taskId){
	Connection dbc=null;
	Statement stmt=null;
	PreparedStatement ps=null;
	try {
		dbc = new DBConn().getNewConnection();
		//stmt = db
                                
                                分布式服务框架 Zookeeper -- 管理分布式环境中的数据
                                    矮蛋蛋
zookeeper
                                    原文地址： 
http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 
安装和配置详解 
本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
                                
                                tomcat数据源
                                    alafqq
tomcat
                                    数据库 
 
 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。 
 
 
 没有使用JNDI时我用要这样连接数据库： 
 
 
03.  Class.forName("com.mysql.jdbc.Driver");  
04.  conn
                                
                                遍历的方法
                                    百合不是茶
遍历
                                                                                          遍历 
在java的泛
                                
                                linux查看硬件信息的命令
                                    bijian1013
linux
                                    linux查看硬件信息的命令 
一.查看CPU： 
cat /proc/cpuinfo 
  
二.查看内存： 
free 
  
三.查看硬盘： 
df 
  
linux下查看硬件信息 
1、lspci 列出所有PCI 设备； 
lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
                                
                                java常见的ClassNotFoundException
                                    bijian1013
java
                                    1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory   添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization    
                                
                                【Gson五】日期对象的序列化和反序列化
                                    bit1129
反序列化
                                    对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 
  
1. 序列化时，Date对象序列化的字符串日期格式如何 
2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 
3. Date A -> str -> Date B,A和B对象是否equals 
  默认序列化和反序列化 
  
  
import com
                                
                                【Spark八十六】Spark Streaming之DStream vs. InputDStream
                                    bit1129
Stream
                                      1. DStream的类说明文档： 
  
/**
 * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous
 * sequence of RDDs (of the same type) representing a continuous st
                                
                                通过nginx获取header信息
                                    ronin47
nginx header
                                    1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， 
  if ( $http_cookie ~* "(.*)$") { 
          set $all_cookie $1; 
  } 
      变量$all_cookie就获得了cookie的值，可以用于运算了 
 

                                
                                java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999
                                    bylijinnan
java
                                    参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 
写了个java版的： 
 
 



public class Print_1_To_NDigit {

	/**
	 * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999
	 * 1.使用字符串
                                
                                Netty源码学习-ReplayingDecoder
                                    bylijinnan
javanetty
                                    ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 
 
http://bylijinnan.iteye.com/blog/1982618 
 
API说，ReplayingDecoder简化了操作，比如： 
 
FrameDecoder在decode时，需要判断数据是否接收完全： 
 
 

public class IntegerH
                                
                                js特殊字符过滤
                                    cngolon
js特殊字符js特殊字符过滤
                                    1.js中用正则表达式 过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) {    var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）&mdash;—|{}【】‘；：”“'。，、？]"
                                
                                hibernate使用sql查询
                                    ctrain
Hibernate
                                    
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import org.hibernate.Hibernate;
import org.hibernate.SQLQuery;
import org.hibernate.Session;
import org.hibernate.Transa
                                
                                linux shell脚本中切换用户执行命令方法
                                    daizj
linuxshell命令切换用户
                                    经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 
  
1、执行单个命令：su - user -c "command" 
如：下面命令是以test用户在/data目录下创建test123目录 
[root@slave19 /data]# su - test -c "mkdir /data/test123" 
                                
                                好的代码里只要一个 return 语句
                                    dcj3sjt126com
return
                                    别再这样写了：public boolean foo() {    if (true) {         return true;     } else {          return false;    
                                
                                Android动画效果学习
                                    dcj3sjt126com
android
                                    1、透明动画效果 
方法一：代码实现 
	public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState)
		{
			View rootView = inflater.inflate(R.layout.fragment_main, container, fals
                                
                                linux复习笔记之bash shell (4)管道命令
                                    eksliang
linux管道命令汇总linux管道命令linux常用管道命令
                                    转载请出自出处：
http://eksliang.iteye.com/blog/2105461   
  bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。 
    上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？ 
    答：非常的经典的一句话，记住了，何为管
                                
                                Android系统中自定义按键的短按、双击、长按事件
                                    gqdy365
android
                                    在项目中碰到这样的问题： 
由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 
1、单击事件：就是普通key的单击； 
2、双击事件：500ms内同一按键单击两次； 
3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 
4、组合按键：两个以上按键同时按住； 
                                
                                asp.net获取站点根目录下子目录的名称
                                    hvt
.netC#asp.nethovertreeWeb Forms
                                    使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： 
<asp:ListBox runat="server" ID="lbKeleyiFolder" /> 
  
那么在页面上显示根目录子文件夹的代码如下： 
string[] m_sub
                                
                                Eclipse程序员要掌握的常用快捷键
                                    justjavac
javaeclipse快捷键ide
                                       判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。       曾有人在豆瓣评
《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个
程序员图书列表，目的也就是通过读书，让程序员变懒。     写道   程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
                                
                                c++编程随记
                                    lx.asymmetric
C++笔记
                                     为了字体更好看，改变了格式…… 
  
&&运算符： 
  
#include<iostream> 
using namespace std; 
int main(){ 
     int a=-1,b=4,k; 
     k=(++a<0)&&!(b--
                                
                                linux标准IO缓冲机制研究
                                    音频数据
linux
                                    一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
                                
                                随想 生活
                                    暗黑小菠萝
生活
                                    其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。 
  
毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
                                
                                我认为POJO是一个错误的概念
                                    windshome
javaPOJO编程J2EE设计
                                      
            这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 
   &
                                
                
            
        
    


    
        
            按字母分类：
            ABCDEFGHIJKLMNOPQRSTUVWXYZ其他
        
    


    
        
            首页 -
            关于我们 -
            站内搜索 -
            Sitemap -
            侵权投诉
        
        版权所有 IT知识库 CopyRight © 2000-2050 E-COM-NET.COM , All Rights Reserved.