鑫xing

python爬虫，爬取哔哩哔哩视频

通过python爬虫实现爬取哔哩哔哩视频

- 通过python爬虫爬取blbl的一些视频
- 1，get_url函数
- 2，get_video函数
- 3，video_load函数
- 4，video_add_mp4函数
- 5，完整代码部分
- 6，运行结果

通过python爬虫爬取blbl的一些视频

工具：python3.6，pycharm，任意浏览器
相关库： request，re，lxml等

首先本次项目需要安装ffmpeg
这里是ffmpeg的安装教程

由于本人对爬虫也是处于刚起步状态，这篇文章我会尽可能得讲得详细（怕我以后也看不懂…）

1，get_url函数

首先，如果我们知道想要爬取视频的有效详细地址url是可以直接拿到html信息的。但是我们知道b站有个特点，每位up的视频在成功发布后，会有个唯一的特殊的编号，之前是av号，现在是bv号，这个编号就可以作为唯一标识去定位我们想要的视频。

所以现在我们有两种访问方法：1，通过地址直接访问。2，搜索它的av号或bv号，得到唯一搜索结果，拿到url，再去访问。

打开搜索界面随便搜索一下，我们可以观察到在地址中有个很明显的东西’keyword=2‘，它正好对应了我们的搜索内容，大部分网站的搜索功能都是通过这个keyword去传值。

所以我们通过去修改这个‘keyword’为av或bv号的url，就可以达到我们想要的搜索功能。
现在可以看到，当我们输入某一个完整的bv号后，只会返回给我们一个结果，而这个视频的url，就放在这个页面里，这样就很容易拿到了。

打开开发者工具，可以很容易地定位到视频标题以及它的地址的位置，这样通过xpath的标签定位就可以拿到。

现在我们定义一个get_url函数来拿到我们想要视频的url。

!!!这里注意，在pycharm运行中拷贝一个链接过来直接回车会直接去访问，所以我们需要空格一下再回车。并且这里我们重新定义了一个head2，后续会用到。

#get_url函数，选择搜索方式，
#参数：无
#作用：通过搜索返回视频的url地址
def get_url():
    print('请选择你的搜索方式')
    print('1：知道该视频的完整av号或者bv号')
    print('2：知道视频的有效链接地址')
    kind = int(input('请选择：'))
    if kind == 1:
        # print('kw')
        kw = input('输入你需要搜索的av号或者bv号,例如 bv1i4411f7p1:')
        url = 'https://search.bilibili.com/all?keyword='+kw+'&from_source=web_search'
        r_search = requests.get(url =url,headers =head1)
        r_search.encoding = r_search.apparent_encoding
        r_search_html = r_search.text
        # print(r_search_html)
        
        tree_search = etree.HTML(r_search_html)
        #href属性中存放的是一个list，且不完整，取出后与字符串'https:'拼接组成完整的url
        video_url = 'https:'+str(tree_search.xpath('//*[@id="all-list"]/div[1]/div[2]/ul/li[1]/a/@href')[0])
    else:
        print('!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!')
        print('!!!注意，在从网页拷贝的链接粘贴后,按一下空格再回车')
        kw = input('输入该视频的有效链接地址：')
        video_url = kw

    # 保持会话状态，在head中添加键值对:referer，存放上一次的会话的url,所以需要一个新的header
    head2 = {
     
             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.67',
             'Referer':video_url
    }
    return video_url,head2

2，get_video函数

现在我们打开刚刚视频的页面看看。

首先我们需要知道，b站的视频在网页中的播放分为两部分，一个音频，一个视频，它们同时工作，我们才能在网页中看到完整的视频。
在开发者工具中，ctrl+f搜索’playinfo‘，这个json串里存放哔哩哔哩视频的音频、视频信息

这样看起来杂乱无章，我们使用代码来让它有序些。
使用正则来定位到playinfo这里，取出这个json串。再使用json库的json_loads来帮助我们转化成更容易阅读的形式，再使用pprint.pprint再输出它。

json_data = re.findall('', r2_html)[0]
json_data = json.loads(json_data)
pprint.pprint(json_data)

现在就能很清楚地看到这个json串里面的数据。
里面包括有视频的清晰度，以及各种各样的url地址。现在我们能看到这里面有许许多多的地址，但是我们点击它会报一个403的错，错误说明这个链接是没有错的，但是我们没有权限去访问它。其实是可以访问的，但是我们没有保持视频页面的会话状态就去访问，那么服务器就会认为我们是爬虫而拒绝访问，所以在get_url函数中在head2中添加了‘Referer’，里面存放了视频的url，这样就相当于模拟了我们是先看了视频再去访问它的数据，这样才不会拒绝。

现在来定义第二个函数，get_url函数，从网页中返回视频title和存放视频和音频的两个url，共计三个元素

在这里定义了一个ss列表，里面是一些常见的符号，因为这些符号在后续的文件操作可能会导致错误，所以这里得将它们去除掉。

# get_video函数，
# 参数：网页的url
# 作用：从网页中返回视频title和存放视频和音频的两个url，共计三个元素
def get_video(url):
    r2 = requests.get(url=url, headers=head1)
    r2.encoding = r2.apparent_encoding
    r2_html = r2.text
    # 这里需要获取页面中playinfo中存放的json数据,这里存放了视频和音频文件

    tree2 = etree.HTML(r2_html)
    title = str(tree2.xpath('//*[@id="viewbox_report"]/h1/span/text()')[0])

    #去除一些符号，避免后续文件名操作时报错
    ss = ['\n', '，', '。', ' ', '—', '”', '？', '“', '（', '）', '、','|']
    df = [w for w in jieba.cut(title) if w not in ss]  # 去除标点符号
    title = ''  # 重新将除去标点的分词结果拼接
    for i in df:
        title = title + i

    print('视频标题："'+title+'"')
    json_data = re.findall('', r2_html)[0]
    json_data = json.loads(json_data)
    # pprint.pprint(json_data)
    '''提取音频'''
    audio_url = json_data['data']['dash']['audio'][0]['backupUrl'][0]
    # print(audio_url)
    print('已提取到音频地址')

    '''提取视频'''
    video_url = json_data['data']['dash']['video'][0]['backupUrl'][0]
    # print(video_url)
    print('已提取到视频地址')
    video_list = [title , audio_url , video_url]
    return video_list

3，video_load函数

现在我们拿到了两个重要的url，这一步就是将它存放的数据下载下来。

#video_load函数
#参数：存放上述三个数据的列表
#作用：下载音频和视频
def video_load(video_list):
    # 下载保存音频和视频两种文件，MP3格式和MP4格式

    v_name = video_list[0][:5]
    print('开始下载音频')
    r3 = requests.get(url=video_list[1], headers=head2)
    audio_data = r3.content
    with open(v_name+'(audio).mp3', mode='wb') as f:
        f.write(audio_data)
    print('音频下载完成')


    print('开始下载视频')
    r4 = requests.get(url=video_list[2], headers=head2)
    video_data = r4.content
    with open(v_name+'(video).mp4', mode='wb') as f:
        f.write(video_data)
    print('视频下载完成')

    r3.close()
    r4.close()
    return v_name

4，video_add_mp4函数

前面我们已经下载好了MP3，MP4各一个文件，这一步就将它们合并，这里我们需要使用ffmpeg，ffmpeg是专门做视频处理的工具，需要下载配置。

这里传入参数文件名，通过ffmpeg命令将MP3，MP4合并。
有关于ffmpeg的手册可以去官网查阅。
在ffmpeg命令中输出的名字似乎不能过长，所以切片，后面再更改为标题名。

#mix_video函数
#参数：文件名
#作用：合并音频和视频为原视频
def video_add_mp4(video_name):
    video = video_name+"(video).mp4"
    audio = video_name+"(audio).mp3"
    print('开始合成')
    cmd = f'ffmpeg -i {video} -i {audio} -acodec copy -vcodec copy {video_name[:8]+".mp4"}'
    # print(cmd)
    subprocess.call(cmd,shell=True)
    '''选择是否删除原mp3、mp4文件'''
    #os.remove(video)
    #os.remove(audio)

    os.rename(video_name[:8]+'.mp4',video_name+'.mp4')  # 记得加文件后缀名
    print('合成结束')

5，完整代码部分

这里可以看到我们需要的所有库。

#-*- codeing = utf-8 -*-
# @Time :21/7/12/0012 18:26
# @Author:zx 
# @File :哔哩哔哩视频爬取.PY 
# @sOFTWARE:PyCharm

import requests
from lxml import etree
import re
import json
import pprint
import subprocess
import os
import jieba

head1 = {
     
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.67'
}

#get_url函数，选择搜索方式，
#参数：无
#作用：通过搜索返回视频的url地址
def get_url():
    print('请选择你的搜索方式')
    print('1：知道该视频的完整av号或者bv号')
    print('2：知道视频的有效链接地址')
    kind = int(input('请选择：'))
    if kind == 1:
        # print('kw')
        kw = input('输入你需要搜索的av号或者bv号,例如 bv1i4411f7p1:')
        url = 'https://search.bilibili.com/all?keyword='+kw+'&from_source=web_search'
        r_search = requests.get(url =url,headers =head1)
        r_search.encoding = r_search.apparent_encoding
        r_search_html = r_search.text
        # print(r_search_html)
        #实例化xpath对象
        tree_search = etree.HTML(r_search_html)
        #href属性中存放的是一个list，且不完整，取出后与字符串'https:'拼接组成完整的url
        video_url = 'https:'+str(tree_search.xpath('//*[@id="all-list"]/div[1]/div[2]/ul/li[1]/a/@href')[0])
    else:
        print('!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!')
        print('!!!注意，在从网页拷贝的链接粘贴后,按一下空格再回车')
        kw = input('输入该视频的有效链接地址：')
        video_url = kw

    # 保持会话状态，在head中添加键值对:referer，存放上一次的会话的url,所以需要一个新的header
    head2 = {
     
             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.67',
             'Referer':video_url
    }
    return video_url,head2

# url1,head2 = get_url()
# print(url1,head2)

# get_video函数，
# 参数：网页的url
# 作用：从网页中返回视频title和存放视频和音频的两个url，共计三个元素
def get_video(url):
    r2 = requests.get(url=url, headers=head1)
    r2.encoding = r2.apparent_encoding
    r2_html = r2.text
    # 这里需要获取页面中playinfo中存放的json数据,这里存放了视频和音频文件

    tree2 = etree.HTML(r2_html)
    title = str(tree2.xpath('//*[@id="viewbox_report"]/h1/span/text()')[0])

    #去除一些符号，避免后续文件名操作时报错
    ss = ['\n', '，', '。', ' ', '—', '”', '？', '“', '（', '）', '、','|']
    df = [w for w in jieba.cut(title) if w not in ss]  # 去除标点符号
    title = ''  # 重新将除去标点的分词结果拼接
    for i in df:
        title = title + i

    print('视频标题："'+title+'"')
    json_data = re.findall('', r2_html)[0]
    json_data = json.loads(json_data)
    #pprint.pprint(json_data)
    '''提取音频'''
    audio_url = json_data['data']['dash']['audio'][0]['backupUrl'][0]
    # print(audio_url)
    print('已提取到音频地址')

    '''提取视频'''
    video_url = json_data['data']['dash']['video'][0]['backupUrl'][0]
    # print(video_url)
    print('已提取到视频地址')
    video_list = [title , audio_url , video_url]
    return video_list

#这里使用一个列表来存放：1，标题，2：音频地址， 3：视频地址
# video_list = get_video(url1)
# print(video_list)


#video_load函数
#参数：存放上述三个数据的列表
#作用：下载音频和视频
def video_load(video_list):
    # 下载保存音频和视频两种文件，MP3格式和MP4格式

    v_name = video_list[0][:5]
    print('开始下载音频')
    r3 = requests.get(url=video_list[1], headers=head2)
    audio_data = r3.content
    with open(v_name+'(audio).mp3', mode='wb') as f:
        f.write(audio_data)
    print('音频下载完成')


    print('开始下载视频')
    r4 = requests.get(url=video_list[2], headers=head2)
    video_data = r4.content
    with open(v_name+'(video).mp4', mode='wb') as f:
        f.write(video_data)
    print('视频下载完成')

    r3.close()
    r4.close()
    return v_name
# video_name = video_load(video_list)

#mix_video函数
#参数：文件名
#作用：合并音频和视频为原视频
def video_add_mp4(video_name):
    video = video_name+"(video).mp4"
    audio = video_name+"(audio).mp3"
    print('开始合成')
    cmd = f'ffmpeg -i {video} -i {audio} -acodec copy -vcodec copy {video_name[:8]+".mp4"}'
    # print(cmd)
    subprocess.call(cmd,shell=True)
    '''选择是否删除原mp3、mp4文件'''
    # os.remove(video)
    # os.remove(audio)

    os.rename(video_name[:8]+'.mp4',video_name+'.mp4')  # 记得加文件后缀名
    print('合成结束')



if __name__ == "__main__":
    # get_url函数，选择搜索方式，
    # 参数：无
    # 作用：通过搜索返回视频的url地址和后续需要的header
    url1, head2 = get_url()

    # get_video函数，
    # 参数：网页的url
    # 作用：从网页中返回视频title和存放视频和音频的两个url，共计三个元素

    video_list = get_video(url1)
    # video_load函数
    # 参数：存放上述三个数据的列表
    # 作用：下载音频和视频
    video_name = video_load(video_list)

    # mix_video函数
    # 参数：文件名
    # 作用：合并音频和视频为原视频
    video_add_mp4(video_name)

6，运行结果

这里展示get_url函数的两种情况
1，使用bv号搜索：

2，详细链接：

至此，你就可以在当前目录下看到你下载的视频，关于路径是可以根据自己的需求来更换的。在video_add_mp4函数中你可以选择是否删除之前的两个文件。

现在，你就可以在b站下载视频了，我不能保证所有的视频都可以下载，首先什么会员专享、番剧之类的就不可以，这里主要是针对up主的原创视频。

【Python 第五篇章】数据类型蜗牛 | ICU Python 专栏 python windows 开发语言
一、列表详解list.append(x)在列表末尾添加一个元素。list.extend(iterable)用可迭代对象的元素扩展列表。list.insert(i,x)在指定位置插入元素，第一个参数是插入元素的索引，第二个是值。list.remove(x)从列表中删除第一个值为x的元素。list.pop([i])移除列表中给定位置的条目，并返回该条目。如果未指定索引号，则a.pop()将移除并返回列
python catia catalog文件_Python封装的获取文件目录的函数卢新生 python catia catalog文件
获取指定文件夹中文件的函数，网上学习时东拼西凑的结果。注意，其中文件名如1.txt，文件路径如D:\文件夹\1.txt；direct为第一层子级importos#filePath输入文件夹全路径#mode#1递归获取所有文件名;#2递归获取所有文件路径;#3获取direct文件名;#4获取direct文件路径;#5获取direct文件名和direct子文件夹名;#6获取direct文件路径和dir
Python：每日一题之错误票据努力的敲码工蓝桥杯每日一题 python 蓝桥杯
题目描述某涉密单位下发了某种票据，并要在年终全部收回。每张票据有唯一的ID号。全年所有票据的ID号是连续的，但ID的开始数码是随机选定的。因为工作人员疏忽，在录入ID号的时候发生了一处错误，造成了某个ID断号，另外一个ID重号。你的任务是通过编程，找出断号的ID和重号的ID。假设断号不可能发生在最大和最小号。输入描述输入描述要求程序首先输入一个整数N(N<100)表示后面数据行数。接着读入N行数据
Python控制批量插入Catia文件并修改文件定义及PN 一盘红烧肉 python
改了两天，总算初步摸清楚了Catia中的文件结构，实现了使用Python控制批量修改文件名及定义使用Pycatia在Product中插入Part并改名及定义
PySide2是 Qt 库的 Python 绑定之一 WwwwwH_PLUS #Qt qt python 开发语言
PySide2是Qt库的Python绑定之一，它为Python程序员提供了创建跨平台桌面应用程序的工具和功能。PySide2是Qt5.x系列的Python绑定，而Qt本身是一个跨平台的图形用户界面（GUI）框架，广泛用于开发各种类型的桌面应用程序，包括多种平台（Windows、Linux、macOS）的应用。主要特点跨平台支持：PySide2可以在Windows、Linux和macOS上运行，允许
Python学习第十一天 Leo来编程 Python学习 python
疑惑：有很多人不知道是不是也分不清什么是单核？什么是多核？什么是时间片？进程？线程？那么在讲进程和线程前我先举个例子更好理解这些概念。单核例子：比如你是一个厨师（计算机）在一个厨房（CPU）里需要同时做3个菜（进程）、每个菜需要准备不同的调料以及协作（线程），那么这个厨师需要不断地切换时间（时间片）来达到同时在一个时间将三个菜做完。多核的话其实对应的例子就是多个厨师，这样的例子太多了因为万物皆对象
python学习第三天 Leo来编程 Python学习 python 开发语言
条件判断条件判断使用if、elif和else关键字。它们用于根据条件执行不同的代码块。#条件判断age=18ifage0:#也可以写if(s>0)但是没必要因为python给个提示建议去掉保证代码的按照缩进来进行更加规范print("这个数字是大于0的数字!")#这行代码属于if语句的代码块elifs==0:print("这个数字是等于0的数字!")#这行代码属于elif语句的代码块else:pr
三种优化算法旅者时光算法算法 python 开发语言
本文将总结遗传算法、粒子群算法、模拟退火三种优化算法的核心思路，并使用python完整实现。实际上，越来越多的优秀算法已经被封装为一个易用的接口。很多时候，一行代码就能实现我们的需求。但了解这些算法的基本逻辑，能够使用最基本的代码实现它。无论对于提升我们的编程能力还是解决问题的能力，都会大有裨益。甚至，改变我们思考问题的方式。1、遗传算法遗传算法，顾名思义，就是借鉴了生物通过遗传变异来逐渐适应环境
使用 Python 合并微信与支付宝账单，生成财务报告 python后端
最近用思源笔记记东西上瘾，突然想每个月存一份收支记录进去。但手动整理账单太麻烦了，支付宝导出一份CSV，微信又导出一份，格式还不一样，每次复制粘贴头都大。干脆写了个Python脚本一键处理，核心就干两件事：把俩平台的CSV账单合并到一起自动生成带分类表格的Markdown（直接拖进思源就能渲染）代码主要折腾了这些：支付宝账单前24行都是废话，直接skiprows=24跳过去，GBK编码差点让我栽跟
Python Flask 在网页应用程序中处理错误和异常 dowhileprogramming python flask 开发语言
PythonFlask在网页应用程序中处理错误和异常PythonFlask在网页应用程序中处理错误和异常PythonFlask在网页应用程序中处理错误和异常在我们所有的代码示例中，我们没有注意如何处理用户在浏览器中输入错误的URL或向我们的应用程序发送错误的参数集的情况。这不是设计意图，但目的是首先关注网页应用程序的关键组件。网页框架的美妙之处在于，它们通常默认支持错误处理。如果发生任何错误，将自
农业生产模拟和农业政策分析：WOFOST模型与PCSE模型安装、运行、数据准备；农田农作物生长模拟和产量预测等 WangYan2022 作物模型农业 WOFOST模型 PCSE模型农田生态系统作物模型农业生产模拟
WOFOST（WorldFoodStudies）和PCSE（PythonCropSimulationEnvironment）是两个用于农业生产模拟的模型：WOFOST是一个经过多年开发和验证的模型，被广泛用于全球的农业生产模拟和农业政策分析；采用了模块化的结构，可以对不同的农作物和环境条件进行参数化和适应；WOFOST可用于长期模拟，能够模拟整个作物生长周期，包括播种、生长、收获等各个阶段；WOF
基于Python+Vue开发的电影订票管理系统源码+运行步骤冷琴1996 Python系统设计 python vue.js 开发语言
项目简介该项目是基于Python+Vue开发的电影订票管理系统（前后端分离），这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Python编程技能，同时锻炼他们的项目设计与开发能力。通过学习基于Python的电影订票管理系统项目，大学生可以在实践中学习和提升自己的能力，为以后的职业发展打下坚实基础。技术学习之路主要功能影片管理：管理系统可以录入、修改和查询影片的基本信息，如
Python通过YOLO格式TXT标签文件在图像中画框 CHERISH_KDX python YOLO 人工智能
使用场景检测数据集标注是否有误：在目标检测算法中需要标注自己的数据集，为了更加方便的检查数据集标注是否有误，可以使用该工具将标注结果绘制在图像中并查看。美化识别结果中的检测框：在一些目标检测场景中，YOLO检测算法原始的检测框绘制会导致重叠、颜色冲突、字体过大等问题。可以使用该工具进行修改。代码importosimportcv2classcheck_label:def__init__(self,c
基于llama_cpp 调用本地模型（llama）实现基本推理月光技术杂谈大模型初探 llama llama.cpp python LLM 集成显卡本地模型 AI
零基础实践本地推理模型基本应用：基于llama_cpp的本地模型调用。本文先安装llama_cpppython库，再编写程序，利用其调用llama-2-7b-chat.Q4_K_M.ggu模型。背景llama_cpp是一个基于C++的高性能库（llama.cpp）的Python绑定，支持在CPU或GPU上高效运行LLaMA及其衍生模型（如LLaMA2），并通过量化技术（如GGUF格式）优化内存使用
python实现查找满足条件的数字 qq_恰同学少年 python
问题：一个四位数，知道其前两位和后两位分别相等，并且这个数还是一个平方数，求出这个数。一个四位数，范围只能是1000~9999，前两位和后两位分别相等，也就是说，它的结构应该是aabb。最后，这个数是一个平方数。有的小伙伴可能不知道啥叫平方数，暂且解释下，所谓的平方数就是指该数等于一个整数的平方。比如3的平方是9，那么我们就说9是个平方数。第一步，这是个四位数，前两位和后两位分别相等，我们将满足条
python中常用的内置模块举例（入门级整理） qq_恰同学少年 python
python对于初学者可以说是十分友好的一门编程语言，不仅语法简单，而且它自身还包含了十分丰富的第三方模块，我仅就将我自己常用的一些内置模块（自带的，无需安装）做一下简单的总结和介绍：1.turtleturtle，是python中比较好玩一个模块，它有一个专有名称“海龟作图”，光看名字就应该能够猜到它是用来干嘛的，没错，就是来画图的，它可以通过某些语句来控制一个点在白板上的运动轨迹，它在白板上走过
QPython双核攻略：从零基础到AI开发，你的手机就是全栈训练营程之编 python 开发语言青少年编程人工智能
主题一：《编程小白必看！在手机上种下你的第一行代码》✨北京优趣天下信息技术有限公司重磅出品我们比谁都清楚：✔️86%的初学者因环境配置放弃编程✔️72%的上班族只有碎片化学习时间✔️95%的自学者需要即时答疑支持为什么QPython成为2025现象级学习工具？▸全栈开发环境：解释器+编辑器+控制台三合一▸AI导师常驻：集成DeepSeek代码助手（支持中英双语提问）▸极速学习路径：Q派课程7天完成
Python学习指南：系统化路径 + 避坑建议程之编 Python全栈通关秘籍青少年编程 python 开发语言人工智能机器学习
新手小白学习编程就像搭积木——需要从基础开始，逐步构建知识体系。以下是为你量身定制的Python学习路径，帮你告别杂乱，高效入门！一、学习前的关键认知明确目标：想用Python做什么？数据分析（如Excel自动化、可视化）Web开发（如搭建网站）人工智能（如机器学习）自动化办公（如处理文件、邮件）目标不同，后续学习侧重点不同（但基础通用）。避免误区：❌只看教程不写代码✅边学边动手，哪怕抄代码也要运
【Python代码练习（简单应用）】 9... python 汇编前端开发语言 dreamweaver
一、Python列表添加与删除元素：append()。在列表末尾添加新的格式元素添加格式：list.append(元素)删除格式：list.remove(元素)例如：#给出代码listA=['水煮千丝','平板豆腐','白烧饭','香菇青菜','西红柿鸡蛋汤']listA._________("红烧肉")listA._________("水煮千丝")print(listA)将“红烧肉”放入列表中，
统信uos20：利用docker部署python+jupyterlab开发环境阆遤 docker python jupyter github actions workflow 统信uos20
很多统信uos20计算机没有联网安装python开发环境的条件，但是工作中需要对数据进行分析处理，因而产生了离线部署python开发环境的想法。我首先下载了python3.11的源代码包，在uos中编译居然正常通过。但后续的麻烦来了：需要安装的库没法安装。尝试了一天，最终放弃。改用Docker方式部署，理由就不多解释了。一、在uos中安装docker。我的系统是uos20linux4.19.0-a
第五周作业——第十章动手试一试 hongsqi
10-1Python学习笔记学习笔记：在文本编辑器中新建一个文件，写几句话来总结一下你至此学到的Python知识，其中每一行都以“InPythonyoucan”打头。将这个文件命名为learning_python.txt，并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序，它读取这个文件，并将你所写的内容打印三次：第一次打印时读取整个文件；第二次打印时遍历文件对象；第三次打印时将各行
统信UOS下达梦数据库启动图形界面应用工具monitor报JAVA相关错：An error has occurred. See the log file LaoYuanPython 老猿Python 国产信创之光 java 达梦数据库统信UOS操作系统 JDK 图形应用报错
☞░前往老猿Python博客░https://blog.csdn.net/LaoYuanPython一、前言在博文《基于飞腾2000CPU+浪潮电脑+统信UOS安装达梦数据库详解https://blog.csdn.net/LaoYuanPython/article/details/143258863》中介绍了基于飞腾2000CPU+浪潮电脑+统信UOS安装达梦数据库的详细过程，并且安装完毕之后通过
整理一下arcGis desktop版本软件，从入门到精通需要学习的知识点 AnalogElectronic arcgis 学习
整理一下arcGisdesktop版本软件，从入门到精通需要学习的知识点以下是一份关于ArcGISDesktop从入门到精通的学习知识点整理：一、软件初认识与基础操作软件初认识：了解ArcGISDesktop的界面布局，包括内容列表、ArcToolbox工具箱、结果窗口、地图窗口、目录窗口、搜索窗口、python编程窗口以及其他常用工具条等。数据添加与管理：掌握通过不同方式添加数据，如图层列表右键
动态规划双剑合璧：C++与Python征服洛谷三大经典DP问题三流搬砖艺术家动态规划 c++python
动态规划核心思想状态定义→转移方程→边界处理→时空优化本文精选洛谷动态规划题单中三大经典问题，通过C++与Python双语言对比实现，彻底掌握DP精髓！题目一：P1048采药（01背包模板）题目描述在限定时间T内采集草药，每株草药有采集时间time[i]和价值value[i]，求最大总价值。解题思路状态定义：dp[j]表示时间j能获得的最大价值转移方程：dp[j]=max(dp[j],dp[j-t
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务1.背景介绍1.1问题的由来翻译是跨语言沟通的重要桥梁，随着全球化进程的加速，翻译需求日益增长。传统的机器翻译方法主要依赖于规则和统计方法，如基于短语的翻译、基于统计的机器翻译等。然而，这些方法难以处理复杂的语言现象，翻译质量参差不齐。近年来，随着深度学习技术的快速发展，基于神经网络序列到序列（Sequence-to-Seq
20个简单的python代码练习 qq_恰同学少年 python 开发语言
下面整理了20个简单的python代码练习，供大家学习交流使用，轻易上手，复制下来就能用！！！废话不多说，直奔主题1.输入一个不超过5位的正整数，输出其逆数。例如输入12345，输出应为54321。a=input('请输入一个不超过5位的正整数：')print('其逆数为：',a[::-1])注：该代码使用了列表的切片和反转操作，首先将这个数的每个位上的数字存储到一个列表中，然后通过列表的反转来得
Python第十六课：深度学习入门 | 神经网络解密程之编 Python全栈通关秘籍 python 神经网络青少年编程
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的训练过程掌握防止过拟合的基础策略一、神经网络基础（大脑的数字化仿生）1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和（∑(权重×输入)+偏置）轴突传递电信号激活函数处理输出2.核心组件解析激活函数：神经元的"开关"（如ReLU：max
通过 Ollama 本地部署 DeepSeek-r1:1.5b 模型后，用 Python 调用推理并生成基于 pytest + PO 设计模式的 Playwright 自动化测试文件 Python测试之道测试提效 python python pytest 设计模式
以下是完整的实现步骤和代码示例，详细说明了如何通过Python调用本地部署的DeepSeek-r1:1.5b模型，将功能测试用例转换为适合pytest和PageObject（PO）设计模式的Playwright自动化测试脚本。一、前提条件DeepSeek模型本地部署通过Ollama部署DeepSeek-r1:1.5b模型。Ollama提供的本地推理服务默认可通过HTTPAPI访问，地址通常为：ht
【UI自动化】Selenium库中使用By类元素定位方法搞不来测试的摄影狮软件测试 python selenium 自动化
使用By类，首先需要在Python中导入该模块：fromselenium.webdriver.common.byimportBy1.通过元素的ID属性来定位driver.find_element(By.ID,'kw')如下图，我们需要定位百度的输入框。首先选中定位工具，然后选中输入框。我们可以看到该元素id的值为："kw"2.通过元素的NAME属性来定位driver.find_element(By
DeepSeek + Cline：编程如何加速引擎 meisongqing 人工智能
DeepSeek与Cline的结合为编程工作流提供了显著的加速能力，这种组合通过AI辅助规划、代码生成与优化、实时调试等功能，大幅提升开发效率。以下是具体实现方式及技术要点：一、智能规划与代码生成问题分析与规划（Plan模式）DeepSeek-R1模型擅长处理复杂逻辑推理，开发者可在Cline的Plan模式下用自然语言描述需求（如“用Python实现数据清洗并计算平均值”）。DeepSeek会根据
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(