imherer

Python每日一练(9)-批量爬取B站小视频

1. 批量爬取B站小视频

哔哩哔哩网站(英文名称: bilibili)，是年轻人的文化社区，被粉丝们亲切的称为B站。该网站中拥有动画、番剧、国创、音乐、舞蹈、游戏、科技、生活、鬼畜、娱乐、时尚等多个内容分区。那么我们能不能爬取一些视频以后离线观看呢？答案是肯定的。本任务要求使用Python语言中的爬虫技术，实现批量爬取B站小视频的爬虫程序。爬取后的效果下图所示。

分析过程如下：

点击上面的排行榜之后，按F12调出浏览器控制台调试界面，点击Network，第一次进入Network可能是空的，按F5或者点击浏览器左上角刷新一下即可，最后如图所示。

但是需要注意的是，不是所有的数据都是根据一个固定的url返回的，如图所示。

接下来就可以去完成代码了，注意，因为爬虫需要使用第三方模块requests，所以读者需要使用如下命令进行安装。

pip install --user  -i http://pypi.douban.com/simple --trusted-host pypi.douban.com requests

如图所示：

示例代码如下：

import requests  # 网络请求模块
import os  # 系统模块
import time  # 时间模块
import re  # 正则模块
import random  # 随机模块

json_url = "https://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset={}1&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc"  # 哔哩哔哩小视频json地址


class MySpider(object):  # 定义一个spider类
    # 初始化
    def __init__(self):
        # 构造请求头
        self.headers = {
            "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit"      "/537.36 (KHTML, like Gecko) Chrome/80.0.3987.163 Safari/537.36"}

    # 请求json数据
    def get_json(self, url):
        response = requests.get(url, headers=self.headers)
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            return response.json()  # 返回json信息
        else:
            print("获取json信息的请求没有成功~")

    #  下载视频
    def download_video(self, url, video_name):
        # 下载视频的网络请求
        response = requests.get(url, headers=self.headers, stream=True)
        if not os.path.exists("video"):  # 判断本地是否存在video文件夹 不存在则创建
            os.mkdir("video")
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            with open("video/" + video_name + ".mp4", "wb") as file:  # 非纯文本都以字节的方式写入
                for data in response.iter_content(chunk_size=1024):  # 循环写入file.write(data)  # 写入视频文件file.flush()  # 刷新缓存
                print("视频下载完成～")
        else:
            print("视频下载失败~")


if __name__ == '__main__':  # 程序的入口
    spider = MySpider()
    for i in range(10):  # 100条数据 需要发送10次循环 所以需要循环10次
        json = spider.get_json(json_url.format(i))
        video_infos = json["data"]["items"]  # 信息集 一个列表
        # 遍历 获取每一个video的信息
        for video_info in video_infos:
            # 视频的名字只保留标题中英文、数字与汉字 便于写入文件
            title = video_info["item"]["description"]
            comp = re.compile("[^A-Z^a-z^0-9^\u4e00-\u9fa5]")
            title = comp.sub("", title)  # 其他字符一律替换为空
            video_url = video_info["item"]["video_playurl"]  # 视频地址
            print(title, video_url)  # 打印提取的视频标题与视频地址
            spider.download_video(video_url, title)  # 下载视频 视频标题作为视频的名字
        time.sleep(random.randint(3, 6))  # 避免频繁发送请求 ip被封

2. 获取动态请求的JSON数据

在上面的批量爬取B站小视频任务中，我们已经通过发送动态请求的方式，获取到视频的标题与视频地址。为了更好的掌握JSON数据的提取技术，此次任务要求获取JSON中视频发布时间、用户名称以及观看人数并打印。在PyCharm控制台输出的结果如图所示。

这个任务的话其实就是在之前代码的基础上修改了一小部分，如图所示：

3. 随机生成浏览器的头部信息

有时在请求一个网页内容时，如果频繁地使用一个固定的浏览器头部信息发送网络请求时，可能会出现403错误。产生这种错误是由于该网页为了防止恶意采集信息而使用了反爬虫设置，从而拒绝了用户的访问。所以本任务要求实现每发送一个网络请求，就更换一个浏览器的头部信息，避免使用固定的浏览器头部信息。在PyCharm控制台输出的结果如图所示。

安装fake_useragent模块并初步了解其基本应用，使用pip命令安装fake_useragent模块的命令如下：

pip install --user  -i http://pypi.douban.com/simple --trusted-host pypi.douban.com  fake_useragent

如图所示：

在这次的任务中，还需要一个json格式的文件，下载地址为：

链接:https://pan.baidu.com/s/1IeW70k6pd1HMZqOQ0jw1FQ  密码:t67s

示例代码如下：

import requests  # 网络请求模块
import os  # 系统模块
import time  # 时间模块
import re  # 正则模块
import random  # 随机模块
from fake_useragent import UserAgent  # 导入伪造头部信息的模块

json_url = "https://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&ne" \
           "xt_offset={}1&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc"  # 哔哩哔哩小视频json地址


class MySpider(object):  # 定义一个spider类
    def get_json(self, url):  # 请求json数据
        headers = {"User-Agent": UserAgent(path="fake_useragent.json").random}  # 创建随机生成的头部信息
        print(f"当前下载请求的浏览器头部信息为: {headers}")
        response = requests.get(url, headers=headers)
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            return response.json()  # 返回json信息
        else:
            print("获取json信息的请求没有成功~")

    #  下载视频
    def download_video(self, url, video_name):
        headers = {"User-Agent": UserAgent(path="fake_useragent.json").random}  # 创建随机生成的头部信息
        # 下载视频的网络请求
        response = requests.get(url, headers, stream=True)
        if not os.path.exists("video"):  # 判断本地是否存在video文件夹 不存在则创建
            os.mkdir("video")
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            with open("video/" + video_name + ".mp4", "wb") as file:  # 非纯文本都以字节的方式写入
                for data in response.iter_content(chunk_size=1024):  # 循环写入file.write(data)  # 写入视频文件file.flush()  # 刷新缓存
                print("视频下载完成～")
        else:
            print("视频下载失败~")


if __name__ == '__main__':  # 程序的入口
    spider = MySpider()
    for i in range(10):  # 100条数据 需要发送10次循环 所以需要循环10次
        json = spider.get_json(json_url.format(i))
        video_infos = json["data"]["items"]  # 信息集 一个列表
        # 遍历 获取每一个video的信息
        for video_info in video_infos:
            # 视频的名字只保留标题中英文、数字与汉字 便于写入文件
            title = video_info["item"]["description"]
            comp = re.compile("[^A-Z^a-z^0-9^\u4e00-\u9fa5]")
            title = comp.sub("", title)  # 其他字符一律替换为空
            video_url = video_info["item"]["video_playurl"]  # 视频地址
            upload_time = video_info["item"]["upload_time"]  # 视频发布日期
            user_name = video_info["user"]["name"]  # 用户名字
            watched_num = video_info["item"]["watched_num"]  # 观看人数
            print(f"视频标题为: {title}")
            print(f"发布时间为: {upload_time}")
            print(f"视频地址为: {video_url}")
            print(f"观看人数为: {watched_num}")
            # spider.download_video(video_url, title)  # 下载视频 视频标题作为视频的名字
        time.sleep(random.randint(3, 6))  # 避免频繁发送请求 ip被封

4. 获取要下载视频的大小

在多数网站中下载视频、音乐以及文本文件时，都可以看见当前文件的大小，如下图所示。

本任务要求通过requests模块下载指定视频内容时，获取其视频的文件大小。在PyCharm控制台输出的结果如下图所示。

示例代码如下：

import requests  # 网络请求模块
import os  # 系统模块
import time  # 时间模块
import re  # 正则模块
import random  # 随机模块
from fake_useragent import UserAgent  # 导入伪造头部信息的模块

json_url = "https://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&ne" \
           "xt_offset={}1&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc"  # 哔哩哔哩小视频json地址


class MySpider(object):  # 定义一个spider类
    def get_json(self, url):  # 请求json数据
        headers = {"User-Agent": UserAgent(path="fake_useragent.json").random}  # 创建随机生成的头部信息
        response = requests.get(url, headers=headers)
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            return response.json()  # 返回json信息
        else:
            print("获取json信息的请求没有成功~")

    #  下载视频
    def download_video(self, url, video_name):
        headers = {"User-Agent": UserAgent(path="fake_useragent.json").random}  # 创建随机生成的头部信息
        # 下载视频的网络请求
        response = requests.get(url, headers=headers, stream=True)
        content_size = int(response.headers["content-length"])  # 视频内容的总大小
        if not os.path.exists("video"):  # 判断本地是否存在video文件夹 不存在则创建
            os.mkdir("video")
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            # 1MB=1024KB 1KB=1024B 我们返回的是多少B 推出==>KB==>MB
            print("视频文件大小: %0.2fMB" % (content_size / 1024 / 1024))  # 换算单位
            with open("video/" + video_name + ".mp4", "wb") as file:  # 非纯文本都以字节的方式写入
                for data in response.iter_content(chunk_size=1024):  # 循环写入file.write(data)  # 写入视频文件file.flush()  # 刷新缓存
                print("视频下载完成～")
        else:
            print("视频下载失败~")


if __name__ == '__main__':  # 程序的入口
    spider = MySpider()
    ranking = 0  # 排名
    for i in range(10):  # 100条数据 需要发送10次循环 所以需要循环10次
        json = spider.get_json(json_url.format(i))
        video_infos = json["data"]["items"]  # 信息集 一个列表
        # 遍历 获取每一个video的信息
        for video_info in video_infos:
            ranking += 1
            print(f"正在下载排名第 {ranking} 的视频")
            # 视频的名字只保留标题中英文、数字与汉字 便于写入文件
            title = video_info["item"]["description"]
            comp = re.compile("[^A-Z^a-z^0-9^\u4e00-\u9fa5]")
            title = comp.sub("", title)  # 其他字符一律替换为空
            video_url = video_info["item"]["video_playurl"]  # 视频地址
            print(f"视频标题为: {title}")
            print(f"视频地址为: {video_url}")
            spider.download_video(video_url, title)  # 下载视频 视频标题作为视频的名字
        time.sleep(random.randint(3, 6))  # 避免频繁发送请求 ip被封

5. 实时打印文件下载进度

在多数网站中下载视频、音乐以及文本文件时，都可以看见当前文件的大小以及已经下载的大小，如下图所示。

在之前的任务中，我们已经实现了显示当前文件的大小。本任务要求将下载文件的实时进度打印出来。在PyCharm控制台输出的结果如下图所示。

示例代码如下：

import requests  # 网络请求模块
import os  # 系统模块
import time  # 时间模块
import re  # 正则模块
import random  # 随机模块
from fake_useragent import UserAgent  # 导入伪造头部信息的模块

json_url = "https://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&ne" \
           "xt_offset={}1&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc"  # 哔哩哔哩小视频json地址


class MySpider(object):  # 定义一个spider类
    def get_json(self, url):  # 请求json数据
        headers = {"User-Agent": UserAgent(path="fake_useragent.json").random}  # 创建随机生成的头部信息
        response = requests.get(url, headers=headers)
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            return response.json()  # 返回json信息
        else:
            print("获取json信息的请求没有成功~")

    #  下载视频
    def download_video(self, url, video_name):
        size = 0  # 记录叠加每次写入的大小
        headers = {"User-Agent": UserAgent(path="fake_useragent.json").random}  # 创建随机生成的头部信息
        # 下载视频的网络请求
        response = requests.get(url, headers=headers, stream=True)
        content_size = int(response.headers["content-length"])  # 视频内容的总大小
        if not os.path.exists("video"):  # 判断本地是否存在video文件夹 不存在则创建
            os.mkdir("video")
        # 根据返回的状态码判断是否请求成功
        if response.status_code == 200:
            # 1MB=1024KB 1KB=1024B 我们返回的是多少B 推出==>KB==>MB
            print("视频文件大小: %0.2fMB" % (content_size / 1024 / 1024))  # 换算单位
            with open("video/" + video_name + ".mp4", "wb") as file:  # 非纯文本都以字节的方式写入
                for data in response.iter_content(chunk_size=1024):  # 循环写入file.write(data)  # 写入视频文件file.flush()  # 刷新缓存size += len(data)  # 叠加每次写入的大小# 打印下载进度print("\r 文件下载进度:%d%%(%0.2fMB/%0.2fMB)" % (    float(size / content_size * 100), (size / 1024 / 1024),    (content_size / 1024 / 1024)),      end=" ")
        else:
            print("视频下载失败~")


if __name__ == '__main__':  # 程序的入口
    spider = MySpider()
    ranking = 0  # 排名
    for i in range(10):  # 100条数据 需要发送10次循环 所以需要循环10次
        json = spider.get_json(json_url.format(i))
        video_infos = json["data"]["items"]  # 信息集 一个列表
        # 遍历 获取每一个video的信息
        for video_info in video_infos:
            ranking += 1
            print(f"正在下载排名第 {ranking} 的视频")
            # 视频的名字只保留标题中英文、数字与汉字 便于写入文件
            title = video_info["item"]["description"]
            comp = re.compile("[^A-Z^a-z^0-9^\u4e00-\u9fa5]")
            title = comp.sub("", title)  # 其他字符一律替换为空
            video_url = video_info["item"]["video_playurl"]  # 视频地址
            print(f"视频标题为: {title}")
            print(f"视频地址为: {video_url}")
            spider.download_video(video_url, title)  # 下载视频 视频标题作为视频的名字
        time.sleep(random.randint(3, 6))  # 避免频繁发送请求 ip被封

有没有开源的企业网盘，是否适合企业使用？网盘
开源选项丰富、灵活定制能力强、需要额外运维投入、适合特定场景但不一定适合所有企业，是开源企业网盘的主要特征。从表面看，开源网盘往往具有免费或低成本优势，但企业要投入一定的人力与技术资源来完成安装、维护与升级，从而保障系统的稳定运行。我个人尤其建议在评估运维能力和长期需求后再行决定，因为开源网盘的可行性需要与企业的IT基础和信息安全策略相匹配。在这几点特征里，灵活定制能力强最具吸引力。企业可以根据自
Manus AI：国产AI Agent的破局与隐忧 Hello kele 人工智能人工智能程序员经验分享 AI编程
2025年3月，国内AI领域突然杀出一匹黑马——ManusAI。这个自称全球首个通用AIAgent的产品，凭借"自主完成复杂任务"的核心能力，在技术圈掀起了不小的波澜。官网演示中，它能自动筛选简历、生成房产分析报告、甚至编写股票研究PPT，被网友戏称为"数字世界的私人助理"。但随着内测的展开，关于它的争议也开始浮出水面。一、技术突围背后的故事Manus的开发团队Monica.im颇为低调。创始人肖
DeepSeek与剪映短视频创作指南 meisongqing 人工智能 DeepSeek 剪映
DeepSeek（深度求索）作为一家专注实现AGI的中国公司，其技术可能涉及AI文本生成、图像处理等领域，结合剪映的智能剪辑功能，可以大幅提升短视频创作效率。以下是结合两者优势的详细创作步骤：一、创意策划阶段AI灵感激发使用DeepSeek的AI文本生成功能，输入关键词（如"美食教程"、"科技科普"）获取创意方向生成10-20个标题备选（示例Prompt："生成10个吸引年轻人的美妆短视频标题"）
不同存储器组织和交叉编址技术的工作方式及举例说明海大超级无敌暴龙战士计算机组成原理学习方法
不同存储器组织和交叉编址技术的工作方式及举例说明本节介绍内存系统中常见的组织方式以及如何通过交叉编址来提高存储器性能，主要内容包括：多模块存储器单体多字存储器多体并行存储器高位交叉编址（顺序方式）低位交叉编址（交叉方式）下面依次说明这些结构的工作原理和实际应用中的举例。1.多模块存储器原理简介：多模块存储器将整个存储系统划分为多个独立模块（或称“块”），每个模块具有一定的存储容量和独立的控制电路。
DeepSeek赋能机器人革命：从推理引擎到行业落地的全栈技术实践量子纠缠BUG DeepSeek部署 AI DeepSeek 机器人人工智能 AI编程
——解析大模型如何重塑机器人产业的智能化未来引言：机器人产业的技术范式转移在2025年全球机器人市场规模突破2000亿美元的关键节点，DeepSeek凭借其创新的"推理优先"技术架构，正在重构机器人产业的智能化路径。通过将大模型的认知推理能力与机器人执行系统深度融合，DeepSeek在商业服务、工业制造、智慧城市等领域创造了多个标杆案例。本文将从技术架构、行业应用、开发实践三个维度，深度解读Dee
百奥赛图的AI野心：用2500万抗体序列改写医药研发规则港股研究社人工智能大数据
在生物医药领域，技术突破的浪潮从未停歇。随着DeepSeek的爆火，AI技术也正在深度渗透生物医药行业。近日，百奥赛图作为行业先锋，率先DeepSeek平台本地化部署，结合“千鼠万抗”计划，打造“AI+抗体药物研发”的全新模式，大幅提升药物研发效率与成功率，引领行业迈向智能化创新时代。回顾百奥赛图的发展之路，公司创始人沈月雷博士，凭借十余年深耕免疫学和基因编辑领域的经验，带领团队从锻造靶点人源化小
NTIRE比赛：技术前沿、国内企业表现与计算机视觉未来展望 AndrewHZ 深度学习新浪潮计算机视觉人工智能深度学习调研报告算法 NTIRE 画质算法
一、NTIRE比赛概述：图像恢复与增强领域的全球竞技场1.1NTIRE的定位与历史NTIRE（NewTrendsinImageRestorationandEnhancement）是计算机视觉领域最具影响力的国际赛事之一，聚焦于图像恢复与增强技术的前沿探索。自2017年首次举办以来，NTIRE每年与计算机视觉顶会CVPR联合召开，成为学术界与工业界技术实力的重要展示平台。其竞赛内容涵盖图像超分辨率、
C#实现高性能异步文件下载器（支持进度显示/断点续传） WangMing_X C#实现各种功能工具集 c#开发语言异步下载
一、应用场景分析异步文件下载器用处很大，当我们需要实现以下功能时可以用的上：大文件下载（如4K视频/安装包）避免UI线程阻塞，保证界面流畅响应多任务并行下载支持同时下载多个文件，提升带宽利用率后台静默下载结合Windows服务实现应用自动更新断点续传系统网络中断后可恢复下载（扩展实现）二、技术实现方案核心组件选择方案优点缺点WebClient代码简洁无法精细控制下载过程HttpWebRequest
接口测试中遇到的最大的困难是什么？Java接口测试中用到的框架有哪些？海姐软件测试接口测试测试工具
接口测试中的最大困难环境依赖与数据准备接口测试常依赖外部服务或数据库，测试环境不稳定（如第三方接口延迟）会导致测试结果不可靠。解决方案：使用Mock技术（如Mockito）模拟外部依赖，或通过Docker容器化测试环境，确保数据隔离。参数与逻辑复杂度复杂接口可能涉及多参数组合、加密签名（如Token、OAuth）或动态参数（如时间戳），手工构造请求容易出错。示例：电商接口需同时验证商品库存、用户优
模型上下文协议（MCP）：构建 AI 与数据交互的新范式 xxgshxs 人工智能 chatgpt prompt 文心一言 llama copilot
引言在人工智能领域，大型语言模型（LLMs）的应用正从通用问答向复杂任务执行演进，但数据孤岛、工具集成碎片化及隐私安全等问题制约了其潜力。模型上下文协议（ModelContextProtocol,MCP）作为Anthropic提出的开放标准，旨在通过标准化接口连接AI应用与异构数据源及工具，重塑AI开发范式。本文从技术架构、核心功能、应用场景等维度解析MCP的设计逻辑与实践价值。一、核心概念与设计
量子计算如何颠覆能源优化领域：从理论到实践 Echo_Wish 人工智能前沿技术量子计算能源
量子计算如何颠覆能源优化领域：从理论到实践大家好，我是Echo_Wish，一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天，我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势，也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用，量子计算已经在一些能源相关领域崭露头角，例如电网优化、可再生能源分配和物流节能规划。以下，让我们一步
INCA二次开发GUI实例化智海行舟 python 个人开发
【摘要】本文基于ETASINCA二次开发实践，深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术，实现从软件架构设计到功能模块开发的完整闭环，为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域，ETASINCA作为行业标准标定工具，其自动化测试需求日益增长。传统的手动操作模式存在以下痛点：重复性操作耗时严重（单
常用图像增强算法原理及 OpenCV C++ 实现埃菲尔铁塔_CV算法 opencv 计算机视觉人工智能 c++算法机器学习
一、引言图像增强是数字图像处理中的一个重要分支，其目的是改善图像的视觉效果，突出图像中的重要信息，或者将图像转换为更适合人或机器分析处理的形式。在实际应用中，图像增强技术广泛应用于医学影像、遥感图像、安防监控等领域。本文将详细介绍常用的图像增强算法原理，并给出基于OpenCVC++库的实现代码。二、图像增强算法分类图像增强算法可以分为空间域增强和频域增强两大类。空间域增强是直接对图像的像素值进行操
我与DeepSeek读《大型网站技术架构》（5）下诺亚凹凸曼架构
万无一失：网站的高可用架构4.高可用的数据保证数据存储高可用的手段主要是数据备份和失效转移机制。缓存服务的高可用争论1.缓存服务需要实现高可用核心论据：避免雪崩效应：缓存宕机导致数据库瞬时压力骤增，可能引发级联故障。提升用户体验：缓存直接支撑高频访问，其不可用会导致延迟飙升、功能异常。数据热备价值：部分缓存数据（如会话信息）可能无持久化备份，丢失后影响业务连续性。适用场景：高并发实时系统：如电商秒
我与DeepSeek读《大型网站技术架构》（3）诺亚凹凸曼架构
大型网站架构的核心要素《大型网站技术架构：核心原理与案例分析》第三章聚焦于大型网站架构的核心要素，从技术维度剖析了构建高可用、高性能、可扩展系统的关键设计方向。1.五大核心架构要素(1)性能（Performance）目标：快速响应用户请求，优化用户体验。关键策略：前端优化：CDN加速静态资源、合并压缩JS/CSS、浏览器缓存。服务端优化：缓存（Redis/Memcached）、异步处理（消息队列）
八股文-Linux网络部分 im长街八股文专栏 linux 网络
目录TCP和UDP的区别套接字编程一般的流程是什么Cookie,session和token有什么区别HTTP和HTTPS的区别讲一下TCP的三次握手和四次挥手TCP通过什么来保证可靠性TCP通过什么方式来提高性能了解哪些TCP协议的报头数据如何解决TCP的粘包问题什么是IP协议IP协议的字段了解多少什么是网段划分WAN口ip和LAN口ip的作用了解过NAT技术吗谈一谈你对ARP协议的理解有了ip地
WordPress建站给外贸人带来的负担小机出海建站常谈服务器 ssl https
WordPress是全球最大的开源建站平台，有着丰富的主题与插件，尽管功能非常强大，但也给想要建站的外贸人带来了一些负担。一、技术门槛与学习成本1、由于WordPress发展了几十年，里面的功能应有尽有，但往往这些复杂的功能导致建站新手对它的学习成本变得很高，需要理解各个模块与功能点，增加了上手的复杂度。2、WordPress的建站服务商他不会告诉你，你可能需要知道一些代码知识（HTML、CSS、
Manus联创澄清：我们并未使用MCP技术耶耶Norsea 网络杂烩人工智能
摘要近日，Manus联创针对外界关于其产品可能涉及“沙盒越狱”的疑问进行了正式回应。公司明确表示并未使用Anthropic的MCP（模型上下文协议）技术，并强调MCP是一个旨在标准化应用程序与大型语言模型（LLM）之间上下文交互的开放标准。此外，Manus联创宣布了开源计划，以增强透明度和社区参与。季逸超也确认他们没有采用MCP技术，进一步澄清了相关质疑。关键词沙盒越狱,MCP技术,开源计划,透明
【Servlet】深入解析 Servlet 启动过程 —— 原理分析、代码实战及在 JDK 和 Spring 中的应用工一木子原理分析 Servlet java servlet
深入解析Servlet启动过程——原理分析、代码实战及在JDK和Spring中的应用在JavaWeb开发中，Servlet是一种用于创建动态Web应用程序的核心技术。作为JavaEE（现在是JakartaEE）的基础，Servlet在处理客户端请求、生成响应等方面发挥着重要作用。理解Servlet的启动过程，不仅能帮助我们调试和优化应用，还能为深入掌握JavaWeb开发的核心原理打下坚实基础。本文
HCIE数通 VS HCIE云计算：如何选择最适合你的方向？ IT程序媛-桃子数通华为认证云计算云计算华为数通
在华为认证体系中，HCIE（HuaweiCertifiedInternetworkExpert）无疑是技术专家级别的标志。而在众多HCIE认证方向中，数通（Datacom）和云计算（CloudComputing）成为了很多考生纠结的焦点。它们各有优势，那么对于不同的职业发展规划，应该选择哪个更适合自己呢？【点赞+关注】私我领取华为认证考试复习资料/题库今天，我们就从多个角度来详细对比HCIE数通和
储能变流器硬件工程师能力提升路径 DOMINICHZL 硬件能源硬件工程
储能变流器（PCS，PowerConversionSystem）作为储能系统的核心部件，其硬件设计涉及电力电子、控制理论、热管理、电磁兼容（EMC）等多领域技术。以下是储能变流器行业硬件工程师需要具备的核心能力，以及技术提升的路径建议：一、储能变流器硬件工程师的核心能力电力电子基础能力拓扑设计与分析：熟悉Boost/Buck、双向DC-DC、三相逆变器、LLC谐振变换器等拓扑结构，并能根据效率、成
针对AF调试过程中PD多窗机制是如何打分的爱写BUG的长歌人工智能计算机视觉算法
在AF（自动对焦）调试中，PD多窗机制（PhaseDetectionMulti-Window）是提升相位对焦精度和鲁棒性的关键技术，其核心是通过在画面中划分多个相位检测窗口，分别计算各窗口的相位差（PhaseDifference）并进行综合评分，最终选择最优对焦位置。以下是其打分机制的核心逻辑和调试要点：1.多窗口布局与权重分配窗口划分根据Sensor的PDAF像素分布，将画面划分为多个区域（例如
深入学习Nginx：从入门到实践小码快撩 nginx 学习运维
引言Nginx，全名“EngineX”，是一款高性能的HTTP和反向代理服务器，由俄罗斯程序员IgorSysoev开发。以其轻量级、高并发处理能力和稳定性而闻名于世，广泛应用于负载均衡、动静内容分离、API网关、缓存服务以及静态文件服务等多个场景。本文旨在为读者提供一份详尽的Nginx技术学习指南，助您快速掌握并应用这一强大工具。。一、事件驱动模型在Nginx中，事件驱动模型是其高效处理并发连接的
大数据技术生态圈：Hadoop、Hive、Spark的区别和关系雨中徜徉的思绪漫溢大数据 hadoop hive
大数据技术生态圈：Hadoop、Hive、Spark的区别和关系在大数据领域中，Hadoop、Hive和Spark是三个常用的开源技术，它们在大数据处理和分析方面发挥着重要作用。虽然它们都是为了处理大规模数据集而设计的，但它们在功能和使用方式上存在一些区别。本文将详细介绍Hadoop、Hive和Spark的区别和关系，并提供相应的源代码示例。Hadoop：Hadoop是一个用于分布式存储和处理大规
基于Java的智能家居设计：模块化智能插座的设计与实现 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
智能家居,Java,模块化设计,智能插座,物联网,MQTT,RESTfulAPI1.背景介绍智能家居已成为现代生活的重要趋势，它通过将各种智能设备连接到网络，实现对家居环境的自动化控制和远程管理。智能插座作为智能家居的基础设备之一，能够远程控制电器开关，监测电器功耗，并根据用户需求实现定时开关等功能。传统的智能插座往往采用单片机或嵌入式系统，功能相对单一，难以扩展和升级。随着物联网技术的快速发展，
一体化便携式气象站：从农业到环保，助力各行各业发展 tianhe8888_ 气象站便携式气象站气象监测站
【TH-PQX5】随着科技的飞速进步，气象监测技术也在不断创新与发展。一体化便携式气象站，作为气象监测领域的佼佼者，以其小巧、便捷、功能全面的特点，正逐渐成为各行各业不可或缺的监测工具。从农业到环保，从科研到应急，一体化便携式气象站正以其独特的优势，助力各行各业的发展。一、一体化便携式气象站的基本概述一体化便携式气象站是一种集多种气象要素监测于一体的便携式设备。它通常包括温度传感器、湿度传感器、风
转基因大豆检测仪：快速精准识别，确保大豆安全品质 tianhe8888_ 转基因检测仪转基因检测设备
【TH-ZJY1】在现代农业与食品工业中，转基因作物的安全性一直是公众关注的焦点。为了确保大豆及其制品的安全品质，转基因大豆检测仪应运而生。这种高科技设备以其快速、精准的检测能力，为大豆产业链的安全监管提供了有力支持。一、工作原理基因检测技术转基因大豆检测仪主要依赖于先进的基因检测技术，如聚合酶链反应（PCR）、荧光原位杂交（FISH）或基因芯片等。这些技术能够特异性地识别大豆DNA中的转基因片段
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
【UI自动化技术思路分析】【总纲】UI自动化代码完整设计思路小怪兽长大啦 UI自动化测试技术分享 ui 自动化运维
一、自动化框架散装思路代码结构如下所示️UIAutomationTools：UI自动化操作工具app：业务功能代码ui_automation.py：为Android设备提供UI自动化操作的工具类case：测试用例case_template.csv：UI测试用例步骤config：配置文件login:登录相关的ICON图标路径icon_config.yaml：图片路径配置文件runner：运行器con
从零手撕 LLaMa3 项目爆火（图解+代码）机器学习社区大模型深度学习大模型算法人工智能 RAG 多模态大模型 Llama 面试题
节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。汇总合集《大模型面试宝典》(2024版)发布！一个月前，Meta发布了开源大模型llama3系列，在多个关键基准测试中优于业界SOTA模型，并在代码生成任务上全面领先。此后，开发
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite