spearhead_cai

Jupyter 进阶教程

2019 年第 65 篇文章，总第 89 篇文章

本文大约 7500 字，建议收藏阅读

原题 | Tutorial: Advanced Jupyter Notebooks

作者 | Benjamin Pryke

译者 | kbsc13("算法猿的成长"公众号作者)

原文 | https://www.dataquest.io/blog/advanced-jupyter-notebooks-tutorial/

声明 | 翻译是出于交流学习的目的，欢迎转载，但请保留本文出于，请勿用作商业或者非法用途

前言

上次介绍了Jupyter 入门教程，这次介绍更多 Jupyter notebook 的使用技巧。

本文主要介绍以下内容：

介绍一些基本的 shell 命令和方便的魔法命令，包括 debug，计时以及执行多种语言；
探索如 logging、macros、运行外部代码以及 Jupyter 的拓展插件；
介绍如何加强 Seaborn 模块的图表，通过命令行运行，以及使用数据库。

Shell 命令

在 notebook 中可以直接采用 shell 命令，只需要在 code cell 中，以 ! 开头的都会被当做一个 shell 命令，这在处理数据或者文件，管理 Python 包的时候非常有用。以下是一个简单的示例：

此外，也可以通过添加 $ 命令在 shell 命令中加入 Python 的变量，如下所示：

由于 ! 开头的命令在执行完成后就会被丢弃，因此像 cd 这样的命令是没有效果的。不过，IPython 的魔法命令提供了一个解决方法。

基本的魔法命令

魔法命令是内建于 IPython 核中的非常方便有用的命令，它们专门用于处理特定的任务。它们虽然看起来类似 unix 命令，但实际都是通过 Python 实现的。魔法命令非常多，但在本文中仅介绍其中一部分魔法命令。

魔法命令也分两种：

行魔法命令(line magics)
单元魔法命令(cell magics)

从名字就可以知道，主要是根据其作用范围划分，有的在单行内执行，有的可以作用多行或者整个单元内。

想了解可用的魔法命令，可以输入命令 %lsmagic ，输出结果如下所示，可以看到确实分为 line 和 cell 两类，并且分别给出命令的数量。

如果想具体了解这些命令的作用，可以上官网查看--https://ipython.readthedocs.io/en/stable/interactive/magics.html。

行魔法命令和单元魔法命令的使用形式也是不同的，行魔法命令是以 % 开头，而单元魔法命令则是 %% 开头。

实际上 ! 开头是用于 shell 命令的一种比较复杂的魔法语法，之前说的无法采用类似 cd 的命令，可以采用魔法命令实现，即 %cd、%alias、%env 。

下面介绍更多的例子。

自动保存(Autosaving)

首先是 %autosave 命令可以决定 notebook 自动保存的时间间隔，使用例子如下所示，命令后添加时间间隔参数，单位是秒。

%autosave 60

输出结果：

Autosaving every 60 seconds

显示 Matplotlib 的图表

在数据科学中最常用的一个行魔法命令就是 %matplotlib ，它可以用于显示 matplotlib 的图表，使用例子如下：

%matplotlib inline

加上参数 inline 可以确保在一个单元内显示 Matplotlib 的图表。通常需要在导入 Matplotlib 前就采用这个行魔法命令，通常都会放在第一个代码单元内。

代码执行时间（Timing Execution）

通常我们都需要考虑代码的执行时间，在 notebook 中可以有两个时间魔法命令 %time 和 %timeit，它们都有行和单元两种模式

对于 %time ，使用例子如下所示：

%timeit 和 %time 的区别在于，它会对给定代码运行多次，并计算一个平均时间，可以通过添加参数 -n 来指定运行的次数，如果没有指定，则会自动选择一个最佳的数量。例子如下所示：

执行不同编程语言

在 Jupyter notebook 中可以执行不同的编程语言，尽管选择的核有既定的语言，比如本文例子选择的就是 Python3 ，但通过魔法命令可以执行不同的编程语言，在 %lsmagic 的输出结果也可以找到。

下面是一些使用的例子，包括执行 HTML 语言，以及用于显示数学公式的 LaTeX 语言。

当然还可以执行其他编程语言，包括 Ruby 、markdown 、JavaScript、R 等等。

配置日志(Configuring Logging)

在 Jupyter 中有自定义了如何输出错误信息的方法，它可以通过导入 logging 模块实现。

如上图所示，对于错误信息，会高亮显示。

另外，logging 模块的输出和 print 以及标准的单元输出是分开的，如下图所示：

之所以会出现上图的原因是 Jupyter notebook 会监听标准的输出流，stdout 和 stderr ，但 print 和单元输出默认是输出 stdout ，而 logging 则是通过 stderr 输出。

因此，我们可以对 logging 进行配置来显示 stderr 的其他类型的信息，比如下图就显示了 INFO 和 DEBUG 类型的信息。

logger = logging.getLogger()
logger.setLevel(logging.DEBUG)

logging.info('This is some information')
logging.debug('This is a debug message')

还可以自定义信息的输出格式：

handler = logging.StreamHandler()
handler.setLevel(logging.DEBUG)

formater = logging.Formatter('%(levelname)s: %(message)s')
handler.setFormatter(formater)

logger.handlers = [handler]

logging.error('An error')
logging.warning('An warning')
logging.info('An info')

注意，如果每次运行一个单元内包含代码 logger.addHandler(handler) 来添加一个新的 stream handler ，那么每次输出都会多一行额外的信息。我们可以将对日志的配置放在单独的一个单元内，或者就如同上述所示代码，即直接代替所有现在的 handler ，不采用 addHandler ，而是 logger.handlers = [handler]。这种做法可以移除默认的 handler 。

当然也可以将日志信息保存到文件中，代码如下所示，采用 FileHandler 而非 StreamHandler 。

handler = logging.FileHandler(filename='important_log.log', mode='a')

最后，这里采用的日志跟通过 %config Application.log_level='INFO' 设置的日志等级是不相同的，通过 %config 配置的是 Jupyter 输出到当前运行 Jupyter 的终端上的日志信息。

拓展

Jupyter 是一个开源的工具，因此有很多开发者开发了很多拓展插件，具体可以查看：

https://github.com/ipython/ipython/wiki/Extensions-Index

在后面介绍的使用数据库，就采用了插件 ipython-sql，还有就是包含了拼写检查、代码折叠等等功能的一个拓展插件 Github：

https://github.com/ipython-contrib/jupyter_contrib_nbextensions

安装这些插件可以通过下面的命令

pip install ipython-sql
pip install jupyter_contrib_nbextensions
jupyter contrib nbextension install --user
jupyter nbextension enable spellchecker/main
jupyter nbextension enable codefolding/main

加强 Seaborn 的图表

Jupyter notebook 的最常见的一种应用就是用于绘制图表。但 Python 的最常见绘图库 Matplotlib 在 Jupyter 中并未能给出很吸引人的结果，这可以通过 Seaborn 进行美化并添加一些额外的功能。

如果没有安装 seaborn，可以通过命令 pip install seaborn ，或者在 jupyter 中，根据开始介绍的 shell 命令执行方式--!pip install seaborn ，安装完后，就可以先导入必须的库和数据：

%matplotlib inline
import matplotlib.pyplot as plt
import seaborn as sns
data = sns.load_dataset("tips")

通过 seaborn 提供的简单的数据集，这里采用的 tips 是一个 pandas 的 DataFrame 格式数据集，内容是来自一个酒吧或者饭店的账单信息。

通过 data.head() 可以展示前 5 条数据，并查看属性信息。

采用 Matplotlib 绘制 total_bill 和 tip 的关系图：

plt.scatter(data.total_bill, data.tip);

添加 Seaborn 也是很简单，如下所示，通过 seaborn 设置了一个 darkgrid的样式

sns.set()
plt.scatter(data.total_bill, data.tip);

seaborn 总共有 5 种样式：darkgrid, whitegrid, dark, white, and ticks。

实际上我们也可以单独采用 seaborn 的绘图函数，如下所示：

sns.scatterplot(x="total_bill", y="tip", data=data);

上图可以添加每个坐标的标题信息以及对每个数据点有一个提升的标记。Seaborn还可以自动根据数据的类型进行划分，即可以再添加一个维度，这里我们可以再添加属性 smoker 作为参数 hue ，表示数据点的颜色：

sns.scatterplot(x="total_bill", y="tip", hue="smoker", data=data);

添加 smoker 后，我们可以看到每个数据点都根据是否划分为两种颜色的数据点，展示的信息就更加丰富了。我们再进一步，加入属性 size 作为颜色的划分，而 smoker 作为样式，如下所示：

sns.scatterplot(x="total_bill", y="tip", hue="size", , data=data);

seaborn 可以绘制更多更好看的图表，更多的例子可以查看其官网：

https://seaborn.pydata.org/examples/index.html

宏命令(Macros)

很多时候，我们可能会重复做相同的任务，比如每次创建一个新的 notebook，都需要导入相同的一堆第三方库，对每个数据集都进行的统计方法，或者绘制相同类型的图表。

在 Jupyter 里可以将一些代码片段保存为可执行的宏命令，并且能用在所有的 notebooks 里。这种操作可能对其他阅读使用你的 notebook 的人来说并不是很友好的方式，但对你来说，确实会是非常方便以及减轻工作量的方法。

宏命令也是代码，因此也可以包含变量。下面开始介绍示例

首先是写好一个代码单元，主要作用就是输出 Hello, name!，其中 name 也是定义好的一个变量，然后利用命令 %macro 来保存宏命令，名字是 __hello_world，而 28 表示的就是上一个运行顺序为 28 的代码单元，即 In [28] 对应的代码单元，然后 %store 是保存宏命令。

载入宏命令的操作如下，还是采用命令 %store ，但需要加上参数 -r ，以及宏命令的名字。

如果修改在宏命令中采用的变量，其输出结果也会改变：

name = 'Ben'
__hello_world

输出结果：

Hello, Ben!

宏命令还可以实现更多的操作，具体还是可以查看官网。

执行外部代码

在 Jupyter 还可以加载和运行外部代码，也就是 .py 代码文件。这里需要采用的命令分别是 %load 和 %run。

我们先创建一个新的代码文件--imports.py ，其包含内容如下：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

然后在 jupyter 中加载该代码文件：

%load imports.py

运行结果如下：

接着我们创建一个新的代码文件--triangle_hist.py ，代码如下，绘制一个三角形直方图。

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

if __name__ == '__main__':
    h = plt.hist(np.random.triangular(0, 5, 9, 1000), bins=100, linewidth=0)
    plt.show()

然后调用命令 %run 运行：

此外，还可以传递参数给脚本，只需要在代码文件名后添加即可，比如 %run my_file.py 0 "Hello, World!"，或者是传递变量名，如 %run $filename {arg0} {arg1} ，还可以添加 -p 来通过 Python 的分析器运行代码，具体可以参考下面两个 stackoverflow 上的回答：

https://stackoverflow.com/a/14411126/604687
https://stackoverflow.com/questions/582336/how-can-you-profile-a-python-script/582337#582337

脚本运行

Jupyter notebook 最强大的作用是其交互式的流程，但它也可以在非交互式的模式下运行，即可以通过脚本或者命令行形式运行 jupyter notebook。

命令行的基本语法如下：

jupyter nbconvert --to <format> notebook.ipynb

其中 nbconvert 是用于将 notebook 转换为其他形式的一个 API 接口，比如 PDF、HTML、python 脚本(即 .py 文件)，甚至 LaTeX 文件。

比如，需要将 notebook 转换为 PDF 形式：

jupyter nbconvert --to pdf notebook.ipynb

这个操作将生成一个 pdf 文件--notebook.pdf ，当然如果要实现转换为 PDF ，还需要安装一些必须的库--pandoc 和 LaTeX，安装方法可以查看：

https://stackoverflow.com/a/52913424/604687

默认情况下，nbconvert 并不会执行 notebook 里的代码，但可以添加 --execute 来让其运行代码：

jupyter nbconvert --to pdf --execute notebook.ipynb

另外，还可以添加 --allow-errors 来让 nbconvert 会输出代码中的错误信息，并且不会因为出现错误而中断转换过程：

jupyter nbconvert --to pdf --execute --allow-errors notebook.ipynb

使用数据库

要在 jupyter 中使用数据库，首先需要安装 ipython-sql :

pip install ipython-sql

安装好后，首先输入以下魔法命令来加载 ipython-sql 。

%load_ext sql

接着就是连接到一个数据库：

%sql sqlite://

输出：

'Connected: @None'

这里是连接到一个临时的数据库，你也可以指定连接到你的数据库，可以按照官网(https://docs.sqlalchemy.org/en/latest/core/engines.html#database-urls)的语法进行连接：

dialect+driver://username:password@host:port/database

比如可以是类似 postgresql://scott:tiger@localhost/mydatabase，也就是 driver 就是 postgresql ，usename 是 scott ，password 是 tiger，host 是 localhost ，然后 database 是 mydatabse .

接下来就是快速采用之前用 Seaborn 加载的 tips 的数据集来构建我们的数据库：

接下来就可以对数据进行一些查询的操作，如下所示，这里需要用到多行魔法命令形式 %% ：

还可以进行更复杂的查询操作：

更多的例子可以查看 https://github.com/catherinedevlin/ipython-sql

小结

对比原文，其实删除了部分内容，比如脚本运行 jupyter 部分，自定义 jupyter 的样式，然后数据库部分也有所删减，主要是原文的代码总是缺失一部分内容。

本文中涉及到的网站链接：

https://github.com/catherinedevlin/ipython-sql
https://github.com/ipython-contrib/jupyter_contrib_nbextensions
https://github.com/mwaskom/seaborn-data
https://stackoverflow.com/a/14411126/604687
https://stackoverflow.com/questions/582336/how-can-you-profile-a-python-script/582337#582337
https://nbconvert.readthedocs.io/en/latest/install.html#installing-nbconvert
https://stackoverflow.com/a/52913424/604687
https://github.com/catherinedevlin/ipython-sql

最后本文的代码都上传到 Github 上了：

https://github.com/ccc013/Python_Notes/blob/master/Projects/jupyter_notebook_tutorial/jupyter_advanced_tutorial.ipynb

欢迎关注我的微信公众号--算法猿的成长，或者扫描下方的二维码，大家一起交流，学习和进步！

如果觉得不错，在看、转发就是对小编的一个支持！

你可能感兴趣的:(Jupyter 进阶教程)

Ubuntu 24.04 LTS 通过 docker desktop 安装 seafile 搭建个人网盘 Kasen's experience #Ubuntu ubuntu docker linux Seafile
准备Ubuntu24.04LTSUbuntu空闲硬盘挂载Ubuntu安装DockerDesktop[我的Ubuntu服务器折腾集](https://blog.csdn.net/jh1513/article/details/145222679。安装seafile参考资料Docker安装Seafile+OnlyOffice并配置OnlyOffice到Seafile，实现在线编辑功能官方教程用Docke
15-面向对象进阶澄子兮 Python python 开发语言
面向对象三个特征封装没有学习封装之前，效果如下：classPerson(object):def__init__(self,name,age):self.name=nameself.age=agexiaoming=Person("alvin",16)xiaoming.age=1000print(xiaoming.age)xiaoming.age=-10print(xiaoming.age)#可以看到
webUI自动化之基本框架搭建（python + selenium + unittest）_python ui自动框架 2401_84140628 2024年程序员学习自动化 python selenium
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 linux 网络安全 web安全密码学 CTF夺旗赛
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
Android Kotlin MVP 架构项目教程常樱沙Vigour
AndroidKotlinMVP架构项目教程android-kotlin-mvp-architectureThisrepositorycontainsadetailedsampleappthatimplementsMVParchitectureinKotlinusingDagger2,Room,RxJava2,FastAndroidNetworkingandPlaceholderView项目地址:
GBase 8c 教程（十六）VACUUM指令唤溪 GBase 8c 数据库 database
GBase8c数据库需要周期性的清理维护以达到最优的性能，清理维护工作可以通过自动清理守护进程或手动管理VACUUM命令来进行。一、VACUUM命令基础建议使用VACUUM命令定期对GBase8c数据库的表进行清理，主要有以下几个原因：恢复或重用被已更新或已删除行所占用的磁盘空间；更新被查询规划器使用的数据统计信息；更新可见性映射，它可以加速只用索引的扫描；保护老旧数据不会由于事务ID回卷或多事务
OpenBayes 一周速览｜微软 Phi-4 发布，降低更多成本实现高效推理；Terra 时空数据集上线
公共资源速递5个数据集：Terra多模态时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集SentimentandEmotionAnalysisDataset情感情绪分析数据集4个教程：一键部署Phi-4Docling：文档解析神器一键部署QVQ-72B-preview铅笔素描风格文生图
OpenBayes 一周速览丨ShowUI专注GUI自动化，可解析屏幕截图和用户指令；U-MATH数据集上线
公共资源速递5个数据集：U-MATH数学推理数据集AlMedicalChatbot医学对话数据集Tecnalia电子设备废物高光谱数据集WaterlooExploration大规模图像质量评估数据库WasteClassification可回收物及生活垃圾分类数据集3个教程：一键部署QwQ-32B-PreviewHunyuanVideo腾讯混元文生视频DemoShowUl：专注GUI自动化的视觉-语
OpenBayes 一周速览｜一键部署Qwen2.5-Coder，0编程经验实现代码生成自由！
公共资源速递5个数据集：Coil-100图像数据集Muharaf手写阿拉伯文数据集CollectiveActivity集体活动视频数据集MultimodalSpectroscopic化学多模光谱数据集CDFSOD-benchmark跨域小样本对象检测基准数据集3个教程：一键部署Qwen2.5-CoderInkSight将手写文字数字化DemoGLM-4-Voice端到端中英语音对话模型访问官网立即
使用LangChain构建简单LLM翻译应用 fGVBSAbe langchain java 前端 python
技术背景介绍在本教程中，我们将学习如何使用LangChain构建一个简单的语言模型（LLM）应用程序，该应用程序用于将文本从英语翻译成其他语言。虽然这个应用程序比较简单，但它是学习LangChain的一个不错的开始，因为许多复杂功能都可以通过简单的提示和LLM调用构建。核心原理解析LangChain通过链式调用多个组件，使得复杂的语言处理任务变得简单易行。我们将使用LangChain的以下功能：语
OpenBayes 一周速览｜微软 Phi-4 发布，降低更多成本实现高效推理；Terra 时空数据集上线
公共资源速递5个数据集：Terra多模态时空数据集ChineseCouplets中文对联数据集AqueousSolubility无机化合物数据集HumanLikeDPODataset大模型对话微调数据集SentimentandEmotionAnalysisDataset情感情绪分析数据集4个教程：一键部署Phi-4Docling：文档解析神器一键部署QVQ-72B-preview铅笔素描风格文生图
PyCharm安装PyQt5及工具详细教程 JustLikeRun pycharm qt ide pyqt
PyCharm安装PyQt5及工具详细教程PyCharm是一款功能强大的Python集成开发环境（IDE），而PyQt5是一个用于创建GUI应用程序的流行Python库。在本教程中，我将指导您如何在PyCharm中安装PyQt5及其相关工具，并提供相应的源代码示例。步骤1：安装PyCharm首先，您需要下载并安装PyCharm。您可以从JetBrains官方网站（https://www.jetbr
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Flutter ListView进阶：如何实现根据索引值滚动到列表特定位置 md_1008 flutter javascript 前端
在Flutter开发中，ListView是一个非常常用的组件，它允许我们展示一系列的项目。然而，有时候我们需要根据特定的索引值滚动到ListView中的某个项目位置，以便提供更好的用户体验。本文将详细介绍如何在Flutter中实现这一功能。一、基础准备首先，我们需要确保我们的ListView是可滚动的。在Flutter中，常用的可滚动ListView包括ListView、ListView.buil
chatgpt赋能python：用Python安装Jupyter：让数据科学变得更加高效！ aijinglingchat ChatGpt python chatgpt jupyter 计算机
用Python安装Jupyter：让数据科学变得更加高效！对于数据科学家而言，jupyter是不可或缺的工具之一。它是一个基于web的交互式计算环境，可以帮助我们在Python中以一种轻松、方便、可交互的方式进行编程和数据分析。今天，我们将向您介绍在Python中如何安装jupyter。安装Python要安装jupyter，首先需要安装Python。如果您已经安装了Python，请跳到下一步。您可
Kylin入门教程 -龙川- 介绍学习笔记 kylin
引言ApacheKylin是一个开源的分布式分析引擎，提供Hadoop上的多维分析（OLAP）能力，使得超大规模数据集的实时查询和分析成为可能。它通过预计算数据立方体来加速查询，使得复杂查询可以在亚秒级响应。本文将详细介绍Kylin的基本概念、安装与配置、基本操作及高级功能，帮助你全面掌握这款强大的数据分析工具。第一部分：Kylin简介1.1什么是Kylin？Kylin是由eBay开发并捐赠给Ap
MySQL知识大总结（进阶）神秘的t mysql 数据库
一，数据库的约束1，约束类型1notnull非空约束，标记这个字段不可以为空2unique唯一约束，标记这个字段的值是该列唯一的值，在这一列的其他行，不可以与该字段相等3default默认约束，在该字段没有赋值时，使用默认值填充该列4primarykey主键约束，相当于notnull+unique5foreignkey外键约束，与其他表的主键简历联系，在添加或修改数据是，会根据主外键关系检查数据是
ASP.NET Core N-Tier 架构 Web API 项目教程蓬为宜
ASP.NETCoreN-Tier架构WebAPI项目教程aspnetcore.ntier.NETCoreN-TierarchitectureWebApisampleproject.项目地址:https://gitcode.com/gh_mirrors/as/aspnetcore.ntier项目介绍ASP.NETCoreN-Tier架构WebAPI项目是一个示例项目，展示了如何使用ASP.NETC
MCP（Model Context Protocol）模型上下文协议进阶篇4 - 发展计划 AIQL MCP(Model Context Protocol)MCP ai language model 开源协议人工智能
ModelContextProtocol（MCP）正在快速发展。这一章概述了2025年上半年关键优先事项和未来方向的当前思考，尽管这些内容可能会随着项目的进展而发生显著变化。目前MCP的主要内容，除实战篇外（包括理论篇、番外篇和进阶篇）均已进入收尾阶段。在官方未发布重大更新前，预计短期不会新增其他篇章。远程MCP支持（RemoteMCPSupport）我们的首要任务是启用远程MCP连接，允许客户端
ros2_control 6 自由度机械臂 kuan_li_lyg ROS &ROS2 机器人人工智能 ROS 机械臂控制工程算法
系列文章目录前言ros2_control是一个实时控制框架，专为普通机器人应用而设计。标准的c++接口用于与硬件交互和查询用户定义的控制器命令。这些接口增强了代码的模块化和与机器人无关的设计。具体的应用细节，例如使用什么控制器、机器人有多少个关节以及它们的运动学结构，则通过YAML参数配置文件和通用机器人描述文件（URDF）来指定。最后，通过ROS2启动文件部署ros2_control框架。本教程
使用Scrapy抓取图片网站的图片：完整教程与实战案例 Python爬虫项目 2025年爬虫实战项目 scrapy 爬虫 python 音视频开发语言 selenium
引言在互联网时代，图片已经成为我们生活和工作中不可或缺的一部分。随着社交媒体、电子商务、新闻网站等平台的普及，图片的需求量和使用量不断增加。因此，如何高效、便捷地抓取网站上的图片，成为了许多数据工程师、爬虫开发者以及数据科学家需要解决的问题。Scrapy是Python中一个非常强大且广泛使用的爬虫框架。它不仅提供了强大的抓取能力，还能够轻松地处理大规模数据抓取和高效的数据存储。Scrapy适合处理
deepin下载mysql教程 deepinmysql
官方下载Mysql8.2支持here解压到需要的文件夹去(建议放到/opt/mysql/mysql8)建立mysql的用户与组（groupaddmysql&&useradd-r-gmysqlmysql）创建软链接到系统中,后继服务与配置中会使用到cd/usr/local&&sudoln-s/opt/mysql/mysql8mysql8cd/usr/bin&&sudoln-s/opt/mysql/m
Web三维CAD绘制一个窗户模型
前言本文使用mxcad3d在网页中创建一个简单的三维窗户模型，mxcad3d提供了丰富的三维建模功能和便捷的API，使得创建各种三维模型变得简单方便，最终效果如下图：环境搭建和入门首先学习mxcad的基本使用方法，可通过官方的入门教程来搭建一个最基本的项目模板，依次查看教程：安装Node.js以及VSCode开发工具、创建mxcad开发项目、API文档接口使用说明。压缩包下载解压后需要在项目目录下
VictoriaMetrics 中文教程（10）集群版简介 prometheus
VictoriaMetrics中文教程系列文章：VictoriaMetrics中文教程（01）简介VictoriaMetrics中文教程（02）安装VictoriaMetrics中文教程（03）如何配置Prometheus使其把数据远程写入VictoriaMetricsVictoriaMetrics中文教程（04）对接Grafana同时介绍vmuiVictoriaMetrics中文教程（05）对接
【TVM 教程】内联及数学函数
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：TianqiChen尽管TVM支持基本的算术运算，但很多时候，也需要复杂的内置函数，例如exp取指函数。这些函数是依赖target系统的，并且在不同target平台中可能具有不同的名称。本教程会学习到如何调用这些target-spe
做python少儿编程教程-超好玩的Python少儿编程 weixin_37988176
1.作者有14年的计算机培训经验，能抓住青少年的学习心理。2.超过180分钟的视频讲解，可下载也可扫码直接观看。《超好玩的Python少儿编程》是写给青少年读者的编程学习用书，主要通过游戏及作品的实例来讲解Python的编程方法，引导青少年在快乐中学习编程。通过游戏编程实例及有趣的作品，让青少年参与其中，培养他们独立分析问题和解决问题的能力，提高他们的探索精神，为今后进一步深入学习编程打好基础。《
鸿蒙开发教程实战案例源码分享-搜索无缝转场跳界面效果 893151960 鸿蒙开发案例分享鸿蒙鸿蒙系统鸿蒙开发鸿蒙教程鸿蒙转场鸿蒙搜索转场效果鸿蒙跳转界面转场
鸿蒙开发教程实战案例源码分享-搜索无缝转场跳界面效果搜索框用下无缝转场效果，不错，给用户的感觉你没跳转界面，还是在本界面搜索，挺高大上的。一、思路：用sharedTransition和pageTransition结合使用二、效果图：看视频更直观点：【2025最新】鸿蒙开发教程实战案例源码分享-搜索转场三、关键代码：@Entry@ComponentstructIndex{pageTransition
线性回归：从基础到进阶的全面解析 tester Jeffky 大模型线性回归机器学习算法
线性回归：从基础到进阶的全面解析线性回归是机器学习中最基本的算法之一，广泛应用于预测和分析。本文将详细介绍线性回归的基本概念、数学原理、实现方法以及在实际应用中的注意事项。我们将通过丰富的代码示例来展示如何从头开始构建一个简单的线性回归模型，并逐步深入到更复杂的场景。1.线性回归的基本概念1.1什么是线性回归？线性回归是一种用于建模两个或多个变量之间关系的统计方法。它假设因变量（目标变量）与一个或
三套uniapp视频教程，让你彻底搞懂uniapp。学习路上助你一臂之力！ guoguo507 uni-app 学习
快速入口在文章最后，大家耐心观看！谢谢(想学其他更多编程技术视频，请进我的博客查看。)Uniapp开发：视频教程的助力之旅在当今数字化飞速发展的时代，移动应用开发已成为众多开发者关注的焦点领域。无论是为了满足企业业务的拓展需求，还是个人开发者想要实现自己的创意想法，开发一款成功的移动应用都面临着诸多挑战和机遇。在这样的大背景下，Uniapp作为一款跨平台开发框架，正以其独特的优势吸引着越来越多开发
yoloV8训练标注数据生成模型安陆米香目标检测计算机视觉 YOLO 目标检测计算机视觉
1、标注工具：vott2、yoloV82.1仓库地址https://github.com/ultralytics/ultralytics2.2参考教程文档文档地址：https://github.com/ultralytics/ultralytics/wiki3、数据集|标注数据格式3.1数据集格式【coco128】3.1.1下载地址：https://cocodataset.org/#downloa
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name