摘星星的屋顶

2023年12月2日~12月8日周报（OpenFWI代码细节理解之warm-up策略、Tensorboard的使用、loss的理解等，以及OpenFWI论文初读）

一、前言

二、学习情况

2.1 torch.optim.AdamW的理解

2.2 warm-up策略

2.3 Tensorboard的使用

2.4 Loss的理解

2.5 OpenFWI论文初读

三、遇到的部分问题及解决

四、总结

4.1 存在的疑惑

4.2 下周安排

一、前言

上周对OpenFWI代码中的训练与测试部分进行了抄写与理解，存在一部分疑惑尚未解决。

因此，本周的任务是完成相关细节的理解，包括warm-up策略、Tensorboard的使用、Loss的理解等，最后完成OpenFWI论文的正文部分阅读。

二、学习情况

2.1 torch.optim.AdamW的理解

Adam自2014年提出就受到广泛关注，但是很多研究者发现Adam算法的收敛性得不到保证。AdamW是在Adam的基础上加入了weight decay正则化，实现了带权重衰减的Adam优化算法。正则化是用来防止模型过拟合（泛化能力差，训练样本集准确率高，测试样本集准确率低）而采取的手段，但是Adam的代码中已经有正则化。AdamW的优点包括收敛速度快、适应性强、对于超参数的选择不敏感等。在训练深度学习模型时常常使用AdamW优化器来加速模型的收敛。

其中，lr、betas和eps与Adam优化器的参数相同，weight_ decay则是AdamW的特有参数。

class AdamW(Optimizer):
    """
    Implements Adam algorithm with weight decay fix as introduced in
    `Decoupled Weight Decay Regularization `__.

    Parameters:
        params (:obj:`Iterable[torch.nn.parameter.Parameter]`):
            Iterable of parameters to optimize or dictionaries defining parameter groups.
        lr (:obj:`float`, `optional`, defaults to 1e-3):
            The learning rate to use.
        betas (:obj:`Tuple[float,float]`, `optional`, defaults to (0.9, 0.999)):
            Adam's betas parameters (b1, b2).
        eps (:obj:`float`, `optional`, defaults to 1e-6):
            Adam's epsilon for numerical stability.
        weight_decay (:obj:`float`, `optional`, defaults to 0):
            Decoupled weight decay to apply.
        correct_bias (:obj:`bool`, `optional`, defaults to `True`):
            Whether ot not to correct bias in Adam (for instance, in Bert TF repository they use :obj:`False`).
    """

    def __init__(
        self,
        params: Iterable[torch.nn.parameter.Parameter],
        lr: float = 1e-3, # 学习率
        betas: Tuple[float, float] = (0.9, 0.999), # AdamW优化器中的两个指数衰减率，分别用于计算梯度的一阶矩估计和二阶矩估计，默认值为（0.9,0.999）
        eps: float = 1e-6, # AdamW优化器中一个小常数，用于防止除以零的情况，用于控制L2正则化的强度，通常建议设置为一个小于1的值。默认值为1e-8
        weight_decay: float = 0.0, # L2正则化（权重衰减）的系数，用于控制模型参数的大小。默认值为0
        correct_bias: bool = True,
    ):

参考：当前训练神经网络最快的方式：AdamW优化算法+超级收敛 - 知乎 (zhihu.com)

2.2 warm-up策略

学习率是神经网络训练中最重要的超参数之一，Warm-up是众多学习率优化方式中的一种。

warm-up是一种学习率预热的方法，在训练开始的时候先使用一个较小的学习率训练一些epoches或者steps，使网络熟悉数据，随着训练的进行学习率慢慢变大，等到了一定程度，再修改为预先设置的学习率来进行训练，接着过了一些inter后，学习率再慢慢变小。

学习率变化：上升——平稳——下降；

选择原因：开始训练时，模型的权重(weights)是随机初始化的，此时若选择一个较大的学习率，可能带来模型的不稳定(振荡)，选择Warmup预热学习率的方式，可以使得开始训练的几个epoches或者一些steps内学习率较小。在预热的小学习率下，模型可以慢慢趋于稳定，等模型相对稳定后再选择预先设置的学习率进行训练，使得模型收敛速度变得更快，模型效果更佳。

具体步骤：

启用warm-up，设置warm up setp（一般等于epoch*inter_per_epoch）

lr = args.lr * args.world_size
# 定义优化器
optimizer = torch.optim.AdamW(model.parameters(), lr=lr, betas=(0.9, 0.999), weight_decay=args.weight_decay)

warmup_iters = args.lr_warmup_epochs * len(dataloader_train)
lr_milestones = [len(dataloader_train) * m for m in args.lr_milestones]
# 确定学习率调整策略
lr_scheduler = WarmupMultiStepLR(
    optimizer, milestones=lr_milestones, gamma=args.lr_gamma,
    warmup_iters=warmup_iters, warmup_factor=1e-5)

当step小于warm_iters时，学习率等于基础学习率×(当前step/warm up inters)，由于后者是一个小于1的数值，因此在整个warm up的过程中，学习率是一个递增的过程
当warm up结束后，学习率以基础学习率进行训练，再学习率开始递减

# Scheduler adopted from the original repo
# 自定义调整学习率的方式
class WarmupMultiStepLR(torch.optim.lr_scheduler._LRScheduler):
    def __init__(
        self,
        optimizer, # 优化器
        milestones, # 一个list，每一个元素代表何时调整学习率，list元素必须是递增的，如milestones=[30,80,120]
        gamma=0.1, # 学习率调整倍数（更新lr的乘法因子），默认为0.1倍，即下降10倍
        warmup_factor=1.0 / 3, # 初始学习率
        warmup_iters=5, # 更新epoch数
        warmup_method="linear", # warmup的其中一种方式
        last_epoch=-1, # 上一个epoch数，该变量用于指示学习率是否需要调整。当last_epoch符合设定的间隔时，就会对学习率进行调整。当为-1时，学习率设置为初始值。
    ):
        # sorted()函数对所有可迭代的对象进行排序操作
        if not milestones == sorted(milestones):
            raise ValueError(
                "Milestones should be a list of" " increasing integers. Got {}",
                milestones,
            )

        if warmup_method not in ("constant", "linear"):
            raise ValueError(
                "Only 'constant' or 'linear' warmup_method accepted"
                "got {}".format(warmup_method)
            )
        self.milestones = milestones
        self.gamma = gamma
        self.warmup_factor = warmup_factor
        self.warmup_iters = warmup_iters
        self.warmup_method = warmup_method
        super(WarmupMultiStepLR, self).__init__(optimizer, last_epoch)

    # 获取学习率
    def get_lr(self):
        warmup_factor = 1
        # 根据不同的策略设置相应的warm-up学习率
        if self.last_epoch < self.warmup_iters:
            # constant从一个很小的学习率一下变为比较大的学习率，会导致训练误差突然增大
            if self.warmup_method == "constant":
                warmup_factor = self.warmup_factor
            # linear避免constant的不足，线性增长
            elif self.warmup_method == "linear":
                alpha = float(self.last_epoch) / self.warmup_iters
                warmup_factor = self.warmup_factor * (1 - alpha) + alpha
        return [
            base_lr *
            warmup_factor *
            self.gamma ** bisect_right(self.milestones, self.last_epoch)
            for base_lr in self.base_lrs
        ]

常见的warm-up方式：constant，linear和exponent

参考：

一文看懂学习率warmup及各主流框架实现差异 - 知乎 (zhihu.com)
torch.optim.lr_scheduler：调整学习率-CSDN博客
pytorch之warm-up预热学习策略_pytorch warmup_还能坚持的博客-CSDN博客

2.3 Tensorboard的使用

Tensorboard是一组可用于数据可视化的工具，包含在流行的开源机器学习库TensorFlow中，其主要功能包括：

可视化模型的网络架构
跟踪模型指标，如损失、准确性变化等
检查机器学习工作流程中权重、偏差和其他组件的直方图
显示非表格数据，包括图像、文本和音频
将高维嵌入投影到低维空间

使用步骤：

（1）安装Tensorboard：

本次Tensorboard在pycharm终端中下载，先激活Pytorch环境，接着输入pip install tensorboard；下载完成后，还需要安装另一个它所依赖的库pip install future。

pip install tensorboard
pip install future

下载完成后，可以通过pip list查看是否安装成功：

（2）启动Tensorboard：

打开Pycharm终端，输入dir查看项目当前文件夹中的文件：

设置路径，输入tensorboard --logdir=./runs，./runs为想要可视化数据所在的文件夹路径，接着点击网址，打开tensorboard页面

有的时候，可能主机很多人在使用，为防止端口号冲突，可以设定特别的主机端口，方法是多加一个参数：--port=，例如：
tensorboard --logdir=XXX --port=6666

Tensorboard中涉及的类：SummaryWriter（在给定目录中创建事件文件，并向其中添加摘要和事件。该类异步更新文件内容，这允许训练程序调用方法以直接从训练循环将数据添加到文件中，而不会减慢训练速度。）

# Set up tensorboard summary writer 设置 tensorboard 摘要编写器
train_writer, val_writer = None, None
if args.tensorboard:
    utils.mkdir(args.log_path)  # create folder to store tensorboard logs
    if not args.distributed or (args.rank == 0) and (args.local_rank == 0):
        # SummaryWriter：在给定目录中创建事件文件，并向其中添加摘要和事件。
        # 该类异步更新文件内容，允许训练程序调用方法以直接从训练循环将数据添加到文件中，而不会减慢训练速度。
        train_writer = SummaryWriter(os.path.join(args.output_path, 'logs', 'train'))
        val_writer = SummaryWriter(os.path.join(args.output_path, 'logs', 'val'))

writer.add_scalar()：目的是添加一个标量数据（scalar data）到summary中，用于在tensorboard中加入loss，其中常用参数有：

tag：标签，用于描述该标量数据图的标题
scalar_value：标签的值
global_step：标签的x轴坐标

if writer:
    writer.add_scalar('loss', loss_val, step)
    writer.add_scalar('loss_g1v', loss_g1v_val, step)
    writer.add_scalar('loss_g2v', loss_g2v_val, step)

store_true 是指带触发action时为真，不触发则为假。

有default值的时候，running时不声明就为默认值；没有的话，如果是store_false,则默认值是True，如果是store_true,则默认值是False。

参考：

TensorBoard最全使用教程：看这篇就够了 - 知乎 (zhihu.com)
【pytorch】使用tensorboard进行可视化训练-CSDN博客
Tensorboard的使用 ---- SummaryWriter类（pytorch版）-CSDN博客

2.4 Loss的理解

2.4.1 L1损失函数

L1损失函数也叫平均绝对值误差（MAE-mean abs error），是指预测值和真实值之间差值的绝对值。

$E=\frac{1}{m}\sum_{i=1}^{m}|y_{i}-f(x_{i})|$

yi是指目标值，f(xi)是指估计值。

缺点：梯度恒定；导数不连续；
优点：收敛速度必L2损失函数更快，L1可以提供更大且稳定的梯度；

2.4.2 L2损失函数

L2损失函数也叫平均平方误差（MSE-mean square error），是指预测值和真实值之间的差值（会计算神经网络的输出和正确解监督数据的各个元素之差的平方，再求总和）。均方误差公式如下：

$E=\frac{1}{m}\sum_{i=1}^{m}(y_i{}-f(x_{i}))^{2}$

缺点：收敛速度比L1慢，梯度会随着预测值接近真实值而不断减小；对异常数据比L1更加敏感，这是由平方项引起的，异常数据会引起很大的损失；
优点：训练更容易，鲁棒性（指模型在陌生环境或者噪声干扰下依旧能够完成预期任务的能力）更好，梯度随着预测值接近真实值而不断减小，不会轻易错过极点值，但是容易陷入局部最优；导数具有封闭解，更容易进行优化和编程。

2.5 OpenFWI论文初读

在本周完成了OpenFWI论文的初读任务，见：论文学习记录之OpenFWI（Large-scale Multi-structuralBenchmark Datasets for Full Waveform Inversion）-CSDN博客。

三、遇到的部分问题及解决

运行test.py文件遇到了如下问题：f'{funcname}() argument must be str, bytes, or ‘‘, f'os.PathLike object, not {s.__class__.__name__!

检查代码：通常是字符串两端的引号未正确匹配、成对造成的，是否有单引号、双引号或三引号没有闭合（只有开头无结尾）

解决方式：

①查看genericpath.py发现存在错误：

②注释代码：

运行成功：

四、总结

4.1 存在的疑惑

项目所涉及的知识点太多，感觉对很多概念一知半解，该如何解决？
实验室师兄师姐的项目一般会用到预热学习率吗？如果使用的话，一般采用什么策略？
对loss损失函数、优化器等概念需要掌握到什么程度呢？了解他们之间的区别并熟悉用法吗？
哪种损失函数的使用更多？根据个人项目决定吗？

4.2 下周安排

阅读剩下OpenFWI论文中的细节，并尝试修改部分参数，运行后对比效果；
打开Tensorboard，进行可视化；
运行完代码，查看结果；

python rest framework_Python Django rest framework
本节内容Djangorestframework安装Djangorestframwwork环境配置简单举例说明Django中使用restframework1.1安装Djangorestframework建立新的环境可以忽略virtualenvenvsourceenv/bin/activate安装djangorestframework模块pipinstalldjangopipinstalldjango
Python大数据分析&人工智能教程 - Django-Celery异步处理（深入解析与实战案例） AI_DL_CODE python 数据分析 Django Celery异步处理 Celery
文章目录1.概念介绍1.1Django框架概述1.2Celery异步任务队列1.3AMQP协议与消息路由2.环境搭建2.1安装Django和Celery2.2配置Redis作为消息代理3.Celery架构与工作原理3.1Celery组件介绍3.2任务生命周期3.3任务调度与执行3.3.1定时任务3.3.2异步任务调用3.3.3任务结果查询4.Django与Celery集成4.1创建Celery实例
Python使用连接池操作MySQL 菜鸟驿站2020 python python mysql
测试环境说明：Python版本是3.8.10，DBUtils版本是3.1.0，pymysql版本是1.0.3首先安装指定版本的连接池库DBUtils、还有pymysqlpipinstallDBUtils==3.1.0pipinstallpymysql==1.0.3创建文件sqlConfig.py#sqlConfig.pyimportpymysqlfromdbutils.pooled_dbimpor
python序列化工具_python_restframework(序列化) weixin_39623271 python序列化工具
django自带的序列化工具serializers三步骤导入fromdjango.coreimportserializers生成对象并传参response=serializers.serialize('json',book_list)第一个json是解析器，说明要解析成json格式的字符串,第二个是queryset对象,最后返回结果returnJsonResponse(response,safe=
智能之火，重塑创造：大模型如何点燃新一代开发引擎？黑巧克力可减脂 AIGC 人工智能 AIGC
导言：普罗米修斯之火再现在科技演进的长河中，每一次生产力的跃迁都伴随着工具的质变。从蒸汽机轰鸣到电力普及，再到信息高速公路的铺就，人类驾驭能量的能力不断突破。今天，我们站在一个崭新的临界点上：大语言模型（LLM）正将人工智能的“普罗米修斯之火”引入软件开发的核心腹地。这不再仅仅是效率的优化，更是对开发者角色、开发流程乃至软件本质的深度重塑。GitHubCEOThomasDohmke曾断言：“Cop
Python大数据分析&人工智能教程 - Django-RestFramework框架（深入解析+实操案例） AI_DL_CODE python 数据分析 django RestFramework框架
文章目录1.Django-RestFramework基础1.1Django-RestFramework概述1.2安装与配置1.3构建第一个API1.3.1定义模型1.3.2创建序列化器1.3.3定义视图1.3.4配置URL路由1.4进阶功能1.4.1权限控制1.4.2限流1.5实战案例1.5.1创建图书1.5.2查询图书1.5.3更新图书1.5.4删除图书2.序列化器(Serializers)2.
Golang中的数组 white.tie Golang golang 开发语言后端
GolangArray和以往认知的数组有很大不同。有点像Python中的列表1.数组：是同一种数据类型的固定长度的序列。2.数组定义：vara[len]int，比如：vara[5]int，数组长度必须是常量，且是类型的组成部分。一旦定义，长度不能变。3.长度是数组类型的一部分，因此，vara[5]int和vara[10]int是不同的类型。4.数组可以通过下标进行访问，下标是从0开始，最后一个元素
Python从0到100完整学习指南（必看导航）是Dream呀 Python python 人工智能爬虫 web 神经网络算法深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和工作就业的先行者！【优惠信息】•新专栏订阅前1000名享9.9元优惠•订阅量破10
python 复制word表格并粘贴_Python应用之可控顺序复制粘贴 weixin_40005887 python 复制word表格并粘贴
1、应用场景：有大量源数据（保存在Excel表格中）需要逐个进行筛查（在第三方平台接口进行查询）。2、场景举例：由于学生无法上网，老师需要帮助上百名同学在第三方平台查询考试成绩。平台无法批量导入查询，只能逐个输入查询。3、常规操作步骤：从excel表格复制一个源数据，然后粘贴到第三方平台输入口，然后点击查询，获取查询结果。4、常规操作的问题：频繁切换窗口从excel中单元格中复制数据比较繁琐，此动
python word表格操作_Python|处理word的基本操作苗舰舰 python word表格操作
问题描述众所周知python有很多第三方库，这也是python简单实用的原因。要想用python处理word文档就需要安装python-docx库。解决方案1安装python-docx库首先找到python根目录(就是有python.exe的文件夹)打开Scripts文件夹Shift+鼠标右键选择在此处打开powershell窗口或者cmd窗口输入pipinstallpython-docx按下回车
Hadoop WordCount 程序实现与执行指南
HadoopWordCount程序实现与执行指南下面是使用Python实现的HadoopWordCount程序，包含完整的Mapper和Reducer部分。这个程序可以在PyCharm中本地测试，也可以部署到远程Hadoop集群上运行。mapper.pyimportsys#从标准输入读取数据forlineinsys.stdin:#移除行首行尾的空白字符line=line.strip()#将行分割为
Python|读取word文档表格内容算法与编程之美算法之美编程语言人工智能 python 数据挖掘数据可视化
本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。引言在日常生活里，不管是办公、学习还是制作邀请函、请柬、简历等等，我们都会使用一个软件MicrosoftOfficeWord，OfficeWord是微软公司的一个收费文字处理应用程序，是最流行的文字处理程序之一，它虽功能强大，但简学易懂，但同时也有一个缺点，当一个Word文档储存的内容特别庞大的时候，使用者想要提取自己想要
【机器学习&深度学习】模型微调的基本概念与流程一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？三、微调的基本流程（以BERT为例）1️⃣准备数据2️⃣加载预训练模型和分词器3️⃣数据编码与加载4️⃣定义优化器5️⃣开始训练6️⃣评估与保存模型四、是否要冻结BERT层？五、完整训练示例代码5.1环境依赖5.2执行代码总结：微调的优势前言在自然语言处理（NLP）快速发展的今天，预训练模型如BERT成为了众多任务
FastGPT与MCP：解锁AI新时代的技术密码挑战者666888 AI模型应用实战迁移学习集成学习文心一言
一、AI浪潮中的新星：FastGPT与MCP登场在当今科技飞速发展的时代，人工智能（AI）已成为推动各行业变革的核心力量。从智能语音助手到复杂的图像识别系统，AI的应用无处不在，而其中的关键技术——语言模型和集成平台，更是备受关注。FastGPT和MCP（Multi-ComponentPlatform）作为这一领域的新兴代表，正逐渐崭露头角，为AI的发展注入新的活力。FastGPT，以其高效的推理
Python解释器路径查找
1.Pythoninterpreter获取Python解释器的完整路径。importsysprint(sys.executable)2.安装了多个Python，查看每个的位置win+Rcmd打开控制台输入：wherepython
前沿技术推动机器人的智能化升级 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据机器人 ai
前沿技术推动机器人的智能化升级关键词：机器人智能化、人工智能、机器学习、计算机视觉、自主导航、人机交互、边缘计算摘要：本文深入探讨了前沿技术如何推动机器人从传统自动化向智能化升级的演进过程。文章首先分析了机器人技术发展的历史脉络和当前挑战，然后详细阐述了人工智能、机器学习、计算机视觉等关键技术如何赋能机器人智能化。通过算法原理分析、数学模型构建和实际项目案例，展示了智能机器人的核心技术实现路径。最
linux深度学习问题汇总不想改代码备忘录 linux python 深度学习 pytorch 人工智能 1024程序员节
目录一、异常问题1.segementationfault(coredump)2.Illegalinstruction(coredumped)3.死锁4.掉卡二、通用方法1.查看重启记录2.系统性能监控3.后台执行命令4.异常日志三、深度学习技术1.普通网络改DDP训练，单机多卡，pytorch四、专业内容方法1.微调diffusion类模型本文记录一些在使用linux服务器进行深度学习时遇到的问题
提升首屏加载的秘密武器：一文讲透 CDN 加速核心逻辑网罗开发实战源码前端 json javascript
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
量化AI价值的30个关键指标 mao_feng 人工智能 AI
摘要：量化AI的战略价值人工智能（AI）成功集成到业务运营中超越了单纯的技术部署;它需要一种严格、可量化的方法来展示其价值。本报告系统地分类并解释了评估AI优势的基本指标，从核心模型性能到总体战略和道德考虑因素。必须制定多方面的衡量策略，将技术AI指标与运营效率、客户体验、财务绩效、战略优势和负责任的AI实践等有形业务成果直接联系起来。稳健的关键绩效指标（KPI）不仅仅是问责制的工具;它们是持续改
python3常用模块 ZZH1120KQ python 开发语言
1数学运算模块math“math”模块提供了许多常用的数学函数，例如三角函数、四舍五入、指数、对数、平方根、总和等importmath1.1常数math.pi返回圆周率的数学常数。math.e返回指数的数学常数示例：print(math.pi)print(math.e)1.2fabs(x)取绝对值示例：print(math.fabs(5))print(math.fabs(-5))1.3ceil(x
Django REST framework - 设置 djangopython
settings.py命名空间是个绝妙的主意，让我们多用用吧！——《Python之禅》DjangoREST框架的配置都放在一个命名空间内，即Django的一个设置，名为REST_FRAMEWORK。例如，项目的settings.py文件可能包含类似以下内容：REST_FRAMEWORK={'DEFAULT_RENDERER_CLASSES':['rest_framework.renderers.J
生信分析用python还是r_生信分析利器：JupyterLab weixin_39612726 生信分析用python还是r
生信分析对计算机的开发环境有诸多要求，随之而来的自然就是很多麻烦。不说别的，要兼顾Python和R的问题就有够头疼。一边想着用Python搭流程处理文本和分析结果，另一边还想着用R来做统计分析和画图，而且大多数时候生信分析还得在服务器上完成。Python你用Pycharm，R用Rstudio，一会这儿一会那儿的切来切去，还得设置服务器连接(Pycharm如果不是付费版本，要连服务器还挺麻烦)。完了
Python 爬虫实战：抓取哔哩哔哩收藏夹视频（API 逆向 + 视频分类整理）西攻城狮北 python 爬虫音视频
引言哔哩哔哩（B站）作为国内知名的视频分享平台，拥有丰富多样的视频资源和活跃的用户社区。对于视频创作者、数据分析人员或爬虫学习者来说，抓取B站收藏夹中的视频数据，不仅能帮助我们更好地了解用户喜好和视频内容，还能为创作和研究提供有力支持。本文将深入浅出地讲解如何通过Python爬虫实现抓取哔哩哔哩收藏夹视频，并对其进行分类整理，涵盖从环境搭建、API逆向分析到数据处理与存储等关键步骤，旨在为读者提供
【Python学习】可视化图表-使用matplotlib绘制不同种类散点图西攻城狮北 Python实用案例 python 学习 matplotlib 可视化图形
一、引言在数据可视化领域，散点图是一种极其强大的工具，它能够直观地展示变量之间的关系、数据分布的模式以及潜在的聚类情况等。通过散点图，我们可以轻松地发现数据中的异常值、相关性以及其他隐藏的特征。Python的matplotlib库提供了丰富而灵活的功能，可以帮助我们绘制出各种类型的散点图，以满足不同的数据分析和展示需求。本文将深入探讨如何使用matplotlib绘制多种类型的散点图，并提供详细的代
18个Python高效编程技巧！程序员笑武 python 开发语言数据分析信息可视化运维
初识Python语言，觉得python满足了我上学时候对编程语言的所有要求。python语言的高效编程技巧让我们这些大学曾经苦逼学了四年c或者c++的人，兴奋的不行不行的，终于解脱了。高级语言，如果做不到这样，还扯啥高级呢？01交换变量>>>a=3>>>b=6这个情况如果要交换变量在c++中，肯定需要一个空变量。但是python不需要，只需一行，大家看清楚了>>>a,b=b,a>>>print(a
python连接db2的官方库ibm_db的api 数据-脚本-资源-管道 ibm-db python 数据库 python
IBM_DBAPI详细文档ibm_db.active描述检查指定的数据库连接是否处于活动状态传入参数connection:有效的数据库连接资源返回值True:资源处于活动状态False:资源未处于活动状态例子importibm_dbconn=ibm_db.connect("DATABASE=testdb;HOSTNAME=localhost;PORT=50000;PROTOCOL=TCPIP;UI
Python 爬虫实战：动态数据+定时任务+价格预测全链路解析西攻城狮北 python 爬虫开发语言
一、动态数据捕获技术栈1.1目标网站分析（以某OTA平台为例）实现原理：本节演示如何使用Selenium自动化浏览器访问机票查询页面。选择Selenium而非直接请求API的原因在于：目标网站采用JavaScript动态渲染价格数据需要模拟用户操作（如选择日期、舱位）触发数据加载需处理反爬机制（如Cookie验证、行为检测）fromseleniumimportwebdriverfromseleni
Python并发编程基础：进程与线程本质区别详解 Yant224 python #并发编程 python 进程与线程并发编程多线程原理多进程原理并发模型线程安全
一、进程与线程的本质概念1.核心定义操作系统进程1进程2线程1线程2线程3线程1线程2进程(Process)：操作系统进行资源分配的基本单位线程(Thread)：操作系统进行任务调度的基本单位每个进程至少包含一个主线程，线程是进程的执行分支二、核心区别深度解析1.资源分配对比维度进程线程内存空间独立地址空间共享进程内存空间文件句柄独立文件描述符表共享进程文件描述符网络连接独立socket连接共享进
Python 自动批量生成发卡平台卡密信息并导入数据库拉灯的小手支付相关及一些实用小脚本 Python脚本 Python 自动脚本自动发卡平台发卡网
本文仅供学习交流使用，如侵立删！demo下载见文末Python自动批量生成发卡平台卡密信息并导入数据库环境win10Python：3.6.7os、csv、uuid、datetime1、生成脚本生成卡密文件：txt、csv各一份txt：导入发卡平台csv：导入数据库#-*-coding:utf-8-*-#作者：Administrator#文件：提取码txt转csv脚本.py
python中classmethod中讲解 AI专题精讲 python python
classmethod中的cls和self区别在Python中，@classmethod是一个装饰器，用于定义类方法。类方法与实例方法不同，它操作的是类本身，而不是类的实例。cls和self的区别：cls:cls是类方法的第一个参数，代表类本身。类方法通过@classmethod装饰器定义，调用时不需要创建类的实例。cls通常用于访问或修改类级别的属性，或者创建类的实例。self:self是实例方
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

2023年12月2日~12月8日周报（OpenFWI代码细节理解之warm-up策略、Tensorboard的使用、loss的理解等，以及OpenFWI论文初读）

一、前言

二、学习情况

2.1 torch.optim.AdamW的理解

2.2 warm-up策略

2.3 Tensorboard的使用

2.4 Loss的理解

2.4.1 L1损失函数

2.4.2 L2损失函数

2.5 OpenFWI论文初读

三、遇到的部分问题及解决

四、总结

4.1 存在的疑惑

4.2 下周安排

你可能感兴趣的:(周报,人工智能,深度学习,python,pytorch)