卖报的大地主

【模型加速部署】—— Pytorch自动混合精度训练

自动混合精度

torch. amp为混合精度提供了方便的方法，其中一些操作使用torch.float32（浮点）数据类型，而其他操作使用精度较低的浮点数据类型（lower_precision_fp）：torch.float16(half)或torch.bfloat16。一些操作，如线性层和卷积，在lower_precision_fp中要快得多。其他操作，如缩减，通常需要float32的动态范围。混合精度试图将每个操作与其适当的数据类型相匹配。

通常，数据类型为torch. float16的“自动混合精度训练”一起使用torch.autocast和torch.cuda.amp.GradScaler。并且torch.autocast和torch.cuda.amp.GradScaler是模块化的，如果需要，可以单独使用。

对于CUDA和CPU，API也单独提供：

torch.autocast(“cuda”，args…)等价于torch.cuda.amp.autocast(args…)。

torch.autocast(“cpu”，args…)等价于torch.cpu.amp.autocast(args…)。对于CPU，目前仅支持torch.bfloat16的较低精度浮点数据类型。

自动转换（autocast）

torch.autocast(device_type, dtype=None, enabled=True, cache_enabled=None)

参数：
device_type (str, required) - 使用’cuda’或’cpu’设备
enabled (bool, optional) - 是否在区域中启用autocasting。默认值：True
dtype (torch_dtype, optional) - 是否使用torch.float16或torch.bfloat16。
cache_enabled (bool, optional) - 是否启用autocast内部的权重缓存。默认值：True

autocast可以用作上下文管理器或装饰器，允许脚本作用区域以混合精度运行。

在这些区域中，数据操作会以autocast选择的特定于该操作的dtype进行运行，以提高性能同时保持准确性。

进入启用autocast的区域时，张量可以是任何类型。使用autocast时，您不应在模型或输入上调用half()或bfloat16()。 autocast应仅包装网络的前向传递forward，包括loss计算。不建议在autocast下进行后向传递。后向操作以与autocast用于相应前向操作的运行类型相同。

CUDA示例：

# Creates model and optimizer in default precision
model = Net().cuda()
optimizer = optim.SGD(model.parameters(), ...)

for input, target in data:
    optimizer.zero_grad()

    # Enables autocasting for the forward pass (model + loss)
    with autocast():
        output = model(input)
        loss = loss_fn(output, target)

    # Exits the context manager before backward()
    loss.backward()
    optimizer.step()

在启用自动转换的区域中生成的浮点张量可能是float16。返回到禁用自动转换的区域后，将它们与不同dtype的浮点张量一起使用可能会导致类型不匹配错误。如果是这样，请将自动转换区域中生成的张量转换回float32（或其他dtype，如果需要）。如果来自自动转换区域的张量已经是float32，则转换是无操作的，并且不会产生额外的开销。

CUDA示例：

# Creates some tensors in default dtype (here assumed to be float32)
a_float32 = torch.rand((8, 8), device="cuda")
b_float32 = torch.rand((8, 8), device="cuda")
c_float32 = torch.rand((8, 8), device="cuda")
d_float32 = torch.rand((8, 8), device="cuda")

with autocast():
    # torch.mm is on autocast's list of ops that should run in float16.
    # Inputs are float32, but the op runs in float16 and produces float16 output.
    # No manual casts are required.
    e_float16 = torch.mm(a_float32, b_float32)
    # Also handles mixed input types
    f_float16 = torch.mm(d_float32, e_float16)

# After exiting autocast, calls f_float16.float() to use with d_float32
g_float32 = torch.mm(d_float32, f_float16.float())

CPU 训练示例:

# Creates model and optimizer in default precision
model = Net()
optimizer = optim.SGD(model.parameters(), ...)

for epoch in epochs:
    for input, target in data:
        optimizer.zero_grad()

        # Runs the forward pass with autocasting.
        with torch.autocast(device_type="cpu", dtype=torch.bfloat16):
            output = model(input)
            loss = loss_fn(output, target)

        loss.backward()
        optimizer.step()

CPU 推理示例:

# Creates model in default precision
model = Net().eval()

with torch.autocast(device_type="cpu", dtype=torch.bfloat16):
    for input in data:
        # Runs the forward pass with autocasting.
        output = model(input)

CPU 使用jit trace的推理示例:

class TestModel(nn.Module):
    def __init__(self, input_size, num_classes):
        super().__init__()
        self.fc1 = nn.Linear(input_size, num_classes)
    def forward(self, x):
        return self.fc1(x)

input_size = 2
num_classes = 2
model = TestModel(input_size, num_classes).eval()

# For now, we suggest to disable the Jit Autocast Pass,
# As the issue: https://github.com/pytorch/pytorch/issues/75956
torch._C._jit_set_autocast_mode(False)

with torch.cpu.amp.autocast(cache_enabled=False):
    model = torch.jit.trace(model, torch.randn(1, input_size))
model = torch.jit.freeze(model)
# Models Run
for _ in range(3):
    model(torch.randn(1, input_size))

autocast(enabled=False)子区域可以嵌套在启用autocast的区域中。在特定的数据类型中强制运行子区域时，局部禁用autocast是有用的。禁用autocast可以明确控制执行类型。在子区域中，来自周围区域的输入在使用之前应该被转换为指定的数据类型。

# 在默认数据类型（这里假设为float32）中创建一些张量
a_float32 = torch.rand((8, 8), device="cuda")
b_float32 = torch.rand((8, 8), device="cuda")
c_float32 = torch.rand((8, 8), device="cuda")
d_float32 = torch.rand((8, 8), device="cuda")

with autocast():
    e_float16 = torch.mm(a_float32, b_float32)
    with autocast(enabled=False):
        # 调用e_float16.float()以确保使用float32执行
        # （这是必需的，因为e_float16是在autocast区域中创建的）
        f_float32 = torch.mm(c_float32, e_float16.float())

    # 当重新进入启用autocast的区域时，无需手动转换类型。
    # torch.mm仍然以float16运行并产生float16的输出，不受输入类型的影响。
    g_float16 = torch.mm(d_float32, f_float32)

autocast状态是线程本地的。如果要在新线程中启用它，必须在该线程中调用上下文管理器或装饰器。

torch.cuda.amp.autocast(enabled=True, dtype=torch.float16, cache_enabled=True)
torch.cuda.amp.autocast(args…)等同于torch.autocast(“cuda”, args…)

*torch.cuda.amp.custom_fwd(fwd=None, , cast_inputs=None)
用于自定义自动求导函数（torch.autograd.Function的子类）的forward方法的辅助装饰器。

参数：
cast_inputs (torch.dtype或None, optional, default=None) - 如果不为None，在autocast-enabled区域中运行forward时，将传入的浮点数CUDA张量转换为目标数据类型（非浮点数张量不受影响），然后以禁用autocast的方式执行forward。如果为None，则forward的内部操作将根据当前的autocast状态执行

梯度缩放（Gradient Scaling）

如果某个操作的前向传递具有float16输入，则该操作的反向传递将产生float16梯度。具有较小幅度的梯度值可能无法表示为float16。这些值将被置零（“underflow”），因此相应参数的更新将丢失。

为了防止underflow，"梯度缩放"通过将网络的损失乘以一个缩放因子，并在缩放后的损失上进行反向传递来进行。通过网络向后传播的梯度也会按照相同的因子进行缩放。换句话说，梯度值具有较大的幅度，因此它们不会被置零。

每个参数的梯度（.grad属性）在优化器更新参数之前应进行还原，以确保缩放因子不会干扰学习率的设置。

torch.cuda.amp.GradScaler(init_scale=65536.0, growth_factor=2.0, backoff_factor=0.5, growth_interval=2000, enabled=True)

get_backoff_factor() 返回一个包含缩放回退因子的Python浮点数。

get_growth_factor() 返回一个包含缩放增长因子的Python浮点数。

get_growth_interval() 返回一个包含增长间隔的Python整数。

get_scale() 返回一个包含当前缩放因子的Python浮点数，如果禁用缩放，则返回1.0。

**警告：**get_scale()会产生CPU-GPU同步。

is_enabled() 返回一个布尔值，指示此实例是否已启用。

load_state_dict(state_dict) 加载缩放器状态。如果此实例已禁用，则load_state_dict()不执行任何操作。

参数： state_dict (dict) – 缩放器状态。应为调用state_dict()返回的对象。

scale(outputs) 将张量或张量列表按比例因子进行缩放。

返回缩放后的输出。如果未启用GradScaler的实例，则返回未修改的输出。

参数： outputs (Tensor或Tensor的可迭代对象) – 要进行缩放的输出。

set_backoff_factor(new_factor) 参数： new_factor (float) – 用作新缩放回退因子的值。

set_growth_factor(new_factor) 参数： new_factor (float) – 用作新缩放增长因子的值。

set_growth_interval(new_interval) 参数： new_interval (int) – 用作新增长间隔的值。

state_dict() 以字典形式返回缩放器的状态。它包含五个条目：

“scale” - 一个包含当前缩放的Python浮点数

“growth_factor” - 一个包含当前增长因子的Python浮点数

“backoff_factor” - 一个包含当前回退因子的Python浮点数

“growth_interval” - 一个包含当前增长间隔的Python整数

“_growth_tracker” - 一个包含最近连续未跳过步骤的数量的Python整数。

如果此实例未启用，则返回一个空字典。

注意:如果要在特定迭代之后检查点缩放器的状态，则应在update()之后调用state_dict()。

step(optimizer, *args, **kwargs)

step()执行以下两个操作：

1在内部调用unscale_(optimizer)（除非在迭代中之前显式调用了unscale_()）。在unscale_()的一部分，会检查梯度是否包含inf/NaN。

2如果未发现inf/NaN梯度，则使用未缩放的梯度调用optimizer.step()。否则，将跳过optimizer.step()以避免破坏参数。

*args和**kwargs会被传递给optimizer.step()。

返回optimizer.step(*args, **kwargs)的返回值。

参数： optimizer (torch.optim.Optimizer) – 应用梯度的优化器。

args –任何参数。

kwargs – 任何关键字参数。

警告

目前不支持闭包使用。

unscale_(optimizer) 将优化器的梯度张量通过缩放因子进行除法（“取消缩放”）。

unscale_()是可选的，适用于在反向传播和步骤（step()）之间修改或检查梯度的情况。如果未显式调用unscale_()，则梯度将在步骤（step()）期间自动取消缩放。

简单示例，使用unscale_()来启用未缩放梯度的剪裁：

… scaler.scale(loss).backward() scaler.unscale_(optimizer) torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm) scaler.step(optimizer) scaler.update() 参数： optimizer (torch.optim.Optimizer) – 拥有待取消缩放梯度的优化器。

注意

unscale_()不会产生CPU-GPU同步。

警告

每次调用unscale_()时，应对于每个优化器在每个step()调用中仅调用一次，并且只在为该优化器的分配参数累积了所有梯度之后才调用。在每个step()之间对于给定优化器连续调用unscale_()两次会触发RuntimeError。

警告

unscale_()可能会以不可恢复的方式取消缩放稀疏梯度，替换.grad属性。

update(new_scale=None)[SOURCE] 更新缩放因子。

如果跳过了任何优化器步骤，则通过backoff_factor乘以缩放因子来减小它。如果连续出现growth_interval个未跳过的迭代，则通过growth_factor乘以缩放因子来增加它。

传递new_scale会手动设置新的缩放值。（new_scale不会直接使用，而是用于填充GradScaler的内部缩放张量。因此，如果new_scale是一个张量，对该张量的原地更改将不会进一步影响GradScaler内部使用的缩放。）

参数： new_scale（float或torch.cuda.FloatTensor，可选，默认为None） – 新的缩放因子。

警告

update()应仅在迭代结束时调用，在该迭代中为所有使用的优化器调用了scaler.step(optimizer)。

Autocast Op 相关参考

Autocast Op 资格

无论是否启用自动转换，在float64或非float类型中运行的操作不被autocast转换操作，它们都将在原本类型中运行。 autocast只会对out-of-place 操作和张量方法产生影响。在启用autocast的区域中允许显式提供out=…tensor的in-place操作以及调用，但他们不会通过autocast。例如，在启用自动转换的区域中，a. addmm（b，c）可以自动转换，但a.addmm_（b，c，out=d）不能。为了获得最佳性能和稳定性，请在启用autocast的区域中优先使用 out-of-place 操作。显式调用dtype=…的操作不符合autocast使用资格，并且将生成dtype参数的输出。

CUDA Op 特定行为

下面的列表描述了在启用自动转换的区域中具备资格的操作的行为。这些操作始终经过自动转换，无论它们作为 torch.nn.Module 的一部分被调用，作为函数被调用，还是作为 torch.Tensor 方法被调用。如果函数在多个命名空间中公开，无论命名空间如何，它们都经过自动转换。

下面未列出的操作不经过自动转换。它们根据其输入定义的类型运行。然而，如果它们是自动转换的操作的下游，自动转换仍然可能更改未列出的操作运行的类型。

如果一个操作未列出，我们假设它在 float16 中是数值稳定的。如果您认为未列出的操作在 float16 中数值不稳定，请提出问题。

可以自动转换为 float16 的 CUDA Ops

matmul、addbmm、addmm、addmv、addr、baddbmm、bmm、chain_matmul、multi_dot、conv1d、conv2d、conv3d、conv_transpose1d、conv_transpose2d、conv_transpose3d、GRUCell、linear、LSTMCell、matmul、mm、mv、prelu、RNNCell

可以自动转换为 float32 的 CUDA Ops

pow、rdiv、rpow、rtruediv、acos、asin、binary_cross_entropy_with_logits、cosh、cosine_embedding_loss、cdist、cosine_similarity、cross_entropy、cumprod、cumsum、dist、erfinv、exp、expm1、group_norm、hinge_embedding_loss、kl_div、l1_loss、layer_norm、log、log_softmax、log10、log1p、log2、margin_ranking_loss、mse_loss、multilabel_margin_loss、multi_margin_loss、nll_loss、norm、normalize、pdist、poisson_nll_loss、pow、prod、reciprocal、rsqrt、sinh、smooth_l1_loss、soft_margin_loss、softmax、softmin、softplus、sum、renorm、tan、triplet_margin_loss

可以提升到最广泛输入类型的CUDA Ops

这些操作对于稳定性不需要特定的数据类型，但需要多个输入并要求输入的数据类型匹配。如果所有输入都是 float16，则该操作在 float16 中运行。如果输入中有任何一个是 float32，则自动转换将所有输入转换为 float32，并在 float32 中运行该操作。

addcdiv、addcmul、atan2、bilinear、cross、dot、grid_sample、index_put、scatter_add、tensordot

这里未列出的一些操作（例如，add 等二元操作）在没有自动转换的干预下本身就可以提升输入。如果输入是 bfloat16 和 float32 的混合，这些操作将在 float32 中运行，并产生 float32 输出，无论是否启用自动转换。

优先使用 binary_cross_entropy_with_logits 而不是 binary_cross_entropy

torch.nn.functional.binary_cross_entropy()（以及包装它的 torch.nn.BCELoss）的反向传播可能会产生 float16 中无法表示的梯度。在启用自动转换的区域中，前向输入可能是 float16，这意味着反向传播的梯度必须是可以在 float16 中表示的（将 float16 前向输入自动转换为 float32 是无用的，因为该转换必须在反向传播中被反转）。因此，在启用自动转换的区域中，binary_cross_entropy 和 BCELoss 会引发错误。

许多模型在二元交叉熵层之前使用了一个 sigmoid 层。在这种情况下，使用 torch.nn.functional.binary_cross_entropy_with_logits() 或 torch.nn.BCEWithLogitsLoss 结合这两个层。binary_cross_entropy_with_logits 和 BCEWithLogits 是可以安全自动转换的。

CPU Op 特定行为

如果一个操作未列出，我们假设它在 bfloat16 中是数值稳定的。如果您认为未列出的操作在 bfloat16 中数值不稳定，请提出问题。

可以自动转换为 bfloat16 的 CPU Ops

conv1d、conv2d、conv3d、bmm、mm、baddbmm、addmm、addbmm、linear、matmul、_convolution

可以自动转换为 float32 的 CPU

Ops conv_transpose1d、conv_transpose2d、conv_transpose3d、avg_pool3d、binary_cross_entropy、grid_sampler、grid_sampler_2d、_grid_sampler_2d_cpu_fallback、grid_sampler_3d、polar、prod、quantile、nanquantile、stft、cdist、trace、view_as_complex、cholesky、cholesky_inverse、cholesky_solve、inverse、lu_solve、orgqr、inverse、ormqr、pinverse、max_pool3d、max_unpool2d、max_unpool3d、adaptive_avg_pool3d、reflection_pad1d、reflection_pad2d、replication_pad1d、replication_pad2d、replication_pad3d、mse_loss、ctc_loss、kl_div、multilabel_margin_loss、fft_fft、fft_ifft、fft_fft2、fft_ifft2、fft_fftn、fft_ifftn、fft_rfft、fft_irfft、fft_rfft2、fft_irfft2、fft_rfftn、fft_irfftn、fft_hfft、fft_ihfft、linalg_matrix_norm、linalg_cond、linalg_matrix_rank、linalg_solve、linalg_cholesky、linalg_svdvals、linalg_eigvals、linalg_eigvalsh、linalg_inv、linalg_householder_product、linalg_tensorinv、linalg_tensorsolve、fake_quantize_per_tensor_affine、eig、geqrf、lstsq、_lu_with_info、qr、solve、svd、symeig、triangular_solve、fractional_max_pool2d、fractional_max_pool3d、adaptive_max_pool3d、multilabel_margin_loss_forward、linalg_qr、linalg_cholesky_ex、linalg_svd、linalg_eig、linalg_eigh、linalg_lstsq、linalg_inv_ex

可以提升到最宽输入类型的 CPU Ops

这些操作不需要特定的数据类型来保持稳定性，但需要多个输入并要求输入的数据类型匹配。如果所有输入都是 bfloat16，则该操作在 bfloat16 中运行。如果任何一个输入是 float32，则自动转换将所有输入转换为 float32，并在 float32 中运行该操作。

cat、stack、index_copy

补充：关于inplace 和 out of inplace的理解（理解inplace就明白了）

inplace=True指的是进行原地操作，选择进行原地覆盖运算。比如 x+=1则是对原值x进行操作，然后将得到的结果又直接覆盖该值。y=x+5,x=y则不是对x的原地操作。
inplace=True操作的好处就是可以节省运算内存，不用多储存其他无关变量。
注意：当使用 inplace=True后，对于上层网络传递下来的tensor会直接进行修改，改变输入数据，具体意思如下面例子所示：

import torch
import torch.nn as nn

relu = nn.ReLU(inplace=True)
input = torch.randn(7)

print("输入数据：",input)

output = relu(input)
print("ReLU输出：", output)

print("ReLU处理后，输入数据：")
print(input)

torch.autograd.grad函数是PyTorch中用于计算梯度的函数之一。它用于计算一个或多个标量函数相对于一组变量的梯度。

函数签名如下：

mathematicaCopy code
torch.autograd.grad(outputs, inputs, grad_outputs=None, retain_graph=None, create_graph=False, only_inputs=True, allow_unused=False)

参数说明：

outputs：包含需要计算梯度的标量函数的张量或张量列表。
inputs：需要计算梯度的变量的张量或张量列表。
grad_outputs：与outputs具有相同形状的张量或张量列表，用于指定在计算梯度时的外部梯度。默认为None，表示使用单位梯度（即1）。
retain_graph：布尔值，指定在计算完梯度后是否保留计算图以进行后续计算。默认为None，表示自动判断是否需要保留计算图。
create_graph：布尔值，指定是否创建一个新的计算图用于计算高阶导数。默认为False。
only_inputs：布尔值，指定是否只计算输入的梯度。默认为True，表示仅计算输入的梯度。
allow_unused：布尔值，指定是否允许在计算梯度时存在未使用的输入。默认为False，表示不允许存在未使用的输入。

函数返回一个与inputs具有相同形状的张量或张量列表，表示相对于inputs的梯度。如果某个输入不需要梯度，对应位置的梯度将为None。

以下是一个示例用法：

pythonCopy codeimport torch

x = torch.tensor([2.0], requires_grad=True)
y = x ** 2
grads = torch.autograd.grad(y, x)

print(grads)  # 输出 [tensor([4.])]

上述示例中，我们计算了y = x ** 2相对于x的梯度，并通过torch.autograd.grad函数获取了结果。在这个例子中，grads的值为4.0，表示y相对于x的梯度为4.0。

你可能感兴趣的:(深度学习,#,模型部署,#,PyTorch,pytorch,人工智能,python,深度学习,机器学习)

字符串 5. 实现 strStr() （KMP算法初探） Mophead_Zarathustra Mophead的小白刷题笔记 leetcode python 代码随想录字符串 KMP算法
字符串5.实现strStr()（KMP算法初探）28.找出字符串中第一个匹配项的下标-力扣（LeetCode）代码随想录难度3-简单（但是个人觉得用KMP算法解决并不简单）（可以直接拉到最后看KMP算法的python实现，已做好详细注释，可结合注释进行理解）看题目感觉用python不难实现，因此直接给出代码如下：代码v1，利用python的字符串比较：classSolution:defstrStr
PyPi 是什么 HoneyMoose CS
pypi是PythonPackageIndex的首字母简写，其实表示的是Python的Packag索引，这个也是Python的官方索引。你需要的包（Package）基本上都可以从这里面找到。作为开源软件，你也希望能够贡献你的Package到这里供其他用户使用。我们举个栗子，如果你希望你的Python程序能够下载金融数据，目前比较好用的金融数据来源是Yahoo和Google。你可能需要读取这2个平台
华为OD机试E卷 --字符串化繁为简 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c++算法源码题目描述给定一个输入字符串，字符串只可能由英文字母(az、AZ)和左右小括号(、)组成当字符里存在小括号时，小括号是成对的，可以有一个或多个小括号对，小括号对不会嵌套，小括号对内可以包含1个或多个英文字母也可以不包含英文字母。当小括号对内包含多个英文字母时，这些字母之间是相互等效的关系，而且等
Python数据分析之共享单车及建模探索(CLV建模、可视化) weixin_46205203 笔记 python 数据分析数据建模
Python数据分析之共享单车及建模探索(CLV建模、可视化)开发环境4.3【开发平台及环境】Windons10教育版Python3.7IntelliJIDEA2018.2.1/PyCharmGoogeChrome数据清洗分析模块pandas，numpy可视化模块matplotlib上期原创：Python数据分析之智联招聘职位分析完整项目（数据爬取,数据分析,数据可视化）链接:https://bl
python中!ls -r_光学现象的Python实现 weixin_39838798 python中!ls -r
“Youwillseelightinthedarkness。Youwillmakesomesenseofthis.”“你终将于黑暗中触摸白昼，它将如影般随行。”如果说20世纪是电子的世界，那么21世纪就是光学的舞台。光学和光子学无处不在：智能手机和计算设备上的显示方式，互联网中承载信息的光纤，先进的精密制造，大量的生物医学应用终端，全光衍射神经网络等。对光学的深入理解为每一个学习物理和工程的同学带
xgboost在spark集群使用指南一颗小草333 算法 mapreduce spark 数据挖掘
简介XGBoost是一个优化的分布式梯度增强库，具有高效、灵活和可移植性。在梯度增强框架下实现了机器学习算法。XGBoost提供了一种并行树增强(也称为GBDT、GBM)，可以快速、准确地解决许多数据科学问题。相同的代码在主要的分布式环境(Hadoop、SGE、MPI)上运行，可以解决数十亿个示例的训练问题。xgb相对于gbt所做的改进：1.2.3.XGBoost可以使用R、python、java
【安装cudnn】 Eternal-Student linux linux
官网下载并安装如果打算使用深度学习框架，如TensorFlow或PyTorch，并且需要GPU加速，可能还需要安装NVIDIA的cuDNN库，它是一个GPU加速的深度神经网络库。officialweb:https://developer.nvidia.com/cudnn下载具体：cuDNN9.5.0Downloads历史版本下载：https://developer.nvidia.com/rdp/c
python实战项目27：boss直聘招聘数据可视化分析 wp_tao Python副业接单实战项目信息可视化 python 数据分析
boss直聘招聘数据可视化分析一、数据预处理二、数据可视化三、完整代码一、数据预处理在上一篇博客中，笔者已经详细介绍了使用selenium爬取南昌市web前端工程师的招聘岗位数据，数据格式如下：这里主要对薪水列进行处理，为方便处理，将日薪和周薪的数据删除，将带有13薪和14薪的数据也删除，计算出最低薪资、最高薪资和平均薪资三列。数据预处理代码如下：importpandasaspddf=pd.rea
Pytorch深度学习指南卷I --编程基础（A Beginner‘s Guide）第1章一个简单的回归 liuhui244 深度强化学习深度学习 pytorch 回归
本章正式开始使用pytorch的接口来实现对应的numpy的学习的过程，来学习模型的实现，我们会介绍numpy是如何学习的，以及我们如何一步步的通过torch的接口来实现简单化的过程，优雅的展示我们的代码，已经我们的代码完成的事情numpy的线性回归在此之前，先看看现在的numpy实现的学习的过程是什么样的#引入计算模块importnumpyasnpfromsklearn.linear_model
Python 3 中使用 SMTP 发送邮件：高级技巧与应用三带俩王 python 网络服务器
在现代的软件开发和自动化流程中，发送电子邮件是一项常见的任务。Python3提供了强大的工具来实现这一功能，特别是通过使用SMTP（SimpleMailTransferProtocol）协议。本文将深入探讨Python3中使用SMTP发送邮件的高级用法，展示其在不同场景下的灵活性和强大功能。一、SMTP简介SMTP是一种用于发送电子邮件的协议。它允许客户端（如Python程序）与邮件服务器进行通信
Python 在股票分析中的高级应用：挖掘金融数据的深度洞察三带俩王 python 金融开发语言
在当今的金融世界中，股票分析是投资者和金融从业者必备的技能。Python作为一种强大且灵活的编程语言，为股票分析提供了丰富的工具和技术。本文将深入探讨使用Python进行股票分析的高级用法，涵盖从数据获取与清洗、高级分析指标计算到机器学习和深度学习在股票分析中的应用等多个方面。一、数据获取与预处理：构建坚实的分析基础1.数据来源与获取直接从证券交易所获取数据：许多证券交易所提供了数据接口，例如，上
Python 中的complex(real[, imag])函数：高级用法与强大功能三带俩王 python 开发语言算法
在Python中，complex(real[,imag])函数是一个用于创建复数的强大工具。复数在数学、物理学、工程学等领域中有着广泛的应用，而Python的complex类型为我们提供了便捷的方式来处理复数。本文将深入探讨complex(real[,imag])函数的高级用法，展示其在不同场景下的强大功能。一、复数的基本概念复数是由实数和虚数组成的数，通常表示为a+bj的形式，其中a和b是实数，
如何在 Ubuntu 18.04 上升级 gcc 到 9.4：一步步详细指南草莓奶忻 #Linux ubuntu linux 运维 c++
文章目录问题描述问题解决1.添加Toolchain测试PPA2.安装GCC和G++3.更新替代版本4.验证安装5.出现报错在执行sudoaptinstallgcc-9g++-9时，出现以下报错。解决方案更换默认的Ubuntu软件源问题描述在尝试编译PyTorch时遇到的报错提示需要GCC版本9.3或更高，但系统中安装的是版本7.5.0。因此，需要升级GCC到至少9.3版本。damon@damon-
python 利用 ddddocr包 ocr识别图片码风_流沙 python工具备忘录 python ocr 开发语言
ddddocr是一个轻量级的OCR（光学字符识别）库，适用于识别图片中的文字，包括验证码等图像文本。要使用ddddocr进行图片验证码的识别，可以按照以下步骤进行：1.安装ddddocr包首先，你需要安装ddddocr包。你可以使用pip安装：pipinstallddddocr2.使用ddddocr进行OCR识别importddddocr#创建OCR对象ocr=ddddocr.DdddOcr()#
智能电动汽车 --- 人工智能（AI）入门车载诊断技术思考汽车行业人工智能智能电动汽车的三智和三电开发语言数据结构架构智能电动汽车人工智能（AI）入门
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
AI大模型书籍推荐丨这本书必看：大语言模型基础与前沿（附PDF） LLM教程人工智能大模型 LLM 程序员自然语言处理 AI大模型编程
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大语言模型：基础与前沿》，本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用，涵盖大语言模型的广泛主题，从基础到前沿，从方法到应用，涉及从方法论到应用场景方方面面的内容。作者简介熊涛，美国明尼苏达大学双城分校电子与计算机工程博士。曾在多家中美知名高科技公司担任高级管理职位和首席科学家，在人工智能的多个领域，包括大语言模型、
计算机毕业设计之基于PythonBOSS直聘招聘数据可视化系统的设计与实现 wx—bishe58 信息可视化数据分析数据挖掘 rnn 人工智能课程设计 python
本文主要介绍了基于PythonBOSS直聘招聘数据可视化系统的设计与实现。随着互联网的普及，BOSS直聘招聘网站成为了企业和求职者的重要交流平台。然而，大量的招聘信息给用户带来了信息过载的问题。为了解决这一问题，本文提出了一种基于PythonBOSS直聘招聘数据可视化系统的设计与实现方法。首先，本文采用爬虫技术收集了拉勾BOSS直聘招聘网站上的大量招聘信息。然后，利用爬虫优化算法对爬取到的数据进行
Python 中的异常处理：try except Exception as e 三带俩王 python
在Python编程中，异常处理是一项至关重要的技能，它可以帮助我们提高程序的稳定性和可靠性。其中，tryexceptExceptionase语句是一种常见的异常处理方式。在这篇博客中，我们将深入探讨这个语句的要点和高级用法。一、异常处理的重要性在编程过程中，错误是不可避免的。这些错误可能是由于用户输入错误、文件不存在、网络连接问题等原因引起的。如果我们不处理这些错误，程序可能会崩溃，导致数据丢失或
python中的CSV模块一粒微尘_1 Python基础 python 开发语言后端
1、查询CSV模块中都有哪些函数和功能？①通过dir()函数查询CSV模块都有哪些函数importcsvforiindir(csv):print(i)②搜索CSV模块的官方教程’https://docs.python.org/3.6/library/csv.html‘③搜索中文教材’https://yiyibooks.cn/xx/python_352/library/csv.html#module
python爱心代码高级 youyouxiong python 开发语言
在Python中，绘制爱心图案可以通过多种方式实现，包括使用turtle模块、matplotlib库或者PIL库。以下是一些使用这些库绘制爱心的高级方法：使用turtle模块绘制动画爱心importturtleimportmathdefdraw_heart(t,size):""“绘制爱心的函数”""t.begin_fill()a=2*math.pit.circle(size,a/2)t.circl
Python李峋同款跳动的爱心代码（可写字版）雪碧没气阿 python 数据库开发语言 ide webstorm 爬虫
一年前小编曾用python编写过跳动的爱心代码，不知道有多少小伙伴们已经学会了呢，最近小编在用c语言和java编写跳动的爱心的时候，发现之前用python编写跳动的爱心时没有添加文字，这不，小编立马翻出之前的代码一顿操作，给大家带来了更新后的爱心，快来看看趴~（附详细分析哦）环境PythonPyCharm跳动的爱心运行结果完整程序importtkinterastkimporttkinter.mes
我的搬砖工具由 VS Code 变成 Cursor 了老余捞鱼人工智能 AI编程 cursor
作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：本文介绍了我从VSCode转向Cursor的原因，强调了Cursor的人工智能交互流畅性以及其他一些优于VSCode的特性。VSCode是免费的，而且运行起来非常出色。我一直很喜欢VSCode，不过，它与GitHubCopilot等编码助手扩展的交互并不比使用ChatGPT好多少，而且肯定不如Claude。在寻找其他替代方案时，我偶然发
2024年AI发展的感知回顾八角Z 人工智能机器学习计算机视觉大数据
2024年，人工智能（AI）的发展呈现出诸多引人注目的关键词，深刻地塑造着技术格局、经济模式以及人类社会的方方面面。混合无疑成为这一年AI创新历程中最为显著的特征之一。多模态生成技术在这一年里取得了令人瞩目的不断进步，使得AI能够巧妙地将文本、图像、音频、视频等多种模态的信息进行深度融合与再创造。例如：AI内容创作：AI可以将作者的文字描述转换为生动的图像、视频和配乐，为创作提供更多可能性，让创意
Apache Airflow 2.1.2：开源工作流管理系统的全面指南銀河鐵道的企鵝
本文还有配套的精品资源，点击获取简介：ApacheAirflow2.1.2是一个开源的工作流管理系统，用于编排、调度和监控复杂的业务逻辑。它基于DAG（有向无环图）概念，通过Python代码定义任务的Operator，定义任务的执行顺序和条件。该版本提供了任务调度、监控、错误处理、插件扩展和多环境管理等核心功能。解压后包含许可证文件、文档和源代码目录等，且介绍了安装和运行步骤。Airflow适用于
拉曼光谱增强技术，农药“指纹图谱“数据库？百态老人数据库
构建拉曼光谱增强技术与农药"指纹图谱"数据库是农药成分快速检测领域的前沿方向，其核心在于通过纳米材料增强效应和人工智能算法解析，实现对农药分子的高灵敏度、高特异性识别。以下从技术原理、数据库构建、应用场景及挑战四方面深入解析：一、拉曼光谱增强技术原理1.表面增强拉曼散射（SERS）电磁增强机制：利用金/银纳米结构（纳米颗粒、纳米棒、纳米星）的局域表面等离子体共振效应（LSPR），在激光激发下产生"
python无法启动此程序因为_(python shell怎么用)为啥我按照python安装教程，总说无法启动此程序，因为计算机中丢失？... weixin_39540023 python无法启动此程序因为
python3.8遍历整个列表？你打印的是colorprint(color)不对应该是magician为啥我按照python安装教程，总说无法启动此程序，因为计算机中丢失？这是你windows操作文件丢失的，和python无关。首先去网上搜索下载api-ms-win-crt-process-l1-1-0.dll文件载完毕后，把dll文件放到C:\Windows\System32下即可。如果下载的d
制造业汽车业数字化转型新方案——飞速创软低代码平台人工智能
2023年7月20日-2023年7月21日2023汽车业数字化大会&制造业数字化大会在佛山顺德盛大开幕！深圳飞速创软科技有限公司如邀参加展会。本次大会聚焦于数字化转型新场景中企业承压，IT行业可以扮演怎样的角色。如今AGI时代来临，AGI将是第四次工业革命的核心驱动力。人工智能作为最先进生产力，在不断冲击着各个行业，一定程度上要求行业的现有业务结构重构，以实现当今复杂多变、极速发展的时代。在面对多
举例说明Python的CSV模块 weixin_30556161 python
举例说明Python的CSV模块byGaryJia—上次修改时间:2007-11-3017:28文章标签pythonzope举几个例子来介绍一下，Python的CSV模块的使用方法，包括，reader,writer,DictReader,DictWriter.register_dialect一直非常喜欢python的csv模块，简单易用，经常在项目中使用，现在举几个例子说明一下。reader(cs
Python爬虫实战：解析京东商品信息（附部分源码）是有头发的程序猿 API API接口 python 爬虫开发语言
在信息爆炸的今天，网络爬虫（WebScraping）作为一种自动获取网页内容的技术，已经成为数据采集的重要手段。Python，因其简洁的语法和强大的库支持，成为编写爬虫的首选语言之一。本文将通过一个实战案例，展示如何使用Python编写爬虫，以京东商品页面为例，解析商品信息。环境准备在开始编写爬虫之前，需要准备以下环境和工具：Python3.x网络请求库：requestsHTML解析库：Beaut
SpringAI 搭建智能体（二）：搭建客服系统智能体 drebander AI 编程 springAI Agent
在现代人工智能应用中，智能体（Agent）是一个重要的概念，它的核心能力是自主性与灵活性。一个智能体不仅能够理解用户的需求，还能拆解任务、调用工具完成具体操作，并在复杂场景中高效运行。在本篇博客中，我们将围绕一个基于SpringAI的智能体实现，深入探讨智能体的概念、构建流程以及实际应用场景。1.什么是智能体？智能体是一种能够根据目标自主执行任务的系统。与传统的AI模型生成内容的模式不同，智能体通
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l