PyTorch梯度下降反向传播

前言：

反向传播的目的是计算成本函数C对网络中任意w或b的偏导数。一旦我们有了这些偏导数，我们将通过一些常数 α的乘积和该数量相对于成本函数的偏导数来更新网络中的权重和偏差。这是流行的梯度下降算法。而偏导数给出了最大上升的方向。因此，关于反向传播算法，我们继续查看下文。

我们向相反的方向迈出了一小步——最大下降的方向，也就是将我们带到成本函数的局部最小值的方向

如题：

意思是利用这个二次模型来预测数据，减小损失函数(MSE)的值。

代码如下：

import torch
import matplotlib.pyplot as plt
import os
os.environ["KMP_DUPLICATE_LIB_OK"]  =  "TRUE"
# 数据集
x_data = [1.0,2.0,3.0]
y_data = [2.0,4.0,6.0]
# 权重参数初始值均为1
w = torch.tensor([1.0,1.0,1.0])
w.requires_grad = True    # 需要计算梯度

# 前向传播
def forward(x):
    return w[0]*(x**2)+w[1]*x+w[2]
# 计算损失
def loss(x,y):
    y_pred = forward(x)
    return (y_pred-y) ** 2

# 训练模块
print('predict (before tranining) ',4, forward(4).item())
epoch_list = []
w_list = []
loss_list = []
for epoch in range(1000):
    for x,y in zip(x_data,y_data):
        l = loss(x,y)
        l.backward()        # 后向传播
        print('\tgrad: ',x,y,w.grad.data)
        w.data = w.data - 0.01 * w.grad.data        # 梯度下降
        
        w.grad.data.zero_()    # 梯度清零操作
        
    print('progress: ',epoch,l.item())
    epoch_list.append(epoch)
    w_list.append(w.data)
    loss_list.append(l.item())
print('predict (after tranining) ',4, forward(4).item())

# 绘图
plt.plot(epoch_list,loss_list,'b')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.grid()
plt.show()

结果如下：

predict (before tranining)  4 21.0
    grad:  1.0 2.0 tensor([2., 2., 2.])
    grad:  2.0 4.0 tensor([22.8800, 11.4400,  5.7200])
    grad:  3.0 6.0 tensor([77.0472, 25.6824,  8.5608])
progress:  0 18.321826934814453
    grad:  1.0 2.0 tensor([-1.1466, -1.1466, -1.1466])
    grad:  2.0 4.0 tensor([-15.5367,  -7.7683,  -3.8842])
    grad:  3.0 6.0 tensor([-30.4322, -10.1441,  -3.3814])
progress:  1 2.858394145965576
    grad:  1.0 2.0 tensor([0.3451, 0.3451, 0.3451])
    grad:  2.0 4.0 tensor([2.4273, 1.2137, 0.6068])
    grad:  3.0 6.0 tensor([19.4499,  6.4833,  2.1611])
progress:  2 1.1675907373428345
    grad:  1.0 2.0 tensor([-0.3224, -0.3224, -0.3224])
    grad:  2.0 4.0 tensor([-5.8458, -2.9229, -1.4614])
    grad:  3.0 6.0 tensor([-3.8829, -1.2943, -0.4314])
progress:  3 0.04653334245085716
    grad:  1.0 2.0 tensor([0.0137, 0.0137, 0.0137])
    grad:  2.0 4.0 tensor([-1.9141, -0.9570, -0.4785])
    grad:  3.0 6.0 tensor([6.8557, 2.2852, 0.7617])
progress:  4 0.14506366848945618
    grad:  1.0 2.0 tensor([-0.1182, -0.1182, -0.1182])
    grad:  2.0 4.0 tensor([-3.6644, -1.8322, -0.9161])
    grad:  3.0 6.0 tensor([1.7455, 0.5818, 0.1939])
progress:  5 0.009403289295732975
    grad:  1.0 2.0 tensor([-0.0333, -0.0333, -0.0333])
    grad:  2.0 4.0 tensor([-2.7739, -1.3869, -0.6935])
    grad:  3.0 6.0 tensor([4.0140, 1.3380, 0.4460])
progress:  6 0.04972923547029495
    grad:  1.0 2.0 tensor([-0.0501, -0.0501, -0.0501])
    grad:  2.0 4.0 tensor([-3.1150, -1.5575, -0.7788])
    grad:  3.0 6.0 tensor([2.8534, 0.9511, 0.3170])
progress:  7 0.025129113346338272
    grad:  1.0 2.0 tensor([-0.0205, -0.0205, -0.0205])
    grad:  2.0 4.0 tensor([-2.8858, -1.4429, -0.7215])
    grad:  3.0 6.0 tensor([3.2924, 1.0975, 0.3658])
progress:  8 0.03345605731010437
    grad:  1.0 2.0 tensor([-0.0134, -0.0134, -0.0134])
    grad:  2.0 4.0 tensor([-2.9247, -1.4623, -0.7312])
    grad:  3.0 6.0 tensor([2.9909, 0.9970, 0.3323])
progress:  9 0.027609655633568764
    grad:  1.0 2.0 tensor([0.0033, 0.0033, 0.0033])
    grad:  2.0 4.0 tensor([-2.8414, -1.4207, -0.7103])
    grad:  3.0 6.0 tensor([3.0377, 1.0126, 0.3375])
progress:  10 0.02848036028444767
    grad:  1.0 2.0 tensor([0.0148, 0.0148, 0.0148])
    grad:  2.0 4.0 tensor([-2.8174, -1.4087, -0.7043])
    grad:  3.0 6.0 tensor([2.9260, 0.9753, 0.3251])
progress:  11 0.02642466314136982
    grad:  1.0 2.0 tensor([0.0280, 0.0280, 0.0280])
    grad:  2.0 4.0 tensor([-2.7682, -1.3841, -0.6920])
    grad:  3.0 6.0 tensor([2.8915, 0.9638, 0.3213])
progress:  12 0.025804826989769936
    grad:  1.0 2.0 tensor([0.0397, 0.0397, 0.0397])
    grad:  2.0 4.0 tensor([-2.7330, -1.3665, -0.6832])
    grad:  3.0 6.0 tensor([2.8243, 0.9414, 0.3138])
progress:  13 0.02462013065814972
    grad:  1.0 2.0 tensor([0.0514, 0.0514, 0.0514])
    grad:  2.0 4.0 tensor([-2.6934, -1.3467, -0.6734])
    grad:  3.0 6.0 tensor([2.7756, 0.9252, 0.3084])
progress:  14 0.023777369409799576
    grad:  1.0 2.0 tensor([0.0624, 0.0624, 0.0624])
    grad:  2.0 4.0 tensor([-2.6580, -1.3290, -0.6645])
    grad:  3.0 6.0 tensor([2.7213, 0.9071, 0.3024])
progress:  15 0.0228563379496336
    grad:  1.0 2.0 tensor([0.0731, 0.0731, 0.0731])
    grad:  2.0 4.0 tensor([-2.6227, -1.3113, -0.6557])
    grad:  3.0 6.0 tensor([2.6725, 0.8908, 0.2969])
progress:  16 0.022044027224183083
    grad:  1.0 2.0 tensor([0.0833, 0.0833, 0.0833])
    grad:  2.0 4.0 tensor([-2.5893, -1.2946, -0.6473])
    grad:  3.0 6.0 tensor([2.6240, 0.8747, 0.2916])
progress:  17 0.02125072106719017
    grad:  1.0 2.0 tensor([0.0931, 0.0931, 0.0931])
    grad:  2.0 4.0 tensor([-2.5568, -1.2784, -0.6392])
    grad:  3.0 6.0 tensor([2.5780, 0.8593, 0.2864])
progress:  18 0.020513182505965233
    grad:  1.0 2.0 tensor([0.1025, 0.1025, 0.1025])
    grad:  2.0 4.0 tensor([-2.5258, -1.2629, -0.6314])
    grad:  3.0 6.0 tensor([2.5335, 0.8445, 0.2815])
progress:  19 0.019810274243354797
    grad:  1.0 2.0 tensor([0.1116, 0.1116, 0.1116])
    grad:  2.0 4.0 tensor([-2.4958, -1.2479, -0.6239])
    grad:  3.0 6.0 tensor([2.4908, 0.8303, 0.2768])
progress:  20 0.019148115068674088
    grad:  1.0 2.0 tensor([0.1203, 0.1203, 0.1203])
    grad:  2.0 4.0 tensor([-2.4669, -1.2335, -0.6167])
    grad:  3.0 6.0 tensor([2.4496, 0.8165, 0.2722])
progress:  21 0.018520694226026535
    grad:  1.0 2.0 tensor([0.1286, 0.1286, 0.1286])
    grad:  2.0 4.0 tensor([-2.4392, -1.2196, -0.6098])
    grad:  3.0 6.0 tensor([2.4101, 0.8034, 0.2678])
progress:  22 0.017927465960383415
    grad:  1.0 2.0 tensor([0.1367, 0.1367, 0.1367])
    grad:  2.0 4.0 tensor([-2.4124, -1.2062, -0.6031])
    grad:  3.0 6.0 tensor([2.3720, 0.7907, 0.2636])
progress:  23 0.01736525259912014
    grad:  1.0 2.0 tensor([0.1444, 0.1444, 0.1444])
    grad:  2.0 4.0 tensor([-2.3867, -1.1933, -0.5967])
    grad:  3.0 6.0 tensor([2.3354, 0.7785, 0.2595])
progress:  24 0.016833148896694183
    grad:  1.0 2.0 tensor([0.1518, 0.1518, 0.1518])
    grad:  2.0 4.0 tensor([-2.3619, -1.1810, -0.5905])
    grad:  3.0 6.0 tensor([2.3001, 0.7667, 0.2556])
progress:  25 0.01632905937731266
    grad:  1.0 2.0 tensor([0.1589, 0.1589, 0.1589])
    grad:  2.0 4.0 tensor([-2.3380, -1.1690, -0.5845])
    grad:  3.0 6.0 tensor([2.2662, 0.7554, 0.2518])
progress:  26 0.01585075818002224
    grad:  1.0 2.0 tensor([0.1657, 0.1657, 0.1657])
    grad:  2.0 4.0 tensor([-2.3151, -1.1575, -0.5788])
    grad:  3.0 6.0 tensor([2.2336, 0.7445, 0.2482])
progress:  27 0.015397666022181511
    grad:  1.0 2.0 tensor([0.1723, 0.1723, 0.1723])
    grad:  2.0 4.0 tensor([-2.2929, -1.1465, -0.5732])
    grad:  3.0 6.0 tensor([2.2022, 0.7341, 0.2447])
progress:  28 0.014967591501772404
    grad:  1.0 2.0 tensor([0.1786, 0.1786, 0.1786])
    grad:  2.0 4.0 tensor([-2.2716, -1.1358, -0.5679])
    grad:  3.0 6.0 tensor([2.1719, 0.7240, 0.2413])
progress:  29 0.014559715054929256
    grad:  1.0 2.0 tensor([0.1846, 0.1846, 0.1846])
    grad:  2.0 4.0 tensor([-2.2511, -1.1255, -0.5628])
    grad:  3.0 6.0 tensor([2.1429, 0.7143, 0.2381])
progress:  30 0.014172340743243694
    grad:  1.0 2.0 tensor([0.1904, 0.1904, 0.1904])
    grad:  2.0 4.0 tensor([-2.2313, -1.1157, -0.5578])
    grad:  3.0 6.0 tensor([2.1149, 0.7050, 0.2350])
progress:  31 0.013804304413497448
    grad:  1.0 2.0 tensor([0.1960, 0.1960, 0.1960])
    grad:  2.0 4.0 tensor([-2.2123, -1.1061, -0.5531])
    grad:  3.0 6.0 tensor([2.0879, 0.6960, 0.2320])
progress:  32 0.013455045409500599
    grad:  1.0 2.0 tensor([0.2014, 0.2014, 0.2014])
    grad:  2.0 4.0 tensor([-2.1939, -1.0970, -0.5485])
    grad:  3.0 6.0 tensor([2.0620, 0.6873, 0.2291])
progress:  33 0.013122711330652237
    grad:  1.0 2.0 tensor([0.2065, 0.2065, 0.2065])
    grad:  2.0 4.0 tensor([-2.1763, -1.0881, -0.5441])
    grad:  3.0 6.0 tensor([2.0370, 0.6790, 0.2263])
progress:  34 0.01280694268643856
    grad:  1.0 2.0 tensor([0.2114, 0.2114, 0.2114])
    grad:  2.0 4.0 tensor([-2.1592, -1.0796, -0.5398])
    grad:  3.0 6.0 tensor([2.0130, 0.6710, 0.2237])
progress:  35 0.012506747618317604
    grad:  1.0 2.0 tensor([0.2162, 0.2162, 0.2162])
    grad:  2.0 4.0 tensor([-2.1428, -1.0714, -0.5357])
    grad:  3.0 6.0 tensor([1.9899, 0.6633, 0.2211])
progress:  36 0.012220758944749832
    grad:  1.0 2.0 tensor([0.2207, 0.2207, 0.2207])
    grad:  2.0 4.0 tensor([-2.1270, -1.0635, -0.5317])
    grad:  3.0 6.0 tensor([1.9676, 0.6559, 0.2186])
progress:  37 0.01194891706109047
    grad:  1.0 2.0 tensor([0.2251, 0.2251, 0.2251])
    grad:  2.0 4.0 tensor([-2.1118, -1.0559, -0.5279])
    grad:  3.0 6.0 tensor([1.9462, 0.6487, 0.2162])
progress:  38 0.011689926497638226
    grad:  1.0 2.0 tensor([0.2292, 0.2292, 0.2292])
    grad:  2.0 4.0 tensor([-2.0971, -1.0485, -0.5243])
    grad:  3.0 6.0 tensor([1.9255, 0.6418, 0.2139])
progress:  39 0.01144315768033266
    grad:  1.0 2.0 tensor([0.2333, 0.2333, 0.2333])
    grad:  2.0 4.0 tensor([-2.0829, -1.0414, -0.5207])
    grad:  3.0 6.0 tensor([1.9057, 0.6352, 0.2117])
progress:  40 0.011208509095013142
    grad:  1.0 2.0 tensor([0.2371, 0.2371, 0.2371])
    grad:  2.0 4.0 tensor([-2.0693, -1.0346, -0.5173])
    grad:  3.0 6.0 tensor([1.8865, 0.6288, 0.2096])
progress:  41 0.0109840864315629
    grad:  1.0 2.0 tensor([0.2408, 0.2408, 0.2408])
    grad:  2.0 4.0 tensor([-2.0561, -1.0280, -0.5140])
    grad:  3.0 6.0 tensor([1.8681, 0.6227, 0.2076])
progress:  42 0.010770938359200954
    grad:  1.0 2.0 tensor([0.2444, 0.2444, 0.2444])
    grad:  2.0 4.0 tensor([-2.0434, -1.0217, -0.5108])
    grad:  3.0 6.0 tensor([1.8503, 0.6168, 0.2056])
progress:  43 0.010566935874521732
    grad:  1.0 2.0 tensor([0.2478, 0.2478, 0.2478])
    grad:  2.0 4.0 tensor([-2.0312, -1.0156, -0.5078])
    grad:  3.0 6.0 tensor([1.8332, 0.6111, 0.2037])
progress:  44 0.010372749529778957
    grad:  1.0 2.0 tensor([0.2510, 0.2510, 0.2510])
    grad:  2.0 4.0 tensor([-2.0194, -1.0097, -0.5048])
    grad:  3.0 6.0 tensor([1.8168, 0.6056, 0.2019])
progress:  45 0.010187389329075813
    grad:  1.0 2.0 tensor([0.2542, 0.2542, 0.2542])

    grad:  2.0 4.0 tensor([-2.0080, -1.0040, -0.5020])
    grad:  3.0 6.0 tensor([1.8009, 0.6003, 0.2001])
progress:  46 0.010010283440351486
    grad:  1.0 2.0 tensor([0.2572, 0.2572, 0.2572])
    grad:  2.0 4.0 tensor([-1.9970, -0.9985, -0.4992])
    grad:  3.0 6.0 tensor([1.7856, 0.5952, 0.1984])
progress:  47 0.00984097272157669
    grad:  1.0 2.0 tensor([0.2600, 0.2600, 0.2600])
    grad:  2.0 4.0 tensor([-1.9864, -0.9932, -0.4966])
    grad:  3.0 6.0 tensor([1.7709, 0.5903, 0.1968])
progress:  48 0.009679674170911312
    grad:  1.0 2.0 tensor([0.2628, 0.2628, 0.2628])
    grad:  2.0 4.0 tensor([-1.9762, -0.9881, -0.4940])
    grad:  3.0 6.0 tensor([1.7568, 0.5856, 0.1952])
progress:  49 0.009525291621685028
    grad:  1.0 2.0 tensor([0.2655, 0.2655, 0.2655])
    grad:  2.0 4.0 tensor([-1.9663, -0.9832, -0.4916])
    grad:  3.0 6.0 tensor([1.7431, 0.5810, 0.1937])
progress:  50 0.00937769003212452
    grad:  1.0 2.0 tensor([0.2680, 0.2680, 0.2680])
    grad:  2.0 4.0 tensor([-1.9568, -0.9784, -0.4892])
    grad:  3.0 6.0 tensor([1.7299, 0.5766, 0.1922])
progress:  51 0.009236648678779602
    grad:  1.0 2.0 tensor([0.2704, 0.2704, 0.2704])
    grad:  2.0 4.0 tensor([-1.9476, -0.9738, -0.4869])
    grad:  3.0 6.0 tensor([1.7172, 0.5724, 0.1908])
progress:  52 0.00910158734768629
    grad:  1.0 2.0 tensor([0.2728, 0.2728, 0.2728])
    grad:  2.0 4.0 tensor([-1.9387, -0.9694, -0.4847])
    grad:  3.0 6.0 tensor([1.7050, 0.5683, 0.1894])
progress:  53 0.00897257961332798
    grad:  1.0 2.0 tensor([0.2750, 0.2750, 0.2750])
    grad:  2.0 4.0 tensor([-1.9301, -0.9651, -0.4825])
    grad:  3.0 6.0 tensor([1.6932, 0.5644, 0.1881])
progress:  54 0.008848887868225574
    grad:  1.0 2.0 tensor([0.2771, 0.2771, 0.2771])
    grad:  2.0 4.0 tensor([-1.9219, -0.9609, -0.4805])
    grad:  3.0 6.0 tensor([1.6819, 0.5606, 0.1869])
progress:  55 0.008730598725378513
    grad:  1.0 2.0 tensor([0.2792, 0.2792, 0.2792])
    grad:  2.0 4.0 tensor([-1.9139, -0.9569, -0.4785])
    grad:  3.0 6.0 tensor([1.6709, 0.5570, 0.1857])
progress:  56 0.00861735362559557
    grad:  1.0 2.0 tensor([0.2811, 0.2811, 0.2811])
    grad:  2.0 4.0 tensor([-1.9062, -0.9531, -0.4765])
    grad:  3.0 6.0 tensor([1.6604, 0.5535, 0.1845])
progress:  57 0.008508718572556973
    grad:  1.0 2.0 tensor([0.2830, 0.2830, 0.2830])
    grad:  2.0 4.0 tensor([-1.8987, -0.9493, -0.4747])
    grad:  3.0 6.0 tensor([1.6502, 0.5501, 0.1834])
progress:  58 0.008404706604778767
    grad:  1.0 2.0 tensor([0.2848, 0.2848, 0.2848])
    grad:  2.0 4.0 tensor([-1.8915, -0.9457, -0.4729])
    grad:  3.0 6.0 tensor([1.6404, 0.5468, 0.1823])
progress:  59 0.008305158466100693
    grad:  1.0 2.0 tensor([0.2865, 0.2865, 0.2865])
    grad:  2.0 4.0 tensor([-1.8845, -0.9423, -0.4711])
    grad:  3.0 6.0 tensor([1.6309, 0.5436, 0.1812])
progress:  60 0.00820931326597929
    grad:  1.0 2.0 tensor([0.2882, 0.2882, 0.2882])
    grad:  2.0 4.0 tensor([-1.8778, -0.9389, -0.4694])
    grad:  3.0 6.0 tensor([1.6218, 0.5406, 0.1802])
progress:  61 0.008117804303765297
    grad:  1.0 2.0 tensor([0.2898, 0.2898, 0.2898])
    grad:  2.0 4.0 tensor([-1.8713, -0.9356, -0.4678])
    grad:  3.0 6.0 tensor([1.6130, 0.5377, 0.1792])
progress:  62 0.008029798977077007
    grad:  1.0 2.0 tensor([0.2913, 0.2913, 0.2913])
    grad:  2.0 4.0 tensor([-1.8650, -0.9325, -0.4662])
    grad:  3.0 6.0 tensor([1.6045, 0.5348, 0.1783])
progress:  63 0.007945418357849121
    grad:  1.0 2.0 tensor([0.2927, 0.2927, 0.2927])
    grad:  2.0 4.0 tensor([-1.8589, -0.9294, -0.4647])
    grad:  3.0 6.0 tensor([1.5962, 0.5321, 0.1774])
progress:  64 0.007864190265536308
    grad:  1.0 2.0 tensor([0.2941, 0.2941, 0.2941])
    grad:  2.0 4.0 tensor([-1.8530, -0.9265, -0.4632])
    grad:  3.0 6.0 tensor([1.5884, 0.5295, 0.1765])
progress:  65 0.007786744274199009
    grad:  1.0 2.0 tensor([0.2954, 0.2954, 0.2954])
    grad:  2.0 4.0 tensor([-1.8473, -0.9236, -0.4618])
    grad:  3.0 6.0 tensor([1.5807, 0.5269, 0.1756])
progress:  66 0.007711691781878471
    grad:  1.0 2.0 tensor([0.2967, 0.2967, 0.2967])
    grad:  2.0 4.0 tensor([-1.8417, -0.9209, -0.4604])
    grad:  3.0 6.0 tensor([1.5733, 0.5244, 0.1748])
progress:  67 0.007640169933438301
    grad:  1.0 2.0 tensor([0.2979, 0.2979, 0.2979])
    grad:  2.0 4.0 tensor([-1.8364, -0.9182, -0.4591])
    grad:  3.0 6.0 tensor([1.5662, 0.5221, 0.1740])
progress:  68 0.007570972666144371
    grad:  1.0 2.0 tensor([0.2991, 0.2991, 0.2991])
    grad:  2.0 4.0 tensor([-1.8312, -0.9156, -0.4578])
    grad:  3.0 6.0 tensor([1.5593, 0.5198, 0.1733])
progress:  69 0.007504733745008707
    grad:  1.0 2.0 tensor([0.3002, 0.3002, 0.3002])
    grad:  2.0 4.0 tensor([-1.8262, -0.9131, -0.4566])
    grad:  3.0 6.0 tensor([1.5527, 0.5176, 0.1725])
progress:  70 0.007440924644470215
    grad:  1.0 2.0 tensor([0.3012, 0.3012, 0.3012])
    grad:  2.0 4.0 tensor([-1.8214, -0.9107, -0.4553])
    grad:  3.0 6.0 tensor([1.5463, 0.5154, 0.1718])
progress:  71 0.007379599846899509
    grad:  1.0 2.0 tensor([0.3022, 0.3022, 0.3022])
    grad:  2.0 4.0 tensor([-1.8167, -0.9083, -0.4542])
    grad:  3.0 6.0 tensor([1.5401, 0.5134, 0.1711])
progress:  72 0.007320486940443516
    grad:  1.0 2.0 tensor([0.3032, 0.3032, 0.3032])
    grad:  2.0 4.0 tensor([-1.8121, -0.9060, -0.4530])
    grad:  3.0 6.0 tensor([1.5341, 0.5114, 0.1705])
progress:  73 0.007263725157827139
    grad:  1.0 2.0 tensor([0.3041, 0.3041, 0.3041])
    grad:  2.0 4.0 tensor([-1.8077, -0.9038, -0.4519])
    grad:  3.0 6.0 tensor([1.5283, 0.5094, 0.1698])
progress:  74 0.007209045812487602
    grad:  1.0 2.0 tensor([0.3050, 0.3050, 0.3050])
    grad:  2.0 4.0 tensor([-1.8034, -0.9017, -0.4508])
    grad:  3.0 6.0 tensor([1.5227, 0.5076, 0.1692])
progress:  75 0.007156429346650839
    grad:  1.0 2.0 tensor([0.3058, 0.3058, 0.3058])
    grad:  2.0 4.0 tensor([-1.7992, -0.8996, -0.4498])
    grad:  3.0 6.0 tensor([1.5173, 0.5058, 0.1686])
progress:  76 0.007105532102286816
    grad:  1.0 2.0 tensor([0.3066, 0.3066, 0.3066])
    grad:  2.0 4.0 tensor([-1.7952, -0.8976, -0.4488])
    grad:  3.0 6.0 tensor([1.5121, 0.5040, 0.1680])
progress:  77 0.00705681974068284
    grad:  1.0 2.0 tensor([0.3073, 0.3073, 0.3073])
    grad:  2.0 4.0 tensor([-1.7913, -0.8956, -0.4478])
    grad:  3.0 6.0 tensor([1.5070, 0.5023, 0.1674])
progress:  78 0.007009552326053381
    grad:  1.0 2.0 tensor([0.3081, 0.3081, 0.3081])
    grad:  2.0 4.0 tensor([-1.7875, -0.8937, -0.4469])
    grad:  3.0 6.0 tensor([1.5021, 0.5007, 0.1669])
progress:  79 0.006964194122701883
    grad:  1.0 2.0 tensor([0.3087, 0.3087, 0.3087])
    grad:  2.0 4.0 tensor([-1.7838, -0.8919, -0.4459])
    grad:  3.0 6.0 tensor([1.4974, 0.4991, 0.1664])
progress:  80 0.006920332089066505
    grad:  1.0 2.0 tensor([0.3094, 0.3094, 0.3094])
    grad:  2.0 4.0 tensor([-1.7802, -0.8901, -0.4450])
    grad:  3.0 6.0 tensor([1.4928, 0.4976, 0.1659])
progress:  81 0.006878111511468887
    grad:  1.0 2.0 tensor([0.3100, 0.3100, 0.3100])
    grad:  2.0 4.0 tensor([-1.7767, -0.8883, -0.4442])
    grad:  3.0 6.0 tensor([1.4884, 0.4961, 0.1654])
progress:  82 0.006837360095232725
    grad:  1.0 2.0 tensor([0.3106, 0.3106, 0.3106])
    grad:  2.0 4.0 tensor([-1.7733, -0.8867, -0.4433])
    grad:  3.0 6.0 tensor([1.4841, 0.4947, 0.1649])
progress:  83 0.006797831039875746
    grad:  1.0 2.0 tensor([0.3111, 0.3111, 0.3111])
    grad:  2.0 4.0 tensor([-1.7700, -0.8850, -0.4425])
    grad:  3.0 6.0 tensor([1.4800, 0.4933, 0.1644])
progress:  84 0.006760062649846077
    grad:  1.0 2.0 tensor([0.3117, 0.3117, 0.3117])
    grad:  2.0 4.0 tensor([-1.7668, -0.8834, -0.4417])
    grad:  3.0 6.0 tensor([1.4759, 0.4920, 0.1640])
progress:  85 0.006723103579133749
    grad:  1.0 2.0 tensor([0.3122, 0.3122, 0.3122])
    grad:  2.0 4.0 tensor([-1.7637, -0.8818, -0.4409])
    grad:  3.0 6.0 tensor([1.4720, 0.4907, 0.1636])
progress:  86 0.00668772729113698
    grad:  1.0 2.0 tensor([0.3127, 0.3127, 0.3127])
    grad:  2.0 4.0 tensor([-1.7607, -0.8803, -0.4402])
    grad:  3.0 6.0 tensor([1.4682, 0.4894, 0.1631])
progress:  87 0.006653300020843744
    grad:  1.0 2.0 tensor([0.3131, 0.3131, 0.3131])
    grad:  2.0 4.0 tensor([-1.7577, -0.8789, -0.4394])
    grad:  3.0 6.0 tensor([1.4646, 0.4882, 0.1627])
progress:  88 0.0066203586757183075
    grad:  1.0 2.0 tensor([0.3135, 0.3135, 0.3135])
    grad:  2.0 4.0 tensor([-1.7548, -0.8774, -0.4387])
    grad:  3.0 6.0 tensor([1.4610, 0.4870, 0.1623])
progress:  89 0.0065881176851689816
    grad:  1.0 2.0 tensor([0.3139, 0.3139, 0.3139])
    grad:  2.0 4.0 tensor([-1.7520, -0.8760, -0.4380])
    grad:  3.0 6.0 tensor([1.4576, 0.4859, 0.1620])
progress:  90 0.0065572685562074184
    grad:  1.0 2.0 tensor([0.3143, 0.3143, 0.3143])
    grad:  2.0 4.0 tensor([-1.7493, -0.8747, -0.4373])
    grad:  3.0 6.0 tensor([1.4542, 0.4847, 0.1616])
progress:  91 0.0065271081402897835
    grad:  1.0 2.0 tensor([0.3147, 0.3147, 0.3147])
    grad:  2.0 4.0 tensor([-1.7466, -0.8733, -0.4367])
    grad:  3.0 6.0 tensor([1.4510, 0.4837, 0.1612])
progress:  92 0.00649801641702652
    grad:  1.0 2.0 tensor([0.3150, 0.3150, 0.3150])
    grad:  2.0 4.0 tensor([-1.7441, -0.8720, -0.4360])
    grad:  3.0 6.0 tensor([1.4478, 0.4826, 0.1609])
progress:  93 0.0064699104987084866
    grad:  1.0 2.0 tensor([0.3153, 0.3153, 0.3153])
    grad:  2.0 4.0 tensor([-1.7415, -0.8708, -0.4354])
    grad:  3.0 6.0 tensor([1.4448, 0.4816, 0.1605])
progress:  94 0.006442630663514137
    grad:  1.0 2.0 tensor([0.3156, 0.3156, 0.3156])
    grad:  2.0 4.0 tensor([-1.7391, -0.8695, -0.4348])
    grad:  3.0 6.0 tensor([1.4418, 0.4806, 0.1602])
progress:  95 0.006416172254830599
    grad:  1.0 2.0 tensor([0.3159, 0.3159, 0.3159])
    grad:  2.0 4.0 tensor([-1.7366, -0.8683, -0.4342])
    grad:  3.0 6.0 tensor([1.4389, 0.4796, 0.1599])
progress:  96 0.006390606984496117
    grad:  1.0 2.0 tensor([0.3161, 0.3161, 0.3161])
    grad:  2.0 4.0 tensor([-1.7343, -0.8671, -0.4336])
    grad:  3.0 6.0 tensor([1.4361, 0.4787, 0.1596])
progress:  97 0.0063657015562057495
    grad:  1.0 2.0 tensor([0.3164, 0.3164, 0.3164])
    grad:  2.0 4.0 tensor([-1.7320, -0.8660, -0.4330])
    grad:  3.0 6.0 tensor([1.4334, 0.4778, 0.1593])
progress:  98 0.0063416799530386925
    grad:  1.0 2.0 tensor([0.3166, 0.3166, 0.3166])
    grad:  2.0 4.0 tensor([-1.7297, -0.8649, -0.4324])
    grad:  3.0 6.0 tensor([1.4308, 0.4769, 0.1590])
progress:  99 0.00631808303296566
predict (after tranining)  4 8.544171333312988

损失值随着迭代次数的增加呈递减趋势，如下图所示：

可以看出：x=4时的预测值约为8.5，与真实值8有所差距，可通过提高迭代次数或者调整学习率、初始参数等方法来减小差距。

参考文献：

[1] https://www.bilibili.com/video/av93365242

到此这篇关于PyTorch反向传播的文章就介绍到这了,更多相关PyTorch反向传播内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

机器学习(二) 本文(2.5万字) | KNN算法原理及Python复现 | 小酒馆燃着灯机器学习算法 k近邻算法
文章目录一KNN算法原理二KNN三要素三机器学习中标准化四KNN分类预测规则五KNN回归预测规则六KNN算法实现方式七KDTree7.1构造KDtree7.2KDtree查找最近邻八KNN特点九KNN算法实现案例一案例二1.机器学习2.深度学习与目标检测3.YOLOv54.YOLOv5改进5.YOLOv8及其改进6.Python与PyTorch7.工具8.小知识点9.杂记一KNN算法原理K近邻分类
【大模型LLM面试合集】分布式训练_总结 X.AI666 大模型LLM面试合集面试分布式人工智能语言模型
9.总结1.数据并行数据并行，由于其原理相对比较简单，是目前使用最广泛的分布式并行技术。数据并行不仅仅指对训练的数据并行操作，还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。我们首先以PyTorch数据并行的发展（DataParallel、DistributedDataParallel、FullyShardedDataParallel）为主线进行讲述了数据并行的技术原理。同时，也简述了D
【vLLM 学习】使用 TPU 安装 HyperAI超神经 vLLM 学习人工智能 vLLM 深度学习 TPU 机器学习教程
vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。更多vLLM中文文档及教程可访问→https://vllm.hyper.ai/vLLM使用PyTorchXLA支持GoogleCloudTPU。依赖环境GoogleCloudTPUVM（单主机和多主机）TPU版本:v5e、v5p、v4Python:3.10安装选项：href=“https://v
深度学习之优化器Optimizer介绍 yueguang8 人工智能深度学习人工智能
优化器(Optimizer)是深度学习训练中非常关键的组件,它负责根据损失函数的梯度来更新模型参数,从而使模型性能不断提升。1.优化器的作用和重要性优化器是训练深度学习模型的核心组件之一。它负责根据损失函数的梯度来更新模型参数,推动模型性能不断提高。选择合适的优化器可以极大地影响模型的收敛速度和最终性能。2.优化器的基本原理优化器的基本思路是利用梯度下降法来最小化损失函数。每一步都根据当前梯度的方
深度学习常见优化器 Humingway 深度学习人工智能
一、基础优化器随机梯度下降（SGD）•核心：∇θJ(θ)=η*∇θJ(θ)•特点：学习率固定，收敛路径震荡大•适用场景：简单凸优化问题•改进方向：动量加速二、动量系优化器2.SGDwithMomentum•公式：v_t=γv_{t-1}+η∇θJ(θ)•效果：平滑梯度更新，加速收敛•经典参数：γ=0.9（多数场景推荐）三、自适应学习率家族3.Adagrad•创新：∇θJ(θ)_t=∇θJ(θ)/(
在windows下运行ollama用5600XT (其实旧的a卡应该都可以）步骤同时用ComfyUI + RX 5600 XT + DirectML 安装与配置 Zalo2 AI deepseek windows llama stable diffusion linux AI作画
Linux部分5600XT这个卡是gfx1010的核心，这个是rand1架构，这是被amd放弃的老古董包裹其他的rand1或者rand2都是。没钱也要玩AI(自能简单运用，不能训练，微调等)这张卡只有6g远远不够ai使用所以我发现好像是能和cpu一起混用的。#警告这张卡不要在linux下尝试安装rocm版本进行pytorch编译，然后进行模型微调，反正我是浪费时间了，根本行不通，因为amd根本就没
深度学习中常用的优化器无能者狂怒深度学习计算机视觉人工智能深度学习算法
梯度下降是优化神经网络的首选方法。本文将介绍各种基于梯度下降的优化器，如Momentum，Adagrad以及Adam等等StochasticGradientDescent（SGD）MomentumAdagradRMSpropAdamAdaMax1：梯度下降假设梯度下降法是一个下山的过程。假设这样一个场景：一个人被困在山上，需要从山上下来(找到山的最低点，也就是山谷)。但此时山上的浓雾很大，导致可视
PyTorch 和 Python关系一只积极向上的小咸鱼 python pytorch 人工智能
1PyTorch和Python关系PyTorch和Python是两个不同但相互关联的工具，主要用于机器学习和深度学习领域。以下是它们之间的关系和各自的作用：Python编程语言:Python是一种高级编程语言，以其简洁易读的语法而闻名。广泛使用:Python在数据科学、人工智能、Web开发、自动化等多个领域有着广泛的应用。库和生态系统丰富:Python拥有丰富的第三方库和工具，如NumPy、pan
python和pytorch关系_PyTorch：Python优先的深度学习框架 weixin_39877182
最近，Torch7团队开源了PyTorch。据该项目官网介绍，PyTorch是一个Python优先的深度学习框架，能够在强大的GPU加速基础上实现张量和动态神经网络。PyTorch是一个Python软件包，其提供了两种高层面的功能：使用强大的GPU加速的Tensor计算（类似numpy）构建于基于tape的autograd系统的深度神经网络如有需要，你也可以复用你最喜欢的Python软件包（如nu
点云空洞的边界识别提取 pso-bp 神经网络的模型来修复点云空洞附python代码点云-激光雷达-Slam-三维牙齿激光雷达点云 c++为主神经网络人工智能深度学习点云 python
代码是一个Python程序，用于处理3D点云数据，特别是检测和修复点云中的孔洞区域。1.**导入库**：-`numpy`：用于数学运算。-`open3d`：用于处理3D数据和可视化。-`torch`：PyTorch库，用于深度学习。-`torch.nn`和`torch.optim`：PyTorch的神经网络和优化器模块。-`mpl_toolkits.mplot3d`和`matplotlib.pyp
OSError: We couldn‘t connect to ‘https://huggingface.co‘ to load this file, 小李飞刀李寻欢 Notebook huggingface bert 分类大模型
场景：训练bert-base-chinese下游任务：分类。在一个服务器可以用，但GPU只有一个卡，只能换一个服务器，换个服务器又要重装环境，但后者下载模型有问题，手动用git-lfs下载后指定位置报错：Traceback(mostrecentcalllast):/examples/pytorch/text-classification/run_glue.py",line622,inmain()/
Python深度学习033：Python、PyTorch、CUDA和显卡驱动之间的关系若北辰 Python深度学习 python 深度学习 pytorch
Python、PyTorch、CUDA和显卡驱动之间的关系相当紧密，它们共同构成了一个能够执行深度学习模型的高效计算环境。下面是它们之间关系的简要概述：PythonPython是一种编程语言，广泛用于科学计算、数据分析和机器学习。它是开发和运行PyTorch代码的基础环境。PyTorchPyTorch是一个开源的机器学习库，用于应用如自然语言处理和计算机视觉的深度学习模型。它提供了丰富的API，使
PyTorch深度学习框架进阶学习计划 - 第21天：自然语言处理基础凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程 AIGC 自然语言处理
PyTorch深度学习框架进阶学习计划-第21天自然语言处理基础今天我们将深入学习自然语言处理(NLP)的基础概念，重点关注词嵌入技术、序列建模原理以及主流模型之间的区别和优缺点。通过理解这些基础知识，你将能够更好地应用PyTorch构建NLP应用。1.词嵌入原理与实现词嵌入(WordEmbeddings)是NLP中的核心概念，它将单词映射到连续向量空间，使得语义相似的词在向量空间中距离较近。为什
PyTorch深度学习框架60天进阶学习计划 - 第19天：时间序列预测凡人的AI工具箱深度学习 pytorch 学习人工智能 AI编程迁移学习 python
PyTorch深度学习框架60天进阶学习计划-第19天：时间序列预测目录时间序列预测概述滑动窗口数据构造方法归一化策略对比：MinMaxvsZ-ScoreLSTM基础原理Attention机制与LSTM结合LSTM-Attention模型实现TeacherForcing技术与应用Prophet基准模型对比多步预测的滚动验证方法综合实战：股票价格预测1.时间序列预测概述时间序列预测是机器学习中的一个
PyTorch深度学习框架60天进阶学习计划 - 第18天：模型压缩技术凡人的AI工具箱深度学习 pytorch 学习 python 人工智能
PyTorch深度学习框架60天进阶学习计划-第18天：模型压缩技术目录模型压缩技术概述知识蒸馏详解软标签生成策略KL散度损失推导温度参数调节结构化剪枝技术通道剪枝评估准则L1-norm剪枝算法APoZ剪枝算法量化训练基础量化类型与精度PyTorch量化API剪枝与量化协同优化Torch.fx动态计算图修改自动化模型压缩流程实现实战案例：ResNet模型压缩性能评估与分析进阶挑战与思考1.模型压缩
五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook 芝帕先生深度学习 windows pycharm python conda pip 人工智能
目录前言下载并安装Anaconda下载途径安装步骤下载并安装PyCharm安装pytorch安装jupyternotebook前言新手五分钟掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch配置的时候遇到了很多问题，总结了一下，可以按这个流程无脑配置。通过本流程下载的版本Anaconda2023.03PyCharmCommunity2023.1.3Pytorch2
python,pycharm,pytorch，向量数据库，环境搭建记录 dept123 python pycharm pytorch 向量数据库
修改ubuntu上的pycharm镜像源，详细步骤-腾讯云开发者社区-腾讯云【超详细教程】2024最新Pytorch安装教程（同时讲解安装CPU和GPU版本）-CSDN博客https://zhuanlan.zhihu.com/p/667447891Quickstart|MilvusDocumentation
【图像去噪】论文复现：TPAMI 2025！全面提升单图像去噪泛化性！像素级零样本去噪方法Pixel2Pixel的Pytorch源码复现，跑通源码，修改各种报错，框架详解，注释详细！十小大 pytorch 人工智能 python 深度学习计算机视觉图像处理图像去噪
请先看【专栏介绍文章】：【图像去噪（ImageDenoising）】关于【图像去噪】专栏的相关说明，包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总（更新中）完整代码和训练好的模型权重文件下载链接见本文底部，订阅专栏免费获取！本文亮点：跑通Pixel2Pixel全部源码，包含数据集准备、制作像素库(PixelBank)、训练和推理等，
(4-8)基于DeepSeekMoE架构的DeepSeek-V3：测试模型码农三叔训练 RAG 多模态)架构 transformer deekseek 人工智能大模型
4.8测试模型DeepSeek-V3是一款基于PyTorch的深度学习模型，主要用于文本生成任务。在加载模型时，首先需要从指定路径加载模型的配置文件和预训练权重。加载完成后，模型被设置为评估模式，并移动到GPU上以加速推理过程。在生成文本时，用户可以输入提示文本，模型会根据这些提示生成相应的文本输出。生成过程支持交互式输入和批量处理两种模式，用户可以根据需要选择适合的方式进行文本生成。此外，模型的
一个基于LSTM的字符级文本生成模型的训练+使用(pytorch) 一只小铁柱 lstm pytorch 人工智能
一、代码实现1.配置文件config.pyimporttorch#设备配置DEVICE=torch.device('cuda'iftorch.cuda.is_available()else'cpu')#超参数和配置SEQ_LENGTH=100#输入序列长度BATCH_SIZE=64#批大小EMBEDDING_DIM=256#嵌入层维度HIDDEN_SIZE=512#LSTM隐藏层大小NUM_LAY
模型训练和推理一杯水果茶！视觉与网络 python 梯度反向传播训练推理
训练时需要梯度，推理时不需要怎么理解“梯度”？计算图以及前向后向传播训练时需要梯度，推理时不需要阶段是否计算梯度是否反向传播是否更新参数用例写法训练✅✅✅loss训练默认即可，requires_grad=True推理❌❌❌采样、预测、部署用@torch.inference_mode()或withtorch.no_grad()训练阶段必须开启梯度计算：要计算loss（损失函数）然后通过loss.ba
PyTorch安装与环境配置终极指南：从零搭建高效深度学习开发环境（一） WHCIS python pytorch 人工智能深度学习机器学习
一、环境搭建的核心意义与准备工作1.1深度学习环境的核心挑战深度学习开发环境涉及复杂的软件栈依赖关系：硬件兼容性：GPU型号（NVIDIA系列）与CUDA版本的匹配软件依赖链：Python版本→PyTorch版本→CUDA驱动→cuDNN加速库环境隔离需求：不同项目可能依赖冲突的库版本1.2硬件准备清单硬件类型最低要求推荐配置CPU4核8核以上内存8GB32GB+GPU支持CUDANVIDIART
【梯度下降算法】蝉叫醒了夏天机器学习算法
梯度下降算法：第一章梯度下降的历史沿革1.1优化方法的演进脉络从17世纪牛顿时代的数值解法，到20世纪最优控制理论的发展，直至现代机器学习对优化算法的特殊需求，梯度下降算法在数学优化史上占据重要地位。1947年FrankRosenblatt在感知机研究中首次系统应用梯度下降思想1.2机器学习时代的复兴21世纪深度学习革命使梯度下降算法获得新生：2006年Hinton团队在深度信念网络中的突破应用2
RNN 实战指南：用 PyTorch 从零实现文本分类吴师兄大模型 PyTorch pytorch python 人工智能 RNN 循环神经网络文本分类开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
分布式并行策略概述灵海之森 LLM 算法分布式
数据并行（DataParallelism）内容：数据并行通过将训练数据分割成多个小批次，并在多个处理单元（如GPU）上同时训练模型的副本来工作。每个副本完成自己批次的前向和反向传播计算后，梯度被汇总并同步更新到所有模型副本。优势：易于实现和扩展。可以显著减少训练时间，尤其是当模型较小，而数据集较大时。缺点：随着模型大小的增加，每个处理单元需要的内存也增加，可能受限于单个GPU的内存容量。大规模时通
Pytorch实现之利用普通GAN的人脸修复这张生成的图像能检测吗优质GAN模型训练自己的数据集 GAN系列 pytorch 生成对抗网络人工智能神经网络深度学习计算机视觉 python
简介简介：利用遮挡真实样本的部分面貌，输入给生成器，让生成器输出未被遮挡的面貌，以达到修复人脸的效果。论文题目：FACERESTORATIONVIAGENERATIVEADVERSARIALNETWORKS（基于生成对抗网络的人脸恢复）会议：2023ThirdInternationalConferenceonSecureCyberComputingandCommunication(ICSCCC)摘
训练大模型LLM选择哪种开发语言最好大0马浓人工智能训练 python
训练大型语言模型（LLM）时，选择合适的编程语言主要取决于效率、生态支持、开发便利性以及特定需求（如性能优化或硬件适配）。以下是常见语言的分析和推荐：---1.Python（首选语言）优势：-生态系统丰富：主流深度学习框架（PyTorch、TensorFlow、JAX）均以Python为主要接口，提供完整的工具链（数据处理、模型训练、评估部署）。-开发效率高：语法简洁，适合快速实验和原型开发，社区
PyTorch分布式训练阳光明媚大男孩 pytorch 分布式人工智能
本文结构：分布式训练概述环境设置数据并行（DDP）模型并行启动训练性能优化建议示例代码参考资料和相关问题以下是为您整理的PyTorch分布式训练教程指南：一、PyTorch分布式训练核心概念数据并行：通过分割数据集实现多GPU并行训练，主流方法包括：DistributedDataParallel(DDP)：官方推荐的分布式训练接口DataParallel(DP)：单机多卡方案（已逐步被DDP取代）
基于yolov11的瓶盖缺陷检测系统python源码+pytorch模型+评估指标曲线+精美GUI界面 FL1623863129 深度学习 YOLO pytorch 人工智能
【算法介绍】基于YOLOv11的瓶盖缺陷检测系统在现代制造业中，瓶盖的质量直接影响到产品的封装效果和消费者的使用体验。因此，对瓶盖进行快速、准确的缺陷检测至关重要。基于YOLOv11（YouOnlyLookOnceversion11）的瓶盖缺陷检测系统应运而生，为瓶盖质量监控提供了一种高效、智能的解决方案。该系统采用YOLOv11作为核心检测算法，这一算法融合了先进的深度学习技术和创新的网络架构，
开发ai模型最佳的系统是Ubuntu还是linux？俺足人工智能 ubuntu
在AI/ML开发中，Ubuntu是更优选的Linux发行版，原因如下：1.开箱即用的AI工具链支持Ubuntu预装了主流的AI框架（如TensorFlow、PyTorch）和依赖库，且通过apt包管理器可快速部署开发环境。提供针对NVIDIAGPU的官方驱动支持，简化CUDA和cuDNN的配置流程（如nvidia-smi直接监控显存）。2.社区生态与长期维护（LTS）UbuntuLTS版本（如24
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他

PyTorch梯度下降反向传播

你可能感兴趣的:(PyTorch梯度下降反向传播)