菜鸟向前冲fighting

PyTorch小技巧

很多内容来源于网络，如有冒犯。私信删除

文章目录

Pytorch搭建网络问题
- 1. 数据预处理
- - 1.1 归一化 (Normalization)
  - 1.2 标准化(Standardization)
  - 1.3 正则化
  - 1.4 Pytorch中常用张量操作
  - - 1.4.1 torch.cat
    - 1.4.2 torch.stack
    - 1.4.3 round四舍五入操作
    - 1.4.4 Tensor()与tensor()
    - 1.4.5取分类输出的最大值
    - 1.4.6字典切片
    - 1.4.7 数据类型转换
    - - (1) Numpy转换为Tensor
      - (2) Tensor转换为Numpy
      - (3) Tensor与 list 相互转换
      - (4) 基本数据类型转换
      - (5) type_as将张量转换成指定类型张量
      - (6) 使用torch.type()函数
    - 1.4.8 isinstance数据类型判断
  - 1.5 数据加载
  - 1.6 不同维度数组相乘操作
  - 1.7 pytorch中函数公式
  - - 1.7.1 logsigmoid形式
    - 1.7.2 激活函数
  - 1.8 Excel数据提取转换
- 2. 梯度操作
- - 2.1 打开梯度
  - 2.2 梯度清零
- 3. 网络模型搭建
- - 3.1 Sequential方法
  - 3.2 Class类方法
  - 3.3 优化器
  - 3.4 损失函数
  - 3.5 修改模型默认参数
  - 3.6 model.train和model.eval
- 4. 保存模型参数
- - 4.1 仅保存网络参数
  - 4.2 保存整个网络
- 5. 遇到的巨坑
- - 5.1 CrossEntropyLoss分类问题

Pytorch搭建网络问题

1. 数据预处理

1.1 归一化 (Normalization)

属性缩放到一个指定的最大和最小值（通常是1-0）之间，这可以通过preprocessing.MinMaxScaler类实现。常用的最小最大规范化方法(x-min(x))/(max(x)-min(x))。

from sklearn import preprocessing
import numpy as np

min_max_scaler = preprocessing.MinMaxScaler()
X_train = np.array([[ 1., -1., 2.],[ 2., 0., 0.],[ 0., 1., -1.]])
X_train_minmax = min_max_scaler.fit_transform(X_train)

>>> X_train_minmax
array([[ 0.5 , 0. , 1. ],
[ 1. , 0.5 , 0.33333333],
[ 0. , 1. , 0. ]])

1.2 标准化(Standardization)

将数据按比例缩放，使之落入一个小的特定区间内，标准化后的数据可正可负，一般绝对值不会太大。计算时对每个属性/每列分别进行将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每个属性/每列来说所有数据都聚集在0附近，方差为1。使用z-score方法规范化(x-mean(x))/std(x)这个在matlab中有特定的方程使用sklearn.preprocessing.scale()函数，可以直接将给定数据进行标准化：

from sklearn import preprocessing
import numpy as np

X = np.array([[ 1., -1.,  2.],
              [ 2.,  0.,  0.],
              [ 0.,  1., -1.]])
X_scaled = preprocessing.scale(X)
 
>>> X_scaled                                          
array([[ 0.  ..., -1.22...,  1.33...],
       [ 1.22...,  0.  ..., -0.26...],
       [-1.22...,  1.22..., -1.06...]])
 
>>>#处理后数据的均值和方差
>>> X_scaled.mean(axis=0)
array([ 0.,  0.,  0.])
 
>>> X_scaled.std(axis=0)
array([ 1.,  1.,  1.])

1.3 正则化

正则化的过程是将每个样本缩放到单位范数（每个样本的范数为1），如果后面要使用如二次型（点积）或者其它核方法计算两个样本之间的相似性这个方法会很有用。Normalization主要思想是对每个样本计算其p-范数，然后对该样本中每个元素除以该范数，这样处理的结果是使得每个处理后样本的p-范数（l1-norm,l2-norm）等于1。
$P-范数的计算公式：||X||_p=(|x_1|^p+|x_2|^p+...+|x_n|^p)^{1/p}$
该方法主要应用于文本分类和聚类中。例如，对于两个TF-IDF向量的l2-norm进行点积，就可以得到这两个向量的余弦相似性。

可以使用preprocessing.normalize()函数对指定数据进行转换：

>>> X = [[ 1., -1., 2.],
... [ 2., 0., 0.],
... [ 0., 1., -1.]]
>>> X_normalized = preprocessing.normalize(X, norm='l2')
 
>>> X_normalized
array([[ 0.40..., -0.40..., 0.81...],
[ 1. ..., 0. ..., 0. ...],
[ 0. ..., 0.70..., -0.70...]])

可以使用processing.Normalizer()类实现对训练集和测试集的拟合和转换：

>>> normalizer = preprocessing.Normalizer().fit(X) # fit does nothing
>>> normalizer
Normalizer(copy=True, norm='l2')
 
>>>
>>> normalizer.transform(X)
array([[ 0.40..., -0.40..., 0.81...],
[ 1. ..., 0. ..., 0. ...],
[ 0. ..., 0.70..., -0.70...]])
 
>>> normalizer.transform([[-1., 1., 0.]])
array([[-0.70..., 0.70..., 0. ...]])

1.4 Pytorch中常用张量操作

1.4.1 torch.cat

对数据沿着某一维度进行拼接，cat后的总维度数不变，需要注意两个张量进行cat时某一维的维数要相同，否则会报错！

import torch
x = torch.randn(2,3)
print(x)
print('*'*80)
y = torch.randn(1,3)
print(y)
print('*'*80)
t = torch.cat((x, y), 0)   # 维度为(3, 3)
print(t)
torch.cat((x, z), 0)  # 报错

运行结果：

tensor([[-1.3758, -0.3441, -1.4608],
        [ 1.2006, -0.7091,  0.1233]])
********************************************************************************
tensor([[-0.8673, -0.8082, -2.3864]])
********************************************************************************
tensor([[-1.3758, -0.3441, -1.4608],
        [ 1.2006, -0.7091,  0.1233],
        [-0.8673, -0.8082, -2.3864]])

1.4.2 torch.stack

相比于Cat，Stack则会增加新的维度，并且将两个矩阵在新的维度上进行堆叠，一般要求两个矩阵的维度是相同的！

import torch
x = torch.randn(1,2)
y = torch.randn(1,2)
torch.stack((x, y), 0)   # 在0维度进行堆叠，维度为(2, 1, 2)
torch.stack((x, y), 1)   # 维度为(1, 2, 2)

运行结果：

tensor([[-0.9762, -1.1769]])
********************************************************************************
tensor([[-0.6522,  0.0318]])
********************************************************************************
tensor([[[-0.9762, -1.1769]],

        [[-0.6522,  0.0318]]])
********************************************************************************
tensor([[[-0.9762, -1.1769],
         [-0.6522,  0.0318]]])
********************************************************************************

1.4.3 round四舍五入操作

import torch

x = 2.55555
y = torch.tensor(2.55555, dtype= torch.float32)
# 方法一
print('结果1：',round(x,3))  # round为python语法中自带的函数，3是保留小数的位数
# 方法二
print('结果2：',torch.round(y))  # torch.round不能限制小数位数
print('结果3：',torch.round(y).item())  # item()把数从tensor中取出

运行结果：

结果1： 2.556
结果2： tensor(3.)
结果3： 3.0

1.4.4 Tensor()与tensor()

import torch

在PyTorch中，Tensor和tensor都能用于生成新的张量：

a = torch.Tensor([1,2])

>>> a=torch.Tensor([1,2])
>>> a
tensor([1., 2.])
>>> a=torch.tensor([1,2])
>>> a
tensor([1, 2])

首先，我们需要明确一下，torch.Tensor()是python类，更明确地说，是默认张量类型torch.FloatTensor()的别名，torch.Tensor([1,2])会调用Tensor类的构造函数__init__，生成单精度浮点类型的张量。

>>> a=torch.Tensor([1,2])
>>> a.type()
'torch.FloatTensor'

而torch.tensor()仅仅是python函数：https://pytorch.org/docs/stable/torch.html#torch.tensor ，函数原型是：

torch.tensor(data, dtype=None, device=None, requires_grad=False)

其中data可以是：list, tuple, NumPy ndarray, scalar和其他类型。torch.tensor会从data中的数据部分做拷贝（而不是直接引用），根据原始数据类型生成相应的torch.LongTensor、torch.FloatTensor和torch.DoubleTensor。

>>> a=torch.tensor([1,2])
>>> a.type()
'torch.LongTensor'

>>> a=torch.tensor([1.,2.])
>>> a.type()
'torch.FloatTensor

>>> a=np.zeros(2,dtype=np.float64)
>>> a=torch.tensor(a)
>>> a.type()
'torch.DoubleTensor'

这里再说一下torch.empty()，根据 https://pytorch.org/docs/stable/torch.html?highlight=empty#torch.empty ，我们可以生成指定类型、指定设备以及其他参数的张量，由于torch.Tensor()只能指定数据类型为torch.float，所以torch.Tensor()可以看做torch.empty()的一个特殊情况。

1.4.5取分类输出的最大值

with torch.no_grad():
    testY = model(testX)
print(testY)

运行结果：

tensor([[  7.4433,  -1.4233,  -1.6965,  -4.9028],
        [ 11.1287,  -5.7861,  -2.3523,  -1.3352],
        [  1.6368,   4.0758,   1.5106,  -6.8918],
        [ 11.1269,  -6.2055,  -0.2486,  -4.0074],
        [  4.2791,  -7.5071,   8.0243,  -5.0912],
        [  3.9377,   0.1002,  -3.0278,   0.7973],
        [ 10.4937,  -5.5156,   0.3815,  -4.5885],
        [ 10.2765,  -2.4278,  -0.0422,  -7.3499],
        [  0.8234,   9.4561,  -2.2854,  -7.8151],
        [  3.6753,  -2.6943,   6.2879,  -5.9786],
        [  9.7963,  -1.1426,   0.2660,  -8.2053],
        [  5.3171,   3.5008,  -3.4102,  -5.2817],
        [  9.0295,  -2.3807,  -5.0728,  -2.1787],
        [ 12.7925,  -6.8981,  -3.3715,  -1.3687],
        [  2.9363,  -4.1924,  -3.8692,   5.4553],
        [  7.0463,  -1.8211,  -2.3471,  -1.9651],
        [  6.1256,  -1.4506,  -0.0740,  -4.6081],
        [  4.4470,   0.8657,   1.6806,  -5.3237],
        [  7.1012,   1.6752,   1.1116,  -9.0371],
        [  1.7235,  -5.7148,   6.2477,  -1.1781],
        [  0.8945,   4.2796,  -1.5190,  -3.4724],
        [  9.7305,  -2.1866,  -2.9471,  -2.3112],
        [  7.8209,  -2.1488,   0.8533,  -5.8382],
        [  0.6063,   7.9243,  -2.4863,  -5.3481],
        [  3.1649,  -0.0549,   3.5648,  -6.4298],
        [  8.4594,  -0.2936,  -0.4718,  -6.2386],
        [  2.6753,   2.1676,   0.6504,  -4.7133],
        [ 11.4688,  -4.3625,  -5.2973,  -1.6718],
        [ 12.7178,  -6.6919,  -4.8123,  -1.9376],
        [ -0.9076,  -0.9274,  -4.6698,   7.8568],
        [  8.5488,  -3.4524,  -1.4708,  -3.4786],
        [  9.8643,  -6.3564,  -2.3896,   0.1812],
        [ -0.3086,   6.6137,  -1.6922,  -4.2936],
        [  5.6480,  -0.3888,  -1.8955,  -0.7594],
        [  2.4999,  -2.9834,   7.2879,  -5.2193],
        [  4.2896,   0.3526,  -4.0778,   0.2920],
        [  9.1389,  -5.9225,  -0.3296,  -3.1200],
        [  6.9025,  -3.9361,  -2.1047,   1.1030],
        [  1.7949,   2.7270,  -1.1831,  -1.9257],
        [  4.2454,  -4.7726,   5.9915,  -4.7709],
        [ 10.3149,  -2.4509,  -0.5917,  -6.6981],
        [  0.3288,   8.1812,  -5.5801,  -0.7519],
        [ 10.9215,  -3.3665,  -3.9858,  -2.0602],
        [  9.2952,  -3.1185,  -5.7481,  -0.3535],
        [  2.7448,  -6.3724,  -4.5297,   7.7019],
        [  8.7598,  -4.8083,  -2.2426,  -0.4326],
        [  9.3423,  -5.7544,   0.3519,  -2.5967],
        [  2.0215,   2.5876,  -0.7334,  -1.8973],
        [  8.3974,  -1.2813,  -0.1331,  -5.7042],
        [  1.4222,  -2.6100,   6.5302,  -2.1887],
        [  7.4289,   2.8581,   0.6636,  -8.8257],
        [  7.4660,  -3.3966,  -3.2598,   0.7070],
        [  7.7047,  -3.7917,  -0.8066,  -2.5238],
        [  3.9101,   3.1239,  -2.9358,  -1.0799],
        [  2.7316,  -3.2821,   8.4985,  -6.1583],
        [  9.0011,  -2.5707,  -1.6200,  -3.3008],
        [ -0.5210,   4.3287,  -2.8837,   0.1590],
        [  9.4240,  -1.8600,  -4.6306,  -0.2257],
        [ 10.5553,  -4.5794,  -2.8072,  -1.3519],
        [ -2.0982,  -1.5021,  -5.8774,  10.1451],
        [  8.1251,  -5.1918,  -3.6729,   0.5811],
        [  8.6910,  -2.0897,  -4.6669,   0.5333],
        [ -0.7934,   5.4703,  -0.1302,  -3.1170],
        [  6.9602,  -1.3405,  -0.1571,  -4.3973],
        [  0.1805,  -0.8911,   6.1601,  -5.5365],
        [  2.1057,   2.5338,  -5.6351,   2.3221],
        [  7.3220,   0.2707,  -4.7512,  -2.4399],
        [  8.4964,  -1.4643,   4.8854, -10.9043],
        [  3.1047,   5.5968,   0.9471,  -8.8787],
        [  4.9688,  -5.2696,   6.1680,  -4.2479],
        [  9.7998,  -3.5701,   1.4597,  -6.7401],
        [  1.8569,   6.1164,  -3.1263,  -4.2748],
        [  6.1492,   2.9876,  -7.2567,  -2.3775],
        [  9.4298,  -2.8283,  -7.4377,   1.5422],
        [ -0.6555,  -0.2519,  -5.8323,   6.8694],
        [  7.3518,   3.0800,  -0.9119,  -9.0124],
        [  6.9438,   1.7972,  -2.6768,  -6.1078],
        [ -0.0528,   7.3127,  -1.9607,  -3.8322],
        [  5.6991,   2.8540,  -3.7784,  -4.0820],
        [ -1.1966,  -1.2128,   6.1327,  -2.6217],
        [ -0.3849,   7.3386,  -2.5669,  -4.6670],
        [  6.3555,   1.5932,  -5.1967,  -1.0024],
        [  2.5816,   4.1530,  -0.7747,  -5.6864],
        [ -0.7420,   9.3222,   0.5745,  -7.3484],
        [  0.1243,  -2.8342,  10.8683,  -7.7141],
        [  6.9208,   1.0358,  -0.1274,  -5.5745],
        [  0.7077,   4.9082,   2.1944,  -6.8996],
        [  6.7253,  -0.3559,  -4.0509,  -1.9693],
        [  8.4796,  -3.4290,  -4.4795,  -1.4465],
        [ -0.5281,  -0.7838,  -5.0702,   7.0901],
        [  5.6690,   0.0732,  -3.9329,  -2.0248],
        [ 12.2119,  -2.2533,  -1.3228,  -7.9734],
        [  3.9205,   2.3429,   0.3645,  -6.9054],
        [  7.0275,   1.2768,  -2.3088,  -4.5443],
        [  0.8335,  -3.6880,   8.6731,  -5.6231],
        [  0.8692,   6.5459,  -5.7003,  -0.1224],
        [  8.7197,  -1.6967,  -3.0582,  -3.4979],
        [  7.0834,  -1.9839,  -3.9747,   0.7744],
        [  3.1499,   4.4433,  -3.7725,  -2.7284],
        [  8.1010,  -2.4316,   4.0292,  -8.6694]])

代码：

print(testY.max(1))  # 返回两个tensor， 第一个tensor为每一行的最大值，第二个tensor为最大值在每一行位置的索引

运行结果：

torch.return_types.max(
values=tensor([ 7.4433, 11.1287,  4.0758, 11.1269,  8.0243,  3.9377, 10.4937, 10.2765,
         9.4561,  6.2879,  9.7963,  5.3171,  9.0295, 12.7925,  5.4553,  7.0463,
         6.1256,  4.4470,  7.1012,  6.2477,  4.2796,  9.7305,  7.8209,  7.9243,
         3.5648,  8.4594,  2.6753, 11.4688, 12.7178,  7.8568,  8.5488,  9.8643,
         6.6137,  5.6480,  7.2879,  4.2896,  9.1389,  6.9025,  2.7270,  5.9915,
        10.3149,  8.1812, 10.9215,  9.2952,  7.7019,  8.7598,  9.3423,  2.5876,
         8.3974,  6.5302,  7.4289,  7.4660,  7.7047,  3.9101,  8.4985,  9.0011,
         4.3287,  9.4240, 10.5553, 10.1451,  8.1251,  8.6910,  5.4703,  6.9602,
         6.1601,  2.5338,  7.3220,  8.4964,  5.5968,  6.1680,  9.7998,  6.1164,
         6.1492,  9.4298,  6.8694,  7.3518,  6.9438,  7.3127,  5.6991,  6.1327,
         7.3386,  6.3555,  4.1530,  9.3222, 10.8683,  6.9208,  4.9082,  6.7253,
         8.4796,  7.0901,  5.6690, 12.2119,  3.9205,  7.0275,  8.6731,  6.5459,
         8.7197,  7.0834,  4.4433,  8.1010]),
indices=tensor([0, 0, 1, 0, 2, 0, 0, 0, 1, 2, 0, 0, 0, 0, 3, 0, 0, 0, 0, 2, 1, 0, 0, 1,
        2, 0, 0, 0, 0, 3, 0, 0, 1, 0, 2, 0, 0, 0, 1, 2, 0, 1, 0, 0, 3, 0, 0, 1,
        0, 2, 0, 0, 0, 0, 2, 0, 1, 0, 0, 3, 0, 0, 1, 0, 2, 1, 0, 0, 1, 2, 0, 1,
        0, 0, 3, 0, 0, 1, 0, 2, 1, 0, 1, 1, 2, 0, 1, 0, 0, 3, 0, 0, 0, 0, 2, 1,
        0, 0, 1, 0]))

代码：

print(testY.max(1)[1])

运行结果：

tensor([0, 0, 1, 0, 2, 0, 0, 0, 1, 2, 0, 0, 0, 0, 3, 0, 0, 0, 0, 2, 1, 0, 0, 1,
        2, 0, 0, 0, 0, 3, 0, 0, 1, 0, 2, 0, 0, 0, 1, 2, 0, 1, 0, 0, 3, 0, 0, 1,
        0, 2, 0, 0, 0, 0, 2, 0, 1, 0, 0, 3, 0, 0, 1, 0, 2, 1, 0, 0, 1, 2, 0, 1,
        0, 0, 3, 0, 0, 1, 0, 2, 1, 0, 1, 1, 2, 0, 1, 0, 0, 3, 0, 0, 0, 0, 2, 1,
        0, 0, 1, 0])

1.4.6字典切片

word_to_idx = {
     word:i for i, word in enumerate(idx_to_word)}
# print(type(word_to_idx))  # 字典0 : the, 1 : of,……………… 
# print(word_to_idx[:100])  # 报错
# 字典不能切片显示，可以转换成list
print(list(word_to_idx.items())[:100])
print('*'*80)
print(list(word_to_idx)[:100])

运行结果：

[('the', 0), ('of', 1), ('and', 2), ('one', 3), ('in', 4), ('a', 5), ('to', 6), ('zero', 7), ('nine', 8), ('two', 9), ('is', 10), ('as', 11), ('eight', 12), ('for', 13), ('s', 14), ('five', 15), ('three', 16), ('was', 17), ('by', 18), ('that', 19), ('four', 20), ('six', 21), ('seven', 22), ('with', 23), ('on', 24), ('are', 25), ('it', 26), ('from', 27), ('or', 28), ('his', 29), ('an', 30), ('be', 31), ('this', 32), ('he', 33), ('at', 34), ('which', 35), ('not', 36), ('also', 37), ('have', 38), ('were', 39), ('has', 40), ('but', 41), ('other', 42), ('their', 43), ('its', 44), ('first', 45), ('they', 46), ('had', 47), ('some', 48), ('more', 49), ('all', 50), ('can', 51), ('most', 52), ('been', 53), ('such', 54), ('who', 55), ('many', 56), ('new', 57), ('there', 58), ('used', 59), ('after', 60), ('american', 61), ('when', 62), ('time', 63), ('into', 64), ('these', 65), ('only', 66), ('see', 67), ('may', 68), ('than', 69), ('i', 70), ('world', 71), ('b', 72), ('d', 73), ('would', 74), ('no', 75), ('however', 76), ('between', 77), ('about', 78), ('over', 79), ('states', 80), ('years', 81), ('war', 82), ('people', 83), ('united', 84), ('during', 85), ('known', 86), ('if', 87), ('called', 88), ('use', 89), ('th', 90), ('often', 91), ('system', 92), ('so', 93), ('history', 94), ('state', 95), ('will', 96), ('up', 97), ('while', 98), ('where', 99)]
********************************************************************************
['the', 'of', 'and', 'one', 'in', 'a', 'to', 'zero', 'nine', 'two', 'is', 'as', 'eight', 'for', 's', 'five', 'three', 'was', 'by', 'that', 'four', 'six', 'seven', 'with', 'on', 'are', 'it', 'from', 'or', 'his', 'an', 'be', 'this', 'he', 'at', 'which', 'not', 'also', 'have', 'were', 'has', 'but', 'other', 'their', 'its', 'first', 'they', 'had', 'some', 'more', 'all', 'can', 'most', 'been', 'such', 'who', 'many', 'new', 'there', 'used', 'after', 'american', 'when', 'time', 'into', 'these', 'only', 'see', 'may', 'than', 'i', 'world', 'b', 'd', 'would', 'no', 'however', 'between', 'about', 'over', 'states', 'years', 'war', 'people', 'united', 'during', 'known', 'if', 'called', 'use', 'th', 'often', 'system', 'so', 'history', 'state', 'will', 'up', 'while', 'where']

1.4.7 数据类型转换

import torch
import numpy as np
a_numpy = np.array([1,2,3])

(1) Numpy转换为Tensor

a_tensor = torch.from_numpy(a_numpy)
print(a_tensor)

(2) Tensor转换为Numpy

a_numpy = a_tensor.numpy()
print(a_numpy)

(3) Tensor与 list 相互转换

# Tensor转list
>>>a=torch.ones([1,5])
>>>a

tensor([[1., 1., 1., 1., 1.]])

>>>b=a.tolist()
>>>b

[[1.0, 1.0, 1.0, 1.0, 1.0]]

# list转Tensor
>>>a=list(range(1,6))
>>>a
[1, 2, 3, 4, 5]

>>>b=torch.tensor(a)
>>>b
tensor([1, 2, 3, 4, 5])

(4) 基本数据类型转换

tensor = torch.Tensor(3, 5)

# torch.long() 将tensor投射为long类型
newtensor = tensor.long()

# torch.half()将tensor投射为半精度浮点类型
newtensor = tensor.half()

# torch.int()将该tensor投射为int类型
newtensor = tensor.int()

# torch.double()将该tensor投射为double类型
newtensor = tensor.double()

# torch.float()将该tensor投射为float类型
newtensor = tensor.float()

# torch.char()将该tensor投射为char类型
newtensor = tensor.char()

# torch.byte()将该tensor投射为byte类型
newtensor = tensor.byte()

# torch.short()将该tensor投射为short类型
newtensor = tensor.short()

(5) type_as将张量转换成指定类型张量

>>> a=torch.Tensor(2,5)
>>> a

tensor([[1.9431e-19, 4.8613e+30, 1.4603e-19, 2.0704e-19, 4.7429e+30],
        [1.6530e+19, 1.8254e+31, 1.4607e-19, 6.8801e+16, 1.8370e+25]])

>>> b=torch.IntTensor(1,2)
>>> b

tensor([[16843009,        1]], dtype=torch.int32)

>>> a.type_as(b)

tensor([[          0, -2147483648,           0,           0, -2147483648],
        [-2147483648, -2147483648,           0, -2147483648, -2147483648]],
       dtype=torch.int32)

>>> a

tensor([[1.9431e-19, 4.8613e+30, 1.4603e-19, 2.0704e-19, 4.7429e+30],
        [1.6530e+19, 1.8254e+31, 1.4607e-19, 6.8801e+16, 1.8370e+25]])

(6) 使用torch.type()函数

type(new_type=None, async=False)如果未提供new_type，则返回类型，否则将此对象转换为指定的类型。如果已经是正确的类型，则不会执行且返回原对象，用法如下：

>>>t1 = torch.LongTensor(3, 5)
>>>print(t1.type())

torch.LongTensor

# 转换为其他类型
>>>t2=t1.type(torch.FloatTensor)
>>>print(t2.type())

torch.FloatTensor

存在的类型有：

torch.FloatTensor
torch.LongTensor
torch.HalfTensor
torch.IntTensor
torch.DoubleTensor
torch.FloatTensor
torch.CharTensor
torch.ByteTensor
torch.ShortTensor

1.4.8 isinstance数据类型判断

isinstance() 函数来判断一个对象是否是一个已知的类型，类似 type()。

以下是 isinstance() 方法的语法:

isinstance(object,classinfo)

object – 实例对象
classinfo – 可以是直接或间接类名、基本类型或者由它们组成的元组。
返回值：如果对象的类型与参数二的类型（classinfo）相同则返回 True，否则返回 False。

>>>a = 2
>>>isinstance(a,int)
True
>>>isinstance(a,str)
False
>>>isinstance(a,(str,int,list)
# 是元组中的任何一个返还True
True

isinstance()与type()的区别

type() 不会认为子类是一种父类类型，不考虑继承关系。
isinstance() 会认为子类是一种父类类型，考虑继承关系。

class A:
    pass

class B(A):
    pass

isinstance(A(), A)    # returns True
type(A()) == A        # returns True
isinstance(B(), A)    # returns True
type(B()) == A        # returns False

我们发现，创建一个A对象，再创建一个继承A对象的B对象，使用 isinstance() 和 type() 来比较 A() 和 A 时，由于它们的类型都是一样的，所以都返回了 True。而B对象继承于A对象，在使用isinstance()函数来比较 B() 和 A 时，由于考虑了继承关系，所以返回了 True，使用 type() 函数来比较 B() 和 A 时，不会考虑 B() 继承自哪里，所以返回了 False。如果要判断两个类型是否相同，则推荐使用isinstance()。

if isinstance(h, torch.Tensor):
    pass
else:
    pass

1.5 数据加载

class WordEmbeddingDataset(torch.utils.data.Dataset):
    def __init__(self, text, word_to_idx, idx_to_word, word_freqs, word_counts):
        super(WordEmbeddingDataset, self).__init__()
        self.text_encoded = [word_to_idx.get(t, VOCAB_SIZE-1) for t in text]
        self.text_encoded = torch.LongTensor(self.text_encoded).long()
        self.word_to_idx = word_to_idx
        self.idx_to_word = idx_to_word
        self.word_freqs = torch.Tensor(word_freqs)
        self.word_counts = torch.Tensor(word_counts)
        
    def __len__(self):
        # 这个数据集一共有多少items
        return len(self.text_encoded)
    
    def __getitem__(self, idx):  # 根据idx返回数据(tensor)
        center_word = self.text_encoded[idx]
        pos_indices = list(range(idx-C, idx)) + list(range(idx+1, idx+1+C))  # 周围单词的索引
        # 防止 idx+1+C 大于 len(self.text_encoded)，
        # i % len(self.text_encoded)，当i
        # 当i>len(self.text_encoded)时，余数为个数
        pos_indices = [i % len(self.text_encoded) for i in pos_indices]  
        pos_words = self.text_encoded[pos_indices]  # 周围正确的单词，希望预测出来
        # torch.multinomial()
        neg_words = torch.multinomial(self.word_freqs, K*pos_words.shape[0],True)  # 负例采样，pos_words.shape[0]表示正确单词个数
        return center_word,pos_words,neg_words
    
dataset = WordEmbeddingDataset(text, word_to_idx, idx_to_word, word_freqs, word_counts)
dataloader = torch.utils.data.DataLoader(dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=0) 
# 查看dataloader中dataset数据
# 方法一 
next(iter(dataloader))  
# 方法二
for i,(center_word, pos_words, neg_words) in enumerate(dataloader):
	print(center_word, pos_words, neg_words)
	if i>5:
		break

1.6 不同维度数组相乘操作

input_embedding = self.in_embed(input_labels) # Batch_size * embed_size
pos_embedding = self.out_embed(pos_labels) # Batch_size * (2*C) * embed_size
neg_embedding = self.out_embed(neg_labels) # Batch_size * (2*C * K) * embed_size
        
input_embedding = input_embedding.unsqueeze(2)  # Batch_size * embed_size * 1,unsqueeze(2)增加了第三个维度
# torch.bmm实现第一个维度不变，其余维度矩阵相乘
pos_dot = torch.bmm(pos_embedding, input_embedding).squeeze() # 本来是Batch_size * (2*C) * 1，squeeze()后变为B * (2*C)
neg_pot = torch.bmm(neg_embedding, -input_embedding).squeeze() # Batch_size * (2*C*K)

1.7 pytorch中函数公式

1.7.1 logsigmoid形式

import torch.nn.functional as F

# log形式的sigmoid函数，用F.log(F.sigmoid)形式，可能会出现内存爆炸等一系列问题
log_pos = F.logsigmoid(pos_dot).sum(1)
log_neg = F.logsigmoid(neg_pot).sum(1)

1.7.2 激活函数

import torch.nn.functional as F
import torch.nn as nn

# 只是纯粹调用函数，都是小写字母开头
F.tanh()
F.sigmoid()
# 在网络中增加激活层，均为大写字母开头
nn.Tanh()
nn.Sigmoid()

1.8 Excel数据提取转换

方法一：


# input_datas.xlsx存储复数的表格

data_input = pd.read_excel(r"E://Datas/input_datas.xlsx")
# print(data_1)
data_input = np.array(data_input)
# data_1 = data_1.reshape(1024,2)
data_input = data_input.tolist()
data_input = np.array(data_input)
data_input = data_input.astype(np.complex).tolist()  # 数据类型转换成复数
data_input = np.array(data_input)
print(data_input.shape)
data_input_r = torch.tensor(np.real(data_input), dtype=torch.float32)  # 实部
data_input_i = torch.tensor(np.imag(data_input), dtype=torch.float32)  # 虚部

# 提取data_input_r中，除第一行之外的所有数据

new_data_input_r = torch.zeros((46,1024), dtype=torch.float32)
new_data_input_r = data_input_r[1:,:]
# print(data_input_r[46])
# print(new_data_input_r[45])

方法二：

# 训练集输入数据
data_input = pd.read_excel('/content/drive/My Drive/Colab Notebooks/工作簿6.xlsx') # 

data_input = np.array(data_input)
data_input = data_input.tolist()
new = list()
for i in range(347):
  for j in range(1024):
    new.append(complex(data_input[i][j]))

data_input = np.array(new).reshape(347,1024)

2. 梯度操作

2.1 打开梯度

# 打开梯度的两种方式

# 方法一
x = torch.ones(2, 2, requires_grad=True)
# 方法二
x.requires_grad_(True)
# model = torch.nn.Sequential(……)
for params in model.parameters():
    params.requires_grad_(True)

# 无梯度运算
with torch.no_grad():
	for param in model.parameters():  # 注意加括号
		param -= learning_rate*param.grad

2.2 梯度清零

# 方法一
optimizer = torch.optim.SGD(model.parameters(), lr=0.05)
………………………………
optimizer.zero_grad()
# 方法二
model = torch.nn.Sequential(……)
model.zero_grad()

3. 网络模型搭建

3.1 Sequential方法

# 方法一
hidden_Layers = 100
NUM_DIGITS = 10
model = torch.nn.Sequential(
    torch.nn.Linear(NUM_DIGITS, hidden_Layers),  # 不能少逗号
    torch.nn.ReLU(),
    torch.nn.Linear(hidden_Layers, 4)
)

loss_fn = torch.nn.CrossEntropyLoss()  # 多用作分类，集成了Softmax
optimizer = torch.optim.SGD(model.parameters(), lr=0.05)
……………………
y_pred = model(input_data)
loss = loss_fn(y_pred, y_label)
optimizer.zero_grad()  # 梯度清零不能忘
loss.backward()
optimizer.step()

3.2 Class类方法

# 方法二
class TwoLayerNet(torch.nn.Module):
    def __init__(self, n_features, n_hidden, n_out):  # define the model architecture
        super(TwoLayerNet, self).__init__()
        self.linear1 = torch.nn.Linear(n_features, n_hidden)  # 在句尾多家一个逗号，会报错
        self.linear2 = torch.nn.Linear(n_hidden, n_out)
    def forward(self, x):
        y_before = F.relu(self.linear1(x))
        y_pred = self.linear2(y_before)
#         y_pred = self.linear2(self.linear1(x).clamp(min = 0))
        return y_pred
    
net = TwoLayerNet(2, 10, 4)
loss_fn = torch.nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.05)
……………………
y_pred = net(input_data)
loss = loss_fn(y_pred, y_label)
optimizer.zero_grad()  # 梯度清零不能忘
loss.backward()
optimizer.step()

3.3 优化器

optimizer = torch.optim.SGD(model.parameters(), lr=0.05)
optimizer = torch.optim.Adam(model.parameters(), lr=0.05)
………………

3.4 损失函数

loss_fn = torch.nn.CrossEntropyLoss()  # 多用作分类，集成了Softmax
loss_fn = torch.nn.MSELoss()
………………
loss = loss_fn(y_pred, y_label)
optimizer.zero_grad()  # 梯度清零不能忘
loss.backward()

3.5 修改模型默认参数

# 以Sequential方法为例
model = torch.nn.Sequential(
    torch.nn.Linear(NUM_DIGITS, hidden_Layers),  # 不能少逗号
    torch.nn.ReLU(),
    torch.nn.Linear(hidden_Layers, 4)
)

print(model)
print(model[0].weight)

# 修改方法如下：修改模型默认初始化的数据
torch.nn.init.normal_(model[0].weight)
torch.nn.init.normal_(model[2].weight)

运行结果：

Sequential(
  (0): Linear(in_features=1000, out_features=100, bias=True)
  (1): ReLU()
  (2): Linear(in_features=100, out_features=10, bias=True)
)

Parameter containing:
tensor([[ 0.6446,  0.6133, -1.2414,  ...,  0.7190,  0.1795, -0.1246],
        [ 1.5737, -1.2386, -0.7058,  ...,  0.8870,  0.0807,  0.4245],
        [-0.8080, -2.5309, -0.9246,  ..., -0.1821, -0.0434, -0.2618],
        ...,
        [-0.6270, -1.0656,  1.3784,  ...,  0.3057, -1.4967, -0.3401],
        [ 0.9599, -0.0353, -1.1812,  ...,  1.1073,  0.9129,  0.0291],
        [-1.3919, -0.1804,  0.0903,  ...,  0.5543,  0.3251,  1.8142]],
       requires_grad=True)

3.6 model.train和model.eval

两条语句有固定的使用场景。

在训练模型时会在前面加上：

model.train()

在测试模型时在前面使用:

model.eval()

同时发现，如果不使用这两条语句，程序也可以运行。这两个方法是针对在网络train和eval时采用不同方式的情况，比如Batch Normalization和Dropout。下面对这Batch Normalization和Dropout做一下详细的解析：

Batch Normalization

BN的作用主要是对网络中间的每层进行归一化处理，并且使用变换重构（Batch Normalization Transform）保证每层所提取的特征分布不会被破坏。
训练时是针对每个mini-batch的，但是在测试中往往是针对单张图片，即不存在mini-batch的概念。由于网络训练完毕后参数都是固定的，因此每个batch的均值和方差都是不变的，因此直接结算所有batch的均值和方差。所有Batch Normalization的训练和测试时的操作不同。

Dropout

4. 保存模型参数

4.1 仅保存网络参数

import torch
torch.save(model.state_dict(),path):

功能：保存训练完的网络的各层参数（即weights和bias)

其中：model.state_dict()获取各层参数，path是文件存放路径(通常保存文件格式为.pt或.pth)

import torch
model2 = Sequential(…………)

model2 = TheModelClass(*args, **kwargs)
model2.load_state_dict(torch.load(PATH))
model2.eval()
# 必须在加载模型后调用model.eval函数来将dropout及批归一化层设置为预测模式。如果不这么做结果出错。

功能：加载保存到path中的各层参数到神经网络

注意：不可以直接为torch.load_state_dict(path)，此函数不能直接接收字符串类型参数

4.2 保存整个网络

torch.save(net,path):

功能：保存训练完的整个网络模型（不止weights和bias）

net2=torch.load(path):

功能：加载保存到path中的整个神经网络

说明：官方推荐方式一，原因自然是保存的内容少，速度会更快。

案列：保存loss最小时，model中的参数。

# 0.5,表示每调用一次 lr 降一半。
scheduler = torch.optim.lr_scheduler.ExponentialLR(optimizer,0.5)  

loss_list = []
for epoch in range(20000):
    for start in range(0, 346, batch_size):  # 
        end = start + batch_size
        batch_input_datas = new_data_input_r[start:end]
        batch_label_datas = new_data_label_r[start:end]
        acc_sum, err_sum =0.0, 0.0
        new_y_pred_r = model(batch_input_datas)
		loss = loss_fn(new_y_pred_r, batch_label_datas)
        # 训练准确率：
        if epoch % 50 ==0:
#############################################################################
            loss_list = loss.item()  # 将loss保存在列表中
            if len(loss_list) ==0 or loss_list < min(loss_list):
                torch.save(model.state_dict(), 'lm.pth')
                print("best model saved to lm.pth")
            else:  # 模型loss没有下降时：
                # learning rate decay：下降学习率。
                # 也可以设置loss三次没下降，调用该函数
                scheduler.step()  # 必须放在optimizer.step()之后

5. 遇到的巨坑

5.1 CrossEntropyLoss分类问题

pytorch 中利用交叉熵损失函数分类时，输入的正确 label 不能是 one-hot 格式。函数内部会自己处理成 one-hot 格式。所以不需要输入 [ 0 0 0 0 1]，只需要输入 4 就行。自己转换成 one-hot 与预测值比较，求损失函数。
label 用数字标注是从 0 开始，不能从 1或者其他数开始。
label 一定要是 LongTensor 类型。
label 的 shape 必须是 [batch_size]，如果是 [batch_size, 1]，需要用 label.squeeze() 转化为 [batch_size]。

未完待续…………

你可能感兴趣的:(机器学习,python,深度学习,pytorch,神经网络,机器学习)

chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
chatgpt赋能python：如何在Python中安装Keras库？ turensu ChatGpt python chatgpt keras 计算机
如何在Python中安装Keras库？Keras是一个简单易用的神经网络库，由FrançoisChollet编写。它在Python编程语言中实现了深度学习的功能，可以使您更轻松地构建和试验不同类型的神经网络。如果您是一名Python开发人员，肯定会想知道如何在您的Python项目中安装Keras库。在本文中，我们将向您展示如何安装和配置Keras库。步骤1：安装Python要使用Keras库，您需
Python实验|磁盘垃圾文件清理器 cw11lq Python python
实验目的：1、熟练运用标准库os和os.path中的函数。2、理解sys库中argv成员用法。3、理解Python程序接收命令行参数的方式。4、理解递归遍历目录树的原理。5、了解从命令提示符环境运行Python程序的方式。实验内容：编写程序，实现磁盘垃圾文件清理功能。要求程序运行时，通过命令行参数指定要清理的文件夹，然后删除该文件夹及其子文件夹中所有扩展名为tmp、log、obj、txt以及大小为
2017.11.23打卡计划爱跑步的coder
11.23打卡做完calculus_oneweek2的作业（暂时不学这个了，意义不大），并尽量将内容代码化。（已用python和ruby的匿名函数来表示）11.24打卡明晚学习中国人文文化导读第一周的课程。
如何理解深度学习的训练过程奋斗的草莓熊深度学习人工智能 python scikit-learn virtualenv numpy pandas
文章目录1.训练是干什么？2.预训练模型进行训练，主要更改的是预训练模型的什么东西？1.训练是干什么？以yolov5为例子，训练的目的是把一组输入猫狗图像放到神经网络中，得到一个输出模型，这个模型下次可以直接用来识别哪个是猫，哪个是狗2.预训练模型进行训练，主要更改的是预训练模型的什么东西？超参数（Hyperparameters）：这是模型结构中定义的参数，比如：卷积核大小（kernel_size
计算平均值python 暖风822 python
从键盘输入三个整数，分别存入x,y,z三个整型变量中，计算并输出三个数的和以及平均值。【输入形式】从键盘输入三个整数，整数之间以空格隔开。【输出形式】在屏幕上分两行显示结果：第一行为三个数的和，整数形式输出；第二行为三个数的平均值，浮点数形式输出，小数点后保留两位小数。【输入样例】3 2 3【输出样例】82.67【样例说明】3、2、3的和为8，所以第一行输出8；第二行输出3、2、3的平均值2.67
Python中定义函数有哪些方法？老男孩IT教育 python 开发语言
在Python中，函数是组织好的，可重复使用的，用来实现单一，或相关联功能的代码块，它可以提高应用的模块性，和代码的重复利用率。那么Python如何定义一个函数?以下是具体内容介绍。在Python中定义函数有多种方法。最常见的方法是使用def关键字，后跟函数名称和一对圆括号。语法：def函数名称(参数1，参数2，...):函数体示例：定义一个名为greet的函数，它接受一个name参数并打印一条问
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
Python 集成快递物流 API 助力订单追踪：轻松实现物流可视化幂简集成 API实战指南 python 开发语言 API
嗨，亲爱的读者们！你是否曾经在购物的时候对订单状态感到无比焦急？是不是经常会忍不住去刷新页面，希望能看到快递小哥已经出发的消息？别担心，今天我们要聊的是一种神器，它能让你轻松实现订单的实时追踪——那就是快递物流API。通过Python代码的力量，你可以将这项功能集成到你的网站或应用中，随时随地掌握包裹的动态信息。这篇文章，我们将手把手教你如何使用Python与韵达的快递物流API来实现一个高效的物
python-logging库冰美式QAQ python学习
1.logging模块简介logging模块是Python内置的标准模块，主要用于输出运行日志，可以设置输出日志的等级、日志保存路径、日志输出格式等2.logging库日志级别级别级别数值使用时机DEBUG10详细信息，常用于调试INFO20程序正常运行过程中产生的一些信息WARNING30警告用户，虽然程序还在正常工作，但有可能发生错误ERROR40由于更严重的问题，程序已不能执行一些功能了CR
一文理解 Python 中的环境变量简讯Alfred 和我一起零基础学 Python 简明python教程零基础学python python 环境变量
你好，我是简讯！一枚野生程序员。热爱编程，但目前的工作与编程毫无关系。正在尝试各种副业，目前有做：红包封面商城：如何利用红包封面打造副业购物平台赚取佣金：利用淘宝京东等平台优惠券赚取佣金编辑器使用Neovim多一点，如果你也喜欢使用Nvim，我们可以一起交流。我的Nvim配置：https://github.com/alpha87/nvim。个人公众号经常会分享一些编程相关的文章，还有一些我已经操作
python 标准库之openpyxl的常规操作真的学不了一点。。。 Python学习 python
目录openpyxl（Excel文件处理模块）读sheet读sheet中单元格合并单元格openpyxl模块基本用法安装方法基本使用读取Excel文档（一）获取工作表（二）获取单元格（三）获取行和列写入Excel文档（一）写入单元格（二）保存文件设置单元格样式（一）字体（二）对齐方式（三）边框（四）设置行高和列宽（五）合并和拆分单元格openpyxl(Excel文件处理模块)读sheet读取Exc
Python实时聊天室架构与API实战应用幂简集成 python
尊敬的各位读者，欢迎参与本次共享研讨项目——利用Python构建实时聊天室。在本项目中，我们将引进一款前沿工具——发布订阅频道API，以实现聊天室内的实时交互功能。在当今信息泛滥的社会环境下，实时交流已成为人们日常生活中不可或缺的组成部分。不论是社交平台上的即时通讯，抑或是网络游戏中的实时对决，实时通信技术始终在幕后默默支持着我们的每一次互动。今日，让我们共同踏入Python的奇妙世界，亲手打造专
python离线安装pip 于光yuguang python pip 开发语言
如果您的服务器没有互联网连接，您仍然可以通过其他方式将pip安装到服务器上。以下是一种可能的方法：方法一：离线安装下载pip安装文件：在另一台联网的计算机上，下载pip的安装文件（.whl文件）以及其依赖项的安装文件（如果有）。可以从PyPI下载pip的.whl文件。传输文件：将下载的.whl文件和依赖项文件通过USB等方式传输到没有互联网的服务器上。安装pip：在服务器上，使用pip的安装文件进
python 编译器spyder 安装_离线安装spyder的Python环境 weixin_39552037 python 编译器spyder 安装
一、介绍：要求在不联网、无法使用anaconda的情况下，在一台离线的win7设备上配置Spyder的python的开发环境，用于提高数据处理效率，且安装方法在win732位和64位的各种设备上均可流畅安装。二、问题难点总结：1.离线安装Python的第三方函数库Python在联网情况下安装第三方包很容易，但离线安装操作比较复杂，如某第三方库a，联网状态下仅一行代码pipinstalla，然而离线
pycharm 运行celery_python远程调试及celery调试夏小龙 pycharm 运行celery
部分来自from:https://www.xncoding.com/2016/05/26/python/pycharm-remote.html你是否经常要在Windows7或MACOSX上面开发Python或Web应用程序，但是它们最后需要在linux上面来运行呢？我们经常会碰到开发时没有问题但是到了正式的Linux环境下面却出现问题。那么怎样保证开发环境跟运行环境的一致呢？通常有两种方法解决。一
QT与Python混合编程经验记录 weixin_30237281 python 人工智能 c/c++
1、如何embeddingpython,Python文档中有专门一章阐述https://docs.python.org/3.5/extending/embedding.htm；1、库文件：在vs--c/c++--附加包含文件中添加目；链接中也要添加，：将python中的include,libs二个目录添加进来2、对于Python，没有调试库，可直接将运行库复制一份，名称后面加上_d，就可用，可不能
python爬虫(5)之CSDN It is a deal️ 小项目 python json 爬虫
CSDN的爬虫相对于doubatop250更加简单，一般只需要title和url即可下面是相关的代码：#爬虫之csdn#分析urlhttps://www.csdn.net/api/articles?type=more&category=python&shown_offset=0（firstpage）#https://www.csdn.net/api/articles?type=more&categ
python学习第七节：正则表达式一只会敲代码的小灰灰 python学习 python 学习正则表达式
python学习第七节：正则表达式正则表达式基本上在所有开发语言中都会使用到，在python中尤为重要。当我们使用python开发爬虫程序将目标网页扒下来之后我们要从网页中解析出我们想要的信息，这个时候就需要正则表达式去进行匹配。importrere的常量re模块中有9个常量，常量的值都是int类型！（知道就行）修饰符描述re.l使匹配对大小写不敏感re.L做本地化识别(locale-aware)
【Python】离线/无网/内网安装第三方库的一种方法 qilei2010 Python python 开发语言后端
有时候，我们使用的电脑没有接入互联网，或者是内部网络电脑，又或者是单机无网络，这时候使用Python，就不能自由的使用pipinstall命令了。下面是一种比较简单的无互联网安装第三方Python库的方法。此方法利用pipfreeze命令从已安装第三方库的电脑上移植库到内网电脑上。注意：以下命令中的D:\pkg文件夹需要自己提前创建。1.准备互联网电脑，优盘，无互联网电脑（下称无网电脑）无网电脑要
利用Python3爬取下载bookset网站的kindle电子书 nobodyyang
突然间发现这个网站，可以下载很多kindle电子书。观摩了下，和前段时间刚写的爬取头条有点类似。该网站链接首页：https://bookset.me/，这次爬取排行榜链接：https://bookset.me/?rating=douban，打开观察发现排行榜其实真正分页规则是https://bookset.me/page/num?rating=douban，其中num代表页数。具体代码如下
python离线安装一个第三方库 Lhj0616 python相关 python 第三方库
文章目录实例步骤下载`xlwt`库将文件转移到目标机器在目标机器上安装`xlwt`验证安装总结步骤可能的问题解决方法检查库的兼容性使用`pip`下载适配特定Python版本的库创建虚拟环境创建虚拟环境（Python3.6）创建虚拟环境（Python3.11）检查和验证库的安装下载多个版本的`.whl`文件总结更新：下载的第三方库有依赖库解决方案实例想离线安装一个第三方库xlwt，python版本分
Python中模块和包的概念及其区别 Good_tea_h python 开发语言
Python中模块和包的概念及其区别在Python中，模块（Module）和包（Package）是组织代码、提高代码重用性和可维护性的重要工具。它们各自扮演着不同的角色，并在Python程序设计中发挥着关键作用。以下将详细阐述模块和包的概念以及它们之间的主要区别。一、模块的概念定义：在Python中，模块是一个包含了函数、类和变量定义的文件。这些文件通常以.py作为文件扩展名。任何.py文件都可以
Python库之Numpy的简介、安装、使用方法详细攻略 shadowtalon Python python numpy 开发语言
Python库之Numpy的简介、安装、使用方法详细攻略引言在Python的数据处理和科学计算领域，Numpy库无疑是最核心的库之一。它提供了高性能的多维数组对象和一系列用于操作这些数组的工具。本篇文章将详细介绍Numpy的基本概念、安装方法以及如何使用Numpy进行数据处理。一、Numpy简介1.1什么是NumpyNumpy（NumericalPython）是一个开源的Python科学计算库，它
Python库之PyAutoGUI的简介、安装、使用方法详细攻略 shadowtalon 爬虫 Python python 爬虫学习开发语言
Python库之PyAutoGUI的简介、安装、使用方法详细攻略简介PyAutoGUI是一个Python模块，它可以用来控制鼠标和键盘，实现自动化操作用户界面的功能。它适用于Windows、macOS和Linux操作系统。PyAutoGUI可以用于自动化测试、数据录入、自动化演示等场景。安装PyAutoGUI可以通过pip命令轻松安装。打开你的命令行工具（例如CMD、Terminal或者shell
Python二级系列（四）：键盘输入两个整数，最小值和最大值，按要求输出两个整数之间的所有素数 shadowtalon Python二级 Python python
素数又称质数，是指除了1和它本身以外不能被其他整数整除的数。lower=int(input("输入区间最小值:"))upper=int(input("输入区间最大值:"))fornuminrange(lower+1,upper):ifnum>1:foriinrange(2,num):if(num%i)==0:breakelse:print(num)
Python二级系列（一）：将整数转化为二进制、八进制和十六进制（大写） shadowtalon Python二级 Python python
num=eval(input('请输入数字:'))print('对应的二进制数:{0:b}\n八进制数：{0:o}\n十六进制数:{0:X}'.format(num))
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key