BruceCheen

学习笔记：GAN和DCGAN入门

GAN的全称为Generative Adversarial Networks，意为对抗生成网络。原始的GAN是一种无监督学习方法，它巧妙地利用“对抗”的思想来学习生成式模型，一旦训练完成后可以生成全新的数据样本。DCGAN将GAN的概念扩展到卷积神经网络中，可以生成质量较高的图片样本。GAN和DCGAN在各个领域都有广泛的应用，这篇文章首先会介绍他们的原理，再介绍如何在TensorFlow中使用DCGAN生成图像，关于GAN和DCGAN的更多项目会在接下来的章节中进行介绍。

GAN的原理

GAN的原理其实非常简单。可以把GAN看成数据生成工具，这里以生成图片数据为例进行讲解，实际GAN可以应用到任何类型的数据。

假设有两个网络，生成网络G（Generator）和判别网络D（Discriminator）
他们的功能分别是：

G负责生成图片，它接收一个随机的噪声 z ，通过该噪声生成图片，将生成的图片记为 G(z) 。
D负责判别一张图片是不是“真实的”。它的输入时 x ， x 代表一张图片，输出 D(x) 表示 x 为真实图片的概率，如果为，代表真实图片的概率为%，而输出为，代表不可能是真实的图片。

在训练过程中，生成网络G的目标是尽量生成真实的图片去欺骗判别网络D，而D的目标是尽量把生成的图片和真实的图片区分开来。这样，G和D构成了一个动态的“博弈”，这就是GAN的基本思想。

最后博弈的结果是什么？在理想的状态下，G可以生成足以“以假乱真”的图片 G(z) 。对于D来说，他难以判定G生成的图片究竟是不是真实的，因此 D(G(z))=0.5 。此时得到了一个生成式的模型G，他可以用来生成图片。

下面就用数学化的语言来描述这个过程。假设用于训练的真实图片数据是 x ，图片数据的分布为 Pdata(x) ，之前说G能够“生成图片”，实际G可以学习到真实的数据分布 Pdata(x) 。噪声 z 的分布设为 pz(z) ， pz(z) 是已知的，而 Pdata(x) 是未知的。在理想情况下， G(z) 的分布应该尽可能接近 Pdata(x) ，G将已知分布的 z 变量映射到了未知分布 x 变量上。

根据交叉熵损失，可以构造下面的损失函数
V(D,G)=Ex∼Pdata(x)[lnD(x)]+Ez∼Pz(z)[ln(1−D(G(z)))]
损失函数中的 Ex∼Pdata(x) 是指在训练数据 x 中取得真实样本，而 Ez∼Pz(z) 是指从已知的噪声分布中提取的样本。对于这个损失函数，需要认识下面几点：

整个式子由两项构成。 x 表示真实图片， z 表示输入G网络的噪声，而 G(z) 表示G网络生成的图片。
D(x)表示D网络判断真实图片是否真实的概率（因为x是真实的，所以对于D来说，这个值越接近1越好）。而 D(G(z)) 是为了D判断G生成的图片是否真实的概率。
G的目的：G应该希望自己生成的图片“越接近真实越好”。也就是说，G希望 D(G(z)) 尽可能得大，这是 V(D,G) 会变小。
D的目的：D的能力越强， D(x) 应该越大， D(G(x)) 应该越小。因此D的目的和G不同，D希望 V(D,G) 越大越好。

在实际训练中，使用梯度下降法，对D和G交替做优化即可，详细的步骤为：

从已知的噪声分布 Pz(z) 中选出一些样本 z(1),z(2),...,z(m) 。
从训练数据中选出同样个数的真实图片 x(1),x(2),...,x(m) 。
设判别器D的参数为 θd ，求出损失关于参数的梯度 ▽1m∑mi=1[lnD(xi)+ln(1−D(G(zi)))] ，对 θd 更新时加上该梯度。
设生成器G的参数为 θg ，求出损失关于参数的梯度 ▽1m∑mi=1[ln(1−D(G(zi)))] ，对 θg 更新时减去该梯度。

在上面的步骤中，每对D的参数更新一次，便接着更新一次G的参数。有时还可以对D的参数更新k次后再更新一次G的参数，这些要根据训练的实际情况进行调整。另外，要注意的是，由于D是希望损失越大越好，G是希望损失损失越小越好，所以他们是一个加上梯度，一个是减去梯度。

当训练完成后，可以从 Pzz 随机取出一个噪声，经过G运算后可以生成符合 Pdata(x) 的新样本。

2 DCGAN的原理

DCGAN的全称是Deep Convolutional Generative Adversarial Networks ,
意即深度卷积对抗生成网络，它是由Alec Radford在论文Unsupervised
Representation Learning with Deep Convolutional Generative Adversarial
Networks中提出的。从名字上来看，它是在GAN的基础上增加深度卷积网
络结构，专门生成图像样本。下面一起来学习DCGAN的原理。

上一节详细介绍了D 、G 的输入输出租损失的走义，但关于D 、G 本身的结构并没高做过多的介绍。事实上， GAN 并没再对D 、G 的具体结构做出任何限制。DCGAN中的D 、G 的含义以及损失都和原始GAN中完全一致，但是它在D和G中采用了较为特殊的结构，以便对图片进行有效建模。

对于判别器D，它的输入是一张图像，输出是这张图像为真实图像的概率。在DCGAN中，判别器D的结构是一个卷积神经网络，输入的图像经过若干层卷积后得到一个卷积特征，将得到的特征送入Logistic函数，输出可以看作是概率。

对于生成器G ，它的网络结构如图8-1所示。

G的输入时一个100维的向量z。它是之前所说的噪声向量。G网络的第一层实际是一个全连接层，将100维的向量变成一个4x4x1024维的向量，从第二层开始，使用转置卷积做上采样，逐渐减少通道数，最后得到的输出为64x64x3，即输出一个三通道的宽和高都为64的图像。

此外，G、D还有一些其他的实现细节：

不采用任何池化层（ Pooling Layer ），在判别器D 中，用带有步长（ Stride)的卷积来代替池化层。
在G 、D 中均使用Batch Normalization帮助模型收敛。
在G中，激活函数除了最后一层都使用ReLU 函数，而最后一层使用tanh函数。使用tanh函数的原因在于最后一层要输出图像，而图像的像素值是有一个取值范围的，如0～255 。ReLU函数的输出可能会很大，而tanh函数的输出是在-1～1之间的，只要将tanh函数的输出加1再乘以127.5可以得到0～255 的像素值。
在D 中，激活函数都使用Leaky ReLU作为激活函数。

以上是DCGAN中D和G的结构，损失的定义以及训练的方法和第1节中描述的完全一致。Alec Radford使用DCGAN在LSUN数据集上进行无监督学习， LSUN是一个场景理解图像数据集，主要包含了卧室、固房、客厅、教室等场景图像。在LSUN的卧室数据集上，DCGAN生成的图像如图8-2所示。

除了使用G生成图像之外，还可以将G的输入信号 z 看作生成图像的一种表示。假设图片A对应的输入为 zA ，图片B对应的输入为 zB ，可以在 zA 和 zB 之间做插值，并使用G生成每一个插值对应的图片，对应的结果如图8-3所示。每一行的最左边可以看做图片A，而每一行的最右边可以看做是图片B，DCGAN可以让生成的图像以比较自然的方式从A过渡到B，并保证每一张过度图片都是卧室的图片。如图8-3所示的第六航中，一键没有窗户的卧室逐渐变化成了一间有窗户的卧室，在第四行中，一间有点事的卧室逐渐变化成了一间没有电视的卧室，原来电视的位置被窗帘取代，所有这些图片都是机器自动生成的。

实验证明，不仅可以对输入信号z进行过渡插值，还可以对它进行复杂运算。如图8-4所示，用代表“露出笑容的女性”的 z ，减去“女性”，再加上“男性”，最后得到了“露出笑容的男性”。

3 在TensorFlow中用DCGAN生成图像

本节会以GitHub上的一个DCGAN项目介绍TensorFlow中的DCGAN实现。利用该代码主要去完成两件事，一是生成MNIST手写数字，二是在自己的数据集上训练。还会穿插讲解该项目的数据读入方法、数据可视化方法。

3.1 生成MNIST图像

先做一个简单的小实验：生成MNIST手写数字。
运行如下代码会下载MNIST数据集到data/mnist文件夹中。

python download.py mnist

download.py 依赖一个名为tqdm的库，如果运行报错，可以先使用pip
install tqdm安装该库。

注意：当下载数据集时，如果出现网络问题导致下载中断，在再次下载时必须先删除data/mnist 文件夹，否则download.py 会自动跳过下载。

下载完成后，使用下面的命令即可开始训练：

python main.py --dataset mnist --input_height=28 --output_height=28 --train

参数的含义会在下面的小节中进行详细的介绍，先来关注运行该命令后屏幕显示的信息：

Epoch: [ 3] [   5/  15] time: 152.4979, d_loss: 1.39733350, g_loss: 0.68659568
Epoch: [ 3] [   6/  15] time: 155.5141, d_loss: 1.39340806, g_loss: 0.68581676
Epoch: [ 3] [   7/  15] time: 158.4942, d_loss: 1.39538455, g_loss: 0.68858492
Epoch: [ 3] [   8/  15] time: 161.3817, d_loss: 1.39494920, g_loss: 0.68842071
Epoch: [ 3] [   9/  15] time: 164.2292, d_loss: 1.40010333, g_loss: 0.67908889
Epoch: [ 3] [  10/  15] time: 167.2779, d_loss: 1.40040839, g_loss: 0.68134904

Epoch[3][10/15]表示当前为第3个epoch，每个epoch内有15步，当前为第0步。默认会在MNIST数据集运行25个epoch。每个一段时间，程序会把生成的模型保存在checkpoint/mnist_64_28_28、文件夹中。此外，每隔100步，程序都会使用当前的G生成图像样本，并将图像保存在samples文件夹中。这些自动生成的图像以train开头，如train_20_0299.png表示是第20个epoch第299步生成的图像。根据这些图像，可以得知当前生成G的性能，从而决定是否可以停止训练。

运行完25个epoch时，生成的效果如图8-5所示。

3.2 使用自己的数据集训练

本节介绍如何使用自己的图片数据集进行训练。首先需要准备好图片数据将它们裁剪到统一大小。在数据目录chapter_8_data中已经准备好了一个动漫人物头像数据集faces.zip 。在源代码的data目录中新建一个anime目录（如果没有data目录可以自行新建），并将faces.zip中所高的图像文件解压到anime目录中。最后形成的项目结构为：

在项目根目录中运行下面的命令即可开始训练：

python main.py --input_height 96 --input_width 96 \
    --output_height 48 --output_width 48 \
    --dataset anime --crop --train \
    --epoch 300 --input_fname_pattern ".jpg"

这里将参数设置为一共会训练300个epoch，实际可能并不需要那么多，读者同样可以观察samples文件夹下生成的样本图像来决定应该训练多少个
epoch 。

在训练1个epoch后，产生的样本图像如图8-6所示，此时只有模糊的边框（产生的图片在samples文件夹中）。

在训练5个epoch后，产生的样本如图8-7所示。

在训练50个epoch 后，产生的样本如图8-8所示，此时模型已经基本收敛了。

使用已经训练好的模型进行测试的对应命令为：

python main.py --input_height 96 --input_width 96 \
    --output_height 48 --output_width 48 \
    --dataset anime --crop

3.3 程序结构分析：如何将图像读入模型

如果对第3.1、3.2节中的命令仍有所疑惑，本节会结合程序源码，对这些输入参数进行详细的分析。项目所有的功能入口为文件main.py,因此，先来看下main.py的大体结构。在这个文件中，首先定义了一些参数，然后将参数统一保存到变量FLAGS中，接着根据这些参数调用DCGAN()，新建一个模型，并保存到变量dcgan中。接下来的代码为：

# 如果参数中指定为train，那么调用train方法进行训练
if FLAGS.train:
  dcgan.train(FLAGS)
else:
    # 如果不需训练，直接去载入已经训练好的模型
  if not dcgan.load(FLAGS.checkpoint_dir)[0]:
    raise Exception("[!] Train a model first, then run test mode")

# Below is codes for visualization
# 无论是进行训练还是直接执行，都会调用visualize方法进行可视化
OPTION = 2
visualize(sess, dcgan, FLAGS, OPTION)

根据这段代码，在输入命令时，如果指定了–train，会进行训练，如果不指定–train，会载入己保存的模型，无论是进行训练还是不进行训练，都会调用visualize方法进行可视化。

以上是该项目的整体逻辑。下面介绍输入的命令行和输入图像有关的参数处理。–input_height、–input_width、–output_height、–output_width 、–dataset、–crop、–input_fname_pattern 这些参数。

首先–dataset、–input_fname_pattern 两个参数。在model.py中，找到下列代码：

# mnist单独处理
if self.dataset_name == 'mnist':
  self.data_X, self.data_y = self.load_mnist()
  self.c_dim = self.data_X[0].shape[-1]
else:
  # 在训练时，使用self.data中的数据
  # 是data、dataset_name、self.input_fname_pattern
  self.data = glob(os.path.join("E:\datasets", self.dataset_name, self.input_fname_pattern))
  # 检查图片的通道数。一般是3通道彩色图
  imreadImg = imread(self.data[0]);
  if len(imreadImg.shape) >= 3: #check if image is a non-grayscale image by checking channel number
    self.c_dim = imread(self.data[0]).shape[-1]
  else:
    self.c_dim = 1

对于MNIST数据，程序是使用一个load_mnist（）函数单独处理的。而对
于自己的数据集3 程序会在data 文件夹下根据dataset和input_fname pattern两个变量找图像文件。这里的self.dataset_name是输入参数dataset,
self.input_fname_pattern是输入参数input_fname pattern 。如输入dataset 为anime 、input_fname_pattern 为.jpg ，程序会自动寻找路径为data/anime/ .jpg的所有图片，即data/anime目录下的所有jpg图像。

读入所高图片的文件名后，又会做哪些操作呢？这涉及–input_height 、–input_width 、–crop 、–output_height 、–output_width五个参数。首先要说明的一点是，如果输入时不指定–input_width，那么它的值会和–input_height的值相同；同样，如果不指定–output_width，那么它的值会和–output_height相同。即main.py中的：

if FLAGS.input_width is None:
  FLAGS.input_width = FLAGS.input_height
if FLAGS.output_width is None:
  FLAGS.output_width = FLAGS.output_height

读入的图片文件名首先经过以下操作（该部分代码在model.py 中）：

# mnist单独操作
if config.dataset == 'mnist':
batch_images = self.data_X[idx*config.batch_size:(idx+1)*config.batch_size]
batch_labels = self.data_y[idx*config.batch_size:(idx+1)*config.batch_size]
else:
# self.data是所有图像文件名，batch_files是取出一个batch_size文件的文件名
batch_files = self.data[idx*config.batch_size:(idx+1)*config.batch_size]
# 调用get_image函数对每个图像进行处理
batch = [
    get_image(batch_file,
              input_height=self.input_height,
              input_width=self.input_width,
              resize_height=self.output_height,
              resize_width=self.output_width,
              crop=self.crop,
              grayscale=self.grayscale) for batch_file in batch_files]
# 区分灰度图和彩色图
if self.grayscale:
  batch_images = np.array(batch).astype(np.float32)[:, :, :, None]
else:
  batch_images = np.array(batch).astype(np.float32)

self.data是之前说的存放所有图像文件路径的列表，每次都从该列表中取出batch_size大小的子集batch_files，对于batch_files中的每一个文件路径，调用get_image函数进行处理。

get_image函数在utils.py中，在此直接列出所有用到的函数：

# get_image读入图像后直接使用transform函数
def get_image(image_path, input_height, input_width,
              resize_height=64, resize_width=64,
              crop=True, grayscale=False):
  image = imread(image_path, grayscale)
  return transform(image, input_height, input_width,
                   resize_height, resize_width, crop)


# transform函数
def transform(image, input_height, input_width, 
              resize_height=64, resize_width=64, crop=True):
  if crop:
  # 中心crop之后resize
    cropped_image = center_crop(
      image, input_height, input_width, 
      resize_height, resize_width)
  else:
  # 直接resize
    cropped_image = scipy.misc.imresize(image, [resize_height, resize_width])
    # 标准化处理
  return np.array(cropped_image)/127.5 - 1.

# 中心crop，再进行缩放
def center_crop(x, crop_h, crop_w,
                resize_h=64, resize_w=64):
  if crop_w is None:
    crop_w = crop_h
  h, w = x.shape[:2]
  j = int(round((h - crop_h)/2.))
  i = int(round((w - crop_w)/2.))
  return scipy.misc.imresize(
      x[j:j+crop_h, i:i+crop_w], [resize_h, resize_w])

get_image函数实际调用了transform 函数。transform 函数又使用了
center_crop函数。而center_crop函数的功能是：在图片中心截取高为crop_h像素，宽为crop_w像素的图片，再缩放为resize_h乘resize_w的大小。

再看transform函数，对输入图像的处理有两种方法。当指定–crop后，会调用center_crop函数。根据调用关系，这里的input_height和input_width是输入的–input_height和–input_ width参数，而resize_height和resize_width是输入的–output_height和–output_width参数。因此，实际是在图像中心截
取高为input_height乘以input_width的小块，并放缩到output_ height乘以
output_width的大小。此外，如果不指定参数–crop，不去截取图像，而是直接缩放到output_height乘output_width 。

这样的话，之前的执行指令非常好理解了，下面的命令：

python main.py --input_height 96 --input_width 96 \
    --output_height 48 --output_width 48 \
    --dataset anime --crop --train --epoch 300 --input_fname_pattern "*.jpg"

对应的含义是：

找出data/anime/下所有jpg格式的图像。
将这些图像中心截取96x96的小块，并缩放到48 ×48像素。
因为有–train参数，所以执行训练。

最后还有一个参数–epoch没解释，这个参数含义很好理解，代表执行的epoch数目。

3.4 程序结构分析：可视化方法

在训练好模型或者载入已有模型后，都会调用visualize方法进行可视化，即main.py中的如下代码：

OPTION = 0
visualize(sess, dcgan, FLAGS, OPTION)

visualize函数在utils.py中。简单查看后可以发现该函数的输入参数option支持0、1、2、3、4一共5个值。在main. py 中直接更改OPTION的值可以使用不同的可视化方法。这里以option=0和option=1为例进行介绍。

option=0的可视化方法：

# image_fname_dim是batch_size开方之后向上取整的值
image_frame_dim = int(math.ceil(config.batch_size**.5))
if option == 0:
  # 生成batch_size个z噪声
  z_sample = np.random.uniform(-0.5, 0.5, size=(config.batch_size, dcgan.z_dim))
  # 根据batch_size个z噪声生成batch_size张图片
  samples = sess.run(dcgan.sampler, feed_dict={dcgan.z: z_sample})
  # 将所有图片拼合成一张图片
  # 这一张图片的格式为image_frame_dim乘以image_frame_dim
  save_images(samples, [image_frame_dim, image_frame_dim], './samples/test_%s.png' % strftime("%Y%m%d%H%M%S", gmtime()))

程序首先根据batch_size的值计算出一个image_frame_dim 。这个值实际上是batch_size开方后再向上取整的结果。如默认的batch_size为64，那么对应的image_frame_dim值是8 。

接着随机生成一些躁声z并保存为变量z_sample，它的形状为（ batch size,z dim ），后者z_dim是单个噪声本身具有的维度，默认为100，这也和原始论文中的网络结构保持一致。在默认情况下，将生成一个形状为（ 64, 100）的z_sample，z_sample中的每个值都在-0.5～0.5 之间。将它送入网络中，可以得到64张图像并放在samples中，最后调用save_images函数将64张图像组合为一张8*8的图像，如图8-9所示。

再看option=1的可视化方法：

elif option == 1:
  # values是和batch_size等长的向量，从0~1递增
  values = np.arange(0, 1, 1./config.batch_size)
  # 会生成100张图片
  for idx in xrange(100):
    print(" [*] %d" % idx)
    # 这里的z_sample大多数都是0
    z_sample = np.zeros([config.batch_size, dcgan.z_dim])
    # 实际上是把z_sample的第idx列变成values
    for kdx, z in enumerate(z_sample):
      z[idx] = values[kdx]

    if config.dataset == "mnist":
      # 对mnist分开处理
      y = np.random.choice(10, config.batch_size)
      y_one_hot = np.zeros((config.batch_size, 10))
      y_one_hot[np.arange(config.batch_size), y] = 1

      samples = sess.run(dcgan.sampler, feed_dict={dcgan.z: z_sample, dcgan.y: y_one_hot})
    else:
      samples = sess.run(dcgan.sampler, feed_dict={dcgan.z: z_sample})

    save_images(samples, [image_frame_dim, image_frame_dim], './samples/test_arange_%s.png' % (idx))

option=1的可视化方法会生成100张和option=0中差不多的图片。每个
z_sample中的数字大多数都是0，某中第idx( idx 从0～99）列变成一个事先
定义好的向量values。因此每个z_sample中各个图片对应的改变很小。图
8-10展示了使用option=1进行可视化生成的图片（变化比较细微）。

剩下的几种可视化方法我们可以自行参阅源码进行分析。注意option=2 、
3、4 的几种方法都依赖一个名为moviepy的库。可以使用pip install moviep y安装，并保证import moviepy.editor as mpy不会出错。

4 总结

本章首先讲解了GAN和DCGAN的原理，接着介绍了一个非常有趣的项目：在TensorFlow中利用DCGAN生成图片。最后，以输入图像和可视化方法两部分为例，分析了DCGAN 项目的源码。希望通过这篇文章的介绍，掌握GAN的思想以及DCGAN的使用方法。

Flutter-完整开发实战详解(一、Dart-语言和-Flutter-基础) 2401_85122662 flutter
《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》完整开源地址：https://docs.qq.com/doc/DSkNLaERkbnFoS0ZF基本类型var可以定义变量，如vartag=“666”，这和JS、Kotlin等语言类似，同时Dart属于动态类型语言，支持闭包。Dart中number类型分为int和double，其中java中的long对应的也是Da
学习笔记：oracle online系列：oracle：Per-Process PGA memory limit 认真就输DBA Oracle 学习随笔学习笔记 oracle
我们的文章会在微信公众号IT民工的龙马人生和博客网站(www.htz.pw)同步更新，欢迎关注收藏，也欢迎大家转载，但是请在文章开始地方标注文章出处，谢谢！由于博客中有大量代码，通过页面浏览效果更佳。本文转自朋友的真实案例分享。oracleonline系列：oracle：Per-ProcessPGAmemorylimit前几日，东区某客户的19crac出现了ORA-04030，从报错的trace来
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
DPDK探测设备并初始化分享放大价值 DPDK dpdk probe 设备初始化 mmap
本文整理下之前的学习笔记，基于DPDK17.11版本源码分析。主要看一下DPDK探测网卡设备，并进行初始化的流程，用到了类似kernel中的总线-设备-驱动模型。本文的重点之一是DPDK如何在用户态操作网卡寄存器，这里先给个答案:想要操作网卡寄存器，需要用到网卡的基地址BAR，intel网卡一般使用BAR0就行，通过mmap此文件/sys/bus/pci/devices/'pciaddress'/
动手学深度学习13.7. 单发多框检测（SSD）-笔记&练习（PyTorch） scdifsn 深度学习笔记 pytorch ssd 单发多框检测（SSD）目标检测 mAP评价
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：45SSD实现【动手学深度学习v2】_哔哩哔哩_bilibili本节教材地址：13.7.单发多框检测（SSD）—动手学深度学习2.0.0documentation本节开源代码：…>d2l-zh>pytorch>chapter_optimization>ssd.ipynb单发多框
动手学深度学习3.3线性回归的简洁实现-笔记&练习（PyTorch） scdifsn 深度学习线性回归笔记 pytorch
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：线性回归的简洁实现_哔哩哔哩_bilibili本节教材地址：3.3.线性回归的简洁实现—动手学深度学习2.0.0documentation(d2l.ai)本节开源代码：...>d2l-zh>pytorch>chapter_linear-networks>linear-regre
Python学习笔记2-垃圾回收机制 Carrie_Lei Python python 学习笔记
Python的垃圾回收机制是自动管理内存的系统，用于回收不再使用的内存，以避免内存泄漏和优化内存使用。Python使用引用计数（ReferenceCounting）和垃圾回收（GarbageCollection）两种方式来管理内存。1.引用计数(ReferenceCounting)引用计数是Python内存管理的基础机制。每个对象都维护一个引用计数器，记录有多少个引用指向该对象。当一个新的引用指向
Python数据分析学习笔记：字符串统计 NIKEeri python pandas 字符串匹配 python 数据分析学习
一、题目来源KagglePandas-Exercise:SummaryFunctionsandMaps章节二、题目要求描述一瓶葡萄酒时，可用的词汇有限。哪种词出现频率更高：“tropical”还是“fruity”？统计description列中这两个词的出现次数。忽略大小写。三、我的思路（使用str.contains统计总次数）tropical_count=reviews['description
【机器学习|学习笔记】随机森林（Random Forest, RF）详解，附代码。努力毕业的小土博^_^ 机器学习基础算法优质笔记1 机器学习学习笔记随机森林人工智能
【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。文章目录【机器学习|学习笔记】随机森林（RandomForest,RF）详解，附代码。前言起源随机子空间法与Bagging的萌芽原理算法机制理论保障发展应用优缺点优点缺点Python实现示例（Scikit-learn）欢迎铁子们点赞、关注、收藏
PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第1-11个视频笔记）胡说八道的Dr. Zhu 深度学习 pytorch 学习
本学习笔记源自于B站up主【我是土堆】的视频教程：PyTorch深度学习快速入门教程（绝对通俗易懂！）【小土堆】本博客是该视频教程中第1-11个视频的详细学习笔记，第12-22个视频、第23-33个视频的详细学习笔记链接如下：PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第12-22个视频笔记）PyTorch深度学习快速入门教程【小土堆】详细学习笔记（第23-33个视频笔记）目录1、P
关于 Linux中系统调优的一些笔记山河已无恙 Linux笔记 Linux 性能调优 1024程序员节 linux 运维
写在前面推送的的邮件里看到有大佬讲的公共课，听了之后这里整理学习笔记。因为是公开课，所以讲的很浅，没接触过，这里做为了解，长长见识。博文内容包括系统调优原理概述如何检测系统的性能瓶颈如何进行内核参数调优如何限制服务的资源占用自定义tuned调优配置集我突然又明白，死亡是聪明的兄长，我们可以放心地把自己托付给他，他会知道在我们有所准备的适当时刻前来。我也突然懂得，原来痛苦、失望和悲愁不是为了惹恼我们
CSC研修计划的书写
博主最近在申请CSC，所以也会更新一下自己的学习笔记，有需要的可以关注我一下，同时有问题大家可以一起交流一下啊一要求（fromCSC官网）①拟留学专业(研究课题)在国内外研究情况及水平；②拟选择的留学国别、留学单位及选择原因(应简单评述对方国家及留学单位在申请人所从事学科、专业领域的水平、优势，申请人及所在单位与对方有无合作基础及业务联系);③达到本次出国学习预期目标的可行性,结合本人目前从事的工
【机器学习笔记 Ⅱ】9 模型评估巴伦是只猫机器学习机器学习笔记人工智能
评估机器学习模型是确保其在实际应用中有效性和可靠性的关键步骤。以下是系统化的评估方法，涵盖分类、回归、聚类等任务的评估指标和技术：一、分类模型评估1.基础指标2.高级指标ROC-AUC：通过绘制真正例率（TPR）vs假正例率（FPR）曲线下面积评估模型整体性能。AUC=1：完美分类；AUC=0.5：随机猜测。适用于二分类及多分类（OvR或OvO策略）。混淆矩阵：可视化模型在各类别上的具体错误（如将
【机器学习笔记 Ⅱ】7 多类分类巴伦是只猫机器学习机器学习笔记分类
1.多类分类（Multi-classClassification）定义多类分类是指目标变量（标签）有超过两个类别的分类任务。例如：手写数字识别：10个类别（0~9）。图像分类：区分猫、狗、鸟等。新闻主题分类：政治、经济、体育等。特点互斥性：每个样本仅属于一个类别（区别于多标签分类）。输出要求：模型需输出每个类别的概率分布，且概率之和为1。实现方式One-vs-Rest(OvR)：训练K个二分类器（
【DeepSeek开源周】Day 4：DualPipe & EPLB 学习笔记蓝海星梦 DeepSeek开源周探秘开源学习笔记人工智能云计算分布式
目录一、DualPipe&EPLB概述二、DualPipe详解1.流水线并行策略（1）F-then-B策略（2）1F1B策略2.朴素流水线并行3.GPipe微批次流水线并行4.PipeStream5.ZBPP6.DualPipe7.DualPipeV8.流水线并行方案对比三、EPLB详解1.专家并行（EP）2.EPLB冗余专家策略3.负载均衡策略（1）分层负载均衡（2）全局负载均衡（3）接口和示例
【机器学习笔记 Ⅱ】4 神经网络中的推理
推理（Inference）是神经网络在训练完成后利用学到的参数对新数据进行预测的过程。与训练阶段不同，推理阶段不计算梯度也不更新权重，仅执行前向传播。以下是其实现原理和代码示例的完整解析：1.推理的核心步骤加载训练好的模型参数（权重和偏置）。前向传播：输入数据逐层计算，得到输出。后处理：根据任务类型解析输出（如分类取概率最大值，回归直接输出）。2.代码实现（Python+NumPy）(1)定义模型
【机器学习笔记 Ⅲ】3 异常检测算法巴伦是只猫机器学习机器学习笔记算法
异常检测算法（AnomalyDetection）详解异常检测是识别数据中显著偏离正常模式的样本（离群点）的技术，广泛应用于欺诈检测、故障诊断、网络安全等领域。以下是系统化的解析：1.异常类型类型描述示例点异常单个样本明显异常信用卡交易中的天价消费上下文异常在特定上下文中异常（如时间序列）夏季气温突降至零下集体异常一组相关样本联合表现为异常网络流量中突然的DDOS攻击流量2.常用算法(1)基于统计的
【机器学习笔记 Ⅲ】4 特征选择巴伦是只猫机器学习机器学习笔记人工智能
特征选择（FeatureSelection）系统指南特征选择是机器学习中优化模型性能的关键步骤，通过筛选最相关、信息量最大的特征，提高模型精度、降低过拟合风险并加速训练。以下是完整的特征选择方法论：1.特征选择的核心目标提升模型性能：去除噪声和冗余特征，增强泛化能力。降低计算成本：减少训练和预测时间。增强可解释性：简化模型，便于业务理解。2.特征选择方法分类(1)过滤法（FilterMethods
机器学习笔记二-回归
回归是统计学和机器学习中的一种基本方法，用于建模变量之间的关系，特别是用一个或多个自变量（输入变量）来预测一个因变量（输出变量）的值。回归分析广泛应用于预测、趋势分析和关联研究中。根据目标和数据的性质，可以使用不同类型的回归方法。1.回归的基本概念：自变量（IndependentVariable）:也称为预测变量、解释变量，是模型中的输入变量，用于预测或解释因变量的变化。因变量（Dependent
OpenHarmony解读之设备认证：Pake协议详解与实战陈乔布斯鸿蒙开发 HarmonyOS OpenHarmony harmonyos 分布式鸿蒙开发软总线 openHarmony 嵌入式硬件
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）①鸿蒙应用开发与鸿蒙系统开发哪个更有前景？②嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~③对于大前端开发来说，转鸿蒙开发究竟是福还是祸？④鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？⑤记录一场鸿蒙开发岗位面试经历~⑥持续更新中……一、概述在设备认证过程中，pake协议用于认证会话密钥协商，基于该会话密钥，双方可以安全地交换各自的
【ESP32最全学习笔记（基础篇）——7.ESP32 ADC – 使用 Arduino IDE 读取模拟值】「已注销」 ESP32学习笔记学习 ESP32 单片机嵌入式硬件 Arduino
关于本教程：ESP32基础篇1.ESP32简介2.ESP32Arduino集成开发环境3.VS代码和PlatformIO4.ESP32引脚5.ESP32输入输出6.ESP32脉宽调制7.ESP32模拟输入☑8.ESP32中断定时器9.ESP32深度睡眠
计算机网络（网页显示过程，TCP三次握手，HTTP1.0，1.1，2.0，3.0，JWT cookie）老虎0627 计算机网络计算机网络 tcp/ip 网络协议
前言最近一直在看后端开发的面经，里面涉及到了好多计算机网络的知识，在这里以问题的形式写一个学习笔记（其中参考了:JavaGuide和小林coding这两个很好的学习网站）1.当键入网址后，到网页显示，其间发生了什么？（1）首先浏览器会解析URL。（如确定协议像Http或Https）（2）然后通过DNS服务器把域名解析为IP地址。（找到服务器啦）（3）接着TCP协议三次握手和服务器建立连接。（客户端
PyQt5—QTextEdit 学习笔记寄思～ Python——PyQt5笔记 qt 学习笔记 python
第二章控件学习一、QTextEdit基础认知QTextEdit是PyQt/PySide框架中用于处理富文本内容的强大控件，它不仅支持纯文本编辑，还能处理HTML、图片等复杂内容，是开发文本编辑器、日志查看器等应用的核心组件。二、最简单的QTextEdit实现下面是一个创建QTextEdit并显示的基础案例，适合零基础入门：importsysfromPyQt5.QtWidgetsimportQApp
陈强《计量经济学及Stata应用》学习笔记——持续更新 WangSoooCute 学习笔记
1导论1.1什么是计量经济学econometrics几种关系：相关关系、因果关系、逆向因果关系reversecausality、双向因果关系被解释变量dependentvariable解释变量explanatoryvariable=regressor=自变量independentvariable=协变量covariateunobservable的误差项errorterm=随机扰动项stochast
医咖会免费STATA教程学习笔记——单因素方差分析 Unacandoit stata 单因素方差分析
单因素方差分析和单因素回归分析相同1.单因素方差分析需要满足的假设：（1）因变量为连续变量（2）至少有一个分类变量（大于等于2类）（3）观测值相互独立（4）没有异常值（5）服从正态分布（6）方差齐性2.准备工作（1）导入数据集：webusesystolic,clear（2）检验是否存在异常值：方法一：图形——箱线图——在变量中选择systolic——确定方法二：grahboxsystolic,ov
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
【机器学习笔记Ⅰ】13 正则化代价函数
正则化代价函数（RegularizedCostFunction）详解正则化代价函数是机器学习中用于防止模型过拟合的核心技术，通过在原始代价函数中添加惩罚项，约束模型参数的大小，从而提高泛化能力。以下是系统化的解析：1.为什么需要正则化？过拟合问题：当模型过于复杂（如高阶多项式回归、深度神经网络）时，可能完美拟合训练数据但泛化性能差。解决方案：在代价函数中增加对参数的惩罚，抑制不重要的特征权重。2.
【机器学习笔记Ⅰ】6 多类特征巴伦是只猫机器学习机器学习笔记人工智能
多类特征（Multi-classFeatures）详解多类特征是指一个特征（变量）可以取多个离散的类别值，且这些类别之间没有内在的顺序关系。这类特征是机器学习中常见的数据类型，尤其在分类和回归问题中需要特殊处理。1.核心概念(1)什么是多类特征？定义：特征是离散的、有限的类别，且类别之间无大小或顺序关系。示例：颜色：红、绿、蓝（无顺序）。城市：北京、上海、广州（无数学意义的大小关系）。动物类别：猫
机器学习笔记——支持向量机 star_and_sun 机器学习笔记支持向量机
支持向量机参数模型对分布需要假设（这也是与非参数模型的区别之一）间隔最大化，形式转化为凸二次规划问题最大化间隔间隔最大化是意思：对训练集有着充分大的确信度来分类训练数据，最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢？最终的方法如下1.线性可分的支持向量机的优化目标其实就是找得到分离的的超平面求得参数w和b的值就可以了注意，最大间隔分离超平面是唯一的，间隔叫硬间隔1.1
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts