weixin_34224941

【深度学习与TensorFlow 2.0】卷积神经网络（CNN）

注：在很长一段时间，MNIST数据集都是机器学习界很多分类算法的benchmark。初学深度学习，在这个数据集上训练一个有效的卷积神经网络就相当于学习编程的时候打印出一行“Hello World!”。下面基于与MNIST数据集非常类似的另一个数据集Fashion-MNIST数据集来构建一个卷积神经网络。

0. Fashion-MNIST数据集

MNIST数据集在机器学习算法中被广泛使用，下面这句话能概况其重要性和地位：

In fact, MNIST is often the first dataset researchers try. "If it doesn't work on MNIST, it won't work at all", they said. "Well, if it does work on MNIST, it may still fail on others."

Fashion-MNIST数据集是由ZALANDO实验室制作，发表于2017年。在该数据集的介绍中，列出了MNIST数据集的不足之处：

MNIST太容易了，卷积神经网络可以达到99.7%的正确率，传统的分类算法也能很轻易的达到97%的正确率；

被过度使用了；

不能很好的代表现代计算机视觉任务.

Fashion-MNIST数据集的规格（28×28像素的灰度图片，10个不同类型），数据量（训练集包括60000张图片，测试集包括10000张图片）都与MNIST保持一致。差别是，MNIST的数据是手写数字0-9，Fashion-MNIST的数据是不同类型的衣服和鞋的图片。

下面是该数据集中的标签：

Label	Description
0	T-shirt/top
1	Trouser
2	Pullover
3	Dress
4	Coat
5	Sandal
6	Shirt
7	Sneaker
8	Bag
9	Ankle boot

下面是一些例子：

图0-1：Fashion-MNIST 中的图片示例

为了便于使用，TF 收集了常用的数据集，制作成了一个独立的 Python package。可以通过以下方式安装：

- 更多关于该数据集的信息可参考：https://github.com/tensorflow/datasets

pip install -U tensorflow_datasets

1. 普通神经网络

1.1 导入依赖的包

下面导入了一些必要的 package（包括前面安装的 tensorflow_datasets），并且输出了当前使用的 TensorFlow(TF) 的版本号。如果不是最新的 TF，可以使用下面的命令安装最新的TF。

pip install tensorflow==2.0.0-alpha0  # 安装最新版的TF

 1 from __future__ import absolute_import, division, print_function
 2 
 3 
 4 # Import TensorFlow and TensorFlow Datasets
 5 import tensorflow as tf
 6 import tensorflow_datasets as tfds
 7 
 8 # Helper libraries
 9 import math
10 import numpy as np
11 import matplotlib.pyplot as plt
12 
13 # Improve progress bar display
14 import tqdm
15 import tqdm.auto
16 tqdm.tqdm = tqdm.auto.tqdm
17 
18 
19 print(tf.__version__) # 2.0.0-alpha0
20 
21 # This will go away in the future.
22 # If this gives an error, you might be running TensorFlow 2 or above
23 # If so, the just comment out this line and run this cell again
24 # tf.enable_eager_execution()

1.2 导入数据集

准备就绪，就可以从 tensorflow_datasets 中导入Fashion-MNIST数据集了：

- 加载的过程中，会自动 shuffle 数据；

- 该数据集与MNIST数据集相同，train_dataset 中包含60000张图片用来做训练集，test_dataset 中包含10000张图片用来做测试集.

dataset, metadata = tfds.load('fashion_mnist', as_supervised=True, with_info=True)
train_dataset, test_dataset = dataset['train'], dataset['test']

下面是所有衣服或鞋的名称，其顺序与其前面列出的该数据集的标签顺序相同：

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 
               'Sandal',      'Shirt',   'Sneaker',  'Bag',   'Ankle boot']

可以利用 metadata 来查看数据集的信息：

- 下面会输出训练集和测试集中样本的个数

# metadata包含一些关于该数据集的元信息，包括数据集的description, url, version等信息
num_train_examples = metadata.splits['train'].num_examples
num_test_examples = metadata.splits['test'].num_examples
print("Number of training examples: {}".format(num_train_examples))
print("Number of test examples:     {}".format(num_test_examples))

1.3 数据的预处理

原始数据中图片的每个像素由[0, 255]区间上的整数表示。为了更好的训练模型，需要将所有的值都标准化到区间[0, 1]。

- 经过测试，如果不做这一步，最终在测试集的准确率会下降大概8%。

1 def normalize(images, labels):
2     images = tf.cast(images, tf.float32)  # Casts a tensor to a new type
3     images /= 255
4     return images, labels
5 
6 # The map function applies the normalize function to each element in the train
7 # and test datasets
8 train_dataset =  train_dataset.map(normalize)
9 test_dataset  =  test_dataset.map(normalize)

预处理后的数据同样可以表示一张图片，下面取出测试集中的一张图片并显示：

# Take a single image, and remove the color dimension by reshaping
for image, label in test_dataset.take(1):
    break
# print(image.shape, label.shape)
image = image.numpy().reshape((28,28))

# Plot the image - voila a piece of fashion clothing
plt.figure()
plt.imshow(image, cmap=plt.cm.binary)
plt.colorbar()
plt.grid(False)
plt.show()

图1-1：标准化后的图片

取出训练集中前25张图片：

 1 plt.figure(figsize=(10,10))
 2 i = 0
 3 for (image, label) in train_dataset.take(25):
 4     image = image.numpy().reshape((28,28))
 5     plt.subplot(5,5,i+1)
 6     plt.xticks([])
 7     plt.yticks([])
 8     plt.grid(False)
 9     plt.imshow(image, cmap=plt.cm.binary)
10     plt.xlabel(class_names[label])
11     i += 1
12 plt.show()

图1-2：训练集中前25张图片

1.4 建立模型

准备好数据之后，就可以构建神经网络模型了。主要包括构建网络和编译两部分。

1.4.1 构建网络

在构建网络时需要明确以下参数：

网络中包含的总层数；
每一层的类型：例如Flattten，Dense等；
每一层中包含的神经单元的个数；
每一层使用的激活函数：例如Relu，Softmax等，不设置该参数表示不对该层进行任何非线性变换.

下面时构建网络的代码：

1 model = tf.keras.Sequential([
2     tf.keras.layers.Flatten(input_shape=(28, 28, 1)),
3     tf.keras.layers.Dense(128, activation=tf.nn.relu),
4     tf.keras.layers.Dense(10,  activation=tf.nn.softmax)
5 ])

该网络一共有3层（下面假设仅输入单个样本，即一张图片）：

第一层是Flatten层（下图中的l0），输入的单个样本是一个28*28的矩阵（矩阵每一个元素的值表示图片中对应的一个像素点的值），输出一个长度为784的向量；
第二层是Dense层（下图中的l1），输入是上一层的输出，即长度为784的向量；该层具有128个神经单元，激活函数为Relu；输出为一个长度为128的向量；
第三层是Dense层（下图中的l2），输入是上一层的输出；该层具有10个神经单元，激活函数为Softmax；输出为一个长度为10的向量，也是该网络的输出层.

图1-3：网络的结构

上图中上角标表示层的编号，$\theta$表示各层的参数，$b$表示各层的偏执单元。

1.4.2 编译

网络构建好之后，需要编译。在编译过程中需要确定以下几个参数：

损失函数（Loss function）：评价模型的好坏；
优化器（Optimizer）：根据误差和梯度更新参数，从而最小化误差；
评估标准（Metrics）：同样用于评价模型的好坏.

损失函数与评估标准的异同：

都是评价模型好坏的方式，且具有高度的相关性；
损失函数必须可导，是待训练参数的函数，模型的训练过程就是基于损失函数的优化过程；
评估标准不一定可导，具有更好的可解释性，例如分类问题中分类的准确率.

下面是编译的代码：

model.compile(optimizer='adam', 
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

1.5 训练模型

建立好模型之后，就可以训练模型了。因为是使用梯度下降来训练模型，因此除了训练集，还需要指定两个参数：

批次大小（batch size）：单次训练模型使用的样本数（下面设置该值为32，也就是每次训练只使用全部训练集中的32个样本，使用完所有训练集样本需要训练60000/32=1875次）；
训练迭代次数（epochs）：在整个训练集上训练的次数，如果该值为5且批次大小为32，那么参数总共会更新5*1875次（也就是说训练集中的每张图片会被用到5次）；

下面是训练模型的代码：

BATCH_SIZE = 32
train_dataset = train_dataset.repeat().shuffle(num_train_examples).batch(BATCH_SIZE)
test_dataset = test_dataset.batch(BATCH_SIZE)

model.fit(train_dataset, epochs=5, steps_per_epoch=math.ceil(num_train_examples/BATCH_SIZE))

下面是训练过程中的输出：

Epoch 1/5
1875/1875 [==============================] - 24s 13ms/step - loss: 0.2735 - accuracy: 0.8981
Epoch 2/5
1875/1875 [==============================] - 14s 8ms/step - loss: 0.2719 - accuracy: 0.8995
Epoch 3/5
1875/1875 [==============================] - 14s 8ms/step - loss: 0.2613 - accuracy: 0.9018
Epoch 4/5
1875/1875 [==============================] - 13s 7ms/step - loss: 0.2457 - accuracy: 0.9087
Epoch 5/5
1875/1875 [==============================] - 13s 7ms/step - loss: 0.2407 - accuracy: 0.9091

可以看到随着迭代次数的增加，损失函数的值在下降，分类的准确率在上升。最后该模型在训练集上的分类准确率为90.91%.

1.6 模型的最终评价

前面是在训练集中训练模型，训练的终止条件是人为设定的训练次数。训练停止后，模型在训练集上的分类准确率为91%。如果我们认为现在模型训练已经完成，最后一步就是在测试集上评价模型。测试集中包含的数据是模型之前从未见过新样本，如果在测试集上表现好，说明该模型有很好的泛化能力，学习到了这类数据的本质特征。

test_loss, test_accuracy = model.evaluate(test_dataset, steps=math.ceil(num_test_examples/32))
print('Accuracy on test dataset:', test_accuracy)

下面是输出：

313/313 [==============================] - 2s 6ms/step - loss: 0.3582 - accuracy: 0.8772
Accuracy on test dataset: 0.8772

因为测试集中每批次的大小也是32，因此需要重复10000/32=312.5次来完成整个测试集的测试。最终在测试集中分类准确率为88%，

1.7 使用模型进行预测以及结果的可视化

下面从测试集取一个 batch 的样本（32个样本）进行预测，并将真实的label保存在test_labels中，最终得到第一个样本的预测分类与真实分类都是6.

for test_images, test_labels in test_dataset.take(1):
    test_images = test_images.numpy()
    test_labels = test_labels.numpy()
    predictions = model.predict(test_images)
np.argmax(predictions[0]), test_labels[0]  # (6, 6)

下面对部分结果进行可视化：

 1 def plot_image(i, predictions_array, true_labels, images):
 2     predictions_array, true_label, img = predictions_array[i], true_labels[i], images[i]
 3     plt.grid(False)
 4     plt.xticks([])
 5     plt.yticks([])
 6     
 7     plt.imshow(img[...,0], cmap=plt.cm.binary)
 8 
 9     predicted_label = np.argmax(predictions_array)
10     if predicted_label == true_label:
11         color = 'blue'
12     else:
13         color = 'red'
14     
15     plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
16                                   100*np.max(predictions_array),
17                                   class_names[true_label]),
18                                   color=color)
19 
20 def plot_value_array(i, predictions_array, true_label):
21     predictions_array, true_label = predictions_array[i], true_label[i]
22     plt.grid(False)
23     plt.xticks([])
24     plt.yticks([])
25     thisplot = plt.bar(range(10), predictions_array, color="#777777")
26     plt.ylim([0, 1]) 
27     predicted_label = np.argmax(predictions_array)
28     
29     thisplot[predicted_label].set_color('red')
30     thisplot[true_label].set_color('blue')
31 
32 # Plot the first X test images, their predicted label, and the true label
33 # Color correct predictions in blue, incorrect predictions in red
34 num_rows = 5
35 num_cols = 3
36 num_images = num_rows*num_cols
37 plt.figure(figsize=(2*2*num_cols, 2*num_rows))
38 for i in range(num_images):
39     plt.subplot(num_rows, 2*num_cols, 2*i+1)
40     plot_image(i, predictions, test_labels, test_images)
41     plt.subplot(num_rows, 2*num_cols, 2*i+2)
42     plot_value_array(i, predictions, test_labels)

结果如下：

图1-4：部分结果的可视化

上图中，蓝色字体表示预测正确，蓝色柱状图表示正确的类；红色表示预测错误。

2. 卷积神经网络

前面直接使用全连接层加上激活函数，已经取得了非常好分类效果：测试集的准确率为88%。实现卷积神经网络只需要改动网络的结构（1.4.1 构建网络）这一部分就可以了：

 1 model = tf.keras.Sequential([
 2     tf.keras.layers.Conv2D(32, (3,3), padding='same', activation=tf.nn.relu,
 3                            input_shape=(28, 28, 1)),
 4     tf.keras.layers.MaxPooling2D((2, 2), strides=2),
 5     tf.keras.layers.Conv2D(64, (3,3), padding='same', activation=tf.nn.relu),
 6     tf.keras.layers.MaxPooling2D((2, 2), strides=2),
 7     tf.keras.layers.Flatten(),
 8     tf.keras.layers.Dense(128, activation=tf.nn.relu),
 9     tf.keras.layers.Dense(10,  activation=tf.nn.softmax)
10 ])

此时，除了前面出现过的Flatten和Dense层，还有两种新的层类型：Conv2D和MaxPooling2D.

2.1 卷积层

Conv2D表示二维卷积层（2D convolution layer），主要参数如下：

filters：过滤器（filter或kernal）的个数n，每一个过滤器都可以对上一层的整个图片进行卷积操作，得到n个激活图（activation map）。例如上面的网络结构中第一个卷积层中n=32，表示该层有32个过滤器，因此该层处理后得到的结果的维度是(28, 28, 32)；
kernel_size：过滤器的大小，因为这里使用的图片是灰度图片只有1个channel（彩色图片有3个channel），因此kernal的深度也为1，只需要设定kernal的长和宽。上面两个卷积层都是用了(3, 3)大小的过滤器；
padding：padding的处理方式，如果不padding，过滤后原图片边缘的信息会丢失。本例中该参数都设置为"same"，会在原图像周围补0，从而保持过滤后图像的长宽保持不变；
激活函数：同其他层，用于对神经单元的值做非线性变换.

下面是卷积层处理的示意图：

图2-1 卷积层过滤

上图左边是原图像，中间是过滤器，右边是卷积操作后得到的结果。

本文更多的是介绍利用 TF 2.0 实现神经网络的方式，关于卷积层的更多知识点可以参考下面的链接：

- http://cs231n.stanford.edu/syllabus.html，Convolutional Neural Networks相关部分

- https://jhui.github.io/2017/03/16/CNN-Convolutional-neural-network/

2.2 最大池化层

MaxPooling2D表示2维最大池化层，用于对原图像进行下采用（down sampling），从而减小图片大小，降低训练难度。最大池化操作一般与卷积操作连在一起使用。主要参数如下：

pool_size：池化窗口的大小。例如上面两个最大池化操作的窗口大小都为(2, 2)；
strides：步幅，窗口平移时间隔的距离。例如上面的设置都为2，表示窗口平移时，下一个窗口与上一个窗口间隔两个像素.

图2-2 使用(2, 2)，步幅为2的窗口进行最大池化操作

最大池化就是只保留每个窗口中的最大值。如上图所示，按照(2, 2)的窗口大小和2的步幅，在左边(4, 4)的图像中只有4个窗口，每个窗口取最大值就可以得到右边的结果。

2.3 CNN的位置不变性

卷积神经网络之所以适合处理图片，一个最大的原因就是该算法具有位置不变性。例如进行图像识别时，不管所识别的物体位于图片的哪个位置，都可以准确的识别。这种位置不变性就是卷积操作带来的，因为该操作使用一个小的窗口（kernal）地毯式的扫描了图片各个局部区域。

由卷积层和最大池化层构成的卷积神经网络将 Fashion-MNIST 测试集图片分类的正确率提高到了92%.

3. 小结

构建深度学习模型的一般流程

准备数据集：明确数据的特征、标签和样本总数，将数据集拆分成训练集和测试集（有时候还会包括验证集），数据的预处理（例如标准化等操作）；
定义网络结构：在 Keras 和 TF 2.0 中，层（layer）是网络的基本结构，所有的网络类型都可以使用基本类型的层搭建起来。这里需要确定网络的层数，每一层的类型、激活函数、神经单元的个数等超参数；
编译模型：编译构建好的网络，需要明确三个参数，损失函数（loss function）、优化器（optimizer）和评估标准（metrics）;
训练模型：需要指定批次大小（batch size）和迭代次数（epochs）;
评价模型：在测试集上评价模型的效果.

损失函数的选择

参考：https://keras.io/losses/

两分类：binary crossentropy
对分类问题：categorical crossentropy
回归问题：mean-squared error

优化器的选择

参考：https://keras.io/optimizers/

现在用的比较多的是RMSprop和Adam

度量

参考：https://keras.io/metrics/

Reference

https://github.com/zalandoresearch/fashion-mnist#why-we-made-fashion-mnist

https://arxiv.org/abs/1708.07747

https://medium.com/tensorflow/introducing-tensorflow-datasets-c7f01f7e19f3

https://towardsdatascience.com/a-comprehensive-guide-to-convolutional-neural-networks-the-eli5-way-3bd2b1164a53

https://datascience.stackexchange.com/questions/13663/neural-networks-loss-and-accuracy-correlation

https://keras.io/layers/convolutional/

https://keras.io/layers/pooling/

http://cs231n.stanford.edu/slides/2019/cs231n_2019_lecture05.pdf

https://blogs.nvidia.com/blog/2018/09/05/whats-the-difference-between-a-cnn-and-an-rnn/

https://github.com/OnlyBelter/examples/blob/master/courses/udacity_intro_to_tensorflow_for_deep_learning/l03c01_classifying_images_of_clothing.ipynb，代码

https://github.com/OnlyBelter/examples/blob/master/courses/udacity_intro_to_tensorflow_for_deep_learning/l04c01_image_classification_with_cnns.ipynb，代码

https://github.com/keras-team/keras-docs-zh，一些名词的翻译参考了该文档

Deep Learning with Python, by François Chollet, 2017.11

转载于:https://www.cnblogs.com/Belter/p/10662718.html

【Mybatis】精妙运用动态SQL：精准解决条件判断难题 master_chenchengg sql数据库 mybatis sql 数据库
【Mybatis】精妙运用动态SQL：精准解决条件判断难题一、引言：MySQL与Mybatis在现代开发中的核心地位二、技术概述：Mybatis动态SQL的魔力示例代码：基本的条件判断三、技术细节：动态SQL的实现原理与挑战四、实战应用：复杂查询条件的处理应用场景问题与解决方案五、优化与改进潜在问题与性能瓶颈优化建议六、常见问题与解决方案问题1：动态SQL导致的N+1查询问题问题2：SQL注入风险
列出从出生到现在最伟大的创造和显化成就宇宙的宠儿艳宝
1高三复读，考上大学，每天在床前写上“我轻松顺利考上大学”2转系到心理学，这是我一直想要的3坐月子考上公务员，每天观想梦想实现4观想轻松顺利做老师，梦想实现5观想轻松舒适的工作环境，目前已实现6观想与金钱相亲相爱，后天就拿到别墅的钥匙，7观想自己有一辆车，并会开车，梦想已实现8观想老公的工作做秘书，已实现很多年
直返模式是什么?它是如何运作的? 氧惠购物达人
直返是一个购物返利平台，用户可以在该平台上购物并获得一定比例的返利。直返APP与各大电商平台合作，用户在平台上选择需要购买的商品，然后通过直返APP跳转到对应的电商平台进行购买。氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元
12、Rust 特性：多种形式与应用 Linux 精通Rust：从入门到实践 Rust 特性 Trait
Rust特性：多种形式与应用在Rust编程中，特性（trait）是一项强大的工具，它可以让我们定义一组行为，并让不同的类型来实现这些行为。特性有多种形式，下面我们来详细了解一下。1.特性的多种形式特性有多种不同的形式，每种形式都有其特定的用途和优势。1.1标记特性（Markertraits）标记特性定义在std::marker模块中，它们没有任何方法，只是简单地声明一个名称，用于标记一个类型属于某
探索未来游戏开发的新纪元 —— 使用Rust与Bevy引擎的《Rust Invaders》项目解析林泽炯
探索未来游戏开发的新纪元——使用Rust与Bevy引擎的《RustInvaders》项目解析rust-invadersSimpleRUSTgamewiththeBevyEngine项目地址:https://gitcode.com/gh_mirrors/ru/rust-invaders在游戏开发的浩瀚星海中，一款能够激发开发者创造力和提升效率的引擎至关重要。今天，我们要向您隆重推荐一个基于Rust编
应用集成体系深度解析：从数据互通到流程协同
一、应用集成核心概念框架应用集成功能互操作业务逻辑驱动异构系统协同语义互理解协议兼容1.本质定义核心内涵：多个应用系统基于业务逻辑的功能级互操作关键特征：业务逻辑驱动的功能调用（非简单数据传递）双向/多向的交互式通信实时或近实时的响应机制与传统集成区别：数据集成静态数据迁移字段映射应用集成动态功能协同服务调用二、分层支撑体系1.基础支撑层层级功能技术实现关键指标网络集成物理连通性TCP/IP,VL
对于没有怎么上过学的年轻人来说，难道就真的没有就业机会了吗？了然予心
都说知识改变命运，这话本身没有任何错误，也的确可以称之为一条真理，人们可以通过获取知识的方式走出大山，看到山另一边的风景；也可以通过知识获取地位和财富，以及宝贵的人生阅历与经验。然而不论知识的力量有多么强大，到目前为止也不是每一个人都能获取知识，并用知识的力量去武装自己。这其中有出生环境的影响，比如说偏远山区的孩子，即使是有希望小学的地区，可教育资源的缺乏与差异仍旧存在；也有家庭教育的影响，比如说
昇思MindSpore创新训练营·长三角站开始报名！昇思MindSpore 人工智能自然语言处理深度学习
一、介绍为充分发挥长三角研究型大学联盟教学实践基地共建共享功能，加强华东高校优秀青年学子的交流与互动，提供学生与产业界接触的机会，上海交通大学与华为技术有限公司共同发起，面向长三角研究型大学学生开设昇思MindSpore创新训练营。本次训练营以实践项目和业界需求为牵引，以学生实践为主线，让学生在实践的过程中学习和实践人工智能相关知识，掌握相关技术和工具，紧跟业界最新趋势，加深对人工智能行业的认识，
[数据结构]#2 链表
有关顺序表与链表的操作，简而言之就是四个字——增、删、改、查。在上一篇文章，我们提到顺序表的插入与删除https://blog.csdn.net/Marvinem13/article/details/148900187?fromshare=blogdetail&sharetype=blogdetail&sharerId=148900187&sharerefer=PC&sharesource=Mar
LangChain4j：Java开发者的AI应用构建利器 | 1. 实战：构建AI对话应用秋秋棠人工智能 java 大数据
LangChain4j：Java开发者的AI应用构建利器目录LangChain4j简介LangChain4jvsSpringAI：JavaAI框架对比实战：构建AI对话应用环境搭建配置大模型核心服务实现深入ChatModel：灵活配置与应用框架选择建议LangChain4j简介LangChain4j是专为Java开发者设计的AI应用开发框架，它提供了开箱即用的API和模块化设计，让开发者能够快速构
MyBatis深度解析：从原理到实战的ORM框架指南秋秋棠 Java全栈 mybatis java
MyBatis深度解析：从原理到实战的ORM框架指南一、MyBatis核心概念1.1ORM框架的本质对象关系映射（ORM）是连接面向对象编程与关系型数据库的桥梁，它实现了：数据库表↔Java类的映射表记录↔对象实例的映射表字段↔对象属性的映射以用户表为例：idusernamepasswordage1zhangsan123456252lisiabcdef30对应的Java实体类：publicclas
Python爬虫实战：高效提取与解析JSON格式数据 Python爬虫项目 python 爬虫宽度优先数据库 json 深度优先开发语言
1.JSON数据爬取概述在当今互联网时代，JSON(JavaScriptObjectNotation)已成为最流行的数据交换格式之一。相比传统的HTML页面，JSON格式数据具有结构清晰、体积小、解析方便等优势，使得它成为API接口的首选数据格式。1.1为什么选择JSON数据爬取数据结构化：JSON数据本身就是结构化的，不需要像HTML那样进行复杂的解析传输高效：JSON通常比HTML体积小，传输
【AI论文】CLiFT：面向计算高效与自适应神经渲染的压缩光场标记
摘要：本文提出了一种神经渲染方法，该方法将场景表示为“压缩光场标记（CLiFTs）”，以保留场景丰富的外观和几何信息。CLiFT通过压缩标记实现计算高效的渲染，同时能够通过调整标记数量来表征场景，或利用单个训练好的网络渲染新视角。具体而言，给定一组图像，多视图编码器会根据相机位姿对图像进行标记化处理。潜在空间K均值聚类算法利用这些标记选取一组精简的光线作为聚类中心。随后，多视图“压缩器”将所有标记
2023-7-7晨间日记德三努
今天是什么日子起床：6：00就寝：23：00天气：晴心情：好纪念日：叫我起床的不是闹钟是梦想年度目标及关键点：勤学习，勤工作，勤锻炼本月重要成果：卧薪尝胆，闻鸡起舞今日三只青蛙/番茄钟成功日志-记录三五件有收获的事务努力完成各项工作。财务检视人际的投入开卷有益-学习/读书/听书听书60分钟健康与饮食今日步数：7102今日锻炼：走路今日饮食：按时吃饭一日三餐。好习惯打卡1、按时吃饭一日三餐。2、按时
真相曝光：佛萨奇Force原力元宇宙背后的故事和经济模型口碑信息传播者
在数字化的浪潮中，佛萨奇2.0以其创新的智能合约系统，成为行业的焦点。不仅延续了经典的矩阵模式，还引入了NFT、BOOST矩阵、元宇宙等全新元素，展现出它对未来数字生态的深远布局。特别是结合NFT，佛萨奇2.0激发了无限的想象和可能。13分钟视频彻底弄明白佛萨奇Force原力元宇宙项目是什么佛萨奇2.0：智能合约的核心佛萨奇2.0的核心在于其智能合约系统。智能合约是存储在区块链上的自动执行程序，当
Spring - BeanFactory 和 ApplicationContext 有什么区别撸帝
学习完整课程请移步互联网Java全栈工程师BeanFactory可以理解为含有bean集合的工厂类。BeanFactory包含了种bean的定义，以便在接收到客户端请求时将对应的bean实例化。BeanFactory还能在实例化对象的时生成协作类之间的关系。此举将bean自身与bean客户端的配置中解放出来。BeanFactory还包含了bean生命周期的控制，调用客户端的初始化方法（initia
我与你的过往(3.21) 想看你的风
嗨，最近时常会陷入两种交替的状态，一方面会想要我质问你，为什么要放开我的手？我们再坚持坚持不好么？一方面又会责怪我自己，既然你已经放手了，我应该祝你幸福，毕竟我们没有未来了。可是这一切的一切在昨天我那些疯狂的举动背后，这又是什么?想着你会经过哪里，开着车飞驰，看到你的车超级开心，却在见到你之后心痛。想多和你说一句话，所以会反问。嗨，你去结婚吧，大概我会死心的
自媒体写作如何才能坚持下去？看我踩过的坑总结出这几条经验笑的心灵之旅
壹前阵子经过持续地输出文章，我拿到了某平台的原创功能。曾经我很希望能拿到它，可是拿到它以后，突然失去了创作的灵感和动力。不知道该写什么了。看着自己那少的可怜的阅读量，我决定加入一个写作群，了解一下互联网文章的写法。结果，整个人不好了。整个群组充满了焦虑与狂热，大家都羡慕着别人的爆款文带来的巨大流量和利益，恨不得自己马上写出个10w+，走上人生巅峰。不得不说，我被群里氛围带动了。只不过我是默默地退了
剧本杀《福尔摩斯之梅特弗斯探案记》复盘详细解析+凶手角色剧透答案真相 VX搜_小燕子复盘
为了你获得更好的游戏体验，本文仅显示《福尔摩斯之梅特弗斯探案记》剧本杀部分真相复盘，获取完整真相复盘只需两步①【微信关注公众号：集美复盘】②回复【福尔摩斯之梅特弗斯探案记】即可查看获取哦﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎﹎1、剧本杀《福尔摩斯之梅特弗斯探案记》角色介绍这天早晨，华生与福尔摩斯在餐桌前用着早餐。“你看这几个家伙，跟在伦敦贝克街的时候都没有什
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
痛苦与不甘，也许是通往成功殿堂的钥匙(八十一) 风之舞555
十年前，一个巴西人背起了小他七岁的阿根廷少年，恣意地向诺坎普球场的10万球迷分享的他的喜悦；十年后，曾经那个青涩的阿根廷少年已经成为这里新的主人，他身着巴西人留下的10号球衣，背起了小他五岁的巴西人。这就是传承，这就是体育赛场上的传承！在梅西内心里，非常想把当年小罗对待自己的故事在内马尔身上重演。而随着2014年夏天乌拉圭人苏亚雷斯加盟巴萨，巴萨一条全新的锋线组合正式成形。这条大杀四方、威震赛场的
大模型在2型糖尿病性酮症预测及临床方案制定中的应用研究 LCG元围术期危险因子预测模型研究人工智能 python 深度学习
目录一、引言1.1研究背景与意义1.2研究目的与创新点二、2型糖尿病性酮症相关理论基础2.12型糖尿病性酮症概述2.1.1定义与发病机制2.1.2临床表现与危害2.1.3诊断标准与鉴别诊断2.2大模型技术原理及在医疗领域的应用潜力2.2.1大模型的基本原理和特点2.2.2在医疗领域的应用现状和优势三、大模型在2型糖尿病性酮症术前风险预测的应用3.1数据收集与预处理3.1.1数据来源3.1.2数据清
大规模图计算引擎的分区与通信优化：负载均衡与网络延迟的解决方案 LCG元系统服务架构负载均衡网络运维
目录一、系统架构设计与核心流程1.1原创架构图解析1.2双流程对比分析二、分区策略优化实践2.1动态权重分区算法实现（Python）三、通信优化机制实现3.1基于RDMA的通信层实现（TypeScript）四、性能对比与调优4.1分区策略基准测试五、生产级部署方案5.1Kubernetes部署配置（YAML）5.2安全审计配置六、技术前瞻与演进附录：完整技术图谱一、系统架构设计与核心流程1.1原创
没骨花卉画法之牡丹花与石榴花郑辉贤国学艺术
牡丹花画法步骤步骤一：牡丹素以雍容华贵著称，画前当思其高贵典雅之风神。花瓣色彩虽富丽，但是应做到艳而不俗。步骤二：花瓣以洋红、曙红调和成一种主调色，暗部可加入少许胭脂、花青、草绿等。由于牡丹花瓣较大，有些部位可使用接染的方法，即一支笔蘸淡曙红画根部，后以淡洋红趁湿接染画出花瓣形状。最后趁湿注粉，待干后粉浮于色彩之上，熠熠生辉。步骤三：三叉九顶是牡丹叶子的斟酌特征，绘画时应当谙。同时也要注意叶子的反
2025年前端 Vue 开发工程师完整技术路线 Mr.小海前端 vue.js javascript 前端框架 html5 node.js 正则表达式
文章目录前端Vue开发工程师完整技术路线一、基础阶段（入门级）1.基础语言与工具2.Vue3基础3.实践项目二、进阶阶段（中级）1.Vue深度掌握2.工具链与工程化3.网络请求与接口联调4.实践项目三、高级阶段（专家级）1.高级Vue技术2.性能与安全优化3.微前端与架构设计4.实践项目四、资深阶段（架构师/技术负责人）1.技术领导力2.行业深度3.工具链与自动化4.实践项目五、技术栈总结六、建议
真正成熟的人是怎样处理亲密关系的？心灵之音的空间
真正成熟的人是怎样处理亲密关系的呢？在开始这个话题之前，我们可能都想过，我们都向往成熟。什么是成熟？在我理解肯定是与幼稚是相反的了。那么什么是幼稚？幼稚的定义按照曲伟杰老师的话就是我们的情绪，想法和行动是绑在一起的。比如他饿了就会哭，他不会体谅别人的感受。那么成年人饿了，他不会去哭，他会去找吃的，他会去做吃的，如果对方也饿了，他会做出对方那一份。我们人都是从幼稚不断走向成熟的。我们会去考虑说话的方
2025年最流行跑分最高的图片理解大模型调研报告
2025年最流行跑分最高的图片理解大模型调研报告引言当前，图片理解大模型正处于快速演进阶段，其技术发展呈现多维度深化与融合的特征。从技术演进方向来看，多模态融合已成为核心趋势之一，文本、图像、视频等不同模态的交互与协同能力显著提升。大型视觉-语言模型（LVLMs）作为人工智能领域的重要突破，标志着多模态理解与交互进入变革性发展阶段，尽管当前模型在各类任务中表现出色，但在细粒度视觉任务等基础能力层面
用Python实现神经网络(四)
使用多层神经网络我们展示如何用TensorFlow构建多层神经网络###低出生率数据LowBirthratedata:#Columns Variable Abbreviation#---------------------------------------------------------------------#Lo
NFV中：DPDK与SR-IOV应用场景及性能对比 lingshengxiyou 网络 linux c++虚拟机运维
DPDK与SR-IOV两者目前主要用于提高IDC（数据中心）中的网络数据包的加速。但是在NFV（网络功能虚拟化）场景下DPDK与SR-IOV各自的使用场景是怎样的？以及各自的优缺点？本文主要通过从以下几点来阐述这个问题：1、什么是DPDK？2、什么是SR-IOV？3、DPDK与SR-IOV有何不同？4、DPDK与SR-IOV各自适合的应用场景是怎样的？1、什么是DPDK？DPDK（DataPlan
算法单链的创建与删除换个号韩国红果果 c 算法
先创建结构体 struct student { int data; //int tag;//标记这是第几个 struct student *next; }; // addone 用于将一个数插入已从小到大排好序的链中 struct student *addone(struct student *h,int x){ if(h==NULL) //??????
《大型网站系统与Java中间件实践》第2章读后感白糖_ java中间件
断断续续花了两天时间试读了《大型网站系统与Java中间件实践》的第2章，这章总述了从一个小型单机构建的网站发展到大型网站的演化过程---整个过程会遇到很多困难，但每一个屏障都会有解决方案，最终就是依靠这些个解决方案汇聚到一起组成了一个健壮稳定高效的大型系统。看完整章内容，
zeus持久层spring事务单元测试 deng520159 java DAO spring jdbc
今天把zeus事务单元测试放出来,让大家指出他的毛病, 1.ZeusTransactionTest.java 单元测试 package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Test; import
Rss 订阅开发周凡杨 html xml 订阅 rss 规范
RSS是 Really Simple Syndication的缩写（对rss2.0而言，是这三个词的缩写，对rss1.0而言则是RDF Site Summary的缩写，1.0与2.0走的是两个体系）。 RSS
分页查询实现 g21121 分页查询
在查询列表时我们常常会用到分页，分页的好处就是减少数据交换，每次查询一定数量减少数据库压力等等。按实现形式分前台分页和服务器分页：前台分页就是一次查询出所有记录，在页面中用js进行虚拟分页，这种形式在数据量较小时优势比较明显，一次加载就不必再访问服务器了，但当数据量较大时会对页面造成压力，传输速度也会大幅下降。服务器分页就是每次请求相同数量记录，按一定规则排序，每次取一定序号直接的数据
spring jms异步消息处理 510888780 jms
spring JMS对于异步消息处理基本上只需配置下就能进行高效的处理。其核心就是消息侦听器容器，常用的类就是DefaultMessageListenerContainer。该容器可配置侦听器的并发数量，以及配合MessageListenerAdapter使用消息驱动POJO进行消息处理。且消息驱动POJO是放入TaskExecutor中进行处理，进一步提高性能，减少侦听器的阻塞。具体配置如下：
highCharts柱状图布衣凌宇 hightCharts 柱图
第一步：导入 exporting.js,grid.js,highcharts.js;第二步：写controller @Controller@RequestMapping(value="${adminPath}/statistick")public class StatistickController { private UserServi
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans spring mvc Spring 教程 spring3 教程 Spring 入门
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
TLS java简单实现 antlove java ssl keystore tls secure
1. SSLServer.java package ssl; import java.io.FileInputStream; import java.io.InputStream; import java.net.ServerSocket; import java.net.Socket; import java.security.KeyStore; import
Zip解压压缩文件百合不是茶 Zip格式解压 Zip流的使用文件解压
ZIP文件的解压缩实质上就是从输入流中读取数据。Java.util.zip包提供了类ZipInputStream来读取ZIP文件,下面的代码段创建了一个输入流来读取ZIP格式的文件; ZipInputStream in = new ZipInputStream(new FileInputStream(zipFileName)); &n
underscore.js 学习（一） bijian1013 JavaScript underscore
工作中需要用到underscore.js，发现这是一个包括了很多基本功能函数的js库，里面有很多实用的函数。而且它没有扩展 javascript的原生对象。主要涉及对Collection、Object、Array、Function的操作。学
java jvm常用命令工具——jstatd命令(Java Statistics Monitoring Daemon) bijian1013 java jvm jstatd
1.介绍 jstatd是一个基于RMI（Remove Method Invocation）的服务程序，它用于监控基于HotSpot的JVM中资源的创建及销毁，并且提供了一个远程接口允许远程的监控工具连接到本地的JVM执行命令。 jstatd是基于RMI的，所以在运行jstatd的服务
【Spring框架三】Spring常用注解之Transactional bit1129 transactional
Spring可以通过注解@Transactional来为业务逻辑层的方法(调用DAO完成持久化动作)添加事务能力，如下是@Transactional注解的定义： /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version
我(程序员)的前进方向 bitray 程序员
作为一个普通的程序员,我一直游走在java语言中,java也确实让我有了很多的体会.不过随着学习的深入,java语言的新技术产生的越来越多,从最初期的javase,我逐渐开始转变到ssh,ssi,这种主流的码农,.过了几天为了解决新问题,webservice的大旗也被我祭出来了,又过了些日子jms架构的activemq也开始必须学习了.再后来开始了一系列技术学习,osgi,restful.....
nginx lua开发经验总结 ronin47
使用nginx lua已经两三个月了，项目接开发完毕了，这几天准备上线并且跟高德地图对接。回顾下来lua在项目中占得必中还是比较大的，跟PHP的占比差不多持平了，因此在开发中遇到一些问题备忘一下 1：content_by_lua中代码容量有限制，一般不要写太多代码，正常编写代码一般在100行左右（具体容量没有细心测哈哈，在4kb左右），如果超出了则重启nginx的时候会报 too long pa
java-66-用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。颠倒之后的栈为{5,4,3,2,1}，5处在栈顶 bylijinnan java
import java.util.Stack; public class ReverseStackRecursive { /** * Q 66.颠倒栈。 * 题目：用递归颠倒一个栈。例如输入栈{1,2,3,4,5}，1在栈顶。 * 颠倒之后的栈为{5,4,3,2,1}，5处在栈顶。 *1. Pop the top element *2. Revers
正确理解Linux内存占用过高的问题 cfyme linux
Linux开机后，使用top命令查看，4G物理内存发现已使用的多大3.2G，占用率高达80%以上： Mem: 3889836k total, 3341868k used, 547968k free, 286044k buffers Swap: 6127608k total,&nb
[JWFD开源工作流]当前流程引擎设计的一个急需解决的问题 comsci 工作流
当我们的流程引擎进入IRC阶段的时候，当循环反馈模型出现之后，每次循环都会导致一大堆节点内存数据残留在系统内存中，循环的次数越多，这些残留数据将导致系统内存溢出，并使得引擎崩溃。。。。。。而解决办法就是利用汇编语言或者其它系统编程语言，在引擎运行时，把这些残留数据清除掉。
自定义类的equals函数 dai_lm equals
仅作笔记使用 public class VectorQueue { private final Vector<VectorItem> queue; private class VectorItem { private final Object item; private final int quantity; public VectorI
Linux下安装R语言 datageek R语言 linux
命令如下：sudo gedit /etc/apt/sources.list1、deb http://mirrors.ustc.edu.cn/CRAN/bin/linux/ubuntu/ precise/ 2、deb http://dk.archive.ubuntu.com/ubuntu hardy universesudo apt-key adv --keyserver ke
如何修改mysql 并发数(连接数)最大值 dcj3sjt126com mysql
MySQL的连接数最大值跟MySQL没关系，主要看系统和业务逻辑了方法一：进入MYSQL安装目录打开MYSQL配置文件 my.ini 或 my.cnf查找 max_connections=100 修改为 max_connections=1000 服务里重起MYSQL即可　　方法二：MySQL的最大连接数默认是100客户端登录：mysql -uusername -ppass
单一功能原则 dcj3sjt126com 面向对象的程序设计软件设计编程原则
单一功能原则[ 编辑] SOLID 原则单一功能原则开闭原则 Liskov代换原则接口隔离原则依赖反转原则查论编在面向对象编程领域中，单一功能原则（Single responsibility principle）规定每个类都应该有
POJO、VO和JavaBean区别和联系 fanmingxing VO POJO javabean
POJO和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Plain Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比POJO复杂很多，JavaBean是一种组件技术，就好像你做了一个扳子，而这个扳子会在很多地方被
SpringSecurity3.X--LDAP：AD配置 hanqunfeng SpringSecurity
前面介绍过基于本地数据库验证的方式，参考http://hanqunfeng.iteye.com/blog/1155226，这里说一下如何修改为使用AD进行身份验证【只对用户名和密码进行验证，权限依旧存储在本地数据库中】。将配置文件中的如下部分删除：
mac mysql 修改密码 IXHONG mysql
$ sudo /usr/local/mysql/bin/mysqld_safe –user=root & //启动MySQL(也可以通过偏好设置面板来启动)$ sudo /usr/local/mysql/bin/mysqladmin -uroot password yourpassword //设置MySQL密码（注意，这是第一次MySQL密码为空的时候的设置命令，如果是修改密码，还需在-
设计模式--抽象工厂模式 kerryg 设计模式
抽象工厂模式：工厂模式有一个问题就是，类的创建依赖于工厂类，也就是说，如果想要拓展程序，必须对工厂类进行修改，这违背了闭包原则。我们采用抽象工厂模式，创建多个工厂类，这样一旦需要增加新的功能，直接增加新的工厂类就可以了，不需要修改之前的代码。总结：这个模式的好处就是，如果想增加一个功能，就需要做一个实现类，
评"高中女生军训期跳楼” nannan408
首先，先抛出我的观点，各位看官少点砖头。那就是，中国的差异化教育必须做起来。孔圣人有云：有教无类。不同类型的人，都应该有对应的教育方法。目前中国的一体化教育，不知道已经扼杀了多少创造性人才。我们出不了爱迪生，出不了爱因斯坦，很大原因，是我们的培养思路错了，我们是第一要“顺从”。如果不顺从，我们的学校，就会用各种方法，罚站，罚写作业，各种罚。军
scala如何读取和写入文件内容？ qindongliang1922 java jvm scala
直接看如下代码： package file import java.io.RandomAccessFile import java.nio.charset.Charset import scala.io.Source import scala.reflect.io.{File, Path} /** * Created by qindongliang on 2015/
C语言算法之百元买百鸡 qiufeihu c 算法
中国古代数学家张丘建在他的《算经》中提出了一个著名的“百钱买百鸡问题”，鸡翁一，值钱五，鸡母一，值钱三，鸡雏三，值钱一，百钱买百鸡，问翁，母，雏各几何？代码如下： #include <stdio.h> int main() { int cock,hen,chick; /*定义变量为基本整型*/ for(coc
Hadoop集群安全性：Hadoop中Namenode单点故障的解决方案及详细介绍AvatarNode wyz2009107220 NameNode
正如大家所知，NameNode在Hadoop系统中存在单点故障问题，这个对于标榜高可用性的Hadoop来说一直是个软肋。本文讨论一下为了解决这个问题而存在的几个solution。 1. Secondary NameNode 原理：Secondary NN会定期的从NN中读取editlog，与自己存储的Image进行合并形成新的metadata image 优点：Hadoop较早的版本都自带，