大树先生的博客

卷积神经网络CNN-基础

卷积神经网络CNN-基础

1. 链式反向梯度传导

链式法则的计算

y = f (x) ， z = g (y) \partial z \partial x = \partial z \partial y \cdot \partial y \partial x

简单函数的例子

f (x, y, z) = (x + y) \cdot z

记：

q=x+y，f=q⋅z 。
则有：

\partial f \partial z = q ， \partial f \partial q = z \partial q \partial x = 1 ， \partial q \partial y = 1

卷积神经网络CNN-基础_第1张图片

函数

f 对自己的导数为1，上面的数字代表各层传递的值。

卷积神经网络CNN-基础_第2张图片

从后向前反向传播，得到反向梯度传导的导数值。

layer融合的过程中，如果layer是相加的，则直接传递导数；如果是相乘，则相互交换导数。

复杂函数的例子

f (x, y, w) = 1 exp { - [ ( x 1 + x 2 ) w + max ( y 1 , y 2 ) ] }

卷积神经网络CNN-基础_第3张图片

卷积神经网络CNN-基础_第4张图片

对每层的导数（

Δy，Δx ）结果进行存储，用于下一层的导数计算。

2. 卷积层

卷积层的定义

卷积层由多个卷积核组合形成，每个卷积核同输入数据进行卷积运算，形成新的特征图。

卷积神经网络CNN-基础_第5张图片

每一个卷积核，仅产生一层特征图。有多少个卷积核，下一层便产生特征图的“厚度“即为对应的个数。

卷积核

同输入数据进行计算的二维（一维，三维）算子；
其大小有用户定义，其深度根据输入的数据深度大小确定；
卷积核的“矩阵”值，便为卷积神经网络的参数，及网络需要学习的参数；
卷积核初值随机生成，通过反向传播进行更新。
-

卷积层关键参数

卷积核的大小：
- 一般卷积核会选择奇数，满足对称，偶数也可以；
- 一般会选择卷积核小一些，层数多一些的结构来建立卷积神经网络模型。
- 1×1×n大小的卷积核可以用做特殊的降维处理。 **
- 卷积核的“厚度”与前一层输入数据的“厚度”保持一致；
- 一般卷积核会覆盖全部输入，特殊情况下覆盖局部区域。
步长
步长（stride）表示对输入特征图的扫描间隔对输出特征图的影响。
步长大的情况相当于在卷积的过程中做了池化。
边界扩充（pad）
在卷积计算过程中，为了允许边界上的数据也能作为中心参与卷积运算，将边界假装延伸。
- 扩充的目的是为了确保卷积后特征图尺度一致；
- 卷积核的宽度为 2i+1 ，则添加pad的宽度为 i 。
卷积神经网络的“宽度”
一般常见的参数为64、128、256。主要是为了GPU并行计算，使得训练过程更加高效。

卷积网络

卷积网络的参数计算
- Num： n×3×3×m ， n 个 3×3×m 大小的卷积核。
- 与传统的神经网络相比，其参数的数量会减少，但是其计算量会增加。
正向传播（Forward Propagation）
反向传播（Back Propagation）

3. 功能层

卷积神经网络需要的一些额外功能：
* 非线性激励：卷积是线性运算，增加非线性描述的能力；
* 降维：特征图稀疏，减少数据运算量，保持精度；
* 归一化：特征的scale保持一致；
* 区域分割：不同区域进行独立学习；
* 区域融合：对分开的区域进行合并，方便信息融合；
* 增维：增加图片生成或探测任务中空间信息。

非线性激励层

在输入的特征图和卷积核卷积的过程中，每一次卷积计算都会生成特征图的一个值，卷积计算为线性运算，需要将所得结果输入非线性激励函数中，得到一个非线性值，增加非线性描述的能力。
一般会使用ReLU函数，相当于选取 XW 和 0 两者之间的最大值。

卷积神经网络CNN-基础_第7张图片

池化层

数据降维，方便计算和存储；
池化过程中，每张特征图单独降维。

归一化层

在计算的过程中，中间层部分激励不平等，则对数据进行归一化。某种程度上可以减少梯度衰减。

批量归一化Batch Normalization(BN)
- 可以加速训练过程，提高精度。
近邻归一化Local Response Normalization

xi=xi(k+(α∑jx2j))β

与BN的区别：
- BN依据mini batch的数据，近邻归一化仅需要自身；
- BN训练中有学习参数。

切分层

在某些应用中，希望独立对某些区域单独学习。
其好处是，学习多套参数，其具有更强的特征描述能力。

融合层

对独立进行特征学习的分支进行融合，构建高效且精简的特征组合。
例如：GoogleLeNet 的基本模块用多种分辨率对目标特征进行学习，之后进行多分辨率特征的融合。

卷积神经网络CNN-基础_第9张图片

级连 - concatenation
不同输入网络特征简单叠加。
合并 - 运算融合形状一致的特征层，通过（+，-，X， max，conv）运算，形成形状相同的输出。
ResNet的融合：

4. 卷积神经网络MNIST

下面还是利用mnist数据集，利用卷积神经网络进行手写字体的识别。

代码

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

import tensorflow as tf

# Parameters
learning_rate = 0.001
training_epochs = 30
batch_size = 100
display_step = 1

# Network Parameters
n_input = 784 # MNIST data input (img shape: 28*28)
n_classes = 10 # MNIST total classes (0-9 digits)

# tf Graph input
x = tf.placeholder("float", [None, n_input])
y = tf.placeholder("float", [None, n_classes])

#pre-define the  
def conv2d(x, W):
  return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')

def max_pool_2x2(x):
  return tf.nn.max_pool(x, ksize=[1, 2, 2, 1],
                        strides=[1, 2, 2, 1], padding='SAME')


# Create model
def multilayer_perceptron(x, weights, biases):
    #now, we want to change this to a CNN network

    #first reshape the data to 4-D
    x_image = tf.reshape(x, [-1,28,28,1])

    #then apply cnn layers

    h_conv1 = tf.nn.relu(conv2d(x_image, weights['conv1']) + biases['conv_b1'])
    h_pool1 = max_pool_2x2(h_conv1)

    h_conv2 = tf.nn.relu(conv2d(h_pool1, weights['conv2']) + biases['conv_b2'])
    h_pool2 = max_pool_2x2(h_conv2)

    h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])
    h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, weights['fc1']) + biases['fc1_b'])


    # Output layer with linear activation
    out_layer = tf.matmul(h_fc1, weights['out']) + biases['out_b']
    return out_layer

# Store layers weight & biases
weights = {
    'conv1': tf.Variable(tf.random_normal([5, 5, 1, 32])),
    'conv2': tf.Variable(tf.random_normal([5, 5, 32, 64])),
    'fc1' : tf.Variable(tf.random_normal([7*7*64,256])),
    'out': tf.Variable(tf.random_normal([256,n_classes]))
}
biases = {
    'conv_b1': tf.Variable(tf.random_normal([32])),
    'conv_b2': tf.Variable(tf.random_normal([64])),
    'fc1_b': tf.Variable(tf.random_normal([256])),
    'out_b': tf.Variable(tf.random_normal([n_classes]))
}

# Construct model
pred = multilayer_perceptron(x, weights, biases)

# Define loss and optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=pred, labels=y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)

# Initializing the variables
init = tf.global_variables_initializer()

# Launch the graph
with tf.Session() as sess:
    sess.run(init)

    # Training cycle
    for epoch in range(training_epochs):
        avg_cost = 0.
        total_batch = int(mnist.train.num_examples/batch_size)
        # Loop over all batches
        for i in range(total_batch):
            batch_x, batch_y = mnist.train.next_batch(batch_size)
            # Run optimization op (backprop) and cost op (to get loss value)
            _, c = sess.run([optimizer, cost], feed_dict={x: batch_x,
                                                          y: batch_y})
            # Compute average loss
            avg_cost += c / total_batch
        # Display logs per epoch step
        if epoch % display_step == 0:
            print("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(avg_cost))
    print("Optimization Finished!")

    # Test model
    correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
    # Calculate accuracy
    accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
    print("Accuracy:", accuracy.eval({x: mnist.test.images, y: mnist.test.labels}))

关键代码解释

1.：tf.nn.conv2d

tf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None)

除去name参数用以指定该操作的name，与方法有关的一共五个参数：

第一个参数input：指需要做卷积的输入图像，它要求是一个Tensor，具有[batch, in_height, in_width, in_channels]这样的shape，具体含义是[训练时一个batch的图片数量, 图片高度, 图片宽度, 图像通道数]，注意这是一个4维的Tensor，要求类型为float32和float64其中之一；
第二个参数filter：相当于CNN中的卷积核，它要求是一个Tensor，具有[filter_height, filter_width, in_channels, out_channels]这样的shape，具体含义是[卷积核的高度，卷积核的宽度，图像通道数，卷积核个数]，要求类型与参数input相同，有一个地方需要注意，第三维in_channels，就是参数input的第四维；
第三个参数strides：卷积时在图像每一维的步长，这是一个一维的向量，长度4；对于图片，因为只有两维，通常strides取[1，stride，stride，1]；
第四个参数padding：string类型的量，只能是”SAME”,”VALID”其中之一，这个值决定了不同的卷积方式。’SAME’时，表示卷积核可以停留在图像边缘，即图片的大小不会因为卷积运算而变小；’VALID’时，表示卷积核不能停留在图像边缘，即会因为卷积运算图片的大小会缩小；
第五个参数：use_cudnn_on_gpu :bool类型，是否使用cudnn加速，默认为true。
结果返回一个Tensor，这个输出，就是我们常说的feature map.

2.：tf.nn.max_pool

tf.nn.max_pool(value, ksize, strides, padding, name=None)

第一个参数value：需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape；
第二个参数ksize：池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1；
第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]；
第四个参数padding：和卷积类似，可以取’VALID’ 或者’SAME’。
返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式。

3.：tf.reshape

tf.reshape(tensor, shape, name=None)

函数的作用是将tensor变换为参数shape的形式。
其中shape为一个列表形式，特殊的一点是列表中可以存在-1。-1代表的含义是不用我们自己指定这一维的大小，函数会自动计算，但列表中只能存在一个-1。

版权声明：本博客为博主学习网课《深度学习》课程总结，博文图片均为课程PPT图片。
同时，本文为博主原创文章，博客地址：http://blog.csdn.net/koala_tree，未经博主允许不得转载。

你可能感兴趣的:(Deep,Learning)

Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
一文读懂：AI 工具 Cursor、DeepSeek 和 Copilot 的区别与使用方法 AI云极【AI智能系列】人工智能 copilot
在人工智能技术迅猛发展的今天，各类AI工具层出不穷，为编程、搜索、写作等领域带来了极大的便利。今天，我们将深入介绍三款备受瞩目的AI工具：Cursor、DeepSeek和Copilot。它们各有特色，适合不同场景。想知道它们之间有哪些区别？又该如何使用？一起往下看！一、什么是Cursor、DeepSeek和Copilot？1.CursorCursor是一款专为程序员打造的智能代码编辑工具，结合AI
蓝桥杯真题 - 翻转 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3520/learning/个人评价：难度1星（满星：5）前置知识：无整体思路贪心，除了第一位跟最后一位，其它字符，每当S[i]≠T[i]S[i]\neqT[i]S[i]=T[i]时，能换则换；为什么可以贪心？因为如果某段连续的数字为101101101或者010010010，在被修改之后变为111111111或者00000
蓝桥杯真题 - 三国游戏 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3518/learning/个人评价：难度2星（满星：5）前置知识：贪心整体思路先假设魏蜀吴中的某一个势力最终获胜的情况下，如何求出事件发生的最大数量，最后枚举三个势力获胜的情况取最大值就是答案；假设魏国最终胜利，那最好是让已发生的事件中AiA_iAi的和尽可能大于Bi+CiB_i+C_iBi+Ci的和，大得越多越优先选择让
【AI工具】夸克AI试用：分析DeepSeek-V3技术报告 bylander AI工具 AI学习 AI论文阅读人工智能学习 gpt
安装了夸克AI，试用了一下AI总结功能，导入了DeepSeekV3的技术报告，使用了文章总结、问题提问、脑图、大纲等功能还不错，尤其是几个问题提问，回答的都不错，而且数学公司都是标准的markdown格式，不乱码，这一点就比其他的AI工具强。下面是分析的具体内容》AI文件总结DeepSeek-V3技术报告分析报告引言DeepSeek-V3是一个拥有6710亿参数的专家混合（MoE）语言模型，每次生
总结8.. 挽清和 c语言
#include//定义结构体表示二叉树节点，包含左右子节点编号structnode{intl;intr;}tree[100000];//全局变量记录二叉树最大深度，初始为0intans=0;//深度优先搜索函数//pos:当前节点在数组中的位置，deep:当前深度voiddfs(intpos,intdeep){//若为叶子节点if(tree[pos].l==0&&tree[pos].r==0){
el-tree，父节点的复选框不显示 timoingff 前端 javascript html
对父节点的选择框禁用关键代码：computed:{defaultProps(){return{children:'children',label:'label',disabled:(data,node)=>{//isDir-判断是否为父节点returndata&&data.isDir}}}}//取消禁用样式/deep/[aria-disabled=true]>.el-tree-node__cont
组会20220616 m0_61799349 研究生组会深度学习计算机视觉神经网络
安装、使用Ubuntu系统花费了一定的时间2.看结肠镜息肉检测的论文wang.改进DeepLabv3+网络的肠道息肉分割方法[J].计算机科学与探索.2020.14(7):1673-9418Jhaetal.,"ResUNet++:AnAdvancedArchitectureforMedicalImageSegmentation,"2019IEEEInternationalSymposiumonMu
深度ResUnet与ResUnet++：新一代的语义分割神器倪澄莹George
深度ResUnet与ResUnet++：新一代的语义分割神器去发现同类优质开源项目:https://gitcode.com/在这个数据驱动的时代，深度学习模型在图像处理领域展现出了强大的潜力，尤其是在语义分割任务中。今天，我们向您推荐一个基于PyTorch实现的开源项目——DeepResUnet和ResUnet++。这两个模型源自于学术界的最新研究，旨在提高图像分割的准确性和效率。项目介绍这个开源
医学类使用TransUNet、UNet、DeepLabV3+、HRNet、PSPNet 模型对息肉分割数据集进行训练、评估和可视化 EDD2020息肉数据集分割数据集计算机C9硕士_算法工程师数据集语义分割医学类数据集语义分割息肉 TransUNet UNet
息肉数据集/息肉瘤分割项目解决（已处理好:EDD2020数据集(EndoscopyDiseaseDetectionandSegmentationChallenge)该息肉分割数据集主要包含人体生长的（肠胃）息肉用于器官内部息肉瘤分割，息肉目标检测，息肉定位任务息肉分割是一个重要的医学影像分析任务，特别是在内窥镜检查中。EDD2020数据集是一个很好的起点。我们将使用几种流行的深度学习模型（如Tra
Windows 11安装DeepSpeed报错（Unable to pre-compile async_io）已解决 day_day_up1 python 机器学习计算机视觉
Windows11安装DeepSpeed报错（Unabletopre-compileasync_io）问题解决_pipinstalldeepspeed报错-CSDN博客
深度学习中高斯噪声：为什么以及如何使用小白学视觉深度学习人工智能
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达来源：DeepHubIMBA本文约1800字，建议阅读8分钟高斯噪声是深度学习中用于为输入数据或权重添加随机性的一种技术。在数学上，高斯噪声是一种通过向输入数据添加均值为零和标准差(σ)的正态分布随机值而产生的噪声。正态分布，也称为高斯分布，是一种连续概率分布，由其概率密度函数(PDF)定义：pdf(x)=(1/(σ*sqrt(
智能推理的革命：DeepSeek-R1 深度解析其算法与实现步子哥算法人工智能
在人工智能（AI）领域，语言模型（LargeLanguageModels,LLMs）正以惊人的速度发展，变得越来越智能，能够理解和生成复杂的语言内容。然而，尽管现有的模型在许多任务上表现出色，它们在深度推理和逻辑思维方面仍有显著的提升空间。DeepSeek-R1的出现，正是为了解决这一问题，通过强化学习（ReinforcementLearning,RL）赋予语言模型更强大的推理能力，开创了LLMs
KNOWLEDGE UNLEARNING FOR MITIGATING PRIVACY RISKS IN LANGUAGE MODELS 绒绒毛毛雨语言模型人工智能自然语言处理
文章目录摘要1引言2相关工作2.1语言模型的隐私方法2.2机器去学习2.3语言模型中的记忆3语言模型中的知识去学习3.1方法论3.2量化语言模型的隐私风险4实验4.1模型、数据集和配置4.2主要实验4.3知识去学习的分析5结论摘要预训练语言模型（LMs）在初始预训练过程中记忆了大量知识，包括可能侵犯个人隐私和身份的信息。以往针对语言模型隐私问题的研究主要集中在数据预处理和差分隐私方法上，这两者都需
机器学习与分布式机器学习_经理人的机器学习–您需要知道的 cumian8165 算法神经网络大数据编程语言 python
机器学习与分布式机器学习Ifyouaremanagingatechteamasaproductorprojectmanager,hereiswhatyouneedtoknowaboutmachinelearning.如果您要以产品或项目经理的身份管理技术团队，这是您需要了解的有关机器学习的知识。Machinelearninganddeeplearninghavebeenpopularbuzzwor
Progressive learning yore0531 深度学习人工智能计算机视觉
learnfromRestormer.Restormer:EfficientTransformerforHigh-ResolutionImageRestoration|IEEEConferencePublication|IEEEXploreProgressivelearning在小的croppatches上训练Transformer模型可能无法对全局图像统计进行编码，从而在测试时对全分辨率图像的效
【PLPR】Progressive Learning for Person Re-Identification with One Example 南风楠 Person Re-ID One-shot Learning Few-shot Learning 深度学习机器学习神经网络
【PLPR】ProgressiveLearningforPersonRe-IdentificationwithOneExampleBibtexPublicinformationFieldsCodelinkMainworkKeytechnologyFrameworkDatasetResultsAlgorithmOthers论文下载：关注下方公众号，回复“PLPR”即可获得论文原文Bibtex@art
深度学习利用数据加载、预处理和增强数据提高模型的性能 weixin_30777913 人工智能深度学习
深度学习数据预处理是一个关键步骤，旨在提高模型的性能和准确性。通过数据加载、预处理和增强，可以显著提高深度学习模型的性能和准确性。在实际应用中，需要根据具体的数据和任务来选择合适的预处理和增强技术。以下将详细论述并举例说明如何加载、预处理和增强数据。一、数据加载在深度学习中，数据加载是第一步。这通常涉及到从各种数据源（如CSV文件、数据库、图像文件夹等）中读取数据。以DeepLearning4J（
论文阅读：DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection（Deepfake模型快速调参）海拉鲁的小厨娘读论文论文阅读
一、论文信息论文名称：DeepFake-Adapter:Dual-LevelAdapterforDeepFakeDetection作者团队：项目主页：https://github.com/rshaojimmy/DeepFake-Adapter（代码暂未开源）二、动机与创新动机：目前的deepfake检测模型泛化能力差，将其归因于过拟合于低级的伪造模式，现有的deepfake检测方法仅关注低级别的伪
vue项目运行报：SassError: expected selector... 落日弥漫的橘_ 前端 vue.js webpack css
SassError:expectedselector错误通常由于Sass或SCSS文件中存在语法错误或选择器缺失，导致Sass编译器无法解析。Sass语法语法中误用深度选择器语法导致以上问题。/deep/和::v-deep都是用于Vue单文件组件（.vue文件）中的样式穿透选择器;/deep/在Sass中并不被支持，如果是在Vue单文件组件中，并且需要穿透样式，可以使用::v-deep代替/dee
总结：IDEA社区版接入AI代码工具小魏的博客机器学习大语言模型 IDE相关软件 intellij-idea java ide
一、介绍本文主要记录下IDEA工具接入通义灵码、deepseek（深度求索）、豆包的方式。idea社区版（我的具体是：IntelliJIDEA2023.2.5(CommunityEdition)）二、deepseek配置1、首先得去deepseek平台创建个apikey；生成key位置：DeepSeek默认会送500万的tokens，查看tokens用量：DeepSeek2、安装AutoDev插件
springboot接入deepseek深度求索 java 笑发财了1 java spring boot 服务器
以下是在springboot中接入aideepseek的过程。官网并没有java的示例。1.创建APIkeydeepseekAPIkeys点击创建APIkey，把创建的key值复制下来，以后就不能再查看了，只能重新创建。2.封装询问deepseek的工具方法添加key值和询问路径。API_KEY为你创建的key值。privatestaticfinalStringAPI_URL="https://a
python广告点击率预测_常见计算广告点击率预估算法总结 weixin_39850143 python广告点击率预测
欢迎大家前往腾讯云技术社区，获取更多腾讯海量技术实践干货哦~作者：导语：本文讨论了CTR预估模型，包括工业界使用比较广的比较经典模型和学术界最新的结合DeepLearning的一些工作。前言谈到CTR，都多多少少有些了解，尤其在互联网广告这块，简而言之，就是给某个网络服务使用者推送一个广告，该广告被点击的概率，这个问题难度简单到街边算命随口告诉你今天适不适合娶亲、适不适合搬迁一样，也可以复杂到拿到
uniapp中使用vant wappp m0_70647189 Web前端经验分享前端前端框架
.custom-button{.van-button{background-color:blue;border-radius:10px;}}如果你的style样式中存在scoped，我们可以利用vue中的语法，加个/deep/进行样式覆盖，如下所示：/deep/.custom-button{.van-button{background-color:blue;border-radius:10px;}
LLM-1-chatglm-安装deepspeed报错愚昧之山绝望之谷开悟之坡 python 开发语言
安装pipinstalldeepspeed报错Lookinginindexes:https://mirror.baidu.com/pypi/simpleCollectingdeepspeedUsingcachedhttps://mirror.baidu.com/pypi/packages/9f/64/4a3643f61b15dbfec1cab0172f4bdae1d45e1ab3cd73bb060
Django学习笔记 mengmwng Django django 学习笔记
学习视频来源：最新Python的web开发全家桶代码仓库：https://gitee.com/m_engmeng/django-learning1.创建项目Django中项目会有一些默认的文件和文件夹1.1在终端打开终端进入某个目录(项目放在哪里)输入命令——创建项目(最后一个参数是项目名)django-adminstartprojectmysite继续输入——创建app（最后一个参数是app所处
Docker多架构镜像构建踩坑记一直学下去 docker 容器 adm64 arm64 多架构
背景公司为了做信创项目的亮点，需要将现有的一套在X86上运行的应用系统迁移到ARM服务器上运行，整个项目通过后端Java，前端VUEJS开发通过CICD做成Docker镜像在K8S里面运行。但是当前的CICD产品不支持ARM的镜像构建，于是只能手工构建ARM镜像。以下是一些踩坑的记录，希望能帮大家少踩坑构建环境本地电脑DeepinLinux23(Windows的WSL和其他的Linux系统都可以）
亲测解决unable to import torch, please install it if you want to pre-compile any deepspeed ops. 狂小虎 Windows 系统学习python Deep Learning python 人工智能 pytorch deepspeed
这个问题是小虎在win上下载deepspeed导致。原因是windows不支持deepspeed。问题背景unabletoimporttorch,pleaseinstallitifyouwanttopre-compileanydeepspeedops.DS_BUILD_OPS=1解决方法windows上面不能使用deepspeed，因为deepspeed用到了linux系统的libaio-dev模
How can I fix my Flask server‘s 405 error that includes OpenAi api? 营赢盈英 AI ai python javascript flask openai api
题意：解决包含OpenAIAPI的Flask服务器中出现的405错误（MethodNotAllowed，即方法不允许）问题背景：I'mtryingtoaddanAPItomywebpageandhaveneverusedanyFlaskserverbefore,IhaveneverusedJavascripttoosothisisacompletelybrandnewlearningexperie
开源生态发展合作倡议操作系统
在信息技术发展的浪潮中，开源已成为全球创新的强劲引擎，深刻影响着各行各业的发展。今天，我们站在新的历史起点上，肩负着推动开源生态发展的重任。在此，开源欧拉（openEuler）、龙蜥（OpenAnolis）、鸥栖（OpenCloudOS）、开放麒麟（openKylin）、深度（deepin）五大操作系统开源社区携手并进，共同发起开源生态发展合作倡议，旨在书写开源生态繁荣的新篇章。在此，我们提出三点
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他