borisjineman

CNTK从入门到深入研究（2） - 研究CNTK配置文件

前言

根据前一篇文章的介绍，大家已经对CNTK有所了解，并且也已经搭建好了运行环境。在前一篇文章最后的例子中，我们只是简单地运行了CNTK提供的其中一个样例。并且得到了结果。大家可能发现，在命令cntk.exe的后面，需要接一个参数用于指明配置文件。
本文中将详细的描述配置文件的各个部分，笔者会尽量的按照层次结构进行讲解。所以本文可以作为一个交流的文档，也可以当做一个参考资料以备所需。

简单的说明下CNTK配置文件

CNTK配置文件从功能的角度来说就是给大家一个地方去写明操作的逻辑。这里操作的逻辑指的是大家使用CNTK的目的。你希望CNTK去运行什么，设定模型？训练模型？还是评估测试模型？。这些都是命令，CNTK配置文件给出了一种方式去写一个文件来描述这些操作逻辑。由于机器学习中所涉及的参数很多，所以基本无法让用户直接通过命令行的方式输入。所以配置文件基本上是必须的。

其中CNTK的配置文件还有合并和覆盖等特性。cntk.exe可以同时加载多个配置文件，但是如果配置文件中数据块中有一样的项，则后面的配置文件的相应配置信息会覆盖前面的。当然，如果两个配置文件中如果数据快中的项完全不同，则取并集。

CNTK配置文件

基本语法

一切都要从基本语法说起。下面先展示一个简单的配置内容。

block2 = [
    subblock = [string="hi";num=5]
    value = 1e-10
    array = 10:"this is a test":1.25
]

CNTK配置文件中的数据项基本上是由块状结构进行组织的，其中，同一个块中后面的项将合并或覆盖前面相同名称的数据项。在数据块中可以包含其他数据块。如果希望在一行中定义两个数据项，则需要使用“;”进行分割。最后是注释部分，注释以“#”开头

变量定义与引用

配置文件中的变量定义，可以直接写赋值语句。变量的引用则是将之前定义的变量名前后加上“$”来进行引用。下面给出示例:

RootDir = ".."

ConfigDir = "$RootDir$/Config"
DataDir = "$RootDir$/Data"
OutputDir = "$RootDir$/Output"
ModelDir = "$OutputDir$/Models"

注意一点是这样的，在一个块的外面定义的数据，是会被块内引用的。所以，大家发现一些块内本应定义的内容不存在的时候，应该考虑是否他已经在外面有所定义。块与块之间是有数据的继承关系的。

数据类型

数据项的值的数据类型可以为如下几种：

- 简单类型 （12， 1.25, 1e-10，"hi"，auto）
- 块（集合）类型 （block1 = [id=1;size=256]）
- 数组类型 （array=2:50:2)

简单类型：其本质就是单独的一个值，可能是整数，浮点，字符串或者特殊的枚举类型。
块（集合）类型：其本质是一系列类型的一个集合，它可将一系列项打包在一起，可以包含其他数据块。
数组类型：前面几种数据类型不过多的阐述了，唯一有些需要解释的是数组类型。
数组类型在定义中可能出现两种符号，分别是“:”和“*”号。
先说“:”，这个符号用于分割数组中的元素，例如array=2:50:2，所对应的是定义一个包含3个元素的数组，分别是2，50，2。
然后是“*”，这个符号并非乘法，而是表示所修饰的类型重复多少遍。例如array=50:150*2:100，这个展开后是array=50:150:150:100。
数组类型经常用于定义网络的结构。定义每层网络的神经元个数。

覆盖与合并

我们在调用cntk.exe的过程中，我们使用configFile参数来指明我们的配置文件的位置。

cntk.exe configFile=yourExp.cntk

这样我们可以加载一个单独的配置文件，但是在一些复杂的工程中，我们可能为了一些特殊的需要，不同的参数写在不同的配置文件中。这时我们可以通过“+”进行拼接使其一次性加载多个配置文件。

cntk.exe configFile=yourExp1.cntk+yourExp2.cntk

当上述的yourExp1.cntk与yourExp2.cntk中有相同的数据项导致配置冲突的情况下，最后加载的yourExp2.cntk将会覆盖前面的数据项内容。

同时cntk.exe也支持在命令行中指定局部的数据项来补充或者覆盖配置文件中的内容。

cntk.exe configFile=yourExp.cntk mnistTrain=[reader=[file=”mynewfile.txt”]]

CNTK配置文件结构

最外层结构

除了自己需要定义的一些变量以外，CNTK的配置文件的最外层我们可以定义如下结构的数据以供cntk.exe使用。

# 定义的一些配置文件内部使用的常用变量
RootDir = ".."

ConfigDir = "$RootDir$/Config"
DataDir = "$RootDir$/Data"
OutputDir = "$RootDir$/Output"
ModelDir = "$OutputDir$/Models"

# 外部引用变量command 用于指明需要执行什么任务
command = Simple_Demo_Train:Simple_Demo_Test

# 外部引用变量deviceId 用于指明所使用的设备
deviceId = -1

# 外部引用变量precision 用于指明计算所使用的精度
precision = "float"

# 外部引用变量traceLevel 输出到Console的内容级别
traceLevel = 1

# 任务1
Simple_Demo_Train = [
    ...
]

# 任务2
Simple_Demo_Test = [
    ...
]

上述就是一个典型的CNTK配置文件的外层结构，这里任务块的内容暂时没有展开说明，相会在后续展开继续讲解。这里包括的配置的内容除了一些内部使用的变量以外，还有一些外部引用的变量。这些变量将会在cntk.exe中读取并且设置cntk的当前要执行的环境并且之执行相应的任务。

command

command可以理解为是最重要的，也是CNTK配置中不可缺少的，它用于指明当前需要执行什么任务。command的值可以为简单类型，也可以为数组类型。如下所示：

command = Simple_Demo_Train:Simple_Demo_Test

上述配置方式，将指明执行train和test两个任务块的内容。这里所讲的任务块就是下面所示的内容，任务块中的配置将在后面详细说明，这里只简单说明任务块是通过command调用的。

command = Simple_Demo_Train:Simple_Demo_Test

# 任务1
Simple_Demo_Train = [
    ...
]

# 任务2
Simple_Demo_Test = [
    ...
]

deviceId

deviceId参数用于指明操作需要使用的设备，可以设置为auto，或者是一个整数。
当设置为auto时，CNTK会自动选择一个最适合的设备进行计算操作。
当设置为-1或者是cpu时，则只是用CPU进行计算，不使用GPU。
当设置的值为大于等于0时，则使用指定的GPU进行计算。

# 自动识别性能最佳的设备并使用该设备
deviceId = auto

precision

precision用于指明计算过程中所使用的精度，该变量有默认值为float。可以设置的值为float或者是double。

precision = "float"

这个参数的设置会影响训练和测试网络的速度，毕竟精度的提升不仅仅是数据量的提升，还是计算量的提升。具体设置情况可以参考需要权衡训练所需达到的效果与训练或者测试的速度之间的平衡。

traceLevel

traceLevel这个值只是为了控制console中输出内容的量。取值范围是从0-2的整数

traceLevel = 1

其中0代表有限制的输出，也就是只输出有必要的内容。1代表正常的输出。2代表输出所有的内容。该参数可以理解为log的详细程度。

stderr

stderr参数用于设置如果发生错误则log输出文件的位置。这里只是指定错误文件的位置的部分，具体的log文件名称需要和所执行的任务的名称项结合。举例来说，先看下面局部的配置内容。

command = mnistTrain 
stderr="c:\cntk\log\cntk“
mnistTrain = [
...
]

如上所设置，当执行mnistTrain任务时发生错误，错误的log将会输出至“c:\cntk\log\cntk_mnistTrain.log”。

NumCPUThreads

NumCPUThreads = 0

NumCPUThreads参数用于指定所使用的cpu线程数。该参数设定的取值可以是正整数，也可以是负整数，也可以是0。
当NumCPUThreads取值为0时，具体使用的线程数则由MKL、ACML或者是OpenMP自动检测。0也是其默认值。
当NumCPUThreads取值为正整数的时候，最大所使用的线程数为所设定的值与当前并行计算能力两者中相对较小的值。
当NumCPUThreads为负数的时候，则为硬件并行能力的最大值，但至少为1。

任务块的结构

每一个任务块其实就是具体进行的一项操作。例如train，eval，test这都是我们所常用任务。下面列举一个典型的任务快的样例：

mnistTrain = [
    action = "train"

    NDLNetworkBuilder = [
        networkDescription = "$ConfigDir$/01_OneHidden.ndl"
    ]

    SGD = [
        modelPath = "$ModelDir$/01_OneHidden_Model.dnn"
        epochSize = 60000
        minibatchSize = 32
        learningRatesPerMB = 0.1
        maxEpochs = 30
    ]

    reader = [
        readerType = "UCIFastReader"
        file = "$DataDir$/mnist_train.txt"
        features = [
            dim = 784
            start = 1
        ]
        labels = [
            dim = 1
            start = 0
            labelDim = 10
            labelMappingFile = "$DataDir$/mnistlabels.txt"
        ]
    ]
]

一个典型的任务块中，经常出现的有4部分内容。

action 用于指明具体的任务行为。
Network Builder 网络创建器
Learner 学习方法
Data Reader 数据读取器

其中action为组成任务块的必要元素，其他3个部分可以根据action的具体内容而设置。

action任务行为

action目前根据官方所给出来的文档中的说法目前可以选择的值为Train、Test以及Eval。

action = “train”

同时大家在观察CNTK所给出来的一些Sample中，也会发现action中会出现其他的值，这部分值没有在官方目前所给出来的文档中找到解释，但是笔者会通过笔者自己对代码的解读中尝试性的去解释他的行为。

Train: 当action为Train时，则当前任务块的行为为训练网络。需要在任务块中定义如下内容：

（必要）Network Builder 需要为学习行为制定一个网络的构造器以定义具体训练什么类型的网络。后面会详细解释Network Builder的设置。
（必要）Reader 需要为学习行为指定一个数据的读取器，以读入训练数据。
（必要）Learner(目前是SGD）需要配置一个SGD（随机梯度下降）块来配置训练相关的训练参数。
cvReader 这个根据官方的说明给出的是cross-validation data（交叉验证数据）的读取器的配置块。该参数可选提供。
makeMode 这个参数用于指定是当训练行为被打断后在继续开始的时候，是从头开始训练（值为false），还是根据已有的训练结果继续训练（值为true）。该参数的默认值为true。
numMBsToShowResult 参数用于指定当多少个minibatches后，中间结果需要被显示出来。

Test/Eval: 当action为Test或者是Eval时，则当前任务块的行为为测试网络或者是使用该网络计算数据。需要在任务块中定义如下内容：

（必要）Reader 需要为学习行为指定一个数据的读取器，以读入训练数据。
（必要）modelPath 参数用于指明所使用的网络model的位置。该参数由之前train行为训练出来的网络给出。
minibatchSize 设定用于从数据集中读取或者处理数据的minibatchSize参数。
epochSize 指定数据集大小，可以设定为0，当设定为0时，将会自动判断数据集大小。
numMBsToShowResult 参数用于指定当多少个minibatches后，中间结果需要被显示出来。
evalNodeNames 该参数用于设定需要执行的一个或多个节点名称的集合。

上述为在实际使用过程中常用的action。还有一些工具类型的action。

convertdbn: 用于将通过微软的dbn.exe生成的网络转换CNTK的网络模型。

（必要）dbnModelPath 指定dbn.exe所生成的网络的位置。
（必要）modelPath 指定转换后输出的CNTK网络模型的位置。

plot: 用于将已有的网络通过dot绘制到文件。

command = topoplot
topoplot = [
    action = "plot"
    modelPath = "train\lstm.model.0"

    # outputdotFile specifies the dot file to output
    # if the user does not specify this, it will be ${modelPath}.dot
    outputdotFile = "train\lstm.model.dot" 

    # outputFile specifies the rendered image
    outputFile="train\lstm.model.jpg" 

    # if RenderCmd is specified, CNTK will call the plot command after replacing
    # <IN> with ${outputdotFile} and <OUT> with ${outputfile}
    renderCmd="d:\Tools\graphviz\bin\dot.exe -Tjpg <IN> -o<OUT>"
]

（必要）modelPath 参数用于指明所使用的网络model的位置。该参数由之前train行为训练出来的网络给出。
（必要）outputFile 指定需要输出的图片文件位置。
outputdotFile 指定需要输出的dot文件位置。
renderCmd 用于指定具体使用的render的执行命令。在调用前，会使用${outputdotFile}去替换宏<IN>，使用${outputfile}去替换宏<OUT>。

上述为官方在一些文档中已经说明的action的可选项。还有一些可选项官方未给出说明，但是在Sample中或者是代码中有出现。下面笔者将会根据自己的理解进行解读。

trainRNN 等价于 train

adapt （等研究完代码后补充）

edit 编辑网络

cv 执行cross-validation交叉验证

write （等研究完代码后补充）

devtest（等研究完代码后补充）

dumpnode 导出节点信息

createLabelMap（等研究完代码后补充）

writeWordAndClass 预处理自然语言文本的输入数据

SVD 矩阵奇异值分解

Network Builder网络创建器

目前支持两种Network Builder（也许存在第三种）, 分别是：

SimpleNetworkBuilder
NDLNetworkBuilder
BrianScript（这个是在代码中发现的第三种，但是没有详细记录如何使用）

SimpleNetworkBuilder 使用方式比较简单，只需要设定网络的各种参数即可。

 SimpleNetworkBuilder = [
    # 2 inputs, 2 hidden layers with 50 element nodes each, 2 outputs
    layerSizes = 2:50*2:2
    trainingCriterion = "CrossEntropyWithSoftmax"
    evalCriterion = "ErrorPrediction"
    layerTypes = "Sigmoid"
    applyMeanVarNorm = true
]

NDLNetworkBuilder 则是设定一个networkDescription的参数，在参数中引用一个ndl文件。ndl文件有自己的特殊语法。NDL（Network Description Language）是为了CNTK所实现的一种不是编程语言的网络描述语言。

NDLNetworkBuilder = [
    networkDescription = "$ConfigDir$/yourNetwork.ndl"
]

BrianScript 这个是在代码中发现的，未来可能会进行支持。也是定义网络的一种方式。

笔者未来将会针对SimpleNetworkBuilder以及NDLNetworkBuilder这两种网络创建器写一篇详细的文章进行讲解。这里先预留占位。后期将文章的链接补上。

Learner 学习方法

目前CNTK的Learner所支持的学习方法根据笔者自身的研究好像只有SGD（Stochastic gradient descent随机梯度下降）。SGD块的配置虽然参数比较多，但是大多数参数已经有默认值，如果实际情况允许或者符合情况，直接使用默认值即可。否则的话，则需要按需要进行指定。

SGD = [
    modelPath = "$ModelDir$/myModel.dnn"
    epochSize = 60000
    minibatchSize = 32
    learningRatesPerMB = 0.1
    maxEpochs = 30
]

CNTK中提供针对SGD的配置有很多，未来也会针对SGD的配置单独写一篇文章进行详细的描述。

Data Reader 数据读取器

CNTK中提供了很多Data Reader，并且也提供了接口供开发者或者使用者实现针对自身数据专门的Reader。Data Reader主要的功能就是为了读取原始数据。目前CNTK中已有文档描述的Reader如下：

UCI Fast Reader 基于UCI数据格式的读取器（可以理解为文本格式）
HTKMLF Reader 其中HTK指的是HMM Toolkit 隐马尔科夫链工具箱，这个是一种读取基于HTK的MLF文件的读取器。
LM sequence reader 基于LM（语言模型 language modeling）序列的字符串读取器，一般适用于分析语言模型。
LU sequence reader 通LM sequence reader有些类似，只是用于语言的理解(language understanding)上。

每种Reader由于其实现不同，所以配置参数不尽相同，笔者将会分为多个部分讲解这四种读取器，并会在未来的文章中，解读代码以及讲解开发的过程中，详细的讲解如何自定义符合特殊数据的读取器。

总结及下一步的计划

在本篇文章中，随同大家一同研究了CNTK配置的一些基本原理和基本的语法。并且也了解了一个基本的CNTK配置中所需要配置的内容及如何进行配置顶层参数以及任务块中的内容。

本文虽然已经描述了CNTK配置文件的一些详细内容，但是在Network Builder网络创建器、Learner学习方法以及Data Reader数据读取器这三个关键的任务块部分只是简单的介绍了一下，并没有给出详细的解释和使用方法。笔者计划针对于这三部分详细的说明，其源于两个原因，一个是在实际使用过程中这三部分十分重要，另外的原因是这三部分中需要讲解的内容过于繁重，无法再一篇文章中详细阐述。笔者将会在未来的文章中视情况拓展。

本节完，其他章节将会持续更新……

验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
2025扩展可能性采购和供应链管理使用AI报告100+份汇总解读|附PDF下载拓端研究室百度人工智能
原文链接：https://tecdat.cn/?p=40348在当今快速发展的商业环境中，采购和供应链管理领域正经历着深刻变革，人工智能（AI）技术的融入成为推动这一变革的关键力量。本报告汇总解读聚焦于AI在采购和供应链管理中的应用，深入剖析其发展现状、面临挑战与潜在机遇。通过对大量数据的分析，揭示AI技术在实际应用中的具体表现，如不同行业的采用比例、应用场景等。本报告汇总洞察基于文末135份供应
从LayerNorm到RMSNorm：深度学习归一化技术的进化！qwen2.5的技术。 KangkangLoveNLP qwen2.5 深度学习人工智能 transformer pytorch 自然语言处理 python 神经网络
RMSNorm（RootMeanSquareNormalization，均方根归一化）是一种用于深度学习的归一化技术，是LayerNorm（层归一化）的一种改进。它通过计算输入数据的均方根（RootMeanSquare,RMS）来进行归一化，避免了传统归一化方法中均值和方差的计算1.LayerNorm（层归一化）LayerNorm（层归一化）是一种用于深度学习的归一化技术，主要用于稳定训练过程、加
Visual Studio 2022和C++实现带多组标签的Snowflake SQL查询批量数据导出程序 weixin_30777913 c++云计算开发语言 sql 数据仓库
设计一个基于多个带标签SnowflakeSQL语句作为json配置文件的VisualStudio2022的C++代码程序，实现根据不同的输入参数自动批量地将Snowflake数据库的数据导出为CSV文件到本地目录上，标签加扩展名.csv为导出数据文件名，文件已经存在则覆盖原始文件。需要考虑SQL结果集是大数据量分批数据导出的情况，通过多线程和异步操作来提高程序性能，程序需要异常处理和输出，输出出错
Python Pandas带多组参数和标签的Snowflake数据库批量数据导出程序 weixin_30777913 pandas python 云计算数据仓库
设计一个基于多个带标签的SnowflakeSQL模板作为配置文件和多组参数的PythonPandas代码程序，实现根据不同的输入参数自动批量地将Snowflake数据库中的数据导出为CSV文件到指定目录上，然后逐个文件压缩为zip文件，标签和多个参数（以“_”分割）为组成导出数据文件名，文件已经存在则覆盖原始文件。需要考虑SQL结果集是大数据量分批数据导出的情况，通过多线程和异步操作来提高程序性能
C#带多组标签的Snowflake SQL查询批量数据导出程序 weixin_30777913 c#数据仓库云计算 sql
设计一个基于多个带标签SnowflakeSQL语句作为json配置文件的C#代码程序，实现根据不同的输入参数自动批量地将Snowflake数据库的数据导出为CSV文件到本地目录上，标签加扩展名.csv为导出数据文件名，文件已经存在则覆盖原始文件。需要考虑SQL结果集是大数据量分批数据导出的情况，通过多线程和异步操作来提高程序性能，程序需要异常处理和输出，输出出错时的错误信息，每次每个查询导出数据的
【Agent实战】发票信息识别提取专家（AI +OCR技术结合ChatGPT4o能力+结构化prompt（CoT、One-shot等）+Knowledge - RAG+API工具Agent项目实践）姚瑞南大模型落地探索及agent搭建 RAG技术应用探索 prompt实战应用案例人工智能 ocr prompt AIGC chatgpt gpt agi
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）目录1.项目背景2.项目目标定性：定量：3.发票核心字段概述4.关键举措5.Workflow设计思路及编排5.1整体设计思路5.2流程搭建及解读流程解读：代码节点：解析agent数据
你所不知道的关于AI的27个冷知识——AI的军事应用贫苦游商 transformer 人工智能自动化算法 gpt
AI的军事应用亲爱的朋友们，今天我们要踏入一个既神秘又令人激动的领域——人工智能（AI）在军事中的应用。想象一下，一个由智能机器人和无人机组成的军队，能够进行精准打击和复杂的战略部署，这一切听起来像是科幻电影中的场景，但在现实中已经逐渐成为可能。让我们一起探索AI在军事中的奇妙应用以及它所带来的挑战。智能无人机：空中的无形战士首先，让我们飞向天空，看看那些令人惊叹的智能无人机。这些无人机不仅能进行
普通人如何利用GPT赚钱之开发虚拟助手贫苦游商普通人利用AI搞钱系列 gpt 人工智能深度学习机器人 AIGC
普通人如何利用GPT赚钱之开发虚拟助手随着人工智能技术的迅猛发展，GPT（GenerativePre-trainedTransformer）作为一种强大的语言模型，正在改变我们的生活和工作方式。普通人如何利用GPT赚钱？开发虚拟助手是一个极具潜力的方向。本文将探讨如何开发虚拟助手，以及如何通过这一技术实现经济收益。什么是虚拟助手虚拟助手是一种基于人工智能的技术，能够理解自然语言并执行特定任务。它们
【漫话机器学习系列】137.随机搜索（Randomized Search） IT古董漫话机器学习系列专辑机器学习人工智能
随机搜索（RandomizedSearch）详解在机器学习和深度学习的模型训练过程中，超参数调优（HyperparameterTuning）是至关重要的一环。随机搜索（RandomizedSearch）是一种高效的超参数优化方法，它通过在候选超参数的数值分布（如正态分布、均匀分布等）中随机选择超参数组合，从而找到最优的超参数配置。1.超参数调优的必要性超参数是模型在训练之前需要人为设定的参数，例如
南京大学×百度“星河杯”AI大模型创意校园赛正式起航
3月9日，教育部长怀进鹏在十四届全国人大二次会议民生主题记者会上，谈到了人工智能+教育的重要性。他强调，要把人工智能技术深入到教育教学和管理的全过程和全环节，研究其有效性和适应性，让青年一代更加主动地学习，让教师更加创造性地教学。南京大学早在年初就已经敏锐地洞察到了人工智能的重要性，在新学期工作布置会上，发布了一个前瞻性决策：24年9月面向全体本科新生开设“人工智能通识核心课程体系”，南京大学党委
大模型（DeepSeek等）是否会动摇AI工程师的工作？点我头像干啥 Ai 深度学习人工智能 AI编程计算机视觉
引言近年来，人工智能（AI）领域取得了突飞猛进的发展，尤其是大模型（如GPT-3、BERT、DeepSeek等）的出现，极大地推动了自然语言处理（NLP）、计算机视觉（CV）等领域的进步。大模型凭借其强大的泛化能力和广泛的应用场景，逐渐成为AI领域的核心技术之一。然而，随着大模型的普及，一个备受关注的问题浮出水面：大模型是否会动摇AI工程师的工作？本文将从多个角度探讨这一问题，分析大模型对AI工程
DeepSeek大模型部署指南点我头像干啥 Ai 人工智能 python 分类数据挖掘深度学习
在当今人工智能快速发展的时代，大模型的应用越来越广泛。DeepSeek作为一款高性能的大模型，支持长文本、多模态、代码生成等复杂任务，已经在多个领域展现出强大的能力。本文将详细介绍DeepSeek大模型的部署流程，帮助读者在自己的环境中高效地使用这一先进工具。一、DeepSeek大模型简介DeepSeek是一款专注于大模型与AGI（人工智能通用智能）研究的高性能基座模型。它支持长文本处理、多模态理
Spring Boot 参数校验异常与错误编码映射方案 robin-cloud spring spring boot spring cloud
一、错误码定义与配置错误码结构采用分层编码格式：[模块][错误类型][序号]（如1001表示公共模块参数校验错误中的第一个错误）配置文件（application.yml）yaml复制error:codes:#公共模块错误码common:param_invalid:1000#校验子错误码constraints:NotNull:1001Size:1002Pattern:1003Email:1004#用
医学人工智能影像诊断数据收集与整理 V搜xhliang0246 人工智能健康医疗算法
在医学领域中，人工智能（AI）尤其是深度学习技术，已经被广泛应用于医学影像的分析和诊断。为了训练这些模型，需要大量的高质量标注数据。下面我会给出一个简单的示例流程，介绍如何收集、整理和准备医学影像数据集，并提供一些基础的Python代码示例。数据收集首先，你需要收集包含医学影像的数据集。这些数据通常来自医院或研究机构，并且需要经过伦理审查和患者同意。示例数据集假设我们有一个包含肺部X光片的数据集，
深度学习模块缝合教程：从理论到实践 RockLiu@805 深度学习模块机器视觉深度学习人工智能
深度学习模块缝合教程：从理论到实践引言随着深度学习的不断发展，模型的设计与优化成为研究者关注的核心问题之一。如何有效地“缝合”不同模块，以实现更高效的计算和更强大的功能，是当前深度学习研究中的一个重要课题。在本文中，我们将从基础概念出发，详细探讨深度学习模块缝合的方法、技巧及其应用场景。无论是理论深厚的研究者还是实验导向的实践者，都可以从中获得启发。一、深度学习基础知识详解深度学习是人工智能领域的
全球首款通用 AI 智能体 Manus 发布的分析报告 PM简读馆技术杂谈人工智能
一、引言在人工智能领域持续蓬勃发展的进程中，新的技术成果与产品不断涌现，推动着行业的快速变革。全球首款通用AI智能体Manus的发布成为近期备受瞩目的事件，尤其其宣称性能超越OpenAI，更是引发了行业内外的广泛关注与讨论。本报告将围绕Manus展开深入探讨，分析其特点、性能优势、可能带来的影响以及面临的挑战等方面内容。链接：https://manus.im/二、Manus的基本概述（一）发布背景
AI人工智能2025年发展趋势及普通人利用AI赚钱的方法 A达峰绮人工智能经验分享赚钱
一、2025年AI人工智能发展趋势（一）增强型工作与人机协作2025年，几乎所有主要的软件工具都将整合生成式人工智能功能。人们将更多地考虑如何与人工智能携手合作，扩展技术能力，把创造性和人际交往技能应用到机器仍然无法管理的工作中。（二）实时自动决策拥有更加成熟的人工智能战略的企业将走向整个业务流程的端对端自动化。这很可能发生在物流、客户支持和营销领域，算法将在这些领域进行决策，带来更高的效率和对变
毕业论文AIGC高？5个方法有效降低AI率，消除AI痕迹！我是宝库 AIGC 人工智能经验分享论文抽检毕业论文 AIGC检测学习方法
现在很多学校要求毕业论文基本都要检测AIGC了。AIGC是指人工智能生成的内容，现在无论是毕业论文还是期刊投稿，都会检测论文是否由AI生成的，比如知网、维普、万方、Turnitin、MasterAI率检测等。如果你的论文使用了AI工具辅助写作，自己提前进行AIGC检测，必要时降低AIGC率是很有必要的，那么，如何降低AIGC率呢？分享5种方法：1、改写句子结构。AI生成的句子通常比较长，句子结构僵
大模型开发教程：从零开始的入门指南！程序员二飞人工智能 java 数据库职场和发展深度学习
概述大模型开发教程引领人工智能领域前沿，从基础概念至实战项目，全面覆盖Python与深度学习框架使用，指导初学者构建线性回归、逻辑回归、神经网络等模型，深入探索图像分类、情感分析等复杂应用，为探索未来智能世界提供坚实基石。前排提示，文末有大模型AGI-CSDN独家资料包哦！二、基础知识2.1人工智能与深度学习的概念人工智能(AI)是计算机科学的一个分支，旨在使计算机能够执行通常需要人类智能的任务。
GAN生成对抗网络小记文弱_书生乱七八糟生成对抗网络人工智能神经网络
生成对抗网络（GAN）深入解析：数学原理与优化生成对抗网络（GenerativeAdversarialNetwork,GAN）是一个基于博弈论的深度学习框架，通过生成器（G）和判别器（D）之间的对抗训练，生成高度逼真的数据。其核心思想是让GGG生成伪造数据以欺骗DDD，而DDD则努力分辨真实数据与伪造数据。GAN在理论上可以看作一个极小极大（Minimax）优化问题。1.GAN的数学公式1.1生成
Nginx安全配置文档笑锝没心没肺 Nginx nginx 安全服务器
Nginx安全配置文档1.配置文档中有多处明确写出了nginx的配置文件路径，该路径是测试环境中的路径，线上系统的nginx配置文件与文档中所写的路径可能不一样，在进行相关配置时，应以线上配置文件的实际路径为准。线上系统nginx的安装目录在：/usr/local/nginx，默认配置文件在/usr/local/nginx/conf/nginx.conf,此外也引用了/usr/local/ngin
Swagger2 多环境安全配置 L烧鱼学习笔记 java swagger
一、生产环境关闭Swagger我们该怎么做？1、在配置文件新增开关#swagger开关swagger2.enable=true2、修改SwaggerConfifig动态设置开关@Configuration@EnableSwagger2publicclassSwaggerConfig{ @Value("${swagger2.enable}") privatebooleanenable; @Be
Spring学习之路：环境搭建、核心API与配置文件细节 qq_44766305 Spring spring java 后端
1.软件版本1.JDK1.8+2.Maven3.5+3.IDEA2018+4.SpringFramework5.1.5官方网站www.spring.io2.环境搭建Spring的jar包#设置pom依赖可以去Maven中央仓库org.springframeworkspring-context5.1.4.RELEASESpring的配置文件1.配置文件的放置位置:任意位置，没有硬性要求2.配置文件命
全网炸裂！这款网站让你一站畅享所有大模型努力敲代码的小火龙 ZealYearning
在科技的浩瀚星空中，人工智能大模型无疑是最为璀璨的星辰，它们以卓越的智慧和强大的能力，为我们的数字生活增添了无尽的魅力与可能。然而，以往想要领略这些不同大模型的风采，我们往往需要在众多的平台和接口之间来回奔波，就像是在不同的岛屿间跳岛前行，过程繁琐且耗时。但是，如今有一个令人心跳加速的消息传遍了整个网络世界：一个前所未有的网站横空出世，它宛如一座神奇的“大模型宝藏库”，在一个网站里就能让你畅享所有
目前人工智能的发展，判断10年、20年后的人工智能发展的主要方向，或者带动的主要产业 meisongqing 人工智能
根据2025年的最新行业研究和技术演进趋势，结合历史发展轨迹，未来10-20年人工智能发展的主要方向及带动的产业将呈现以下六大核心趋势：一、算力革命与底层架构优化核心地位：算力将成为类似“新能源电池”的基础设施，支撑大模型迭代和实时交互。中国通过DeepSeek等技术创新（如MLA注意力机制、FP8混合精度训练）突破算力瓶颈，实现与美国顶尖模型性能对标，成本降低至558万美元/项目。技术突破：量子
在Android Studio中通过CMake实现交叉编译生成动态so文件 H.ZWei Android NDK android studio android Android NDK CMake 动态so文件交叉编译
文章目录NDK工具链基本步骤CMake配置文件aux_source_directoryinclude_directorieslink_directoriesadd_librarytarget_link_libraries将CMake配置文件依赖到Gradle中交叉编译生成动态库参考NDK工具链最近项目上需要将微信语音silk文件格式进行编解码，在silk、PCM、AMR、MP3间进行格式转换，将s
在Vite创建项目中引入Sass弹出The legacy JS API is deprecated and will be removed in Dart Sass 2.0.0 宝子卡粉 javascript 前端 node.js
在Vite创建项目中引入Sass弹出ThelegacyJSAPIisdeprecatedandwillberemovedinDartSass2.0.0原因分析：其实通过报错提供的链接就可以知道，sass提供的某些jsapi即将在v2.0.0的新版本中废弃了，提醒你及时更新解决方案：在配置文件vite.config.js中配置//设置scss的api类型为modern-compilercss:{pr
一文读懂强化学习：从基础到应用 LHTZ 算法时序数据库大数据数据库架构动态规划
强化学习是什么强化学习是人工智能领域的一种学习方法，简单来说，就是让一个智能体（比如机器人、电脑程序）在一个环境里不断尝试各种行为。每次行为后，环境会给智能体一个奖励或者惩罚信号，智能体根据这个信号来调整自己的行为，目的是让自己在未来能获得更多奖励。就像训练小狗，小狗做对了动作（比如坐下），就给它零食（奖励），做错了就没有零食（惩罚），慢慢地小狗就知道怎么做能得到更多零食，也就是学会了最优行为。强
LLM大语言模型书籍：《大模型时代》开启人工智能狂潮！（附文档） Langchain 人工智能 prompt chatgpt ai大模型 LLM 大语言模型大模型时代
哈喽大家好！很久都没有更新大模型这块的书了，今天给大家说一下这本：《大模型时代》，本书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。近2年GPT风靡全球，然而真正的智慧“心脏”却是大型语言模型（LargeLanguageModel）！生成式大型模型正引领我们进入一个崭新的时代。《本书》深入探讨了大型模型时代的技术演进、应用场景和产业变革。生动地阐释了ChatGPT背后的工作原理，深入解
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持