BedivereYang

基于MindStudio的Tensorflow 模型命令行推理一键式精度比对

---以AIPaint为例

对应的视频教程链接：基于MindStudio的Tensorflow模型命令行推理一键式精度比对_哔哩哔哩_bilibili

第1章. 引言...

第2章. 前置知识与基础介绍...

模型推理与模型保存格式...

模型转换（从pb转为om）与图优化...

华为模型转换工具...

精度损失与精度比对工具...

MindStudio软件...

第3章. 环境准备...

MindStudio 安装与基本设置...

和远程开发环境相连...

第4章. 实验...

脚本获取...

启动项目...

查看文件映射关系...

脚本环境设置...

运行脚本与环境变量设置...

结果解析...

第5章. 总结...

第6章. 附录...

遇到的问题以及解决方法...

一些开发建议...

一些文档...

引言

大家好，模型转换是在推理时常见的一种需求，如在Ascend 310上部署应用需要[1] 使用om模型，然而我们通常使用MindSpore 、Tensorflow 或 Pytorch所开发的模型都不是om模型，从而需要对不同的格式进行转换或者称为翻译。模型文件通常包含两部分构成：1. 模型的图信息（包含节点和边）；2. 模型的参数信息（如卷积层kernel的weight）。不同的文件格式代表了其对图信息和参数信息的描述不同，同一个卷积在tensorflow模型格式 pb 和 Pytorch格式的pt中描述不同。

模型转化就是针对不同的格式（或者称为图描述，参数描述）做对应目标的转换。然后这种转换通常会对原始模型做一定程度的优化，如消除一些没用到的图节点，合并算子以及降低数据精度（将fp32转为fp16）。这种操作可能会使得转换后的模型（om模型）精度不如原始模型（pb模型）。这时候为了找到因为算子转换导致的精度差异,通常会将原始模型(pb模型)和转换后模型(om模型)的全图运算信息获取下来(称为dump过程),进行逐算子对比,从而找到差异.

然而获取全图逐算子运算结果是非常复杂的过程.为此本文会向大家介绍一键精度比对工具，以及如何使用MindStudio实现精度的比对。MindStudio 本文主体由基础知识介绍，环境准备，具体实验和总结四部分组成。实验部分是以官方例子AIPaint做基础演示。最后本文是本文档的总结，以及根据笔者的开发经验，总结出一些tips，希望能帮助到各位开发者。在本文中,tools库中的msquickcmp将用来一键生成对比数据,MindStudio将用于精度对比.

提醒：如果对基础知识以及有了较多的了解或者想尽快浏览实验部分的，可以直接跳过第一部分--前置知识和第二部分—环境准备，直接到第三部分的实验和第四部分的总结。

前置知识与基础介绍

模型推理与模型保存格式

推理首先需要固定模型,一般是由训练好的模型前向传播图固定成框架对应的格式,其中与训练不同的是除了个别算子的值(如dropout和bathnorm之类的归一化算子)会发生改变,其他与训练时没有差别. 如tensorflow框架下开发的模型,通常需要保存为pb模式, pytorch框架开发的模型通常会保存为pt格式.除了框架相关的格式外,还有统一的格式:onnx(开放神经网络交换,Open Neural Network Exchange ). 保存的文件一般包含:模型的算子图信息和参数信息, 常见的模型包括om模型都可以使用MindStudio的model visualize 模块或者netron打开查看图结构. 这里需要说明一点, 单纯使用torch.save(“model.pt”,model)保存的模型只有参数信息,并不具有算子网络图信息,只有torch脚本定义的高级图信息(图节点为自定义的module name).通过torch.jit.trace()模拟输入dummy_input，调用traced.save()存储成的pt模型才具有算子级网络图信息.如果需要转为om模型,通常会先将pt转为onnx然后转为om.

模型转换（从pb转为om）与图优化

从原始格式模型转换到目标格式模型,过程涉及到算子和图的格式转换. 在华为Atals 服务器（搭载Ascend 910或者Ascend 310芯片）上，模型加速推理的运行时(CANN Compute Architecture for Neural Networks) 依赖om格式的模型。这里的加速推理指的是使用AICore进行推理.

模型转换可以采用算子级别一对一转换,即只针对模型的算子格式做转换,并不更改更多的内容.模型的值运算通常需要在特定的设备(加速卡等)上做矩阵运算,而模型的赋值操作通常涉及到cpu操作,数据在两种设备之间频繁传递. 为了减少这样的传递, 通常会在原始网络模型基础上做进一步优化. 优化主要包括两个部分: 网络图优化和精度优化. 图优化主要包括:节点级优化(消除没有使用的算子或者全等算子,如 dropout在推理时可以直接去掉), 块级优化(包括常数折叠,算子合并等). 这里我们呈现两个例子:

上图右边是pb模型，左边是对应的om模型，如图所示，出现了多个算子合并，如卷积算子合并，将两个算子合并为一个算子，还有后面的多个算子也是合并为单个算子。这样对于算子的描述就会发生改变，下图是om模型中，一个add算子的描述：

attributes表示该算子其实是一个合并算子（fused op），是将add和relu合在一起的算子。

通常这种优化不会对精度产生任何影响,任何一个优化操作原则上不会对计算结果造成偏差，但是会在一定程度上减少数据的搬运和计算的次数. 然而精度优化例外. 精度的优化通常指的是将fp32的权重值改为fp16的值,从而加速运算. 由于fp32的权重值改为fp16, 部分运算可能会出现精度丢失.一般情况下, fp32的运算改为fp16去算,对结果不会造成太大的影响, 但由于神经网络是由大量的矩阵运算组成,因此很难确保过程中是否会导致较大的值偏移.另外还有一种模型参数精度的优化:将fp32的模型转为int8的模型,从而大大减小模型的参数空间.这一种优化称为模型量化,是另外一个分支.

还有涉及到后端(特定设备)的优化, 如算子调度优化, 内存优化等. 但是这些只影响算子的运行效率,不影响精度. 感兴趣的小伙伴可以参考 The Deep Learning Compiler: A Comprehensive Survey.

华为模型转换工具

将pb, onnx模型转为om模型需要使用到 ATC工具(Ascend Tensor Compiler).该工具集成在 CANN包中, 将开源框架（如 Caffe、TensorFlow、ONNX）和单算子 json 文件的网络模型转换为 Ascend AI Processors 支持的离线模型。在模型转换过程中，可以实现算子调度优化、权重数据重排、内存优化，不依赖设备完成模型预处理。

这里需要说明的是 ATC包含了模型编译的前端和后端。前端指的是将原始格式模型转为高级IR，后端指的是对于设备的代码模型优化，如调度优化和显存优化，从而得到更高的性能。对于后端的调优可以采用auto tune工具。

精度损失与精度比对工具

Om模型推理与pb模型推理的主要精度差异来自俩方面：1. 输入不同导致的精度不同（常见原因有预处理没有对齐），2. 算子精度下降或者算子运算出错。对于第一种精度差异，可以通过对齐预处理来解决。方式是将预处理后的结果直接保存为bin文件，然后pb和om用相同的bin文件作为输入进行推理。注意om模型的输入通常都是32位的，如果保存格式为fp64或者fp16，会导致异常。这里记录一个笔者遇到的问题：transfering gan模型需要输入一个random.normal 的值，np.random.normal得到的是float64类型，如果以此保存为bin文件会导致结果差异较大。

而算子精度下降，需要对比算子的输入输出值，通常需要采集两侧的算子运算过程值。这里采集pb模型推理过程中的算子输入输出可以使用tensorflow.python debug模块，开启debug模型，通过dump得到tensor的信息。Om模型的算子运行结果可以在msame运行时开启dump选项。算子的输入输出值通常都是高维数据，通常采用欧式距离（如l1 距离，l2距离）和相似度（cosine similarity）。现有的集成在CANN包中的精度对比差异计算方式支持如下算法：

0：CosineSimilarity，表示余弦相似度算法。
1：MaxAbsoluteError，表示最大绝对误差算法。
2：AccumulatedRelativeError，表示累积相对误差算法。
3：RelativeEuclideanDistance，表示欧氏相对距离算法。
4：KullbackLeiblerDivergence，表示KL散度算法。
5：StandardDeviation，表示标准差算法。
6：MeanAbsoluteError，表示平均绝对误差。
7：RootMeanSquareError，表示均方根误差。
8：MaxRelativeError，表示最大相对误差。
9：MeanRelativeError，表示平均相对误差。

MindStudio软件

MindStudio提供在AI开发所需的一站式开发环境，支持模型开发、算子开发以及应用开发三个主流程中的开发任务。依靠模型可视化、算力测试、IDE本地仿真调试等功能，MindStudio能够帮助您在一个工具上就能高效便捷地完成AI应用开发。MindStudio采用了插件化扩展机制，开发者可以通过开发插件来扩展已有功能。需要注意的是, MindStudio只有Linux和Windows两个版本,MAC电脑所使用的Unix OS不支持.

MindStudio 类似IDEA 软件，如下图所示，

需要说明的是，通常在Windows服务器上安装MindStudio，昇腾AI设备需要安装对应的驱动、固件、Ascend-cann-toolkit和AI框架包。我们在本地写脚本，然后在云端（昇腾AI设备）执行，如下图所示：

如果您是直接在开发板上写脚本，会不同。本文针对的是以上开发场景。

MindStudio解决了两个问题：文件和云端同步以及脚本能够在云端执行。其中针对远程开发，MindStudio提供了Tools工具，该工具下面包含最常用的Deployment和SSH session工具。

其中Deployment 可以实现脚本的自动上传，SSH能够帮助我们随时链接远程服务器。

Ascend工具

MindStudio 还提供了 Ascend工具，其中包含很多我们开发Ascend应用时需要使用的工具, 如迁移工具(migration tools), 模型转换工具(model converter) , 模型可视化工具(model visualizer),模型精度分析工具(model accuracy analyzer),dump工具等.

Ascend 工具同时操纵远程的昇腾AI设备以及本地的开发环境.部分工具对本地环境有限制,如migration tools需要本地安装有pandas等库, profiler工具需要本地的python3环境能够使用sqlite.

环境准备

本次的实验涉及本地开发环境(window10) 和远程开发环境(Ascend 910服务器).

本地开发环境需要安装python3 和 MindStudio 软件.远程开发环境需要CANN中Ascend-cann-toolkit(开发套件包)。该开发套件是为开发者提供基于昇腾AI处理器的相关算法开发工具包，旨在帮助开发者进行快速、高效的模型、算子和应用的开发。开发套件包只能安装在Linux服务器上，开发者可以在安装开发套件包后，使用MindStudio开发工具进行快速开发.

目前远程开发环境(Ascend 910服务器)一般已经由华为官方配置好了,主要是驱动和CANN包的安装.

MindStudio安装与基本设置

MindStudio软件在本地安装时有环境要求, 为了避免后续出问题,建议遵循先检查环境是否完备,然后再安装软件.

参考链接:

昇腾社区-官网丨昇腾万里让智能无所不及

首先检查本地环境

本地是否有python3.7及以上版本?

在cmd中输入python即可查验.

这里可能出现的问题是不少用户使用Conda或者miniconda实现python的环境管理,而跳过安装python的步骤,而使用anaconda或者miniconda所携带的默认python, 根据笔者的实验,发现: miniconda所自带的python版本通常为3.9, 且部分依赖缺失,如sqlite的dll文件.因此,建议安装独立安装python3.7.

Python3.7 的版本可以通过 Welcome to Python.org 获得. 下载安装文件后,注意将python的路径添加到环境变量的path中. 在window10上可以通过win+s键,然后输入编辑环境快速进入环境变量设置界面.

基于MindStudio的Tensorflow 模型命令行推理一键式精度比对_第7张图片

需要安装一下python包, xlrd==1.2.0 absl-py numpy和pandas.

本地是否有MinGW 和 cmake?

由于部分脚本可能依赖c++和cmake环境, 而在window上安装c++编译器需要使用到MinGW. 通过MinGW-w64 - for 32 and 64 bit Windows - Browse Files at SourceForge.net 下载MinGW ,下载完安装好后,添加bin目录到path路径中,和上面操作相同.

Cmd启动的terminal中输入 gcc –v可以查验gcc是否安装成功.

输入 cmake –version,出现下图所示则说明安装成功.

需要注意的是: 我们可以完全在远程开发环境上安装MindStudio, 而本地只需要安装MobaXterm即可. 在远程开发环境上启动带有界面的MindStudio, 通过MobaXterm中自带的XServer映射远程软件的GPU, 从而实现单机安装MindStudio进行开发. 然而这种连接对网络和设备要求都较高, 会出现高延迟卡顿等情况, 笔者并不推荐, 然而这似乎也是MAC用户使用MindStduio的唯一解.

软件安装

软件包下载地址：昇腾社区-官网丨昇腾万里让智能无所不及

获取[1] 最新的MindStudio exe安装包，含有GUI的集成开发环境。也可以下载zip没安装的软件包, 但是exe能够帮助自动设置路径.可以通过如上的网址校验软件, 确保软件包未被篡改.

双击下载的exe即可实现安装, 可以选择一路next到底.

没有报错就可以看到入口的界面 :

此时完成安装.

和远程开发环境相连

华为的远程环境(除了在华为云ECS上买的Ascend 310推理环境)需要通过secoclient连接昇腾生态众智实验室网络,具体教程链接为:

guide/common/tutorials/昇腾生态众智实验室网络连接指导.md · Ascend/docs-openmind - Gitee.com

在本机中,出现如下所示即可表示连上了华为的昇腾生态众智实验室网络.

我们新建一个项目,测试与服务器的连接.

通过change设置与远程服务器CANN的连接.

点击右侧的进入ssh配置环节, 通过test connect 测试连接是否通达.

出现下图所示表示连接成功.

出现上图表示已经找到了CANN包,如果MindStudio没有自动找到,可以通过如下路径添加 /usr/local/Ascend

实验

脚本获取

本次实验需要使用msame工具实现om模型的推理以及dump功能. msame工具在tools库中. 通过 git clone tools: Ascend tools 获取tools仓库。

另外本次实验需要使用一键精度对比(msquickcmp)工具,参考如下链接:

一键式全流程精度比对 - CANN 5.0.4 开发工具指南 01 - 华为

msquickcmp 工具是一个脚本集, 也在tools下面. 参考链接:

tools: Ascend tools - Gitee.com

启动项目

由于我们本地已经有项目文件，因此我们选择Empty Project

点击finish后便可进入项目。

我们将其转为 Ascend project，以方便使用MindStudio自带的Ascend 工具。

转换后我们可以看到有Ascend工具栏更新了

在这个项目里面，我们会用到 Convert 工具和Accuracy Analyzer工具。

查看文件映射关系

通过Tools Deployment configuration 可以看到本地文件与远程服务器的映射关系。

脚本环境设置

如tools仓库msquickcmp Readme 所示，我们需要额外安装一些pip包。由于910服务器已经安装好了tensorflow, 我们只需要安装 onnxruntime, onnx, numpy skl2onnx pexpect 和gnureadline。

这里还需要readline包，部分机器第一次安装这个包可能会出问题，详见附录部分。

模型准备和转换：

下载相关模型，本次实例用的是msquickcmp 的示例模型，原始模型获取地址

https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/003_ATC_Models/AE/ATC%20Model/painting/AIPainting_v2.pb

om模型获取地址

https://obs-9be7.obs.cn-east-2.myhuaweicloud.com/003_ATC_Models/AE/ATC%20Model/painting/AIPainting_v2.om

但是已有的om模型是基于Ascend310编译的，为了适配当前的环境，我们需要重新编译（转换）pb模型。

可以得到pb文件，通过deployment可以自动同步到本地，注意远程目录的地址，可以通过tools工具栏中的start ssh session启动ssh，然后进入相应的目录实现模型下载。也可以现在本地下载后通过右键文件，deployment到服务器。

在Ascend工具栏中点击model convert，并选择文件后出现如下界面

注意Target SoC Version的选择，因为我们是910服务器所以选择Ascend910A。下面的Input Nodes自动解析是Ascend工具自动在pb文件中查找出的，但是根据netron对模型可视化（这里也可以通过model visualize可视化，但是个人感觉netron可视化界面以及布局方式都比MindStudio好看）。

所以我们需要将上图的objs type改为int32，此过程比较简单，不再截图演示。这里需要说明的是，Ascend工具可能是通过数据大小猜测输入为fp16，因为fp16和int64所占据的空间大小是相同的。

这里我们不做选择，直接next。

不过需要说明的是om可以将预处理集成在其中，从而利用硬件加速预处理。感兴趣的伙伴可以试试。另外因为我们要做dump，需要严格要求模型的输入一致，所以这里不可以使用Data Preprocessing。

下一步是一些高级设置。这里对应初开始的背景介绍。第一个是算子合并(operation fusion)，是图优化的一部分，auto tune会同时优化前后端，但是都只加速运行速度，不影响精度。影响精度的并没有在这里体现出来。查看上图的command preview可以观察到工具是通过将前面的设置转化为command命令实现模型转换，本质上还是调用ATC工具。而ATC工具在模型转换时有一些默认参数。这里我们在ssh界面通过输入 atc –help可以看到很多参数设置，也可以通过如下文档和图看到。

参数概览 - CANN 5.0.4 ATC工具使用指南 01 - 华为

这里额外关注算子调优参数（--precision mode）,他的默认参数是 force_fp16(default).

即强制将转化模型参数从fp32转为fp16.

我们暂时只做了解，不做修改。

图来源华为官网 ATC参数讲解图

点击finish开始转换，查看output可以看到

转换成功。这里我们就准备好了模型，下面开始推理（注意上传文件到远程开发目录下）。

一般来说，推理需要准备推理的输入。一键精度比对工具和msame工具类似支持输入bin文件也支持无数据输入。在无数据输入时，默认根据模型的input随机生成。（如果我们发现部分的推理有问题，可以采用携带bin文件进行精度比对，否则可以使用默认的随机数据作为精度比对。）

运行脚本与环境变量设置

根据msquickcmp文档，需要设置一些环境变量，如下所示：

带有export的都是环境设置。这些环境变量设置需要在运行main.py脚本时使用。main.py有很多参数，如下图所示：

运行main.py首先需要配置python解释器。这里我们选择左上角的Add Configuration添加python脚本的配置。

其中1处添加参数，2处添加前文提及的环境变量，3处设置remote python3.7.5环境。

我的1处配置为：-m ./AIPainting_v2.pb -om ./910om/AIPainting_v2.om -c /usr/local/Ascend/ascend-toolkit/latest -o ./test

2的配置是export环境变量的转换

配置完后，，会出现该标志，msqcmp对应上截图所示的name。点击右边按钮运行脚本。查看run窗口可以看到脚本已经运行。

接下来需要等待一段时间等待运行结束。这里介绍main.py的精度比对原理：

模拟tf debug工具开启tensorflow的debug模型，并通过GDB的接口模拟输入得到pb模型的dump结果。
构建工程目录父目录的msame工具（这里可能会出错，没有msame工具，解决方案详细查看附录）。
通过msame dump om模型的算子运行结果。
比对两者之间的差异生成report文件。

出现如下结果表示比对结束：

红色圈出的部分是msquickcmp给出的总结。

仔细观察输出详细可以发现tf和npu的dump文件地址。msquickcmp会给出总的结果。

通过 ls 可以看到其生成了以.csv结尾的文件，该文件记录了整网比对的结果。

注意dump文件较大，不建议同步到本地。

结果解析

result为一键精度比对分析结果。但是result不具有格式化，结果也不无法自定义，因此我们使用MindStudio的Ascend工具里面的Model Accuracy Analyzer来分析精度差异。

首先我们新建一个task。

随后可以看到new task的配置：注意

output的位置为最后生成的result csv文件的位置（是本地存放的位置）；
Analysis Mode应该为 NPU和GPU/CPU的对比；
Framework 为tensorflow；
NPU Dump的地址为npu dump目录中的最后一层详细看下图的右边部分；
Model File 为om模型的位置；
Ground Truth为pb dump的位置；

这里的Advanced Options如下图所示，可以自定义比对算法，但是本文档不涉及。

随后开始进行比对，可以看到如下图：

左上角是生成的result文件，中间主体部分是对应的表格内容和可视化图。result csv展示了丰富的对比结果，下面是csv中模型比对结果参数说明：

参数	说明
Index	网络模型中融合算子的ID。
OpSequence	部分算子比对时算子运行的序列。即-f参数指定的全网层信息文件中算子的ID。仅配置-r参数时展示。
LeftOp	表示基于昇腾AI处理器运行生成的dump数据的算子名。
RightOp	表示基于GPU/CPU运行生成的npy或dump数据的算子名。
TensorIndex	表示基于昇腾AI处理器运行生成的dump数据的算子的input ID和output ID。
Shape	比对的Tensor的Shape。
OverFlow	溢出算子。显示YES表示该算子存在溢出；显示NO表示算子无溢出；显示NaN表示不做溢出检测。
CosineSimilarity	进行余弦相似度算法比对出来的结果，取值范围为[-1,1]，比对的结果如果越接近1，表示两者的值越相近，越接近-1意味着两者的值越相反。
MaxAbsoluteError	进行最大绝对误差算法比对出来的结果，取值范围为0到无穷大，值越接近于0，表明越相近，值越大，表明差距越大。
AccumulatedRelativeError	进行累积相对误差算法比对出来的结果，取值范围为0到无穷大，值越接近于0，表明越相近，值越大，表明差距越大。
RelativeEuclideanDistance	进行欧氏相对距离算法比对出来的结果，取值范围为0到无穷大，值越接近于0，表明越相近，值越大，表明差距越大。
KullbackLeiblerDivergence	进行KL散度算法比对出来的结果，取值范围为0到无穷大。KL散度越小，真实分布与近似分布之间的匹配越好。
StandardDeviation	进行标准差算法比对出来的结果，取值范围为0到无穷大。标准差越小，离散度越小，表明越接近平均值。该列显示两组数据的均值和标准差，第一组展示基于昇腾AI处理器运行生成的dump数据的数值(均值;标准差)，第二组展示基于GPU/CPU运行生成的dump数据的数值(均值;标准差)。
MeanAbsoluteError	表示平均绝对误差。取值范围为0到无穷大，MeanAbsoluteError趋于0，RootMeanSquareError趋于0，说明测量值与真实值越近似；MeanAbsoluteError趋于0，RootMeanSquareError越大，说明存在局部过大的异常值；MeanAbsoluteError越大，RootMeanSquareError等于或近似MeanAbsoluteError，说明整体偏差越集中；MeanAbsoluteError越大，RootMeanSquareError越大于MeanAbsoluteError，说明存在整体偏差，且整体偏差分布分散；不存在以上情况的例外情况，因为RMSE ≥ MAE恒成立。
RootMeanSquareError	表示均方根误差。取值范围为0到无穷大，MeanAbsoluteError趋于0，RootMeanSquareError趋于0，说明测量值与真实值越近似；MeanAbsoluteError趋于0，RootMeanSquareError越大，说明存在局部过大的异常值；MeanAbsoluteError越大，RootMeanSquareError等于或近似MeanAbsoluteError，说明整体偏差越集中；MeanAbsoluteError越大，RootMeanSquareError越大于MeanAbsoluteError，说明存在整体偏差，且整体偏差分布分散；不存在以上情况的例外情况，因为RMSE ≥ MAE恒成立。
MaxRelativeError	表示最大相对误差。取值范围为0到无穷大，值越接近于0，表明越相近，值越大，表明差距越大。
MeanRelativeError	表示平均相对误差。取值范围为0到无穷大，值越接近于0，表明越相近，值越大，表明差距越大。
CompareFailReason	算子无法比对的原因。若余弦相似度为1，则查看该算子的输入或输出shape是否为空或全部为1，若为空或全部为1则算子的输入或输出为标量，提示：this tensor is scalar。

一一讲解会比较麻烦，这里笔者结合自己的经验介绍主要会观察的几个地方。由于笔者的经验有限，一些错过的地方希望大家能够见谅，并补充在后续的文档里面。

首先我们在众多的评价指标中，cosine similarity是我们比较关注的指标。其次从结果往前看，我们首先找到输出节点。通过netron或者MindStudio 的Model Visualize可以看到

离输出节点最近的是trans_Cast433算子，我们查看table

基于MindStudio的Tensorflow 模型命令行推理一键式精度比对_第40张图片

看到非常相似，只有很小的误差，这误差的来源可能是不同的精度(pb为fp32， om为fp16)导致，但是对整体推理结果应该不影响。

大家可能观察到我们是通过result文件得到可视化table和图的，因此我们也可以直接使用msquickcmp的result文件分析，会得到相同的table和图。

另外我们从scatter diagram看会更加清晰：

中间会有一些算子的精度可能出现了异常，但是总体这种得到了调整。

到此我们完成了一键精度比对。

总结

模型转换过程中出现精度损失可以通过对两个模型进行dump，得到算子级别的差异结果。通过对于算子输入和输出得到精度丢失的算子。比对om和pb或者onnx，进行自动dump和自动计算差异的过程叫做一键精度比对。通过tools库的msquickcmp工具实现一键精度比对，通过MindStudio软件的Model Accuracy Analysis可以得到可视化的结果。

附录

遇到的问题以及解决方法

文件找不到：

通过linux命令查看是否存在文件，如果不存在，则在MindStudio里面执行一下文件上传。

环境依赖问题：

pip 安装 readline 包安装不上。

经查需要安装libncurses5-dev，需要执行sudo apt install libncurses5-dev. 然而我没有sudo权限,因此换了一个有权限的机器。

缺少tfdbg_ascend

ECS中的Ascend310服务器报错如下，这可能是线上的CANN版本过低，没有tfdbg_ascend .

一种方法是升级CANN包。

出现报错No such file or directory: '/tmp/msame'

在run.sh运行完后，可能会出现如下错误。原因是msame工具需要在msquickcmp工具在父级目录。因此我们copy tools里面的msame到/tmp/msame里面。通过执行cp -r xxxx、tools/msmae /tmp/msame，进而重新执行run脚本即可。

模型dump运行时间太长

笔者在实验室还对比了其他的模型，包括vision transformer。但是由于vision transformer太大，导致运行时间过长。

会在pb gdb dump过程中卡很长时间，请耐心等待，或者手动实现dump。

MindStudio 本地与远程同步时等待时间较长问题

不要同步较大的文件，不要设置tools工具栏里面的automatic upload.

一些开发建议

针对不同的问题，采用的不同的方式。以下是笔者针对加速推理方法和精度差异大问题的建议：

如果pb和om结果差异很大（如pb模型的精度为80%，om模型类似随机结果），则可能是前处理或者后处理除了问题。注意查看预处理是否对齐，转成bin文件时是否按照输入要求的格式保存，后处理读取bin文件或者txt文件是否发生精度溢出/不足的情况；
如果pb和om结果相差不大，而且om每次都劣于pb模型，则应该注意ATC转换时是否强制转换为fp16，可以通过设置precison_model为fp32或者allow fp32 to fp16提升模型的参数精度（笔者团队中Animate gan出现了这个问题，强制使用fp32的精度结果就正常了。）；
为了加速推理性能，可以使用auto tune对模型做进一步图优化；
处于更好地在边缘设备上使用模型，建议使用量化模型。Ascend支持int8量化，具体可以参考量化 - CANN 5.0.1 Ascend Graph开发指南 01 - 华为。

一些文档

华为文档：

华为 Ascend int8 量化工具：

量化 - CANN 5.0.1 Ascend Graph开发指南 01 - 华为

华为Ascend ATC工具介绍：

运行流程 - CANN 5.0.4 ATC工具使用指南 01 - 华为

MindStudio 工具安装使用指南：

https://support.huaweicloud.com/devg-MindStudio304/atlasms_02_0023.html

华为Ascend实验室网络连接指南：

guide/common/tutorials/昇腾生态众智实验室网络连接指导.md · Ascend/docs-openmind - Gitee.com

一键对比工具使用指南：

tools: Ascend tools - Gitee.com

AI编译器综述： The Deep Learning Compiler: A Comprehensive Survey

https://arxiv.org/abs/2002.03794

你可能感兴趣的:(人工智能,深度学习,ai)

react native学习record one month jjjjjjjjj¢ react native react native 学习 react.js
ReactNative开发主要面向“跨平台原生App开发”一、基础能力JavaScript/TypeScript•熟练掌握ES6+（async/await、Promise、Map、Set等）•熟悉TypeScript类型系统（常用类型定义、接口、联合类型、泛型）React核心•函数组件+Hook（useState、useEffect、useCallback、useRef等）•状态管理（Contex
(05-29) textView和textField设置光标后移 shushuzhen
//这里设置光标位置，让光标位置后移10textField.leftView=[[UIViewalloc]initWithFrame:CGRectMake(0,0,10,0)];textField.leftViewMode=UITextFieldViewModeAlways;//这里设置光标位置，让光标位置后移10textView.textContainer.lineFragmentPadding
【AIGC工具箱】AIGC重塑生活神器
【AIGC工具箱】AIGC重塑生活神器（一）数字人（1）Sonic（腾讯）（2）HUMVA（二）视频生成（1）HumanDiT（字节跳动）（2）AnimateAnyone2（阿里巴巴）（3）Recraft（4）MIMO（阿里巴巴）（5）Wan2.1（阿里巴巴通义万象）（三）代码辅助（1）Cursor（2）Trae（字节跳动）（3）Qwen2.5-Coder(32B)（阿里巴巴）（4）Roo-Cli
人工智能服务器处理器的全新定义两大头部品牌旗舰款的王者之争！云储存cpu_云服务器处理器_企业服务器处理器
一、旗舰处理器架构解析IntelXeon6900系列代表着英特尔在服务器处理器领域的最新成果，采用增强版Intel7制程工艺打造。该系列最高配置56个物理核心，通过超线程技术支持112个逻辑线程，在处理多线程任务时展现出卓越的性能表现。内存子系统方面，支持8通道DDR5-4800内存配置，最高可扩展至4TB容量，为内存密集型应用提供了充足带宽。特别值得一提的是其集成的AMX高级矩阵扩展指令集，这项
院级医疗AI管理流程—基于数据共享、算法开发与工具链治理的系统化框架 Allen_Lyb 医疗高效编程研发人工智能算法时序数据库经验分享健康医疗
医疗AI：从“单打独斗”到“协同共进”在科技飞速发展的今天，医疗人工智能（AI）正以前所未有的速度改变着传统医疗模式。从最初在影像诊断、临床决策支持、药物发现等单一领域的“单点突破”，医疗AI如今已迈向“系统级协同”的新阶段。曾经，医疗AI的应用多集中在某一特定环节，比如利用深度学习算法分析医学影像，辅助医生进行疾病诊断。这种单点突破式的应用虽然在一定程度上提高了医疗效率，但随着医疗行业对AI技术
python--自动化的机器学习（AutoML） Q_ytsup5681 python 自动化机器学习
自动化机器学习（AutoML）是一种将自动化技术应用于机器学习模型开发流程的方法，旨在简化或去除需要专业知识的复杂步骤，让非专家用户也能轻松创建和部署机器学习模型**[^3^]。具体介绍如下：1.自动化的概念：自动化是指使设备在无人或少量人参与的情况下完成一系列任务的过程。这一概念随着电子计算机的发明和发展而不断进化，从最初的物理机械到后来的数字程序控制，再到现在的人工智能和机器学习，自动化已经渗
react native 之自定义顶部导航栏，实现标题居中可控铁柱同学 React Native react native基础讲解 react-native 导航栏标题居中
本来一直用的都是RN自带的组件react-navigation，但是后面需求有变，需要顶部导航栏目的标题可以自己控制，同一页面的标题根据数据库查出来的内容变化。因此自定义了一个导航栏目，实现需求。关于RN自带的顶部导航栏以及底部导航栏目，请看我的另一篇博客，地址：http://blog.csdn.net/ljfphp/article/details/77940284一、背景1、根据需求，要求点击列
RAID的介绍和实战操作
一RAID的介绍RAID（RedundantAarryofIndependentDisks）：廉价磁盘冗余阵列是一种通过将多个物理磁盘组合成一个逻辑单元来提高数据存储性能、可靠性或两者兼顾的技术。作用：提高性能：通过并行读写（数据分块）加速数据访问。增强容错能力：通过冗余数据（如镜像或校验）防止磁盘故障导致的数据丢失。扩展存储容量：将多个磁盘合并为更大逻辑单元。（简单说就是提高容错以及读写速率）类
React Native打开相册选择图片或拍照 -- react-native-image-picker
官方文档：https://www.npmjs.com/package/react-native-image-picker场景：点击按钮打开相册选择图片或者点击按钮拍照import{launchCamera,launchImageLibrary}from'react-native-image-picker';//...{//调相册选择图片const{assets}=awaitlaunchImageL
STC15单片机实战笔记一未来电子机械工程师单片机STC15实战单片机
新建工程一、新建工程前的准备1、添加型号与头文件到keil第一次新建STC工程时，需要将STC的型号与头文件添加到keil软件中。打开STC-ISP下载工具，切换至keil仿真设置栏，按提示添加即可。2、新建工程文件夹①、在新建工程目录下新建软件开发文件夹用于存放工程文件；②、在软件开发目录下新建user文件夹，用于存放main，public等文件；③、在软件开发目录下新建app文件夹，用于存放应
js运行，控制台显示乱码 wangsrc javascript linux 开发语言
"code-runner.executorMap":{ "javascript":"C:\\ProgramFiles\\nodejs\\node.exe" //node.js的安装路径}参考文章：https://blog.csdn.net/m0_63785629/article/details/129432129
AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
人人皆有神功：AI如何改变程序员的江湖地位？ nbsaas-boot 人工智能大数据
在人类的历史中，每一次技术革命都重新洗牌了社会的力量结构：工业革命带来机器力量的爆发，信息时代成就了程序员的黄金时代。而如今，随着通用人工智能（AGI）和大模型技术的突飞猛进，我们正在步入一个**“人人皆有神功”的AI江湖时代**。当AI成为每个人的智能助手，编程是否还重要？程序员将何去何从？本文将以“武林江湖”的隐喻，探索AI时代的技术平权与社会重构。一、技术平权真的来了吗？过去，程序员之所以被
CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界 AI专题精讲强化学习人工智能强化学习 AI技术应用
温馨提示：本篇文章已同步至"AI专题精讲"CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界摘要中等规模的大型语言模型（LLMs），如参数量为7B或13B的模型，在机器翻译（MT）任务中展现出良好性能。然而，它们仍未能达到最先进的传统编码器-解码器翻译模型，或是如GPT-4（OpenAI,2023）等更大规模LLM的表现。在本研究中，我们致力于弥合这一性能差距。我们首先评估了在机器翻译任
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
view的初始化及控件的懒加载 lifeLL
@implementationPGIndexBannerSubiew-(instancetype)initWithFrame:(CGRect)frame{self=[superinitWithFrame:frame];if(self){[selfaddSubview:self.mainImageView];[selfaddSubview:self.coverView];}returnself;}-
C++ 实现多继承和组合 uj_ C++C++继承和组合
设计一个计算机系统类，由软件和硬件组合而来使用c++的继承和组合思路首先定义一个硬件和软件类，包含各自的数据成员和成员函数采用多继承实现计算机系统类采用组合实现计算机系统最后在main()中进行测试#include#includeusingnamespacestd;classCHard{public:CHard(char*bn){strcpy(bodyname,bn);}CHard(CHard&h
【人脸识别】FROM：提升遮挡状态下的人脸识别效果姚路遥遥人脸识别深度学习计算机视觉人工智能遮挡人脸识别损失
论文题目：《End2EndOccludedFaceRecognitionbyMaskingCorruptedFeatures》论文地址：https://arxiv.org/pdf/2108.09468v3.pdf代码地址：https://github.com/haibo-qiu/from1.前言人脸识别技术已经取得了显著的进展，主要归功于以下三个因素:lossfunctions:Centerlos
AI 浪潮下的锚与帆：工程师文化的变与不变 | 架构师夜生活腾讯云开发者人工智能
目录：一、那些让程序员焦虑的"假消息"二、我们理解的工程师文化三、AI到底改变了什么四、程序员需要学什么新技能五、80后程序员vs00后程序员六、最好的时代永远在前方引言公司食堂里，一个产品经理和一个程序员正在讨论一个让行业都焦虑的话题："AI来了，你们程序员还有什么用？我直接对着机器说需求，它就能给我做出来，我还要你干嘛？你还要给我排期！"产品经理显得有些得意。"你对它说的话它听得懂吗？它生成的
复杂场景检测老翻车？陌讯算法实测提升 40% 2501_92453489 算法视觉计算机视觉视觉检测
在工业质检、安防监控等计算机视觉落地场景中，工程师常面临棘手问题：传统算法在光照突变、目标遮挡等复杂环境下，漏检率高达20%以上，泛化能力不足成为项目落地的最大阻碍。而陌讯AI视觉算法通过架构创新，正在重新定义复杂场景下的检测精度标准。技术解析：从单模态到多模态的跨越传统目标检测模型多依赖单一RGB图像输入，在特征提取阶段容易受环境干扰。以经典的FasterR-CNN为例，其区域提议网络（RPN）
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
python的signal weixin_33690963 python
今天在使用python的signal时，发现第二个传的函数必须是拥有两个函数参数变量的1importsignal2importtime3flag=True4deffunc1(a,b):5print"recieveSIGTERM"6globalflag7print"flag%s"%flag8flag=False9print"flag%s"%flag101112defmain():13signal.s
工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
打卡信奥刷题（1697）用C++实现信奥 P8244 [COCI 2013/2014 #3] KOLINJE Loge编程生活 C++c++算法开发语言青少年编程数据结构
P8244[COCI2013/2014#3]KOLINJE题目描述在一年一度的生猪屠宰会上，屠夫Bajs正在进行活动的最后一个环节——将自己那条屡获殊荣的火腿拿出一部分，分给参加活动的所有人。今年的生猪屠宰会一共有nnn个人参加，其中第iii个人目前已经吃了aia_iai千克火腿。Bajs将自己的火腿按照b1:b2:⋯:bnb_1:b_2:\cdots:b_nb1:b2:⋯:bn的比例分给所有人，
打卡信奥刷题（1150）用C++实现信奥 P2085 最小函数值
P2085最小函数值题目描述有nnn个函数，分别为F1,F2,…,FnF_1,F_2,\dots,F_nF1,F2,…,Fn。定义Fi(x)=Aix2+Bix+Ci(x∈N∗)F_i(x)=A_ix^2+B_ix+C_i(x\in\mathbbN*)Fi(x)=Aix2+Bix+Ci(x∈N∗)。给定这些AiA_iAi、BiB_iBi和CiC_iCi，请求出所有函数的所有函数值中最小的mmm个（如
解决errCode = 2, detailMessage = Table[xx]‘s state is not NORMAL. Do not allow doing ALTER报错胡八一、报错解决 doris 数据库
test_table正处于“后台作业执行中”状态（不是NORMAL），所以FE拒绝新的ALTERTABLE/CREATEMATERIALIZEDVIEW等DDL。要继续操作，必须先让表回到NORMAL。请按下面步骤排查并处理。1、找出到底在跑什么任务--列变更（ADD/DROPCOLUMN、修改键等）SHOWALTERTABLECOLUMNWHERETableName='test_table';-
51单片机定时器时钟微芬 51单片机 51单片机单片机
本章博客实现在LCD1602上展示定时器时钟部分1.main.c注：Sec,Min,Hour可不进行赋值#include#include"Delay.h"#include"LCD1602.h"#include"Timer0.h"unsignedcharSec=55,Min=59,Hour=23;voidmain(){LCD_Init();Timer0Init();LCD_ShowString(1,
NFL的React GPT项目使用指南吕岚伊
NFL的ReactGPT项目使用指南一、项目目录结构及介绍ReactGPT是由NFL团队开发的一个尝试性项目，旨在创建一个自主的React开发者工具，利用AI辅助进行React代码的生成与修改。以下是本项目的主要目录结构和各部分功能简介：├──env#环境变量配置文件所在目录│└──.env#存放OPENAI_API_KEY等敏感信息的环境变量文件├──example#可能包含示例代码或配置的目录
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
Leetcode 523. Continuous Subarray Sum SnailTyan
文章作者：Tyan博客：noahsnail.com|CSDN|1.DescriptionContinuousSubarraySum2.Solution解析：Version1，使用前缀和来解决，遍历数组，求前缀和，求前缀和与k的余数，余数在字典中存在时，则意味着当前前缀和减去之前的前缀和等于k的倍数，此时计算两个前缀和的长度差，如果大于等于2，则返回True，如果余数不存在，则将余数保存在字典中并记
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要