qq_43582235

MindNLP-基于Mindspore2.0的GPT2预训练模型迁移教程

前言

动机

大家好，我是Super_WZB，最近MindSpore快要上线2.0版本了，由于之前主要是参与MindSpore的开发工作，一直想找机会多用一用。而自春节开始也是参与到了一项基于MindSpore的迁移工作，积攒了一些经验，所以最近蹭蹭ChatGPT的热度，搞了一下GPT2的模型迁移工作。目前初步实现了GPT2Model最基础模型的推理，输出精度能够和hugging face中基于Pytorch的实现完全对标。整个流程我感觉非常的顺利，并且也切实的体会到MindSpore目前已经可以说是从“可用”进化到了“易用”的阶段。出于MindSpore布道师的职责，同时更是自己想要分享MindSpore2.0的使用感受，写下这篇基于MindSpore2.0的模型迁移教程，供大家参考。

目的

这篇文章主要目的是为了让大家能够清楚如何用MindSpore2.0来进行模型的迁移，因此更加注重整体的开发流程介绍，针对迁移中代码的编写不会详细讲解，但是会给出样例以及供查阅的文档链接。最终希望读者能够了解迁移模型需要做什么，每一步应该怎么做，做完了应该怎么验证。话不多说，直接开始：

1、前期准备

本章节介绍开发的前期准备工作，简要介绍环境配置、MindSpore安装和寻找迁移参考代码的途径，每一部分的详细操作大家可以百度搜索一下，相关博客非常多，这里就不赘述。这一章节非常的基础，如果已经是老手可以直接跳过。

1.1 寻找参照样例

既然是迁移工作，那么第一件事肯定是确定自己想要迁移的模型，然后找到该模型的开源代码，提供以下几个途径供大家寻找源码，基本上比较知名的模型通过以下几种方式都是可以找到相应代码的：

模型论文源码：一般知名的模型和机构发布的论文和模型都是有开源的，可以直接在github搜这个模型的名字或者论文的题目，找到对应机构的仓库即可
Papers With Code：Paper With Code是一个整合论文和相应开源代码的网址，其中可以查到绝大多数论文以及多框架版本的实现，如果觉得官方的看不懂的话，可以找一些高引用的其他框架版本作为参考源码。
Hugging Face：Hugging face 起初是一家总部位于纽约的聊天机器人初创服务商，他们本来打算创业做聊天机器人，然后在github上开源了一个Transformers库，虽然聊天机器人业务没搞起来，但是他们的这个库在机器学习社区迅速大火起来。目前已经共享了超100,000个预训练模型，10,000个数据集，变成了机器学习界的github。那其实看起来这个网站和PaperWithCode很类似，但是它胜在有模型使用教程，同时有演示窗口，并且调用非常方便。

1.2 Git操作

找到了参考代码之后，大家会发现这些源码基本上都是保存在GitHub上的，因此为了更方便的查阅我们需要迁移的代码，以及跳转和搜索可能存在的依赖函数，我建议大家把参考代码Clone到本地，然后进行对照开发：

常用的git操作可以参考这篇博客：[Git的下载、安装与使用](https://blog.csdn.net/weixin_45060125/article/details/129318796#:~:text=Windows下的Git的下载、安装与使用教程 1 2.1 命名 2 2.2 创建仓库 3,2.4 查看修改文件内容 5 2.5 检查修改次数、时间和修改人 6 2.5 返回历史版本)

1.3 环境配置

1.3.1 自有硬件

如果大家自己有硬件资源，比如CPU、GPU、服务器，那么可以在自己的电脑本地配置神经网络的运行环境，主要包括以下步骤：

安装anaconda：anaconda是一个非常便捷好用的包管理工具，基本上大家都使用它来管理python运行环境，安装流程参考：anaconda安装-超详细版-CSDN博客
创建并激活虚拟环境：安装好了anaconda之后就可以创建虚拟环境了，之所以要创建自己的虚拟环境是因为不同的项目和开发者需要的运行环境不同，需要的包不同，即使需要同样的包可能需求的版本也不同，因此最好是对每一个项目创建一个单独的虚拟环境，以免影响他人使用，创建虚拟环境流程参考：使用 Anaconda 创建 Python 虚拟环境-CSDN博客
安装依赖包：python开发的一大优势就是有非常多可以直接安装调用的依赖包，这些包中包含了大量奇奇怪怪非常有用的接口，可以大大简化python项目的开发难度。因此大部分基于python的项目都导入了非常多的依赖包，在运行之前必须将它们都安装好否则会报错，依赖包通常采用pip安装的方式，可以从以下几个网址下载：

PyPI · The Python Package Index（官网，可能需要科学上网，不该镜像的话默认从这里下载）

pip更换软件源方法-CSDN博客（如果官网下载异常，可以参考博客切换以下国内镜像）

http://mirrors.aliyun.com/pypi/simple/ （阿里云镜像）
https://pypi.mirrors.ustc.edu.cn/simple/ （中国科技大学镜像）
http://pypi.douban.com/simple/ （豆瓣镜像）
https://pypi.tuna.tsinghua.edu.cn/simple/ （清华大学镜像）
http://pypi.mirrors.ustc.edu.cn/simple/（中科科学技术大学镜像）

1.3.2 启智社区

OpenI 启智新一代人工智能开源开放平台

启智AI协作平台，简称启智社区，是一个开源在线Web应用，旨在为人工智能算法、模型开发提供在线协同工作环境，它提供了代码托管、数据集管理与共享、免费云端算力资源支持(GPU/NPU)、共享镜像等功能。

启智平台是可以直接在线创建网络运行环境的平台，里面可以白嫖GPU/NPU资源，配置也非常容易，个人感觉非常的好用，如果大家没有自己的硬件资源的话可以创建一个账号，用启智来进行调试：

GPU调试参考：OpenIOSSG/MNIST_PytorchExample_GPU - OpenI - 启智AI开源社区提供普惠算力！

NPU调试参考：OpenIOSSG/MNIST_Example NPU - OpenI - 启智AI开源社区提供普惠算力！

1.4 安装MindSpore

1.4.1 MindSpore简介

安装之前，请允许我先介绍和宣传一下MindSpore：MindSpore官网介绍

昇思MindSpore是一个全场景深度学习框架，旨在实现易开发、高效执行、全场景覆盖三大目标。

其中，易开发表现为API友好、调试难度低；高效执行包括计算效率、数据预处理效率和分布式训练效率；全场景则指框架同时支持云、边缘以及端侧场景。

昇思MindSpore总体架构如下图所示：

ModelZoo（模型库）：ModelZoo提供可用的深度学习算法网络，也欢迎更多开发者贡献新的网络(ModelZoo地址)。
Extend（扩展库）：昇思MindSpore的领域扩展库，支持拓展新领域场景，如GNN/深度概率编程/强化学习等，期待更多开发者来一起贡献和构建。
Science（科学计算）：MindScience是基于昇思MindSpore融合架构打造的科学计算行业套件，包含了业界领先的数据集、基础模型、预置高精度模型和前后处理工具，加速了科学行业应用开发。
Expression（全场景统一API）：基于Python的前端表达与编程接口，支持两个融合（函数/OOP编程范式融合、AI+数值计算表达融合）以及两个统一（动静表达统一、单机分布式表达统一）。
第三方前端：支持第三方多语言前端表达，未来计划陆续提供C/C++、华为自研编程语言前端-仓颉（目前还处于预研阶段）等第三方前端的对接工作，引入更多的第三方生态。
Data（数据处理层）：提供高效的数据处理、常用数据集加载等功能和编程接口，支持用户灵活地定义处理注册和pipeline并行优化。
Compiler（AI编译器）：图层的核心编译器，主要基于端云统一的MindIR实现三大功能，包括硬件无关的优化（类型推导、自动微分、表达式化简等）、硬件相关优化（自动并行、内存优化、图算融合、流水线执行等）、部署推理相关的优化（量化、剪枝等）。
Runtime（全场景运行时）：昇思MindSpore的运行时系统，包含云侧主机侧运行时系统、端侧以及更小IoT的轻量化运行时系统。
Insight（可视化调试调优工具）：昇思MindSpore的可视化调试调优工具，能够可视化地查看训练过程、优化模型性能、调试精度问题、解释推理结果（了解更多)。
Armour（安全增强库）：面向企业级运用时，安全与隐私保护相关增强功能，如对抗鲁棒性、模型安全测试、差分隐私训练、隐私泄露风险评估、数据漂移检测等技术（了解更多）。

对昇思MindSpore感兴趣的开发者，可以参与昇思MindSpore的社区并一键三连（Watch/Star/Fork）。

1.4.2 MindSpore安装

MindSpore官网就有非常详细的安装教程，大家可以按照官网的步骤进行安装：

MindSpore安装指南

2、网络迁移

神经网络其实可以理解为搭积木，而不同框架就可以理解为不同品牌的积木包，比如有乐高、森宝、启蒙等等，不同品牌的积木包中肯定有非常多的积木是类似可代替的。

比如A品牌推出了一个Super Mario超级马里奥的积木套装，而我们手头有B品牌的零散积木，只要我们有了这个Super Mario的搭建步骤图，我们同样可以用B品牌的积木构造出一个基本相同的Super Mario。

那么我们将品牌A替换为框架A、品牌B替换为MindSpore、积木替换为需要用到的API接口，构建图替换为GPT2的论文。那么：

我们有了基于框架A的GPT2模型，而我们手头有MindSpore中大量的可调用接口，那么我们只需要参照GPT2的网络结构图和原论文，就可以用MindSpore写出一个基本相同的GPT2模型，这个过程就是模型迁移。

经过上面的例子，大家应该大致了解网络迁移是在干个什么事情，而实际上网络的迁移工作也非常简单，主要考验开发者对于网络模型构建以及多种深度学习框架的熟悉情况。不过不同的模型网络结构肯定是不相同的，因此本章节只会介绍迁移流程和每一步应该做什么，具体怎么迁移就需要大家读懂源码，然后参照我给出的api映射表具体问题具体分析。

首先介绍一下后续迁移讲解用到的资源情况：

参考源码：hugging face transformers GPT2模型（Pytorch实现）transformers/src/transformers/models/gpt2 at main · huggingface/transformers (github.com)
开发环境：Linux 服务器，GPU GeForce RTX 3090
开发工具：Pycharm（远程连接服务器）
框架版本：MindSpore2.0.0 GPU版本， Pytorch 1.8.1，Transformers v4.26.1

2.1 源码下载

2.1.1 参考源码下载

前往huggingface/transformers仓库下载transformers包

之后找到迁移需要用到的configguration_gpt2.py配置文件和modeling_gpt2.py模型文件（没有后缀的一般是pytorch实现，带tf的是tensorflow实现，我个人对于pytorch更熟悉一些所以选择pytorch版本进行迁移）

使用pycharm远程连接，可以直接访问文件代码：

2.3.1 MindNLP仓库下载

由于迁移之后的源码是需要合入到MindNLP仓库的，因此大家需要去MindNLP官方GitHub仓库进行一键三连（watch+fork+star）

目前MindNLP中已经有了Bert模型的迁移代码，因此我们是可以将这个bert.py与hugging face中的bert代码进行对比来学习应该如何迁移的：

下载好之后同样用pycharm打开，刚下载的mindnlp打开图示的models界面是没有gpt2这个文件夹的，这个是大家需要根据自己的模型创建的，用于存放之后迁移之后的相关文件。我的是GPT2所以创建为gpt2，其他模型同理。

之后在该文件夹下新建init___.py、config_gpt2.py、gpt2.py三个文件，作用分别是：

使得当前文件夹可以被识别为一个模块用于import和调用
GPT2参数文件
GPT2模型文件

2.2 API映射

下载好了参考源码和MindNLP仓库之后我们就可以正式开始网络迁移了，经过上面搭积木的例子，大家其实应该知道我们需要做的其实就是把参考源码中所使用框架（我参考的是pytorch，之后都以它来讲解）的API替换为MindSpore中的API即可。

2.2.1 直接API映射

下面举一个非常简单的例子：

GPT2MLP的迁移：

得益于MindSpore中API命令的规范化和统一化，我们可以发现从左边基于pytorch的实现迁移到右边基于mindspore的实现基本上可以直接复制粘贴，图中的Conv1D和ACT2FN是左边hugging face源码自己封装的类别，后面会讲解。而这个GPT2MLP中其他的代码基本上是直接照搬即可，唯一的差异就是这个nn.Dropout()中的参数有些许不同，这个在2.3API差异中会介绍。

通过这一个例子大家会发现其实迁移还是非常简单的，只要把代码逻辑甚至直接把代码搬过来就行了。这得益于目前MindSpore完善的API接口库，大部分神经网络需要用到的接口都是有的，并且对于输入输出等参数的设置也是向大众的一致标准靠齐的，所以会用其他框架就一定能很快的上手MindSpore（打波小广告哈哈哈）。

下面是更多直接API映射的例子：

大家会发现，这些直接API映射的例子里面存在一些参数或者名字不对应的情况，这将会在2.3 API差异中为大家讲解。

2.2.2 hugging face自封装类别和函数迁移

还是以GPT2MLP举例，其中的Conv1D类别是hugging face实现GPT2时自己封装好的类别：

那我们需要做的其实也很简单，把这个类别也迁移过来就好了。而关于这个类别该迁移到哪个文件，这个可以选择迁移到自己的模型文件（即gpt2.py），也可以参照hugging face中的文件路径在MindNLP中相应路径新建文件来保存。我这里以迁移到gpt2.py为例：

迁移之后呢，这个hugging face自定义的Conv1D类别我们也可以直接使用啦：

2.3 API差异

接下来讲一下迁移中出现的API名字或者参数存在差异的问题，API差异主要包括API命名差异、API参数差异、API功能差异。

2.3.1 命名差异

命名差异就是说MindSpore某个接口和pytorch等其他框架的功能是一致的，但是API的名字不同，这时候我们就需要查询pytorch等其他框架中某个API在MindSpore的名字叫啥，而这就需要用到MindSpore官方给出的pytorch/tensorflow API映射表：

可以看到其中收纳了绝大多数常用的API接口，我们只需要在网页中搜索原来pytorch/tensorflow的API名就可以找到MindSpore这边对应的API名字，并且MindSpore这边还非常细致的给出了每个API映射之间的关系，是完全一致、还是存在差异，点赞。

PyTorch与MindSpore API映射表

TensorFlow与MindSpore API映射表

这两张映射表非常重要，是迁移的基础，一定要收藏、一定要收藏、一定要收藏

比如这张图中的差异nn.ModuleList是因为Pytorch中网络都继承了nn.Module类别，而MindSpore网络继承的是nn.Cell类别，因此命名有些不同：

这个差异是可以在映射表中查到的，并且没有显示存在差异，所以我们直接给它替换掉就解决啦：

2.3.2 参数差异

（1）参数值差异

参数值差异是指pytorch/tensorflow与MindSpore中API的名字相同，但是一些参数的名字或者参数的含义不同，导致API在使用时功能会产生差异，比如最经典的nn.Dropout§差异：

PyTorch中默认输入nn.Dropout(0.2)时代表有每个参数有20%的概率被丢弃，而如果在MindSpore中不指定参数名直接输入nn.Dropout(0.2)的话代表每个参数有（1 - 0.2）即80%的概率被丢弃。这就是一个非常经典，如果大家有长期使用MindSpore的话肯定知道的差异，当然最新的版本中已经提示这种默认写法将会删除，之后就也可以直接使用nn.Dropout(0.2)啦：

（2）参数初始化差异

这一块主要是有一些网络API的参数在初始化时存在不同，不要小看初始化的差异，有时候网络结构都是对的，但是结果就是对标补上，很有可能就是某些网络的参数初始化不一样，导致结果大相径庭。

比如将PyTorch线性层nn.Linear()映射为MindSpore线性层nn.Dense()：

从Pytorch的官网来看，他的nn.Linear线性层中的weight和bias应该是用均匀分布初始化的

而MindSpore中的nn.Dense线性层中weight使用normal初始化的，而bias使用zeros初始化的

2.3.3 功能差异

其实大部分的功能差异都是因为2.3.2中参数没设置好，但是也存在一小部分API确实是功能有差异，这里举一个很简单的例子：

torch中的Tensor.transpose在MindSpore中应该是swapaxes

而MindSpore中的Tensor.transpose实际上对应torch.Tensor.permute

所以如果不仔细检查，看到mindspore中有transpose API就直接迁移过来的话最后的结果往往是不正确。因此大家在迁移时一定要仔细核对每一步迁移的API是否是正确的映射，多查表、多查表、多查表！！！

2.4 API缺失

极少出的情况会出现pytorch/tensorflow中的API在MindSpore查不到的情况：

如果缺失的API是非常重要并且常用，那么大家可以在mindspore官方gitee仓库中提交issue申请补充该API（但是一般常用的APi都已经有了，很少有这种情况）
如果该API在numpy中有相应实现，我们可以调用numpy的 API生成数据之后再用mindspore.Tensor包装起来：

比如mindspore中没有这个finfo API

我们可以用numpy.finfo得到相同的数据之后包装成mindspore.Tensor
如果该API使用频率不高，并且numpy中也没有相应实现，那么我们可以自己用python写一个类来实现该API的功能。即写一个类，实现其初始化函数和运行函数，然后调用即可，具体实现方法这里就不赘述。

2.5 注意事项

如果存在Dropout、BatchNorm等训练和预测阶段行为不一致的，或存在随机性的，需要将模块设置为预测模式：

Pytorch：module.eval()

MindSpore: cell.set_train(False)
MindSpore和Pytorch的参数命名可能不同，如：

Pytorch: nn.Embedding.weight, MindSpore: nn.Embedding.embedding_table

Pytorch: nn.BatchNorm1d.weight, MindSpore: nn.BatchNorm1d.gamma

Pytorch: nn.BatchNorm1d.bias, MindSpore: nn.BatchNorm1d.beta
由于框架机制不同，Pytorch部分操作无需转换，直接删除即可：

Tensor.contiguous()

Tensor.to(device)

3、迁移验证

清楚了网络迁移应该干什么，以及如何查找对应的API之后，我们就可以对自己迁移的网络进行验证了，验证主要包括两个方面：输出shape验证、输出精度验证，验证流程从小到大依次为单模块验证、整网验证、checkpoint验证。

3.1 单模块验证

单模块验证就是对网络中每个单独的模块进行验证，比如对于迁移好的GPT2MLP：

我们需要对它进行测试验证，那怎么做呢？实际上网络说复杂了是网络，说简单点就是一堆函数的拼接，我们测试的一个模块就是一个小的函数，只不过它是一个类别的正向运行函数（forward/construct，只是命名差异，pytorch中叫forward，mindspore中叫construct）罢了。所以想要验证迁移结果是否正确，我们只需要实例化迁移前和迁移后的两个类别，然后给他们的正向运行函数输入相同的数值，再对标两个函数的输出结果即可。以下给出简单的实现：

import numpy as np
import modeling_gpt2, gpt2, configuration_gpt2, config_gpt2

if __name__ == "__main__":
    config_pt = configuration_gpt2.GPT2Config()    // 获取pytorch的配置
    config_ms = config_gpt2.GPT2Config()           // 获取mindspore的配置
    
    pt_net = modeling_gpt2.GPT2MLP(config_pt)      // 实例化pytorch的GPT2MLP模块
    ms_net = gpt2.GPT2MLP(config_ms)               // 实例化mindsproe的GPT2MLP模块
    
    input_np = np.random.randint(0, 10, (2, 512))  // 使用numpy随机生成一个shape为(2, 512)的numpy.array
    pt_input = torch.tensor(input_np)              // 将numpy.array转化为pytorch.Tensor
    ms_input = mindspore.Tensor(input_np)          // 将numpy.array转化为mindspore.Tensor

    pt_out = pt_net(pt_input)                      // 调用pytorch正向函数GPT2MLP.forward()计算结果
    ms_out = ms_net(ms_input)                      // 调用mindspore正向函数GPT2MLP.construct()计算结果
    
    assert pt_out.size() == ms_out.shape           // 对比pytorch和mindspore输出的shape，必须相同否则迁移出错
    
    loss = 1e-3                                    // 精度误差一般为1e-5，最大为1e-3，必须小于1e-3否则迁移出错
    assert np.allclose(pt_out.detach().numpy(), ms_out.asnumpy(), loss, loss) // 将结果全部转成array然后对比精度

最终我们的目的就是要给pytorch和mindspore的两个模块输入相同的数据，他们的输出shape完全一致，精度误差在1e-3之内就代表该模块基本迁移成功了。每个模块都这样子验证正确之后，我们就可以尝试把整个网络搭建起来然后进行验证了

3.2 整网验证

整网验证其实和每个模块测试验证没啥区别，网络说白了就是个大函数，所以就把GPT2MLP改成GPT2Model其实就差不多了，无非就是输出可能多几个。

当然我说的仅仅只是测试代码很好写，和模块测试没啥区别，但是整个网络连起来之后可能会出现单模块测试时未出现的bug，这也很正常，如果出现bug一点点debug检查就好了。

import numpy as np
import modeling_gpt2, gpt2, configuration_gpt2, config_gpt2

if __name__ == "__main__":
    config_pt = configuration_gpt2.GPT2Config()    // 获取pytorch的配置
    config_ms = config_gpt2.GPT2Config()           // 获取mindspore的配置
    
    pt_net = modeling_gpt2.GPT2Model(config_pt)      // 实例化pytorch的GPT2MLP模块
    ms_net = gpt2.GPT2Model(config_ms)               // 实例化mindsproe的GPT2MLP模块
    
    input_np = np.random.randint(0, 10, (2, 512))  // 使用numpy随机生成一个shape为(2, 512)的numpy.array
    pt_input = torch.tensor(input_np)              // 将numpy.array转化为pytorch.Tensor
    ms_input = mindspore.Tensor(input_np)          // 将numpy.array转化为mindspore.Tensor

    pt_out = pt_net(pt_input)                      // 调用pytorch正向函数GPT2MLP.forward()计算结果
    ms_out = ms_net(ms_input)                      // 调用mindspore正向函数GPT2MLP.construct()计算结果
    
    assert pt_out.size() == ms_out.shape           // 对比pytorch和mindspore输出的shape，必须相同否则迁移出错
    
    loss = 1e-3                                    // 精度误差一般为1e-5，最大为1e-3，必须小于1e-3否则迁移出错
    assert np.allclose(pt_out.detach().numpy(), ms_out.asnumpy(), loss, loss) // 将结果全部转成array然后对比精度

最终我们需要达到的目的和模块验证一致，向pytorch和mindspore的整个网络输入相同的数据，最终要求网络输出的个数相同、shape一致、精度误差在1e-3以内。满足以上要求我们就可以进行最后的checkpoint验证了。

3.3 checkpoint验证

以上的验证都是在检查网络的流程以及计算是否正确，而其中网络的参数都是随机初始化的，而为了达到迁移的最终目的：”直接调用训练好的预训练模型，可以达到与原论文相同的结果“。我们必须将预训练好的模型参数checkpoint导入进来，然后在”指定参数“的情况下再进行一次整网验证，如果也能够满足网络输出的个数相同、shape一致、精度误差在1e-3以内的要求，那么我们的checkpoint验证也就成果啦，这就说明这个GPT2Model真正迁移成功了。下面我简要介绍一下应该如何进行checkpoint验证

3.3.1 checkpoint下载

一般NLP这边的大模型官方是有预训练的参数的，但是有些官方放出来的网站死活就是打不开，因此我还是推荐大家使用hugging face中来下载checkpoint：

以GPT2为例，我们前往GPT2的hugging face网址gpt2 at main (huggingface.co)，点击其中的Files and version，这个界面存放了gpt2不同版本的配置文件以及模型预训练参数，我使用的是pytorch版本，因此我下载pytorch_model.bin以及pytorch和tensorflow通用的config.json配置文件。

将pytorch_model.bin和config.json上传到服务器的同一个文件夹内：

接下来进行checkpoint的导入和转换

3.3.2 checkpoint导入与转换

由于我们手上的是pytorch的预训练参数，所以我们先参照hugging face中提供的使用样例将这个pytorch_model.bin导入

（1）导入pytorch预训练参数

import torch
from transformers import GPT2Model, GPT2Config

model_name = '/home/xxxxxx/wzb/mindnlp/pt_pretrained'               // pytorch checkpoint存放路径
model_config = GPT2Config.from_pretrained(model_name)               // 导入GPT2配置
pt_net = GPT2Model.from_pretrained(model_name, config=model_config) // 导入GPT2 checkpoint中的参数

（2）创建MindSpore的GPT2Model模型

import mindspore
from mindnlp.models.gpt2 import gpt2, config_gpt2

ms_config = config_gpt2.GPT2Config()                                // 获取mindspore GPT2配置
ms_net = gpt2.GPT2Model(config=ms_config)                           // 创建mindspore GPT2Model

（3）核对参数是否对应

获取pytorch和mindspore的网络参数字典，而由于pytorch和mindspore中有部分网络参数的命名不同，所以我们需要核对一下两边的参数是不是都能对应的上：

pt_dict = pt_net.state_dict()                                       // 获取pytorch整网参数字典
ms_dict = ms_net.parameters_dict()                                  // 获取mindspore整网参数字典

常见参数命名差异对比

pytorch	mindspore
weight	embedding_table（embedding层）
weight	gamma（Dense线性层）
bias	beta（Dense线性层）

获取了pt_dict和ms_dict之后我们可以将他们打印出来看看参数是否能够对应：

for pt_key in pt_dict:                                               // 打印pytorch所有参数名
    print(pt_key)
print("+++++++++++++++++++++++++++++++++++++++++")                   // 分界线
for ms_key in ms_dict:                                               // 打印mindspore所有参数名
	print(ms_key)

打印出来之后自己人眼核对那可太累了，我推荐大家使用excel来进行比对。由于print()会自动换行，所以我们将pytorch和mindspore的参数复制之后直接粘贴到excel表格中的两列，复制好之后第一件事就是直接看一下两边的参数个数是否相同（查看这两列的行数是否相同）：

粘贴之后，由于我们知道存在一些命名的差异，因此我们点击mindspore这一列然后ctrl+f之后选择替换，将gamma换成weight，将beta换成bias，得到：

之后我们利用Excel的Exact()函数直接比较pytorch和mindspore每一行的字符串是否相同：

可以看到，除了前两行，后面的参数都是一致的，而前两行不一致其实也是正常的，因为只有一个embeeding层，所以我就没有将embedding_table替换为weight，实际上是对的，至此参数全部对应正确后核对结束。

（4）参数导入

参数对应一致后，我们需要将pytorch网络的参数导入mindspore的网络，同时需要注意对名称不一致参数的替换处理：

for key, parameter in ms_net.parameters_and_names():                // 获取ms模型的参数名和数值
    if 'embedding_table' in key:                                    // 参数名中的embedding_table替换为weight
        key = key.replace('embedding_table', 'weight')
    elif 'gamma' in key:
        key = key.replace('gamma', 'weight')                        // 参数名中的gamma替换为weight
    elif 'beta' in key:
        key = key.replace('beta', 'bias')                           // 参数名中的beta替换为bias
    // 依据key获取pytorch中相应参数的数值并赋给mindspore当前参数parameter，上面替换参数名就是为了get(key)的时候不会找不到
    parameter.set_data(mindspore.Tensor(pt_dict.get(key).detach().numpy()))

参数全部正确导入之后我们就可以进入最终的checkpoint整网验证了

3.3.3 checkpoint整网验证

获取了Pytorch和MindSpore导入了参数的网络后，我们就可以和之前的3.2整网验证一样，构造输入然后验证输出是否对标，最终整体代码如下：

import torch
import mindspore
import numpy as np
from transformers import GPT2Model, GPT2Config

from mindnlp.models.gpt2 import gpt2, config_gpt2

if __name__ == "__main__":
    model_name = '/home/xxxxxx/wzb/mindnlp/pt_pretrained'
    model_config = GPT2Config.from_pretrained(model_name)
    pt_net = GPT2Model.from_pretrained(model_name, config=model_config)
    ms_config = config_gpt2.GPT2Config()
    ms_net = gpt2.GPT2Model(config=ms_config)

    pt_dict = pt_net.state_dict()
    ms_dict = ms_net.parameters_dict()
    for key, parameter in ms_net.parameters_and_names():
        if 'embedding_table' in key:
            key = key.replace('embedding_table', 'weight')
        elif 'gamma' in key:
            key = key.replace('gamma', 'weight')
        elif 'beta' in key:
            key = key.replace('beta', 'bias')
        parameter.set_data(mindspore.Tensor(pt_dict.get(key).detach().numpy()))

    input_ids = np.random.randint(0, 10, (2, 512))
    pt_input = torch.tensor(input_ids)
    ms_input = mindspore.Tensor(input_ids)

    pt_out = pt_net(pt_input)
    ms_out = ms_net(ms_input)

    assert pt_out.size() == ms_out.shape
    print("shape对标通过")

    loss = 1e-3
    assert np.allclose(pt_out.detach().numpy(), ms_out.asnumpy(), loss, loss)
    print("精度对标通过，误差：%f", loss)

如果最终输出个数、shape和精度全部通过，那么恭喜你网络GPT2Model迁移成功，之后你只需要重复以上的操作，把其他的GPT2变形全部迁移成功，本次MindNLP的预训练模型迁移工作就做完成了，完结撒花！！！

总结

通过本文的阅读，大家应该是能够了解MindNLP的预训练模型迁移工作需要做什么，怎么做以及怎么验证结果。而如果大家能够独立完成一个Model的迁移工作，就会发现目前的MindSpore2.0.0实际上已经比较好用了，API丰富并且映射表格非常详细，对于差异的描述也非常清晰，报错信息也比之前精准多了（当然还是需要努力）。看来在大家共同的努力下，MindSpore还是取得了非常显著的提升，当然距离最初设想的动静统一目标还是有不小的差距，还是需要不断的查漏补缺。

综合来说，国产深度学习框架的发展道阻且长、任重而道远，很开心自己能够为其贡献自己的一份力。同时作为昇思MindSpore的布道师我想说：从未使用过MindSpore的同学可以基于这篇文章来体验一下MindSpore，曾经使用过但是因为各种原因“退坑”了的同学也不妨试一下MindSpore2.0，真的比以前的体验好了很多！

那么就到这了，下次再见！我是Super_WZB，一个想像超级马里奥一样顶破砖块不断上升的程序员。

你可能感兴趣的:(MindSpore,人工智能,深度学习,神经网络,华为,开源)

pip方式安装MindSpore Ascend版本
pip方式安装MindSporeAscend版本参考：https://www.mindspore.cn/install/本文档介绍如何在Ascend环境的Linux系统上，使用pip方式快速安装MindSpore。安装MindSpore与依赖软件下表列出了安装MindSpore所需的系统环境和第三方依赖。软件名称版本作用Ubuntu18.04/CentOS7.6/EulerOS2.8/openEu
Tesla的FSD 架构设计 WSSWWWSSW 智能驾驶汽车人工智能 FSD
特斯拉的FSD（完全自动驾驶）架构设计以端到端神经网络为核心，结合专用硬件加速、海量数据训练和持续OTA迭代，形成了一套高度集成的系统。以下从硬件、软件、算法、数据处理和安全机制五个维度展开分析：一、硬件架构：从HW3.0到AI5的算力跃迁HW3.0基础设计采用三星14nm工艺的定制SoC，包含12个Cortex-A72CPU核心、2个NPU（合计73.7TOPS算力）和Mali-G71GPU，支
深入解读MaaS技术架构：从模型服务到智能部署的全流程分析 Cc不爱吃洋葱架构人工智能大语言模型大模型智能部署 MaaS技术架构 LLM
随着人工智能（AI）的迅速发展，MaaS（ModelasaService，模型即服务）技术架构应运而生。它通过将复杂的AI模型封装为标准化服务，降低了模型的开发和部署门槛，帮助企业快速实现业务场景的智能化升级。本文将深入解析MaaS技术架构，详细阐述其各个组成部分以及如何在实际应用中高效发挥其功能。一、使用方层：从应用接入到业务赋能MaaS技术架构的顶层是使用方层，它主要面向第三方应用，是企业与M
记一次frp使用，公网映射内网穿透林间6 部署网络
目录1、准备工作1.1文件下载1.2公网IP准备2、服务端2.1文件配置2.2服务启动3、客户端3.1文件配置3.2服务启动为方便自己测试，有时候会需要把家里或者其他地方的服务映射到公网上，便于访问或者本地调试，这时候就需要将内网映射到外网上，常用的工具有花生壳、netapp等，但是大多需要收费，我仅是自己调试用，不需要太稳定，因此采用frp免费开源工具。frp32位64位frp内网穿透内外网映射
想要了解大模型，看懂这一篇就够了！大模型工作流程及核心参数介绍！ Gq.xxu qwen3 vllm transforms 大语言模型部署深度学习人工智能
若想深入探究大模型核心参数的效果与作用，就务必先弄清大模型的工作流程，明确核心参数在流程各阶段的效能与功能，知晓其具体含义。一，大模型的工作流程大模型运行时的工作原理可以概括为输入处理→特征提取→模型推理→结果生成四个核心阶段，整个过程融合了深度学习架构、自然语言处理技术以及分布式计算能力。从用户输入到大模型输出，整个工作的处理流程如下：输入文本→分词→嵌入+位置编码→Transformer多层处
LSTM 论文（Hochreiter & Schmidhuber, 1997）精读（三）
文章：SeppHochreiter,JürgenSchmidhuber;LongShort-TermMemory.NeuralComput1997;9(8):1735–1780.doi:https://doi.org/10.1162/neco.1997.9.8.1735第2节PreviousWork（已有研究），这是论文对以往方法的一个评述，总结了已有递归神经网络在面对时间序列学习、尤其是长时依赖
深入理解Tomcat 基本架构水木石画室 tomcat 架构 java
Tomcat是Apache软件基金会旗下的开源Servlet容器，实现了JavaEE（现JakartaEE）的Servlet、JSP等规范，广泛用于JavaWeb应用的部署和运行。其架构设计围绕高效处理HTTP请求、灵活管理Web应用和支持扩展展开。以下从核心组件、层级结构、关键机制三个维度深入解析Tomcat的基本架构。一、Tomcat核心组件与层级结构Tomcat的架构采用分层容器模型，核心组
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
在WPF中使用CommunityToolkit.Mvvm——（一）为什么使用CommunityToolkit.Mvvm 永远的久远 wpf
前言阅读我文章的同学可能已经发现了，我总是会在一个系列文章的第一篇抛出问题，为什么要用到这个技术。因为一些成熟的库和技术会给我们带来生产力大幅的提升，同时通过学习一些优秀的开源项目，对我们个人的能力提升也会有帮助。接下来我们一起来看一下MVVMToolkit能为我们带来哪些惊喜～～CommunityToolkit.Mvvm是什么微软的官方文档这样介绍的CommunityToolkit.Mvvm包（
ubuntu上编译fastDDS库源码并运行hellworld示例程序的流程
1.介绍1.1.目的本文是关于自己了解、学习、并使用fastDDS中间件的文章，描述了在ubuntu18.04上从下载源码到安装运行hellworld的整个流程，本文章为亲身实践，有问题请私信沟通1.2.FastDDS介绍eProsimaFastDDS是一个独立的cpp中间件实现，提供OMGDDS1.4和OMGRTPS2.2可互操作的有线协议标准，是一款免费和开源软件（ApacheLicense2
Flutter-完整开发实战详解(一、Dart-语言和-Flutter-基础) 2401_85122662 flutter
《Android学习笔记总结+最新移动架构视频+大厂安卓面试真题+项目实战源码讲义》完整开源地址：https://docs.qq.com/doc/DSkNLaERkbnFoS0ZF基本类型var可以定义变量，如vartag=“666”，这和JS、Kotlin等语言类似，同时Dart属于动态类型语言，支持闭包。Dart中number类型分为int和double，其中java中的long对应的也是Da
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
基于存算一体架构的实时深度学习推理优化瑕疵热点资讯架构深度学习人工智能
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化基于存算一体架构的实时深度学习推理优化引言存算一体架构的核心优势1.能效比突破2.实时性保障架构设计与实现技术1.存储单元创新2.硬件加速器设计3.电路级优化深度学习推理优化策略1.模型压缩技术2.硬件-软件协同优化3.运行时调度典型应
Python进阶 - 关键字 Global 和 Return 孤寒者 Python全栈系列教程 python global return
目录：每篇前言：一、`return`的角色与机制二、`global`关键字与命名空间三、函数多值返回的高级模式四、`global`vs`nonlocal`vs返回值五、最佳实践与反模式总结每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于Python全栈系列教程专栏：《Python全栈系列教程》热门专
ChatTTS实现文本转语音（TTS）全流程教程【附完整代码 & 环境配置】文浩（楠搏万）语言模型 Chattts 大语言模型 AI 人工智能 python 生成
言简意赅的讲解ChatTTS解决的痛点‍本教程手把手带你从零上手ChatTTS，实现文本到语音（TTS）转换，适合自媒体配音、有声内容创作、AI语音实验等场景。配套提供完整代码和环境配置方法，一键复现，无压力！什么是ChatTTS？ChatTTS是由清华大学团队开源的一款中文文本转语音（Text-to-Speech,TTS）模型。它的特点包括：️语音自然流畅，情感丰富️支持自定义发音人音色（spe
人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程 H-大叔人工智能大模型实战与教程人工智能
在实战开发大语言模型的过程中，经常会遇到各种API-KEY的配置问题，例如GPTOpenAIKEY的配置，而且目前大部分都要求将其配置在环境变量中，下面将会讲解如何在Linux、macOS、Windows中配置，本文一文通教程。您可以使用配置环境变量的方法，避免在调用各种SDK时显式地配置API-KEY，从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析 G皮T #大语言模型人工智能 LLM 大语言模型 chatgpt deepseek DeepSeek-R1 DeepSeek-V3
ChatGPT、DeepSeek-R1、DeepSeek-V3辨析1.ChatGPT对比DeepSeek1.1技术相似点1.2主要差异1.3关键区别1.4如何选择1.5总结2.DeepSeek-R1对比DeepSeek-V32.1DeepSeek-R12.2DeepSeek-V32.3核心区别总结2.4如何选择3.R1和V3有什么含义3.1DeepSeekR1的"R"3.2DeepSeekV3的"
《移动App测试实战》读书笔记 xh15 2017笔试面试修炼软件测试移动测试读书笔记
最近看完了《移动App测试实战》，这里做一点笔记，后面可以重温。功能测试自动化轻量接口自动化测试（JMeter）：JMeter是一款开源测试工具，多用于接口测试用例的分层：CGI：通用网关接口，常称为单个业务接口Function：请求组合，包含多个CGI层接口的调用TestCase：单个测试用例TestSuite：多个测试用例的集合UI层的自动化面向Android：AndroidSDK提供的UIA
鸿蒙操作系统核心特性解析：从分布式架构到高效开发的全景技术图谱
摘要近年来，随着物联网（IoT）、智能家居、智慧办公等领域的发展，传统的移动操作系统在多设备协同和资源共享方面越来越吃力。华为推出的鸿蒙操作系统（HarmonyOS）正是在这样的背景下诞生的。相比于iOS和Android，鸿蒙以“分布式操作系统”理念为核心，实现了跨设备协同、高效通信与统一开发的新生态，为开发者和用户都带来了新的体验。引言传统的移动操作系统大多聚焦在单一终端设备上，比如Androi
视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用
原文链接：https://tecdat.cn/?p=42891原文出处：拓端数据部落公众号分析师：ZiqiYe视频讲解：多层感知机MLP与卷积神经网络CNN在服装图像识别中的应用作为数据科学领域的从业者，我们常面临这样的挑战：如何让机器真正“看懂”图像中的信息？在为客户完成服装零售行业的图像识别时，这一问题尤为突出。追溯图像识别技术的发展，早期依赖人工设计特征，如边缘检测、纹理分析等，效率低下且适
30个网络抓包/调试工具-IT运维与网络工程师必会，从零基础到精通，收藏这篇就够了！程序员羊羊黑客网安工程师网络安全网络运维安全数据库压力测试 web安全
运维老兵都知道，网络抓包这活儿，就像给网络做CT，透视内部问题。但工具再多，用不对也是白搭。今天咱就来聊聊30款抓包/调试“神器”，别再只会用Wireshark了！一、协议分析工具：别光看表面，还得懂“潜台词”Wireshark：老牌劲旅，但别迷信它简介：开源界的扛把子，协议分析界的“瑞士军刀”，跨平台支持是基本操作。特点：协议多？那是必须的，2000+协议解析，过滤表达式（tcp.port==8
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
操作系统领域的新宠儿：鸿蒙应用深度剖析操作系统内核探秘操作系统内核揭秘 harmonyos 华为 ai
操作系统领域的新宠儿：鸿蒙应用深度剖析关键词：鸿蒙操作系统、微内核架构、分布式软总线、ArkUI框架、DevEcoStudio、跨设备开发、全场景生态摘要：本文深度剖析华为鸿蒙操作系统的核心技术架构与应用开发体系，从微内核设计、分布式协同技术、UI框架创新到全场景开发工具链展开分析。通过数学模型解析分布式一致性算法，结合Python代码演示核心调度逻辑，并以实战案例演示跨设备应用开发流程。探讨鸿蒙
构建强大AI代理的最佳开源工具
在2025年，打造一个智能自主的代理意味着要组装一套能够协同工作的智能工具栈——处理从推理和记忆到浏览器控制和实时语音等所有功能。在过去的一年里，我试验了几十个这样的工具，其中有一些出了问题，也有一些修复了问题，并见证了整个生态系统的成熟。以下是经过精心挑选、实地测试的最佳开源工具列表，可用于构建严肃的AI代理。无论您是要实现工作流程自动化、创建语音优先助手，还是部署可模拟的代理，此堆栈都能满足您
探秘Linux进程间通信：ipcdump 工具高慈鹃Faye
探秘Linux进程间通信：ipcdump工具IPCDump项目地址:https://gitcode.com/gh_mirrors/ip/IPCDumpipcdump是一个强大的开源工具，专门用于追踪Linux系统中的进程间通信（IPC）。这个工具涵盖了管道、FIFO、信号、Unix套接字、回环网络和伪终端等多种常见的IPC机制。无论是调试多进程应用程序还是理解系统中各个组件之间的交互方式，ipcd
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
算命网源码 - ASP版本松玫立
算命网源码-ASP版本去发现同类优质开源项目:https://gitcode.com/简介本仓库提供了一套基于ASP语言开发的算命网源码。该源码是一套完整的网站程序，用户可以将其直接解压部署到服务器上，实现一个功能完备的在线算命服务。使用说明下载源码：首先，从本仓库下载完整的算命网源码压缩包。解压文件：将下载的压缩包解压至您的本地服务器或网站目录。配置环境：确保您的服务器环境支持ASP程序运行，并
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
Manus AI与多语言手写识别 tonngw 人工智能
技术文章大纲：ManusAI与多语言手写识别引言手写识别技术的发展背景与市场需求ManusAI的定位与核心技术优势多语言场景下的挑战与机遇ManusAI的核心技术架构基于深度学习的端到端手写识别模型多模态数据融合（笔迹压力、书写轨迹等）自适应语言模型与字符集扩展机制多语言手写识别的关键技术非拉丁语系（中文、阿拉伯语等）的笔迹特征提取小样本语言数据的迁移学习策略上下文感知与语法纠错在低资源语言中的应
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">