aienbin

caffe用自己的数据集训练深度网络模型——windows平台适用

斯坦福公开课-深度学习计算机视觉说到caffe用来训练一个基本的深度网络模型，改几个配置文件就好了，不用写代码！当时，我就震惊了！赶紧试试。

caffe训练深度网络模型

caffe训练深度神经网络不需要写代码，听上去是挺好的，但只是一个噱头。如果不写代码，caffe里面很多东西就不能自己更改，而且为了符合caffe的程序，达到训练深度网络模型的效果，caffe对输入输出会有严格要求，比如，想要定义自己网络层layer结构，使用自己的求解算法，这时候不自己写代码，基本不可能实现；caffe训练网络时，会要求你的样本有训练集和测试集，而且分类和标签都有严格规定，否则直接报错，不让你训练模型。

当然如果你只是想要用caffe做做简单实验，你可以用本文的方法试试，我不保证测试的正确率会高哦。

下面以 训练AlexNet模型用于图片二分类 为例，具体讲解不写代码的整个caffe训练（train）、测试（test）过程。

caffe训练深度神经网络的前期准备

前面说到，caffe训练深度神经网络如果不写代码，需要修改几个配置文件，所以一些前期工作还是要做的。

准备样本，也就是train样本（训练样本）。样本主要用来训练和测试，需要该样本有标记。需要注意的是，如果是对图片进行多分类，则每一类样本的数量比例最好1：1。
准备caffe源码，这里提供的是windows版本。
编译好caffe，如果还没有配置成功的，请移步这里。
当然还得有深度学习的基本知识，要不然几个配置文件还是看不懂的。

caffe训练的大致流程

将整个train样本分为train数据集和test数据集两个数据集。这里的train样本必须是有标记的，如果你已经有了train样本和test样本（test样本也必须有标记），可以直接将其作为train数据集和test数据集。
将train数据集和test数据集分别转化为对应的lmdb数据集（或者leveldb数据集，这两种数据库的区别是lmdb读取快，但是占用空间大）。
分别计算train数据集的均值，另存为.binaryproto均值文件。（AlexNet需要这个，有一些其他模型似乎不需要，如GoogLeNet）
修改模型的网络结构文件train_val.prototxt文件，添加lmdb数据集和均值文件的路径。（这个文件后面会说的）
修改模型的solver.prototxt，该文件包含一些超参数的设置，如迭代次数、学习率设置，以及网络结构文件的路径设置和是否使用GPU加速等。
使用编译好的caffe.exe进行模型训练和测试。
附加：使用classification.exe对未知标签的样本进行分类。

以上是基本流程，数值计算和模型训练基本上都要在cmd命令行下操作。下面是详细的过程

准备样本

很多人都有一些标注好的样本，而且已经分好了，但你如果不写代码就想用caffe来训练模型，那你的样本说不定得重新分，因为官方的caffe对样本的划分有自己的要求；如果不想重新划分样本，那还是写代码吧！

学过机器学习的人都知道，样本的重要性，这里我就只想强调一下：真的非常重要！

其实样本严格划分的作用在后面的配置文件修改中会有体现，本来应该先看看配置文件的，但为了一套流程的完整，还是先从样本准备开始说起。（再次提醒：这里的任务是对图片进行二分类，多分类是类似的）

caffe训练时，需要有两个图片数据集分别用于训练和测试，这里就简称为train集（训练集）和test集（测试集），分别对应于train文件夹和test文件夹。
train文件夹里面必须包含有所有类别的图片，且每一类的图片数量比例最好保持或者接近1：1，test文件夹也一样。train文件夹的图片应该要比test文件夹的多一些，我设置的比例一般为4：1，这个可以自己设置，但是train集至少应该比test集大几倍，而且这两个数据集不应该有重叠，test文件夹的图片不能在train文件夹出现，对train文件夹也是如此。
这两个数据集里的每一张图片必须要有标签，而且train集和test集分别对应一个标签文件，所以，还得有两个标签文件train.txt、test.txt。标签文件放在与train、test文件夹同目录下，就是为了好看、直观，如下所示：
标签文件test.txt和train.txt里面的标签定义，也有要求。图片和标签之前以空格分开，必须是空格哦，本人试过tab间隔符，不行！这跟头栽的。每个图片只占一行，空格前面是图片名，图片名必须顶格，空格后面是标签（一般的标准数据集会提供标签，如果没有，那你就手动标注吧，研一都干过这事:），如下图，我的命名：

train文件夹里面的图片必须和train.txt里面的图片对应好，test文件夹也一样。
图片和标签文件都弄好后，就可以进行下一步了。（推荐大家使用NotePad编辑标签文件，不要使用window自带的记事本）

转换图片格式

很多人就要问了：caffe不能读取原始的.jpg和.png格式图片吗？答案是可以的，但是这种格式的图片不能作为caffe训练神经网络的输入，输入只能使用固定的格式：lmdb、leveldb（这其实是两种数据库）。于是我们就要转换图片格式。以train文件夹里的图片为例.

caffe提供转换图片为指定格式的命令，在windows系统下，就是一个.exe文件，名字是convert_imageset.exe，这个文件在编译好的caffe目录下，具体路径为D:\caffe\tools\Release\目录下（这个目录是用我前一篇博客的方法编译出来的，如果不是按照我之前的方法，可能这个exe文件不在该目录下）
打开cmd命令行窗口（程序员不会用cmd？赶紧改行，OK？），跳转到D:\caffe\tools\Release\目录下，也就是convert_imageset.exe所在的目录，然后敲下命令

convert_imageset.exe -backend leveldb -resize_height 227 -resize_width 227 D:\image\train\ D:\image\train.txt D:\output_lmdb\train_lmdb

上面是将图片转换为leveldb格式，但我常用的是lmdb格式，如果不加上“-backend leveldb”，默认就是转换为lmdb格式。所以命令改为：

convert_imageset.exe -resize_height 227 -resize_width 227 D:\image\train\ D:\image\train.txt D:\output_lmdb\train_lmdb

后面的”-resize_height 227 -resize_width 227”是将图片大小重新设置为227x277，这是AlexNet的标准输入。“D:\image\train\”是你train文件夹的位置，“D:\image\train.txt”是你标签文件train.txt，后面的“D:\output_lmdb\train_lmdb”是你转换后的数据存放的位置，记住，output_lmdb需要自己新建，train_lmdb一定不能自己建立！否则会有错。
然后执行完命令，转换数据需要一定的时间。在没有报错的情况下，表明数据转换成功。得到D:\output_lmdb目录下的文件夹：train_lmdb
这个文件夹下会有以下两个文件：data.mdb和lock.mdb，前面一个比较大，就是我们整个图片转换后的数据。

同样的，可以建立test_lmdb：
convert_imageset.exe -resize_height 227 -resize_width 227 D:\image\test\ D:\image\test.txt D:\output_lmdb\test_lmdb

计算均值

在转换完图片数据后，就能够得到lmdb数据，这个就是caffe能够处理的数据。计算均值这一步是AlexNet特有的，要用到程序compute_image_mean.exe，这个程序与convert_imageset.exe在同一目录下。下面以计算train集为例。

同样打开cmd命令行窗口，跳转目录，执行以下命令：

compute_image_mean.exe D:\output_lmdb\train_lmdb D:\image\train_mean.binaryproto

其中’D:\output_lmdb\train_lmdb’为train转换后的数据集的位置，’D:\image\train_mean.binaryproto’为你计算后的均值文件的路径和文件名。

该命令也需要执行一段时间，在没有报错的情况下，命令执行成功，然后就会在image目录下出现一个train_mean.binaryproto文件。
同样对test集也可以得到相应的均值文件test_mean.binaryproto。

建立深度网络模型AlexNet

其实现在典型的深度网络模型就那么几种，AlexNet、VGG-16、GoogLeNet、ResNet，AlexNet和GoogLeNet的网络结构文件caffe源码里面都有提供，在models文件夹下。不知道为什么，我编译好的caffe目录下没有models文件夹，更别说网络模型了，所以我就找到了caffe源码里面的models文件夹，里面有以下文件夹：

第一个文件夹就是AlexNet模型的，后面的GoogLeNet等等，其他常用的深度模型在caffe的model zoo里面基本都能找到，你要是想自己写，当然也是可以的。bvlc_alexnet文件夹下就会有以下几个文件，我们可以将他们都拷贝到我们的image目录下，除了readme.md文件：

其中train_val.prototxt是网络结构文件，定义的是多层网络(layer)，deploy.prototxt也是网络结构文件，但是这个文件是用于分类的，train_val.prototxt文件是用于训练的。

一开始我不明白，不都是同一个网络么，为何要分两个文件，如果仔细看这两个文件的话，你会发现，train_val.txt文件里，有两个数据输入层，一个用于train，里面定义了之前转换数据train_lmdb的路径，一个用于test，里面则定义了test_lmdb的路径，而deploy.prototxt则只有一层数据输入层，且没有数据的路径。实际使用中，使用train_val.prototxt训练时，由于文件里面已经定义train集和test集的路径，所以不需要手动在cmd中输入，而使用deploy.prototxt进行分类时，需要手动在cmd中输入图片的路径。

这两个文件的其他内容基本一致，还有一些细节处不一样，等到后面再说吧。基本上要记住的是我们训练的时候只用到train_val.prototxt和solver.prototxt两个文件就行了。

因为原本的AlexNet是在ImageNet上做1000个分类，所以它网络的输出为1000，在这里我们做的是2分类，所以，需要将输出改为2，因此需要更改train_val.prototxt文件，如下：

layer {
  name: "fc8"
  type: "InnerProduct"
  bottom: "fc7"
  top: "fc8"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  inner_product_param {
    num_output: 2         //这里的值原本是1000，这里要改为2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}

训练深度神经网络模型AlexNet

由于caffe自己定义有AlexNet的网络结构，所以我们不必自己定义，直接用就好了。前面一步只是做了一点小的更改，来适应我们的任务。现在修改train_val.prototxt和solver.prototxt文件来训练模型。

先从train_val.prototxt文件开始。之前一步已经改过一处，现在还有文件前面几处需要更改，基本上就是1-40行，如下：

name: "AlexNet"
layer {
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN    //这层是train集的数据输入层
  }
  transform_param {
    mirror: true
    crop_size: 227  //图片的长宽，由于之前已经resize所有图片为227x227，所以这里不需要更改
    //将引号里面改为之前train集的均值文件的路径。注意路径分隔符，很容易出错，详情请看下面红字解释。
    mean_file: "D:/image/train_mean.binaryproto" 

  }
  data_param {
    source: "D:/output_lmdb/train_lmdb" //将引号里面改为前面生成的train_lmdb的路径
    batch_size: 128   //每次训练的时候，使用128张train集的图片
    backend: LMDB   //由于我转换图片为lmdb格式，所以这里不用改，如果你是leveldb，请修改。下面也有一处。
  }
}
layer {
  name: "data"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TEST   //这层是test集的数据输入层
  }
  transform_param {
    mirror: false
    crop_size: 227
    mean_file: "D:/image/test_mean.binaryproto"   //改为test集均值文件的路径
  }
  data_param {
    source: "D:/output_lmdb/test_lmdb"  //改为前面生成的test_lmdb的路径
    batch_size: 64    每次训练的时候，使用64张test集的图片
    backend: LMDB  //转换后的数据格式
  }

注意，因为windows有点坑，本来路径分隔符是 ‘/’，微软为了显示自己与众不同，非要将windows路径分隔符默认为 ‘\’，所以，修改train_val.prototxt和solver.prototxt文件时，一定要额外注意，路径分隔符一定要使用 ‘/’，如上。
本来有几个参数，但是为了快速上手，先不说了，下面再提。

接下来修改solver.prototxt文件，这个文件主要包含一些超参数的设置。这个文件没多少行，我就全都贴上来了：

net: "D:/image/train_val.prototxt"//引号里面的是前面修改过的train_val.prototxt文件的位置，同样注意路径分隔符。
test_iter: 1000            //test集迭代的次数
test_interval: 1000        //训练多少次之后，用test集测试一次
base_lr: 0.01              //学习率
lr_policy: "step"          //学习的策略，这个有很多讲究的，但一般是默认是step
gamma: 0.1                 //与学习率更改有关
stepsize: 100000           //训练多少次之后，修改学习率
display: 20                //训练多少次之后，将训练误差显示在屏幕上（总不可能训练一次就显示，那样会显示多，屏幕会一直刷新）
max_iter: 450000           //最多训练多少次，也就是总的训练次数
momentum: 0.9              //上一次梯度更新的权重
weight_decay: 0.0005       //权重衰减项
snapshot: 10000            //训练多少次，保存一次模型
snapshot_prefix: "D:/image/trained_model/caffe_alexnet_train"  //模型保存的位置，trained_model为同目录下的自己新建的文件夹，caffe_alexnet_train不是文件夹，不需要自己新建。
solver_mode: GPU           //设置为使用GPU加速训练

修改完成后，将train_val.prototxt和solver.prototxt文件都保存在image目录下（当然你也可以放在其他地方，我为了简单、好描述，就都放在一起了），现在，我的image文件夹的文件列表（转换的lmdb数据不在这个目录下）如下：

OK，经过一系列的配置，现在差不多都配置妥当了，可以开始训练了！

训练需要用到caffe.exe这个程序，这个程序在D:\caffe\tools\Release\目录下，打开cmd命令行，输入以下命令，回车执行：

//等号后面是之前修改的solver.prototxt的路径

caffe.exe train -solver=D:\image\solver.prototxt

回车之后，如果跳出一大串信息，显卡信息、网络结构信息等等，一直刷新你的屏幕，并且不弹出错误信息，出现以下的迭代信息，train losss输出，就说明正在训练网络：

I0920 16:00:27.649086  6560 solver.cpp:397]     Test net output #0: accuracy = 0.429297
I0920 16:00:27.650086  6560 solver.cpp:397]     Test net output #1: loss = 0.961522 (* 1 = 0.961522 loss)
I0920 16:00:27.839097  6560 solver.cpp:218] Iteration 0 (-1.0869e-012 iter/s, 1.90837s/50 iters), loss = 1.54311
I0920 16:00:27.839097  6560 solver.cpp:237]     Train net output #0: loss = 1.54311 (* 1 = 1.54311 loss)
I0920 16:00:27.839097  6560 sgd_solver.cpp:105] Iteration 0, lr = 0.0005
I0920 16:00:32.528365  6560 solver.cpp:218] Iteration 50 (10.6641 iter/s, 4.68861s/50 iters), loss = 5.26144e-007
I0920 16:00:32.528365  6560 solver.cpp:237]     Train net output #0: loss = 5.26201e-007 (* 1 = 5.26201e-007 loss)
I0920 16:00:32.528365  6560 sgd_solver.cpp:105] Iteration 50, lr = 0.0005
I0920 16:00:34.219462  1856 data_layer.cpp:73] Restarting data prefetching from start.
I0920 16:00:37.195632  6560 solver.cpp:218] Iteration 100 (10.713 iter/s, 4.66724s/50 iters), loss = -1.21904e-006
I0920 16:00:37.196632  6560 solver.cpp:237]     Train net output #0: loss = 0 (* 1 = 0 loss)
I0920 16:00:37.196632  6560 sgd_solver.cpp:105] Iteration 100, lr = 0.0005
I0920 16:00:40.894843  1856 data_layer.cpp:73] Restarting data prefetching from start.
I0920 16:00:41.826897  6560 solver.cpp:218] Iteration 150 (10.7991 iter/s, 4.63002s/50 iters), loss = 0
I0920 16:00:41.826897  6560 solver.cpp:237]     Train net output #0: loss = 0 (* 1 = 0 loss)

如果你的数据集比较好，solver,prototxt文件中的参数配置合理，会看到train loss会一直在下降。如果输出的东西太多，屏幕会一直刷新，之前显示的数据会被覆盖，这个时候，你可以将cmd输出重定向到一个output.txt文件中，等训练完成，再打开txt文件，查看显示数据。windows中原本只需要在命令行后面加上“>D:\output.txt”就可以重新向，如ping命令：

ping www.baidu.com >D:\output.txt

这个时候cmd中就不会显示信息，直接执行完成，无任何输出，D盘下就会自动生成一个output.txt文件，文件的内容就是该ping命令的执行信息。按理来说caffe这样重定向也是可以的，但是上面的方法我试过了，不行！信息还是在cmd中显示，虽然会生成output.txt，但是里面没有任何信息，是空的。经过我的多方考究和多次实验，终于发现，caffe重定向输出需要在caffe命令后面加上“>D:\output.txt 2>&1”,于是上面的训练命令可以改为：

caffe.exe train -solver=D:\image\solver.prototxt >D:\output.txt 2>&1

然后，cmd的输出就不显示了，然后显示在output.txt的文件里面了。训练的过程中，如果你发现loss在一段时间内不降反升，而且test的accuracy也比较高的时候，说明模型差不多训练好了，可以提前终止。或者你可以等到它训练次数达到你设定的最大值。这都看你。

利用训练好的AlexNet模型做分类

通过上面步骤的训练，你或许就能够得到一个较好的模型，利用这个模型就可以做分类任务啦。

根据之前修改的solver.prototxt文件，可以找到训练好的模型在trained_model文件夹内：如我的该文件夹内容如下：

文件名中的iter后面的数字“1000”表明迭代了1000次后保存的caffe模型。caffe模型的后缀名为caffemodel，很直观。

现在我们要挑选一个最优的模型来做分类任务，哪个最优？根据训练过程中的test accuracy来确定，test accuracy较高的就是比较好的模型。比如，我在迭代了10000次后，发现在迭代到6000次的时候，test accuracy是最高的，这个时候就可以使用这个iter_6000的caffemodel来进行分类。
之前有提到过一个deploy.prototxt文件，它是用来做分类的，我也已经放到image目录下，这个文件之前没有改过，是因为训练的时候没有用到，现在是分类任务，所以修改这个文件使用，基本上就是修改以下一处：

layer {
  name: "fc8"
  type: "InnerProduct"
  bottom: "fc7"
  top: "fc8"
  param {
    lr_mult: 1
    decay_mult: 1
  }
  param {
    lr_mult: 2
    decay_mult: 0
  }
  inner_product_param {
    num_output: 2         //这里的值原本是1000，这里要改为2
    weight_filler {
      type: "gaussian"
      std: 0.01
    }
    bias_filler {
      type: "constant"
      value: 0
    }
  }
}

做分类任务需要用到一个label.txt文件，这个文件指明你的分类。比如我之前标注的有“0”和“1”两类标签，这时，label.txt文件的第0行为你的标签为“0”的类标，这里可以设置中文名“无”，也就是标签“0”对应“无”，将标签“1”对应“有”。也就是label.txt第一行为“无”，第二行为“有”，实验中，为了简便，我第一行还是写0，第二行写1，分别对应标签“0”、“1”。
分类任务主要使用classification.exe这个程序，这个程序在D:\caffe\examples\cpp_classification\Release\目录下，同样要用到cmd命令行，跳转到该目录下，输入命令：

classification.exe D:\image\deploy.prototxt D:\trained_model\caffe_alexnet_train_iter_6000.caffemodel D:\image\train_mean.binaryproto D:\image\labels.txt D:\image\1.jpg

classification.exe后面的第一个参数是deploy.prototxt文件名，第二个参数为caffemodel文件名，第三个参数为均值文件名，第四个参数为label.txt文件名，第五个参数为你想要检测的图片的图片名，这张图片可以是train集和test集里面的图片，也可以是其他的图片。以上由于不在同一目录下，需使用绝对路径定位到该文件。
输入命令后回车，如果不报错的话，一般1秒左右就能够输出label.txt定义的标签。

以下是我另一个工程的测试结果：
标签“0”、“1”前面的小数为该类别的置信度，也就是说这张测试的图片有0.9657的可能是“0”类的，只有0.0343的可能是“1”类的，实际这张图片的标记为“0”，结果还不错。

总结

以上简单介绍了一下基本的模型训练流程，至于参数调整等技巧，我还要仔细研究，就先不讲了。现在看来，训练出来的模型分类结果还行。

这一套训练方法是caffe绝无仅有的，不需要写代码，只需要修改几个配置文件，就能够训练自己的网络模型，就算没有写过什么代码，也毫无压力。而其他的深度学习框架都必须要写代码，之前有学过tensorflow，就是用python写代码，没有caffe这般的操作，心中再次佩服作者贾扬清一下，给国人点赞！

但是这种方法也有缺点，会有很多限制，比如网络结构自定义的范围较小，求解方式不能自定义，文件名、标签文件、命令等等都要按照要求来，因为中间用的命令比较多，比较难记忆，像我就根本没有记，用的时候再看，感觉还是写代码自由点。

当然，作为目前流行的深度学习框架，caffe绝不仅仅只能这么用，想写代码也是可以的，caffe由于是开源的，你可以直接使用C++对源码进行更改，也可以通过python和matlab接口进行编程。作为爱编程的你，一定要自己试试才知道其中的妙处！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
展现思维导图魅力，不断挖掘人生宝藏思维导图讲师Mandy
第13期最强思维导图训练营已经结束一周了，但是我依旧是感觉所有学员还在努力的学习，这些学员中有教师、学生、白领、公务员、宝妈等等，只要你努力，只要你想改变自己，任何行业，任何岗位都可以参与进来，28天足以让你见成效，在这28天中，我们的学员不仅仅是收获了一枚毕业证，最重要的是让自己的思维方式得到升级，今天的你为自己投资，明天的你就会感谢你今天的付出，我们来听一听来自13期最强思维导图训练营优秀学员
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
渝婧感恩日记第68天梁渝婧lydia
1.哇！我真是太幸福啦！感恩奇迹感恩训练营毕业典礼，让我能共振到同学们的喜悦和能量，感谢！感谢！感谢！2.哇！我真是太幸福啦！感恩每天早起，运动3公里！这个星期又做到连续三天，不间断！感谢亲爱的渝婧！你真的是非常的棒！加油，继续坚持！感谢！感谢！感谢！3.哇！我真是太幸福啦！感恩曾正波班主任给我们分享的艾宾浩斯的记忆曲线255学习法，让我蠢蠢欲试，感谢！感谢！感谢！4.哇！我真是太幸福啦！感恩胜利
Xinference如何注册自定义模型玩人工智能的辣条哥人工智能 AI 大模型 Xinference
环境：Xinference问题描述：Xinference如何注册自定义模型解决方案：1.写个model_config.json，内容如下{"version":1,"context_length":2048,"model_name":"custom-llama-3","model_lang":["en","ch"],"model_ability":["generate","chat"],"model
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
系统架构设计师需求分析篇二 AmHardy 软件架构设计师系统架构需求分析面向对象分析分析模型 UML和SysML
面向对象分析方法1.用例模型构建用例模型一般需要经历4个阶段：识别参与者：识别与系统交互的所有事物。合并需求获得用例：将需求分配给予其相关的参与者。细化用例描述：详细描述每个用例的功能。调整用例模型：优化用例之间的关系和结构，前三个阶段是必需的。2.用例图的三元素参与者：使用系统的用户或其他外部系统和设备。用例：系统所提供的服务。通信关联：参与者和用例之间的关系，或用例与用例之间的关系。3.识别参
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
放松的一天 4da9b7687fa0
20190325总结起床07:20图片发自App睡觉:23:00天气:晴今日任务清单学习·信息·阅读•水滴阅读Day40Alice’sAdventuresinWonderlandChapter6.2图片发自App•BBC跟读训练营Day24图片发自App图片发自App图片发自App•潘多拉口语训练营Day6Wow.Whatabigboy!•文化知识学习今日无•阅读时间地狱健康·饮食·锻炼•饮食目标
人到中年的5大恐惧不想独白的独白
这一段时间闭关在家，心里越来越没有底。全球疫情，全国疫情，一直在关心和自我调试中。但是，好像还是对自己的未来充满了无所适从。不想去做什么，也没有激情和兴趣去开始什么。人生过半，还有什么可以逆袭或改变的机会呢。不知道做什么的时候，去追剧，做美食，教育孩子，锻炼，花钱进什么什么读书训练营，打卡训练营，微信群，各种分享和共同体的群。但是还是没有任何的起色。就这样了吗。中午并不困，但是到了12点，还是习惯
计算机网络八股总结 Petrichorzncu 八股总结计算机网络笔记
这里写目录标题网络模型划分（五层和七层）及每一层的功能五层网络模型七层网络模型（OSI模型）==三次握手和四次挥手具体过程及原因==三次握手四次挥手TCP/IP协议组成==UDP协议与TCP/IP协议的区别==Http协议相关知识网络地址，子网掩码等相关计算网络模型划分（五层和七层）及每一层的功能五层网络模型应用层：负责处理网络应用程序，如电子邮件、文件传输和网页浏览。主要协议包括HTTP、FTP
我的一个小心愿，减肥20斤，有人一起吗张晓晓ZXX
我现在体重141斤，163cm，想减到120以内，不想吃减肥药，不喝奶昔，也不想买健身卡，就是希望通过一些运动的aPP进行训练和适当的节食，有人一起的吗？3月12号，我73公斤，现在70.9公斤，是通过咕咚app训练来的，但一个人太孤单，有一起的吗？我想知道除了小时候坚持一个月练习写字帖把字写好了，还能做什么锻炼一下自己的毅力，我也想知道100天之后，我能不能也达到理想的体重。接下来100天，愿意
今天是总结薛帅
今天来个最后一天的总结。为什么要学习写作技巧呢？就如同建房子，如果想要住的安全、舒服，我们要先打地基，建房子的框架，这样才能随意的装修。那么我们要怎么建好才能建好写作的地基呢？1走直路，少弯路01利他：能够给别人带来价值。02吸引：吸住读者的眼球。03打动：打动人心，引起共鸣。04说服：用数据说话。05刻意：通过有意识的训练。06修改：好的文章至上修改10遍。07模仿：10万+的文章必有成功的道理
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n