jsk_learner

Caffe制作LMDB数据并进行分类网络训练和测试

这是一篇caffe训练分类模型步骤说明博客、本次步骤不涉及caffe的编译讲解

caffe制作LMDB数据集及求均值文件

生成train.txt和val.txt
制作LMDB数据集
生成binaryproto均值文件

caffe训练网络模型

train_val.prototxt
solver.prototxt
train_model.sh
进行网络模型训练

进行网络模型测试

caffe自带的test工具
pycaffe接口

本篇博客以某项比赛数据、ResNet-50模型为例，讲解了生成自己的train.txt和val.txt文本文件、制作LMDB数据集、生成均值文件、网络训练、网络测试以及使用pycaffe接口进行测试的详细流程。

数据集来源：某项比赛
模型：ResNet-50
系统：Linux-Ubuntu

caffe制作LMDB数据集及求均值文件

数据集分为train和val数据集，训练集180000张图片左右，验证集20000张图片左右，总共涉及对45种类型的分类，包括干旱地、棒球场等。

在用caffe进行网络模型训练前，最好先生成LMDB格式数据集，这会提高caffe读取数据的效率。当完成这部分工作后，会有两个文件夹和一个文件：训练集train_lmdb文件夹、验证集val_lmdb文件夹和binaryproto均值文件。

制作步骤分别为：生成train.txt和val.txt、制作LMDB数据集、生成均值文件

生成train.txt和val.txt

首先需要生成具有训练集和验证集图片名称和对应标签信息的txt文件，即train.txt和val.txt文本文件。

python脚本如下：

import os
up_dir = 'E:/xxx/'
train_dirname = 'E:/xxx/val'
id_path = "E:/xxx/ClsName2id.txt"

class_name_list = os.listdir(train_dirname)
train_txt = open(os.path.join(up_dir, 'val.txt'), 'w')   #修改val.txt为train.txt即可
id_txt = open(id_path, 'r', encoding='UTF-8')
for line in id_txt:
    for class_name in class_name_list:
        if line.split(':')[0] == class_name:
            print(class_name)
            image_list = os.listdir(os.path.join(train_dirname, class_name))
            for image in image_list:
                train_txt.write(image)
                train_txt.write(' ')
                train_txt.write(str(int(line.split(':')[2])-1))
                train_txt.write('\n')

train_txt.close()

行数即为你训练集或验证集的图片数量
列有两列，第一列是图片名称，第二列是图片对应的标签。

在这里要特别注意一点，图片的标签值一定要从0开始，否则精度会下降很多。trust me，我做过相应的实验，有时间会把实验结果放上来。

制作LMDB数据集

我使用的是caffe下的create_imagenet.sh文件，文件可以在caffe/examples/imagenet下找到。

打开后如下：

需要修改的地方以及怎样修改，我在相应行用中文进行了注释，按照说明进行修改即可，主要是路径和名称问题。

#!/usr/bin/env sh
    # Create the imagenet lmdb inputs 
    # N.B. set the path to the imagenet train + val data dirsset -e
    
    EXAMPLE=/home1/xxx/RemoteSensing              # 生成的lmdb文件存放路径          
    DATA=/home1/xxx/RemoteSensing		          # train.txt和val.txt所在路径
    TOOLS=/home1/xxx/caffeMS/build/tools		  # 改成自己的caffe路径		
    
    TRAIN_DATA_ROOT=/home1/xxx/RemoteSensing/train/	         # 训练原始图片路径
    VAL_DATA_ROOT=/home1/xxx/RemoteSensing/val/              # 验证原始图片路径
  
    rm -rf $EXAMPLE/train_lmdb
    rm -rf $EXAMPLE/val_lmdb
     
    # Set RESIZE=true to resize the images to 256x256. Leave as false if images have
    # already been resized using another tool.	
    RESIZE=true                                              # 设为ture，会进行resize
    if $RESIZE; then
       RESIZE_HEIGHT=256
       RESIZE_WIDTH=256
    else
       RESIZE_HEIGHT=0
       RESIZE_WIDTH=0
     fi
     
    if [ ! -d "$TRAIN_DATA_ROOT" ]; then
       echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"
       echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \
            "where the ImageNet training data is stored."
       exit 1
    fi
     
    if [ ! -d "$VAL_DATA_ROOT" ]; then
       echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"
       echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \
            "where the ImageNet validation data is stored."
    	   exit 1
    	fi
    	
    	echo "Creating train lmdb..."
     
    GLOG_logtostderr=1 $TOOLS/convert_imageset \
         --resize_height=$RESIZE_HEIGHT \
         --resize_width=$RESIZE_WIDTH \
         --shuffle \
         $TRAIN_DATA_ROOT \
         $DATA/train.txt \                            # 训练文本名字
         $EXAMPLE/train_lmdb            			  # lmdb训练数据集数据集名字
     
    echo "Creating val lmdb..."
    
    GLOG_logtostderr=1 $TOOLS/convert_imageset \
         --resize_height=$RESIZE_HEIGHT \
         --resize_width=$RESIZE_WIDTH \
         --shuffle \
         $VAL_DATA_ROOT \
         $DATA/val.txt \					   # 测试文本名字
         $EXAMPLE/val_lmdb				       # lmdb验证集数据集名字
     
    echo "Done."

成功后，会生成两个文件夹train_lmdb和val_lmdb，这两个文件夹就是我们LMDB格式数据集。

生成binaryproto均值文件

生成均值文件使用的是make_imagenet_mean.sh，和create_imagenet.sh文件一样，也可以在caffe/examples/imagenet路径下找到。
主要是对train_lmdb。

	#!/usr/bin/env sh
    # Compute the mean image from the imagenet training lmdb
    # N.B. this is available in data/ilsvrc12
    
    EXAMPLE=/home1/xxx/RemoteSensing         # train_lmdb文件夹所在路径          
    DATA=/home1/xxx/RemoteSensing            # 生成的binaryproto路径
    TOOLS=/home1/xxx/caffeMS/build/tools     # 设置为自己的caffe路径
    
    rm -f $DATA/rs_imagenet_mean.binaryproto
    
    $TOOLS/compute_image_mean $EXAMPLE/train_lmdb \      
      $DATA/rs_imagenet_mean.binaryproto    # 均值文件名字
    
    echo "Done."

caffe训练网络模型

进行模型训练需要train_val.prototxt、solver.prototxt以及train_model.sh三个文件。

train_val.prototxt

train_val.prototxt中定义了网络模型的结构、数据输入部分和loss部分。

我所使用的是ResNet-50网络模型。

因为模型有两千多行，在这里我只放出开头读入数据部分和结尾训练loss部分，当然这两部分也是一般我们需要修改的地方。

开头输入数据部分：

 name: "ResNet-50"
    layer {
      name: "data"
      type: "Data"
      top: "data"
      top: "label"
      include {
        phase: TRAIN                                 # 训练时输入数据设置
      }
      transform_param {
        crop_size: 224                          	 # 从原始图片中随机裁剪出224x224大小的图片区域
        mirror: true                                 # 镜像设为true，提高样本数量
        mean_file: "/home1/xxx/RemoteSensing/rs_imagenet_mean.binaryproto"    # 均值文件所在路径
      }
      data_param {
        source: "/home1/xxx/RemoteSensing/train_lmdb/"  			# train_ldmb路径
        batch_size: 25 #*iter_size							    	# batch_size，根据你显卡内存大小进行选择
        backend: LMDB											    # 数据来源要改成LMDB
      }
    }
    layer {
      name: "data"
      type: "Data"
      top: "data"
      top: "label"
      include {
        phase: TEST						   			  # 测试时输入数据设置
      }
      transform_param {
        crop_size: 224                                # 测试时从中心裁剪出224x224大小区域进行测试
        mirror: false								  # 镜像设为flase
        mean_file: "/home1/xxx/RemoteSensing/rs_imagenet_mean.binaryproto"   # 均值文件所在路径
      }
      data_param {
        source: "/home1/xxx/RemoteSensing/val_lmdb/"			    # val_lmdb路径
        batch_size: 10     #not *iter_size						    # batch_size，根据你显卡内存大小进行选择
        backend: LMDB 												# 数据来源要改成LMDB
      }
    }

结尾loss部分：

 layer {
      name: "loss1/loss1"
      type: "SoftmaxWithLoss"					   # 采用SoftmaxWithLoss
      bottom: "my-classifier"
      bottom: "label"
      top: "loss1/loss1"
      loss_weight: 0.3                             # 训练输出的loss所占的权重
    }
    layer {
      name: "test/loss"
      type: "SoftmaxWithLoss"					  # 采用SoftmaxWithLoss
      bottom: "my-classifier"
      bottom: "label"
      top: "test/loss"
      include {
        phase: TEST								  # 验证时的loss参与训练权重参数的更新
      }
    }
    layer {
      name: "accuracy"
      type: "Accuracy"							 # 测试时的精度输出
      bottom: "my-classifier"
      bottom: "label"
      top: "accuracy"
      include {
        phase: TEST
      }
    }

solver.prototxt

solver.prototxt中定义了loss优化器、模型保存路径、最大迭代次数、基础学习率、学习率衰减策略、模型运算是GPU还是CPU等超参数。

 # the definition of neural network model
    net: "train_val.prototxt"              						 # 网络结构路径
    # test_iter is related to batch_size in test layer, test_iter * batch_size = the number of test data
    test_iter: 2000												 # 测试次数
    # carry out test once every 5 training iterations
    test_interval: 50											 # 每多少次进行一次测试
    # exclude test phase when test_initialization = false
    # test_initialization: false
    # display information once every 10 training iterations
    display: 10													 # 训练多少次显示一次
    average_loss: 40											
    # the initial learning rate
    base_lr: 0.0000001										     # 基础学习率
    lr_policy: "poly"											 # 学习率更新策略
    stepsize: 1000										    	 # 每1000次学习率更新一次
    gamma: 0.96													 # 学习率更新的超参
    # The max number of iterations
    max_iter: 50000											     # 最大迭代次数
    power: 1.0													 # 学习率更新超参
    momentum: 0.9										      	 # 动量设置
    # weight decay item, in case of overfitting
    weight_decay: 0.0002										 # 正则化设置
    # save once every 50 training iterations
    snapshot: 400												 # 训练多少次保存一次模型
    # save path
    snapshot_prefix: "snapshot/resnet_50_ft"	 			     # 训练模型保存路径
    solver_mode: GPU											 # 采用GPU训练，也可改为CPU

train_model.sh

train_model.sh是命令文件，其中会设置预训练模型路径、solver.prototxt路径、log日志保存路径等参数。

#!/usr/bin/env sh  
TOOLS=/home1/xxx/caffeMS/build/tools  
GLOG_logtostderr=0 GLOG_log_dir=./ft_log/ $TOOLS/caffe train --solver=solver.prototxt --weights=/home1/jsk/RemoteSensing/ResNet/ResNet-50/snapshot/resnet_50__iter_100000.caffemodel -gpu 0  #加入 -gpu 选项

TOOLS改为自己的caffe路径
GLOG_log_dir改为自己要保存的日志文件路径
–solver表示solver.prototxt文件路径
–weights表示预训练模型所在路径
-gpu 0表示采用编号为0的显卡进行训练

进行网络模型训练

打开linux终端命令窗口：
输入

sudo sh train_model.sh

网络模型训练就开始了，出现如下图所示，表示你前期工作没有错误。

日志文件被保存在，我的就是./ft_log/下

打开后，内容如图：

训练模型保存在，我的是snapshot路径下

进行网络模型测试

网络模型测试，可以使用caffe自带的test工具，或者使用matcaffe或pycaffe接口进行模型测试。

下面我将讲解caffe自带的test工具和利用pycaffe进行模型测试两种方法

caffe自带的test工具

创建一个脚本命令文件，test_model.sh，内容如下：

/home1/xxx/caffeMS/build/tools/caffe test --model=/home1/xxx/RemoteSensing/ResNet/ResNet-50/train_val.prototxt --weights=/home1/xxx/RemoteSensing/ResNet/ResNet-50/snapshot/resnet_50__iter_100000.caffemodel --iterations 2000 -gpu 0

打开linux终端命令窗口：

sudo sh test_model.sh

即可

结果如下图所示：

pycaffe接口

代码如下：

#!/usr/bin/python
    #coding:utf-8
    import sys
    #caffe_root='/home1/xxx/caffeMS/' #修改成你的Caffe项目路径
    #sys.path.append(caffe_root+'python')
    import caffe
    sys.path.insert(0,'/home1/xxx/caffeMS/python')
    caffe.set_mode_gpu() #设置为GPU运行
    import os
    import numpy as np
    
    # 修改成你的deploy.prototxt文件路径
    model_def = '/home1/xxx/RemoteSensing/ResNet/ResNet-50/deploy.prototxt' 
    model_weights = '/home1/xxx/RemoteSensing/ResNet/ResNet-50/snapshot/resnet_50__iter_100000.caffemodel' 
    # 修改成你的caffemodel文件的路径
    
    net = caffe.Net(model_def,      # defines the structure of the model
                    model_weights,  # contains the trained weights
                    caffe.TEST)     # use test mode (e.g., don't perform dropout)
    
    #这是一个由mean.binaryproto文件生成mean.npy文件的函数
    def convert_mean(binMean,npyMean):
        blob = caffe.proto.caffe_pb2.BlobProto()
        bin_mean = open(binMean, 'rb' ).read()
        blob.ParseFromString(bin_mean)
        arr = np.array( caffe.io.blobproto_to_array(blob) )
        npy_mean = arr[0]
        np.save(npyMean, npy_mean )
    binMean='/home1/xxx/RemoteSensing/rs_imagenet_mean.binaryproto' 
    #修改成你的mean.binaryproto文件的路径
    npyMean='rs_imagenet_mean.npy' 
    #你想把生成的mean.npy文件放在哪个路径下
    convert_mean(binMean,npyMean)
    
    transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})
    transformer.set_transpose('data', (2,0,1))  # 通道变换，例如从(530,800,3) 变成 (3,530,800)
    transformer.set_mean('data', np.load(npyMean).mean(1).mean(1))
     #如果你在训练模型的时候没有对输入做mean操作，那么这边也不需要
    transformer.set_raw_scale('data', 255)  # rescale from [0, 1] to [0, 255]
    transformer.set_channel_swap('data', (2, 1, 0))  # swap channels from RGB to BGR
    
    with open('/home1/xxx/RemoteSensing/val.txt') as image_list: 
    # 修改成你要测试的txt文件的路径，这个txt文件的内容一般是：每行表示图像的路径，
    #然后空格，然后是标签，也就是说每行都是两列
        with open('rs_prediction_resize_center.txt','w') as result: 
    # 如果你想把预测的结果写到一个txt文件中，那么把这个路径修改成你想保存这个txt文件的路径
            count_right=0
            count_all=0
            while 1:
                list_name=image_list.readline()
                if list_name == '\n' or list_name == '': #如果txt文件都读完了则跳出循环
                    break
                image_type=list_name[0:-3].split('.')[-1]
                if image_type == 'gif': #这里我对gif个数的图像直接跳过
                    continue
                #print('image_type' + image_type)
                #print '*******'+ list_name.split(' ')[1]
                img_name = list_name.split(' ')[0]
                image = caffe.io.load_image(os.path.join('/home1/xxx/RemoteSensing/val_resize/',img_name)) 
                # 这里要添加你的图像所在的路径，根据你的list_name灵活调整，总之就是图像路径
                #imshow(image)
                output_prob = np.zeros((1, 45))
                image_shape = np.array(image.shape)
                crop_dims = (224,224)
                crop_dims = np.array(crop_dims)
                range_ = image_shape[0] - crop_dims[0]
                #for k in range(0, range_ + 1, crop_dims[0]/4) + range(range_, 1, -crop_dims[0]/4):
                    #for m in range(0, range_ + 1, crop_dims[1]/4) + range(range_, 1, -crop_dims[1]/4):
                        #crop_img = image[m:m+crop_dims[0],k:k+crop_dims[1],:]
                       
                        #transformed_image = transformer.preprocess('data', crop_img)
    
                # 用转换后的图像代替net.blob中的data
                        #net.blobs['data'].data[...] = transformed_image
                        #net.blobs['data'].reshape(1, 3, 224, 224)
                ### perform classification
                        #output = net.forward()
    
            # 读取预测结果和真实label
                        #output_prob += net.blobs['prob'].data[0]
    
                crop_img = image[(image_shape[0]-crop_dims[0]) / 2:(image_shape[0]-crop_dims[0]) / 2 + crop_dims[0],(image_shape[1]-crop_dims[1]) / 2:(image_shape[1]-crop_dims[1]) / 2 + crop_dims[1],:]
                       
                transformed_image = transformer.preprocess('data', crop_img)
    
                # 用转换后的图像代替net.blob中的data
                net.blobs['data'].data[...] = transformed_image
                net.blobs['data'].reshape(1, 3, 224, 224)
                ### perform classification
                output = net.forward()
    
            # 读取预测结果和真实label
                output_prob += net.blobs['prob'].data[0]
                true_label = int(list_name.split(' ')[1])
        # 如果预测结果和真实label一样，则count_right+1
                if(output_prob.argmax()==true_label):
                    count_right=count_right+1
                count_all=count_all+1
    
        # 保存预测结果，这个可选
                result.writelines(list_name.split(' ')[0] + ' ' + str(int(list_name.split(' ')[1])) +' '+str(output_prob.argmax())+'\n')
        #可以每预测完100个样本就打印一些，这样好知道预测的进度，尤其是要预测几万或更多样本的时候，否则你还以为代码卡死了
                if(count_all%100==0):
                    #print(list_name.split('\n')[0])
                    print(count_all)
    
           # 打印总的预测结果
            print('Accuracy: '+ str(float(count_right)/float(count_all)))
            print('count_all: ' + str(count_all))
            print('count_right: ' + str(count_right))
            print('count_wrong: ' + str(count_all-count_right))

其可以生成一个预测文件，有三列

第一列是图片名称
第二列是是图片的真实标签（groundtruth）
第三列是图片的预测值

同时打印出模型预测的精度：

至此，我们已完成在caffe下从制作数据集到网络训练再到测试的全部过程。

希望能帮助到各位。谢谢。
2019.7.10

多线程之三：MFC多线程及实例（转） Stef若木 MFC 线程
MFC中有两类线程，分别称之为工作者线程和用户界面线程。二者的主要区别在于工作者线程没有消息循环，而用户界面线程有自己的消息队列和消息循环。工作者线程没有消息机制，通常用来执行后台计算和维护任务，如冗长的计算过程，打印机的后台打印等。用户界面线程一般用于处理独立于其他线程执行之外的用户输入，响应用户及系统所产生的事件和消息等。但对于Win32的API编程而言，这两种线程是没有区别的，它们都只需线程
【LangChain编程：从入门到实践】实现多模态代理 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】实现多模态代理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：LangChain编程，多模态代理，自然语言处理，多媒体数据融合，复杂任务解决能力1.背景介绍1.1大背景与问题的提出随着人工智能技术的飞速发展，尤其是大模型在自然语言处理领域的突破，如通义千问、通义万相、阿里云通义大模型等，我们正迎来一个全
Unity 列表滚动到指定位置程序猿多布 unity
使用场景策划提出需求：当玩家打开领奖界面时，奖励列表需要自动滑动到可以领奖的奖励栏处或者正在进行的任务栏处。思路1、将Content设置好对齐方式和锚点子物体的预制体和Content：pivot轴心点设置为(0,1),并且设置为左上角对齐。2、主要根据索引计算Content需要设置的高度即（RectTransform的PosY）varsumHeight=targetIndex*(itemHeigh
神经网络中的Adagrad 化作星辰神经网络人工智能深度学习
Adagrad（AdaptiveGradient）是一种自适应学习率的优化算法，专门设计用于在训练过程中自动调整每个参数的学习率。这种方法对于处理稀疏数据特别有效，并且非常适合那些需要频繁更新但很少使用的参数的学习任务。###Adagrad的核心思想Adagrad通过累积过去所有梯度平方的和来调整每个权重的学习率。具体来说，它为网络中的每个参数维护一个历史梯度平方和，然后用这个累积值来缩放当前的学
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路步子哥人工智能
“逻辑是智慧的骨架，而语言是智慧的血肉。让大语言模型（LLMs）既能说会道，又能逻辑严谨，是AI发展的下一座高峰。”开篇：语言模型的“逻辑盲区”近年来，大语言模型（LLMs）在自然语言处理（NLP）任务中取得了令人瞩目的成就。从生成流畅的文章到翻译复杂的句子，这些模型似乎无所不能。然而，当我们试图让它们回答逻辑推理问题时，却发现它们的表现常常令人失望。比如，某顶尖LLM在回答以下问题时出现了自相矛
基于STM32的无人机自主导航与避障系统 STM32发烧友 stm32 无人机嵌入式硬件
目录引言环境准备2.1硬件准备2.2软件准备无人机自主导航与避障系统基础3.1控制系统架构3.2功能描述代码实现：实现无人机自主导航与避障系统4.1数据采集模块4.2数据处理与控制算法4.3通信与远程监控实现4.4用户界面与数据可视化应用场景：无人机智能化与任务执行问题解决方案与优化收尾与总结1.引言无人机自主导航与避障技术是无人机系统实现智能化和高效任务执行的核心功能。基于STM32微控制器，该
【spug】使用勤不了一点 CI/CD python django ci/cd 运维 devops
目录简介下载与安装初始化配置启动与日志版本更新登录与使用工作台主机管理批量执行配置中心应用发布系统管理监控与告警使用问题简介手动部署|Spugwalle的升级版本轻量级无Agent主机管理主机批量执行主机在线终端文件在线上传下载应用发布部署在线任务计划配置中心监控报警如果有测试错误请指出。下载与安装测试环境：Python3.7.8CentOSLinuxrelease7.4.1708(Core)sp
【NFS】Lock reclaim failed-造成web卡住504 勤不了一点基础应用 linux nfs
目录警报触发排查过程解决问题后续优化，避免同类问题收获警报触发搬砖搬砖。。。突然邮件弹窗XXX系统访问504，难道又是别人请求响应超时了？紧接着又来了几个504，不秒啊，决定上机器一探究竟。排查过程ps-ef发现不少php程序，每分钟几个很规律。怀疑是不是crond里面添加的计划任务卡住了。先记着继续查看top,lsof-pXX,df-Th，iostat一套工具下去，想看看是不是系统资源限制了，发
C++库std::future 码农葫芦侠 C++库 c++
std::future介绍成员函数作用使用场景异步任务并发控制结果获取用法示例使用std::async关联异步任务使用std::promise与std::future配合结果获取与异常处理注意事项其他std::shared_futurestd::future_status介绍std::futurefstd::future是C++11标准库（并发支持库）中的一个模板类，它表示一个异步操作的结果。当我
Python异步编程-asyncio详解我爱让机器学习 python 开发语言 asyncio 异步
目录asyncio简介示例什么是asyncio?适用场景APIasyncio的使用可等待对象什么是可等待对象？协程对象任务对象Future对象协程什么是协程？基本使用运行协程Task什么是Task？创建Task取消TaskTask异常获取Task回调TaskGroup什么是TaskGroup？为什么使用TaskGroup？创建任务异常处理同步任务完成asyncio简介示例首先，我们来看一个简单的H
7.asyncio库详解汪汪队~ Python系列教程之进阶篇 python
深入理解Python的asyncio库Python的asyncio库是一个强大的异步I/O框架，用于处理并发和异步编程。它提供了一种基于协程的方式来处理异步任务，使得编写异步代码更加简单和直观。1.什么是asyncio？asyncio是Python3.4引入的标准库，用于编写协程和异步代码。它基于事件循环（EventLoop）的概念，通过异步任务（coroutines）和Future对象来实现非阻
Power Automate入门1 - 云端流泽西岛
一、不同类型流的概述PowerAutomate是一项服务，可用于自动执行重复性任务以提高所有组织的效率。您可以创建云端流、桌面流或业务流程流。云端流当您希望自动、即时或通过计划触发自动化时，请创建云端流。流类型用例自动化目标自动化流创建事件(如来自特定人员的电子邮件到达，或在社交媒体中描述公司)触发的自动化。云或本地服务的连接器连接您的帐户，并使其与彼此交流。即时流通过单击按钮启动自动化。可以从桌
Python -- asyncio库鹿夏
asyncio协程前言问题的引出多线程版本多进程版本生成器版本事件循环协程FutureTask任务协程的使用回调的使用多个任务执行使用回调,如下新语法TCPEchoServer举例aiohttp库安装文档开发前言3.4版本加入标准库。asyncio底层基于selectors实现，看似库，其实就是个框架，包含异步IO、事件循环、协程、任务等内容问题的引出defa():forxinrange(3):p
使用Python或R语言重新拟合模型 pk_xz123456 python 算法 python r语言开发语言
以下分别给出使用Python和R语言完成该任务的示例代码，假设我们有一个包含被试编号、实验条件和反应时的数据，并且要拟合一个线性回归模型。Python实现importpandasaspdimportnumpyasnpimportstatsmodels.apiassm#生成示例数据data={'subject':np.repeat(range(1,11),5),'condition':np.tile
利用DSPy优化LangChain RAG系统的实战指南 scaFHIO langchain python
利用DSPy优化LangChainRAG系统的实战指南技术背景介绍DSPy是一个用于大语言模型（LLMs）的出色框架，它引入了一个自动编译器，能够教会模型如何执行你程序中的声明性步骤。具体来说，DSPy编译器会在内部追踪你的程序，然后为大型语言模型（LLMs）创建高质量的提示（或为小型LLMs训练自动微调），以教会它们任务的步骤。感谢OmarKhattab的努力，现在DSPy可以与LangChai
文章精读篇——用于遥感小样本语义分割的可学习Prompt LiXiang like coding吗学习 prompt 人工智能
题目：LearnablePromptforFew-ShotSemanticSegmentationinRemoteSensingDomain会议：CVPR2024Workshop论文：10.48550/arXiv.2404.10307相关竞赛：https://codalab.lisn.upsaclay.fr/competitions/17568年份：2024任务背景小样本语义分割（Few-shot
GPT-4提示词冠军如何写 prompt：CO-STAR 框架、文本分段、系统提示天涯倦客的美丽人生 prompt 数据库
CO-STAR框架CO-STAR框架用来构建提示词(prompt)，分隔符对提示词进行文本分段。©上下文：为任务提供背景信息通过为大语言模型（LLM）提供详细的背景信息，可以帮助它精确理解讨论的具体场景，确保提供的反馈具有相关性。(O)目标：明确你要求大语言模型完成的任务清晰地界定任务目标，可以使大语言模型更专注地调整其回应，以实现这一具体目标。(S)风格：明确你期望的写作风格你可以指定一个特定的
前言：什么是大模型微调伯牙碎琴大模型微调深度学习人工智能机器学习大模型微调训练
一、大模型微调的基础知识1.什么是大模型微调？大模型微调（Fine-tuning）是指在预训练模型的基础上，针对特定的任务或数据集进行进一步训练的过程。预训练模型通常在大规模的通用数据上训练，具备广泛的语言理解和生成能力。通过微调，我们可以让模型更好地适应特定的领域或任务，例如情感分析、问答系统、文本生成等。2.为什么需要微调？适应特定任务：通用模型虽然功能强大，但在特定任务上可能表现不够精准。微
深入理解 Spring IoC 与 DI：控制反转与依赖注入解析代码江 Spring spring java 后端
前言：在接触Spring框架之前，通常我们会在main方法或其他业务逻辑中手动new对象，然后调用这些对象的方法来完成任务。手动创建对象的方式意味着我们自己掌握了对象的控制权。然而，在Spring中，我们不再直接在代码中手动创建对象，而是将对象的创建、管理、依赖注入等职责交给了Spring容器。Spring框架通过IoC（控制反转）和DI（依赖注入）来实现这一点。大家伙，这次封面是我把标题发给ai
【深入探索 Caffeine：Java 缓存利器】提前退休了-程序员阿飞 java 缓存 spring
引言咱搞软件开发的时候，缓存可是提升系统性能的关键。用好了缓存，能大大减少对数据库、远程服务这些后端数据源的访问，系统响应更快，吞吐量也能提高。Java里有不少不错的缓存框架，不过Caffeine性能好、功能多，越来越受开发者欢迎了。接下来我就跟你好好唠唠Caffeine的原理、特点还有咋用，让你能把这个厉害的缓存工具用得明明白白。什么是Caffeine？Caffeine是一个基于Java8开发的
阿里重磅模型深夜开源；DeepSeek宣布开源DeepGEMM；微软开源多模态AI Agent基础模型Magma...|网易数智日报网易数智网易数智日报开源人工智能大数据业界资讯 ai AIGC
阿里重磅模型深夜开源：表现超越Sora、Pika，消费级显卡就能跑2月26日，25日深夜阿里云视频生成大模型万相2.1（Wan）正式宣布开源，此次开源采用Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务。据阿里云官方介绍，14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出，在权威评测集Vbench中，万相
A100高效架构深度解析智能计算研究中心其他
内容概要NVIDIAA100GPU作为面向人工智能与高性能计算的关键硬件载体，其架构创新标志着计算范式的重要演进。本文通过系统性拆解A100的核心技术模块，重点探讨其在计算密度、互联效率与资源利用率三个维度的突破性设计。在计算架构层面，第三代TensorCore通过引入细粒度结构化稀疏支持与新型数据格式，显著提升矩阵运算效率；多实例GPU（MIG）技术则通过物理级硬件隔离实现单卡多任务并行处理，为
DeepSeek智能引擎：高效重塑创作与开发智能计算研究中心其他
内容概要DeepSeek智能引擎通过创新的混合专家架构（MixtureofExperts），在670亿参数规模下实现了多模态智能处理能力的突破性进展。该架构通过动态路由机制，使模型在处理复杂任务时能够自动调用最适配的专家模块，相较于传统单体模型，其推理效率提升约40%，同时保持90%以上的参数利用率。系统核心功能模块对比如下：功能模块核心能力应用场景处理速度（Tokens/s）DeepSeekCh
【openCV-89】人脸检测华东算法王华东算法王-opencv opencv 人工智能计算机视觉
人脸检测简介人脸检测是计算机视觉中的一个重要任务，旨在从图像或视频中识别并定位出人脸的位置。人脸检测不仅是人脸识别、表情分析、面部特征点检测等高级任务的前置步骤，而且在安防监控、智能家居、自动驾驶等多个领域都具有广泛应用。人脸检测的目标人脸检测的目标是从输入的图像或视频流中自动检测出所有人脸的区域，通常用矩形框（boundingbox）表示人脸的位置。人脸检测不仅要识别图像中的人脸，还要在各种条件
使用Hugging Face Text Embeddings Inference进行文本嵌入推理 dgay_hua python
在自然语言处理中，文本嵌入是一个重要的技术，它将文本转换为可以由机器学习算法处理的数字向量。在这篇文章中，我们将探讨如何使用HuggingFace的TextEmbeddingsInference（TEI）工具包来部署和服务开源文本嵌入和序列分类模型。TEI支持高性能提取，包括常用的嵌入模型如FlagEmbedding、Ember、GTE和E5。技术背景介绍文本嵌入在现代NLP任务中起着关键作用，它
深入Android HandlerThread 使用及其源码完全解析 ThreadLocalForrest android java ui
本篇我们将来给大家介绍HandlerThread这个类，以前我们在使用线程执行一个耗时任务时总会new一个Thread的线程去跑，当任务执行完后，线程就会自动被销毁掉，如果又由新的任务，我们又得新建线程.....我们假设这样的一个情景，我们通过listview去加载图文列表，当我们往下滑动时，这时需要不断去请求网络资源，也就是需要不断开线程去加载网络资源，如果每次都new一个Thread，这显然是
Java中常用的分布式排他锁实现方式阿湯哥 java 分布式开发语言
在分布式系统中，实现排他锁需要跨节点的协调机制。以下是Java中常用的分布式排他锁实现方式及其详细说明：1.基于数据库的实现原理：利用数据库的唯一约束或乐观锁机制确保锁的互斥性。步骤：创建锁表，设置唯一索引字段（如锁名称）。获取锁时插入记录，成功则获得锁；释放时删除记录。添加超时机制，通过定时任务清理过期锁。Java实现：//示例：使用唯一约束try{//插入锁记录，若冲突则失败jdbcTempl
AI+RPA：开启智能自动化新时代 coding侠客 AI+RPA系列人工智能 rpa 自动化 python
不知大家在日常的购物中，有没有想过，京东，淘宝等平台面对如此庞大的用户量，618，双十一等活动期间的各种报表是如何快速生成的呢？当我们刷短视频时，可曾疑惑过，为何相似主题的短视频，有的点赞，评论等互动量很高，有些却很少？直播带货公司为何能迅速崛起？还有，在面对大批量数据校验时，如何高效完成任务？答案或许就藏在RPA之中。本文将探讨在AI时代，RPA与AI的紧密结合，将会给我们带来哪些机会。一、RP
python dag调度系统开发_基于DAG的分布式任务调度平台-Maat weixin_39634997 python dag调度系统开发
背景什么是MaatMaat是一个基于开源项目Airflow的流程调度系统，它支持用户自定义地组装流程节点，流程可以在用户指定的时间触发(支持crontab格式)，或由用户手动触发。Maat的所有节点分布式地运行在Hippo上，由Drogo调度。用户可以创建自己的调度节点和执行节点，达到资源隔离的目的。用户可以通过配置的方式安装自己执行节点的运行环境，也可以配置执行节点的副本数。下图展示了一个任务的
Python 文本处理神器：textwrap 模块深度解析 tekin Python 编程秘籍库 python 开发语言 Python 文本处理 textwrap 模块深度解析
Python文本处理神器：textwrap模块深度解析在Python编程中，处理文本是一项常见任务，比如自动换行、填充文本、缩短文本等。textwrap模块就像是一个贴心助手，专门用来解决这些问题。本文将带你深入了解textwrap模块的各种功能，通过丰富的示例代码和清晰的讲解，让你轻松掌握它的使用技巧，提升文本处理能力。文章目录Python文本处理神器：textwrap模块深度解析一、`text
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S