weixin_39971132

基于python实现resnet_【Tensorflow系列】使用Inception_resnet_v2训练自己的数据集并用Tensorboard监控...

【写在前面】

用Tensorflow(TF)已实现好的卷积神经网络(CNN)模型来训练自己的数据集，验证目前较成熟模型在不同数据集上的准确度，如Inception_V3, VGG16，Inception_resnet_v2等模型。本文验证Inception_resnet_v2基于菜场实拍数据的准确性，测试数据为芹菜、鸡毛菜、青菜，各类别样本约600张，多个菜场拍摄，不同数据源。

补充：自己当初的计划是用别人预训练好的模型来再训练自己的数据集已使可以完成新的分类任务，但必须要修改代码改网络结构，并使用迁移学习(Fine-tune)

本文记录了其间的工作过程，相信也会有一些帮助的 : )

测试环境：Centos7.3-64位 python3.5.4(Anaconda)

一.准备

1.安装python

2.安装tensorflow

3.下载TF-slim图像库

4.准备数据

5.下载模型

二.训练

1.读入数据

2.构建模型

3.开始训练

4.执行脚本，训练自己的数据

5.可视化log

【问题】 tensorboard版本已更新，找不到对应包

三.验证

四.测试

一.准备

1.安装python

推荐Anaconda，可创建虚拟环境，用conda命令易实现虚拟环境管理、包管理，安装包时会查出所有依赖包并一共一键安装，链接：https://www.anaconda.com/download/

2.安装tensorflow

进入当下Anaconda的运行环境，我安装的是python2.7版，并创建3.5虚拟环境

conda create -n py35 python=3.5 【py35是虚拟环境的名称; 输入y 安装】

source activate py35 【激活py35环境】

conda install tensorflow 【安装tensorflow-cpu版，有GPU可安装cpu版】

3.下载TF-slim代码库

cd $WORKSPACE 【目录跳转到自己的工作目录下】

git clone https://github.com/tensorflow/models/

4.准备数据

对所有训练样本按不同样本类别存在不同文件夹下

zsy_train|---jimaocai|--- 0.jpg|---...|---qc|---qingcai

下面的代码是为了生成list.txt ，把不同文件夹下的图片和数字label对应起来

1 importos2 class_names_to_ids = {'jimaocai': 0, 'qc': 1, 'qingcai': 2}3 data_dir = 'flower_photos/'

4 output_path = 'list.txt'

5 fd = open(output_path, 'w')6 for class_name inclass_names_to_ids.keys():7 images_list = os.listdir(data_dir +class_name)8 for image_name inimages_list:9 fd.write('{}/{} {}\n'.format(class_name, image_name, class_names_to_ids[class_name]))10 fd.close()

为了方便后期查看label标签，也可定义labels.txt

jimaocai

qingcai

随机生成训练集和验证集(在总量中随机选取350个样本作为验证集)

1 importrandom2 _NUM_VALIDATION = 350

3 _RANDOM_SEED =04 list_path = 'list.txt'

5 train_list_path = 'list_train.txt'

6 val_list_path = 'list_val.txt'

7 fd =open(list_path)8 lines =fd.readlines()9 fd.close()10 random.seed(_RANDOM_SEED)11 random.shuffle(lines)12 fd = open(train_list_path, 'w')13 for line inlines[_NUM_VALIDATION:]:14 fd.write(line)15 fd.close()16 fd = open(val_list_path, 'w')17 for line inlines[:_NUM_VALIDATION]:18 fd.write(line)19 fd.close()

生成TFRecord数据

importsys#sys.path.insert(0, '../models/slim/') models-master research

sys.path.insert(0, './models/research/slim/') #把后面的路径插入到系统路径中 idx=0

from datasets importdataset_utilsimportmathimportosimporttensorflow as tf#根据list路径把数据转化为TFRecord#def convert_dataset(list_path, data_dir, output_dir, _NUM_SHARDS=5):

def convert_dataset(list_path, data_dir, output_dir, _NUM_SHARDS=3):

fd=open(list_path)

lines= [line.split() for line infd]

fd.close()

num_per_shard= int(math.ceil(len(lines) /float(_NUM_SHARDS)))

with tf.Graph().as_default():

decode_jpeg_data= tf.placeholder(dtype=tf.string)

decode_jpeg= tf.image.decode_jpeg(decode_jpeg_data, channels=3)

with tf.Session('') as sess:for shard_id inrange(_NUM_SHARDS):

output_path=os.path.join(output_dir,#'data_{:05}-of-{:05}.tfrecord'.format(shard_id, _NUM_SHARDS))

'data_{:03}-of-{:03}.tfrecord'.format(shard_id, _NUM_SHARDS))

tfrecord_writer=tf.python_io.TFRecordWriter(output_path)

start_ndx= shard_id *num_per_shard

end_ndx= min((shard_id + 1) *num_per_shard, len(lines))for i inrange(start_ndx, end_ndx):

sys.stdout.write('\r>> Converting image {}/{} shard {}'.format(

i+ 1, len(lines), shard_id))

sys.stdout.flush()

image_data= tf.gfile.FastGFile(os.path.join(data_dir, lines[i][0]), 'rb').read()

image= sess.run(decode_jpeg, feed_dict={decode_jpeg_data: image_data})

height, width= image.shape[0], image.shape[1]

example=dataset_utils.image_to_tfexample(

image_data, b'jpg', height, width, int(lines[i][1]))

tfrecord_writer.write(example.SerializeToString())

tfrecord_writer.close()

sys.stdout.write('\n')

sys.stdout.flush()

os.system('mkdir -p train')

convert_dataset('list_train.txt', 'zsy_train', 'train/')

os.system('mkdir -p val')

convert_dataset('list_val.txt', 'zsy_train', 'val/')

得到的文件夹结构如下

WORKSPACE

├── zsy_train

├── labels.txt

├── list_train.txt

├── list.txt

├── list_val.txt

├── train

│ ├── data_000-of-003.tfrecord

│ ├── ...

│ └── data_002-of-003.tfrecord

└── val

├── data_000-of-003.tfrecord

├── ...

└── data_002-of-003.tfrecord

5.下载模型

官方提供了预训练，这里以Inception-ResNet-v2以例

cd $WORKSPACE/checkpointswget http://download.tensorflow.org/models/inception_resnet_v2_2016_08_30.tar.gz

tar zxf inception_resnet_v2_2016_08_30.tar.gz

二.训练

1.读入数据

读入自己的数据，需要把下面代码写入models/slim/datasets/dataset_classification.py

importosimporttensorflow as tf

slim=tf.contrib.slimdef get_dataset(dataset_dir, num_samples, num_classes, labels_to_names_path=None, file_pattern='*.tfrecord'):

file_pattern=os.path.join(dataset_dir, file_pattern)

keys_to_features={'image/encoded': tf.FixedLenFeature((), tf.string, default_value=''),'image/format': tf.FixedLenFeature((), tf.string, default_value='jpg'),'image/class/label': tf.FixedLenFeature(

[], tf.int64, default_value=tf.zeros([], dtype=tf.int64)),

}

items_to_handlers={'image': slim.tfexample_decoder.Image(),'label': slim.tfexample_decoder.Tensor('image/class/label'),

}

decoder=slim.tfexample_decoder.TFExampleDecoder(keys_to_features, items_to_handlers)

items_to_descriptions={'image': 'A color image of varying size.','label': 'A single integer between 0 and' + str(num_classes - 1),

}

labels_to_names=Noneif labels_to_names_path is notNone:

fd=open(labels_to_names_path)

labels_to_names= {i : line.strip() for i, line inenumerate(fd)}

fd.close()returnslim.dataset.Dataset(

data_sources=file_pattern,

reader=tf.TFRecordReader,

decoder=decoder,

num_samples=num_samples,

items_to_descriptions=items_to_descriptions,

num_classes=num_classes,

labels_to_names=labels_to_names)

2.构建模型

构建模型取决于个人欲构建什么样的模型，官方都有对应模型的下载链接，只需把对应下载(下载链接：https://github.com/tensorflow/models/tree/master/research/slim)好的模型解压放入到checkpoints中即可

3.开始训练

由于是用已有模型训练自己的数据集，故需对原工程代码做适当调整。

把

from datasets import dataset_factory

改为：

from datasets import dataset_classification

把

dataset =dataset_factory.get_dataset(

FLAGS.dataset_name, FLAGS.dataset_split_name, FLAGS.dataset_dir)

改为：

dataset =dataset_classification.get_dataset(

FLAGS.dataset_dir, FLAGS.num_samples, FLAGS.num_classes, FLAGS.labels_to_names_path)

在

tf.app.flags.DEFINE_string('dataset_dir', None, 'The directory where the dataset files are stored.')

后加入：

tf.app.flags.DEFINE_integer('num_samples', 1781, 'Number of samples.')

tf.app.flags.DEFINE_integer('num_classes', 3, 'Number of classes.')

tf.app.flags.DEFINE_string('labels_to_names_path', None, 'Label names file path.')

4.执行脚本，训练自己的数据

cd $WORKSPACE/models/slim #跳转到工作环境目录

python train_image_classifier.py \ #运行脚本，后面跟的系统参数--train_dir=/root/workspace_mrt/model_lab/train_logs \ #train_log目录，当模型训练时，可用tensorboard命令指定该目录，动态监测--dataset_dir=../../../train \ #训练数据集里面是转换好的TFRecord格式--num_samples=1781\ 　　　　　　#训练样本数，即值train_set中的总样本数，不包括valid中随机抽取350个样本--num_classes=3\　　　　　　　　　　　　#样本类别数--labels_to_names_path=../../../labels.txt \--model_name=inception_resnet_v2 \--checkpoint_path=../../../checkpoints/inception_resnet_v2_2016_08_30.ckpt \ 　　#指定模型位置--checkpoint_exclude_scopes=InceptionResnetV2/Logits,InceptionResnetV2/AuxLogits \--trainable_scopes=InceptionResnetV2/Logits,InceptionResnetV2/AuxLogits \--clone_on_cpu=True　　　　　　　　#cpu训练必须加上该参数

#fine-tune要把 --checkpoint_path,--checkpoint_exclude_scopes，--trainable_scopes 加上

5.可视化log

为了可视化训练时的loss或其他指标，可用tensorboard，如下命令

tensorboard --logdir=${TRAIN_DIR}

在本教程中，对应执行下面命令

tensorboard --logdir=/root/workspace_mrt/model_lab/train_logs

【问题】 tensorboard版本已更新，找不到对应包

当执行

tensorboard --logdir=/root/workspace_mrt/model_lab/train_logs

时，得到如下错误

ImportError: No module named 'tensorflow.tensorboard.tensorboard'

究其原因，是因为在tensorflow更新时，包的位置和所属关系改变了。执行以下代码，可解决该问题。

cd /root/anaconda2/envs/py35/bin #跳转到对应python环境的bin目录下，修改tensorboard执行脚本代码，使之适应当前版本

vim tensorboard

把

import tensorflow.tensorboard.tensorboard

修改为：

import tensorboard.main

把

sys.exit(tensorflow.tensorboard.tensorboard.main())

修改为： sys.exit(tensorboard.main.main())

wq保存，退出，重新执行

tensorboard --logdir=/root/workspace_mrt/model_lab/train_logs

命令，无报错。根据日志提示，进入ip:6006进入tensorboard界面。

三.验证

使用自己的数据集，需修改models/slim/eval_image_classifier.py

把

from datasets import dataset_factory

改为：

from datasets import dataset_classification

把

dataset = dataset_factory.get_dataset( FLAGS.dataset_name, FLAGS.dataset_split_name, FLAGS.dataset_dir)

改为：

dataset =dataset_classification.get_dataset(

FLAGS.dataset_dir, FLAGS.num_samples, FLAGS.num_classes, FLAGS.labels_to_names_path)

在

tf.app.flags.DEFINE_string('dataset_dir', None, 'The directory where the dataset files are stored.')

后加入

tf.app.flags.DEFINE_integer('num_samples', 350, 'Number of samples.')

tf.app.flags.DEFINE_integer('num_classes', 3, 'Number of classes.')

tf.app.flags.DEFINE_string('labels_to_names_path', None, 'Label names file path.')

验证时执行以下命令即可：

python eval_image_classifier.py \--checkpoint_path=../../../checkpoints/inception_resnet_v2_2016_08_30.ckpt \--eval_dir=/root/workspace_mrt/model_lab/eval_logs \--dataset_dir=../../../val \--num_samples=350\--num_classes=3\--model_name=inception_resnet_v2

可以一边训练一边验证，注意使用其它的GPU或合理分配显存。

同样也可以可视化log，如果已经在可视化训练的log则建议使用其它端口，如：

tensorboard --logdir ../../../eval_logs/ --port 6007

四.测试

参考models/slim/eval_image_classifier.py，可编写批量读取图片用模型进行推导的脚本models/slim/test_image_classifier.py

from __future__ importabsolute_importfrom __future__ importdivisionfrom __future__ importprint_functionimportosimportjsonimportmathimporttimeimportnumpy as npimporttensorflow as tffrom nets importnets_factoryfrom preprocessing importpreprocessing_factory

slim=tf.contrib.slim

tf.app.flags.DEFINE_string('master', '', 'The address of the TensorFlow master to use.')

tf.app.flags.DEFINE_string('checkpoint_path', None,'The directory where the model was written to or an absolute path to a'

'checkpoint file.')

tf.app.flags.DEFINE_string('test_list', '', 'Test image list.')

tf.app.flags.DEFINE_string('test_dir', '.', 'Test image directory.')

tf.app.flags.DEFINE_integer('batch_size', 16, 'Batch size.')

tf.app.flags.DEFINE_integer('num_classes', 3, 'Number of classes.')

tf.app.flags.DEFINE_integer('labels_offset', 0,'An offset for the labels in the dataset. This flag is primarily used to'

'evaluate the VGG and ResNet architectures which do not use a background'

'class for the ImageNet dataset.')

tf.app.flags.DEFINE_string('model_name', 'inception_resnet_v2', 'The name of the architecture to evaluate.')

tf.app.flags.DEFINE_string('preprocessing_name', None, 'The name of the preprocessing to use. If left'

'as `None`, then the model_name flag is used.')

tf.app.flags.DEFINE_integer('test_image_size', None, 'Eval image size')

FLAGS=tf.app.flags.FLAGSdefmain(_):if notFLAGS.test_list:raise ValueError('You must supply the test list with --test_list')

tf.logging.set_verbosity(tf.logging.INFO)

with tf.Graph().as_default():

tf_global_step=slim.get_or_create_global_step()####################

#Select the model #

####################

network_fn =nets_factory.get_network_fn(

FLAGS.model_name,

num_classes=(FLAGS.num_classes -FLAGS.labels_offset),

is_training=False)#####################################

#Select the preprocessing function #

#####################################

preprocessing_name = FLAGS.preprocessing_name orFLAGS.model_name

image_preprocessing_fn=preprocessing_factory.get_preprocessing(

preprocessing_name,

is_training=False)

test_image_size= FLAGS.test_image_size ornetwork_fn.default_image_sizeiftf.gfile.IsDirectory(FLAGS.checkpoint_path):

checkpoint_path=tf.train.latest_checkpoint(FLAGS.checkpoint_path)else:

checkpoint_path=FLAGS.checkpoint_path

batch_size=FLAGS.batch_size

tensor_input= tf.placeholder(tf.float32, [None, test_image_size, test_image_size, 3])

logits, _=network_fn(tensor_input)

logits= tf.nn.top_k(logits, 5)

config=tf.ConfigProto()

config.gpu_options.allow_growth=True

test_ids= [line.strip() for line inopen(FLAGS.test_list)]

tot=len(test_ids)

results=list()

with tf.Session(config=config) as sess:

sess.run(tf.global_variables_initializer())

saver=tf.train.Saver()

saver.restore(sess, checkpoint_path)

time_start=time.time()for idx inrange(0, tot, batch_size):

images=list()

idx_end= min(tot, idx +batch_size)print(idx)for i inrange(idx, idx_end):

image_id=test_ids[i]

test_path=os.path.join(FLAGS.test_dir, image_id)

image= open(test_path, 'rb').read()

image= tf.image.decode_jpeg(image, channels=3)

processed_image=image_preprocessing_fn(image, test_image_size, test_image_size)

processed_image=sess.run(processed_image)

images.append(processed_image)

images=np.array(images)

predictions= sess.run(logits, feed_dict ={tensor_input : images}).indicesfor i inrange(idx, idx_end):print('{} {}'.format(image_id, predictions[i -idx].tolist())

time_total= time.time() -time_startprint('total time: {}, total images: {}, average time: {}'.format(

time_total, len(test_ids), time_total/len(test_ids)))if __name__ == '__main__':

tf.app.run()

测试时执行以下命令即可：

CUDA_VISIBLE_DEVICES="0"python test_image_classifier.py \--checkpoint_path=../../../train_logs/\--test_list=../../../list_val.txt \--test_dir=../../../val \--batch_size=16\--num_classes=3\--model_name=inception_resnet_v2

【参考】

【总结】

1.使用Tensorflow预训练模型(TF-slim)可以快速地测试已有成熟模型在不同数据集上的效果，且有利于数据代码架构和核心代码

2.若要自己实现已有成熟的网络模型，包括数据读取、训练、验证、测试，调优，则可用Tensorflow底层API或基于TF的高级API(TensorLayer TFLearn TF-slim)实现。从目前了解情况看，TensorLayer更好用，在DeepLearning中迁移学习更是如此

3.TensorFlow是一个非常庞大的架构，新手学习成本太高且难以摸清方向，故此借助下载已有models，调整参数和少量代码有助于进一步认识TensorFlow的实现原理，若想要更深入研究，手写CNN，看源码等都是不可避免的

4.当多看TensorFlow源码，迁移学习的一大利器！

你可能感兴趣的:(基于python实现resnet_【Tensorflow系列】使用Inception_resnet_v2训练自己的数据集并用Tensorboard监控...)

字符函数和字符串函数很会做人算法
一、字符分类函数头文件是#include下面是函数的使用条件，有x的就代表只要符合体条件就返回真我们以islower为例写一段代码实现一下功能:将小写字符改成大写字符#define_CRT_SECURE_NO_WARNINGS#include#includeintmain(){inti=0;chararr[20]={"aJsfjsJsfH"};while(arr[i]!='\0'){if(islo
利用 HAI 平台进行 DeepSeek 模型训练的详细指南
摘要本文旨在为非专业用户提供在HAI平台上进行DeepSeek模型训练的详细步骤。从创建项目、上传数据集、配置训练参数到启动训练任务并监控训练过程，本文将逐步指导用户完成整个流程。此外，本文还包含可运行的示例代码模块和相关章节配图，以帮助用户更好地理解和操作。引言HAI（HyperAI）平台是一个强大的AI模型训练平台，但对于非专业用户来说，其复杂性可能会成为使用的障碍。本文将详细介绍如何在HAI
基于oracle linux的 DBI/DBD 标准化安装文档(三) oracle
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
FerretDB 2.0：开源 MongoDB 替代品的安装与使用指南田猿笔记 MongoDB 开源数据库 FerretDB
介绍FerretDB2.0是一个开源数据库，旨在作为MongoDB的替代品。它与MongoDB5.0+的驱动程序和工具兼容，适合需要避免MongoDB许可复杂性的开发者。它的核心特点是使用PostgreSQL作为后端，并通过DocumentDB扩展提升性能，研究表明某些工作负载可快20倍。安装与使用安装FerretDB2.0使用dockercompose需要以下步骤：创建docker-compos
Pycharm2018 激活 Deng.Pan Software activation Pycharm Pycharm Patch
测试条件：WIN10+JetBrainsPyCharm2018.2.2x64使用破解补丁激活方式可以使用很久。下载附件JetbrainsCrack-3.1-release-enc.jar，并放置到pycharm安装目录的\bin目录下，其实位置可随意，只要配置时文件填写对应的路径即可。找到Pycharm安装目录的\bin目录下找到pycharm.exe.vmoptions和pycharm64.ex
05.静态代理设计模式 java
05.静态代理设计模式目录介绍01.静态代理模式基础1.1静态代理由来1.2静态代理定义1.3静态代理场景1.4静态代理思考02.静态代理原理与实现2.1罗列一个场景2.2用一个例子理解代理2.3案例演变分析03.静态代理分析3.1静态代理结构图3.2静态代理时序图04.代理模式优势4.1如何降低耦合4.2保护真实对象使用权限05.静态代理不足5.1静态代理类优缺点5.2静态代理缺乏灵活5.3静态
Debian/Ubuntu清理硬盘空间
在Debian/Ubuntu系统上清理硬盘空间的步骤在Debian或Ubuntu系统中，随着使用时间的增加，系统可能会逐渐积累大量的临时文件、软件包缓存、日志文件等，这些都可能导致硬盘空间的消耗。为了保持系统的高效运行，定期清理硬盘空间是必要的。下面将详细说明如何通过多种方式清理系统硬盘空间。1.删除不需要的软件包系统中安装的某些软件包在不再需要时，应该及时卸载，以释放空间。使用以下命令卸载不再需
@RequestParam、@RequestBody、@PathVariable YUELEI118 Java springboot
1.@RequestParam@RequestParam：get请求时如果用不到它的3个属性，可以省略；其他请求如果是通过param传送数据，必须使用该注释要点：可用于任何类型的请求（get请求数据在请求行中，post请求数据在请求体中）无论时在请求行还是请求体，格式都是：[email protected]属性v
使用vscode连接到华为云WordPress服务器北洋水师总督 vscode 华为云服务器
1.在vscode中安装扩展Remote-ssh2.连接到华为云服务器打开ssh按下Ctrl+Shift+P快捷键，出现窗口选择其中的Remote-SSH：ConnecttoHost输入远程主机的IP地址，前加root@。[email protected]输入密码，等待配置完成。连接成功
力扣SQL题记录（持续） Dxecozy leetcode sql
此贴用于个人写SQL题记录，主要是用于记录新的知识和一些个人觉得的难题思路，便于复习目录Leetcode高频SQL50题基本题基本条件筛选多表连接新知识CHAR_LENGTH()函数的使用，用于计算字符长度Leetcode高频SQL50题基本题基本条件筛选1757.可回收且低脂的产品584.寻找用户推荐人595.大的国家1148.文章浏览I多表连接1378.使用唯一标识码替换员工ID新知识CHAR
图片压缩及水印添加概述华为云微认证大嘴巴子华为网络技术华为华为云网络
一、图片压缩和水印添加概述（1）为更好地传输，存储和辨识数据；使用压缩降低图片大小，节约了成本；图片压缩：简单易用；；图片压缩软件：功能单一；网页在线图片压缩；自设图片压缩代码：需要变成基础；使用云服务批量压缩：适合批量处理，可结合自设代码；（2）水印：logo增加辨识，盖章表示版权；附加信息，可增加了地点等信息；二、函数工作流简介（1）是华为云提供的一款无服务器计算服务，它包含了函数和工作流两个
基于STC89C52的CD4511译码显示数字设计 @小张要努力单片机嵌入式硬件 51单片机 proteus mcu
摘要本文深入探讨基于STC89C52单片机的数字显示系统设计，剖析CD4511译码驱动芯片工作原理，结合Proteus仿真验证功能。通过硬件电路、软件编程及原理分析，完整呈现单片机控制数码管显示的实现过程，为相关开发提供理论与实践参考。一、引言在单片机应用中，数码管显示是基础模块。CD4511作为BCD码译码驱动芯片，可简化单片机与数码管接口设计。STC89C52凭借丰富资源与稳定性能，成为驱动C
基于传感器数据的城市空气质量预测与污染源分类云端.代码农夫CloudFarmer 分类数据挖掘人工智能
项目名称：基于传感器数据的城市空气质量预测与污染源分类创新点：结合时间序列预测（回归）与污染源分类（多标签分类），使用公开API获取实时数据。项目目标预测未来6小时的空气质量指数（AQI）。根据传感器数据判断可能的污染源类型（如工业排放、交通尾气、扬尘等）。数据集来源数据获取：通过开放API实时抓取（如OpenAQ、AirNow或国内公开的城市空气质量平台）。特征示例：PM2.5、PM10、SO2
Stream流与Guava工具类使用小薛博客 guava 数据库 java
Stream流与Guava工具类使用小薛博客官方地址Stream流与Guava工具类使用1、StreamAPI1、了解StreamJava8中有两大最为重要的改变。第一个是Lambda表达式；另外一个则是StreamAPI(java.util.stream.*)。Stream是Java8中处理集合的关键抽象概念，它可以指定你希望对集合进行的操作，可以执行非常复杂的查找、过滤和映射数据等操作。使用S
agent实现：通过prompt方式实现agent自定义使用 loong_XL 深度学习大模型AI prompt agent 打磨下大模型
参看：https://github.com/TommyZihao/openvino_tonypihttps://github.com/QwenLM/Qwen/blob/main/examples/react_prompt.md（思想类似react）通过prompt形式，基本任何llm模型都可以使用来自定义agent，不用只能那些支持functioncall的大模型的，更灵活自由prompt案例：比
C# 正则表达式的详细使用说明生命不息-学无止境 C#理论知识 c#正则表达式
正则表达式基础概念正则表达式是一种用于匹配文本模式的工具。它是由普通字符（例如字母、数字）和特殊字符（称为元字符）组成的字符串模式。在C#中，主要通过System.Text.RegularExpressions命名空间来使用正则表达式。元字符表格显示：分类正则表达式字符描述示例字符类.匹配除换行符之外的任意单个字符a.b可匹配aab、acb等[abc]匹配字符a、b或c中的任意一个[abc]可匹配
使用MarkdownHeaderTextSplitter拆分Markdown文档 scaFHIO python 前端开发语言
在AI驱动的应用中，如聊天机器人或问答系统，处理大型文档时，通过分片技术将文档拆分为更小的单元是必要的步骤。尤其是对于Markdown格式的文件，它们通常由各种层级的标题结构化组织。通过按标题拆分，有利于保留文档的上下文语义一致性。本篇文章将讲解如何使用MarkdownHeaderTextSplitter来实现这一目标。技术背景介绍在将完整的段落或文档进行嵌入时，嵌入过程会考虑文本的整体上下文以及
大数据和人工智能概念全面解析就犯得上方法
一、大数据和人工智能大数据是伴随着信息数据爆炸式增长和网络计算技术迅速发展而兴起的一个新型概念。根据麦肯锡全球研究所的定义，大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合，具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求，使数据能够从量变到质变，真正产生价值
Java之ArrayList M(菜鸡) java list
ArrayList1.1ArrayList简介ArrayList的底层是数组队列，相当于动态数组。与Java中的数组相比，它的容量能动态增长。在添加大量元素前，应用程序可以使用ensureCapacity操作来增加ArrayList实例的容量。这可以减少递增式再分配的数量。ArrayList继承了AbstractList，实现了List,RandomAccess,Cloneable,java.io
SpringBoot常用注解 AWen_X 言简意赅系列之Spring Java常用框架注解 spring boot java 后端 spring
SpringBoot常用注解SpringBoot框架提供了丰富的注解，极大地简化了应用开发。本文将SpringBoot常用注解按功能分组，并提供详细说明和使用示例。一、核心注解1.@SpringBootApplication这是SpringBoot应用的核心注解，标记在主类上，表明这是一个SpringBoot应用的入口。它是一个组合注解，相当于同时使用了以下三个注解：@Configuration：
pip download 是一个很有用的命令 weixin_46375180 pip
确实，pipdownload是一个很有用的命令，通常用于下载包到本地以供离线安装或在网络不稳定时使用。以下是关于pipdownload的详细介绍：pipdownload命令下载指定的包：使用pipdownload可以下载指定的包，而不安装它。例如，下载numpy包：pipdownloadnumpy下载指定版本的包：你可以指定要下载的包的版本：pipdownloadnumpy==1.21.0下载并指
Python之pip的安装和使用详细教程叫我技术帝 Python python
我们都知道python有海量的第三方库或者说模块，这些库针对不同的应用，发挥不同的作用。我们在实际的项目中，或多或少的都要使用到第三方库，那么如何将他人的库加入到自己的项目中内呢？打个电话？大哥你好，想用下你那个库，麻烦给邮箱发个源码呗！显然这是个笑话。Python官方的PyPi仓库为我们提供了一个统一的代码托管仓库，所有的第三方库，甚至你自己写的开源模块，都可以发布到这里，让全世界的人分享下载。
小程序Taro跨端框架实战总结 0xRick 小程序
1背景1.1项目项目需开发移动端，需支持以图表、表格等形式展示数据，对素材进行审核审批等功能。并需支持微信、企微小程序、h5等平台使用。2技术选型2.1基础框架选择从落地场景分析，我们需要具备，微信小程序，企微小程序，h5等平台的支持。如果采用小程序/h5等单平台框架开发，在开发效率与人力占用上的成本显然会与需要支持的平台数量成正比。同时小程序在原生开发上也无法使用工程化带来的部分提效功能，所以在
python使用pip安装本地包-Python之pip使用详解|附第三方库安装总结 weixin_37988176
首先简单介绍下pip是什么？pip是python的第三方库管理器，可以根据所开发项目的需要，使用pip相关命令安装不同库。Pyhon3.4以后，pip都默认跟Python一块安装，pip在python安装目录中的位置如下：执行方法：运行【win+R】+cmd，执行pip，查看是否安装成功。（找不到命令，则需要手动添加到环境变量）python官方提供了一个pypi库（https://pypi.org
理解并使用基于n-gram重叠的示例选择器 shuoac easyui 前端 javascript python
在AI及自然语言处理任务中，选择与输入最相似的示例可以显著提升生成的质量和上下文相关性。本文将介绍如何使用NGramOverlapExampleSelector工具，通过n-gram重叠来筛选和排序示例，从而帮助实现这一目标。技术背景介绍n-gram重叠技术通过比较输入文本与示例文本在字符或词组上的相似度，计算一个介于0到1之间的分数来表示相似度。这个分数越高，表示文本间的重叠越大。NGramOv
PDF转图片 JAVA JAVA派派 java PDF
前言以下是一个使用ApachePDFBox将PDF文件转换为图片的封装方法。这个方法将会把PDF的每一页转换为一张图片，并保存到指定的目录中。1.添加依赖首先，你需要在项目中添加PDFBox的依赖。如果你使用的是Maven，可以在pom.xml中添加以下依赖：org.apache.pdfboxpdfbox2.0.292.转换方法importorg.apache.pdfbox.pdmodel.PDD
USB摄像头数据获取——libuvc jbjhzstsl linux
优点：跨平台支持：libuvc是一个跨平台的库，可以在不同的操作系统上使用，包括Linux、Windows和macOS等。简单易用：libuvc提供了一套简单易用的API，使得使用摄像头设备变得更加简便，尤其适合快速开发原型和简单应用。封装性好：libuvc封装了许多底层细节，如视频格式转换、缓冲区管理等，简化了开发过程。缺点：功能有限：相对于V4L2，libuvc提供的功能相对有限，可能无法满足
使用LangSmith Chat Datasets微调模型 scaFHIO python 人工智能机器学习
在这篇文章中，我们将探讨如何通过LangSmithChatDatasets轻松微调模型。这一过程分为三个简单的步骤：创建聊天数据集。使用LangSmithDatasetChatLoader加载示例。微调你的模型。微调后，您可以在LangChain应用中使用微调过的模型。在深入探讨之前，我们需要安装一些前置条件。前置条件确保您已经安装了langchain>=0.0.311并准备好LangSmithA
【后端】【django】Django 自带的用户系统与 RBAC 机制患得患失949 django知识数据库 sqlite django
Django自带的用户系统与RBAC机制Django自带的用户系统（django.contrib.auth）提供了身份验证（Authentication）和权限管理（Authorization），能够快速实现用户管理、权限控制、管理员后台等功能，同时具备RBAC（基于角色的访问控制，Role-BasedAccessControl）的基本实现。本文将详细介绍Django用户系统的功能、管理员账号创建
从0到1，带你快速上手Scala语言 qq_23519469 scala 开发语言后端
什么是ScalaScala，读作“skah-lah”，是“ScalableLanguage”的缩写，是一门多范式编程语言。它就像是编程世界里的“变形金刚”，融合了面向对象编程（OOP）和函数式编程（FP）的特性，这意味着开发者能在同一语言中，把面向对象的设计和函数式编程的抽象结合起来使用，超级灵活！它运行在Java虚拟机（JVM）上，能与现有的Java代码无缝集成。这就好比Scala是Java的“
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin