FistQ

inception-v3模型神经网络图片识别系统搭建详细流程（1）

阅读前提示：代码复制过来时带有行号，运行本文程序需要自行删除行号并检查是否存在缩进错误。本文整理了该模型的运行经验，经过验证可行。
本文详细介绍了基于inception-v3模型的神经网络图片识别系统搭建过程。

1. 系统搭建

进行系统搭建前，需要配置文件夹，如图1，介绍了工程的文件架构。

工程名称为cnn_inception_v3-20181218。
说明如下：
|-dataset #存放数据集
|-record #存放record文件
train.tfrecords #train的record文件
val.tfrecords #val的record文件
|-train #存放用于训练的图片，按类存取，共5类。
|-animal #存放若干张动物的图片
|-flower
|-guitar
|-houses
|-plane
|-val #存放用于评价的图片，按类存取，共5类。
|-animal
|-flower
|-guitar
|-houses
|-plane
label.txt #存放5个标签名称
train.txt #存放训练数据集标签
val.txt #存放评价数据集标签
|-models #存放模型
|-pb #存放pb模型
frozen_model.pb #训练获取的pb模型
checkpoint #检查点文件，文件保存了一个目录下所有的模型文件列表。
model.ckpt-200.data-00000-of-00001 #保存模型中每个变量的取值
model.ckpt-200.index
model.ckpt-200.meta #文件保存了TensorFlow计算图的结构，可以理解为神经网络
#的网络结构，该文件可以被 tf.train.import_meta_graph 加载
#到当前默认的图来使用。
|-slim #存放slim函数库
|-test_image #存放测试的文件
convert_pb.py #将ckpt模型转化为pb模型
create_labels_files.py #将数据创建标签
create_tf_record.py #将数据转化为record格式
inception_v3_train_val.py #训练数据
predict.py #测试模型

1.1 创建数据标签

在dataset/train和dataset/val文件下存放图片数据集，共有五类图片，分别是：flower、guitar、animal、houses和plane，每组数据集大概有800张左右。create_labels_files.py可以直接生成训练train和验证val的数据集txt文件。
create_labels_files.py代码如下：

1.	#调入库
2.	import os
3.	# os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
4.	import os.path
5.	
6.	def write_txt(content, filename, mode='w'):
7.	    """保存txt数据
8.	    :param content:需要保存的数据,type->list
9.	    :param filename:文件名
10.	    :param mode:读写模式:'w' or 'a'
11.	    :return: void
12.	    """
13.	    with open(filename, mode) as f:
14.	        for line in content:
15.	            str_line = ""
16.	            for col, data in enumerate(line):
17.	                if not col == len(line) - 1:
18.	                    # 以空格作为分隔符
19.	                    str_line = str_line + str(data) + " "
20.	                else:
21.	                    # 每行最后一个数据用换行符“\n”
22.	                    str_line = str_line + str(data) + "\n"
23.	            f.write(str_line)
24.	
25.	
26.	def get_files_list(dir):
27.	    '''
28.	    实现遍历dir目录下,所有文件(包含子文件夹的文件)
29.	    :param dir:指定文件夹目录
30.	    :return:包含所有文件的列表->list
31.	    '''
32.	    # parent:父目录, filenames:该目录下所有文件夹,filenames:该目录下的文件名
33.	    files_list = []
34.	    for parent, dirnames, filenames in os.walk(dir):
35.	        for filename in filenames:
36.	            # print("parent is: " + parent)
37.	            # print("filename is: " + filename)
38.	            # print(os.path.join(parent, filename))  # 输出rootdir路径下所有文件（包含子文件）信息
39.	            curr_file = parent.split(os.sep)[-1]
40.	            if curr_file == 'flower':
41.	                labels = 0
42.	            elif curr_file == 'guitar':
43.	                labels = 1
44.	            elif curr_file == 'animal':
45.	                labels = 2
46.	            elif curr_file == 'houses':
47.	                labels = 3
48.	            elif curr_file == 'plane':
49.	                labels = 4
50.	            files_list.append([os.path.join(curr_file, filename), labels])
51.	    return files_list
52.	
53.	
54.	if __name__ == '__main__':
55.	    train_dir = 'dataset/train'
56.	    train_txt = 'dataset/train.txt'
57.	    train_data = get_files_list(train_dir)
58.	    write_txt(train_data, train_txt, mode='w')
59.	
60.	    val_dir = 'dataset/val'
61.	    val_txt = 'dataset/val.txt'
62.	    val_data = get_files_list(val_dir)
63.	    write_txt(val_data, val_txt, mode='w')

1.2 制作tfrecords数据格式

有了 train.txt和val.txt数据集，我们就可以制作train.tfrecords和val.tfrecords文件了，create_tf_record.py如下。

1.	#图片转向量函数
2.	# -*-coding: utf-8 -*-
3.	"""
4.	    @Project: create_tfrecord
5.	    @File   : create_tfrecord.py
6.	    @Author : panjq
7.	    @E-mail : pan_jinquan@163.com
8.	    @Date   : 2018-07-27 17:19:54
9.	    @desc   : 将图片数据保存为单个tfrecord文件
10.	"""
11.	
12.	##########################################################################
13.	
14.	import tensorflow as tf
15.	import numpy as np
16.	import os
17.	import cv2
18.	import matplotlib.pyplot as plt
19.	import random
20.	from PIL import Image
21.	
22.	
23.	##########################################################################
24.	def _int64_feature(value):
25.	    return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))
26.	# 生成字符串型的属性
27.	def _bytes_feature(value):
28.	    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))
29.	# 生成实数型的属性
30.	def float_list_feature(value):
31.	  return tf.train.Feature(float_list=tf.train.FloatList(value=value))
32.	
33.	def get_example_nums(tf_records_filenames):
34.	    '''
35.	    统计tf_records图像的个数(example)个数
36.	    :param tf_records_filenames: tf_records文件路径
37.	    :return:
38.	    '''
39.	    nums= 0
40.	    for record in tf.python_io.tf_record_iterator(tf_records_filenames):
41.	        nums += 1
42.	    return nums
43.	
44.	def show_image(title,image):
45.	    '''
46.	    显示图片
47.	    :param title: 图像标题
48.	    :param image: 图像的数据
49.	    :return:
50.	    '''
51.	    # plt.figure("show_image")
52.	    # print(image.dtype)
53.	    plt.imshow(image)
54.	    plt.axis('on')    # 关掉坐标轴为 off
55.	    plt.title(title)  # 图像题目
56.	    plt.show()
57.	
58.	def load_labels_file(filename,labels_num=1,shuffle=False):
59.	    '''
60.	    载图txt文件，文件中每行为一个图片信息，且以空格隔开：图像路径 标签1 标签2，如：test_image/1.jpg 0 2
61.	    :param filename:
62.	    :param labels_num :labels个数
63.	    :param shuffle :是否打乱顺序
64.	    :return:images type->list
65.	    :return:labels type->list
66.	    '''
67.	    images=[]
68.	    labels=[]
69.	    with open(filename) as f:
70.	        lines_list=f.readlines()
71.	        if shuffle:
72.	            random.shuffle(lines_list)
73.	
74.	        for lines in lines_list:
75.	            line=lines.rstrip().split(' ')
76.	            label=[]
77.	            for i in range(labels_num):
78.	                label.append(int(line[i+1]))
79.	            images.append(line[0])
80.	            labels.append(label)
81.	    return images,labels
82.	
83.	def read_image(filename, resize_height, resize_width,normalization=False):
84.	    '''
85.	    读取图片数据,默认返回的是uint8,[0,255]
86.	    :param filename:
87.	    :param resize_height:
88.	    :param resize_width:
89.	    :param normalization:是否归一化到[0.,1.0]
90.	    :return: 返回的图片数据
91.	    '''
92.	
93.	    bgr_image = cv2.imread(filename)
94.	    if len(bgr_image.shape)==2:#若是灰度图则转为三通道
95.	        print("Warning:gray image",filename)
96.	        bgr_image = cv2.cvtColor(bgr_image, cv2.COLOR_GRAY2BGR)
97.	
98.	    rgb_image = cv2.cvtColor(bgr_image, cv2.COLOR_BGR2RGB)#将BGR转为RGB
99.	    # show_image(filename,rgb_image)
100.	    # rgb_image=Image.open(filename)
101.	    if resize_height>0 and resize_width>0:
102.	        rgb_image=cv2.resize(rgb_image,(resize_width,resize_height))
103.	    rgb_image=np.asanyarray(rgb_image)
104.	    if normalization:
105.	        # 不能写成:rgb_image=rgb_image/255
106.	        rgb_image=rgb_image/255.0
107.	    # show_image("src resize image",image)
108.	    return rgb_image
109.	
110.	
111.	def get_batch_images(images,labels,batch_size,labels_nums,one_hot=False,shuffle=False,num_threads=1):
112.	    '''
113.	    :param images:图像
114.	    :param labels:标签
115.	    :param batch_size:
116.	    :param labels_nums:标签个数
117.	    :param one_hot:是否将labels转为one_hot的形式
118.	    :param shuffle:是否打乱顺序,一般train时shuffle=True,验证时shuffle=False
119.	    :return:返回batch的images和labels
120.	    '''
121.	    min_after_dequeue = 200
122.	    capacity = min_after_dequeue + 3 * batch_size  # 保证capacity必须大于min_after_dequeue参数值
123.	    if shuffle:
124.	        images_batch, labels_batch = tf.train.shuffle_batch([images,labels],
125.	                                                                    batch_size=batch_size,
126.	                                                                    capacity=capacity,
127.	                                                                    min_after_dequeue=min_after_dequeue,
128.	                                                                    num_threads=num_threads)
129.	    else:
130.	        images_batch, labels_batch = tf.train.batch([images,labels],
131.	                                                        batch_size=batch_size,
132.	                                                        capacity=capacity,
133.	                                                        num_threads=num_threads)
134.	    if one_hot:
135.	        labels_batch = tf.one_hot(labels_batch, labels_nums, 1, 0)
136.	    return images_batch,labels_batch
137.	
138.	def read_records(filename,resize_height, resize_width,type=None):
139.	    '''
140.	    解析record文件:源文件的图像数据是RGB,uint8,[0,255],一般作为训练数据时,需要归一化到[0,1]
141.	    :param filename:
142.	    :param resize_height:
143.	    :param resize_width:
144.	    :param type:选择图像数据的返回类型
145.	         None:默认将uint8-[0,255]转为float32-[0,255]
146.	         normalization:归一化float32-[0,1]
147.	         centralization:归一化float32-[0,1],再减均值中心化
148.	    :return:
149.	    '''
150.	    # 创建文件队列,不限读取的数量
151.	    filename_queue = tf.train.string_input_producer([filename])
152.	    # create a reader from file queue
153.	    reader = tf.TFRecordReader()
154.	    # reader从文件队列中读入一个序列化的样本
155.	    _, serialized_example = reader.read(filename_queue)
156.	    # get feature from serialized example
157.	    # 解析符号化的样本
158.	    features = tf.parse_single_example(
159.	        serialized_example,
160.	        features={
161.	            'image_raw': tf.FixedLenFeature([], tf.string),
162.	            'height': tf.FixedLenFeature([], tf.int64),
163.	            'width': tf.FixedLenFeature([], tf.int64),
164.	            'depth': tf.FixedLenFeature([], tf.int64),
165.	            'label': tf.FixedLenFeature([], tf.int64)
166.	        }
167.	    )
168.	    tf_image = tf.decode_raw(features['image_raw'], tf.uint8)#获得图像原始的数据
169.	
170.	    tf_height = features['height']
171.	    tf_width = features['width']
172.	    tf_depth = features['depth']
173.	    tf_label = tf.cast(features['label'], tf.int32)
174.	    # PS:恢复原始图像数据,reshape的大小必须与保存之前的图像shape一致,否则出错
175.	    # tf_image=tf.reshape(tf_image, [-1])    # 转换为行向量
176.	    tf_image=tf.reshape(tf_image, [resize_height, resize_width, 3]) # 设置图像的维度
177.	
178.	    # 恢复数据后,才可以对图像进行resize_images:输入uint->输出float32
179.	    # tf_image=tf.image.resize_images(tf_image,[224, 224])
180.	
181.	    # 存储的图像类型为uint8,tensorflow训练时数据必须是tf.float32
182.	    if type is None:
183.	        tf_image = tf.cast(tf_image, tf.float32)
184.	    elif type=='normalization':# [1]若需要归一化请使用:
185.	        # 仅当输入数据是uint8,才会归一化[0,255]
186.	        # tf_image = tf.image.convert_image_dtype(tf_image, tf.float32)
187.	        tf_image = tf.cast(tf_image, tf.float32) * (1. / 255.0)  # 归一化
188.	    elif type=='centralization':
189.	        # 若需要归一化,且中心化,假设均值为0.5,请使用:
190.	        tf_image = tf.cast(tf_image, tf.float32) * (1. / 255) - 0.5 #中心化
191.	
192.	    # 这里仅仅返回图像和标签
193.	    # return tf_image, tf_height,tf_width,tf_depth,tf_label
194.	    return tf_image,tf_label
195.	
196.	
197.	def create_records(image_dir,file, output_record_dir, resize_height, resize_width,shuffle,log=5):
198.	    '''
199.	    实现将图像原始数据,label,长,宽等信息保存为record文件
200.	    注意:读取的图像数据默认是uint8,再转为tf的字符串型BytesList保存,解析请需要根据需要转换类型
201.	    :param image_dir:原始图像的目录
202.	    :param file:输入保存图片信息的txt文件(image_dir+file构成图片的路径)
203.	    :param output_record_dir:保存record文件的路径
204.	    :param resize_height:
205.	    :param resize_width:
206.	    PS:当resize_height或者resize_width=0是,不执行resize
207.	    :param shuffle:是否打乱顺序
208.	    :param log:log信息打印间隔
209.	    '''
210.	    # 加载文件,仅获取一个label
211.	    images_list, labels_list=load_labels_file(file,1,shuffle)
212.	
213.	    writer = tf.python_io.TFRecordWriter(output_record_dir)
214.	    for i, [image_name, labels] in enumerate(zip(images_list, labels_list)):
215.	        image_path=os.path.join(image_dir,images_list[i])
216.	        if not os.path.exists(image_path):
217.	            print('Err:no image',image_path)
218.	            continue
219.	        image = read_image(image_path, resize_height, resize_width)
220.	        image_raw = image.tostring()
221.	        if i%log==0 or i==len(images_list)-1:
222.	            print('------------processing:%d-th------------' % (i))
223.	            print('current image_path=%s' % (image_path),'shape:{}'.format(image.shape),'labels:{}'.format(labels))
224.	        # 这里仅保存一个label,多label适当增加"'label': _int64_feature(label)"项
225.	        label=labels[0]
226.	        example = tf.train.Example(features=tf.train.Features(feature={
227.	            'image_raw': _bytes_feature(image_raw),
228.	            'height': _int64_feature(image.shape[0]),
229.	            'width': _int64_feature(image.shape[1]),
230.	            'depth': _int64_feature(image.shape[2]),
231.	            'label': _int64_feature(label)
232.	        }))
233.	        writer.write(example.SerializeToString())
234.	    writer.close()
235.	
236.	def disp_records(record_file,resize_height, resize_width,show_nums=4):
237.	    '''
238.	    解析record文件，并显示show_nums张图片，主要用于验证生成record文件是否成功
239.	    :param tfrecord_file: record文件路径
240.	    :return:
241.	    '''
242.	    # 读取record函数
243.	    tf_image, tf_label = read_records(record_file,resize_height,resize_width,type='normalization')
244.	    # 显示前4个图片
245.	    init_op = tf.initialize_all_variables()
246.	    with tf.Session() as sess:
247.	        sess.run(init_op)
248.	        coord = tf.train.Coordinator()
249.	        threads = tf.train.start_queue_runners(sess=sess, coord=coord)
250.	        for i in range(show_nums):
251.	            image,label = sess.run([tf_image,tf_label])  # 在会话中取出image和label
252.	            # image = tf_image.eval()
253.	            # 直接从record解析的image是一个向量,需要reshape显示
254.	            # image = image.reshape([height,width,depth])
255.	            print('shape:{},tpye:{},labels:{}'.format(image.shape,image.dtype,label))
256.	            # pilimg = Image.fromarray(np.asarray(image_eval_reshape))
257.	            # pilimg.show()
258.	            show_image("image:%d"%(label),image)
259.	        coord.request_stop()
260.	        coord.join(threads)
261.	
262.	
263.	def batch_test(record_file,resize_height, resize_width):
264.	    '''
265.	    :param record_file: record文件路径
266.	    :param resize_height:
267.	    :param resize_width:
268.	    :return:
269.	    :PS:image_batch, label_batch一般作为网络的输入
270.	    '''
271.	    # 读取record函数
272.	    tf_image,tf_label = read_records(record_file,resize_height,resize_width,type='normalization')
273.	    image_batch, label_batch= get_batch_images(tf_image,tf_label,batch_size=4,labels_nums=5,one_hot=False,shuffle=False)
274.	
275.	    init = tf.global_variables_initializer()
276.	    with tf.Session() as sess:  # 开始一个会话
277.	        sess.run(init)
278.	        coord = tf.train.Coordinator()
279.	        threads = tf.train.start_queue_runners(coord=coord)
280.	        for i in range(4):
281.	            # 在会话中取出images和labels
282.	            images, labels = sess.run([image_batch, label_batch])
283.	            # 这里仅显示每个batch里第一张图片
284.	            show_image("image", images[0, :, :, :])
285.	            print('shape:{},tpye:{},labels:{}'.format(images.shape,images.dtype,labels))
286.	
287.	        # 停止所有线程
288.	        coord.request_stop()
289.	        coord.join(threads)
290.	
291.	
292.	if __name__ == '__main__':
293.	    # 参数设置
294.	
295.	    resize_height = 224  # 指定存储图片高度
296.	    resize_width = 224  # 指定存储图片宽度
297.	    shuffle=True
298.	    log=5
299.	    # 产生train.record文件
300.	    image_dir='dataset/train'
301.	    train_labels = 'dataset/train.txt'  # 图片路径
302.	    train_record_output = 'dataset/record/train.tfrecords'
303.	    create_records(image_dir,train_labels, train_record_output, resize_height, resize_width,shuffle,log)
304.	    train_nums=get_example_nums(train_record_output)
305.	    print("save train example nums={}".format(train_nums))
306.	
307.	    # 产生val.record文件
308.	    image_dir='dataset/val'
309.	    val_labels = 'dataset/val.txt'  # 图片路径
310.	    val_record_output = 'dataset/record/val.tfrecords'
311.	    create_records(image_dir,val_labels, val_record_output, resize_height, resize_width,shuffle,log)
312.	    val_nums=get_example_nums(val_record_output)
313.	    print("save val example nums={}".format(val_nums))
314.	
315.	    # 测试显示函数
316.	    # disp_records(train_record_output,resize_height, resize_width)
317.	    batch_test(train_record_output,resize_height, resize_width)

1.3 训练方法实现过程

inception_v3要求训练数据height, width = 224, 224，项目使用create_tf_record.py制作了训练train.tfrecords和验证val.tfrecords数据，下面是inception_v3_train_val.py文件代码说明：

1.	#coding=utf-8
2.	
3.	import tensorflow as tf 
4.	import numpy as np 
5.	import pdb
6.	import os
7.	from datetime import datetime
8.	import slim.nets.inception_v3 as inception_v3
9.	from create_tf_record import *
10.	import tensorflow.contrib.slim as slim
11.	
12.	
13.	labels_nums = 5  # 类别个数
14.	batch_size = 16  #
15.	resize_height = 224  # 指定存储图片高度
16.	resize_width = 224  # 指定存储图片宽度
17.	depths = 3
18.	data_shape = [batch_size, resize_height, resize_width, depths]
19.	
20.	# 定义input_images为图片数据
21.	input_images = tf.placeholder(dtype=tf.float32, shape=[None, resize_height, resize_width, depths], name='input')
22.	# 定义input_labels为labels数据
23.	# input_labels = tf.placeholder(dtype=tf.int32, shape=[None], name='label')
24.	input_labels = tf.placeholder(dtype=tf.int32, shape=[None, labels_nums], name='label')
25.	
26.	# 定义dropout的概率
27.	keep_prob = tf.placeholder(tf.float32,name='keep_prob')
28.	is_training = tf.placeholder(tf.bool, name='is_training')
29.	
30.	def net_evaluation(sess,loss,accuracy,val_images_batch,val_labels_batch,val_nums):
31.	    val_max_steps = int(val_nums / batch_size)
32.	    val_losses = []
33.	    val_accs = []
34.	    for _ in range(val_max_steps):
35.	        val_x, val_y = sess.run([val_images_batch, val_labels_batch])
36.	        # print('labels:',val_y)
37.	        # val_loss = sess.run(loss, feed_dict={x: val_x, y: val_y, keep_prob: 1.0})
38.	        # val_acc = sess.run(accuracy,feed_dict={x: val_x, y: val_y, keep_prob: 1.0})
39.	        val_loss,val_acc = sess.run([loss,accuracy], feed_dict={input_images: val_x, input_labels: val_y, keep_prob:1.0, is_training: False})
40.	        val_losses.append(val_loss)
41.	        val_accs.append(val_acc)
42.	    mean_loss = np.array(val_losses, dtype=np.float32).mean()
43.	    mean_acc = np.array(val_accs, dtype=np.float32).mean()
44.	    return mean_loss, mean_acc
45.	
46.	def step_train(train_op,loss,accuracy,
47.	               train_images_batch,train_labels_batch,train_nums,train_log_step,
48.	               val_images_batch,val_labels_batch,val_nums,val_log_step,
49.	               snapshot_prefix,snapshot):
50.	    '''
51.	    循环迭代训练过程
52.	    :param train_op: 训练op
53.	    :param loss:     loss函数
54.	    :param accuracy: 准确率函数
55.	    :param train_images_batch: 训练images数据
56.	    :param train_labels_batch: 训练labels数据
57.	    :param train_nums:         总训练数据
58.	    :param train_log_step:   训练log显示间隔
59.	    :param val_images_batch: 验证images数据
60.	    :param val_labels_batch: 验证labels数据
61.	    :param val_nums:         总验证数据
62.	    :param val_log_step:     验证log显示间隔
63.	    :param snapshot_prefix: 模型保存的路径
64.	    :param snapshot:        模型保存间隔
65.	    :return: None
66.	    '''
67.	    saver = tf.train.Saver()
68.	    max_acc = 0.0
69.	    with tf.Session() as sess:
70.	        sess.run(tf.global_variables_initializer())
71.	        sess.run(tf.local_variables_initializer())
72.	        coord = tf.train.Coordinator()
73.	        threads = tf.train.start_queue_runners(sess=sess, coord=coord)
74.	        for i in range(max_steps + 1):
75.	            batch_input_images, batch_input_labels = sess.run([train_images_batch, train_labels_batch])
76.	            _, train_loss = sess.run([train_op, loss], feed_dict={input_images: batch_input_images,
77.	                                                                  input_labels: batch_input_labels,
78.	                                                                  keep_prob: 0.5, is_training: True})
79.	            # train测试(这里仅测试训练集的一个batch)
80.	            if i % train_log_step == 0:
81.	                train_acc = sess.run(accuracy, feed_dict={input_images: batch_input_images,
82.	                                                          input_labels: batch_input_labels,
83.	                                                          keep_prob: 1.0, is_training: False})
84.	                print("%s: Step [%d]  train Loss : %f, training accuracy :  %g" % (
85.	                datetime.now(), i, train_loss, train_acc))
86.	
87.	            # val测试(测试全部val数据)
88.	            if i % val_log_step == 0:
89.	                mean_loss, mean_acc = net_evaluation(sess, loss, accuracy, val_images_batch, val_labels_batch, val_nums)
90.	                print("%s: Step [%d]  val Loss : %f, val accuracy :  %g" % (datetime.now(), i, mean_loss, mean_acc))
91.	
92.	            # 模型保存:每迭代snapshot次或者最后一次保存模型
93.	            if (i % snapshot == 0 and i > 0) or i == max_steps:
94.	                print('-----save:{}-{}'.format(snapshot_prefix, i))
95.	                saver.save(sess, snapshot_prefix, global_step=i)
96.	            # 保存val准确率最高的模型
97.	            if mean_acc > max_acc and mean_acc > 0.7:
98.	                max_acc = mean_acc
99.	                path = os.path.dirname(snapshot_prefix)
100.	                best_models = os.path.join(path, 'best_models_{}_{:.4f}.ckpt'.format(i, max_acc))
101.	                print('------save:{}'.format(best_models))
102.	                saver.save(sess, best_models)
103.	
104.	        coord.request_stop()
105.	        coord.join(threads)
106.	
107.	def train(train_record_file,
108.	          train_log_step,
109.	          train_param,
110.	          val_record_file,
111.	          val_log_step,
112.	          labels_nums,
113.	          data_shape,
114.	          snapshot,
115.	          snapshot_prefix):
116.	    '''
117.	    :param train_record_file: 训练的tfrecord文件
118.	    :param train_log_step: 显示训练过程log信息间隔
119.	    :param train_param: train参数
120.	    :param val_record_file: 验证的tfrecord文件
121.	    :param val_log_step: 显示验证过程log信息间隔
122.	    :param val_param: val参数
123.	    :param labels_nums: labels数
124.	    :param data_shape: 输入数据shape
125.	    :param snapshot: 保存模型间隔
126.	    :param snapshot_prefix: 保存模型文件的前缀名
127.	    :return:
128.	    '''
129.	    [base_lr,max_steps]=train_param
130.	    [batch_size,resize_height,resize_width,depths]=data_shape
131.	
132.	    # 获得训练和测试的样本数
133.	    train_nums=get_example_nums(train_record_file)
134.	    val_nums=get_example_nums(val_record_file)
135.	    print('train nums:%d,val nums:%d'%(train_nums,val_nums))
136.	
137.	    # 从record中读取图片和labels数据
138.	    # train数据,训练数据一般要求打乱顺序shuffle=True
139.	    train_images, train_labels = read_records(train_record_file, resize_height, resize_width, type='normalization')
140.	    train_images_batch, train_labels_batch = get_batch_images(train_images, train_labels,
141.	                                                              batch_size=batch_size, labels_nums=labels_nums,
142.	                                                              one_hot=True, shuffle=True)
143.	    # val数据,验证数据可以不需要打乱数据
144.	    val_images, val_labels = read_records(val_record_file, resize_height, resize_width, type='normalization')
145.	    val_images_batch, val_labels_batch = get_batch_images(val_images, val_labels,
146.	                                                          batch_size=batch_size, labels_nums=labels_nums,
147.	                                                          one_hot=True, shuffle=False)
148.	
149.	    # Define the model:
150.	    with slim.arg_scope(inception_v3.inception_v3_arg_scope()):
151.	        out, end_points = inception_v3.inception_v3(inputs=input_images, num_classes=labels_nums, dropout_keep_prob=keep_prob, is_training=is_training)
152.	
153.	    # Specify the loss function: tf.losses定义的loss函数都会自动添加到loss函数,不需要add_loss()了
154.	    tf.losses.softmax_cross_entropy(onehot_labels=input_labels, logits=out)#添加交叉熵损失loss=1.6
155.	    # slim.losses.add_loss(my_loss)
156.	    loss = tf.losses.get_total_loss(add_regularization_losses=True)#添加正则化损失loss=2.2
157.	    accuracy = tf.reduce_mean(tf.cast(tf.equal(tf.argmax(out, 1), tf.argmax(input_labels, 1)), tf.float32))
158.	
159.	    # Specify the optimization scheme:
160.	    optimizer = tf.train.GradientDescentOptimizer(learning_rate=base_lr)
161.	
162.	
163.	    # global_step = tf.Variable(0, trainable=False)
164.	    # learning_rate = tf.train.exponential_decay(0.05, global_step, 150, 0.9)
165.	    #
166.	    # optimizer = tf.train.MomentumOptimizer(learning_rate, 0.9)
167.	    # # train_tensor = optimizer.minimize(loss, global_step)
168.	    # train_op = slim.learning.create_train_op(loss, optimizer,global_step=global_step)
169.	
170.	
171.	    # 在定义训练的时候, 注意到我们使用了`batch_norm`层时,需要更新每一层的`average`和`variance`参数,
172.	    # 更新的过程不包含在正常的训练过程中, 需要我们去手动像下面这样更新
173.	    # 通过`tf.get_collection`获得所有需要更新的`op`
174.	    update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
175.	    # 使用`tensorflow`的控制流, 先执行更新算子, 再执行训练
176.	    with tf.control_dependencies(update_ops):
177.	        # create_train_op that ensures that when we evaluate it to get the loss,
178.	        # the update_ops are done and the gradient updates are computed.
179.	        # train_op = slim.learning.create_train_op(total_loss=loss,optimizer=optimizer)
180.	        train_op = slim.learning.create_train_op(total_loss=loss, optimizer=optimizer)
181.	
182.	
183.	    # 循环迭代过程
184.	    step_train(train_op, loss, accuracy,
185.	               train_images_batch, train_labels_batch, train_nums, train_log_step,
186.	               val_images_batch, val_labels_batch, val_nums, val_log_step,
187.	               snapshot_prefix, snapshot)
188.	
189.	
190.	if __name__ == '__main__':
191.	    train_record_file='dataset/record/train.tfrecords'
192.	    val_record_file='dataset/record/val.tfrecords'
193.	
194.	    train_log_step=100
195.	    base_lr = 0.01  # 学习率
196.	    max_steps = 200  # 迭代次数 可选择10000次  有条件可选择100000次
197.	    train_param=[base_lr,max_steps]
198.	
199.	    val_log_step=10    #可定义200
200.	    snapshot=200  #保存文件间隔
201.	    snapshot_prefix='models/model.ckpt'
202.	    train(train_record_file=train_record_file,
203.	          train_log_step=train_log_step,
204.	          train_param=train_param,
205.	          val_record_file=val_record_file,
206.	          val_log_step=val_log_step,
207.	          labels_nums=labels_nums,
208.	          data_shape=data_shape,
209.	          snapshot=snapshot,
210.	          snapshot_prefix=snapshot_prefix)

1.4 模型预测

模型测试的程序，predict.py代码如下：

1.	#coding=utf-8
2.	
3.	import tensorflow as tf 
4.	import numpy as np 
5.	import pdb
6.	import cv2
7.	import os
8.	import glob
9.	import slim.nets.inception_v3 as inception_v3
10.	
11.	from create_tf_record import *
12.	import tensorflow.contrib.slim as slim
13.	
14.	
15.	def  predict(models_path,image_dir,labels_filename,labels_nums, data_format):
16.	    [batch_size, resize_height, resize_width, depths] = data_format
17.	
18.	    labels = np.loadtxt(labels_filename, str, delimiter='\t')
19.	    input_images = tf.placeholder(dtype=tf.float32, shape=[None, resize_height, resize_width, depths], name='input')
20.	
21.	    with slim.arg_scope(inception_v3.inception_v3_arg_scope()):
22.	        out, end_points = inception_v3.inception_v3(inputs=input_images, num_classes=labels_nums, dropout_keep_prob=1.0, is_training=False)
23.	
24.	    # 将输出结果进行softmax分布,再求最大概率所属类别
25.	    score = tf.nn.softmax(out,name='pre')
26.	    class_id = tf.argmax(score, 1)
27.	
28.	    sess = tf.InteractiveSession()
29.	    sess.run(tf.global_variables_initializer())
30.	    saver = tf.train.Saver()
31.	    saver.restore(sess, models_path)
32.	    images_list=glob.glob(os.path.join(image_dir,'*.jpg'))
33.	    for image_path in images_list:
34.	        im=read_image(image_path,resize_height,resize_width,normalization=True)
35.	        im=im[np.newaxis,:]
36.	        #pred = sess.run(f_cls, feed_dict={x:im, keep_prob:1.0})
37.	        pre_score,pre_label = sess.run([score,class_id], feed_dict={input_images:im})
38.	        max_score=pre_score[0,pre_label]
39.	        print("{} is: pre labels:{},name:{} score: {}".format(image_path,pre_label,labels[pre_label], max_score))
40.	    sess.close()
41.	
42.	
43.	if __name__ == '__main__':
44.	
45.	    class_nums=5
46.	    image_dir='test_image'
47.	    labels_filename='dataset/label.txt'
48.	    models_path='models/model.ckpt-200'
49.	
50.	    batch_size = 1  #
51.	    resize_height = 224  # 指定存储图片高度
52.	    resize_width = 224  # 指定存储图片宽度
53.	    depths=3
54.	    data_format=[batch_size,resize_height,resize_width,depths]
55.	    predict(models_path,image_dir, labels_filename, class_nums, data_format)

另外，可将ckpt转pb文件，见下文。
运行总结见下文。

全面解析NVIDIA显卡：从入门级到旗舰级显卡详解花千树-010 大模型人工智能算法智能电视
在选择显卡时，了解不同显卡的性能和适用场景是非常重要的。无论你是预算有限的入门用户，还是追求极致性能的游戏玩家，亦或是专业的内容创作者和深度学习研究人员，NVIDIA都有适合你的显卡。本篇博文将详细列举NVIDIA显卡的各项配置，从低到高逐一整理，并给出适用的使用场景。入门级显卡NVIDIAGeForceGT1030CUDA核心数:384基础频率:1227MHz加速频率:1468MHz显存:2GB
直播预告丨精度优于AlphaFold，基于深度学习实现生物大分子及其互作的三维结构预测
「MeetAI4S」系列直播第6期将于1月15日19:00准时开播，HyperAI超神经有幸邀请到了南开大学统计与数据科学学院教授郑伟，他本次分享的主题是「AlphaFold3王座未稳，来自学术界的反超：基于深度学习的生物大分子及其互作的三维结构预测」。蛋白质的功能取决于其独特的三维结构，近年来，基于深度学习等人工智能技术的蛋白质结构预测发展迅猛，AlphaFold甚至获得了2024年诺贝尔化学奖
AI代码生成工具的未来：杨立昆的洞见与AI革命前端
近年来，人工智能（AI）领域取得了令人瞩目的进展，特别是以大型语言模型为代表的AI技术，在自然语言处理、图像生成等领域展现出强大的能力。然而，深度学习先驱杨立昆（YannLeCun）却对现有的AI系统提出了尖锐的批评，他认为目前的AI系统“理解能力远不如猫”，缺乏对真实世界的理解和常识。这引发了人们对AI未来发展方向的思考，也为我们探讨AI代码生成工具，以及AI技术对人类社会的影响提供了新的视角。
【TVM 教程】内联及数学函数
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：TianqiChen尽管TVM支持基本的算术运算，但很多时候，也需要复杂的内置函数，例如exp取指函数。这些函数是依赖target系统的，并且在不同target平台中可能具有不同的名称。本教程会学习到如何调用这些target-spe
基于YOLOv5、YOLOv8和YOLOv10的自助售货机商品检测：深度学习实践与应用 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言自助售货机已经成为现代零售和自动化销售领域的重要组成部分。在自助售货机中，商品的检测与管理至关重要。通过精准的商品检测技术，售货机可以在商品售出后自动更新库存，并提供准确的商品信息反馈。然而，在复杂的环境下进行商品检测是一个具有挑战性的问题，尤其是在商品种类繁多、摆放方式多样以及光照条件变化较大的情况下。近年来，基于深度学习的目标检测算法，特别是YOLO（YouOnlyLookOnce）系列模
【分类】【损失函数】处理类别不平衡：CEFL 和 CEFL2 损失函数的实现与应用丶2136 AI 分类人工智能损失函数
引言在深度学习中的分类问题中，类别不平衡问题是常见的挑战之一。尤其在面部表情分类任务中，不同表情类别的样本数量可能差异较大，比如“开心”表情的样本远远多于“生气”表情。面对这种情况，普通的交叉熵损失函数容易导致模型过拟合到大类样本，忽略少数类样本。为了有效解决类别不平衡问题，Class-balancedExponentialFocalLoss(CEFL)和Class-balancedExponen
交叉熵损失函数（Cross-Entropy Loss）我叫罗泽南深度学习人工智能
原理交叉熵损失函数是深度学习中分类问题常用的损失函数，特别适用于多分类问题。它通过度量预测分布与真实分布之间的差异，来衡量模型输出的准确性。交叉熵的数学公式交叉熵的定义如下：CrossEntroyLoss=−∑i=1Nyi⋅log(y^i)\begin{equation}CrossEntroyLoss=-\sum_{i=1}^{N}y_i\cdotlog(\hat{y}_i)\end{equati
AI大模型引领医疗变革：十大创新应用场景塑造智慧医疗新时代和老莫一起学AI 人工智能自动化数据库学习语言模型大模型
前言在人工智能技术的迅猛发展中，AI大模型以其无与伦比的数据处理能力和深度学习能力，正逐步成为医疗健康领域变革的引领者。本文旨在深入探讨AI大模型在医疗领域的十大创新应用场景，展示其如何显著提升医疗服务效率、赋能临床决策，并推动整个行业向智能化转型。一、智能化诊疗：精准辅助，提升诊断效率AI大模型凭借对海量医疗数据的深度分析，能够协助医生进行更为精准的诊断。例如，百度灵医大模型凭借强大的数据处理能
技术文档的精髓：规划布局、语言表达与更新维护重庆钢铁侠经验分享
本文将从技术文档的规划布局、语言表达以及更新与维护三个方面入手，探讨如何打造一份出色的技术文档，确保信息的系统性、连贯性以及时效性。一：技术文档的规划布局1.1确定文档的整体架构技术文档的规划布局是确保信息呈现系统性和连贯性的关键。首先，需要确定文档的整体架构，这包括章节设置和逻辑顺序。一个好的架构应该能够清晰地指导读者从入门到精通。章节设置：根据文档的目的和受众，合理设置章节。例如，对于深度学习
基于深度学习的推荐系统构建：Movielens 数据集 fresh的转码之路深度学习人工智能机器学习推荐算法
基于深度学习的推荐系统构建：Movielens数据集依赖环境代码语言：python3.11.5开发平台：pycharmtensorflow版本：2.18.0MovieLen1M数据及简介MovieLens1M数据集包含包含6000个用户在近4000部电影上的100万条评分，也包括电影元数据信息和用户属性信息。下载地址为：http://files.grouplens.org/datasets/mov
海外抖音技术深度解析：算法、AI与全球化的挑战神探阿航计算机产业科普与思考算法人工智能机器学习数据挖掘深度学习
引言2025年1月19日，在美国宣布暂停服务，这一事件引发了全球用户的广泛关注。作为全球最受欢迎的短视频平台之一，其成功离不开其强大的技术支撑，尤其是其个性化推荐算法和AI驱动的创作工具。然而，随着全球市场环境的变化，它面临的技术与运营挑战也日益凸显。本文将深入分析其技术核心、全球化运营中的挑战及其未来发展方向。核心：个性化推荐引擎其算法是其成功的关键，其核心在于个性化推荐引擎。该引擎采用深度学习
YOLOv8与Transformer：探索目标检测的新架构 AI架构设计之禅 AI大模型应用入门实战与进阶大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
YOLOv8与Transformer：探索目标检测的新架构关键词：目标检测，深度学习，YOLOv8，Transformer，计算机视觉，卷积神经网络摘要：目标检测是计算机视觉领域的一项重要任务，其目标是从图像或视频中识别和定位特定对象。近年来，YOLO（YouOnlyLookOnce）系列算法以其高精度和高速度成为目标检测领域的佼佼者。最新版本的YOLOv8引入了Transformer架构，进一步
图像生成大模型：Imagen 详解转角再相遇 imagen python 深度学习计算机视觉
近年来，图像生成技术取得了显著进展，推动了计算机视觉和生成对抗网络（GAN）等领域的发展。Imagen是一个新兴的图像生成大模型，其在生成高质量、逼真图像方面表现出色。本文将详细讲解Imagen的基本原理、架构、训练流程及应用场景。1.Imagen的基本原理1.1什么是Imagen？Imagen是一种基于深度学习的图像生成模型，结合了自注意力机制（Self-attentionMechanism）和
【MySQL】Mysql数据库导入导出sql文件、备份数据库、迁移数据库程序员洲洲数据库数据库 mysql 导入导出sql sql文件备份迁移
本文摘要：本文提出了xxx的实用开发小技巧。作者介绍：我是程序员洲洲，一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。同时欢迎大家关注其他专栏，我将分享Web前后端开发、人工智能、机器学习、深度学习从0到1系列文章。同时洲洲已经建立了程序员技术交流群，如果您感兴趣，可以私信我加入我的社群，也可以直接vx联系（文末有名片）v：bdizztt随时
实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B（多模态）学术菜鸟小晨千问多模型 qwen2 vl
一、简介VLLM是一种高效的深度学习推理库，通过PagedAttention算法有效管理大语言模型的注意力内存，其特点包括24倍的吞吐提升和3.5倍的TGI性能，无需修改模型结构，专门设计用于加速大规模语言模型（LLM）的推理过程。它通过优化显存管理、支持大模型的批处理推理以及减少不必要的内存占用，来提高多GPU环境下的推理速度和效率。VLLM的核心特点包括：显存高效性：VLLM能够动态管理显存，
qwenvl 代码中的attention pool 注意力池如何理解，attention pool注意力池是什么？ OpenSani AI 大模型计算机视觉语言模型 qwenvl LLM
qwenvl中的attentionpool如何理解，其实这就是一个概念的问题看qwenvl的huggingface的代码的时候，发现代码里有一个Resampler以及attn_pool，这和之前理解的连接池线程池表示资源复用的意思不太一样，查了一下：注意这里的pool和线程池连接池里面的pool不一样:深度学习中的池化：池化在深度学习中主要指通过滑动窗口对特征图进行下采样，提取最重要的特征，减少计
计算机视觉与深度学习：使用深度学习训练基于视觉的车辆检测器（MATLAB源码-Faster R-CNN） ZhShy23 javascript 深度学习
在人工智能领域，计算机视觉是一个重要且充满活力的研究方向。它使计算机能够理解和分析图像和视频数据，从而做出有意义的决策。其中，目标检测是计算机视觉中的一项关键技术，它旨在识别并定位图像中的多个目标对象。车辆检测作为目标检测的一个重要应用，在自动驾驶、智能交通系统等领域有着广泛的应用前景。本文将介绍如何使用MATLAB和深度学习技术，特别是FasterR-CNN模型，来训练一个车辆检测器。文章目录一
GAN在图像增强中的应用实战指南码字仙子
本文还有配套的精品资源，点击获取简介：图像增强技术通过算法改善图像质量，GAN作为一种生成对抗网络，在此领域具有重要应用。通过生成器和判别器的对抗性训练，GAN可以生成逼真图像、修复低质量图像、扩增数据集并进行风格迁移。本项目将介绍如何使用Python及其相关库实现GAN图像增强，包括模型的构建、训练和评估。通过项目案例学习，你可以掌握GAN在图像增强中的实际应用，提高图像处理和深度学习的技能。1
【Python】已解决：WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i 屿小夏 python pip ssl
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习模型推理速度/吞吐量计算(附代码） Scabbards_ 1500深度学习笔记深度学习人工智能
参考博文：https://mp.weixin.qq.com/s?__biz=MzI4MDYzNzg4Mw==&mid=2247546551&idx=2&sn=f198b6365e11f0a18832ff1203302632&chksm=ebb70e63dcc0877569d1838b2391744be628bf6cbb6e203a49f855e0769ecbbbf5a9929fe2db&scene
PyTorch使用教程- Tensor包 Loving_enjoy 论文 pytorch 人工智能
###PyTorch使用教程-Tensor包PyTorch是一个流行的深度学习框架，它提供了一个易于使用的API来创建和操作张量（Tensors）。张量是一个多维数组，类似于NumPy中的ndarray，但它是基于GPU的，支持自动求导。本文将详细介绍PyTorch中的Tensor包，包括张量的创建、运算、形状变换、索引与切片、以及重要的张量处理方式。####一、张量的创建在PyTorch中，可以
ChatGPT详解 Loving_enjoy 实用技巧人工智能自然语言处理
ChatGPT是一款由OpenAI研发和维护的先进的自然语言处理模型（NLP），全名为ChatGenerativePre-trainedTransformer，于2022年11月30日发布。以下是对ChatGPT的详细介绍：###一、技术架构与原理1.**技术架构**：ChatGPT建立在Transformer架构之上，这是一种深度学习模型，特别适用于处理自然语言。其核心是自注意力机制，允许模型在
AI绘画工具介绍编程小郭 ai作画
市面上AI绘画工具众多，它们利用深度学习和图像处理技术，为用户提供了丰富的创作体验和可能性。以下是对几款主流AI绘画工具的详细介绍及横向对比：一、主流AI绘画工具介绍Midjourney简介：Midjourney是一个独立的研究实验室，专注于人工智能绘图，被广泛应用于设计、艺术创作、广告制作等领域。特点：以其强大的图像生成能力和跨界融合的创新特点著称，能够根据文本描述和视觉输入生成兼具故事性与视觉
文心一言vsGPT-4全面对比编程小郭文心一言 chatgpt java python 人工智能 ai
文心一言和GPT-4都是当前非常先进的人工智能语言模型，它们各自具有独特的特点和优势。以下是对这两款工具的全面比较：文心一言是由百度开发的一款大型人工智能语言模型，它基于强大的深度学习技术和海量的数据资源，具备出色的语言理解和生成能力。文心一言在中文处理方面尤为出色，能够准确理解中文语境和语义，生成流畅、自然的中文文本。文心一言还具备丰富的知识库和推理能力，能够回答各种问题，提供有用的信息和建议。
基于深度学习的认知架构的AI SEU-WYL 深度学习dnn 人工智能深度学习架构
基于深度学习的认知架构的AI是一类模仿人类认知过程的人工智能系统，旨在模拟人类感知、学习、推理、决策等复杂的认知功能。认知架构的目的是创建一个能够理解和处理复杂环境、实现自我学习和适应的AI系统。结合深度学习技术，这类AI可以更好地应对动态和复杂的任务需求。1.基于深度学习的认知架构的组成一个典型的基于深度学习的认知架构包含多个关键模块：感知模块：负责从外部环境中获取数据，处理和提取特征。深度学习
什么是AI显卡，英伟达与AMD显卡的全面对比 wit_@ 人工智能 python 算法 deep learning 大数据网络
什么是AI显卡？AI显卡是专门为人工智能计算任务设计和优化的图形处理器（GPU）。相比传统显卡，AI显卡具备更强的计算能力、更高的并行处理效率以及针对深度学习、数据科学等领域的特殊硬件支持。在人工智能领域，尤其是深度学习中，训练和推理任务需要处理大量的矩阵运算，这正是GPU擅长的领域。AI显卡通过高度并行的架构，可以显著提升训练速度和模型性能，同时降低功耗和延迟。常见的AI显卡用途包括：深度学习模
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术 wit_@ cnn python 机器学习深度学习 scikit-learn
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术导语卷积神经网络（CNN）是现代深度学习领域中最重要的模型之一，特别在计算机视觉（CV）领域具有革命性的影响。无论是图像分类、目标检测，还是人脸识别、语音处理，CNN都发挥了举足轻重的作用。随着技术的不断发展，CNN已经成为了解决众多实际问题的核心工具。但对于许多人来说，CNN仍然是一个相对复杂的概念，尤其是初学者可能会被其背后的数学原
从零开始的 AI Infra 学习之路 SSS不知-道 MLSys 人工智能深度学习 pytorch
从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM五、AI编译&计算架构5.1CUDA5.2CANN六、AI硬件&体系结构6.1INVIDIAGPU6.2AscendNPU一、概述AIInfra（AI
【深度学习】Huber Loss详解小小小小祥深度学习人工智能算法职场和发展机器学习
文章目录1.HuberLoss原理详解2.Pytorch代码详解3.与MSELoss、MAELoss区别及各自优缺点3.1MSELoss均方误差损失3.2MAELoss平均绝对误差损失3.3HuberLoss4.总结4.1优化平滑4.2梯度较好4.3为什么说MSE是平滑的1.HuberLoss原理详解HuberLoss是一种结合了MSE（均方误差）与MAE（平均绝对误差）的损失函数，旨在克服两者的
【YOLOV8】YOLOV8模型训练train及参数详解小小小小祥 YOLO
介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。本指南旨在涵盖使用YOLOv8强大功能集训练自定义模型所需的所有细节，帮助你快速入门。为什么选择UltralyticsYOLO进行训练？高效性：无论是单GPU设置还是跨多个GPU扩展，都能充分利用你的硬件。多功能性：
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交