放牛娃不吃草

tensorflow使用train_image_classifier来训练数据（修改整理）

看了几篇关于cnn的文章，感觉那种大模型的cnn真的不适合个人去使用，自己也没有那么强悍的显卡，也没有足够的数据和时间

还是用迁移学习比较好，这里说一下用的模型，inception_v3是谷歌的cnn框架。这个框架有22层深，用tensorboard看的时候是比较大的(相比于letnet和alxnet)，这个框架运算量并不大，而且很多卷积层的权值基本上可以不用改变，可以说使用起来非常的方便。

他降低参数有两点第一是去除了最后的全连接层，采用全局平均池化层(将图片尺寸变为1*1)来取代它。全连接层基本上占据了alxnet和vggnet 90%的参数量，为什么呢？因为卷积核并不多，而三层全连接层(Alxnet)的参数量是非常恐怖的，第一层就以万计。而且参数过多，数据量少的话会过拟合，效果并不好。

第二是Inception V1中精心设计Inception moudle级高了参数的利用率，这个结构的思路借鉴于VGGnet，VGGnet首次实现了多个小卷积核的同时使用，替换了Alxnet的第一层11*11的卷积核，而Inception的卷积核尺寸更小，参数利用率越高

下面我来说一下怎么使用，主要是参考讲座炼数成金，但是对这个里面的bug进行了修改。

首先，下载数据集合，数据集我用flowers的，事实上后来我才发现，官方提供了直接针对flowes的代码。

这里面的是花的5个种类

这里有一个txt文件，是output_labels.txt是所有花的名称，放在flower_photo目录下

然后生成tfrecord文件

先上代码再解释吧

      [python]  view plain  copy 
     
# coding: utf-8  
  
import tensorflow as tf  
import os  
import random  
import math  
import sys  
import types  
from PIL import Image  
  
#验证集数量  
_NUM_TEST = 300  
#随机种子  
_RANDOM_SEED = 0  
#数据块 把图片进行分割，对于数据量比较大的时候使用  
_NUM_SHARDS = 5  
#数据集路径  
DATASET_DIR = 'D:/Tensorflow/flower_photos/flowers'  
#标签和文件名字  
LABELS_FILENAME = 'D:/Tensorflow/flower_photos/output_labels.txt'  
  
#定义tfrecord文件的路径和名字  
def _get_dataset_filename(dataset_dir,split_name,shard_id):  
    output_filename = 'image_%s_%05d-of-%05d.tfrecord' % (split_name,shard_id,_NUM_SHARDS)  
    return os.path.join(dataset_dir,output_filename)  
  
#判断tfrecord文件是否存在  
def _datase_exists(dataset_dir):  
    for split_name in ['train','test']:  
        for shard_id in range(_NUM_SHARDS):  
            #定义tfrecord文件的路径+名字  
            output_filename = _get_dataset_filename(dataset_dir,split_name,shard_id)  
        if not tf.gfile.Exists(output_filename):  
            return False  
    return True  
  
  
#获取所有文件以及分类  传入图片的路径  
def _get_filenames_and_classes(dataset_dir):  
    #数据目录  
    directories = []  
    #分类名称  
    class_names = []  
    for filename in os.listdir(dataset_dir):  
        #合并文件路径  
        path = os.path.join(dataset_dir,filename)  
        #判断该路径是否为目录  
        if os.path.isdir(path):  
            #加入数据目录  
            directories.append(path)  
            #加入类别名称  
            class_names.append(filename)  
    photo_filenames = []  
    #循环每个分类的文件夹  
    for directory in directories:  
        for filename in os.listdir(directory):  
            path = os.path.join(directory,filename)  
            #把图片加入图片列表  
            photo_filenames.append(path)  
    return photo_filenames,class_names  
  
def int64_feature(values):  
    if not isinstance(values,(tuple,list)):  
        values = [values]  
        #print(values)  
    return tf.train.Feature(int64_list=tf.train.Int64List(value=values))  
  
def bytes_feature(values):  
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[values]))  
  
  
def image_to_tfexample(image_data,image_format,class_id):  
    return tf.train.Example(features=tf.train.Features(feature={  
        'image/encoded': bytes_feature(image_data),  
        'image/format' : bytes_feature(image_format),  
        'image/class/label' : int64_feature(class_id)  
    }))  
  
  
def write_label_file(labels_to_class_names,dataset_dir,filename='label.txt'):  
    #拼接目录  
    labels_file_name = os.path.join(dataset_dir,filename)  
    print(dataset_dir)  
    #with open(labels_file_name,'w') as f:  
    with tf.gfile.Open(labels_file_name,'w') as f:  
        for label in labels_to_class_names:  
            class_name = labels_to_class_names[label]  
            f.write('%d;%s\n'%(label,class_name))  
  
  
#把数据转为TFRecord格式  
def _convert_dataset(split_name,filenames,class_names_to_ids,dataset_dir):  
    #assert 断言   assert expression 相当于 if not expression raise AssertionError  
    assert split_name in ['train','test']  
    #计算每个数据块有多少个数据  
    num_per_shard = int(len(filenames) / _NUM_SHARDS)  
    with tf.Graph().as_default():  
        with tf.Session() as sess:  
            for shard_id in range(_NUM_SHARDS):  
                #定义tfrecord文件的路径+名字  
                output_filename = _get_dataset_filename(dataset_dir,split_name,shard_id)  
                with tf.python_io.TFRecordWriter(output_filename) as tfrecore_writer:  
                    #每一个数据块开始的位置  
                    start_ndx = shard_id * num_per_shard  
                    #每一个数据块最后的位置  
                    end_ndx = min((shard_id+1) * num_per_shard,len(filenames))  
  
                    for i in range(start_ndx,end_ndx):  
                        try:  
                            sys.stdout.write('\r>> Converting image %d/%d shard %d' % (i+1,len(filenames),shard_id))  
                            sys.stdout.flush()  
                            #读取图片  
                            #image_data = tf.gfile.FastGFile(filenames[i],'rb').read()  
                            img = Image.open(filenames[i])  
                            #img = img.resize((224, 224))  
                            img_raw = img.tobytes()  
                             #获取图片的类别名称  
                            class_name = os.path.basename(os.path.dirname(filenames[i]))  
                            #找到类别名称对应的id  
                            class_id = class_names_to_ids[class_name]  
                            #生成tfrecord文件  
                            example = image_to_tfexample(img_raw, b'jpg',class_id)  
                           # print(filenames[i])  
                            tfrecore_writer.write(example.SerializeToString())  
                        except IOError as e:  
                            print("Could not read: ",filenames[i])  
                            print("Error: ",e)  
                            print("Skip it \n")  
  
    sys.stdout.write('\n')  
    sys.stdout.flush()  
  
  
if __name__=='__main__':  
    #判断tfrecord文件是否存在  
    if _datase_exists(DATASET_DIR):  
        print('tfrecord 文件已经存在')  
    else :  
        #获取图片以及分类  
        photo_filenames,class_names = _get_filenames_and_classes(DATASET_DIR)  
        #print(class_names)  
        #把分类转为字典格式 ，类似于{'house':3,'flower':1,'plane':4}  
        class_names_to_ids = dict(zip(class_names,range(len(class_names))))  
        print(class_names_to_ids)  
        #把数据切为训练集和测试集  
        random.seed(_RANDOM_SEED)  
        random.shuffle(photo_filenames)  
        training_filenames = photo_filenames[_NUM_TEST:]  
        testing_filenames = photo_filenames[:_NUM_TEST]  
       # print(training_filenames[0])  
        #数据转换  
        _convert_dataset('train',training_filenames,class_names_to_ids,DATASET_DIR)  
        _convert_dataset('test',testing_filenames,class_names_to_ids,DATASET_DIR)  
  
        #输出labels文件  
        labels_to_class_names = dict(zip(range(len(class_names)),class_names))  
        write_label_file(labels_to_class_names,DATASET_DIR)  

思路很简单，就是读取图片然后分割，最后转换成tfrecord格式的文件，说一下需要修改的地方(我说了就不用自己找了。。。。)

这两个都是刚才说到的，一个是图片存放的位置，一个是标签文件，为了生成一个类似于字典的txt,其他的不用改，如果

你想改这里的名字的话，那么你后面读取的时候要改官方给你的py文件，还是省省吧。

默认会在你的图片的目录下生成tfrecord文件和labels标签，

为了好看，我把他们移出来，单独放一个文件夹。

然后我们要特别看一下官方给你的几个py文件，如果你只用官方给的例子像测试下的话可以跳过。

首先是这个dataset_factory 这个要改，

原来是没有这个的，你要加上这个，datasets是你所在的这个目录，myimages自然就是你要自己写的py文件了

这里新加上最后一个字典，'image'只是个名字或者叫标识，myimages是你的py文件

然后我们来看看我们自己写的myimages

由于我用的是flowes的图片，你会发现官方给了你一个flowers.py所以你可以参考这个写一下。

下面上一下我的myimages文件，

      [python]  view plain  copy 
     
from __future__ import absolute_import  
from __future__ import division  
from __future__ import print_function  
  
import os  
import tensorflow as tf  
  
from datasets import dataset_utils  
  
slim = tf.contrib.slim  
  
_FILE_PATTERN = 'image_%s_*.tfrecord'  
  
SPLITS_TO_SIZES = {'train': 3320, 'validation': 350}  
  
_NUM_CLASSES = 5  
  
_ITEMS_TO_DESCRIPTIONS = {  
    'image': 'A color image of varying size.',  
    'label': 'A single integer between 0 and 4',  
}  
  
  
def get_split(split_name, dataset_dir, file_pattern=None, reader=None):  
  
  if split_name not in SPLITS_TO_SIZES:  
    raise ValueError('split name %s was not recognized.' % split_name)  
  
  if not file_pattern:  
    file_pattern = _FILE_PATTERN  
  file_pattern = os.path.join(dataset_dir, file_pattern % split_name)  
  
  if reader is None:  
    reader = tf.TFRecordReader  
  
  keys_to_features = {  
      'image/encoded': tf.FixedLenFeature((), tf.string, default_value=''),  
      'image/format': tf.FixedLenFeature((), tf.string, default_value='png'),  
      'image/class/label': tf.FixedLenFeature(  
          [], tf.int64, default_value=tf.zeros([], dtype=tf.int64)),  
  }  
  
  items_to_handlers = {  
      'image': slim.tfexample_decoder.Image(),  
      'label': slim.tfexample_decoder.Tensor('image/class/label'),  
  }  
  
  decoder = slim.tfexample_decoder.TFExampleDecoder(  
      keys_to_features, items_to_handlers)  
  
  labels_to_names = None  
  if dataset_utils.has_labels(dataset_dir):  
    labels_to_names = dataset_utils.read_label_file(dataset_dir)  
  
  return slim.dataset.Dataset(  
      data_sources=file_pattern,  
      reader=reader,  
      decoder=decoder,  
      num_samples=SPLITS_TO_SIZES[split_name],  
      items_to_descriptions=_ITEMS_TO_DESCRIPTIONS,  
      num_classes=_NUM_CLASSES,  
      labels_to_names=labels_to_names)  

      [python]  view plain  copy 
     
你会发现这里，这个可前面生成tfrecord的名字是有对应关系的。  

这个文件大致意思就是读取下tfrecord文件，然后分割下，有的用来train，有的用来test

接下来可以进行train了

train.bat写在slim这个文件夹下

这里我附上我的train然后讲解下参数

      [html]  view plain  copy 
     
python train_image_classifier.py ^  
--train_dir=D:/Tensorflow/flower_photos/train ^  
--dataset_name=image ^  
--dataset_split_name=train ^  
--dataset_dir=D:/Tensorflow/flower_photos/flowers/tfrecord ^  
--batch_size=5 ^  
--max_number_of_steps=10000 ^  
--model_name=inception_v3 ^  
--clone_on_cpu=true ^  
pause  

第一个是你的train_iamge_classifier的位置，这里用的是相对位置

第二个是新建的空文件夹，训练完的数据会放到这个文件夹下

第三个特点的，你在生成tfrecord 的时候切分数据的train和test中的train

第四个是你的tfrecord文件的位置，里面必须要有labels.txt

第五个是分批训练的，主要用于显存不够，不能够一次性存放足够多的数据

第六个是训练的次数，不设置的情况下会一直执行

第七个是训练的模型这里使用inception_v3模型

第八个很重要，我之前一直报错，问了好多人，上了各种网站都没查出来，这个应该是有些cpu版本的tensorflow才能处理的数据，在GPU上无法计算，所以要开启能够使用cpu的这个选项，如果是cpu版本的tensorflow应该没有问题。

第九个 pause 好像没什么用，改退出还是会退出，所以还是从命令窗口开始执行吧。

训练完之后在你的train文件夹下会生成数据

然后在slim目录下新建一个bbb.py

      [python]  view plain  copy 
     
import os  
import tensorflow as tf  
import tensorflow.contrib.slim as slim  
  
from nets import inception  
from nets import inception_v1  
from nets import inception_v3  
from nets import nets_factory  
  
from tensorflow.python.framework import graph_util  
from tensorflow.python.platform import gfile  
from google.protobuf import text_format  
  
checkpoint_path = tf.train.latest_checkpoint('D:/Tensorflow/flower_photos/train')  
with tf.Graph().as_default() as graph:  
    input_tensor = tf.placeholder(tf.float32, shape=(None, 299, 299, 3), name='input_image')  
    with tf.Session() as sess:  
        #  with tf.variable_scope('model') as scope:  
        with slim.arg_scope(inception.inception_v3_arg_scope()):  
            logits, end_points = inception.inception_v3(input_tensor, num_classes=5, is_training=False)  
  
    saver = tf.train.Saver()  
    saver.restore(sess, checkpoint_path)  
  
    output_node_names = 'InceptionV3/Predictions/Reshape_1'  
  
    input_graph_def = graph.as_graph_def()  
    output_graph_def = graph_util.convert_variables_to_constants(sess, input_graph_def, output_node_names.split(","))  
    with open('D:/Tensorflow/flower_photos/output_graph_nodes.txt', 'w') as f:  
        f.write(text_format.MessageToString(output_graph_def))  
  
    output_graph = 'D:/Tensorflow/flower_photos/train/inception_v3_final.pb'  
    with gfile.FastGFile(output_graph, 'wb') as f:  
        f.write(output_graph_def.SerializeToString())  

执行后会在train目录下生成pb文件，这个是tensorflow保存和读取的模型文件。

然后我们来使用他来识别。

用到的命令整理：

rm -rf /home/leo/Downloads/tmp/train_dir/*
python train_image_classifier.py \
    --train_dir=/home/leo/Downloads/tmp/train_dir \
    --dataset_name=dish \
    --dataset_split_name=train \
    --dataset_dir=/home/leo/Downloads/train_datas/smallDataSetTest5_9/output_tfrecord \
    --model_name=inception_resnet_v2 \
    --max_number_of_steps=100000 \
    --batch_size=6 \
    --learning_rate=0.0001 \
    --learning_rate_decay_type=fixed \
    --save_interval_secs=60 \
    --save_summaries_secs=60 \
    --log_every_n_steps=10 \
    --optimizer=rmsprop \
    --weight_decay=0.00004

不fine-tune把--checkpoint_path, --checkpoint_exclude_scopes和--trainable_scopes删掉。
fine-tune所有层把--checkpoint_exclude_scopes和--trainable_scopes删掉。

如果只使用CPU则加上--clone_on_cpu=True。

验证checkpoint：

python eval_image_classifier.py \
    --checkpoint_path=/home/leo/Downloads/tmp/train_dir \
    --eval_dir=/home/leo/Downloads/tmp/eval_logs \
    --dataset_name=dish \
    --dataset_split_name=validation \
    --dataset_dir=/home/leo/Downloads/train_datas/smallDataSetTest5_9/output_tfrecord \
    --model_name=inception_resnet_v2

其他常用训练命令：

############################################################
使用train image classifier 训练 inception_resnet_v2  using fine-tune
############################################################
python train_image_classifier.py \
    --train_dir=/home/leo/Downloads/tmp/train_dir_220_dish_inception_resnet_v2 \
    --dataset_dir=/home/leo/Downloads/train_datas/18_5_14_220_tfrecord/output_tfrecord \
    --dataset_name=dish \
    --dataset_split_name=train \
    --model_name=inception_resnet_v2 \
    --checkpoint_path=/home/leo/Downloads/pretrained_models/inception_resnet_v2_2016_08_30/inception_resnet_v2_2016_08_30.ckpt \
    --checkpoint_exclude_scopes=InceptionResnetV2/Logits,InceptionResnetV2/AuxLogits \
    --trainable_scopes=InceptionResnetV2/Logits,InceptionResnetV2/AuxLogits
############################################################
使用train image classifier 训练 mobile net v1  using fine-tune
############################################################
python train_image_classifier.py \
    --train_dir=/home/leo/Downloads/tmp/train_dir_220_dish_mobilenet_v1 \
    --dataset_dir=/home/leo/Downloads/train_datas/18_5_14_220_tfrecord/output_tfrecord \
    --dataset_name=dish \
    --dataset_split_name=train \
    --model_name=mobilenet_v1 \
    --checkpoint_path=/home/leo/Downloads/pretrained_models/mobilenet_v1_1.0_224/mobilenet_v1_1.0_224.ckpt \
    --checkpoint_exclude_scopes=MobilenetV1/Logits \
    --trainable_scopes=MobilenetV1/Logits

############################################################
使用train image classifier 训练 mobile net v2  from scratch
############################################################
python train_image_classifier.py \
    --train_dir=/home/leo/Downloads/tmp/train_dir_220_dish_mobilenet_v2 \
    --dataset_dir=/home/leo/Downloads/train_datas/18_5_14_220_tfrecord/output_tfrecord \
    --dataset_name=dish \
    --dataset_split_name=train \
    --model_name=mobilenet_v2 \
    --train_image_size=224 \
    --learning_rate=0.0001 \
    --learning_rate_decay_type=fixed \

代码随想录算法训练营Day10 | Leetcode 150逆波兰表达式求值、239滑动窗口最大值、 347前 K 个高频元素 Dominic_Holmes leetcode python 算法数据结构
代码随想录算法训练营Day10|Leetcode150逆波兰表达式求值、239滑动窗口最大值、347前K个高频元素一、反转字符串相关题目：Leetcode150文档讲解：Leetcode150视频讲解：Leetcode1501.Leetcode150.逆波兰表达式求值给你一个字符串数组tokens，表示一个根据逆波兰表示法表示的算术表达式。请你计算该表达式。返回一个表示表达式值的整数。注意：有效的
华为OD机试统一考试D卷C卷 - 机器人仓库搬砖 py 愤怒的小青春 java
平安寿险北分和飞鹤职能哪个强度好一些呀，平安寿险北分和飞鹤职能哪个强度好一些呀，两个offer纠结经营分析应该属于什么序列#数据分析#在牛客搜经营分析貌似只有字节有这个单独岗位名字，其他大厂都是在从属于数据分析，所以这俩昇腾计算岗位扩招，绝佳上车AI机会，速来ai芯片业务发展太快，要大量补充人力缺口。嵌入式软件开发、测试，前后端岗位，硬件岗位都招。院校范围很春招补录两个公司总包差不多，都是后台开发
秒开WebView Android性能优化全攻略：深度解析与实战策略俊星学长 android 性能优化
秒开WebViewAndroid性能优化全攻略：深度解析与实战策略在Android开发中，WebView作为一个重要的组件，用于在应用中嵌入和展示网页内容。然而，WebView的性能往往成为影响用户体验的关键因素之一。实现WebView的“秒开”体验，不仅需要开发者对WebView的工作机制有深入的理解，还需要掌握一系列性能优化策略。本文将从多个维度深入探讨AndroidWebView的性能优化，
卷积神经网络 - 理解卷积核的尺寸 k×k×Cin 谦亨有终 AI学习笔记 cnn 人工智能神经网络深度学习机器学习
卷积神经网络中，每个卷积核的尺寸为k×k×Cin，这一设计的核心原因在于多通道输入的数据结构和跨通道特征整合的需求。以下是详细解释：1.输入数据的结构输入形状：假设输入数据为三维张量，形状为H×W×Cin，其中：H：高度（Height）W：宽度（Width）Cin：通道数（Channelsin）多通道的物理意义：对于RGB图像，Cin=3（红、绿、蓝三通道）。对于中间层的特征图，Cin可能为64、
前端性能优化-知识点甲亿前端性能优化
Web性能优化意义1.减少整体加载时间：减小文件体积、减少HTTP请求、使用预加载。2.使网站尽快可用：仅加载首屏内容，其他内容根据需要进行懒加载。3.平滑和交互性：使用CSS替代JS动画、减少UI重绘。4.加载表现形式：使用加载动画、进度条、骨架屏等过渡信息，让用户感觉到页面加载更快。5.性能监测：性能指标、性能测试、性能监控持续优化等Web性能指标RAIL性能模型Response(响应)：快速
聊聊langchain4j的Naive RAG hello_ejb3 人工智能
序本文主要研究一下langchain4j的NaiveRAG示例publicclassNaive_RAG_Example{/***ThisexampledemonstrateshowtoimplementanaiveRetrieval-AugmentedGeneration(RAG)application.*By"naive",wemeanthatwewon'tuseanyadvancedRAGte
JavaScript 性能优化实战：优化循环结构提升效率 deying0865423 javascript 开发语言
目录一、理解循环的性能损耗二、减少循环迭代次数（一）缓存数组长度（二）提前终止循环三、优化循环内部操作（一）避免在循环内执行复杂计算（二）减少DOM操作四、选择合适的循环类型（一）for循环与while循环的选择（二）for...in与for...of的使用场景在JavaScript编程中，循环结构是实现重复执行任务的基础工具。然而，不当的循环使用常常会导致性能瓶颈，特别是在处理大量数据时，循环的
【最新】TensorFlow、cuDNN、CUDA三者之间的最新版本对应及下载地址江上_酒开发环境及工具配置 TensorFlow CUDA cuDNN
TensorFlow、cuDNN、CUDA对应关系官网查询地址CUDA下载地址cuDNN下载地址VersionPythonversionCompilerBuildtoolscuDNNCUDAtensorflow_gpu-2.9.03.7-3.10MSVC2019Bazel5.0.08.111.2tensorflow_gpu-2.8.03.7-3.10MSVC2019Bazel4.2.18.111.
《今日AI-人工智能-编程日报》-源自2025年3月20日小亦编辑部每日AI-人工智能-编程日报人工智能大数据
一、AI行业动态英伟达新一代AI芯片Rubin发布计划英伟达宣布其新一代AI芯片Rubin将于2026年下半年推出，下下一代AI芯片架构命名为Feynman，计划于2028年登场。同时，英伟达还推出了RTXPRO6000系列Blackwell专业卡，拥有24064核心、96GB显存和最高600W功耗。OpenAI星际之门数据中心建设进展OpenAI的首个数据中心“星际之门”预计于2026年中在德克
性能优化中如何“避免链接关键请求” 混血哲谈性能优化
在性能优化中，“避免链接关键请求”是指通过优化资源加载顺序和依赖关系，减少关键渲染路径中的链式请求（CriticalRequestChains），从而加速页面加载。以下是具体策略及实施步骤：一、什么是“关键请求链”？定义：关键请求链是浏览器在渲染首屏内容时必须按顺序加载的资源序列。例如：HTMLCSSFont浏览器需先下载HTML，解析后请求CSS，CSS解析后发现需要字体文件，再请求字体。问题：
聊聊langchain4j的HTTP Client hello_ejb3 http iphone 网络协议
序本文主要研究一下langchain4j的HTTPClientlangchain4j-http-clientlangchain4j提供了langchain4j-http-client模块，它实现了一个HttpClientSPI（服务提供者接口），其他模块通过该接口调用LLM提供商的RESTAPI。这意味着底层HTTP客户端可以被自定义，通过实现HttpClientSPI，还可以集成任何其他HTTP
L2-050懂蛇语c++（pta天梯赛。测试点1。） zzy678 c++
这个题目看上去还挺简单的，但是自己做的时候就超时了一开始只有19分。我自己stl学的不是很好，然后一开始自己用的pair和vector一起写的发现了一些小问题改了之后才得19。。。其中两个就是超时问题。可能查找太慢？之后又查看了一些别人写的，参考了使用map和vector混用的方法就很好过了，但是那个测试点1就是过不了。最后，我发现就是首字的处理方式应该优化。一个小小小坑。大家注意。#includ
PyTorch核心基础知识点 niuTaylor 编程区 pytorch 人工智能 python
PyTorch核心基础知识点，结合最新特性与工业级实践，按优先级和逻辑关系分层解析：▍核心基石：张量编程（TensorProgramming）1.张量创建（8种生产级初始化）#设备自动选择（2024最佳实践）device="cuda"iftorch.cuda.is_available()else"mps"iftorch.backends.mps.is_available()else"cpu"#关键
机器学习中的 K-均值聚类算法及其优缺点平凡而伟大. 机器学习机器学习算法均值算法
K-均值聚类是一种常用的无监督学习算法，用于将数据集中的样本分成K个簇。其基本原理是将所有样本点划分到K个簇使得簇内样本点之间的距离尽可能接近，而不同簇之间的距离尽可能远。算法流程如下：随机选择K个样本点作为初始的聚类中心。将每个样本点分配到与其最近的聚类中心所在的簇。更新每个簇的聚类中心为该簇所有样本点的平均值。重复第2步和第3步，直到聚类中心不再变化或者达到最大迭代次数。优点：简单且易于实现。
一文讲清楚深度学习和机器学习平凡而伟大. 机器学习人工智能深度学习机器学习人工智能
目录1.定义机器学习（MachineLearning,ML）深度学习（DeepLearning,DL）2.工作原理机器学习深度学习3.应用场景机器学习深度学习4.主要区别5.为什么选择深度学习？6.总结深度学习和机器学习是人工智能（AI）领域中两个密切相关但有所区别的概念。要清楚地解释它们之间的关系，我们可以从定义、工作原理、应用场景以及两者的主要区别等方面进行探讨。1.定义机器学习（Machin
OpenStack阶梯计价实战：Hashmap模块从入门到精准计费冯·诺依曼的 openstack 云计算 linux
目录Hashmap模块概述核心概念解析配置步骤详解应用场景分析注意事项与扩展1.Hashmap模块概述OpenStack的Rating模块负责资源使用量的计费统计，而Hashmap是其核心组件，用于定义灵活的计价规则。通过Hashmap，管理员可以：根据资源类型（如CPU、存储、网络）设置差异化单价实现阶梯计价（如使用量超过阈值后单价打折）将资源与服务、服务组绑定，支持复杂计费策略2.核心概念解析
AIOps：解决企业IT挑战的智能利器雅菲奥朗认证培训 AIOps SRE 可观测性
前言：在当今数字化的时代，企业IT基础设施和应用程序规模不断扩大，面临着日益复杂的挑战。在这种情况下，AIOps人工智能运维成为解决企业IT运维困境的智能利器。AIOps与可观测性密切相关，可观测性是实现AIOps的基础。通过收集、监视和理解系统数据，AIOps能够自动化运维任务、实时监控系统状态、预测潜在问题，从而提高效率和稳定性。AIOps尤其适用于IT运维部门，这是一个迫切需要此类技术的群体
C语言指针入门(二) 悄悄敲敲敲 c语言开发语言算法 c++
1.二级指针二级指针就是指针的指针，即存放指针变量地址的一个变量。#includeintmain(){inta=10;int*p=&a;int**pp=&p;printf("%d\n",a);printf("%d\n",*p);printf("%d\n",**pp);//打印结果全为10printf("%p\n",a);printf("%p\n",*p);printf("%p\n",**pp);/
回归模型评价指标——衡量预测能力 Tang–t 回归数据挖掘人工智能机器学习 python
目录一、指标说明1.均方误差（MeanSquaredError，MSE）2.均方根误差（RootMeanSquaredError，RMSE）3.平均绝对误差（MeanAbsoluteError，MAE）4.决定系数（CoefficientofDetermination，R²）5.解释方差（ExplainedVariance，EV）6.最大误差（MaximumError）二、代码一、指标说明回归模型
使用AIOps进行更好的事件管理茵赛飞3D CAD数据转换软件 pagerduty devops 人工智能运维
DevOps为科技界带来了更加协作和高效的工作流程。随着AIOps的集成，自动化更进一步，使用人工智能为团队提供更快的根本原因分析和算法降噪。主要从采用AIOps中受益的主要领域之一是事件管理。AIOps可以帮助DevOps团队自动化工作流程，以实现更智能、更高效的事件管理，从而腾出时间让IT运营团队成员专注于创新以改善用户体验。在本文中，我们将了解AIOps如何从检测和识别到响应改进事件管理，以
AI大模型编程能力对比：Deepseek&Claude&Gemini 黑夜路人（heiyeluren） AI人工智能人工智能 ai AIGC 语言模型
在当今快速发展的技术领域，人工智能（AI）模型在编程和数据处理方面的应用越来越广泛。不同的AI模型因其独特的设计理念和技术优势，适用于不同的编程任务和场景。本文将对三种主流的AI模型——DeepSeekv3、GeminiFlash2.0和Claude3.5Sonnet的编程能力进行详细对比，帮助读者根据具体需求选择最合适的工具。同时对DeepSeekv3、GeminiFlash2.0和Claude
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(Flask WEB版) 2 带娃的IT创业者 AI大模型趣味实战人工智能 flask 前端
《AI大模型趣味实战》第8集：多端适配个人新闻头条基于大模型和RSS聚合打造个人新闻电台(FlaskWEB版)2摘要本文末尾介绍了如何实现新闻智能体的方法。在信息爆炸的时代，如何高效获取和筛选感兴趣的新闻内容成为一个现实问题。本文将带领读者通过Python和Flask框架，结合大模型的强大能力，构建一个个性化的新闻聚合平台，不仅能够自动收集整理各类RSS源的新闻，还能以语音播报的形式提供"新闻电台
机器学习knnlearn1 XW-ABAP 机器学习机器学习人工智能
importmatplotlib.pyplotaspltimportnumpyasnpimportoperator#定义一个函数用于创建数据集defcreateDataSet():#定义特征矩阵，每个元素是一个二维坐标点，代表不同策略数据点的坐标group=np.array([[20,3],[15,5],[18,1],[5,17],[2,15],[3,20]])#定义每个数据点对应的标签，用于区分
从头开始学C语言第三十一天——void指针和const指针神阶平天牛魔王 c语言
void指针void指针是一种不确定数据类型的指针，可以通过强制转换类型让该指针指向任何数据类型的变量。说明形式：void*对于void指针，在没有强制转换数据类型之前，不能进行指针的算术运算#includeintmain(){inta=10;void*p;p=&a;printf("%d%d\n",a,*(int*)p);return0;}printf("%d%d\n",a,*(int*)p);这
基于 MySQL 和 Spring Boot 的在线论坛管理系统设计与实现城南|阿洋-计算机从小白到大神 mysql spring boot 数据库
markdownCopy✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN[新星计划]导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、pyhton、机器学习技术领域和毕业项目实战✌哈喽兄弟们，好久不见哦～最近整理了一下之前写过的一些小项目/毕业设计。发现还是有很多存货的，想一想既然放在电脑里面也吃灰，那么还不如分享出去，没准还可以帮助到
.net 4.0环境异步方法实现，异步委托和回调异常处理蔚蓝星空-大强异步多线程 c#asp.net
.net4.0环境异步方法实现，异步委托和回调异常处理无返回值的异步方法通过委托实现staticvoidMain(string[]args){//异步执行写入数据任务，不阻塞主线程任务SetDataAsync(1);Console.WriteLine("主线程后续任务...");Console.ReadKey();}publicstaticvoidSetDataAsync(intnum){//这里
RK3588开发笔记-DDR4降频实战与系统稳定性优化 flypig哗啦啦 RK3588 DDR
目录前言一、DDR变频原理与工具准备1.1DDR变频机制1.2工具链配置二、DDR降频操作步骤2.1找到RK3588DDR默认bin文件2.2修改DDRbin文件频率三、进阶优化与调试3.1温控策略调整3.2电源设计优化四、常见问题与解决方案总结前言RK3588作为瑞芯微旗舰级SoC，其DDR4/LPDDR4X内存接口最高支持2112MHz频率，但在实际开发中，高频可能导致系统不稳定或功耗过高。例
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
46-886 Machine Learning Fundamentals W_X_99515681 机器学习人工智能
46-886MachineLearningFundamentalsHW1Homework1Due:Sunday,March23,11:59pm•UploadyourassignmenttoCanvas(onlyonepersonperteamneedstosubmit)•Includeawriteupcontainingyouranswerstothequestionsbelow(andyourt
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

tensorflow使用train_image_classifier来训练数据（修改整理）

你可能感兴趣的:(AI,AI实战派,tensorflow,分类器,神经网络,训练数据集)