qiuxi337

TensorFlow Object Detection API —— 制作自己的模型

在上一篇中我们已经搭建好了TensorFlow Object Detection API所需的环境，现在我们就可以构建自己的模型了，在构建自己的模型之前可以考虑需要用什么模型进行训练和之后进行预测，在这里又要祭出上一篇文章中的模型列表图了，我们可以从下图中找到自己所需要的模型下载，本文选用ssdlite_mobilenet_v2_coco进行训练，大家可以下载其它自己需要的模型进行训练。

1. 构建自己的数据集

在开始训练之前我们需要构建自己的数据集，我们首先看一下官方对数据集的要求（接下来就该上图了）。

官方要求如上图，我们需要注意的是我们图片的格式需要为JPEG或者PNG，简单来说就是我们图片的后缀只能为jpg、jpeg或者是png，所以在准备图片的时候我们需要注意这些至于第二点则是对你标注的框的要求，这个我们可以不用太担心，因为我们利用工具标注出来的图片是可以满足这个要求的。

下面我们就可以开始准备自己的数据集了，小编在images2中trim目录下保存了9张wuli 颖宝的照片，在eval下保存了三张颖宝的照片，然后我们开始标注自己的数据集，首先我们下载一个LabelImg(注意哦这里是LabeLimg不是labeLLmg哦)的小工具，注意下载这个工具的路径不能有中文，如果大家去搜索的话将会是一些编译安装的一些教程在这里给出直接课运行版本的下载链接有兴趣的朋友可以进去下载使用链接如下：https://tzutalin.github.io/labelImg/

下载好后我们就开始用这个小工具给自己标注数据，打开界面如下，我们选择Open Dir打开我们保存图片的目录，然后点击选择目录，之后就可以开始标注自己的图片了我们再设置一下保存目录即Change Save Dir选择和图片所在的同一目录即可。然后我们将输入法切换为英文输入模式，按下W然后会出来一个十字架之后拖动十字架构成一个方框将要标注的目标框起来然后输入目标的名称，因为没测试过是否可以输入中文所以建议大家还是输入英文或者拼音，然后按Ctrl + S保存。

标注好数据之后我们需要将数据集转换为TensorFlow可以识别的TFRecord格式，关于这个可以参考https://blog.csdn.net/dy_guox/article/details/79111949这篇博文，在这里也是借用这篇博文中已经给出的方法来进行数据集的转换。

首先按照博文中的代码我们先将xml图片集转换为csv文件注意要将路径修改为标注的数据集所在的目录，然后将CSV文件移到object_detection下的data目录，按照博文中的CSV转TFRecord 代码（这个代码要保存在objec_detection目录下）运行一遍，类标也要修改为自己的如下图1，注意需要修改图片的路径即如下图2所示代码将图中的images可以替换成我们存储图片的目录在这里我是images2所以改成images2但是因为我们又分了trim和eval目录所以需要在那里分别添加trim和eval分两次运行，如下图3和图4所示，先按照图3修改然后打开Anaconda Prompt（虚拟环境则为Anaconda Prompt(tensorflow)）运行，如图5所示运行一遍，然后按照图4修改按照如图6所示运行一遍，这样就不会遇到如7示错误，成功后就可以进行下一步了。

图1

图2

图3

图4

图5

图6

图7

2. 准备自己的配置文件

在我们下载的models-master/object_detection 下找到samples文件夹打里面的那个configs文件夹如下图所示，找到我们需要的模型的名称的文件然后打开，可以用记事本打开，比如说我们这里是ssdlite_mobilenet_v2_coco，我将这个模型下载到了object_detection的training2文件夹下，建议最好是复制一份去其它目录，在这里我将其复制到了training2这个文件夹下。

下面对我们需要的地方进行修改，下面是我们需要修改的地方

num_classes 在这里修改为我们需要识别的目标也就是类标的数量,在这里我们是1个
fine_tune_checkpoint: "PATH_TO_BE_CONFIGURED/model.ckpt" 在这里修改为模型下载解压后的目录，比如我是training2/ssdlite_mobilenet_v2_coco_2018_05_09
train_config下的batch_size根据自己的情况来一般改为1就好用大一点的batch_size可以更快的收敛但是对GPU要求比较高所以改为1就好，如果有大型计算平台可以保持原来的不动。
然后就是 train_input_reader和 eval_input_reader下的input路径这里需要注意的是train_input_reader是训练的tfrecord比如我这里是zhaoliying.record，eval_input_reader是评估用的tfrecord路径在我这里是zhaoliying_eval.record
就是之前说的那两个中的label_map_path 我们需要创建一个自己的pbtxt文件这个是一个类标对应的文件，可以参照data文件夹下的pbtxt文件，在这里我创建了一个zhaoliying.pbtxt文件

以下为我的配置文件，仅供参考

# SSDLite with Mobilenet v2 configuration for MSCOCO Dataset.
# Users should configure the fine_tune_checkpoint field in the train config as
# well as the label_map_path and input_path fields in the train_input_reader and
# eval_input_reader. Search for "PATH_TO_BE_CONFIGURED" to find the fields that
# should be configured.

model {
  ssd {
    num_classes: 1
    box_coder {
      faster_rcnn_box_coder {
        y_scale: 10.0
        x_scale: 10.0
        height_scale: 5.0
        width_scale: 5.0
      }
    }
    matcher {
      argmax_matcher {
        matched_threshold: 0.5
        unmatched_threshold: 0.5
        ignore_thresholds: false
        negatives_lower_than_unmatched: true
        force_match_for_each_row: true
      }
    }
    similarity_calculator {
      iou_similarity {
      }
    }
    anchor_generator {
      ssd_anchor_generator {
        num_layers: 6
        min_scale: 0.2
        max_scale: 0.95
        aspect_ratios: 1.0
        aspect_ratios: 2.0
        aspect_ratios: 0.5
        aspect_ratios: 3.0
        aspect_ratios: 0.3333
      }
    }
    image_resizer {
      fixed_shape_resizer {
        height: 300
        width: 300
      }
    }
    box_predictor {
      convolutional_box_predictor {
        min_depth: 0
        max_depth: 0
        num_layers_before_predictor: 0
        use_dropout: false
        dropout_keep_probability: 0.8
        kernel_size: 3
        use_depthwise: true
        box_code_size: 4
        apply_sigmoid_to_scores: false
        conv_hyperparams {
          activation: RELU_6,
          regularizer {
            l2_regularizer {
              weight: 0.00004
            }
          }
          initializer {
            truncated_normal_initializer {
              stddev: 0.03
              mean: 0.0
            }
          }
          batch_norm {
            train: true,
            scale: true,
            center: true,
            decay: 0.9997,
            epsilon: 0.001,
          }
        }
      }
    }
    feature_extractor {
      type: 'ssd_mobilenet_v2'
      min_depth: 16
      depth_multiplier: 1.0
      use_depthwise: true
      conv_hyperparams {
        activation: RELU_6,
        regularizer {
          l2_regularizer {
            weight: 0.00004
          }
        }
        initializer {
          truncated_normal_initializer {
            stddev: 0.03
            mean: 0.0
          }
        }
        batch_norm {
          train: true,
          scale: true,
          center: true,
          decay: 0.9997,
          epsilon: 0.001,
        }
      }
    }
    loss {
      classification_loss {
        weighted_sigmoid {
        }
      }
      localization_loss {
        weighted_smooth_l1 {
        }
      }
      hard_example_miner {
        num_hard_examples: 3000
        iou_threshold: 0.99
        loss_type: CLASSIFICATION
        max_negatives_per_positive: 3
        min_negatives_per_image: 3
      }
      classification_weight: 1.0
      localization_weight: 1.0
    }
    normalize_loss_by_num_matches: true
    post_processing {
      batch_non_max_suppression {
        score_threshold: 1e-8
        iou_threshold: 0.6
        max_detections_per_class: 100
        max_total_detections: 100
      }
      score_converter: SIGMOID
    }
  }
}

train_config: {
  batch_size: 24
  optimizer {
    rms_prop_optimizer: {
      learning_rate: {
        exponential_decay_learning_rate {
          initial_learning_rate: 0.004
          decay_steps: 800720
          decay_factor: 0.95
        }
      }
      momentum_optimizer_value: 0.9
      decay: 0.9
      epsilon: 1.0
    }
  }
  fine_tune_checkpoint: "training2/ssdlite_mobilenet_v2_coco_2018_05_09/model.ckpt"
  fine_tune_checkpoint_type:  "detection"
  # Note: The below line limits the training process to 200K steps, which we
  # empirically found to be sufficient enough to train the pets dataset. This
  # effectively bypasses the learning rate schedule (the learning rate will
  # never decay). Remove the below line to train indefinitely.
  num_steps: 200000
  data_augmentation_options {
    random_horizontal_flip {
    }
  }
  data_augmentation_options {
    ssd_random_crop {
    }
  }
}

train_input_reader: {
  tf_record_input_reader {
    input_path: "data/zhaoliying.record"
  }
  label_map_path: "data/zhaoliying.pbtxt"
}

eval_config: {
  num_examples: 8000
  # Note: The below line limits the evaluation process to 10 evaluations.
  # Remove the below line to evaluate indefinitely.
  max_evals: 10
}

eval_input_reader: {
  tf_record_input_reader {
    input_path: "data/zhaoliying_eval.record"
  }
  label_map_path: "data/zhaoliying.pbtxt"
  shuffle: false
  num_readers: 1
}

以下是我的zhaoliying.pbtxt的格式

item {
  name: "yingbao"
  id: 1
}

3. 开始训练我们自己的模型

经过上面的一番周折我们现在已经可以开始训练自己的数据集了，不过还有一个小东西我们需要进行，那就是下载和安装pycocotools，有Visual Studio的童鞋请大胆的安装以下命令安装，如果遇到LINK : fatal error LNK1158: 无法运行“rc.exe”错误可以按照这个博客中的方法解决：https://blog.csdn.net/jacke121/article/details/78359820

pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI

如果不想安装也可以用另外一个方法绕过，不过不建议这么做，这个方法会在稍后介绍，感谢朋友水木莲花提供的对这个问题的解决方法，如果按照此方法此处需要进行的代码修改可以不用进行。在进行训练之前如果是使用python3则需要进行以下修改，需要注意的是如果读者是使用Python2进行训练那么恭喜你，你对代码不需要做任何的修改就可以完美的运行，所以可以跳过这一段修改直接进入训练过程，附上一句笔者在自己的win10上用python3这么修改后出现了梯度爆炸的错误没有训练成功但是有朋友这么训练是没问题的，根据朋友的提示将bathsize改大之后这个错误就消失了，所以大家可以尝试，因而在这里将这个方法放上，那么我们就更改object_detection下的utils\object_detection_evaluation.py 这个文件的第842行开始，改成如下图所示即可

还需要更改object_detection下的model_lib.py的第282行改成如下图1所示,第391行改成如下图2所示,第381行改为如下图3所示。

图1

图2

图3

修改object_detection/metrics下的coco_tools.py的第118行为下图所示

修改object_detection/utils下的learning_schedules.py的第172行为下图所示

如果安装了Pycocotools并且为python2.7或者python3已经按照上述进行了修改的的童鞋请按照下面的命令开始训练:

此图为我进行训练使用的命令，可参照

打开Anaconda Prompt(tensorflow)
定位到object_detection目录
运行以下命令, 其中的config路径请参照自己的来，训练步长(nums_train_steps)和评估步长(nums_eval_steps)按照自己的需求来，model_dir是自己希望保存模型的目录,可以参照我下图中的来。
```
python model_main.py \
     --pipeline_config_path=training2/ssdlite_mobilenet_v2_coco.config \
     --model_dir=training2 \
     --num_train_steps=50000 \
     --num_eval_steps=2000 \
     --alsologtostderr
```

下面介绍第二种方法，这种方法就可以不用修改任何代码，且可以在Windows下进行训练，但是这里修改训练步数就需要在配置文件中即ssdlite_mobilenet_v2_coco.config进行修改将其中的num_steps修改为2000，num_examples修改为200，大家可以修改为自己需要的步数，batch_size可以修改为1或者自己想要的在这里我修改为了12，如果机器性能好batch_size可以不做修改。然后打开Anaconda Prompt输入以下命令,其中的train_dir就是模型保存的目录，pipeline_config_path即训练配置的目录，可以修改为自己的。

python ./legacy/train.py --logtostderr --train_dir=training2/ --pipeline_config_path=training2/ssdlite_mobilenet_v2_coco.config

如果出现如下图所示界面则进入了训练过程，我们等待它慢慢训练完毕就行。

我们可以用tensorboard来查看我们的训练过程，打开另一个Anaconda Prompt(tensorflow) 窗口定位到object_detection输入下述命令,logdir用自己的训练目录替换。

tensorboard  --logdir=training2

然后复制出现的网址（下图中标红部分，每个人都不相同）打开浏览器，将其输入地址栏中访问就可以进入tensorboard了。

下图是我在Windows下运行的截图，这次是用CPU跑的，运行的时间较长，推荐大家使用GPU进行训练，当然机器不满足我们就用CPU来跑一下，等久一点就行了。

对模型进行评估（可选）

首先我在我的训练目录training2下建立了一个名为eval的文件夹，然后我们打开Anaconda Prompt(tensorflow) 定位到object_detection，输入下述命令，其中training2为之前我们训练的路径，根据自己的实际情况进行修改。

python ./legacy/eval.py --logtostderr --checkpoint_dir=training2 --pipeline_config_path=training2/ssdlite_mobilenet_v2_coco.config --eval_dir=training2/eval/

下图是评测的一个结果，可以做一个简单的评估，具体怎么理解大家可以自行去搜索（注：估计这个评测结果大家都会认为不咋地，所以这个步骤大家可以省略，而且如果是用model_main.py训练那么训练过程中自动进行的eval就已经非常不错了）。

4. 生成可被调用的模型

打开Anaconda Prompt定位到object_detection下执行下述命令,其中model.ckpt选择训练目录中最大的数值，然后输出目录由自己定义，注意根据实际情况进行替换。

python export_inference_graph.py  \ 
             --input_type  image_tensor  \
             --pipeline_config_path  training2/ssdlite_mobilenet_v2_coco.config \
             --trained_checkpoint_ prefix training2/model.ckpt-2000  \
             --output_directory  zhaoliying_inference_graph

执行后在输出目录会生成下图中的一些文件

5.使用自己的模型进行测试

在object_detection下建立一个名为my_model.py的文件，具体可参照之前我们用notebook打开的sample来进行修改，下面为我的代码，可以参考，参考自博客: https://blog.csdn.net/dy_guox/article/details/79111949。

# -*- coding: utf-8 -*-
"""
Created on Wed Aug  1 14:09:11 2018

@author: qiuzhongxi
"""
#Imports
import time
start = time.time()
import numpy as np
import os
import six.moves.urllib as urllib
import sys
import tarfile
import tensorflow as tf
import zipfile

 
from collections import defaultdict
from io import StringIO
from matplotlib import pyplot as plt
from PIL import Image
import scipy.misc
if tf.__version__ < '1.4.0':
  raise ImportError('Please upgrade your tensorflow installation to v1.4.* or later!')
  
os.chdir('D:\\Machine_Learning\\tensorflow-api\\models-master\\research\\object_detection')
  
  
#Env setup 
# This is needed to display the images.
#%matplotlib inline
 
# This is needed since the notebook is stored in the object_detection folder.
sys.path.append("..")
 
 
 
 
#Object detection imports
from utils import label_map_util
 
from utils import visualization_utils as vis_util
 

#这是我们刚才训练的模型,修改为自己输出的模型目录名
MODEL_NAME = 'zhaoliying_inference_graph'
 
 
 
#对应的Frozen model位置
# Path to frozen detection graph. This is the actual model that is used for the object detection.
PATH_TO_CKPT = MODEL_NAME + '/frozen_inference_graph.pb'
 
# List of the strings that is used to add correct label for each box.
PATH_TO_LABELS = os.path.join('data', 'zhaoliying.pbtxt')
 
#改成自己例子中的类别数，1
NUM_CLASSES = 1

    
#Load a (frozen) Tensorflow model into memory.    
detection_graph = tf.Graph()
with detection_graph.as_default():
  od_graph_def = tf.GraphDef()
  with tf.gfile.GFile(PATH_TO_CKPT, 'rb') as fid:
    serialized_graph = fid.read()
    od_graph_def.ParseFromString(serialized_graph)
    tf.import_graph_def(od_graph_def, name='')    
    
    
#Loading label map
label_map = label_map_util.load_labelmap(PATH_TO_LABELS)
categories = label_map_util.convert_label_map_to_categories(label_map, max_num_classes=NUM_CLASSES, use_display_name=True)
category_index = label_map_util.create_category_index(categories)
 
 
#Helper code
def load_image_into_numpy_array(image):
  (im_width, im_height) = image.size
  return np.array(image.getdata()).reshape(
      (im_height, im_width, 3)).astype(np.uint8)
 
 
#Detection
 
# If you want to test the code with your images, just add path to the images to the TEST_IMAGE_PATHS.
#测试图片位置
PATH_TO_TEST_IMAGES_DIR = os.getcwd()+'/test_images3'
os.chdir(PATH_TO_TEST_IMAGES_DIR)
TEST_IMAGE_PATHS = os.listdir(PATH_TO_TEST_IMAGES_DIR)
 
# Size, in inches, of the output images.
IMAGE_SIZE = (12, 8)
#修改为自己的目录，必须存在该文件夹
output_path = ('D:\\Machine_Learning\\tensorflow-api\\models-master\\research\\object_detection\\zhaoliying\\')
 
 
with detection_graph.as_default():
  with tf.Session(graph=detection_graph) as sess:
    # Definite input and output Tensors for detection_graph
    image_tensor = detection_graph.get_tensor_by_name('image_tensor:0')
    # Each box represents a part of the image where a particular object was detected.
    detection_boxes = detection_graph.get_tensor_by_name('detection_boxes:0')
    # Each score represent how level of confidence for each of the objects.
    # Score is shown on the result image, together with the class label.
    detection_scores = detection_graph.get_tensor_by_name('detection_scores:0')
    detection_classes = detection_graph.get_tensor_by_name('detection_classes:0')
    num_detections = detection_graph.get_tensor_by_name('num_detections:0')
    for image_path in TEST_IMAGE_PATHS:
      image = Image.open(image_path)
      # the array based representation of the image will be used later in order to prepare the
      # result image with boxes and labels on it.
      image_np = load_image_into_numpy_array(image)
      # Expand dimensions since the model expects images to have shape: [1, None, None, 3]
      image_np_expanded = np.expand_dims(image_np, axis=0)
      # Actual detection.
      (boxes, scores, classes, num) = sess.run(
          [detection_boxes, detection_scores, detection_classes, num_detections],
          feed_dict={image_tensor: image_np_expanded})
      # Visualization of the results of a detection.
      vis_util.visualize_boxes_and_labels_on_image_array(
          image_np,
          np.squeeze(boxes),
          np.squeeze(classes).astype(np.int32),
          np.squeeze(scores),
          category_index,
          use_normalized_coordinates=True,
          line_thickness=8)
      #保存文件
      im=scipy.misc.toimage(image_np, cmin=0.0, cmax=...)
      im.save(output_path+image_path.split('\\')[-1])
      
end =  time.time()
print("Execution Time: ", end - start)

用python执行上述代码，最后输出的两张图片如下，可见模型的效果还有待提高，这个和我的数据集的大小有比较大的关系，增加训练步数也可也提高模型的质量，才刚开始写文，如有错误请海涵，欢迎大家一起交流。

如何微调（Fine-tuning）大语言模型？看完这篇你就懂了！！ datian1234 语言模型人工智能 chatgpt LLM ai AI大模型大模型微调
前言本文介绍了微调的基本概念，以及如何对语言模型进行微调。从GPT3到ChatGPT、从GPT4到GitHubcopilot的过程，微调在其中扮演了重要角色。什么是微调（fine-tuning）？微调能解决什么问题？什么是LoRA？如何进行微调？本文将解答以上问题，并通过代码实例展示如何使用LoRA进行微调。微调的技术门槛并不高，如果微调的模型规模不大10B及10B以下所需硬件成本也不高（10B模
大型语言模型的核心机制解析耶耶Norsea 网络杂烩人工智能 Deepseek
摘要大型语言模型的核心机制依赖于Transformer架构，该架构通过嵌入层将输入数据转换为向量形式，并结合位置编码以保留序列中单词的顺序信息。随后，这些向量进入多头自注意力层，能够同时关注输入序列的不同部分。自注意力层的输出经过残差连接和层归一化处理，以增强模型的学习能力和稳定性。接着，数据流经前馈网络进一步处理，最终再次通过残差连接和层归一化，得到编码器层的输出。模型性能高度依赖大规模和高质量
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch) Tasfa AI人工智能教程人工智能学习 gpt
前序文章【AI系列】从零开始学习大模型GPT(1)-BuildaLargeLanguageModel(FromScratch)BuildaLargeLanguageModel背景第1章：理解大型语言模型第2章：处理文本数据第3章：编码Attention机制什么是Attention机制？Attention机制的基本原理数学表示应用总结为什么要使用注意力机制如何实现？简单注意力机制带训练权重的注意力机
自学人工智能大模型，满足7B模型的训练和微调以及推理，预算3万，如何选购电脑岁月的眸人工智能
如果你的预算是3万元人民币，希望训练和微调7B参数规模的人工智能大模型（如LLaMA、Mistral等），你需要一台高性能的深度学习工作站。在这个预算范围内，以下是推荐的配置：1.关键硬件配置(1)GPU(显卡)推荐显卡：NVIDIARTX4090(24GBVRAM)或者RTX3090（24GBVRAM）理由：7B模型推理：24GB显存足够跑7B模型的推理，但全参数训练可能吃力，适合LoRA等微调
多模态大模型（LMMs）与大语言模型（LLMs）的比较大F的智能小课底层技术解析人工智能语言模型
前言现在的大模型分为两大类：大语言模型（LargeLanguageModels，简称LLMs）和多模态大模型（LargeMultimodalModels，简称LMMs）。本文将从基础定义、输入数据、应用场景、训练过程这几方面讨论下两者的区别。基础定义LLMs(LargeLanguageModels,大型语言模型)-深度学习的应用之一，是基于深度学习的大规模机器学习模型，通常由数十亿到数万亿个参数构
Dify基础：windows下如何学习Linux系统？wsl相关基本概念的介绍几道之旅 Dify：智能体（Agent）工作流知识库全搞定 linux windows docker
文章目录前言首先，WSL到底是个什么东西？在WSL之前，有个hyperV，又是个啥？WSL和HyperV的关系是什么？我来总结一下吧，有了wsl，就相当于在你的windows上有了一个可以运行linux的虚拟机。这和Dify有啥关系？前言为了实现本文效果，我直接下血本把自己的wsl给卸载了。就说这个牺牲精神，希望大伙儿多多关注、多多点赞、多多评论。首先，WSL到底是个什么东西？在很久以前，有一个叫
【好书推荐2】AI提示工程实战：从零开始利用提示工程学习应用大语言模型是Yu欸粉丝福利人工智能深度学习 bert AIGC prompt gpt AI写作
【好书推荐2】AI提示工程实战：从零开始利用提示工程学习应用大语言模型写在最前面AI辅助研发方向一：AI辅助研发的技术进展方向二：行业应用案例方向三：面临的挑战与机遇方向四：未来趋势预测方向五：与法规的影响方向六：人才培养与教育《AI提示工程实战：从零开始利用提示工程学习应用大语言模型》关键点内容简介作者简介你好呀！我是是Yu欸2024每日百字篆刻时光，感谢你的陪伴与支持~欢迎一起踏上探险之旅，挖
Vue3笔记_＜入门基础篇＞我的白银时代 Vue2进阶Vue3笔记 Vue3零到一实战笔记 vue.js 前端
目录Setup语法糖ref:定义一个数据的响应式reactive:定义一个对象类型的响应式数据toRef()toRefs()计算属性watchEffect函数生命周期Vue3获取DomPropsVue3自定义事件Setup语法糖setup是一个专门用于组合式API的特殊钩子函数，只在初始化时执行一次。setup有两种返回值:对象。对象中的属性，方法在模板中都可以直接使用函数。自定义渲染内容，覆盖模
MVC和react 吃蛋糕的居居 javascript css node.js html
MVC1.MVC是一种使用MVC（ModelViewController模型-视图-控制器）设计创建Web应用程序的模式.(1)Model（模型）表示应用程序核心（比如数据库记录列表）.(2)View(视图)显示数据（数据库记录）.(3)Controller（控制器）处理输入（写入数据库记录）.2.MVC模式同时提供了对HTML、CSS和JavaScript的完全控制.(1)Model（模式）是应
RESTful API 和 WebSocket 的区别戎梓漩计算机 restful websocket 后端
文章目录1.RESTfulAPI特点使用场景示例2.WebSocket特点使用场景示例3.RESTfulAPI和WebSocket对比总结4.哪种方式适合大模型服务？RESTfulAPIWebSocket5.什么时候用REST？什么时候用WebSocket？6.结论RESTfulAPI和WebSocket是两种不同的通信方式，主要区别在于数据交互方式、连接管理、性能和适用场景。1.RESTfulA
分布式数据库面试整理 Necther 数据库面试分布式
5.3.1redis面试专题1、redis和memcached什么区别？为什么高并发下有时单线程的redis比多线程的memcached效率要高？区别：mc可缓存图片和视频。rd支持除k/v更多的数据结构；rd可以使用虚拟内存，rd可持久化和aof灾难恢复，rd通过主从支持数据备份;3.rd可以做消息队列。原因:mc多线程模型引入了缓存一致性和锁，加锁带来了性能损耗。2、redis主从复制如何实现
CF Round 1004 记录 & 题解（div.1 A - D1 & div.2 D - F） JeremyHe1209 算法
今天上午VPCodeforcesRound1004(Div.2)，下午改CodeforcesRound1004(Div.1)。上午C题因为少判了一个条件，罚时吃饱了。[Codeforces2066A&2067D]ObjectIdentification神奇交互题。观察到一个性质：对象AAA的答案可能是000，但对象BBB的答案不可能是000。若x1,x2,…,xnx_1,x_2,\dots,x_n
k8s中的service、api-server、kube-proxy有什么区别似水流年光阴已逝 k8s kubernetes java 容器
在Kubernetes（K8s）中，Service、APIServer和kube-proxy是三个不同的组件，它们在集群中扮演着不同的角色和功能。下面我将为你解释它们之间的区别：1.Service（服务）：Service是K8s中的一种资源对象，用于定义一组具有相同功能的Pod的访问方式和负载均衡。它提供了一个虚拟的IP地址和端口，作为对外提供服务的入口。Service将后端的一组Pod抽象为一个
基于 Python 的云笔记平台分析与设计程序员奇奇计算机毕设 Python 云笔记毕业设计
完整代码：https://download.csdn.net/download/qq_38735017/873824351前言1.1背景苏联著名教育学家苏霍姆林斯基说得好：“如果学生的智力生活仅局限于教科书，如果他做完了功课就觉得任务已经完成，那么他是不可能有自己特别爱好的。”每一个学生要在书籍的世界里，有自己的生活。把读书，应视为自己的乐趣。当每读完一本有意思的书时，很多时候都想把书中感触深刻亦
Windows下安装CPU用的Tensorflow Coder LM Wang Python
刚在电脑上安装了Tensorflow，还是碰到了一些麻烦，记录一下：很多教程是介绍怎么在Linux平台下安装的，或者是Windows平台下GPU用的，很可惜，这些教程对我来说太麻烦了。安装步骤：1）安装Python。版本：python-3.6.4-amd64.exe。2）cmd，命令行输入：python，查看Python版本号，以验证Python是否安装成功了。3）继续在命令行输入：pipinst
通义灵码全新上线模型选择功能，新增支持 DeepSeek-V3 和 DeepSeek-R1 模型 TONGYI_Lingma 阿里云云原生 AI程序员通义灵码
近期，阿里云百炼平台重磅推出DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款模型，进一步丰富其AI模型矩阵。与此同时，通义灵码也紧跟步伐，全新上线模型选择功能，支持基于百炼的DeepSeek-V3和DeepSeek-R1满血版671B模型，为AI编程领域注入新活力。通义灵码能力再升级，支持推理模型选择今年1月，通义灵码AI程序员全面上线
《Stable Diffusion绘画完全指南：从入门到精通的Prompt设计艺术》第一章 Allen-Steven python相关应用 SD 创作实践 stable diffusion prompt 人工智能
第一章：认识StableDiffusion与Prompt设计基础1.1什么是StableDiffusion：生成原理与核心优势一、颠覆性生成逻辑：从噪声到艺术的魔法逆向降噪原理传统AI绘画：直接生成完整像素StableDiffusion：通过潜扩散模型（LDM），在低维潜空间（LatentSpace）逐步去除噪声，最终解码为高清图像类比解释：如同雕塑家从混沌的大理石中凿出形体，AI在噪声中「雕刻」
解码DeepSeek家族系列：大语言模型赛道上的黑马传奇大F的智能小课语言模型人工智能自然语言处理
1.DeepSeek公司概况1.1成立背景与发展历程DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，于2023年7月17日正式成立。公司由知名量化资管巨头幻方量化孕育而生，其创始人梁文峰是幻方量化的联合创始人之一。DeepSeek自成立之初，便专注于开发先进的大语言模型（LLM）及相关技术，致力于通过数据蒸馏技术提取更精炼、有用的数据，以提升模型性能。在发展历程中，DeepSeek
【必看】凭啥？DeepSeek如何用1/179的训练成本干到GPT-4o 98%性能大F的智能小课人工智能算法
一、DeepSeek降低训练成本的核心方法1.1创新训练方法DeepSeek通过独特的训练方案显著降低了训练成本。其核心策略包括减少监督微调（SFT）步骤，仅依赖强化学习（RL）技术。DeepSeek-R1-Zero版本完全跳过SFT，仅通过RL进行训练。尽管初期计算开销较大，但添加少量冷启动数据后，训练稳定性和模型推理能力大幅提升。此外，DeepSeek还采用了组相对策略优化（GRPO）算法替代
Sora如何颠覆20个商业场景？Sora模型的商业应用及成本效益分析大F的智能小课玩转大模型人工智能
Sora模型简介Sora模型，作为一种先进的长视频生成模型，具有广泛的应用潜力。以下是Sora模型可能的20个商业场景应用，包括每个场景在Sora模型未发布时的普遍做法、Sora模型发布之后的改变以及节省成本的维度分析。节省成本的说明节省成本的说明：节省成本的计算是基于几个关键因素，包括时间、人力、设备和材料成本。以下是具体计算方法的一个概述：时间成本：使用Sora模型可以显著减少视频制作的时间。
【Termux】安装与配置 Termux zimoyin 尝试新玩意数据库
1.下载与安装1.1下载访问官方网站进行下载：Termux或者点击此处下载此版本:Version0.119.0-beta.1(1020)-AddedonJun21,2024第一次打开可能会进行配置1.2PKG命令termux兼容apt命令但是他有自己的命令pkgpkgsearch#搜索包pkginstall#安装包pkguninstall#卸载包pkgreinstall#重新安装包pkgupdat
《哪吒》的成功之道：影视创作项目管理的“核心技巧”
《哪吒》票房神话背后：揭秘影视创作项目管理的“乾坤圈”——从“手工作坊”到工业化体系，一部爆款的诞生逻辑[]()一、50亿票房背后的“不可能任务”2025年春节档，《哪吒之魔童闹海》以95.1亿元票房刷新影史纪录，成为首个登顶全球动画票房榜的国产电影1。然而，鲜为人知的是，这部现象级作品背后，是一场“逆天改命”的极限挑战——4000人团队：制作规模是第一部的2-3倍，涉及160余家外包公司9；19
【2024年华为OD机试】 (C卷,200分)- 亲子游戏（JavaScript&Java & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od c语言游戏 java javascript 矩阵
一、问题描述宝宝和妈妈的糖果游戏问题题目描述在一个N×N的二维矩阵中，宝宝和妈妈分别用抽签决定自己的初始位置。每个格子可能有不同的糖果数量，同时部分格子有障碍物，妈妈需要遵循以下规则：妈妈必须在最短的时间内到达宝宝的位置（每单位时间只能移动一步）。妈妈沿路可以拾取格子上的糖果，糖果数量会累加。妈妈不能走障碍物的格子，只能上下左右移动。如果妈妈无法到达宝宝，则输出-1。输入格式：第一行输入为N，表示
DeepSeek R1：开启AI推理新时代，强在哪里？人工智能
DeepSeekR1：开启AI推理新时代阅读时长：19分钟发布时间：2025-02-13近日热文：全网最全的神经网络数学原理（代码和公式）直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】你是否曾好奇，AI模型是如何学会拆解数学问题，或是一步步解释代码的呢？在过去几年，许多公司开发出了大型语言模型（LLM），它们能创作文章、翻译语言、编写
DeepSeek使用手册，其中一份是清华大学出品 cpa007 云计算
自娶，。https://pan.quark.cn/s/d174471b17c0深入了解DeepSeek：从技术到应用一、DeepSeek是什么？DeepSeek（深度求索）是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台，专注于提供高效易用的AI模型训练与推理能力。它既包含预训练大语言模型（如DeepSeek-R1系列），也提供配套工具链，助力开发者快速实现AI应用落地。二、De
获取 OpenAI o1-preview/o1-Mini API key 进行 API 调用的详细教程 openaiapikey
如何使用OpenAI推理模型：o1-preview/o1-Mini模型的API调用在快速发展的人工智能领域，OpenAI推出了o1系列模型（草莓），包括o1-preview和o1-Mini。这些模型旨在执行复杂的推理任务，成为开发人员和研究人员的强大工具。本文将介绍如何使用这些模型进行API调用。1.openaiapikey获取首先，您需要一个OpenAIAPI密钥。您可以在OpenAI的官方网站
使用openai api key不支持识别base64的图片？开发者上传多图的示例代码 openaiclaude
openai不支持base64_encoded_image，但是claude3.5支持。我试了uiuiapi.com的api但是你们全用openai的格式似乎不能识别base64的图片。还是说兼容的接口就是所有message的形式全部使用openai的官方文档，我只需要改一个model=xxx，然后其他规则得遵守openai而不是我使用的模型的官方文档？你好，确实需要注意不同模型可能在接口和数据格
获取 OpenAI API Key GPT-4o Mini 模型并开发调用部署ChatGPT聊天 chatgptopenai
获取OpenAIAPIKey并开发调用GPT-4oMini模型OpenAI提供的API可以让开发者轻松调用其强大的自然语言处理模型。以下是获取OpenAIAPIKey并调用GPT-4oMini模型的详细步骤。一、注册OpenAI账户访问官网：打开[OpenAI官方网站]。创建账户：点击页面右上角的“SignUp”按钮，输入你的电子邮件地址和密码。验证邮箱：根据收到的邮件提示，完成邮箱验证。填写信息
如何用useRef优化重复请求
如题：如何用useRef优化重复请求。写业务代码，时而会遇见这种情况，如下伪代码：useEffect(()=>{//api请求()},[a,b])参数a来源某接口请求、参数b来源另外一个接口请求毫无疑问，上面写法回调函数一定会进去两次，除了用参数校验比如满足条件再进入api调用，还可以用useRef来暂存参数，而又不会引起页面的re-render。比如api请求需要a参数，可以写成这样:testR
探索Python爬虫：获取淘宝商品详情与订单API接口的深度解析不爱搞技术的技术猿 Python 淘宝API python 爬虫开发语言
引言在数字化时代，电子商务平台的数据挖掘和分析已成为企业获取市场洞察的重要手段。淘宝，作为中国最大的电商平台之一，拥有海量的商品数据和订单信息。对于商家和市场分析师来说，如何高效、合规地获取这些数据，成为了一个迫切需要解决的问题。本文将深入探讨如何利用Python爬虫技术，通过淘宝提供的API接口，合法合规地获取商品详情和订单数据。淘宝API接口概览淘宝开放平台提供了丰富的API接口，允许开发者在
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p