Icoding_F2014

Tensorflow——使用预训练模型进行猫狗图像分类

前言

预训练模型顾名思义就是使用别人已经训练好的模型参数放到自己的任务里面进行特定任务的微调。这里的模型参数包括：神经网络的结构、神经网络的权值参数。
本博客将尝试使用预训练模型进行猫狗分类。
代码地址：https://github.com/jmhIcoding/dogsVScats.git

实验所用数据集及工具

数据集

将数据集划分为训练集（training dataset）和验证集（validation dataset），均包含dogs和cats两个目录，且每个目录下包含与目录名类别相同的RGB图。数据集共25000张照片，其中训练集猫狗照片各10000张，验证集猫狗照片各2500张。（注：可根据计算资源情况自己调整训练集和验证集的大小，但最好按比例调整）
原始数据集如图3、4、5、6所示。

图3

图4

图5

图6

Slim工具

Slim是 TensorFlow 中一个用来构建、训练、评估复杂模型的轻量化库，TF-Slim 模块可以和 TensorFlow 中其它API混合使用。参见：
https://github.com/tensorflow/models/tree/master/research/slim。
这里简要介绍Tensorflow Slim的代码结构：

datasets/：定义一些训练时用的数据集，预先定义了4个数据集：MNIST、CIFAR-10、Flowers、ImageNet，如果需要训练自己的数据，则可以在datasets文件夹中定义。
nets/：定义了一些常用的网络结构如AlexNet、VGG16、Inception系列等。
preprocessing/：定义了一些图片预处理和数据增强方法。
train_image_classifer.py：训练模型的入口代码。
eval_image_claasifer.py：验证模型的入口代码。

实验步骤与方法

对猫狗照片识别分类的卷积神经网络模型可以自行设计，本实验指导书给出的方法是利用Slim工具包中预定义好的网络结构并进行微调的方法实现，具体是基于nets文件夹中预定义好的Inception V3进行微调。

处理数据集，转换为TFRecord

下载数据集，把train文件夹的25000个图片中，随机取出2500个猫和2500个狗放到train同级目录下的validation目录。
编写TFRecord生成函数

生成train和validdation的TF_Record文件,代码见 convert_kaggle.py
TF_Record文件是tensorflow里面结构化组织训练数据的一种方法，这种方法的本质就是把分散在磁盘中的训练样本集中起来放在一起，使得模型读取数据更加快速。
Slim框架里面使用的数据格式默认就需要先转换为TF_Record。
对于 图片分类 而言，convert_kaggle代码是可以复用的。
只需要根据需要把代码中feature做相应的填充即可：

···
example = tf.train.Example(features=tf.train.Features(
        feature={
                    'image/height': _int64_feature(height), #图片高度
                    'image/width': _int64_feature(width),   #图片宽度
                    'image/colorspace': _bytes_feature(colorspace),
                    'image/channels': _int64_feature(channels),#通道个数
                    'image/class/label': _int64_feature(label),#label
                    'image/class/text': _bytes_feature(text),
                    'image/format': _bytes_feature(image_format),#'JPEG'
                    'image/filename': _bytes_feature(os.path.basename(filename)), #文件名
                    'image/encoded': _bytes_feature(image_buffer)#图片的内容
                }
                )
                )
···

#coding:utf-8
__author__ = 'jmh081701'
import numpy as np
import tensorflow as tf
import sys
import  os
def _int64_feature(value):
    if not isinstance(value, list):
        value = [value]
    return tf.train.Feature(int64_list=tf.train.Int64List(value=value))
def _bytes_feature(value):
    return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))

def _convert_example(filename, image_buffer, label, text, height, width):
    colorspace = 'RGB'.encode()
    channels = 3
    image_format = 'JPEG'.encode()
    if not isinstance(label,int):
        label=int(label)
    if not isinstance(text,bytes):
        text = text.encode()
    if not isinstance(filename,bytes):
        filename = filename.encode()
    example = tf.train.Example(features=tf.train.Features(
        feature={
                    'image/height': _int64_feature(height), #图片高度
                    'image/width': _int64_feature(width),   #图片宽度
                    'image/colorspace': _bytes_feature(colorspace),
                    'image/channels': _int64_feature(channels),#通道个数
                    'image/class/label': _int64_feature(label),#label
                    'image/class/text': _bytes_feature(text),
                    'image/format': _bytes_feature(image_format),#'JPEG'
                    'image/filename': _bytes_feature(os.path.basename(filename)), #文件名
                    'image/encoded': _bytes_feature(image_buffer)#图片的内容
                }
                )
                )
    return example

def convert_kaggle_image(datadir,usage='train'):

    _decode_jpeg_data = tf.placeholder(dtype=tf.string)#place holder
    _decode_jpeg = tf.image.decode_jpeg(_decode_jpeg_data, channels=3)

    with tf.Session() as sess:
        for root,subdirs,files in os.walk(datadir):
            counter = 0
            shard   = 5
            each_shard=int(len(files)/shard)
            writers=[0,1,2,3,4]
            writers[0] = tf.python_io.TFRecordWriter('.\\dogsVScats_%s_0-of-5.tfrecord'%usage)
            writers[1] = tf.python_io.TFRecordWriter('.\\dogsVScats_%s_1-of-5.tfrecord'%usage)
            writers[2] = tf.python_io.TFRecordWriter('.\\dogsVScats_%s_2-of-5.tfrecord'%usage)
            writers[3] = tf.python_io.TFRecordWriter('.\\dogsVScats_%s_3-of-5.tfrecord'%usage)
            writers[4] = tf.python_io.TFRecordWriter('.\\dogsVScats_%s_4-of-5.tfrecord'%usage)
            for file in files:
                writer = writers[int(counter/each_shard)]
                label = 0 if file.split('.')[0] == 'cat' else 1  #0 is cat,while 1 is dog
                filename=root+"\\"+file
                # Read the image file, mode:read and binary
                image_data_raw=tf.gfile.GFile(filename,"rb").read()
                # Convert 2 tensor,转换的目的是为了提取height和width,也可以使用PIL库来转换
                image= sess.run(_decode_jpeg,feed_dict={_decode_jpeg_data:image_data_raw})
                height=image.shape[0]
                width =image.shape[1]

                example=_convert_example(filename,image_buffer=image_data_raw,label=label,text="",height=height,width=width)
                writer.write(example.SerializeToString())
                counter+=1
                print("Finish:%s"%str(counter/len(files)))
                sys.stdout.flush()
            writers[0].close()
            writers[1].close()
            writers[2].close()
            writers[3].close()
            writers[4].close()
if __name__ == '__main__':
    convert_kaggle_image(datadir=r"G:\bdndisk\kaggle\train\validation",usage='validation')
convert_kaggle_image(datadir=r"G:\bdndisk\kaggle\train\train",usage='train')

运行脚本,将生成10个tfrecord文件,其中有5个是训练集另外5个是验证集。

安装TF-slim识别库

安装TF-slim 图像识别库

Tensorflow 1.0以后就支持TF-Slim了，但是要使用TF-Slim进行图像分类就还得安装TF-Slim image models library.

安装方法：

git clone  https://github.com/tensorflow/models/

创建数据库声名文件

在刚刚clone的目录下的models\research\slim\datasets新建一个dogVScats.py文件,把flowers.py内容拷贝下来。修改其中的内容：

主要是_FILE_PATTERN,SPLITS_TO_SIZES以及_NUM_CLASSES 三个值。
_FILE_PATTERN 用于表示刚刚生成的TF_RECORD文件的文件名的格式，%s_* 带了通配符号。
SPLITES_TO_SIZES表示训练集和测试集的大小。
_NUM_CLASSES表示分类类别数目。
dogVScats内容：https://github.com/jmhIcoding/dogsVScats/blob/master/dogsVScats.py

在dataset_factory.py注册dogsVScats

注意箭头指向的地方是需要修改的。
修改后的dataset_factory.py: https://github.com/jmhIcoding/dogsVScats/blob/master/dataset_factory.py

训练模型：

训练脚本

见 main.py

__author__ = 'jmh081701'
import os
cmd="python train_image_classifier.py --train_dir=dogsVScats/train_dir " \
    "--dataset_name=dogsVScats --dataset_split_name=train " \
    "--dataset_dir=dogsVScats/data --model_name=inception_v3 " \
    "--checkpoint_path=dogsVScats/pretrained/inception_v3.ckpt " \
    "--checkpoint_exclude_scopes=InceptionV3/Logits,InceptionV3/AuxLogits " \
    "--trainable_scopes=InceptionV3/Logits,InceptionV3/AuxLogits " \
    "--max_number_of_steps=25000 --batch_size=32 " \
    "--learning_rate=0.001 " \
    "--learning_rate_decay_type=fixed " \
    "--save_interval_secs=300 --save_summaries_secs=2 " \
    "--log_every_n_steps=10 " \
    "--optimizer=rmsprop --weight_decay=0.00004"
if __name__ == '__main__':
os.system(cmd)

其中trainable_scopes指定只训练Logits和AuxLogits部分,checkpoint_exclue_scope则是说明Logits和AuxLogits不要保存，这是因为InceptionV3的顶层是包含1001个神经元，而我们的分类只是二分类。

训练模型过程：

使用tensorboard查看训练过程

Losses的结果图：

训练过程中错误解决

报错1：

tensorflow.python.framework.errors_impl.InvalidArgumentError: Cannot assign a device for operation 'InceptionV3/Predictions/Softmax': Could not satisfy explicit device specification '/device:GPU:0' because no supported kernel for GPU devices is available.
         [[Node: InceptionV3/Predictions/Softmax = Softmax[T=DT_FLOAT, _device="/device:GPU:0"](InceptionV3/Predictions/Reshape)]]

解决方法：
把slim文件夹下的train_image_classfier.py最后几行改掉：

    ###########################
    # Kicks off the training. #
    ###########################
    session_config= tf.ConfigProto(allow_soft_placement=True)
    slim.learning.train(
        train_tensor,
        logdir=FLAGS.train_dir,
        master=FLAGS.master,
        is_chief=(FLAGS.task == 0),
        init_fn=_get_init_fn(),
        summary_op=summary_op,
        number_of_steps=FLAGS.max_number_of_steps,
        log_every_n_steps=FLAGS.log_every_n_steps,
        save_summaries_secs=FLAGS.save_summaries_secs,
        save_interval_secs=FLAGS.save_interval_secs,
        sync_optimizer=optimizer if FLAGS.sync_replicas else None,
        session_config=session_config
)

报错2：

InvalidArgumentError (see above for traceback): Assign requires shapes of both tensors to match. lhs shape= [2] rhs shape= [1001]

解决方法：
检查 --checkpoint_exclude_scopes 参数名以及参数值是否正确，本人一开始把exclude写成了execlue就报错了。

验证(测试)模型

因为Kagggle给的数据里面test数据是没有标注好的，因此我们得从train中划分一部分数据出来做验证或测试用，这部分数据就是刚刚划分出来的validation。
在训练25000个step,共计1小时后，我们对模型进行验证。

验证脚本：
代码见main.py

cmdValid="python eval_image_classifier.py " \
         "--checkpoint_path=dogsVScats/train_dir " \
         "--eval_dir=dogsVScats/eval_dir " \
         "--dataset_name=dogsVScats " \
         "--dataset_split_name=validation " \
         "--dataset_dir=dogsVScats/data " \
         "--model_name=inception_v3"
if __name__ == '__main__':
    #os.system(cmd)
os.system(cmdValid)

验证结果：

在训练25000个step后,在5000个图片中的验证结果为：
Recall_5: 100 %,说明所有的狗样本都被找到.
Accuracy:95.54%,

实验总结

本实验通过猫狗分类的实例来体会如何使用Slim框架来对预训练模型进行微调。使用Slim框架进行微调的主要步骤就是提前准备好TF-Record的训练集验证集数据，同时在datasets目录下注册新的数据集。

剩下的模型微调就只是调用train_image_classfier.py脚本，然后根据需要设置不同参数而已。

一开始本人的疑惑在于InceptionV3都是一个1001分类的模型，如何使用这个预训练好的模型对猫狗二分类进行分类呢？后面发现是在train_image_classfier脚本运行过程中指定trainable_scopes和checkpoint_exclude_scope来实现的。正如官方文档写的那样:
When fine-tuning a model, we need to be careful about restoring checkpoint weights. In particular, when we fine-tune a model on a new task with a different number of output labels, we wont be able restore the final logits (classifier) layer. For this, we’ll use the --checkpoint_exclude_scopes flag. This flag hinders certain variables from being loaded. When fine-tuning on a classification task using a different number of classes than the trained model, the new model will have a final ‘logits’ layer whose dimensions differ from the pre-trained model. For example, if fine-tuning an ImageNet-trained model on Flowers, the pre-trained logits layer will have dimensions [2048 x 1001] but our new logits layer will have dimensions [2048 x 5]. Consequently, this flag indicates to TF-Slim to avoid loading these weights from the checkpoint.

当微调模型的时候，我们要十分慎重的选择载入哪些权重。因为猫狗分类是2个输出，而InceptionV3是1001个输出，我们不能载入最后一个分类层的参数，而—checkpoint_exclude_scopes就是起得这个作用,它会显式在载入预训练模型时不去加载最后一层的值，而是使用slim的初始值。

Redis+Caffeine双层缓存策略对比与实践指南浅沫云归后端技术栈小结 Redis Caffeine 缓存
Redis+Caffeine双层缓存策略对比与实践指南在高并发场景下，缓存是提升系统性能和并发处理能力的关键手段。常见的缓存方案包括远程缓存（如Redis）和本地缓存（如Caffeine）。单层缓存各有优劣，结合两者优势的双层缓存架构已成为生产环境中的最佳实践。本文将基于SpringBoot，从方案对比分析出发，深入探讨Redis、本地Caffeine与双层缓存的实现与性能差异，并给出选型建议与实
【机器学习|学习笔记】组合特征（Feature Combinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。努力毕业的小土博^_^ 机器学习学习笔记机器学习学习笔记人工智能神经网络深度学习
【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达能力的有效手段。文章目录【机器学习|学习笔记】组合特征（FeatureCombinations）是提升模型性能、挖掘特征交互信息、增强非线性表达
python中的logger包的详细使用教程 SunkingYang #python入门之日志使用 python 日志 logger 使用方法说明
文章目录功能说明一、Logger的创建与基础配置二、Handler的配置与使用三、Formatter自定义日志格式四、记录不同级别的日志五、高级配置与最佳实践六、常见问题与调试使用方法一、基础配置与快速使用二、自定义Logger对象三、高级用法四、最佳实践与注意事项五、实际应用场景示例Python的logging模块是标准库中用于记录日志的核心工具，通过灵活配置可实现多级别、多目标、多格式的日志管
【前端】【数字孪生】基础知识：数字孪生 3D 模型去哪里找？Three.js 辅助组件库有哪些？模型的动画是黑盒吗？怎么控制？患得患失949 数字孪生前端 3d javascript
前端数字孪生全解：Vue与Three.js的最佳实践、3D模型网站推荐、自带动画控制详解在数字孪生（DigitalTwin）和三维可视化逐渐成为前端热点的今天，很多开发者开始转向WebGL+前端框架的集成实践，最常见的组合包括：React+Three.js（通过@react-three/fiber与@react-three/drei）Vue+Three.js（本文重点）本文将从以下几个维度全面解析
云原生AI研发体系建设路径 TechVision大咖圈人工智能云原生人工智能云原生AI研发体系
当AI遇上云原生，就像咖啡遇上牛奶，总能擦出不一样的火花☕️文章目录引言：为什么要建设云原生AI研发体系整体架构设计：搭建AI研发的"乐高积木"技术栈选择：选择合适的"武器装备"开发流程设计：从代码到生产的"高速公路"部署运维策略：让AI应用"稳如老狗"监控治理体系：AI应用的"健康管家"总结：建设路径与最佳实践引言：为什么要建设云原生AI研发体系在这个AI满天飞的时代，如果你还在用传统的方式搞A
R语言的软件开发工具纪霁然包罗万象 golang 开发语言后端
R语言的软件开发工具引言R语言因其强大的数据分析能力和丰富的统计包，自发布以来便广受欢迎。随着数据科学和分析的迅猛发展，R语言也逐渐成为数据分析、机器学习和统计建模领域的重要工具。为了更好地利用R语言进行软件开发，许多软件开发工具和环境应运而生。本文将深入探讨R语言的主要开发工具，帮助开发者更高效地进行数据处理和分析。1.R和RStudio基础R语言本身是一个用于统计计算和图形绘制的编程语言，而R
目标检测：从基础原理到前沿技术全面解析随机森林404 计算机视觉目标检测人工智能计算机视觉
引言在计算机视觉领域，目标检测是一项核心且极具挑战性的任务，它不仅要识别图像中有什么物体，还要确定这些物体在图像中的具体位置。随着人工智能技术的快速发展，目标检测已成为智能监控、自动驾驶、医疗影像分析等众多应用的基础技术。本文将全面介绍目标检测的基础概念、发展历程、关键技术、实践应用以及未来趋势，为读者提供系统性的知识框架。第一章目标检测概述1.1目标检测的定义与重要性目标检测（ObjectDet
＜数据结构＞链表实战之单链表与双链表的增删改查叶落秋白数据结构与课程设计 c语言开发语言链表 visualstudio
✅作者简介：一名即将大三的计科专业学生，为C++，Java奋斗中✨个人主页：叶落秋白的主页系列专栏：数据结构干货分享推荐一款模拟面试、刷题神器进入刷题的世界前言上篇博客分享了创建链表传入二级指针的细节，那么今天就分享几个c语言课程实践设计吧。这些程序设计搞懂了的话相当于链表的基础知识牢牢掌握了，那么再应对复杂的链表类的题也就能慢慢钻研了。学习是一个积累的过程，想要游刃有余就得勤学苦练！目录单链表的
《ARM64 迁移深度实战：在飞腾 D2000+ 麒麟 V10 构建高可用全栈环境》 2301_82150492 python c++c语言 c#
从源码编译优化到容器跨架构迁移|附自研文档转换工具开发全记录目录（带锚点）环境深度适配：飞腾芯片+KylinOS安全内核特性基础组件迁移（源码级优化）2.1JDK17GraalVMARM编译指南（性能提升40%）2.2MySQL8.0深度适配（解决麒麟安全模块冲突）2.3Redis7.0内存池优化（ARMNUMA架构调优）容器化迁移企业级实践3.1Docker离线安装+麒麟内核模块编译3.2构建多
React Native 接入 eCharts 1234Wu #React react native react.js javascript
ReactNative图表接入指南概述本文档详细介绍了在ReactNative项目中接入ECharts图表的完整步骤，包括依赖安装、组件配置、数据获取、图表渲染等各个环节。目录1.环境准备2.依赖安装3.图表组件创建4.数据获取Hook5.图表配置6.组件集成7.国际化支持8.最佳实践9.常见问题1.环境准备1.1项目要求ReactNative0.76.9+ExpoSDK52+TypeScript
【1.5 漫画TiDB分布式数据库】
漫画TiDB分布式数据库‍小明：“老王，TiDB作为NewSQL数据库，它是如何既保证ACID又实现水平扩展的？”‍♂️架构师老王：“TiDB是PingCAP开发的分布式关系数据库，它将传统数据库的ACID特性与NoSQL的扩展性完美结合！让我们深入了解这个’钛’级数据库！”目录TiDB核心架构分布式事务原理SQL兼容性集群部署管理性能优化Java集成实战最佳实践️TiDB核心架构三层架构设计┌─
【领码思考】ESG画卷里的项目管理新篇：AI赋能下的绿色智造之路领码科技央国企理念篇 AI应用人工智能 ESG 项目管理 AI赋能绿色转型可持续发展
摘要ESG（环境、社会、治理）理念正悄然融入项目管理的每个细胞，成为驱动项目成功的新引擎。本文聚焦ESG如何与项目管理深度融合，立体呈现各阶段ESG应用场景，围绕AI与数字化工具的协同赋能，解析项目经理如何在绿色转型中实现角色跃迁。通过流程图与表格精炼框架，强化理论指导与实践操作，并结合当下热点新技术，旨在为项目团队和企业管理层提供清晰可落地的全周期ESG实施路径，开启项目管理可持续发展的智慧新纪
Kotlin 与移动开发的无缝对接秘籍移动开发前沿 kotlin 开发语言 android ai
Kotlin与移动开发的无缝对接秘籍关键词：Kotlin、移动开发、Android、iOS、跨平台开发、协程、JetpackCompose摘要：本文深入解析Kotlin在移动开发领域的核心优势与实践方法，通过剖析Kotlin语言特性、跨平台架构、与原生生态的深度集成（如AndroidJetpack和iOSSwift互操作）、异步编程模型（协程）等关键技术，结合完整的项目实战案例，展示如何利用Kot
Go CLI工具开发：自动化测试与持续集成方案 Golang编程笔记 golang ci/cd 开发语言 ai
GoCLI工具开发：自动化测试与持续集成方案关键词：GoCLI、自动化测试、持续集成、GitHubActions、单元测试、集成测试、代码覆盖率摘要：本文将深入探讨如何使用Go语言开发健壮的CLI工具，并为其构建完整的自动化测试和持续集成方案。我们将从基础测试策略开始，逐步深入到复杂的集成测试场景，最后展示如何利用GitHubActions实现自动化构建和部署。通过实际代码示例和最佳实践，帮助开发
GitHub Actions × AWS 集成终极指南：从零构建安全高效的CI/CD流水线 ivwdcwso 运维与云原生 github aws 安全 GitHub Actions DevOps CI/CD
引言：云原生时代的自动化革命在DevOps实践中，GitHubActions与AWS的深度集成已成为现代应用交付的黄金标准。这种组合让开发者能够：✅实现端到端自动化：从代码提交到生产部署的全流程自动化内置企业级安全：通过OIDC消除密钥泄露风险优化资源成本：按执行分钟计费，无闲置资源浪费加速迭代速度：将部署时间从小时级缩短至分钟级本文将全面解析最佳实践、安全策略和高级技巧，助您构建工业级CI/CD
Python 领域 Conda 的集群环境部署经验
Python领域Conda的集群环境部署经验关键词：Conda、Python环境管理、集群部署、环境复制、依赖管理、虚拟环境、Anaconda摘要：本文深入探讨了在集群环境中使用Conda进行Python环境部署的最佳实践。我们将从Conda的核心概念出发，详细讲解环境创建、依赖管理、环境复制和集群部署的全流程。文章包含实际案例、性能优化技巧和常见问题解决方案，旨在帮助读者掌握高效、可靠的Pyth
Python pip与Conda环境的兼容性问题
Pythonpip与Conda环境的兼容性问题关键词：Python环境管理、pip与conda冲突、依赖解析、虚拟环境、包管理、兼容性解决方案、依赖冲突摘要：本文深入探讨Python生态中pip和conda两种主流包管理工具的兼容性问题。我们将从底层机制分析冲突根源，通过具体案例展示常见问题场景，并提供多种解决方案和最佳实践。文章包含详细的依赖解析算法分析、环境隔离技术比较，以及通过实际代码演示如
bean注入的过程中，Property of ‘java.util.ArrayList‘ type cannot be injected by ‘List‘
一、问题在spring实践bean注入ArrayList属性的时候报错：Propertyof‘java.util.ArrayList’typecannotbeinjectedby‘List’二、原因分析在尝试将Spring配置中的注入到一个ArrayList类型的属性时出现了类型不匹配问题。核心问题在于：Spring的标签创建的是java.util.LinkedList，而属性声明为java.ut
AI大模型如何重塑软件开发流程？真实的菜活动人工智能
AI大模型如何重塑软件开发流程？文章摘要随着ChatGPT、Claude等AI大模型的快速发展，软件开发行业正经历着前所未有的变革。本文深入探讨了AI技术如何重塑传统的软件开发流程，分析了开发者角色的转变，并提供了拥抱AI时代的实践指南。核心观点AI大模型将开发者角色从"编码者"转变为"设计师"需求分析、代码生成、测试等环节将实现智能化新技能需求：AI工具使用、提示工程、跨领域整合未来趋势：低代码
结合创新idea：机器学习+运筹优化=CCF高端局 Ai多利机器学习人工智能
2024深度学习发论文&模型涨点之——机器学习+运筹优化机器学习是人工智能的一个分支，它使计算机系统能够从数据中学习并改进其性能，而无需进行明确的编程。运筹优化，也称为运筹学或运营管理，是应用数学的一个分支，它使用数学模型和算法来支持复杂决策过程的制定。机器学习与运筹优化的结合是一个前沿且活跃的研究领域，它们相互补充，为解决复杂问题提供了新的思路和方法。小编整理了一些机器学习+运筹优化【论文+代码
JVM类加载系统详解：深入理解Java类的生命周期真实的菜 jvm jvm java 开发语言
JVM类加载系统详解：深入理解Java类的生命周期目录类加载机制类加载的生命周期类加载器分类‍‍‍双亲委派模型原理与作用️自定义类加载器自定义类加载器的实现步骤打破双亲委派模型的场景与案例性能优化与最佳实践总结类加载机制类加载机制是JVM的核心功能之一，它负责将Java类文件加载到内存中并转换为可执行的字节码。理解类加载机制对于Java开发者来说至关重要。类加载的生命周期类加载的完整生命周期包含七
动手实践OpenHands系列学习笔记12：测试与质量保证 JeffWoodNo.1 笔记
笔记12：测试与质量保证一、引言软件测试和质量保证是确保AI代理系统可靠性和稳定性的关键环节。对于像OpenHands这样的复杂AI系统，测试尤其具有挑战性，因为需要验证系统在各种条件下的行为一致性。本笔记将探讨AI系统测试的独特策略，分析OpenHands的测试需求，并通过实践为关键模块构建测试套件。二、AI系统测试策略理论2.1AI系统测试的特殊挑战不确定性处理：AI系统输出可能存在固有的不确
如何保证前端价格与后端最终价格一致：机制、架构与实践 nbsaas-boot 状态模式
在一个价格复杂、优惠叠加、规则动态的系统中，“前端展示价格”和“后端结算价格”出现不一致的情况，是非常常见且影响巨大的问题。这不仅会造成客户投诉、信任下降，还可能引发退款损失、财务对账错误、法务风险。本文系统性探讨：如何设计机制，保证前端价格≈后端最终成交价格，做到一致、安全、可溯源。一、典型场景与问题场景产生的风险客户看到是89.9元，提交订单后变成99.9元用户信任受损，投诉率高前端使用旧规则
动手实践OpenHands系列学习笔记11：现代开发流程
笔记11：现代开发流程一、引言现代软件开发流程是确保高质量代码交付和团队协作的关键基础。随着软件开发复杂度的增加，自动化工具链和规范化流程变得尤为重要。本笔记将探讨CI/CD管道设计原理，分析OpenHands项目的开发流程，并通过实践搭建一个简化版的OpenHands开发环境。二、CI/CD管道设计理论2.1持续集成(CI)基本概念定义：频繁地将代码集成到主分支，并自动化验证每次集成核心原则：频
【LangChain编程：从入门到实践】LangChain与其他框架的比较 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】LangChain与其他框架的比较1.背景介绍1.1人工智能发展现状在当今时代，人工智能(AI)已经成为科技领域中最热门和最具革命性的话题之一。随着计算能力的不断提升和算法的持续优化,AI系统正在不断扩展其应用范围,包括自然语言处理、计算机视觉、决策系统等各个领域。1.2LangChain概述在这种背景下,LangChain作为一个新兴的AI框架应运而生。L
Jupyter安装指南及Python配置 CodeWG python jupyter ide Python
Jupyter是一个非常流行的交互式计算环境，广泛用于数据分析、机器学习和科学计算等领域。本文将详细介绍如何安装Jupyter并配置Python环境。步骤1：安装Python首先，我们需要安装Python。请按照以下步骤进行操作：打开Python官方网站（https://www.python.org）并下载适用于您操作系统的最新版本的Python。运行下载的安装程序，并按照向导的指示进行安装。在安
Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Python（28）Python循环语句指南：从语法糖到CPython字节码的底层探秘一个天蝎座白勺程序猿 Python爬虫入门到高阶实战 python 开发语言
目录引言一、推导式家族全解析1.1基础语法对比1.2性能对比测试二、CPython实现揭秘2.1字节码层面的秘密2.2临时变量机制三、高级特性实现3.1嵌套推导式优化3.2条件表达式处理四、性能优化指南4.1内存使用对比4.2执行时间优化技巧五、最佳实践建议六、总结Python爬虫相关文章（推荐）引言在Python编程中，循环语句是控制流程的核心工具。传统for循环虽然直观，但在处理大数据时往往面
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
站酷基于服务网格ASM的生产实践
作者：服务网格ASM背景介绍站酷（ZCOOL）2006年8月创立于北京，深耕设计领域多年，聚集了1500万设计师、摄影师、插画师、艺术家、创意人，在设计创意群体中具有一定的影响力与号召力。站酷在创立之初，就以“让设计更有价值”为自身使命，多年来，一直致力于打造以原创设计为核心的“站酷原创版权生态体系”。目前站酷旗下除拥有主站设计师互动平台「站酷网」之外，还重点打磨了一站式正版视觉内容交易平台——「
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

Tensorflow——使用预训练模型进行 猫狗 图像分类

前言