岳麓吹雪

深度学习8：Cats vs. Dogs实例学习

今天学习了油管up主KevinRush的教程Cats vs. Dogs（只找到油管地址），还找到了Maples丶丶的博客，感谢这位大神，写的很详细，这里参考大神的博客记录一下学习笔记。

数据集可以从Kaggle官网上下载：https://www.kaggle.com/c/dogs-vs-cats
代码见：http://blog.csdn.net/c20081052/article/details/76376688

工程分为input_data.py，model.py和training.py三部分。其中重点介绍第一部分。

1. input_data.py

分为三部分：获取数据集划分标签get_files()，分批次get_batch()和测试Test。

1.1 get_files()

Kaggle提供的数据集包含了猫和狗图片各12500幅，都是以cat.<数字>.jpg或dog.<数字>.jpg命名，因此可以根据文件名分类打标签。get_files()就是用于读取数据集，根据文件名，对数据集打标签，以列表形式返回图片和标签。

主要流程：
1.读取数据集，根据文件名，分成cat和dog两类图片和标签。这里cat和dog各有12500幅图片。
2.使用np.hstack()将cat和dog的图片和标签整合为列表image_list和label_list，image_list和label_list的大小均为25000。
3.将image_list和label_list合并，存放在temp中，此时temp的大小为2x25000。对temp进行转置，temp的大小变为25000x2。
4.使用np.random.shuffle()打乱图片和标签。
5.从temp中取出乱序后的image_list和label_list列向量并返回。

代码如下：

#读取数据和标签
def get_files(file_dir):              
    cats = []
    label_cats = []
    dogs = []
    label_dogs = []
    for file in os.listdir(file_dir):   #返回文件名
        name = file.split(sep='.')      #文件名按.分割
        if name[0]=='cat':              #如果是cat，标签为0，dog为1
            cats.append(file_dir + file)
            label_cats.append(0)
        else:
            dogs.append(file_dir + file)
            label_dogs.append(1)
    print('There are %d cats\nThere are %d dogs' %(len(cats), len(dogs)))   #打印猫和狗的数量

    image_list = np.hstack((cats, dogs))
    label_list = np.hstack((label_cats, label_dogs))

    temp = np.array([image_list, label_list])
    temp = temp.transpose()
    np.random.shuffle(temp)             #打乱图片

    image_list = list(temp[:, 0])
    label_list = list(temp[:, 1])
    label_list = [int(i) for i in label_list]          #将label_list中的数据类型转为int型

    return image_list, label_list

1.2 get_batch()

由于数据集较大，需要分批次通过网络。get_batch()就是用于将图片划分批次。

主要流程：
1.image和label为list类型，转换为TensorFlow可以识别的tensor格式。
2.使用tf.train.slice_input_producer()将image和label合并生成一个队列，然后从队列中分别取出image和label。其中image需要使用tf.image.decode_jpeg()进行解码，由于图片大小不统一，使用tf.image.resize_image_with_crop_or_pad()进行裁剪/扩充，最后使用tf.image.per_image_standardization()进行标准化，此时的image的shape为[208 208 3]。
3.因为之前已经进行了乱序，使用tf.train.batch()生成批次，最后得到的image_batch和label_batch的shape分别为[1 208 208 3]和[1]。
4.这里原作者代码中对label_batch又进行reshape，是多余的，删除后无影响。最终返回image_batch和label_batch。

Maples丶丶的博客提到，原代码的get_batch()中使用tf.image.resize_image_with_crop_or_pad效果欠佳，这种方法是从图像中心向四周裁剪，当图片超过规定尺寸时，只保留规定尺寸的中心区域，就会造成裁剪后的图片中只有狗或猫的一部分躯干，如下图，影响最终的训练结果。

因此Maples丶丶提出的使用tf.image.resize_images直接对图片进行缩放来解决这个问题，但缩放后图片没有保持纵横比，造成了比例失调如下图。

我这里使用的还是KevinRush的代码。由于现在不知道对比方法的优劣，待学习之后会对两种情况进行对比测试，在做具体分析。

代码如下：

#将图片分批次
def get_batch(image, label, image_W, image_H, batch_size, capacity):
    ''''' 
    Args: 
        image: list type 
        label: list type 
        image_W: image width 
        image_H: image height 
        batch_size: batch size 
        capacity: the maximum elements in queue 
    Returns: 
        image_batch: 4D tensor [batch_size, width, height, 3], dtype=tf.float32 
        label_batch: 1D tensor [batch_size], dtype=tf.int32 
    '''  
    #image和label为list类型，需要进行数据类型转换
    image = tf.cast(image, tf.string)   
    label = tf.cast(label, tf.int32)


    # make an input queue 把image和label合并生成一个队列
    input_queue = tf.train.slice_input_producer([image, label])

    label = input_queue[1]      #读取label
    image_contents = tf.read_file(input_queue[0])               #读取图片
    image = tf.image.decode_jpeg(image_contents, channels=3)    #解码图片

    ######################################
    # data argumentation should go to here
    ######################################

    # 因为图片大小不一致，需要进行裁剪/扩充
    image = tf.image.resize_image_with_crop_or_pad(image, image_W, image_H)

    # 按照原代码使用标准化报错，注释掉运行正常
    # image = tf.image.per_image_standardization(image)   #标准化

    image_batch, label_batch = tf.train.batch([image, label],   #生成批次
                                                batch_size= batch_size,
                                                num_threads= 64, 
                                                capacity = capacity)

    #you can also use shuffle_batch 
#    image_batch, label_batch = tf.train.shuffle_batch([image,label],
#                                                      batch_size=BATCH_SIZE,
#                                                      num_threads=64,
#                                                      capacity=CAPACITY,
#                                                      min_after_dequeue=CAPACITY-1)

    # 这一步多余，删除无影响
    # label_batch = tf.reshape(label_batch, [batch_size])  

    return image_batch, label_batch

1.3 Test

这部分代码就是调用测试get_files()和get_batch()，看是否能正常读取图片和分批次。

import matplotlib.pyplot as plt

BATCH_SIZE = 2
CAPACITY = 256
IMG_W = 208
IMG_H = 208

train_dir = 'D:/Test/Cats_vs_Dogs/data/train/'   
image_list, label_list = get_files(train_dir)   #读取数据和标签
image_batch, label_batch = get_batch(image_list, label_list, IMG_W, IMG_H, BATCH_SIZE, CAPACITY)    #将图片分批次

with tf.Session() as sess:
    i = 0
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(coord=coord)

    try:
        while not coord.should_stop() and i<1:

            img, label = sess.run([image_batch, label_batch])

            # just test one batch
            for j in np.arange(BATCH_SIZE):
                print('label: %d' %label[j])  #j-index of quene of Batch_size
                plt.imshow(img[j,:,:,:])
                plt.show()
            i+=1

    except tf.errors.OutOfRangeError:
        print('done!')
    finally:
        coord.request_stop()
    coord.join(threads)

input_data.py到这就结束了，下面将对后边的两个部分进行学习。

2. model.py

在model.py中构造卷积神经网络模型结构。其中定义了四个函数：inference()（构造CNN模型），losses()（loss损失值优化），trainning()（训练），evaluation（评价/准确率计算）。

其中重点是inference，仿照TensorFlow官网例程cifar-10构造了一个简单模型，包含卷积+池化层x2，全连接层x2，1个softmax层。这种简单的卷积神经网络在之前已经学习过了，这里不具体分析代码了，详细可参考http://blog.csdn.net/xinyu3307/article/details/74943033。

3. training.py

这一部分主要用于训练和单图测试。其中定义了三个函数：run_training()（训练），get_one_image()（获取单张图片），evaluate_one_image（对单张图片进行分类）。

3.1 run_training()

用于训练模型，其中用到了Tensorboard相关的函数，记录训练模型数据。

考虑到训练中意外中断，我在这里加入了一个可选的恢复模型继续训练的操作，用到的就是模型的保存和恢复。

推荐阅读
https://mp.weixin.qq.com/s?__biz=MzI2NzI2OTExNA%3D%3D&mid=2247483960&idx=1&sn=a01fb83443c1a6537f3c9aa5801085f2&chksm=ea8024adddf7adbb66de772f394eaec1fcdf6a81598ae6a8798c060e8938361a387d35d8a103

模型的保存是通过tf.train.Saver()实现的：
1.首先需要创建一个Saver对象：saver = tf.train.Saver()，详细学习推荐阅读https://www.cnblogs.com/denny402/p/6940134.html。
2.保存模型或checkpoint：saver.save(sess, checkpoint_path, global_step=step)。

模型的恢复是通过restore()实现的：

            ckpt = tf.train.get_checkpoint_state(logs_train_dir) #检查checkpoint
            if ckpt and ckpt.model_checkpoint_path:
                global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]  #获取已训练step数
                saver.restore(sess, ckpt.model_checkpoint_path)  #恢复模型
                print('Loading success, global_step is %s' % global_step)

这里由于是每2000步保存一次，checkpoint名字中会带有已训练步数，因此可以直接提取出来赋给global_step，当global_step小于MAX_STEP时，会继续训练直到MAX_STEP。

#%%
def run_training():

    # you need to change the directories to yours.
    # 训练数据集路径
    train_dir = 'D:/Test/Cats_vs_Dogs/data/train/'    
    # 训练模型存储路径
    logs_train_dir = 'D:/Test/Cats_vs_Dogs/logs/train'
    train, train_label = input_data.get_files(train_dir)

    # 分批次
    train_batch, train_label_batch = input_data.get_batch(train,
                                                          train_label,
                                                          IMG_W,
                                                          IMG_H,
                                                          BATCH_SIZE, 
                                                          CAPACITY)  
    # 设置训练模型参数    
    train_logits = model.inference(train_batch, BATCH_SIZE, N_CLASSES)
    train_loss = model.losses(train_logits, train_label_batch)        
    train_op = model.trainning(train_loss, learning_rate)
    train__acc = model.evaluation(train_logits, train_label_batch)

    summary_op = tf.summary.merge_all()
    sess = tf.Session()
    train_writer = tf.summary.FileWriter(logs_train_dir, sess.graph)
    saver = tf.train.Saver()

    sess.run(tf.global_variables_initializer())
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)

    # 训练
    try:
        if istrain == 1:
            for step in np.arange(MAX_STEP):
                if coord.should_stop():
                        break
                _, tra_loss,tra_acc= sess.run([train_op, train_loss, train__acc])

                #每50步打印失真和准确率   
                if step % 50 == 0:
                    print('Step %d, train loss = %.2f, train accuracy = %.2f%%' %(step, tra_loss, tra_acc*100.0))
                    summary_str = sess.run(summary_op)
                    train_writer.add_summary(summary_str, step)

                #每2000步保存一下model
                if step % 2000 == 0 or (step + 1) == MAX_STEP:
                    checkpoint_path = os.path.join(logs_train_dir, 'model.ckpt')
                    saver.save(sess, checkpoint_path, global_step=step)

        else:
            #读取checkpoint恢复模型
            print("Reading checkpoints...")
            ckpt = tf.train.get_checkpoint_state(logs_train_dir)
            if ckpt and ckpt.model_checkpoint_path:
                global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]
                saver.restore(sess, ckpt.model_checkpoint_path)
                print('Loading success, global_step is %s' % global_step)
                flag = 1
            else:
                print('No checkpoint file found')
            #继续训练
            if flag == 1:
                for step in np.arange(int(global_step),int(global_step)+MAX_STEP):
                    if coord.should_stop():
                       break
                    _, tra_loss,tra_acc= sess.run([train_op, train_loss, train__acc])
                    if step % 50 == 0:
                        print('Step %d, train loss = %.2f, train accuracy = %.2f%%' %(step, tra_loss, tra_acc*100.0))
                        summary_str = sess.run(summary_op)
                        train_writer.add_summary(summary_str,step)

                    if (step+1) % 2000 == 0 or (step+ 1) == MAX_STEP:
                         checkpoint_path = os.path.join(logs_train_dir, 'model.ckpt')
                         saver.save(sess, checkpoint_path, global_step=step+1)

    except tf.errors.OutOfRangeError:
        print('Done training -- epoch limit reached')
    finally:
        coord.request_stop()

    coord.join(threads)
    sess.close()

3.2 get_one_image()

用于在训练集中随机选取一张图片并展示。

代码如下：

def get_one_image(train):
    '''Randomly pick one image from training data
    Return: ndarray
    '''
    n = len(train)      #训练集长度
    ind = np.random.randint(0, n)   #生成随机数
    img_dir = train[ind]    #从训练集中提取选中的图片


    image = Image.open(img_dir)
    plt.imshow(image)   #显示图片
    image = image.resize([208, 208])
    image = np.array(image)
    return image

3.3 evaluate_one_image()

调用get_one_image从训练集中随机选取一张图片进行分类测试。

注意之前在inference()中最后的softmax层没有加激活函数，logit = tf.nn.softmax(logit)用于增加激活函数。

代码如下：

def evaluate_one_image():
    '''Test one image against the saved models and parameters
    '''

    # you need to change the directories to yours.
    # 数据集路径
    train_dir = 'D:/Test/Cats_vs_Dogs/data/train/'
    train, train_label = input_data.get_files(train_dir)
    image_array = get_one_image(train)      #调用get_one_image随机选取一幅图片并显示

    with tf.Graph().as_default():
        BATCH_SIZE = 1
        N_CLASSES = 2

        image = tf.cast(image_array, tf.float32)
        image = tf.image.per_image_standardization(image)
        image = tf.reshape(image, [1, 208, 208, 3])     #inference输入数据需要是4维数据，需要对image进行resize
        logit = model.inference(image, BATCH_SIZE, N_CLASSES)       
        logit = tf.nn.softmax(logit)    #inference的softmax层没有激活函数，这里增加激活函数

        #因为只有一副图，数据量小，所以用placeholder
        x = tf.placeholder(tf.float32, shape=[208, 208, 3])

        # you need to change the directories to yours.
        # 训练模型路径
        logs_train_dir = 'D:/Test/Cats_vs_Dogs/logs/train'

        saver = tf.train.Saver()

        with tf.Session() as sess:

            # 从指定路径下载模型
            print("Reading checkpoints...")
            ckpt = tf.train.get_checkpoint_state(logs_train_dir)
            if ckpt and ckpt.model_checkpoint_path:
                global_step = ckpt.model_checkpoint_path.split('/')[-1].split('-')[-1]
                saver.restore(sess, ckpt.model_checkpoint_path)
                print('Loading success, global_step is %s' % global_step)
            else:
                print('No checkpoint file found')

            prediction = sess.run(logit, feed_dict={x: image_array})
            # 得到概率最大的索引
            max_index = np.argmax(prediction)
            if max_index==0:
                print('This is a cat with possibility %.6f' %prediction[:, 0])
            else:
                print('This is a dog with possibility %.6f' %prediction[:, 1])

在训练结束后就可以用evaluate_one_image()来测试一下了。运行training.py，然后输入evaluate_one_image()，会显示如下：

当然也有很多判错的情况：

好了，到这里Cats vs. Dogs实例学习就结束了。通过这个学习，算是真正上手自己尝试了一下从读取图片划分批次，到搭建网络，再到训练网络和测试的整体过程，收获不小。

【llm对话系统】RL强化学习的技术演进与RLHF kakaZhui 人工智能 chatgpt llama
一、强化学习基础知识强化学习(ReinforcementLearning,RL)是一种机器学习方法，它通过智能体(Agent)与环境(Environment)的交互来学习如何行动以最大化累积奖励(Reward)。1.核心概念:智能体(Agent):做出决策并采取行动的学习者。环境(Environment):智能体所处的外部世界，对智能体的行动做出反应。状态(State,S):对环境当前情况的描述。
解决elementui的dialog对话框过高会被拖动的bug _best 前端 elementui vue.js javascript
在使用elementUI过程中，当dialog对话元素过多长处浏览器高度是，点击标题就会跳成如下图这样，上方会被遮挡且无法拖动上去：解决方法是通过设置css固定top及left禁止拖动，核心css代码：/deep/.el-dialog{top:15%!important;left:0!important;}
OpenAI掀桌子！免费版ChatGPT，提供o3-mini模型！ TGITCIC AI-大模型的落地之道 chatgpt 人工智能
逆天免费用今天凌晨，OpenAI联合创始人兼首席执行官SamAltman宣布了一个大消息——免费版ChatGPT，将提供o3-mini模型！网页们纷纷不淡定了看来OpenAI，这o3-mini还没正式上线呢，就免费开放使用了。不过还是要感谢一下中国大模型界的开源英雄DeepSeek。正是R1的开源才让OpenAI有了危机感，开始放大福利了。有网友就直接问Altman怎么看待DeepSeek的R1模
龙蜥社区落地开源生态发展合作倡议新进展，推出内核 kABI 和配置统一规范操作系统开源
为共同推动做强做优做大创新操作系统生态，积极响应由龙蜥（OpenAnolis）、开源欧拉（openEuler）、鸥栖（OpenCloudOS）、开放麒麟（openKylin）以及深度（deepin）五大操作系统开源社区联合发起的开源生态发展合作倡议，龙蜥社区在操作系统构建工程落地取得新进展，彰显了龙蜥社区致力于构建一个更加开放、繁荣、安全、高效的全球开源生态系统的坚定承诺。在广泛征求操作系统企业及
【无标题】使用ollama配置本地模型（命令行使用）亭亦青 llama
1.下载ollamaOllama进入官网后，点击下载2.检查是否配置成功输入ollama-h命令3.下载deepseek-r1模型左边选择模型大小，我这里使用1.5b，这里的b指的是一个模型的参数规模，即“billion”（10亿）个参数，通常参数越多，模型的表现潜力也越强。右侧复制命令，在命令行输入就可以了，等待下载完成4.命令行使用本地模型
XQuery 添加元素和属性 fengshou1 node.js
向结果添加元素和属性正如在前面一节看到的，我们可以在结果中引用输入文件中的元素和属性：for$xindoc("books.xml")/bookstore/book/titleorderby$xreturn$x上面的XQuery表达式会在结果中引用title元素和lang属性，就像这样：EverydayItalianHarryPotterLearningXMLXQueryKickStart以上XQu
CVPR 2024 人脸方向总汇（人脸识别、头像重建、人脸合成和3D头像等）点云SLAM 图形图像处理深度学习计算机视觉 3D人脸人脸识别头像重建
1、Face(人脸)UnsupervisedGazeRepresentationLearningfromMulti-viewFaceImagesToonerGAN:ReinforcingGANsforObfuscatingAutomatedFacialIndexingPairDETR:JointDetectionandAssociationofHumanBodiesandFacesNeuralIm
《DeepSeek R1：开源大模型的破局者》空云风语神经网络人工智能深度学习人工智能开源
惊爆！中国开源大模型震撼登场在人工智能领域的激烈竞争中，一场震撼全球的技术革命正悄然发生。2025年1月20日晚，一家来自中国的人工智能初创公司——DeepSeek（深度求索），如同一颗耀眼的新星，划破了AI世界的夜空，发布了其最新推理模型DeepSeek-R1正式版。这一消息迅速在全球范围内引发了轩然大波，犹如巨石投入平静的湖面，激起千层浪。消息一经传出，各大科技媒体纷纷将其置于头条位置，相关报
利用MMDetection进行模型微调和权重初始化 MickeyCV 目标检测深度学习目标检测计算机视觉 python
目录模型微调修改第一处：更少的训练回合Epoch修改第二处：更小的学习率LearningRate修改第三处：使用预训练模型权重初始化实际使用案例init_cfg的具体使用规则初始化器配置汇总本文基于MMDetection官方文档，对模型微调和权重初始化进行第三方讲解。模型微调在COCO数据集上预训练的检测器可以作为其他数据集优质的预训练模型。微调超参数与默认的训练策略不同。它通常需要更小的学习率和
自主学习与自然语言处理的融合：实现更智能的聊天机器人 AI天才研究院 LLM大模型落地实战指南大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍自主学习（autonomouslearning）是一种学习方法，它允许机器人或计算机系统在没有人类干预的情况下自行学习和改进。自主学习可以帮助机器人或计算机系统更好地适应新的环境和任务，提高其智能性和效率。自然语言处理（naturallanguageprocessing，NLP）是计算机科学和人工智能领域的一个分支，它涉及计算机如何理解、处理和生成人类语言。自主学习与自然语言处理的融合
英伟达DeepStream学习笔记39———使用netplan固定ip 翟羽嚄英伟达TX2 /Xavier /deepstream开发学习 linux 运维
英伟达DeepStream学习笔记39———使用netplan固定ip简介●介绍Netplan是一个在linux系统上轻松配置网络的实用工具。您只需创建所需网络接口的YAML描述以及每个接口应配置的功能。根据此描述，Netplan将为您选择的渲染器工具生成所有必要的配置。●原理Netplan从/etc/Netplan/*.yaml读取网络配置，这些文件由管理员、安装人员、云映像实例化或其他操作系统
Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
一文读懂：AI 工具 Cursor、DeepSeek 和 Copilot 的区别与使用方法 AI云极【AI智能系列】人工智能 copilot
在人工智能技术迅猛发展的今天，各类AI工具层出不穷，为编程、搜索、写作等领域带来了极大的便利。今天，我们将深入介绍三款备受瞩目的AI工具：Cursor、DeepSeek和Copilot。它们各有特色，适合不同场景。想知道它们之间有哪些区别？又该如何使用？一起往下看！一、什么是Cursor、DeepSeek和Copilot？1.CursorCursor是一款专为程序员打造的智能代码编辑工具，结合AI
蓝桥杯真题 - 翻转 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3520/learning/个人评价：难度1星（满星：5）前置知识：无整体思路贪心，除了第一位跟最后一位，其它字符，每当S[i]≠T[i]S[i]\neqT[i]S[i]=T[i]时，能换则换；为什么可以贪心？因为如果某段连续的数字为101101101或者010010010，在被修改之后变为111111111或者00000
蓝桥杯真题 - 三国游戏 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3518/learning/个人评价：难度2星（满星：5）前置知识：贪心整体思路先假设魏蜀吴中的某一个势力最终获胜的情况下，如何求出事件发生的最大数量，最后枚举三个势力获胜的情况取最大值就是答案；假设魏国最终胜利，那最好是让已发生的事件中AiA_iAi的和尽可能大于Bi+CiB_i+C_iBi+Ci的和，大得越多越优先选择让
【AI工具】夸克AI试用：分析DeepSeek-V3技术报告 bylander AI工具 AI学习 AI论文阅读人工智能学习 gpt
安装了夸克AI，试用了一下AI总结功能，导入了DeepSeekV3的技术报告，使用了文章总结、问题提问、脑图、大纲等功能还不错，尤其是几个问题提问，回答的都不错，而且数学公司都是标准的markdown格式，不乱码，这一点就比其他的AI工具强。下面是分析的具体内容》AI文件总结DeepSeek-V3技术报告分析报告引言DeepSeek-V3是一个拥有6710亿参数的专家混合（MoE）语言模型，每次生
总结8.. 挽清和 c语言
#include//定义结构体表示二叉树节点，包含左右子节点编号structnode{intl;intr;}tree[100000];//全局变量记录二叉树最大深度，初始为0intans=0;//深度优先搜索函数//pos:当前节点在数组中的位置，deep:当前深度voiddfs(intpos,intdeep){//若为叶子节点if(tree[pos].l==0&&tree[pos].r==0){
el-tree，父节点的复选框不显示 timoingff 前端 javascript html
对父节点的选择框禁用关键代码：computed:{defaultProps(){return{children:'children',label:'label',disabled:(data,node)=>{//isDir-判断是否为父节点returndata&&data.isDir}}}}//取消禁用样式/deep/[aria-disabled=true]>.el-tree-node__cont
组会20220616 m0_61799349 研究生组会深度学习计算机视觉神经网络
安装、使用Ubuntu系统花费了一定的时间2.看结肠镜息肉检测的论文wang.改进DeepLabv3+网络的肠道息肉分割方法[J].计算机科学与探索.2020.14(7):1673-9418Jhaetal.,"ResUNet++:AnAdvancedArchitectureforMedicalImageSegmentation,"2019IEEEInternationalSymposiumonMu
深度ResUnet与ResUnet++：新一代的语义分割神器倪澄莹George
深度ResUnet与ResUnet++：新一代的语义分割神器去发现同类优质开源项目:https://gitcode.com/在这个数据驱动的时代，深度学习模型在图像处理领域展现出了强大的潜力，尤其是在语义分割任务中。今天，我们向您推荐一个基于PyTorch实现的开源项目——DeepResUnet和ResUnet++。这两个模型源自于学术界的最新研究，旨在提高图像分割的准确性和效率。项目介绍这个开源
医学类使用TransUNet、UNet、DeepLabV3+、HRNet、PSPNet 模型对息肉分割数据集进行训练、评估和可视化 EDD2020息肉数据集分割数据集计算机C9硕士_算法工程师数据集语义分割医学类数据集语义分割息肉 TransUNet UNet
息肉数据集/息肉瘤分割项目解决（已处理好:EDD2020数据集(EndoscopyDiseaseDetectionandSegmentationChallenge)该息肉分割数据集主要包含人体生长的（肠胃）息肉用于器官内部息肉瘤分割，息肉目标检测，息肉定位任务息肉分割是一个重要的医学影像分析任务，特别是在内窥镜检查中。EDD2020数据集是一个很好的起点。我们将使用几种流行的深度学习模型（如Tra
Windows 11安装DeepSpeed报错（Unable to pre-compile async_io）已解决 day_day_up1 python 机器学习计算机视觉
Windows11安装DeepSpeed报错（Unabletopre-compileasync_io）问题解决_pipinstalldeepspeed报错-CSDN博客
深度学习中高斯噪声：为什么以及如何使用小白学视觉深度学习人工智能
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达来源：DeepHubIMBA本文约1800字，建议阅读8分钟高斯噪声是深度学习中用于为输入数据或权重添加随机性的一种技术。在数学上，高斯噪声是一种通过向输入数据添加均值为零和标准差(σ)的正态分布随机值而产生的噪声。正态分布，也称为高斯分布，是一种连续概率分布，由其概率密度函数(PDF)定义：pdf(x)=(1/(σ*sqrt(
智能推理的革命：DeepSeek-R1 深度解析其算法与实现步子哥算法人工智能
在人工智能（AI）领域，语言模型（LargeLanguageModels,LLMs）正以惊人的速度发展，变得越来越智能，能够理解和生成复杂的语言内容。然而，尽管现有的模型在许多任务上表现出色，它们在深度推理和逻辑思维方面仍有显著的提升空间。DeepSeek-R1的出现，正是为了解决这一问题，通过强化学习（ReinforcementLearning,RL）赋予语言模型更强大的推理能力，开创了LLMs
KNOWLEDGE UNLEARNING FOR MITIGATING PRIVACY RISKS IN LANGUAGE MODELS 绒绒毛毛雨语言模型人工智能自然语言处理
文章目录摘要1引言2相关工作2.1语言模型的隐私方法2.2机器去学习2.3语言模型中的记忆3语言模型中的知识去学习3.1方法论3.2量化语言模型的隐私风险4实验4.1模型、数据集和配置4.2主要实验4.3知识去学习的分析5结论摘要预训练语言模型（LMs）在初始预训练过程中记忆了大量知识，包括可能侵犯个人隐私和身份的信息。以往针对语言模型隐私问题的研究主要集中在数据预处理和差分隐私方法上，这两者都需
机器学习与分布式机器学习_经理人的机器学习–您需要知道的 cumian8165 算法神经网络大数据编程语言 python
机器学习与分布式机器学习Ifyouaremanagingatechteamasaproductorprojectmanager,hereiswhatyouneedtoknowaboutmachinelearning.如果您要以产品或项目经理的身份管理技术团队，这是您需要了解的有关机器学习的知识。Machinelearninganddeeplearninghavebeenpopularbuzzwor
Progressive learning yore0531 深度学习人工智能计算机视觉
learnfromRestormer.Restormer:EfficientTransformerforHigh-ResolutionImageRestoration|IEEEConferencePublication|IEEEXploreProgressivelearning在小的croppatches上训练Transformer模型可能无法对全局图像统计进行编码，从而在测试时对全分辨率图像的效
【PLPR】Progressive Learning for Person Re-Identification with One Example 南风楠 Person Re-ID One-shot Learning Few-shot Learning 深度学习机器学习神经网络
【PLPR】ProgressiveLearningforPersonRe-IdentificationwithOneExampleBibtexPublicinformationFieldsCodelinkMainworkKeytechnologyFrameworkDatasetResultsAlgorithmOthers论文下载：关注下方公众号，回复“PLPR”即可获得论文原文Bibtex@art
深度学习利用数据加载、预处理和增强数据提高模型的性能 weixin_30777913 人工智能深度学习
深度学习数据预处理是一个关键步骤，旨在提高模型的性能和准确性。通过数据加载、预处理和增强，可以显著提高深度学习模型的性能和准确性。在实际应用中，需要根据具体的数据和任务来选择合适的预处理和增强技术。以下将详细论述并举例说明如何加载、预处理和增强数据。一、数据加载在深度学习中，数据加载是第一步。这通常涉及到从各种数据源（如CSV文件、数据库、图像文件夹等）中读取数据。以DeepLearning4J（
论文阅读：DeepFake-Adapter: Dual-Level Adapter for DeepFake Detection（Deepfake模型快速调参）海拉鲁的小厨娘读论文论文阅读
一、论文信息论文名称：DeepFake-Adapter:Dual-LevelAdapterforDeepFakeDetection作者团队：项目主页：https://github.com/rshaojimmy/DeepFake-Adapter（代码暂未开源）二、动机与创新动机：目前的deepfake检测模型泛化能力差，将其归因于过拟合于低级的伪造模式，现有的deepfake检测方法仅关注低级别的伪
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &

深度学习8：Cats vs. Dogs实例学习

1. input_data.py

1.1 get_files()

1.2 get_batch()

1.3 Test

2. model.py

3. training.py

3.1 run_training()

3.2 get_one_image()

3.3 evaluate_one_image()

你可能感兴趣的:(Deep,Learning)