我家树儿多

TensorFlow笔记（一）tensorflow加载数据的三种方式

最近在看TF2.0的内容，顺便把以前的内容也做下笔记，以便查阅。所有程序在不注明的情况下，默认使用tensorflow1.14版本。

数据加载是训练模型的第一步，合理的数据加载方式虽然不会对模型效果有促进作用，但是会大大加快训练过程。TensorFlow中常用的数据加载方式有四种：

内存对象数据集，在学习阶段最常见的数据加载方式，在session中直接用字典变量feed_dict给变量喂数据，这种方式适用于数据量比较少的情况下。
TFRecord数据集，用tfRecord向模型喂数据，适用于大量数据集情况。
Dataset数据集，通过高级API（tf.data）给模型喂数据，也是TensorFlow高级版本比较推荐的方式，在开发中也比较建议使用这种方式。
tf.keras等高级接口，TensorFlow中的高级封装框架，如keras、slim等，会有自己的数据集接口，对于这些高级API比较熟悉的同学，可以使用这些API固有的接口，尤其是tf.kears，建议大家多多熟悉。

1、内存对象数据集

内存对象数据集比较常见，在学习的时候，常常会直接在内存中模拟数据，然后在sess.run中喂数据。这种方法简单直接高效，也比较容易理解，但是在大数据量情况下因为数据都在内存中则不适用。这种方式资料较多，就不做过多介绍了。这里介绍两种改进方法。

（1）第一种改进方法是结合python生成器（yield）和多线程（生产者消费者模型），或者只使用yield加载数据，可以实现每次加载一个batch的数据训练模型。

（2）利用TF中的队列API实现（1）中的功能。具体来说就是使用一个线程源源不断的将硬盘中的数据文件名读入到一个内存队列中，另一个线程负责计算任务，所需数据直接从内存队列中获取。先介绍几个需要用到的API：

tf.train.slice_input_producer(tensor_list, num_epochs=None, shuffle=True, seed=None,
                         capacity=32, shared_name=None, name=None)
##tf.train.slice_input_producer，从tensor_list中抽取tensor，准备放入队列中

tensor_list：包含一系列tensor的列表，表中tensor的第一维度的值必须相等，即个数必须相等，有多少个图像，就应该有多少个对应的标签。使用时常把训练数据和标签放在一个列表中。
num_epochs: 可选参数，是一个整数值，代表迭代的次数，如果设置 num_epochs=None,生成器可以无限次遍历tensor列表，如果设置为 num_epochs=N，生成器只能遍历tensor列表N次，遍历结束以后会抛出tf.errors.OutOfRangeError异常。
shuffle： bool类型，设置是否打乱样本的顺序。一般情况下，如果shuffle=True，生成的样本顺序就被打乱了，在批处理的时候不需要再次打乱样本，使用 tf.train.batch函数就可以了;如果shuffle=False,就需要在批处理时候使用 tf.train.shuffle_batch函数打乱样本。
seed: 可选的整数，是生成随机数的种子，在第三个参数设置为shuffle=True的情况下才有用。
capacity：设置tensor列表的容量。
shared_name：可选参数，如果设置一个‘shared_name’，则在不同的上下文环境（Session）中可以通过这个名字共享生成的tensor。
name：可选，设置操作的名称。

tf.train.batch(tensors, batch_size, num_threads=1, capacity=32,
          enqueue_many=False, shapes=None, dynamic_pad=False,
          allow_smaller_final_batch=False, shared_name=None, name=None)

tensors：tensor序列或tensor字典，可以是含有单个样本的序列，在使用的时候可以把tf.train.slice_input_producer的返回结果传赋给该值
batch_size: 生成的batch的大小;
num_threads：执行tensor入队操作的线程数量，可以设置使用多个线程同时并行执行，提高运行效率，但也不是数量越多越好;
capacity：定义生成的tensor序列的最大容量;
enqueue_many：定义第一个传入参数tensors是多个tensor组成的序列，还是单个tensor;
shapes：可选参数，默认是推测出的传入的tensor的形状;
dynamic_pad：定义是否允许输入的tensors具有不同的形状，设置为True，会把输入的具有不同形状的tensor归一化到相同的形状;
allow_smaller_final_batch：设置为True，表示在tensor队列中剩下的tensor数量不够一个batch_size的情况下，允许最后一个batch的数量少于batch_size，设置为False，则不管什么情况下，生成的batch都拥有batch_size个样本;
shared_name：可选参数，设置生成的tensor序列在不同的Session中的共享名称;
name：操作的名称;

tf.train.start_queue_runners(sess=None, coord=None, daemon=True, start=True,
                        collection=ops.GraphKeys.QUEUE_RUNNERS)

sess：使用的session，默认是默认session
coord：线程协调器
daemon：默认为True，表示是否把线程标记为守护，设为True，表示不会阻塞程序退出
start：默认为True，如果设为False，表示只创建线程，不启动线程
collection：指定获取的队列运行集合

启动队列之前，还需要通过 tf.train.Coordinator(clean_stop_exception_types=None) 类建立一个线程协调器，用来管理之后在Session中启动的所有线程，并将其传给tf.train.start_queue_runners的coord参数。操作示例如下：

##读取图片路径和标签，改为自己的数据即可
def load_sample(sample_dir):
    lfilenames = []
    labelsnames = []
    for (dirpath, dirnames, filenames) in os.walk(sample_dir):
        for filename in filenames:
            #print(dirnames)
            filename_path = os.sep.join([dirpath, filename])
            lfilenames.append(filename_path) 
            labelsnames.append( dirpath.split('\\')[-1] )

    lab= list(sorted(set(labelsnames)))
    labdict=dict( zip( lab  ,list(range(len(lab)))  ))
    labels = [labdict[i] for i in labelsnames]

    return shuffle(np.asarray( lfilenames),np.asarray( labels))

##返回batch
def get_batches(image,label,input_w,input_h,channels,batch_size):
    queue = tf.train.slice_input_producer([image,label])  #使用tf.train.slice_input_producer实现一个输入的队列
    label = queue[1]                                        #从输入队列里读取标签

    image_c = tf.read_file(queue[0])                        #从输入队列里读取image路径
    image = tf.image.decode_bmp(image_c,channels)           #按照路径读取图片

    image = tf.image.resize_image_with_crop_or_pad(image,input_w,input_h) #修改图片大小
    image = tf.image.per_image_standardization(image) #图像标准化处理，(x - mean) / adjusted_stddev
    image_batch,label_batch = tf.train.batch([image,label],#调用tf.train.batch函数生成批次数据
               batch_size = batch_size,
               num_threads = 64)

    images_batch = tf.cast(image_batch,tf.float32)   #将数据类型转换为float32
    labels_batch = tf.reshape(label_batch,[batch_size])#修改标签的形状shape

    return images_batch,labels_batch


batch_size = 16
image_batches,label_batches = get_batches(image,label,28,28,1,batch_size)

with tf.Session() as sess:
    init = tf.global_variables_initializer()
    sess.run(init)  #初始化

    coord = tf.train.Coordinator()          #创建一个线程协调器，开启列队
    threads = tf.train.start_queue_runners(sess = sess,coord = coord)
    try:
        for step in np.arange(10):
            if coord.should_stop():
                break
            images,label = sess.run([image_batches,label_batches]) #注入数据
            print(label) 

    except tf.errors.OutOfRangeError:
        print("Done!!!")
    finally:
        coord.request_stop()

    coord.join(threads)                             #关闭列队

2、TFRecord数据集

TFRecord也是一种非常好用的读取数据的方法，并且是一种非常高效的数据持久化方法，尤其是对于需要预处理的数据。。TFRecord内部使用了“Protocol Buffer”二进制数据编码方案，它只占用一个内存块，只需要一次性加载一个二进制文件的方式即可，简单，快速，尤其对大型训练数据很友好。而且当我们的训练数据量比较大的时候，可以将数据分成多个TFRecord文件，来提高处理效率。一次处理，永久使用。另外一种类似的方法是使用 lmdb 库处理数据。

制作tfrecords文件：

def makeTFRec(filenames,labels): 
    #定义函数生成TFRecord，filenames是数据路径列表，labels是标签列表
    writer= tf.python_io.TFRecordWriter("mydata.tfrecords") #通过tf.python_io.TFRecordWriter 写入到TFRecords文件
    for i in tqdm( range(0,len(labels) ) ):
        img=Image.open(filenames[i])
        img = img.resize((256, 256))
        img_raw=img.tobytes()#将图片转化为二进制格式
        example = tf.train.Example(features=tf.train.Features(feature={
                #存放图片的标签label
                "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[labels[i]])),
                #存放具体的图片
                'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw]))
            })) #example对象对label和image数据进行封装

        writer.write(example.SerializeToString())  #序列化为字符串
    writer.close()  #数据集制作完成

makeTFRec(filenames,labels)

makeTFRec的参数获取可以参考1中的load_sample函数。这里主要有3个API：

tf.python_io.TFRecordWriter(path, options=None)，根据path创建一个tfrecords文件，并返回一个TFRecordWriter实例去写入数据

tf.train.Example。下面是Example协议块，我们可以看出tf_example可以写入的数据形式有三种，分别BytesList, FloatList以及Int64List的类型（注意没有string）。

message Example {
  Features features = 1;
};

message Features {
  map feature = 1;
};

message Feature {
  oneof kind {
    BytesList bytes_list = 1;
    FloatList float_list = 2;
    Int64List int64_list = 3;
  }
};

example.SerializeToString()序列化为字符串

读取tfrecords文件：

def read_and_decode(filenames,batch_size = 3):
    #根据文件名生成一个队列
    filename_queue = tf.train.string_input_producer(filenames)
    reader = tf.TFRecordReader()
    _, serialized_example = reader.read(filename_queue)   #返回文件名和文件
    features = tf.parse_single_example(serialized_example, #取出包含image和label的feature对象
                                       features={
                                           'label': tf.FixedLenFeature([], tf.int64),
                                           'img_raw' : tf.FixedLenFeature([], tf.string),
                                       })

    #tf.decode_raw可以将字符串解析成图像对应的像素数组
    image = tf.decode_raw(features['img_raw'], tf.uint8)
    image = tf.reshape(image, [256,256,3])
    label = tf.cast(features['label'], tf.int32)

    image = tf.cast(image, tf.float32) * (1. / 255) - 0.5     #归一化
    img_batch, label_batch = tf.train.batch([image, label],batch_size=batch_size, capacity=20) ##注意设置capacity大小            

    return img_batch, label_batch

TFRecordfilenames = ["mydata.tfrecords"]
image, label = read_and_decode(TFRecordfilenames)

with tf.Session() as sess:
    sess.run(tf.local_variables_initializer())
    coord=tf.train.Coordinator()
    threads= tf.train.start_queue_runners(coord=coord)

    try:
        for i in range(5):
            example, examplelab = sess.run([image,label])#在会话中取出image和label
            ##这里的example, examplelab大小是batchsize

    except tf.errors.OutOfRangeError:
        print('Done Test -- epoch limit reached')
    finally:
        coord.request_stop()
        coord.join(threads)
        print("stop()")

3、Dataset数据集

tf.data.Dataset是TF比较推荐的数据处理接口。Dataset可以看作是相同类型“元素”的有序列表。在实际使用时，单个“元素”可以是向量，也可以是字符串、图片，甚至是tuple或者dict。tf.data.Dataset接口是通过创建Dataset对象来生成数据集的，并且Dataset对象可以做shuffle、map、iterate、zip、repeat、batch、flat_map、apply、filter等操作。使用demo如下：

def make_dataset(directory,batchsize):
    filenames,labels =load_sample(directory,shuffleflag=False) #载入文件名称与标签
    def _parseone(filename, label):                         #解析一个图片文件
        """ Reading and handle  image"""
        image_string = tf.read_file(filename)         #读取整个文件
        image_decoded = tf.image.decode_image(image_string)
        image_decoded = tf.cast(image_decoded,dtype=tf.float32)
        label = tf.cast(tf.reshape(label, []) ,dtype=tf.int32)#将label 转为张量
        return image_decoded, label

    dataset = tf.data.Dataset.from_tensor_slices((filenames, labels))#生成Dataset对象
    dataset = dataset.map(_parseone).shuffle(buffersize=1000).repeat().batch(batchsize) #批次划分数据集

    return dataset

path = "data"
dataset = make_dataset(path,32)
iterator = dataset.make_one_shot_iterator()	 #生成一个迭代器
one_element = iterator.get_next()			#从iterator里取出一个元素，实际大小是batchsize

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    try:
        for step in np.arange(1):
            value = sess.run(one_element)
            ##value就是图片和标签值

    except tf.errors.OutOfRangeError:           #捕获异常
        print("Done!!!")

load_sample函数可以参考1中的程序。

dataset.map(map_func,num_parallel_calls=None)：通过map_func函数转换数据集元素，返回新数据集；num_parallel_calls表示并行线程数。
dataset.shuffle(buffer_size,seed=None,reshuffle_each_iteration=None)：随机打乱顺序，buffer_size越大越混乱；seed随机种子；reshuffle_each_iteration是否每次迭代都随机乱序。
dataset.repeat(count=None)：生成重复的数据集，count代表重复次数，默认无限次重复。
dataset.batch(batch_size,drop_remainder=False)：批次取数据，batch_size批次大小；drop_remainder是否忽略批次组合后剩余的数据，默认为False，会把最后剩余的数据
dataset.filter(predicate)：对整个数据集过滤，留下使函数predicate为True的数据。

参考资料

https://blog.csdn.net/dcrmg/article/details/79780331

https://blog.csdn.net/lyb3b3b/article/details/82910863

【Python】已解决：error: subprocess-exited-with-error 屿小夏 python 开发语言 linux
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AI在电商平台商品描述生成中的应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI在电商平台商品描述生成中的应用关键词：人工智能、电商平台、商品描述、自然语言处理、机器学习、深度学习摘要：本文深入探讨了人工智能在电商平台商品描述生成中的应用。首先，我们回顾了人工智能的概述和电商平台的发展背景。随后，分析了商品描述在电商平台中的重要性以及存在的问题。接下来，我们重点介绍了AI在商品描述生成中的应用技术，包括自然语言处理、机器学习和深度学习等。文章还通过实战案例展示了AI商品描
【Python】已解决：（cmd进入Python环境报错）No Python at ‘C:\Users…\Python\Python39\python.exe’ 屿小夏 python linux 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
深度学习之基于Django+YOLOv5商标识别 Q1744828575 python plotly python
欢迎大家点赞、收藏、关注、评论啦，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四.总结一项目简介一、项目背景在数字化时代，商标作为企业的重要资产，其保护和管理显得尤为重要。然而，传统的商标识别方法往往依赖于人工审查，效率低下且容易出错。随着深度学习技术的不断发展，尤其是目标检测领域的进步，自动化、高精度的商标识别成为可能。本项目旨在利用DjangoWeb框架和YOLO
动手学深度学习-卷积神经网络-3填充和步幅像污秽一样动手学深度学习深度学习 cnn 人工智能神经网络
目录填充步幅小结在上一节的例子（下图）中，输入的高度和宽度都为3，卷积核的高度和宽度都为2，生成的输出表征的维数为2×2。正如我们在上一节中所概括的那样，假设输入形状为nh×nw，卷积核形状为kh×kw，那么输出形状将是(nh−kh+1)×(nw−kw+1)。因此，卷积的输出形状取决于输入形状和卷积核的形状。还有什么因素会影响输出的大小呢？本节我们将介绍填充（padding）和步幅（stride）
RTX 4090D和A10和T4显卡差别、价格对比张3蜂软件安装部署开源神经网络人工智能深度学习机器学习
RTX4090D、NVIDIAA10和NVIDIAT4三款显卡在设计用途、性能、功耗、价格等方面都有显著差异，以下是它们的主要区别：1.设计用途：RTX4090D:面向高端消费者市场，主要用于游戏、内容创作和3D渲染，适合需要高图形性能的用户，如游戏玩家和内容创作者。NVIDIAA10:专为数据中心和企业应用设计，优化了AI推理、深度学习、虚拟桌面基础设施(VDI)以及多实例GPU（多用户共享显卡
【TVM教程】为 Mobile GPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数（tile因子
非凸科技招聘来啦！技术岗及非技术岗由你选！欢迎大家加入！招聘
公司介绍：非凸科技成立于2018年，是国内领先的智能算法和交易系统服务公司，专注于智能算法交易领域的研究和开发。公司特点：投研团队来自华尔街顶级资管公司BlackRock等，以及多位来自腾讯、字节跳动的顶尖工程师；在职员工100+，投研和技术团队占总人数比例75%，多位成员是ACM/ICPCWorldFinal选手；公司司正基于Rust生态，结合机器学习、深度学习等新兴技术，打造高效率、低延迟、高
深度学习-70-大语言模型LLM之基于大模型LLM与检索增强技术RAG的智能知识库皮皮冰燃深度学习人工智能深度学习语言模型
文章目录1RAG出现的背景2搭建过程2.1数据收集2.2数据处理2.2.1数据清洗与预处理2.2.2文本分块2.2.3微调数据格式统一2.3建立向量索引2.4大模型选择与微调3开源知识库项目3.1FastGPT3.2AnythingLLM3.3LangChain-Chatchat4商业化解决方案4.1百度智能云+千帆大模型知识库4.2阿里云PAI+向量检索5参考附录1RAG出现的背景自从2022年
transformer.js（一）：这个前端大模型运行框架的可运行环境、使用方式、代码示例以及适合与不适合的场景余生H 前端的AI工具书前端 transformer javascript hugginface webml web大模型
随着大模型的广泛应用，越来越多的开发者希望在前端直接运行机器学习模型，从而减少对后端的依赖，并提升用户体验。Transformer.js是一个专为前端环境设计的框架，它支持运行基于Transformer架构的深度学习模型，尤其是像BERT、GPT等广泛应用于自然语言处理（NLP）的模型。本文将全面解析Transformer.js的运行环境、使用方式、代码示例，以及其能够完成的功能与目前的限制，帮助
Python magenta库：一款人工智能生成音乐与艺术的创新工具程序员喵哥 python 人工智能开发语言
更多Python学习内容：ipengtao.com随着人工智能在创意领域的不断进步，音乐和艺术生成正成为一种新的可能性。Magenta是由Google推出的一个开源项目，它结合了深度学习与艺术创作，为开发者提供了一系列强大的工具，帮助他们创作音乐、绘画等艺术作品。基于TensorFlow，Magenta不仅适用于研究人员，也适合开发者和艺术家，提供了易于上手的API和丰富的模型。安装在使用Mage
Python&aconda系列：CUDA+Anaconda的安装以及 Conda实用命令坦笑&&life #python python conda 开发语言
这里写目录标题一.深度学习环境配置：CUDA+Anaconda的安装3.1.1CUDA简介3.1.2查看电脑显卡型号是否支持CUDA的安装3.1.3查看电脑显卡的驱动版本3.1.4根据显卡驱动版本下载支持的CUDA版本3.1.5检查CUDA是否安装成功3.1.6安装Anaconda3.1.7检查Anaconda是否安装成功3.1.8配置Anaconda的安装包下载源二.Conda实用命令conda
深度学习探索：ChatGPT数据分析精髓 & 梯度下降优化方法深度剖析网罗开发 AI 大模型人工智能深度学习 chatgpt 数据分析
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
【深度学习】Squeeze-and-Excitation (SE) 模块优势解读理想不闪火深度学习入门到精通系列讲解
【深度学习】Squeeze-and-Excitation(SE)模块优势解读文章目录1概念辨析—下采样和上采样2Squeeze-and-Excitation(SE)3压缩（Squeeze）4激励（Excitation）5scale操作6相乘特征融合7SE模块的实现8优势1概念辨析—下采样和上采样概念上
人工智能技术的应用前景及未来发展键盘上的蚂蚁- 人工智能生活
引言人工智能（AI）作为21世纪最具创新性和革命性的技术之一，正在全球范围内深刻地改变着我们的生产、工作和生活方式。随着深度学习、强化学习、自然语言处理（NLP）、计算机视觉（CV）等技术的飞速进展，AI不再仅仅是学术研究中的一个热点，而是渗透到各个行业，成为推动创新、优化生产和提升效率的核心力量。对于开发者来说，理解和掌握AI技术不仅是提升个人技能的途径，更是应对未来技术变革、抓住职业机遇的关键
AI人工智能深度学习算法：在生物信息学中的应用 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能深度学习算法：在生物信息学中的应用关键词：人工智能、深度学习、生物信息学、基因组学、蛋白质结构预测、药物发现、个性化医疗文章目录AI人工智能深度学习算法：在生物信息学中的应用1.背景介绍2.核心概念与联系2.1人工智能（AI）2.2机器学习（ML）2.3深度学习（DL）2.4生物信息学2.5应用领域3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1卷积神经网络（CNN）3.1.
深度学习——模型过拟合和欠拟合的原因及解决方法发呆小天才O.o 深度学习深度学习人工智能
一、定义1.过拟合（Overfitting）过拟合是指模型在训练数据上表现非常好，但在测试数据或新的数据上表现很差的现象。模型过度地学习了训练数据中的细节和噪声，以至于它无法很好地泛化到未见过的数据。例如，在一个图像分类任务中，过拟合的模型可能对训练集中的每一张图像的特定细节（如某张猫图片背景中的一个小污点）都学习得过于精细，以至于在测试集中，只要图像背景稍有不同，就无法正确分类。2.欠拟合（Un
【TVM 教程】线性和递归核
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：TianqiChen下面介绍如何在TVM中进行递归计算（神经网络中的典型模式）。from__future__importabsolute_import,print_functionimporttvmimporttvm.testing
基于 PyTorch 的深度学习模型开发实战一ge科研小菜鸡人工智能深度学习
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言深度学习已广泛应用于图像识别、自然语言处理、自动驾驶等领域，凭借其强大的特征学习能力，成为人工智能的核心技术之一。PyTorch作为当前流行的深度学习框架，提供了灵活的张量操作和动态计算图，便于模型的快速开发和调试。本教程将通过一个完整的深度学习模型开发流程，从数据预处理、模型构建、训练与优化、评估以及部署，帮助读者深入理解深度学习的关键技术
神经架构搜索：自动化设计神经网络的方法君君学姐架构自动化神经网络
神经架构搜索：自动化设计神经网络的方法一、引言在深度学习领域，神经网络架构的设计对模型的性能具有至关重要的影响。传统的神经网络设计依赖于专家经验和大量实验，这一过程繁琐且耗时。为了解决这一问题，神经架构搜索（NeuralArchitectureSearch,NAS）应运而生。NAS是一种自动化设计神经网络架构的方法，旨在通过搜索最优的神经网络结构来提高模型性能。本文将详细介绍神经架构搜索的定义、产
2024 年高教社杯全国大学生数学建模竞赛 B 题生产过程中的决策问题详细思路+matlab代码+python代码+论文范例 2025年数学建模美赛 2024年数学建模国赛 2024高教社杯 2024 B题生产过程中的决策问题思路 2024数学建模国赛
持续更新中，2024年所有数学建模比赛思路代码都会发布到专栏内，只需要订阅一次。5号6号半价，会结合历年优秀论文、人工智能深度学习算法、chatgpt。会定期发布思路、代码和论文。思路和论文基本拿不到国奖，想要获得国奖的同学不要购买。适合基础差的学生，容易获得省奖！B题生产过程中的决策问题某企业生产某种畅销的电子产品，需要分别购买两种零配件（零配件1和零配件2），
第八章：AI大模型的未来发展趋势8.3 新兴应用领域8.3.2 生成对抗网络的应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.背景介绍生成对抗网络（GenerativeAdversarialNetworks，GANs）是一种深度学习技术，由伊玛·古德姆（IanGoodfellow）于2014年提出。GANs由两个相互对抗的神经网络组成：生成器（Generator）和判别器（Discriminator）。生成器生成假数据，判别器试图区分假数据和真实数据。这种对抗训练方法使得GANs能够学习数据分布并生成高质
开发者实战 | OpenVINO™ 协同 Semantic Kernel：优化大模型应用性能新路径 OpenVINO 中文社区 openvino 人工智能
点击蓝字关注我们,让开发变得更有趣作者：杨亦诚作为主要面向RAG任务方向的框架，SemanticKernel可以简化大模型应用开发过程，而在RAG任务中最常用的深度学习模型就是Embedding和Textcompletion，分别实现文本的语义向量化和文本生成，因此本文主要会分享如何在SemanticKernel中调用OpenVINO™runtime部署Embedding和Textcompleti
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统 yolov8来训练无人机数据集并检测无人机 QQ_1309399183 无人机类 YOLO 无人机深度学习
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统yolov8来训练无人机数据集并检测无人机无人机数据集，yolo格式种类为uav，一共近5w张图片，如何用yolov8代码训练无人机检测数据集文章目录以下文章及内容仅供参考。1.环境部署2.数据预处理数据集准备划分数据集3.模型定义4.训练模型5.评估模型6.结果分析与可视化7.集成与部署PyQt6GUI(`
Llama3本地部署的解决方案 herosunly llama3 llama 本地部署 API 解决方案
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了Llama3本地部署的解决方案，希望对学习大语言模型的同学们有所帮助。文
深入解析vLLM：加速大模型推理的高效框架秋声studio 口语化解析人工智能模型调优 nlp vLLM
深入解析vLLM：加速大模型推理的高效框架引言在现代深度学习应用中，大型语言模型（如GPT、GLM、LLaMA、Qwen等）的推理速度和资源利用率成为关键挑战。vLLM(VirtualLargeLanguageModel)是由伯克利大学LMSYS组织开源的大语言模型高速推理框架，旨在极大地提升实时场景下的语言模型服务的吞吐量与内存使用效率。本文将深入探讨vLLM的工作原理及其优化技术。一、vLLM
AI 驱动的创业产品设计趋势：大模型赋能下的创新 AI天才研究院【精选大厂面试题详解】大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI驱动的创业产品设计趋势：大模型赋能下的创新一、背景随着人工智能技术的飞速发展，特别是深度学习和大型语言模型（如GPT）的广泛应用，AI正在逐渐改变创业产品设计的游戏规则。大模型赋能下的创新成为许多创业公司脱颖而出的关键。本文将探讨以下几个方面的内容：AI驱动的创业产品设计趋势大模型在产品设计中的具体应用AI驱动创业产品的成功案例分析大模型赋能下的产品设计和开发挑战二、AI驱动的创业产品设计趋势
简要说一下关于实现整个深度学习项目的流程懒大王12138 机器学习深度学习神经网络人工智能算法
我们以识别生物信号为例子，其他类似与图像、文本和目标/故障检测的同样适用1.信号预处理；首先要将得到的生物信号进去噪音去除，另外所有的生物信号由于采样时间不同可能长度并不一样，这时候你需要统一长度。2.特征工程；你需要对所有的经过预处理并且将要输入神经网络的信号提取特征，比如信号的频谱图、时间-频率图或者是一些非线性的动力学特征，比如相空间这些。最重要的是提取的特征数据形状必须一致。3.搭建深度学
在PyTorch框架上训练ImageNet时，Dataloader加载速度慢怎么解决？ cda2024 pytorch 人工智能 python
在深度学习领域，PyTorch因其灵活性和易用性而受到广泛欢迎。然而，在实际应用中，特别是在处理大规模数据集如ImageNet时，Dataloader的加载速度往往成为瓶颈。本文将深入探讨这一问题，并提供多种解决方案，帮助你在PyTorch框架上高效地训练ImageNet。1.问题背景ImageNet是一个包含超过1400万张图像的大规模数据集，被广泛用于图像分类任务的研究。在PyTorch中，D
深度学习篇---Anaconda&LabelImg Ronin-Lotus 深度学习篇深度学习人工智能学习 python 程序人生机器学习计算机视觉
文章目录前言第一部分：Anaconda是什么？1.简介2.特点（1）包管理器Conda（2）环境管理（3）预装包（4）跨平台（5）社区支持3.安装WindowsLinux3.基本命令（1）conda--version（2）condaupdateconda（3）condacreate--namemyenvpython=3.6（4）condaactivatemyenv（5）condadeactivat
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL

TensorFlow笔记（一）tensorflow加载数据的三种方式

1、内存对象数据集

2、TFRecord数据集

3、Dataset数据集

你可能感兴趣的:(深度学习)