Calcular

Tensorflow训练识别基础范本

一、文件结构

TF工程文件夹：

对象描述

data_real 存放要识别东西的真实数据的文件夹

data_test 存放测试数据、标签、tfrecords

data_train 存放训练数据、标签、tfrecords

doc 存放文档、相关论文等

model 存放模型保存的ckpt、pb文件

networks 存放模型网络结构

_tfcore.py Tensorflow输入输出相关代码

data_analyser.py 对数据集的可视化分析

data_generator.py 产生tfrecords文件

run.py 提供训练、识别功能

对象	描述
data_real	存放要识别东西的真实数据的文件夹
data_test	存放测试数据、标签、tfrecords
data_train	存放训练数据、标签、tfrecords
doc	存放文档、相关论文等
model	存放模型保存的ckpt、pb文件
networks	存放模型网络结构
_tfcore.py	Tensorflow输入输出相关代码
data_analyser.py	对数据集的可视化分析
data_generator.py	产生tfrecords文件
run.py	提供训练、识别功能

二、Tensorflow输入输出范本

_tfcore.py：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np


def TFRecordsWriteOne(writer,namespace,data_list,data_type,label_list):
    """
    写入一个分类样本的标签和特征
    writer = tf.python_io.TFRecordWriter('namespace.tfrecords')
    TFRecordsWriteOne(writer,'test',data_list=L_x,data_type='float' or 'bytes',label_list=L_y)
    writer.close()
    """
    if data_type=='float':   #针对普通数据
        writer.write( tf.train.Example(features=tf.train.Features(feature={
            namespace+'_data':  tf.train.Feature(float_list=tf.train.FloatList(value=data_list)),
            namespace+'_label': tf.train.Feature(int64_list=tf.train.Int64List(value=label_list))

            })).SerializeToString())
    elif data_type=='bytes': #针对图像
        writer.write( tf.train.Example(features=tf.train.Features(feature={
            namespace+'_data':  tf.train.Feature(bytes_list=tf.train.BytesList(value=data_list)),
            namespace+"_label": tf.train.Feature(int64_list=tf.train.Int64List(value=label_list))
            })).SerializeToString())


def TFRecordsBatchReader(filename_list,namespace,shuffle,data_len,data_type,label_len,batch_size):
    """
    返回一个batch的样本数据标签tensor,每run一次就会改变batch。
    train_data_batch, train_label_batch =TFRecordsBatchReader(['train.tfrecords'],'train',
        shuffle=True, data_len=1, data_type='bytes', label_len=1, batch_size=100)
    """
    _capacity=50000
    _min_after_dequeue=10000 
    filename_queue = tf.train.string_input_producer(filename_list,shuffle=False)
    reader = tf.TFRecordReader() #这个reader也可以当作图的一个节点,run之后才生效
    _, serialized_example = reader.read(filename_queue)
    if data_type=='float':
        features = tf.parse_single_example(serialized_example,features={
            namespace+'_data': tf.FixedLenFeature([data_len], tf.float32),
            namespace+'_label': tf.FixedLenFeature([label_len], tf.int64),
        })
    else:
        features = tf.parse_single_example(serialized_example,features={
            namespace+'_data': tf.FixedLenFeature([data_len], tf.string),
            namespace+'_label': tf.FixedLenFeature([label_len], tf.int64),
        })
    data =  features[namespace+'_data' ]
    label = features[namespace+'_label']
    if shuffle==True:
        data_batch,label_batch=tf.train.shuffle_batch([data,label], 
                batch_size=batch_size,capacity=_capacity,min_after_dequeue=_min_after_dequeue)
    else:
        data_batch,label_batch=tf.train.batch([data,label],batch_size=batch_size,capacity=_capacity)
    return data_batch, label_batch


if __name__ == '__main__':
    pass

二、数据可视化分析样本

data_analyser.py：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from _tfcore import TFRecordsBatchReader


def showImageByIndex_OriData(namespace,index):

    if namespace=='train':
        ImagesFile=open('data_train/train-images.idx3-ubyte','rb')
        LabelsFile=open('data_train/train-labels.idx1-ubyte','rb')
    else:
        ImagesFile=open('data_test/t10k-images.idx3-ubyte','rb')
        LabelsFile=open('data_test/t10k-labels.idx1-ubyte','rb')

    image_index=index*28*28+16
    label_index=index+8
    ImagesFile.seek(image_index)
    LabelsFile.seek(label_index)
    imageBytes=ImagesFile.read(28*28)
    labelBytes =LabelsFile.read(1)
    img=np.zeros((28,28,3))
    for h in range(0,28):
        for w in range(0,28):
            img[h,w,:]=imageBytes[h*28+w]
    plt.figure()
    plt.title('%s: %d' % (namespace,int(labelBytes[0])),color='red') 
    plt.imshow(img)
    plt.show()
    ImagesFile.close()
    LabelsFile.close()


def showImageBytes28X28(imageBytes,labelInt):
    img=np.zeros((28,28,3))
    for h in range(0,28):
        for w in range(0,28):
            img[h,w,:]=imageBytes[h*28+w]
    plt.title('label: %d' % (labelInt),color='red') 
    plt.imshow(img)


def showImage_TFRecord(namespace):
    filename='data_'+namespace+'/'+namespace+'.tfrecords'
    data_batch, label_batch =TFRecordsBatchReader([filename],namespace,
        shuffle=True, data_len=1, data_type='bytes', label_len=1, batch_size=4)
    with tf.Session() as sess:
        coord = tf.train.Coordinator() #开线程1
        threads = tf.train.start_queue_runners(sess=sess, coord=coord)  #开线程2
        data,label=sess.run([data_batch,label_batch])
        for i in range(0,4):
            plt.subplot(2,2,i+1)
            showImageBytes28X28(data[i,0],int(label[i,0]))
        plt.show()        
        coord.request_stop()
        coord.join(threads)


if __name__ == '__main__':
    # train:0~60000-1
    # test:0~10000-1
    showImageByIndex_OriData('test',785)
    #showImage_TFRecord('test')

三、数据制作范本

制作tfrecords的作用是为了让大量训练更加容易（减少IO时间）。
data_generator.py：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np
from _tfcore import TFRecordsWriteOne


def data_generator(namespace,tag_steps=1000):

    #根据namespace打开文件,生成writer,得到样本数目
    if namespace=='train':
        ImagesFile=open('data_train/train-images.idx3-ubyte','rb')
        LabelsFile=open('data_train/train-labels.idx1-ubyte','rb')
        writer = tf.python_io.TFRecordWriter('data_train/train.tfrecords')
        sampleLen=60000
    else:
        ImagesFile=open('data_test/t10k-images.idx3-ubyte','rb')
        LabelsFile=open('data_test/t10k-labels.idx1-ubyte','rb')
        writer = tf.python_io.TFRecordWriter('data_test/test.tfrecords')
        sampleLen=10000

    #迭代每一个样本写入
    for index in range(0,sampleLen):

        #得到数据和标签列表
        image_index=index*28*28+16
        label_index=index+8
        ImagesFile.seek(image_index)
        LabelsFile.seek(label_index)
        imageBytes=ImagesFile.read(28*28)
        labelBytes =LabelsFile.read(1)
        dataList=[imageBytes]
        labelList=[int(labelBytes[0])]

        #写入数据输出提示
        TFRecordsWriteOne(writer,namespace,dataList,'bytes',labelList)
        if index%tag_steps==0 and index!=0:
            print('%s complete index %d' % (namespace,index))

    print('transfer finished')
    writer.close()


if __name__ == '__main__':
    data_generator('train')
    data_generator('test')

四、训练与识别范本

run.py：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from _tfcore import TFRecordsBatchReader
from networks.TFNetwork_NPL import network_NLP
from networks.TFNetwork_CNN import network_CNN
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'  #忽略烦人的警告


def train_and_test(training_steps,tag_steps,restore):

    batch_size_train=1000
    batch_size_test=1000
    test_all_times=10 #10次完成测试

    #得到数据输入点
    train_recodesname='data_train/train.tfrecords'
    test_recodesname='data_test/test.tfrecords'
    data_batch_train, label_batch_train =TFRecordsBatchReader([train_recodesname],'train',
        shuffle=True, data_len=1, data_type='bytes', label_len=1, batch_size=batch_size_train)
    data_batch_test, label_batch_test =TFRecordsBatchReader([test_recodesname],'test',
        shuffle=False, data_len=1, data_type='bytes', label_len=1, batch_size=batch_size_test)
    real_input=tf.placeholder(name='real_input',dtype=tf.float32,shape=[None,28*28])

    #数据重整形
    data_batch_train=tf.cast(tf.decode_raw(data_batch_train, tf.uint8),tf.float32)
    data_batch_train=tf.reshape(data_batch_train,[batch_size_train,28*28])
    data_batch_test=tf.cast(tf.decode_raw(data_batch_test, tf.uint8),tf.float32)
    data_batch_test=tf.reshape(data_batch_test,[batch_size_test,28*28])

    #标签重整形
    label_batch_train=tf.reshape(label_batch_train,[batch_size_train])
    label_batch_test=tf.reshape(label_batch_test,[batch_size_test])

    #网络
    output_train=network_CNN(data_batch_train,dropout=True,reuse=tf.AUTO_REUSE)
    output_test =network_CNN(data_batch_test,dropout=False,reuse=tf.AUTO_REUSE)
    _real_output=network_CNN(real_input,dropout=False,reuse=tf.AUTO_REUSE)
    real_output=tf.argmax(_real_output,1,name='real_output')

    #损失函数
    loss = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=output_train, labels=label_batch_train))

    #优化器
    train_step = tf.train.AdamOptimizer(1e-3).minimize(loss)

    #评价标准
    correct_prediction_test = tf.equal(tf.argmax(output_test, 1), label_batch_test)
    accuracy_test = tf.reduce_mean(tf.cast(correct_prediction_test, tf.float32))

    saver = tf.train.Saver()
    with tf.Session(config=tf.ConfigProto(log_device_placement=True)) as sess:
        sess.run(tf.global_variables_initializer())
        if restore==True:
            saver.restore(sess,'model/ckpt/model1.ckpt')
        coord = tf.train.Coordinator() #开线程1
        threads = tf.train.start_queue_runners(sess=sess, coord=coord) #开线程2

        #训练代码
        for i in range(training_steps+1):
            sess.run([train_step])
            if i % tag_steps == 0 :
                sum=0.0
                for _ in range(test_all_times):
                    acc = sess.run([accuracy_test])
                    sum+=float(acc[0])
                print("After %d training steps, acc is %g " % (i, sum/test_all_times))
                saver.save(sess, 'model/ckpt/model1.ckpt')

        #导出模型部分图
        output_graph_def= tf.graph_util.convert_variables_to_constants(
            sess,sess.graph_def,['real_input','real_output'])
        with tf.gfile.GFile('model/pb/model1.pb','wb') as f:
            f.write(output_graph_def.SerializeToString())

        coord.request_stop() #关线程1
        coord.join(threads)  #关线程2


def predict_real(filename):
    with tf.gfile.FastGFile(filename,'rb') as f:
        image_data = tf.image.decode_jpeg(f.read())

        with tf.Session() as sess:
            sess.run(tf.global_variables_initializer())

            image_c3 = sess.run(image_data)
            image_hd=np.zeros([1,28*28],dtype=float)
            for i in range(4,24):
                for j in range(4,24):
                    image_hd[0,i*28+j]=float(image_c3[i-4,j-4,0])

            imgx=np.zeros([28,28,3],dtype=int)
            for i in range(0,28):
                for j in range(0,28):
                    imgx[i,j,:]=int(image_hd[0,i*28+j])

            output_graph_def = tf.GraphDef()
            with open('model/pb/model1.pb', "rb") as pbf:
                output_graph_def.ParseFromString(pbf.read())
                _ = tf.import_graph_def(output_graph_def, name="")
                real_input=sess.graph.get_tensor_by_name("real_input:0")
                real_output=sess.graph.get_tensor_by_name("real_output:0")
                result=sess.run(real_output,feed_dict={real_input:image_hd})
                plt.title('%d' % (result[0]),color='red') 
                plt.imshow(imgx)


if __name__ == '__main__':
    # train_and_test(1000,tag_steps=50,restore=True)

    for i in range(0,10):
        plt.subplot(2,5,i+1)
        predict_real('data_real/%d.jpg' % (i)) 
    plt.show()

五、神经网络框架搭建范本

networks/TFNetwork_CNN.py：

# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np


def network_CNN(input,dropout,reuse):
    with tf.variable_scope('mnist_CNN',reuse=reuse):#tf.AUTO_REUSE

        #重整input的形式为[batch, in_height, in_width, in_channels]
        input=tf.reshape(input,shape=[-1,28,28,1])

        #卷积池化层,卷积核形状[核长，核宽，核深，多少核卷积]
        #input:  [batch, 28, 28, 1]
        W_conv = tf.get_variable('W_conv1',[5,5,1,16],initializer=tf.random_normal_initializer(0, 0.1))
        b_conv = tf.get_variable('b_conv1',[16],initializer=tf.constant_initializer(0.1))
        conv2d=tf.nn.conv2d(input=input,filter=W_conv,strides=[1,1,1,1],padding='SAME')
        h_conv=tf.nn.relu(tf.add(conv2d,b_conv))
        h_pool=tf.nn.max_pool(h_conv,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

        #h_pool: [batch,14,14,16]
        W_conv = tf.get_variable('W_conv2',[5,5,16,32],initializer=tf.random_normal_initializer(0, 0.1))
        b_conv = tf.get_variable('b_conv2',[32],initializer=tf.constant_initializer(0.1))
        conv2d=tf.nn.conv2d(input=h_pool,filter=W_conv,strides=[1,1,1,1],padding='SAME')
        h_conv=tf.nn.relu(tf.add(conv2d,b_conv))
        h_pool=tf.nn.max_pool(h_conv,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

        #h_pool: [batch,7,7,32]
        W_conv = tf.get_variable('W_conv3',[5,5,32,32],initializer=tf.random_normal_initializer(0, 0.1))
        b_conv = tf.get_variable('b_conv3',[32],initializer=tf.constant_initializer(0.1))
        conv2d=tf.nn.conv2d(input=h_pool,filter=W_conv,strides=[1,1,1,1],padding='SAME')
        h_conv=tf.nn.relu(tf.add(conv2d,b_conv))

        #h_pool: [batch,7,7,32]
        h_flat=tf.reshape(h_conv,shape=[-1,7*7*32])

        #h_flat: [batch,7*7*32]
        W_fc = tf.get_variable('W_fc1',[7*7*32,1024],initializer=tf.random_normal_initializer(0, 0.1))
        b_fc = tf.get_variable('b_fc1',[1024],initializer=tf.constant_initializer(0.1))
        h_fc = tf.nn.relu(tf.add(tf.matmul(h_flat,W_fc),b_fc))

        W_fc = tf.get_variable('W_fc2',[1024,512],initializer=tf.random_normal_initializer(0, 0.1))
        b_fc = tf.get_variable('b_fc2',[512],initializer=tf.constant_initializer(0.1))
        h_fc = tf.nn.relu(tf.add(tf.matmul(h_fc,W_fc),b_fc))

        #h_fc: [batch,84]
        if dropout==True:
            net = tf.nn.dropout(h_fc, 0.8)
        else:
            net = tf.nn.dropout(h_fc, 1.0)

        W_fc = tf.get_variable('W_fc3',[512,10],initializer=tf.random_normal_initializer(0, 0.1))
        b_fc = tf.get_variable('b_fc3',[10],initializer=tf.constant_initializer(0.1))
        net = tf.add(tf.matmul(net,W_fc),b_fc)

    return net

networks/TFNetwork_NPL.py：


# -*- coding: utf-8 -*-
import tensorflow as tf
import numpy as np


def network_NLP(input,dropout,reuse):
    with tf.variable_scope('mnist_NPL',reuse=reuse):#tf.AUTO_REUSE
        W = tf.get_variable('W1',[28*28,1024],initializer=tf.random_normal_initializer(0, 0.01))
        b = tf.get_variable('b1',[1,1024],initializer=tf.constant_initializer(0.1))
        net = tf.add(tf.matmul(input, W),b)
        net = tf.nn.relu(net)
        W = tf.get_variable('W2',[1024,1024],initializer=tf.random_normal_initializer(0, 0.01))
        b = tf.get_variable('b2',[1,1024],initializer=tf.constant_initializer(0.1))
        net = tf.add(tf.matmul(net, W),b)
        net = tf.nn.relu(net)
        if dropout==True:
            net = tf.nn.dropout(net, 0.9)
        else:
            net = tf.nn.dropout(net, 1.0)
        W = tf.get_variable('W3',[1024,10],initializer=tf.random_normal_initializer(0, 0.01))
        b = tf.get_variable('b3',[1,10],initializer=tf.constant_initializer(0.1))
        net = tf.add(tf.matmul(net, W) , b)
        #net = tf.nn.relu(net)
    return net

图像处理篇---图像预处理 Ronin-Lotus 图像处理篇深度学习篇程序代码篇图像处理人工智能 opencv python 深度学习计算机视觉
文章目录前言一、通用目的1.1数据标准化目的实现1.2噪声抑制目的实现高斯滤波中值滤波双边滤波1.3尺寸统一化目的实现1.4数据增强目的实现1.5特征增强目的实现：边缘检测直方图均衡化锐化二、分领域预处理2.1传统机器学习（如SVM、随机森林）2.1.1特点2.1.2预处理重点灰度化二值化形态学操作特征工程2.2深度学习（如CNN、Transformer）2.2.1特点2.2.2预处理重点通道顺序
目前市场上主流的机器视觉的框架有哪些？他们的特点及优劣 yuanpan 机器学习计算机视觉
目前市场上主流的机器视觉框架和工具可以分为商业软件、开源工具和深度学习框架三大类。以下是它们的总结及特点对比：1.商业软件(1)Halcon(MVTec)特点：专注于工业机器视觉，提供高精度、高效率的算法。支持复杂的工业应用，如缺陷检测、3D视觉、深度学习等。提供图形化开发工具HDevelop和多种编程接口。优势：算法优化好，适合实时工业应用。硬件兼容性强，支持多种工业相机和设备。劣势：商业软件，
1.1PaddleTS_环境配置：一个易用的深度时序建模的Python库 pythonQA python paddlepaddle
PaddleTS是一个易用的深度时序建模的Python库，它基于飞桨深度学习框架PaddlePaddle，专注业界领先的深度模型，旨在为领域专家和行业用户提供可扩展的时序建模能力和便捷易用的用户体验。PaddleTS的主要特性包括：设计统一数据结构，实现对多样化时序数据的表达，支持单目标与多目标变量，支持多类型协变量封装基础模型功能，如数据加载、回调设置、损失函数、训练过程控制等公共方法，帮助开发
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
代码逐行解析 | 教你在C++中使用深度学习提取特征点 3Ｄ视觉工坊 3D视觉从入门到精通 c++深度学习开发语言人工智能
点击下方卡片，关注「3D视觉工坊」公众号选择星标，干货第一时间送达扫描下方二维码，加入3D视觉技术星球，星球内汇集了众多3D视觉实战问题，以及各个模块的学习资料：最新顶会论文、书籍、源码、视频（近20门系统课程[星球成员可免费学习]）等。想要入门3D视觉、做项目、搞科研，就加入我们吧。作者：泡椒味的口香糖|来源：3DCV添加微信：dddvision
深度学习-130-RAG技术之基于Anything LLM搭建本地私人知识库的应用策略问题总结(一) 皮皮冰燃深度学习深度学习人工智能 RAG
文章目录1AnythingLLM的本地知识库1.1本地知识库应用场景1.2效果对比及思考1.3本地体现在哪些方面1.3.1知识在本地1.3.2分割后的文档在本地1.3.3大模型部署运行在本地2问错问题带来的问题2.1常见的问题2.2原因分析3为什么LLM不使用我的文件？3.1LLM不是万能的【omnipotent】3.2LLM不会自省【introspect】3.3AnythingLLM是如何工作的
3DMAX点云算法：实现毫米级BIM模型偏差检测（附完整代码）夏末之花人工智能
摘要本文基于激光雷达点云数据与BIM模型的高精度对齐技术，提出一种融合动态体素化与多模态特征匹配的偏差检测方法。通过点云预处理、语义分割、模型配准及差异分析，最终实现建筑构件毫米级偏差的可视化检测。文中提供关键代码实现，涵盖点云处理、特征提取与深度学习模型搭建。一、核心算法流程点云预处理与特征增强去噪与下采样：采用统计滤波与体素网格下采样，去除离群点并降低数据量。语义分割：基于PointNet++
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
Docker打包深度学习项目 FLY_LTL docker 深度学习容器
文章目录Docker打包深度学习项目1.Docker和NVIDIAContainerToolkit的安装1.Docker2.NVIDIAContainerToolkit3.添加国内镜像源2.使用Dockerfile打包并保存镜像1.Dockerfile2.通过Dockerfile生成镜像3.保存镜像和加载4.运行Docker并测试参考Docker打包深度学习项目本文来源于个人实践总结，供各位同学参
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
Python 模拟鼠标轨迹算法 a485240 鼠标轨迹计算机外设
一.鼠标轨迹模拟简介传统的鼠标轨迹模拟依赖于简单的数学模型，如直线或曲线路径。然而，这种方法难以捕捉到人类操作的复杂性和多样性。AI大模型的出现，使得能够通过深度学习技术，学习并模拟更自然的鼠标移动行为。二.鼠标轨迹算法实现AI大模型通过学习大量的人类鼠标操作数据，能够识别和模拟出自然且具有个体差异的鼠标轨迹。以下是实现这一技术的关键步骤：数据收集：收集不同玩家在各种游戏环境中的鼠标操作数据，包括
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
深度学习在医学影像分析中的应用：DeepSeek系统的实践与探索 Evaporator Core #深度学习 #DeepSeek快速入门 DeepSeek进阶开发与应用深度学习人工智能
随着人工智能技术的迅猛发展，深度学习在医学领域的应用逐渐成为研究热点。医学影像分析作为医疗诊断的重要组成部分，正受益于深度学习技术的突破。DeepSeek系统是一种基于深度学习的医学影像分析平台，旨在通过高效、精准的算法辅助医生进行疾病诊断和治疗决策。本文将深入探讨DeepSeek系统的技术原理、实现方法及其在医学影像分析中的实际应用，并结合代码示例展示其核心功能。1.DeepSeek系统的技术架
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割 985小水博一枚呀论文解读深度学习 transformer 人工智能网络 cnn
【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割文章目录【深度学习遥感分割|论文解读2】UNetFormer：一种类UNet的Transformer，用于高效的遥感城市场景图像语义分割2.Re
PyTorch 深度学习博客 Zoro｜ PyTorch Deep Learning 人工智能
PyTorch深度学习博客欢迎来到我的PyTorch深度学习博客！在这里，我将分享使用PyTorch学习和实践深度学习项目的点滴经验。本博客适用于初学者和有一定基础的开发者，旨在帮助大家快速搭建环境、掌握核心概念，并通过实例了解实际应用。环境配置为了确保项目的稳定性和兼容性，我选择了Python3.9环境，并在conda创建的虚拟环境中运行最新且稳定的PyTorch版本2.6.0。1.创建Pyth
深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析深度学习
卷积神经网络（ConvolutionalNeuralNetwork,CNN）原理：CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算，提取局部特征；池化层则对特征图进行下采样，降低特征维度，同时保留主要特征；全连接层将特征图展开为一维向量，并进行分类或回归计算。CNN利用卷积操作实现局部连接和权重共享，能够自动学习数据中的空间特征。适用场景：广泛应用于图像处理相关的
算力技术创新驱动多场景应用演进智能计算研究中心其他
内容概要算力技术创新正成为数字经济时代的基础性驱动力，从异构计算架构的多元融合到量子计算的颠覆性突破，技术演进不断突破物理与算法的双重边界。在工业互联网场景中，边缘计算通过分布式节点实现毫秒级响应，支撑智能制造产线的实时控制；智能安防系统依托深度学习模型与流计算技术，完成海量视频数据的动态解析；而科学计算领域通过分布式计算与模型压缩技术，将基因测序、气候模拟等复杂任务的效率提升至新量级。值得注意的
AI模型技术前沿与跨场景应用实践智能计算研究中心其他
内容概要当前AI模型技术正呈现多维度突破与跨领域融合的特征。从技术演进角度看，可解释性模型与量子计算框架的协同发展正在突破传统黑箱限制，而联邦学习、自适应优化等技术则为复杂场景建模提供了新的方法论支撑。应用层面，TensorFlow与PyTorch框架在医疗影像诊断、金融时序预测等领域的实战案例，验证了深度学习模型在垂直行业的泛化能力。值得关注的是，工具链整合已成为技术落地的关键环节，MXNet与
融合AMD与NVIDIA GPU集群的MLOps：异构计算环境中的分布式训练架构实践
在深度学习的背景下，NVIDIA的CUDA与AMD的ROCm框架缺乏有效的互操作性，导致基础设施资源利用率显著降低。随着模型规模不断扩大而预算约束日益严格，2-3年更换一次GPU的传统方式已不具可持续性。但是Pytorch的最近几次的更新可以有效利用异构计算集群，实现对所有可用GPU资源的充分调度，不受制于供应商限制。本文将深入探讨如何混合AMD/NVIDIAGPU集群以支持PyTorch分布式训
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
深度学习框架PyTorch——从入门到精通（5）构建神经网络 Fansv587 Torch框架学习深度学习 pytorch 神经网络经验分享
构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作。在PyTorch里，torch.nn这个命名空间提供了你搭建自己神经网络所需要的所有基础组件。PyTorch里的每一个模块都是nn.Module类的子类。一个神经网络本身
深度学习框架PyTorch——从入门到精通（5）自动微分 Fansv587 深度学习 pytorch 人工智能
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。在该算法中，参数（模型权重）根据损失函数的梯度相对于给定参数进行调整。为了计算这些梯度，PyTorch有一个内置的微分引擎，名为torch.autograd。它支持为任何计算图自动计算梯度。考虑最简单的一层神经网络，具有输入x、参数w和b以
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
数据集格式转换——json2txt、xml2txt、txt2json【复制就能用】 kay_545 YOLO11改进有效涨点 python 人工智能机器学习
秋招面试专栏推荐：深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转本专栏所有程序均经过测试，可成功执行专栏地址：YOLO11入门+改进涨点——点击即可跳转欢迎订阅目录json2txt脚本xml2txttxt2json
AI人工智能深度学习算法：在量子计算中的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着科技的不断发展，人工智能和量子计算成为了当今世界的热门话题。人工智能的深度学习算法在处理大规模数据和复杂任务方面取得了显著的成果，而量子计算则具有强大的并行计算能力和高效的信息处理能力。将人工智能与量子计算相结合，为解决一些具有挑战性的问题提供了新的思路和方法。本文将探讨人工智能深度学习算法在量子计算中的应用，包括其背景、意义和应用场景。2.核心概念与联系在人工智能中，深度学习是一
还在为找图发愁？图生生AI以图生图，一键生成专属风格！图生生人工智能 ai AI作画图生生
你是否也遇到过这样的烦恼：想为文章配图，却找不到风格合适的图片？设计海报时，灵感枯竭，不知从何下手？看到喜欢的图片风格，却无法应用到自己的作品中？别担心，图生生AI生图来帮你！只需上传一张图片，AI就能自动生成相似风格的图片，让你轻松拥有专属图库！图生生AI生图是一款基于人工智能技术的图片生成工具，它能够深度学习和理解图片的风格、色彩、构图等元素，并以此为基础生成全新的图片。无论你是设计师、自媒体
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
远程调试Python脚本之ptvsd 工头阿乐 PyTorch 深度学习 python 开发语言
深度学习文章目录深度学习前言前言有时候需要远程调试Python脚本，怎么办呢…以下这段代码用于远程调试Python脚本，特别是通过VisualStudioCode（VSCode）的远程调试功能。它会在指定的服务器IP和端口上等待调试器的连接。#检查是否提供了服务器IP和端口ifargs.server_ipandargs.server_port:#远程调试-参见https://code.visual
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

Tensorflow训练识别基础范本

一、文件结构

二、Tensorflow输入输出范本

二、数据可视化分析样本

三、数据制作范本

四、训练与识别范本

五、神经网络框架搭建范本

你可能感兴趣的:(深度学习)