MoxuanCN

利用CNN对MNIST训练

目录

1 简介

2 数据集

3 数据预处理

3.1 数据集导入

3.2 像素值归一化处理

3.3 计算图片的高和宽

3.4 读取标签并进行one-hot编码

3.5 数据集划分

4 参数与网络设置

4.1 参数设置

4.2 网络设置

5 损失设置与训练

6 结果展示

1 简介

MNIST是一个入门级的计算机视觉数据集，它包含各种从0到9的手写数字图片以及对应的标签，本篇使用了简单卷积神经网络来实现手写图片预测，主要目的在于熟悉CNN的操作。

首先，设置一些参数

%matplotlib inline
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np
import pandas as pd
import tensorflow as tf

# 设置
# 学习率
Learning_Rate = 1e-4
# 训练轮数
Training_Iterations = 2500
# dropout保留百分比
Dropout = 0.6
# 批处理数量
Batch_Size = 50
# 测试数据集数量
Validation_Size = 2000
# 前期测试展示图像编号
Image_To_Display = 10

2 数据集

本次使用了mnist的csv格式的数据，通过原版的train-images-idx3-ubyte.gz、train-labels-idx1-ubyte.gz、t10k-images-idx3-ubyte.gz、t10k-labels-idx1-ubyte.gz转换，此数据集训练数据共60000条，本次训练只使用了训练数据集，其中58000条作为训练数据，2000条作为测试数据：

def convert(imgf, labelf, outf, n):
    #rb，以二进制只读方式从文件开头打开
    #w，从文件开头开始写入
    f = open(imgf, "rb")
    o = open(outf, "w")
    l = open(labelf, "rb")

    # 读入指定字节数
    f.read(16)
    l.read(8)

    # 创建一个列表
    images = []

    for i in range(n):
        # ord()返回字符对应的ASC码
        image = [ord(l.read(1))]    #添加标签
        
        for j in range(28*28):
            image.append(ord(f.read(1)))    #添加图像
        
        images.append(image)    #存入列表

    #写入输出文件
    #写入列名，label,pixel0,pixel1...piexl783
    o.write("label,")
    pixel = []
    for p in range(28*28):
        name = "pixel" + str(p)
        pixel.append(name)
        
    o.write(",".join(pixel))
    o.write("\n")
    #写入图像数据
    for image in images:
        o.write(",".join(str(pix) for pix in image)+"\n")
    f.close()
    o.close()
    l.close()

#生成train.csv
convert(r"路径\train-images.idx3-ubyte", r"路径\train-labels.idx1-ubyte",
        r"路径\mnist_train.csv", 60000)

#生成test.csv
convert(r"路径\t10k-images.idx3-ubyte", r"路径\t10k-labels.idx1-ubyte",
        r"路径\mnist_test.csv", 10000)

print("Convert Finished!")

注意事项：

文件读入与保存时，路径前加r，或者使用\\，防止了\n的转义，否则无法执行。
必须写列名，后面数据集读入后才能通过列名读取数据，否则读取失败。

转换后的数据：

3 数据预处理

3.1 数据集导入

# 导入文件
data = pd.read_csv('mnist_train.csv')

print('data({0[0]},{0[1]})'.format(data.shape))
print(data.head())

通过pandas包导入csv文件，输出如下：

若转换csv文件时没有写入列名，此时列名会变成一些奇奇怪怪的数，其后面读取标签时找不到index。

3.2 像素值归一化处理

# 图像的灰度值在0~255之间，差异性过大，先进行归一化处理
images = data.iloc[:,1:].values
images = images.astype(np.float)

images = np.multiply(images, 1.0 / 255.0)

print('images({0[0]},{0[1]})'.format(images.shape))

图像的像素值在0~255之间，数值的差异性过大，不利于模型的训练，因此先进行归一化处理，将像素值从0~255转换成0~1。

3.3 计算图片的高和宽

# 此时图像是一个784的长条，需要转换成28x28的，先算出来高和宽的值
image_size = images.shape[1]
print('image_size = {0}'.format(image_size))

image_width = image_height = np.ceil(np.sqrt(image_size)).astype(np.uint8)
print('image_width = {0}\nimage_height = {1}'.format(image_width,image_height))

csv数据集中每张图片都是1x784的，训练时需要转换成28x28的，因此先计算出转换后的高和宽(28)

可以进行一下图片展示(此步可跳过)：

def display(img):
    
    one_image = img.reshape(image_width,image_height)
    
    plt.axis('off')
    plt.imshow(one_image, cmap=cm.binary)

display(images[Image_To_Display])

3.4 读取标签并进行one-hot编码

读取标签：

# 读取标签数据和类型数量
labels_flat = data['label'].values.ravel()
labels_count = np.unique(labels_flat).shape[0]

print('labels_flat({0})'.format(len(labels_flat)))
print('labels_flat[{0}] = {1}'.format(Image_To_Display, labels_flat[Image_To_Display]))
print('labels_count = {0}'.format(labels_count))

此时标签仅为一个数字，该数字为图片的标签，但是训练中需要用到分别为各类数字的几率，因此需要进行ont-hot编码，即0→[1,0,0,0,0,0,0,0,0,0], 1→[0,1,0,0,0,0,0,0,0,0],..., 9→[0,0,0,0,0,0,0,0,0,1]，某一个数字类型的概率为1，其他类型的概率为0。

# 对标签进行one-hot coding
# 0 => [1,0,0,0,0,0,0,0,0,0]
# 1 => [0,1,0,0,0,0,0,0,0,0]
# ...
# 9 => [0,0,0,0,0,0,0,0,0,1]

def dense_to_one_hot(labels_dense, num_classes):
    num_labels = labels_dense.shape[0]    # 样本数量
    index_offset = np.arange(num_labels) * num_classes  # [0,10,20,...,599990]
    labels_one_hot = np.zeros((num_labels, num_classes))
    labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1
    return labels_one_hot
    
labels = dense_to_one_hot(labels_flat, labels_count)
labels = labels.astype(np.uint8)

print('labels({0[0]},{0[1]})'.format(labels.shape))
print('labels[{0}] = {1}'.format(Image_To_Display, labels[Image_To_Display]))

此处的labels[10]是上面展示的‘3’的手写数字的标签，是3的概率为1，是其他数字的概率为0。

3.5 数据集划分

本次训练只使用了mnist数据集中的训练数据集，共60000条，其中前2000条作为测试数据，后58000条作为训练数据：

validation_images = images[:Validation_Size]  #前2000作为测试数据
validation_labels = labels[:Validation_Size]

train_images = images[Validation_Size:]
train_labels = labels[Validation_Size:]

print('train_images({0[0]},{0[1]})'.format(train_images.shape))
print('validation_images({0[0]},{0[1]})'.format(validation_images.shape))

4 参数与网络设置

4.1 参数设置

定义两个方法，自动生成权重与偏置：

# 权重与偏置
def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.1)  # 高斯初始化
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)

指定卷积操作，步长为1：

# 指定卷积操作
def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')

#strides=[batch_size(在batchsize上是否有滑动), 图像的高, 图像的宽, 图像的通道(RGB)]

指定池化操作(2x2,strides=2)：

# 指定池化操作
def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

指定输入输出：

# 指定输入输出
x = tf.placeholder('float', shape=[None, image_size])
y_ = tf.placeholder('float', shape=[None, labels_count])

4.2 网络设置

本次网络结构为：输入→卷积(32)→池化→卷积(64)→池化→全连接(1024)→输出(10)

网络构造如下：

第一层：

# 指定神经网络模型
# 第一层
W_conv1 = weight_variable([5, 5, 1, 32]) # filter为5x5x1,32个
b_conv1 = bias_variable([32])

# (58000,784) => (58000,28,28,1)
image = tf.reshape(x, [-1, image_width, image_height, 1])
# -1表示未知数，自动求解

h_conv1 = tf.nn.relu(conv2d(image, W_conv1) + b_conv1) # 卷积层
# h_conv1.get_shape() = (58000, 28, 28, 32)
h_pool1 = max_pool_2x2(h_conv1)                        # 池化层
# h_pool1.get_shape() = (58000, 14, 14, 32)

第二层：

# 第二层
W_conv2 = weight_variable([5, 5, 32, 64]) # 经过一次pooling，filter个数翻倍
b_conv2 = bias_variable([64])

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
# h_conv2.get_shape() = (58000, 14, 14, 64)
h_pool2 = max_pool_2x2(h_conv2)
# h_pool2.get_shape() = (58000, 7, 7, 64)

全连接层：

# 指定全连接层
W_fc1 = weight_variable([7*7*64, 1024])
b_fc1 = bias_variable([1024])

# 将特征提取结果展开  (58000, 7, 7, 64) => (58000, 3136)
h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])

h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)
# h_fc1.get_shape() = (58000, 1024)

指定dropout：

# 指定dropout, 一般只加在最后的几层全连接层
keep_prob = tf.placeholder('float')
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

得到结果：

# 得到结果
W_fc2 = weight_variable([1024, labels_count])
b_fc2 = bias_variable([labels_count])

y = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)
# y.getshape() = (58000,10)

5 损失设置与训练

设置损失函数与评估参数：

# 损失函数
cross_entropy = -tf.reduce_sum(y_*tf.log(y))

# 优化器
train_step = tf.train.GradientDescentOptimizer(Learning_Rate).minimize(cross_entropy)

# 评估
correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, 'float'))
predict = tf.argmax(y,1)

定义批读入方法next_batch:

epochs_completed = 0
index_in_epoch = 0
num_examples = train_images.shape[0]

# 批读入数据，定好起始地址、终止地址然后拿数据就好
def next_batch(batch_size):
    
    global train_images
    global train_labels
    global index_in_epoch
    global epochs_completed
    
    start = index_in_epoch
    index_in_epoch += batch_size
    
    if index_in_epoch > num_examples:
        # 一轮结束
        epochs_completed += 1
        # 刷新数据集
        perm = np.arange(num_examples)
        np.random.shuffle(perm)
        train_images = train_images[perm]
        train_labels = train_labels[perm]
        # 开始下一轮
        start = 0
        index_in_epoch = batch_size
        assert batch_size <= num_examples
    end = index_in_epoch
    return train_images[start:end], train_labels[start:end]

开始训练：

# 初始化
init = tf.global_variables_initializer()
sess = tf.InteractiveSession()
sess.run(init)

# 开始训练
train_accuracies = []        #后面用来画图
validation_accuracies = []
x_range = []

display_step = 1   # 采用动态输出，每输出10次，step*10，见下面

for i in range(Training_Iterations):
    
    # 批读入数据
    batch_xs, batch_ys = next_batch(Batch_Size)
    
    # 展示
    if (i+1)%display_step == 0 or (i+1) == Training_Iterations:
        # 训练数据精度
        train_accuracy = accuracy.eval(feed_dict={x:batch_xs,
                                                   y_:batch_ys,
                                                   keep_prob: 1.0})
        #测试数据精度
        if(Validation_Size):
            validation_accuracy = accuracy.eval(feed_dict={x:validation_images[0:Batch_Size],
                                                             y_:validation_labels[0:Batch_Size],
                                                             keep_prob: 1.0})
            # keep_prob 是 dropout 的设置
            
            print(' training accuracy / validation accuracy = %.2f / %.2f for step %d' % (train_accuracy, validation_accuracy, i+1))
            
            validation_accuracies.append(validation_accuracy)
            
        else:
            print(' training accuracy = %.2f for step %d' % (train_accuracy, i+1))
        
        train_accuracies.append(train_accuracy)
        x_range.append(i+1)
        
        # 展示间隔增加
        if (i+1)%(display_step*10) == 0 and i:
            display_step *= 10
    # 开始
    sess.run(train_step, feed_dict={x:batch_xs, y_:batch_ys, keep_prob: Dropout})

6 结果展示

结果可通过图表显示：

# 结果展示表
if(Validation_Size):
    validation_accuracy = accuracy.eval(feed_dict={x:validation_images[0:Batch_Size],
                                                             y_:validation_labels[0:Batch_Size],
                                                             keep_prob: 0.6})
    print(' validation accuracy = %.4f' % validation_accuracy)
    plt.plot(x_range, train_accuracies, '-b', label='Training')
    plt.plot(x_range, validation_accuracies, '-g', label='Validation')
    plt.legend(loc='lower right', frameon=False)
    plt.ylim(ymax = 1.1, ymin = 0.7)
    plt.ylabel('accuracy')
    plt.xlabel('step')
    plt.show()

本次使用的学习率为0.0001，dropout为0.6：

总体精度从300~400轮左右开始超过90%，后面很多轮都是92%左右，最后2000~2500轮大概为96%。

此外，还增加了卷积核的数量进行了一次训练，网络构成为：

输入→卷积(64)→池化→卷积(128)→池化→全连接(1024)→输出(10)

训练结果为：

总体精度从100轮左右开始达到90%左右，后面慢慢提升，最后大概为98%。

你可能感兴趣的:(深度学习,入门,cnn,神经网络,深度学习)

信而泰×DeepSeek：AI推理引擎驱动网络智能诊断迈向 “自愈”时代
DeepSeek-R1：强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力，融合了自然语言处理（NLP）、深度学习、大规模数据分析等前沿技术。DeepSeek-R1具备卓越的逻辑推理、多模态分析（文本/图像/语音）和实时交互能力，能够高效处理代码生成、复杂问题求解、跨模态学习等高阶任务。凭借其开源、高效、多模态
AI深度噪音抑制技术
这两年人工智能快速发展，AI已经渗透到了各行各业。在噪音抑制技术领域，AI也同样发挥了巨大的作用。AI深度噪音抑制技术是一种利用人工智能和深度学习算法来动态处理和减少音频信号中的噪声，从而提升音频的清晰度和质量。与传统的噪音抑制技术相比，AI深度噪音抑制能够更智能、更精准地分辨出背景噪音与有用的语音或音乐信号，尤其在复杂、多样的环境下表现尤为出色。1.工作原理AI深度噪音抑制技术基于深度神经网络（
这才是你需要了解的时序数据库 Apache-IoTDB 源码解析之系统架构！ AI科学小老师
个人博客导航页（点击右侧链接即可打开个人博客）：大牛带你入门技术栈1.系统架构1.1系统简介以上示意图可能非常简单，但我觉得足够表明一个整体架构。当一台设备、一辆车连接到协议网关后，便开始了真正的收发数据。一般通信的方式都是基于tcp，搞一段二进制协议，所以协议网关基本要做的工作就是完成对连接的管理、完成对数据的收发及编解码。当数据完成编解码之后一般会发往消息队列当中，一般都是Kafka之中。用来
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
云平台健康检查全攻略：从入门到精通 AI云原生与云计算技术学院 AI云原生与云计算 ai
云平台健康检查全攻略：从入门到精通关键词：云平台、健康检查、监控指标、自动化运维、高可用性、故障诊断、性能优化摘要：本文全面解析云平台健康检查的核心技术与实践方法。从基础概念到高级应用，详细讲解健康检查的原理、实现方式和最佳实践。内容包括监控指标体系设计、自动化检查工具开发、常见故障诊断方法以及性能优化策略。通过实际案例和代码演示，帮助读者掌握构建健壮云平台的关键技术，提升系统可靠性和运维效率。1
25岁从零开始学习平面设计，会不会太晚？ 93091cdf8ebb
很多新手小白想学平面设计，但是苦于不知从何处入门、怎么样去学。究竟怎样系统学习平面设计？今天就来谈谈平面设计系统学习的方法。更多学习设计内容关注V公众号广告设计之站了解平面设计平面设计是以“视觉”作为沟通和表现的方式，通过文字、图片等媒介有机结合，借此表达视觉上的讯息。平面设计的分类有很多，如：名片设计、标志设计、字体设计、VI视觉形象设计等等。所以设计师要掌握字体排印、视觉艺术、版面、电脑软件等
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
聚好推网盘拉新项目，新人到入门精通的三大步骤！无忧达人
聚好推是最新上线的网盘拉新，聚好推这个渠道是有着多年互联网项目经验的平台，已经推出了多个互联网项目，在市面上有着非常多的用户，而且这个平台的口碑是相当不错。这次的聚好推也是重磅发布，尤其是聚好推上线的网盘拉新组队奖励，除了正常的佣金团队收益之外，聚好推推出的组队奖励单人最高可拿28w，这也是行业中首次推广的全新奖励。聚好推注册入口及推广教学放在文末了，划到文章结尾即可注册聚好推聚好推网盘拉新项目优
第二期《论语》学习打卡17 暖暖1314
2022年5月17日心得体会：1）最寒冷的时候，才知道松柏是最后才凋谢的。路遥知马力，日久见人心。唯有经历磨难，才能看到坚毅之力是如何的强大，相伴之人是如何地用心竭力。2）追求的至高境界是：做有智慧的人而不受惑于外物，做仁慈的人而不忧愁，做有勇气的人而不畏惧。智慧、仁义、勇气，值得毕生去探索和追寻。3）求学的四个阶段是：入门学习；立志于求道；守道义，以道立世、立身；能守道亦能懂得通达权变却又不逾矩
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
人的价值就是能让别人生活得更有价值——读荆志强老师的书有感花婆婆
最近读了荆志强老师的专著《快乐地做教育》，前言就提到：教育的本真，就是通过激励为学生赋能，帮助学生产生足够的“自我效能感”，让学生主动获取知识技能、培育情感态度；帮助学生建立自主深度学习的能力。荆志强老师倡导的“赋能教育”主要从两个方面建构：激励型课堂、自主化管理。其中，他还谈到生本教育的学习观：学习是生命成长的过程，它是人自身的一种需要，而不是外在压力的结果。教育的一切行为都应该是为了满足儿童的
2023年最新网上配音赚钱平台有哪些配音新手圈
每天都有新的在线配音赚钱的机会出现，网上配音赚钱平台也随之而来。有很多这样的平台，比如支付宝、微信、QQ等，甚至最近比较火爆的语音社交平台。这些平台都可以让你通过配音赚钱，而且你不必担心收入是否有保障。二、网上配音赚钱平台有哪些1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务，都是适合没有基础的人去做的，每天都有任务。适合新入门的小白练手，也是一个从业余到专业的过度期接单的平台。2、声优
夸克网盘拉新项目实战教程，某社群付费课首次分享，零基础入门保姆级教学任推邦官方账号
夸克网盘拉新一个多少钱？揭秘夸克网盘推广最高佣金及服务商对接流程夸克网盘拉新项目作为一个长期热门的副业项目，因其稳定的收益吸引了大量推广者。为了获得最高的收益，选择对接一级服务商渠道至关重要。下面我将为你详细讲解夸克网盘拉新的价格及对接流程。一、夸克网盘拉新最高价格是多少？夸克网盘拉新项目由三个主要收益板块组成，这也是它长久以来备受欢迎的原因：拉新收益：每次新用户通过你的推广链接注册网盘，你会获得
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
Promise入门 m0dw javascript 前端开发语言
文章目录为什么使用PromisePromise介绍为什么使用Promise在ES5中使用回调函数来处理异步任务，当多个异步任务有依赖关系时(如下定时器的层层嵌套)，就需要回调函数互相嵌套，当嵌套结构多了后，就出现了回调地狱的问题，难以维护setTimeout(function(){console.log('a1');setTimeout(function(){console.log('a2');s
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
存档python爬虫、Web学习资料
1python爬虫学习学习Python爬虫是个不错的选择，它能够帮你高效地获取网络数据。下面为你提供系统化的学习路径和建议：1.打好基础首先要掌握Python基础知识，这是学习爬虫的前提。比如：变量、数据类型、条件语句、循环等基础语法。列表、字典等常用数据结构的操作。函数、模块和包的使用方法。文件读写操作。推荐通过阅读《Python编程：从入门到实践》这本书或者在Codecademy、LeetCo
Python爬虫入门到实战（3）-对网页进行操作荼蘼爬虫
一.获取和操作网页元素1.获取网页中的指定元素tag_name()方法：获取元素名称。text()方法：获取元素文本内容。click()方法():点击此元素。submit()方法():提交表单。send_keys()方法：模拟输入信息。size()方法:获取元素的尺寸可进入selenium库文件夹下的webdriver\remote\webelement.py中查看更多的操作方法,2.在元素中输入
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架（原创创新算法）
YOLOv13_SSOD：基于超图关联增强的半监督目标检测框架项目背景随着深度学习技术的快速发展，目标检测在各个领域都取得了显著的进展。然而，现有的监督学习方法在实际应用中面临着标注数据稀缺、泛化能力不足等挑战。特别是在火灾烟雾检测、工业质检等特定场景中，获取大量高质量标注数据的成本极高。为了解决这一问题，本项目基于最新发布的YOLOv13架构，结合EfficientTeacher半监督学习框架，
USB串口通信、握手协议、深度学习等技术要点深度学习教程, 深度学习人工智能网络协议
基于OpenMV的智能车牌识别系统：从硬件到算法的完整实现前言本文将详细介绍一个基于OpenMV微控制器的智能车牌识别系统的设计与实现。该系统集成了嵌入式视觉处理、串口通信协议、深度学习OCR识别等多种技术，实现了从图像采集到车牌识别的完整流程。系统架构概述整体设计思路该车牌识别系统采用分布式架构设计，将计算密集型任务与嵌入式控制分离：┌─────────────┐USB串口通信┌────────
语音识别开源项目推荐：GitHub热门仓库盘点 AGI大模型与大数据研究院 AI大模型应用开发实战语音识别开源 github ai
2024年必看！GitHub热门语音识别开源项目全解析：从入门到实战关键词语音识别(ASR)、开源项目、GitHub、Whisper、FunASR、PaddleSpeech、深度学习摘要想象一下：开车时只需说一句话就能自动发消息，听英文演讲时实时获得中文翻译，给视障人士读文本时精准转换——这些场景的背后，语音识别（AutomaticSpeechRecognition,ASR）技术正在改变我们与机器
MySQL入门学习-查询优化.EXPLAIN
在MySQL中，'EXPLAIN'命令用于获取查询执行计划的信息。一、关于'EXPLAIN'的一些常见查询优化方面的特点、使用方法、与其他比较及高级应用：1.特点：-提供查询执行计划的详细信息，帮助了解查询的执行方式。-可以用于优化查询性能，找出潜在的性能问题。-适用于各种类型的查询，包括简单查询和复杂查询。2.使用方法：-在查询语句前添加'EXPLAIN'关键字，例如：'EXPLAINSELEC
靠声音赚钱的六大方式，靠声音赚钱配音就业圈
在当今这个数字化与多媒体蓬勃发展的时代，声音作为一种独特而强大的媒介，正以前所未有的方式创造价值与财富。配音兼职接单推荐公众号，配音新手圈，声优配音圈，新配音兼职圈，配音就业圈，鼎音副业，有声新手圈，每天更新各种的配音任务，新手小白也可以接单。1、配音新手圈这是一个公众号配音新手圈里面每天更新配音任务(只要有手机就可以接单，对经验无要求)，都是适合没有基础的人去做的，每天都会发布新任务。适合新入门
分布式文件存储（GlusterFS）入门指南，有一定难度！！ ubuntu 努力一点948 分布式gluster 分布式 ubuntu linux 服务器运维人工智能 gpu算力
以下有免费的4090云主机提供ubuntu22.04系统的其他入门实践操作地址：星宇科技|GPU服务器高性能云主机云服务器-登录相关兑换码星宇社区---4090算力卡免费体验、共享开发社区-CSDN博客兑换码要是过期了，可以私信我获取最新兑换码！！！之所以推荐给大家使用，是因为上面的云主机目前是免费使用的，不需要大家再去安装虚拟机，部署虚拟机，环境都搭配好了，非常适合新手入门，减少搭建的时间，把时
【狂神说JAVA】JVM快速入门-1 Jackson Cortex jvm java
链接http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1http://player.bilibili.com/player.html?aid=76728711&bvid=BV1iJ411d7jS&cid=131232435&page=1内容一、探究JVM0、面试题谈谈对J
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
yolov8涨点系列之替换幽灵卷积GhostConv 没脾气的小玩家 yolov8涨点系列 YOLO 目标检测
文章目录核心思想主要步骤优势yolov8.yaml文件增加CBAMyolov8.yamlyolov8.yaml将Conv卷积替换成GhostConv 幽灵卷积（GhostConv）是一种新颖的卷积操作方法，旨在解决传统卷积神经网络中参数量和计算量过大的问题，尤其适用于资源受限的设备。以下是对幽灵卷积的详细介绍：核心思想常规的卷积操作会产生大量的特征图，其中存在一定的冗余信息。幽灵卷积的核心思
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他