驼同学.

机器学习实战2（有监督的机器学习）

文章目录

机器学习实战：MNIST手写数据识别：分类应用入门
- 1. 如何引入MNIST手写数据并确认读入成功。
- - 1.1 针对版本是TF1但是属于1中比较高的版本的，比如1.15.0版本。
  - 1.2 针对版本是TF2版本的处理办法。
- 1.3 对读入的数据的测试：
- - 1.3.1 查看读入的数据的形状：
  - 1.3.2 像列表一样取单个数据：
  - 1.3.3 单幅图片的可视化的实现
  - 1.3.4 对独热编码进行取值
  - 1.3.5 一次性读取多条数据
  - 1.3.6 tf.random_normal()用于参数自动赋初值。
- 2. 模型的构建。
- - 1.占位符的确定
  - 2.变量的确定
  - 3.前向计算和结果分类（Softmax分类）
  - 4.损失函数的选择。
  - - 对数损失函数。
    - 交叉熵损失函数。
- 3. 模型的训练。
- - 超参数的定义
  - 优化器的选择
  - 准确率的设计（用来监控训练效果的另一个参数）
  - 模型训练的主体：
- 4. 模型评估，模型应用与可视化。
- - 关于损失值和准确值的可视化
  - 模型的评估
  - 详细解析模型应用的可视化函数
  - - 参数的考虑
    - 陌生函数的介绍
    - - plt.gcf()
      - fig.set_size_inches()
      - ax = plt.subplot(5, 5, i+1)
      - ax.set_title(title,fontsize=10)
      - ax.set_xticks([]) / ax.set_yticks([])
  - 预测数据的可视化展示

机器学习实战：MNIST手写数据识别：分类应用入门

MNIST分类入门实现代码

1. 如何引入MNIST手写数据并确认读入成功。

实现了数据的读入，并且对读入的数据进行观察的实现的代码如下：
读入MNIST数据并观察

其实这个点是会存在很多问题的，因为TF版本的原因，然后视频引例中使用的TF的版本又偏比较老旧，所以很多比较新的版本的TF的自带的数据的包，其实是放到了其他地方去了的。这里主要要区分的处理方式分为两种类型。

1.1 针对版本是TF1但是属于1中比较高的版本的，比如1.15.0版本。

首先出现的问题是这个样子的：
由于我当前使用的版本是tensorflow1.15.0 的版本，而课程中讲解很多用的是TF1比较初等版本的代码，所以很多地方是存在代码不对称的问题的。
直接使用TF1比较初等版本的语句，虽然也能达到效果，数据资料可以被引用进来，运行上面的代码，会自动下载数据集并将文件解压到当前代码所在同级自录下的MNIST_data 文件夹下。
- 原因是mnist = input_data.read_data_sets("MNIST_data/", one_hot = True)这个语句提供了资料MNIST_data的下载的相对路径，所以才会被下载在当前项目的文件内。
但是难受的是，这种方法，代码本身的报错并不会解除，尽管数据有被引用进来，也能够被使用。

解决方案：

在1.15.0的版本中，那些文件其实被放在了另一个地方：
把引用的位置改为tensorflow_core就能找到这些文件了。
简单来说，如果用的版本依然是TF1只不过版本等级比较高的话，那可以知道，大部分的文件都还在，只不过是换了一个地方而已.
把tensorflow换成tensorflow_core就行。

1.2 针对版本是TF2版本的处理办法。

这一个版本建议参考这篇博客：

TF2.0解决MNIST手写数据问题的博客

读取信息文件的代码：

import tensorflow as tf
from tensorflow_core.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot = True)
mnist_not_one_hot = input_data.read_data_sets("MNIST_data/", one_hot = False)

read_data_sets()函数是MNIST中自带的用来读取数据的函数，这里面可以研究的东西很多，暂时是从功能角度记住它能从MNIST数据中读取数据就行。
"MNIST_data/"这个是用来存放下载的数据的相对路径，下载好后的这个文件会被放到工程文件的根目录下。
one_hot这个参数用来选着标签数据是否用独热编码来表示。
one-hot

1.3 对读入的数据的测试：

1.3.1 查看读入的数据的形状：

由于对分类问题涉及到需要有训练集，验证集和测试集，所以MNIST数据本身也自带了这三个集合，并做好了分类。

print('train images shape:', mnist.train.images.shape,
      ',labels shape', mnist.train.labels.shape)
print('validation images shape:', mnist.validation.images.shape,
      ',labels shape', mnist.validation.labels.shape)
print('test images shape:', mnist.test.images.shape,
      ',labels shape', mnist.test.labels.shape)

1.3.2 像列表一样取单个数据：

print(len(mnist.train.images[0]))
print(mnist.train.images[0].shape)
print(mnist.train.labels[0])

1.3.3 单幅图片的可视化的实现

print(mnist.train.images[0].reshape(28, 28))
# 可视化
def plot_image(image):
      plt.imshow(image.reshape(14, 56), cmap='binary')
      plt.show()
plot_image(mnist.train.images[20000])

reshape()函数这个函数会以行优先，先把一行的数据排满后然后再往下接数据去排。在它需要输入的两个参数中，左边的那个参数代表行数，右边的那个参数代表列数。
plt.imshow()函数这个函数用来实现图片的可视化，它的功能很强大，需要载入的参数有图形矩阵（可以控制形状），以及色彩的搭配方案。

1.3.4 对独热编码进行取值

print(np.argmax(mnist.train.labels[0]))

np.argmax()函数这个函数可以取当前列表中最大项的索引，对当前数字的10分类问题来说，可以实现把独热码转换成它的实际意义的数字。

1.3.5 一次性读取多条数据

方法一，采用列表的切片的读取的方法

print(mnist.train.labels[0:10])

方法二，采用mnist自带的next_batch方法

batch_images_xs, batch_labels_ys = \
      mnist.train.next_batch(batch_size=10)
print(batch_images_xs)
print(batch_labels_ys)

next_batch()会返回两个值，一个是x维度的n维数组，另一个是y维度的n维数组；并且它有一个参数batch_size用来控制每一批次读取的数据的数量。
在同一个数据集中调用next_batch()的话，在全部调用完毕之前，下一次调用会在紧接在上一次调用的地方往下继续调用。

1.3.6 tf.random_normal()用于参数自动赋初值。

norm = tf.random_normal([100])
with tf.Session() as sess:
      norm_data = norm.eval()
print(norm_data[:10])
plt.hist(norm_data)
plt.show()

tf.random_normal()它需要的参数是输入n维数组的形状，它会自动返回一个填充满随机数的对应形状的n维数组。
plt.hist()它实现的是将一组数据用柱状图的形式可视化出来。

2. 模型的构建。

该模型的构建采用的方法是使用了单个神经元的方法来实现的，内部的数学核心是使用了线性代数中的矩阵运算。

# 占位符的定义
x = tf.placeholder(tf.float32, [None, 784], name="images")
y = tf.placeholder(tf.float32, [None, 10], name="labels")
# 定义变量
w = tf.Variable(tf.random_normal([784,10]),name="weight")
b = tf.Variable(tf.zeros([10]),name="b")
# 此处参数带的10，可以让y的结果是一个shape为[1,10]的行向量，正好对应10分类。
# 定义前向计算
forward = tf.matmul(x, w) + b  # 前向计算
# 进行结果分类
pred = tf.nn.softmax(forward)  # 使用S型函数进行Softmax分类
# 损失函数的选择
loss_fuction = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred),
                                             reduction_indices=1)) # 交叉熵 / 对数损失函数

1.占位符的确定

依然需要的是两个占位符，一个是特征向量也就是x(image)，另一个是标签向量，也就是y(label)，[None, 784]其中的None表示不确定每次输入的行的数目，这样可以方便后续参数的改动，而784代表的是一幅图形所需要的空间大小(28*28)。

2.变量的确定

关于变量，它类似于线性代数的样式，只不过每一个参数变量都变成了矩阵，所以也依然需要w矩阵和b矩阵，其中，先说w矩阵这个矩阵最后需要和输入的每一个x向量相乘，而输入的x向量的形状是[1,784]，而要满足矩阵的叉乘运算的规则，这就要求w矩阵的行数也为784，又因为本次问题是10分类的问题，最后我们表示标签的方法是用独热码的形式来表示，所以需要最后得到的结果是一个形状为[1,10]的行向量，所以w矩阵的形状需要被确定为[784,10],这里使用的是tf.random_normal()对矩阵进行数据的初始化。
最后b矩阵本质上是偏振值，出于矩阵之间加法的要求，所以b矩阵也得是一个[1,10]的行向量。其中tf.zeros([10])这个函数实现的是对给定形状的n维数组赋0的初值。

3.前向计算和结果分类（Softmax分类）

前向计算：计算出预测值的原始向量。
由于在逻辑回归问题当中，我们更倾向于使用比例值(处在0~1中间的值)来表示具体的量，所以这里就要用到一种对结果进行分类的方法，那就是Softmax分类。
通过softmax分类，我们能得到一个值总和为1的向量。

4.损失函数的选择。

先直接看使用MSE的均方差损失函数的方法，由于我们做Softmax分类的时候，使用了sigmod函数，所以当把s函数代入MSE函数式中，得到的函数特性是，该函数是非凸函数，存在多个极小值的点，而对于这种函数，如果使用梯度下降法的话，会容易导致陷入局部最优解当中，而这显然不是我们想要达到的结果，所以显然均方差的损失函数，在这个问题上就不适用了，因为后续优化的方案我们依然选择的是梯度下降法，争取最小化损失函数的模型。

对数损失函数。

函数模型实现的效果就是，当标签值为0的时候，预测值越接近0的损失值就越小；当标签值为1的时候，预测值越接近1的损失值就越小。

交叉熵损失函数。

交叉熵损失和对数损失之间的关系

交叉熵中未知真实分布\large p(x)相当于对数损失中的真实标记\large y，寻找的近似分布\large q(x)相当于我们的预测值。如果把所有样本取均值就把交叉熵转化成了对数损失函数。
在该模型中我们本质上使用的是对数损失函数，而之所以提出交叉熵损失函数的原因是对数损失函数是交叉熵损失函数把所有样本取均值所得到的结果，所以用交叉熵的函数式来写，最后再取所有样本的均值就可以实现对数损失函数。这样来构造函数会比较方便。
loss_fuction = tf.reduce_mean(-tf.reduce_sum(y*tf.log(pred), reduction_indices=1)) # 交叉熵 / 对数损失函数
reduction_indices=1表示按行来计算，简单说就是求总和是取一整行的数据求一次总和。

reduction_indices的用法

3. 模型的训练。

# 超参数的定义
learning_rate = 0.01  # 学习率
train_epoches = 50  # 训练的轮数
batch_size = 100  # 单次训练的样本数（批次大小）
display_step = 1  # 显示的粒度
total_batch = int(mnist.train.images.shape[0]/batch_size)

# 优化器的选择，此处依然使用梯度下降优化器
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_fuction)
# 定义准确率（用于验证集验证情况的反馈）
# 检查预测的类别与实际类别的匹配情况
correct_prediction = tf.equal(tf.argmax(pred, 1), tf.argmax(y, 1))
# 准确率，将布尔值转化为浮点数，并计算平均值
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 声明会话
sess = tf.Session()
init = tf.global_variables_initializer()  # 全变量初始化
sess.run(init)

all_loss = []
all_accuracy = []

# 训练模型
for epoch in range(train_epoches):
    for batch in range(total_batch):
        xs, ys = mnist.train.next_batch(batch_size)  # 读取批次的数据
        sess.run(optimizer,feed_dict={x: xs, y: ys})  # 执行批次训练
    # 所有的批次完成之后，使用验证数据集来计算误差和准确率; 验证集没有进行分批而是一次型传入
    loss, acc = sess.run([loss_fuction, accuracy],
                         feed_dict={x: mnist.validation.images,y: mnist.validation.labels})

    all_loss.append(loss)
    all_accuracy.append(acc)

    # 打印训练过程中的详细信息(损失值和准确率)
    if (epoch+1) % display_step == 0:
        print("Train Epoch:", "%02d" % (epoch+1), "Loss=", "{:.9f}".format(loss),\
              "Accuracy=", "{:.4f}".format(acc))

print("Train Finished")

# 损失值和准确值的可视化
plt.plot(all_loss, label="loss")
plt.plot(all_accuracy, label="accuracy")
plt.legend(loc=2)

超参数的定义

机器学习的模型必备的参数：
- 训练的轮迭代次（train_epoches）
- 学习率（learn_rate） 一般取 [0.01,0.1]
- 训练过程的监视所需的显示粒度（dispaly_step）
这里由于样本的容量偏大，所以，不可能一次性把训练集中的所有数据都进行训练，所以需要分成小批次多次执行。因此有：(应为整型int)
- 每一批次的训练量（batch_size）
- 总共需要的训练批次（total_batch）

优化器的选择

依然选择梯度下降优化器。

准确率的设计（用来监控训练效果的另一个参数）

tf.equal()实现的是逐个比较(一一对应)两个输入源的值，如果相同的话，就返回True，如果不相同的话，就返回False。

tf.equal()

对bool值的浮点数的转化，True转化成1，False转化成0。而对准确率的计算方法，则是求所有的匹配值数组的和后再求均值，即准确值就是在所有的验证集合中，预测成功的个数占总个数的比例。

模型训练的主体：

数据的读取使用的是MNIST自带的next_batch()函数

4. 模型评估，模型应用与可视化。

# 损失值和准确值的可视化
plt.plot(all_loss, label="loss")
plt.plot(all_accuracy, label="accuracy")
plt.legend(loc=2)


# 评估模型
# 测试集
accu_test = sess.run(accuracy,
                     feed_dict={x: mnist.test.images, y: mnist.test.labels})
print("Test Accuracy: ", accu_test)
# 验证集
accu_validation = sess.run(accuracy,
                     feed_dict={x: mnist.validation.images, y: mnist.validation.labels})
print("Validation Accuracy: ", accu_validation)
# 训练集
accu_train = sess.run(accuracy,
                     feed_dict={x: mnist.train.images, y: mnist.train.labels})
print("Train Accuracy: ", accu_train)

plt.show()

# 在建立模型并进行训练后，若认为准确率可以接受，则可以使用此模型进行预测
# 模型应用与可视化
# 由于pred的预测结果是one-hot编码格式，所以需要转换为0~9数字
prediction_result = sess.run(tf.argmax(pred, 1),
                             feed_dict={x: mnist.test.images})
print(prediction_result[0:10])

# 定义可视化函数
def plot_images_labels_prediction(images,   # 图像的列表
                                  labels,   # 标签的列表
                                  prediction,   # 预测值的列表
                                  index,   # 从第index个下标开始显示
                                  num=10):   # 默认一次显示10幅
    # 获取图表，并设置尺寸。
    fig = plt.gcf()  # 获取当前的图表，Get Current Figure
    fig.set_size_inches(10, 12)   # 1英寸等于2.54cm
    # 控制展示的峰值
    if num > 25:
        num = 25
    # 处理每一个要展示的子图
    for i in range(0, num):
        ax = plt.subplot(5, 5, i+1)  # 获取当前要处理的子图

        ax.imshow(np.reshape(images[index], (28, 28)),  # 显示第index个图像
                  cmap="binary")
        title = "label=" + str(np.argmax(labels[index]))  # 构建图上要显示的title信息
        if len(prediction) > 0:  # 如果有预测信息的话
            title += ",predict=" + str(prediction[index])

        ax.set_title(title,fontsize=10)   # 显示图上的title信息
        ax.set_xticks([])
        ax.set_yticks([])
        index += 1
    plt.show()
print("_________________________________分割线_____________________________________")
plot_images_labels_prediction(
    mnist.test.images,
    mnist.test.labels,
    prediction_result, 10, 10)
print("_________________________________分割线_____________________________________")
plot_images_labels_prediction(
    mnist.test.images,
    mnist.test.labels,
    prediction_result, 10, 25)

关于损失值和准确值的可视化

这一部分是我自己加上去的内容，关键是想看看损失值和准确值的变化趋势。

模型的评估

模型的评估的本质是待训练结束后，把最后的一个集合，也就是测试集的数据代入求取准确度，用准确度来衡量模型的训练结果。
从对比的角度来说，也可以分别直接代入三个集合的数据来查看。
本质上是用会话端口运行求准确值的节点，然后需要输入 (x,y) 两个占位符的具体数据。

详细解析模型应用的可视化函数

此处本质上是使用了matplotlib的可视化功能，把原始标签、预测结果、实际图形，以一种合理的形式展示出来。

参数的考虑

由于需要展示实际图形，所以需要传入images的列表。
由于需要展示原始标签，所以需要传入labels的列表。
由于考虑到需要展示预测标签，所以需要传入预测结果的列表。
考虑到输出需要控制输出的图形的个数，所以可以定义一个可选参数用来控制输出的图像的个数。
考虑到用户不一定想从头看，可能想任意指定具体的位置来查看，所以可以定义一个可以指定具体的展示的开始下标的参数。

陌生函数的介绍

plt.gcf()

它的作用就是获得一张画布，我们称之为figure。
可以把figure理解为pyplot的一种数据结构，而该语句就是定义了这样的一个类似画布的数据结构，有了画布才能在上面画图形。
对于图片中的两句代码，如果没有上一句定义的画布的话，直接进行展示是不会触发图像的产生的。

fig.set_size_inches()

这是pyplot中自带的一个函数，用于设置这块定义好的画布的尺寸大小，只不过单位是inches（1英寸等于2.54cm）。
用面向对象的角度来说的话，如果把figure当成一个类来看的话，fig就是这个类的一个对象，然后set_size_inches()就是这个类的一个方法，它的作用是设置这个类尺寸的状态，可以这样来理解。

ax = plt.subplot(5, 5, i+1)

使用subplot绘制子图的一些特点

当subplot函数带第3个参数的时候，就代表当前创建的只是一个子图而已，第三个变量表示的是子图组中子图的序号，从1开始。
当只有两个参数的时候，这两个参数的乘积就表示一共创建的子图的数量，第一个参数是总行数，第二个参数是总列数。建子图的时候，逐行创建，一行建完后，再接下一行。
可以通过赋值方式把具体的一个子图赋值给一个子图变量，采用是的对子图组取行，列的索引来赋值。
子图兼容多类图形的创建函数，如直线图(plot)，如散点图(scatter)等，直接用子图索引创建的话，创建的图形会直接出现在子图对应的索引区域。
用plt来直接创建的图形，会默认绘制在执行plt代码执行时处在的最新的一个子图上。

ax.set_title(title,fontsize=10)

对于每一个子图，我们都可以给它加上一条字符串标题。
fontsize控制字体大小的参数。

ax.set_xticks([]) / ax.set_yticks([])

这两个函数都是对坐标轴的控制函数，只不过一个针对x轴一个针对y轴而已，本质是一样的。
参数给定一个空列表可以实现省略坐标轴的功能。
它的本质是，用空列表中的多个空数据来填充坐标轴的每一个间隔，于是最后得到的效果自然也就是空的坐标轴啦。

set_xticks()
python_matplotlib改变横坐标和纵坐标上的刻度(ticks)

预测数据的可视化展示

取10个：

取25个：

主要参考资料：
深度学习应用开发-TensorFlow实践----吴明晖、李卓蓉、金苍宏

【机器学习&深度学习】前馈神经网络（单隐藏层）一叶千舟深度学习【理论】机器学习深度学习神经网络
目录一、什么是前馈神经网络？二、数学表达式是什么？三、为什么需要“非线性函数”？四、NumPy实现前馈神经网络代码示例五、运行结果六、代码解析6.1初始化部分6.2前向传播6.3计算损失（Loss）6.4反向传播（手动）6.5更新参数（梯度下降）6.6循环训练七、训练过程可视化（思维图）八、关键问题答疑Q1：为什么需要隐藏层？Q2：ReLU是干嘛的？Q3：学习率怎么选？九、总结学习建议在机器学习中
python开发框架django/flask/fastapi对比研创通之逍遥峰 Python python django flask
Python三大Web开发框架对比：DjangovsFlaskvsFastAPIPython生态系统中有三个主流的Web开发框架：Django、Flask和FastAPI。它们在设计哲学、功能特性和适用场景上各有不同。1.框架概览对比特性DjangoFlaskFastAPI类型全功能框架微框架现代异步框架学习曲线较陡峭平缓中等内置功能ORM,Admin,Auth,模板仅基础路由和模板自动文档,数据
Python中Django处理MySQL事务@transaction.atomic(using=‘default‘, savepoint=True) 蓝小白1024 Django 值得拥有-Python 数据库 python django mysql
Python中Django处理MySQL事务@transaction.atomic(using=‘default’,savepoint=True)fromdjango.dbimporttransaction#导入事务模块在Django中开启MySQL事务有两种方式,一种是使用装饰器,还有一种是使用with(相当于上下文管理器)来开启事务装饰器方式在函数视图中#在函数视图添加一个@transacti
Windows如何安装ComfyUI 俊偉 stable diffusion agi comfyui
ComfyUI是一个用于生成和管理文本到图像（Text-to-Image）的开源项目，基于StableDiffusion模型。它提供了图形用户界面（GUI），使得使用AI生成图像变得更加简单和直观。要在Windows上安装ComfyUI，你可以按照以下步骤进行操作。前提条件1.Python3.10+：ComfyUI需要Python3.10或更高版本。你可以从Python官方网站下载并安装最新版本的
Python装饰器深度解析：提升代码可读性与复用性天天进步2015 python python 开发语言
Python装饰器（Decorator）是提升代码可读性与复用性的强大工具。无论是日志记录、权限校验、性能分析还是缓存机制，装饰器都能让你的代码更加优雅、简洁和高效。本文将深入解析Python装饰器的原理、常见用法、进阶技巧与最佳实践，助你写出更具专业水准的Python代码。目录装饰器的基本原理函数装饰器的常见用法带参数的装饰器类装饰器与方法装饰器装饰器的嵌套与组合进阶技巧：保留元信息与类型提示装
Python性能优化指南：让你的代码提速10倍的实用技巧天天进步2015 python python
Python以其简洁易用著称，但在性能方面常被诟病。其实，通过一些实用的优化技巧，你的Python代码性能完全可以提升数倍甚至十倍。本文将结合实际经验，系统介绍Python性能优化的常见思路与方法，并给出具体案例，助你写出高效的Python程序。1.算法与数据结构优化优先选择合适的数据结构：如查找用set/dict，顺序存储用list。避免不必要的嵌套循环，能用集合操作、字典映射解决的，绝不用暴力
【day51】复习日 daomingwu017 Python打卡训练营内容 python
内容来自@浙大疏锦行python打卡训练营@浙大疏锦行作业：day43的时候我们安排大家对自己找的数据集用简单cnn训练，现在可以尝试下借助这几天的知识来实现精度的进一步提高
FastAPI vs Flask vs Django：Python Web框架全面对比天天进步2015 python python fastapi flask
Python作为最受欢迎的编程语言之一，其Web开发生态极为丰富。FastAPI、Flask和Django是当前主流的三大PythonWeb框架，各有千秋。本文将从架构设计、开发效率、性能表现、生态支持、适用场景等方面，全面对比这三大框架，帮助开发者选择最适合自己的技术栈。目录框架简介架构设计与理念开发效率与易用性性能对比生态与扩展性典型应用场景总结与选型建议参考资料框架简介FastAPI定位：新
DAY 43 复习日 yizhimie37 python训练营打卡笔记深度学习
@浙大疏锦行https://blog.csdn.net/weixin_45655710第一步：寻找并准备图像数据集在Kaggle等平台上，你可以找到大量用于图像分类任务的数据集，例如英特尔图像分类数据集(IntelImageClassification)或手写数字识别数据集(DigitRecognizer)。对于初学者，一个更便捷的选择是使用像TensorFlow或PyTorch这样深度学习框架内
如何在CentOS7上搭建自己的GitLab仓库详解 ytttr873 gitlab
在CentOS7上搭建自己的GitLab仓库的详细步骤如下：更新系统：在开始之前，确保您的系统已经更新到最新版本。打开终端，并执行以下命令：sudoyumupdate-y安装依赖：在安装GitLab之前，需要安装一些依赖项。执行以下命令来安装所需的软件包：sudoyuminstall-ycurlpolicycoreutils-pythonopenssh-server添加GitLab仓库：执行以下命
基于python快速部署属于你自己的页面智能助手小张Tt python 人工智能腾讯云AI代码助手
文章目录前言一、实现目标二、代码解析2.1目录结构2.2后端：Flask服务器的搭建2.2.1安装Flask2.2.2创建Flask应用2.3实现聊天界面与消息交互2.3.1创建聊天界面三、跨域问题的解决3.1安装flask-cors3.2在Flask中启用CORS五效果展示前言 AI聊天机器人已经成为了许多应用场景中的重要组成部分。通过与用户的对话，聊天机器人不仅能够提升用户体验，还能通过不断
Bagel: 开源协作式AI数据管理平台的使用指南 llzwxh888 人工智能 python
Bagel:开源协作式AI数据管理平台的使用指南引言在人工智能和机器学习领域，高质量的数据集对于模型训练和推理至关重要。Bagel作为一个开源的协作式AI数据管理平台，为开发者和研究人员提供了一个强大的工具，用于创建、共享和管理推理数据集。本文将深入探讨Bagel的特性、安装方法以及如何使用它来处理和管理向量数据。Bagel简介Bagel（OpenInferenceplatformforAI）可以
60 python asyncio模块(异步IO) 爬呀爬的水滴 python零基础到入门 python 开发语言前端 asyncio 异步io
一、asyncio概述asyncio是Python标准库中用于编写异步I/O操作的强大模块，特别适用于处理I/O密集型任务。在传统同步编程中，当程序遇到网络请求、文件读写等I/O操作时会阻塞等待，导致资源浪费。而asyncio通过异步编程模型，让程序在等待I/O操作时能同时处理其他任务，极大提升了单线程程序的并发效率。二、asyncio核心概念2.1协程（Coroutine）协程是asyncio的
python日期时间用哪个模块_python模块介绍-datetime介绍：基本的日期和时间类型
待更新介绍gevent是基于协程的Python网络库。特点：基于libev的快速事件循环(Linux上epoll，FreeBSD上kqueue)。基于greenlet的轻量级执行单元。API的概念和Python标准库一致(如事件，队列)。可以配合socket，ssl模块使用。能够使用标准库和第三方模块创建标准的阻塞套接字(gevent.monkey)。默认通过线程池进行DNS查询,也可通过c-ar
python 获取节假日 AI算法网奇 python宝典
www.easybots.cn是不准的，不能用，比如20190913，不能判断节假日#-*-coding:utf-8-*-importjsonimporturllib.requestimporttimeimportdatetimedefa1(date_str):server_url="http://api.goseek.cn/Tools/holiday?date="#server_url="htt
ADIOS2 介绍与使用指南东北豆子哥 HPC/MPI HPC
文章目录ADIOS2介绍与使用指南什么是ADIOS2?ADIOS2的主要特点ADIOS2核心概念ADIOS2安装Linux系统安装Windows安装ADIOS2基本使用C++示例Python示例ADIOS2高级特性并行I/O流模式ADIOS2引擎类型性能优化建议总结ADIOS2介绍与使用指南什么是ADIOS2?ADIOS2(AdaptableInputOutputSystemversion2)是一
核密度估计KDE和概率密度函数PDF（深入浅出）赵孝正深度学习数学基础 pdf KDE
目录1.和密度估计（KDE）核密度估计的基本原理核密度估计的公式核密度估计的应用Python中的KDE实现示例代码结果解释解释结果总结2.概率密度函数（PDF）概率密度函数（PDF）是怎么工作的：用图画来解释解释这个图：问题解答：总结3.核密度估计（KDE）和概率密度函数（PDF）之间的关系故事开始：第一种方法：概率密度函数（PDF）第二种方法：核密度估计（KDE）总结一下：问题解答：1.和密度估
CIANNA由天体物理学家提供/为天体物理学家提供的卷积交互式人工神经网络 struggle2025 神经网络
一、软件介绍文末提供程序和源码下载CIANNA是一个通用的深度学习框架，主要用于天文数据分析。根据天体物理问题解决的相关性添加功能和优化。CIANNA可用于为各种任务构建和训练大型神经网络模型，并提供高级Python接口（类似于keras、pytorch等）。CIANNA的特点之一是它定制实施了受YOLO启发的对象探测器，用于2D或3D射电天文数据产品中的星系探测。该框架通过低级CUDA编程完全实
PyTorch study notes[4]
文章目录thesystemofequationsreferencesthesystemofequationsthedefinitionofmatrixwithmathematicalform.thefollowingsamplecodeexpressesthemaxtrixandsquarematrix.importtorch#从Python列表创建矩阵matrix=torch.tensor([[
Python 移位操作与 C移位操作你搁这儿写bug呢？ Python 移位操作 Python C
在C语言中左移：m>nm>>n表示把m向右移动n位，右移n位时，最右边的n位将被抛弃，最左边空出来的位置使用符号位填充。在Python中右移n位可以定义为除以pow(2,n)，左移n位可以定义为乘以pow(2,n)；对于普通整数是没有溢出检查的,因此若结果的绝对值大于等于pow(2,31)，这个运算会截掉相应的位并且符号位也在移位处理之列.参考：https://www.cnblogs.com/zh
Python的移位运算符墨宇的博客 Python python
Python的移位运算符正整数的移位运算#1.正整数左移相当于乘以二>>>4>>4>>8>>14>>
Python爬虫短视频平台数据抓取：抓取视频和评论技术方案数据狐（DataFox） 2025年爬虫实战项目 python 爬虫开发语言
一、摘要本方案提供完整的Python爬虫实现流程，涵盖短视频平台(以抖音为例)的视频与评论数据采集技术，包含环境配置、核心代码实现及反爬优化策略。通过模拟浏览器操作、API接口分析及数据持久化处理，实现高效合规的数据采集。二、引言短视频平台数据具有巨大商业价值，但直接爬取面临动态渲染、加密参数等反爬机制挑战。本方案采用混合技术路线，结合网页解析与移动端API分析，平衡效率与成功率。三、环境配置基础
Python HTTP日志分析：Nginx/Apache日志的Python解析华科℡云网络协议负载均衡运维
Web服务器日志是监控流量模式、性能瓶颈及安全威胁的关键数据源。Python凭借其丰富的库生态，可高效解析Nginx与Apache的日志格式，实现结构化数据提取与分析。日志格式解析基础Nginx默认采用combined格式，字段包括：$remote_addr（客户端IP）、$time_local（时间戳）、$request（请求方法+URL+协议）、$status（HTTP状态码）、$body_b
Python HTTP服务监控：Prometheus与自定义Exporter开发指南
在微服务架构中，HTTP服务的高效监控对保障系统稳定性至关重要。Prometheus作为云原生监控标杆，通过其Pull模型与灵活的指标体系，结合Python开发的自定义Exporter，可实现HTTP服务性能、可用性及业务指标的全面观测。Prometheus监控核心机制Prometheus采用时间序列数据库存储指标数据，每条数据由指标名称（如http_requests_total）、标签（如met
Host '*' is not allowed to connect to this MariaDB server weixin_34358365 数据库 python
2019独角兽企业重金招聘Python工程师标准>>>MYSQL权限问题原因：安装MySQL时没有勾选“Enablerootaccessfromremotemachines”如何开启MySQL的远程帐号-1）首先以root帐户登陆MySQL在Windows主机中点击开始菜单，运行，输入“cmd”，进入控制台，然后cd进入MySQL的bin目录下，然后输入下面的命令。>MySQL-uroot-p12
Django ORM 1. 创建模型（Model）博观而约取 Python django 数据库 python
1.ORM介绍什么是ORM？ORM，全称Object-RelationalMapping（对象关系映射），一种通过对象操作数据库的技术。它的核心思想是：我们不直接写SQL，而是用Python对象（类/实例）来操作数据库表和记录。ORM就像一个“翻译官”，帮我们把Python代码翻译成数据库能听懂的SQL命令。为什么使用ORM?Django中的ORM提供了一个高层次、抽象化的接口来操作数据库，它的优
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
Python中np.vstack和np.hstack的应用解释
Python中np.vstack和np.hstack的应用解释用法说明对于np.vstack和np.hstack各自有两种用法•第1种：np.vstack((a,b))或np.hstack((a,b))，即常规用法，也就是两个维数相等的ndarray在对应的方向上进行合并•第2种：np.vstack(a)或np.hstack(a)，对一个ndarray在其内部对应的方向上进行合并，这种属于非常规用
python np.hstack gz153016 python语法总结
importnumpyasnparr1=np.array([1,2,3])arr2=np.array([4,5,6])#print('np.vstack((arr1,arr2)):',np.vstack((arr1,arr2)))print('np.hstack((arr1,arr2)):',np.hstack((arr1,arr2)))#np.hstack((arr1,arr2)):[12345
Python个人学习基础笔记-3.爬虫（1）孜宸润泽 python 学习笔记
一.爬虫的定义爬虫（crawler/spider）是模拟浏览器行为，按照编写规则，自动接收网页信息的工具。通常而言爬虫首先从初始URL集选择URL，向目标网页发起请求，获取网页的HTML源码，然后将获取的数据进行解析过滤，保存我们所需要的标题、内容等，最后提取新的URL加入待爬序列。爬虫常见所需要的库包括Request库、BeautifulSoup4库、Scrapy库和Selenium库等。二.R
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

机器学习实战2（有监督的机器学习）

文章目录

机器学习实战：MNIST手写数据识别：分类应用入门

1. 如何引入MNIST手写数据并确认读入成功。

1.1 针对版本是TF1但是属于1中比较高的版本的，比如1.15.0版本。

1.2 针对版本是TF2版本的处理办法。

1.3 对读入的数据的测试：

1.3.1 查看读入的数据的形状：

1.3.2 像列表一样取单个数据：

1.3.3 单幅图片的可视化的实现

1.3.4 对独热编码进行取值

1.3.5 一次性读取多条数据

1.3.6 tf.random_normal()用于参数自动赋初值。

2. 模型的构建。

1.占位符的确定

2.变量的确定

3.前向计算和结果分类（Softmax分类）

4.损失函数的选择。

对数损失函数。

交叉熵损失函数。

3. 模型的训练。

超参数的定义

优化器的选择

准确率的设计（用来监控训练效果的另一个参数）

模型训练的主体：

4. 模型评估，模型应用与可视化。

关于损失值和准确值的可视化

模型的评估

详细解析模型应用的可视化函数

参数的考虑

陌生函数的介绍

plt.gcf()

fig.set_size_inches()

ax = plt.subplot(5, 5, i+1)

ax.set_title(title,fontsize=10)

ax.set_xticks([]) / ax.set_yticks([])

预测数据的可视化展示

你可能感兴趣的:(机器学习,python,tensorflow,matplotlib,机器学习)