cx-young

【吴恩达老师《机器学习》】课后习题3之【逻辑回归解决多分类】与【神经网络】笔记(代码注释详细)

本次习题所用到的数据，#数据集：ex3data1.mat，参数：ex3weights.mat。在文章开头，下载即可！

逻辑回归解决多分类问题

二分类VS多分类

在机器学习中，分类是一种监督学习任务，其中我们试图预测目标变量的离散值。二分类和多分类是分类问题中两种最常见的形式。

二分类问题：
二分类问题是指需要从两个互斥的类别中选择一个类别的问题。也就是说最终的数据的标签只有两个分类，非此即彼。例如
- 将电子邮件分类为垃圾邮件或非垃圾邮件
- 将患者分类为患有某种疾病或没有患该疾病等都属于二分类问题。
在二分类问题中，通常使用逻辑回归、支持向量机（SVM）和决策树等模型进行建模。
多分类问题：
多分类问题是指需要从多个类别中选择一个类别的问题。例如
- 将一张图片分类为苹果、梨子、香蕉或橙子
- 手写数字识别0-9等都属于多分类问题。
在多分类问题中，通常使用softmax回归、决策树等模型进行建模。在深度学习中，常用的多分类算法包括卷积神经网络（CNN）、循环神经网络（RNN）等。

需要注意的是，在二分类问题中，可以使用多种方法来与该问题等效地处理多分类问题。例如，通过对多个二分类模型输出的概率进行组合，可以得到多分类模型。在本质上，多分类问题是二分类问题的一种特殊情况。

作业案例内容

案例：手写数字识别 0-9
注意：提供的原始数据中，y的取值为1-10，y=10表示当前数字为0
案例数据 ex3data1.mat
matlab的一种数据格式。MATLAB是一种数值计算引擎和编程语言，被广泛用于科学计算、工程和技术领域。MATLAB可以读取和处理各种数据格式，其中 .mat 是常见的一种格式。.mat 文件是一种二进制文件格式，可以存储多种类型的数据，包括数值、字符、逻辑和结构体等。

由于我们要处理的案例是10分类问题，使用逻辑回归来解决，处理这些数据，需要建立10个分类器，每个分类器需要判别当前这个数据的内容是否属于其中的一个类别，例如分类器1用来判断为数字1的概率，以此类推

一些用到的知识点

Scipy

导入了Scipy，下面是来自网络搜索的关于Scipy的一些知识点

Scipy：是一个高级的科学计算库，它与Numpy联系很密切
Scipy一般都是操控Numpy数组来进行科学计算
Scipy有很多子模块可以应对不同的应用，例如插值运算、优化算法、图像处理、数学统计等
scipy.io:数据输入输出
loadmat ：是 SciPy 库中的一个函数，可以用于从 MATLAB .mat 文件中读取数据，将其转换成 Python 对象并返回。一般如下展示

# 通过 loadmat 函数读取了名为 data.mat 的文件中的数据。
# 函数返回的是一个 Python 字典，其中包含了文件中所有变量名及其对应的值。
	import scipy.io as sio 
	sio.loadmat('data.mat')

矩阵相乘

矩阵乘积
C=A⋅B,矩阵乘积是两个矩阵之间的运算，它将两个矩阵中的对应元素相乘，并将这些乘积相加得到一个新的矩阵。
对于二维矩阵，矩阵乘积，对于一维矩阵，内积

np.dot(A,B)
np.matmul(a,b）
a @ b

数量积
也称点积或内积，是两个向量的对应分量逐一相乘，再将相乘结果相加得到的标量值

np.multiply(A,B) 或 *

数量积是两个向量对应分量的乘积相加，结果是一个标量。而矩阵乘积是利用两个矩阵中的元素进行相乘和相加的操作，结果是另一个矩阵。

1.导包

# 导包
import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio

2.读取数据

data = sio.loadmat('ex3data1.mat')
print(data)  # 查看数据data，格式

如下图展示，data是字典格式，逗号是把字典项之间进行隔开，冒号前即红色的key，冒号后即黄色的是value

# 查看data的类型 字典类型
print(type(data))  # 

# 获取data下所有的key的值
print(data.keys())  # dict_keys(['__header__', '__version__', '__globals__', 'X', 'y'])

# 取data中key值为X的数据
raw_X = data['X']

# 取data中key值为y的数据
raw_y = data['y']

# 查看raw_X，raw_y的维度
print(raw_X.shape, raw_y.shape)  # (5000, 400) (5000, 1)
# (5000, 400) 意思是5000个训练样例，特征是400维的 由于我们输入的是一张张的图片，
# 其中20×20像素灰度图像的数字，每个像素由一个浮点数表示，该浮
# 点数表示该位置的灰度强度。其实每个训练样例是一个20*20像素的网格被展开成400维的向量。
# 将二维的像素矩阵展平为一维向量。
# (5000, 1)

随机打印一张图片

# 随机的打印一张图片
def plot_an_image(X):
    # 从 0 到 4999 中随机选择一个整数
    pick_one = np.random.randint(5000)
    # 取出这个图片,pick_one表示训练样例所处行，逗号后面的冒号表示取该行的所有列
    image = X[pick_one, :]
    # 画出该图片
    # 使用fig对象来设置整个图形的属性，如图形大小、标题等；
    # 而使用ax对象来绘制具体的图形元素，如曲线、散点图等。
    # figsize=(1, 1)设置图片尺寸
    fig, ax = plt.subplots(figsize=(1, 1))
    # imshow   Matplotlib的一个函数，把图像数据可视化为20x20像素的灰度图像。
    # reshape维度的变化，恢复成（20，20）
    # .T转置是为了正着显示
    ax.imshow(image.reshape(20, 20).T, cmap='gray_r')
    # 不想显示x或y轴的刻度
    '''plt.yticks([]) 是Matplotlib库中的一个函数，用于设置y轴刻度。
    其中，传入一个空的列表（[]）作为参数，表示将y轴上的刻度设置为空，
    即不显示y轴的任何刻度。以达到更好的可视化效果。'''
    plt.xticks([])
    plt.yticks([])
    plt.show()

plot_an_image(raw_X)

运行结果：

随即打印100张图片

def plot_100_image(X):
    # 从0到len(X)-1的整数范围内随机选择100个整数
    sample_index = np.random.choice(len(X), 100)
    print(sample_index)
    images = X[sample_index, :]
    print(type(images))  # 
    print(images.ndim)  # 2维
    print(images.shape)  # (100, 400)
    # 画出这一百个图片
    # sharex=True 指定子图共享x轴 使用相同的x轴刻度和范围
    fig, ax = plt.subplots(nrows=10, ncols=10, figsize=(8, 8), sharex=True, sharey=True)

    # 显示图像
    for r in range(10):
        for c in range(10):
            # imshow函数将该位置上的图像数据可视化为20x20像素的灰度图像。
            # 10 * r + c计算当前子图所对应的图像位置
            # images[10 * r + c]，这是因为images中的图像被扁平化表示为了一维行向量，而不是按照二维图像进行排列的。
            # 因此，我们需要通过索引计算来获取图像数据的位置，而不是直接使用行列索引。
            # 对于一维数组，只能使用行索引来获取对应位置上的元素，所以需要使用10 * r + c来获取所需的图像位置。
            ax[r, c].imshow(images[10 * r + c].reshape(20, 20).T, cmap='gray_r')
    # 不显示xy轴的刻度
    plt.xticks([])
    plt.yticks([])
    plt.show()


plot_100_image(raw_X)

运行结果：

3.损失函数和梯度向量

# 以前是选择损失函数，使用梯度下降函数去最小化损失函数，本次非也
def sigmoid(z):
    return 1 / (1 + np.exp(-z))


# theta在此要放到第一位，因为分类器那里用到的函数theta是作为要优化的参数，其他的参数是args
def costFunction(theta, X, y, lamda):
    A = sigmoid(X @ theta)

    first = y * np.log(A)
    second = (1 - y) * np.log(1 - A)
    # reg = np.sum(np.power(theta[1:], 2)) * (lamda / (2 * len(X)))
    reg = theta[1:] @ theta[1:] * (lamda / (2 * len(X)))
    return -np.sum(first + second) / len(X) + reg


# 梯度下降不需要整个迭代过程了
# 只需要梯度向量
def gradient_reg(theta, X, y, lamda):
    reg = theta[1:] * (lamda / len(X))
    # 向 reg 数组的第一行插入一个值为 0 的元素。
    reg = np.insert(reg, 0, values=0, axis=0)
    # wj = wj - a * 梯度向量 它是一个 n×1 的列向量，其中 n 是参数向量 θ 的长度。
    first = (X.T @ (sigmoid(X @ theta) - y)) / len(X)
    return first + reg

4.数据处理

# 数据处理
# 将输入数据 X 矩阵中的第一列插入一个值为 1 的向量
# 这个向量代表偏置项（bias term），也就是偏移量或截距
# 在每个样本的特征向量前面添加一个 1，表示该特征向量中的偏置项取值为 1
# 添加偏置项1，可以将模型中的截距项权重独立出来，方便模型的求解和表达。
# 同时，添加偏置项也可以使得模型对数据集的拟合能力更强，提高模型的泛化能力。
X = np.insert(raw_X, 0, values=1, axis=1)
# 对y进行降维 算准确率的时候比较方便
y = raw_y.flatten()
print(X.shape)  # (5000, 401)
print(y.shape)  # (5000,)

5.多分类算法

# 多类分类算法 一对多策略思想
# 输入：
# 1.训练数据集X，形状为(m,n)m表示样本个数，n表示特征向量
# 2.训练数据集对应的标签y 形如(m,),其中yi属于{1,2,...,K}表示第i个样本所属的类别
# 3.正则化系数lamda，用于防止过拟合
# 4.样本类别数K
# 输出：
# 每个类别对应的模型参数theta
def one_vs_all(X, y, lamda, K):
    # 获取特征数量n
    n = X.shape[1]
    # 初始化一个 K x n 的模型参数矩阵，表示K个类别对应的模型参数，其中n是特征数量
    theta_all = np.zeros((K, n))
    # for循环遍历每一个类别i属于{1,2,...,K}
    for i in range(1, K + 1):
        # 对于每个类别i，初始化一个n维的参数theta_i
        theta_i = np.zeros(n, )
        # 对于当前类别i，使用TNC算法训练逻辑回归模型，得到对应的theta_i
        # TNC 算法是一种优化算法，用来寻找损失函数的最小值
        res = minimize(fun=costFunction,  # 损失函数，用于计算损失值
                       x0=theta_i,  # 初始参数theta_i
                       args=(X, y == i, lamda),  # args:其他参数，包括训练集X，样本标签y == i和正则化系数lamda
                       method='TNC',  # 优化算法，此处使用的TNC算法
                       jac=gradient_reg)  # jac：梯度函数，用于计算梯度值
        # 将得到的theta_i存放到模型参数矩阵的第i-1行(因为数组下标从0开始)
        theta_all[i - 1, :] = res.x
    # 返回模型参数矩阵
    return theta_all


lamda = 1
K = 10
theta_final = one_vs_all(X, y, lamda, K)
print(theta_final)

theta_final：

6.预测

# 预测
# X 测试样本集，形状为  (m,n)，其中 m 表示样本个数，n 表示特征数量
# theta_final 模型参数矩阵，形状是(K,n),K是样本类别数，即在训练过程中所得到的参数矩阵
def predict(X, theta_final):
    # X:(5000,401) theta_final(10,401)所以要转置  最后m x K的矩阵h是(5000,10)的矩阵
    h = sigmoid(X @ theta_final.T)
    # print(h.shape)  # (5000, 10)

    # axis=1意味着按行求最大值的下标，
    # 即将每个样本的预测概率(即h中的每一行)和它们对应的类别(即h中的每一列)进行比较
    # 找到概率最大的那个类别所在的列下标

    # 假设有3个测试样本，他属于4个类别的概率为：
    # h = [[0.2, 0.1, 0.5, 0.2],
    #      [0.6, 0.1, 0.2, 0.1],
    #      [0.3, 0.3, 0.2, 0.2]]那么np.argmax(h, axis=1)将返回一个长度为3的一维数组，即(3,)其中的元素分别2,0,0

    # np.argmax(h, axis=1)返回结果是一个一维数组，记录了每个行向量中最大值所在的索引，因此输出的数组形状应该是一个长度为 m 的一维数组
    h_argmax = np.argmax(h, axis=1)
    print(h_argmax.shape)  # 本题是(5000,)
    # np.argmax() 返回的索引是从 0 开始的，而在逻辑回归模型的实现中，类别编号是从 1 开始的，
    # 因此我们需要将它们加上 1，使得 h_argmax 表示每个测试样本所属的实际类别
    return h_argmax + 1


y_pred = predict(X, theta_final)
acc = np.mean(y == y_pred)
print(acc)  # 0.9446

神经网络实现前向传播

神经网络多分类问题。
本案例的主要目的是为了了解神经网络的传递过程，即了解神经网络如何从输入层传递到最后一层，并进行输出的，参数权重是已经训练好的，拿来用就行，并没有很复杂的推导过程，如果想知道怎样推导的，继续学下去。

图片来自网络
a(1)是输入层，(m,n+1)：+1是因为偏置项，也就是本来n个特征，加了一个特征
权重参数θ1(n+1,s),s是隐藏层的单元个数，也要加偏置项
g是激活函数，θ2(s,k) k最终输出类别
a(3) 最终预测值

1.导包

# 数据集：ex3data1.mat
# 参数：ex3weights.mat
import numpy as np
import scipy.io as sio

2.读取数据

data = sio.loadmat('ex3data1.mat')
raw_X = data['X']
raw_y = data['y']

# 插入偏置项
# 即在特征矩阵raw_X的第一列(即axis=1)插入一个元素值为1的列向量，这个元素通常被称为偏置项，用来对应线性回归模型中的截距
X = np.insert(raw_X, 0, values=1, axis=1)
print(X.shape)  # (5000, 401)
y = raw_y.flatten()
print(y.shape)  # (5000,)
# 获取权重参数theta
theta = sio.loadmat('ex3weights.mat')
print(theta.keys())  # dict_keys(['__header__', '__version__', '__globals__', 'Theta1', 'Theta2'])
theta1 = theta['Theta1']  # 输入层到隐藏层的权重参数
theta2 = theta['Theta2']  # 隐藏层到输出层的权重参数
# 查看维度
print(theta1.shape, theta2.shape)  # theta1:(25, 401) (n+1,s)s是隐藏层的单元个数，也要加偏置项 theta2:(10, 26)(s, k)

3.实现前向传播

# 激活函数
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# 输入层 对输入数据X进行预处理，将其插入偏置项1后的X赋值给a1
a1 = X
print(X.shape)  # (5000, 401)(m,n+1)
# 通过第一层(隐藏层)的权重矩阵theta1 将输入数据映射到隐藏层进行计算
# 得到隐藏层的输入值z2和经过激活函数处理的激活值a2
z2 = X @ theta1.T
# 激活函数使用的sigmoid函数，它将z2映射到[0,1]区间内
a2 = sigmoid(z2)  # 激活函数
print(a2.shape)  # (5000, 25)

# 将偏置项1插入到a2中，得到新的矩阵a2
a2 = np.insert(a2, 0, values=1, axis=1)
print(a2.shape)  # (5000, 26)

# 根据第二层(输出层)的权重矩阵theta2，将经过第一层隐藏层的输出值a2映射到输出层进行计算
z3 = a2 @ theta2.T
# 得到输出层的输入z3和经过激活函数处理的激活值a3
a3 = sigmoid(z3)  # 最终预测值
print(a3.shape)  # (5000, 10)

4.查看准确率

# 根据模型的输出a3，通过np.argmax(a3, axis=1)函数，找到每个样本在10个类别中概率最大的预测标签
y_pred = np.argmax(a3, axis=1)
y_pred = y_pred + 1
# 计算准确率
# 将预测标签的平均值与实际标签进行比较，如果相同则认为预测准确
acc = np.mean(y_pred == y)
print(acc)  # 0.9752

感谢https://www.bilibili.com/video/BV1mt411p7kG?p=1&vd_source=b3d1b016bccb61f5e11858b0407cc54e

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
UNIX域套接字
1、UNIX域套接字的定义UNIX域套接字是进程间通信（IPC）的一种方式，不涉及网络协议栈，因此在同一台主机上的通信中，它比基于TCP/IP协议的网络套接字更快速、更高效。2、UNIX域套接字的分类字节流套接字（SOCK_STREAM）：提供面向连接的、可靠的数据传输服务。数据报套接字（SOCK_DGRAM）：提供无连接的数据传输服务，数据以独立的数据报形式传输。3、UNIX套接字与TCP/IP
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
V少JS基础班之第五弹 V少在逆向 JS基础班 javascript 开发语言 ecmascript
文章目录一、前言二、本节涉及知识点三、重点内容1-函数的定义2-函数的构成1.函数参数详解1）参数个数不固定2）默认参数3）arguments对象（类数组）4）剩余参数（Rest参数）5）函数参数是按值传递的6）解构参数传递7）参数校验技巧（JavaScript没有类型限制，需要手动校验）2.函数返回值详解3-函数的分类1-函数声明式：2-函数表达式：3-箭头函数：4-构造函数：5-IIFE：6-
Python爬虫实战：利用最新技术爬取B站直播数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 html 百度
1.B站直播数据爬取概述B站(哔哩哔哩)是中国最大的年轻人文化社区和视频平台之一，其直播业务近年来发展迅速。爬取B站直播数据可以帮助我们分析直播市场趋势、热门主播排行、观众喜好等有价值的信息。常见的B站直播数据类型包括：直播间基本信息(标题、分类、主播信息)实时观看人数与弹幕数据礼物打赏数据直播历史记录分区热门直播数据本文将重点介绍如何获取直播间基本信息和分区热门直播数据。2.环境准备与工具选择2
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
不同行业的 AI 数据安全与合规实践：7 大核心要点全解析观熵人工智能 DeepSeek 私有化部署
不同行业的AI数据安全与合规实践：7大核心要点全解析关键词AI数据安全、行业合规、私有化部署、数据分类分级、国产大模型、隐私保护、DeepSeek部署摘要随着国产大模型在金融、医疗、政务、教育等关键领域的深入部署，AI系统对数据安全与行业合规提出了更高要求。本文结合DeepSeek私有化部署实战，系统梳理当前各行业主流的数据安全合规标准与落地策略，从数据分类分级、访问控制、审计追踪到敏感信息识别与
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
STM32 ADC详解月入鱼饵 stm32 嵌入式硬件单片机
本文介绍stm32ADC的使用，本文较长，可以配合目录跳转到需要的地方阅读。ADC转换原理本文重点在于STM32的ADC的使用，介绍ADC转换原理是为了更好理解STM32中关于ADC的配置，所以这里只是简单介绍一下ADC的转换原理，想详细了解ADC的转换原理可以看看看完这篇文章，终于搞懂了ADC原理及分类！和ADC基本工作原理-CSDN。简单来说，模拟信号输入进来，经过低通滤波操作预处理信号之后，
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
c++中迭代器的本质三月微风 c++开发语言
C++迭代器的本质与实现原理迭代器是C++标准模板库(STL)的核心组件之一，它作为容器与算法之间的桥梁，提供了统一访问容器元素的方式。下面从多个维度深入解析迭代器的本质特性。一、迭代器的基本定义与分类迭代器的本质迭代器是一种行为类似指针的对象，用于遍历和操作容器中的元素。它提供了一种统一的方式来访问不同容器中的元素，而无需关心容器的具体实现细节。标准分类体系C++标准定义了5种迭代器类型，按功能
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
udev 规则文件命名规范奇妙之二进制 #嵌入式/Linux linux 网络运维
文章目录udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的基本概念二、udev规则文件名的规范与含义1.文件名格式规范2.名称各部分的含义3.文件扫描路径三、为何规则文件名通常以数字开头？1.执行顺序的精确控制2.便于分类和管理3.兼容性与标准化四、示例与实践建议1.常见规则文件示例2.自定义规则命名建议五、总结udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的
Ollama平台里最流行的embedding模型： nomic-embed-text 模型介绍和实践 skywalk8163 人工智能 embedding 人工智能服务器
nomic-embed-text模型介绍nomic-embed-text是一个基于SentenceTransformers库的句子嵌入模型，专门用于特征提取和句子相似度计算。该模型在多个任务上表现出色，特别是在分类、检索和聚类任务中。其核心优势在于能够生成高质量的句子嵌入，这些嵌入在语义上非常接近，从而在相似度计算和分类任务中表现优异。之所以选用这个模型，是因为在Ollama网站查找这个模型，发现
Flink 2.0 DataStream算子全景 Edingbrugh.南空大数据 flink flink 人工智能
在实时流处理中，ApacheFlink的DataStreamAPI算子是构建流处理pipeline的基础单元。本文基于Flink2.0，聚焦算子的核心概念、分类及高级特性。一、算子核心概念：流处理的"原子操作1.数据流拓扑（StreamTopology）每个Flink应用可抽象为有向无环图（DAG），由源节点（Source）、算子节点（Operator）和汇节点（Sink）构成，算子通过数据流（S
财政业务知识库目录分类实践 alankuo 人工智能
财政业务知识库的目录分类是实现知识有序管理、高效检索和精准应用的核心环节，需结合财政业务的专业性、系统性和动态性，兼顾业务逻辑、用户需求和管理实践。以下从分类原则、核心框架、实践要点三个方面，结合财政业务特点展开具体实践说明。一、财政业务知识库目录分类的核心原则在实践中，目录分类需遵循以下原则，确保分类逻辑清晰、实用高效：业务关联性：以财政核心业务流程和管理领域为基础，确保分类与实际工作场景紧密贴
微信小程序开发：从漫画阅读到商业变现永远的12
本文还有配套的精品资源，点击获取简介：微信小程序作为一种轻量级应用平台，在无需下载安装的情况下提供便捷服务，尤其在漫画阅读领域得到广泛应用。本文介绍了微信小程序的基础开发框架，包括WXML、WXSS和JavaScript的使用，以及漫画小程序的核心功能设计，如漫画分类、搜索、详情展示、阅读模式等。同时，探讨了在小程序中加入广告ID以实现商业变现，包括广告组件的集成和广告政策的遵守。最后，强调了漫画
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【一文了解】C#基础-集合
目录集合1.集合分类1.1.非泛型集合1.2.泛型集合1）列表（List）2）字典（Dictionary）3）队列（Queue）4）栈（Stack）5）哈希集合（HashSet）2.集合的常见操作3.区分泛型集合与非泛型集合3.1.非泛型集合1）优点2）缺点3.2.泛型集合1）优点2）缺点总结本篇文章来学习一下集合，C#集合主要分为非泛型集合与泛型集合。集合集合（Collection）是一种用于存
C#集合：从基础到进阶的全面解析阿蒙Armon C#继续学习 c#windows linux
C#集合：从基础到进阶的全面解析在C#编程中，集合是处理数据集合的核心工具。无论是存储一组对象、实现缓存机制，还是处理复杂的数据结构，都离不开集合的灵活运用。本文将全面深入地探讨C#集合体系，从基础概念到高级技巧，帮助开发者掌握集合的精髓，写出更高效、更优雅的代码。一、集合概述与分类C#集合框架是.NET类库的重要组成部分，它提供了一系列用于存储和操作数据的类和接口。与数组相比，集合具有动态扩容、
短剧小程序开发全攻略：从0到1打造爆款内容平台 weixin_lynhgworld 小程序短剧
核心内容：行业趋势分析：短剧市场年增长率超300%，用户规模突破5亿，抖音、快手等平台加速布局。小程序成为短剧分发核心渠道：轻量化、低成本、社交裂变优势显著。开发核心功能模块：内容管理：支持多格式上传、分集管理、标签分类。播放体验优化：弹幕互动、倍速播放、清晰度切换、离线缓存。付费系统：单集付费、会员订阅、广告解锁等多元化盈利模式。社交裂变：分享奖励、邀请排行榜、拼团观影功能。技术实现难点：视频流
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
一文读懂HarmonyOS知识地图，开启鸿蒙开发新征程大雨淅淅 #HarmonyOS开发 harmonyos 华为
目录一、HarmonyOS知识地图是什么？二、HarmonyOS基础概念速览（一）起源与发展（二）核心特性（三）技术架构剖析1.内核层2.系统服务层3.框架层4.应用层三、HarmonyOS知识地图板块解读（一）开发基础知识1.应用程序包2.应用配置文件3.资源分类与访问4.ArkTS语言基础（二）UI开发知识1.方舟开发框架（ArkUI）2.布局与组件3.动画与交互（三）应用模型与能力1.Abi
华为L1-L6流程体系核心框架 jmoych 华为大数据数据库
最近项目上讨论流程体系比较多，结合前面笔者发布的关于流程的文章，今天将华为的L1-L6流程体系简单分享一下，该体系是企业级流程管理的核心框架，通过分层设计实现战略到执行的垂直贯通。想获取完整资料的朋友，可加入知识星球，会员可无限制下载所有资料。流程分类框架体系设计应该梳理到L5还是L6?面向离散制造企业复杂业务，流程体系建设覆盖从L1到L5/L6的全层级框架？以下从架构设计、功能定位、层级关系三个
全网最全100道C语言高频经典面试题及答案解析：C语言程序员面试题库分类总结猿享天开学懂C语言-C语言从入门到精通 c语言 c++面试
前言在计算科学领域，C语言犹如一座横跨硬件与软件的桥梁——其简洁的语法背后，承载着操作系统、数据库、嵌入式系统等基础软件的运行命脉。当开发者面对大厂面试中"用户态与内核态切换的开销量化"或"自旋锁在NUMA架构下的性能陷阱"等深度问题时，仅凭教科书知识往往难以应对。本文正是为解决这一痛点而生。我们摒弃传统面试题集的简单罗列模式，精选100个直指系统编程本质的问题，每个案例均包含：工业级场景还原：基
SQL 索引与日志知识点详解及练习题
索引和日志在数据库的高效运行和数据安全中扮演着重要角色。下面我们详细梳理索引和日志的相关知识，并通过练习题加深理解。一、知识点梳理（一）索引基本概念：索引是为了加速查询的数据结构，其数据结构为B+树。B代表Balance（平衡），数据保存在叶子结点中。分类主键索引：唯一标识一行，不允许为空，一张表只能有一个主键。唯一索引：标识一行，允许为空，一张表可以有多个唯一索引。普通索引：允许重复和空值。联合
android mvvm官方demo,Android mvvm架构demo(DataBinding+LiveData+ViewModel+ Repository)
1.实现效果实现页面加载Bing每日一图的功能2.项目结构image(忽略没有按分类创建).png3.实现过程1.注入依赖//ViewModel与LiveDataimplementation"android.arch.lifecycle:extensions:1.1.1"//图片加载implementation'com.github.bumptech.glide:glide:4.9.0'//网络请
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

【吴恩达老师《机器学习》】课后习题3之【逻辑回归解决多分类】与【神经网络】笔记(代码注释详细)

逻辑回归解决多分类问题

二分类VS多分类

作业案例内容

一些用到的知识点

Scipy

矩阵相乘

1.导包

2.读取数据

随机打印一张图片

随即打印100张图片

3.损失函数和梯度向量

4.数据处理

5.多分类算法

6.预测

神经网络实现前向传播

1.导包

2.读取数据

3.实现前向传播

4.查看准确率

你可能感兴趣的:(机器学习,机器学习,逻辑回归,分类)