梆子井欢喜坨

李宏毅2020机器学习深度学习(2) 分类笔记+作业

1. 背景知识
- 1.1 数学基础回顾
- 1.2 用MLE估计类别分布中的参数
- 1.3 二分类问题与logistic激活函数
- 1.4 判别模型与logistic回归
- 1.5 总结判别式模型和生成模型
- 1.6 朴素贝叶斯分类器
2. 作业描述
3. 数据预处理
4. 使用logistic回归
- 4.1 建立模型
- 4.2 完整代码
5. 使用生成模型
- 5.1 建立模型
- 5.2 完整代码

1. 背景知识

1.1 数学基础回顾

方差用来度量随机变量和其数学期望（即均值）之间的偏离程度，而协方差则一般用来度量两个随机变量的相似程度
方差的计算公式为：
协方差的计算公式为：
方差可视作随机变量x关于其自身的协方差
对于这些随机变量，我们还可以根据协方差的定义，求出两两之间的协方差
因此，协方差矩阵为


交叉熵：

极大似然估计：

1.2 用MLE估计类别分布中的参数

线性回归不能很好地完成分类任务，以二元分类为例，二维平面右下角的样本会干扰回归模型的参数

理想的解决方法是找到一个函数g(x)，根据g(x)的大小分类

现在假设某一类的所有的样本都由一个多元高斯分布抽样得到。（假设的是P(x|C)符合多元高斯分布）

然后要试图找到这个高斯分布**( 用MLE最大似然估计 )。**

发现最优解很符合我们的想象。

找到每一类数据对应的分布之后。

就可以计算一个新数据，属于某一类的概率，进而可以完成分类任务

让两个类对应的高斯分布使用同一个协方差矩阵，边界会变成一条直线

1.3 二分类问题与logistic激活函数

从后验概率引出sigmoid函数

省略数学推导，一顿变形
又出现了我们喜欢的线性回归的形式

这里解释了为什么协方差矩阵相同时，分界线会是线性的。
在生成模型中，我们需要估计高斯分布的参数，带入上式，计算w.x + b，进而计算P(C1|x)
那么能否直接寻找w和b呢？
带着这个问题，进入下一节

1.4 判别模型与logistic回归

假设一组训练数据如下：

某一组w，b产生这组训练数据的概率为：

依旧由最大似然的思想求使L(w,b)最大的w，b的值，等效于求右式

化简计算后可得

对wi求偏导，根据链式法则，先对z求偏导

最终化简结果如下

注：x $_i^n$ 为第n个输入数据的第i个维度，求和是对所有n个输入数据求和
与线性回归作比较

1.5 总结判别式模型和生成模型

两种方法找出的w, b不会是同一组

生成式模型的优点

1.6 朴素贝叶斯分类器

朴素贝叶斯分类器采用了“属性条件独立性假设”，假设所有属性相互独立。换言之，每个属性独立地对分类结果发生影响。

下例为使用朴素贝叶斯产生的反常识结果，因为它认为所有的特征条件都是独立的，抽样够多时在class2中也会得到（1，1）的结果。两类样本分布的不均衡也对预测结果产生了影响。
这样的假设也是引入的先验知识。

2. 作业描述

根据人们的个人资料，做一个二元分类，判断其年收入是否高于50000美元。
不妨认为收入大于50000美元的预测值为1，反之则为0。

3. 数据预处理

数据如图所示

train.csv 和 test_no_label.csv为原始资料
实际用到的为X_train、Y_train 和 X_test这3个处理过的数据集
读取X_train，可见许多属性的值已经被自动替换为0和1，一共有510个特征决定最后的分类结果

4. 使用logistic回归

4.1 建立模型

系数矩阵w和偏差值b由梯度下降法得到

4.2 完整代码

详细过程请看注释

import  numpy as np
import matplotlib.pyplot as plt

def _normalize(X, train = True, specified_column = None, X_mean = None, X_std = None):
    # 这个函数用于标准化输入数据的特定列
    # 训练数据的平均值与标准差将在处理测试数据时重复使用
    # 
    # 参数Arguments:
    # X: 待处理数据
    # train: 'True'表示处理训练数据，'False'表示处理测试数据
    # specific_column: 需要标准化处理的列索引，如果为'None',则处理所有列
    # X_mean: 训练数据的平均值
    # X_std: 训练数据的标准差
    # 输出Outputs:
    # X：标准化后的数据
    # X_mean: 计算出的训练数据平均值
    # X_std: 计算出的训练数据标准差
    if specified_column == None:
        specified_column = np.arange(X.shape[1]) # 计算列数
    if train:
        # 计算每列的平均之后变为一行
        X_mean = np.mean(X[:, specified_column], 0).reshape(1, -1)
        # 计算每列的标准差后变为一行
        X_std = np.std(X[:,specified_column], 0).reshape(1, -1)
    X[:, specified_column] = (X[:, specified_column] - X_mean)/(X_std + 1e-8)
    return X, X_mean, X_std

def _train_dev_split(X, Y, dev_ratio = 0.25):
    # 此函数将数据切分training set和development set
    # 注：development set：用来对训练集训练出来的模型进行测试，通过测试结果来不断地优化模型。
    # test set：在训练结束后，对训练出的模型进行一次最终的评估所用的数据集。
    train_size = int(len(X) * (1 - dev_ratio))
    return X[:train_size],Y[:train_size],X[train_size:], Y[train_size:]

def _shuffle(X, Y):
    # 生成两个等长的随机列表
    randomize = np.arange(len(X))
    np.random.shuffle(randomize)
    return (X[randomize], Y[randomize])

def _sigmoid(z):
    # 用于预测的sigmoid函数
    # 限制输出值的范围为1e-8, 1-(1e-8)
    return np.clip(1 / (1.0 + np.exp(-z)), 1e-8, 1 - (1e-8))

def _f(X, w, b):
    # 这是一个逻辑回归函数
    # 
    # 参数
    # X: 输入数据, shape = [batch_size, data_dimension]
    # w: weight vector, shape = [data_dimension, ]
    # b: 偏置 bias, scalar
    # 输出
    # 预测X的每行被预测为1的概率，shape = [batch_size, ]
    return _sigmoid(np.matmul(X, w) + b) # 两个numpy数组的矩阵相乘

def _predict(X, w, b):
    # 根据逻辑回归结果预测分类
    # 实际利用了round函数的四舍五入，将结果输出为0, 1
    return np.round(_f(X, w, b)).astype(np.int)

def _arruracy(Y_pred, Y_label):
    # 计算预测准确度
    acc = 1 - np.mean(np.abs(Y_pred - Y_label))
    return acc

def _cross_entropy_loss(y_pred, Y_label):
    # 此函数计算交叉熵
    #
    # 参数
    # y_pred: 概率预测结果, float vector
    # Y_label: 真实标签, bool vector
    # Output:
    #  cross_entropy, 标量
    cross_entropy = -np.dot(Y_label, np.log(y_pred)) - np.dot((1 - Y_label), np.log(1 - y_pred))
    return cross_entropy

def _gradient(X, Y_label, w, b):
    # 此函数计算交叉熵对于w和b的偏导数
    y_pred = _f(X, w, b)
    pred_error = Y_label - y_pred
    #星乘表示矩阵内各对应位置相乘，矩阵a*b下标(0,0)=矩阵a下标(0,0) x 矩阵b下标(0,0)
    # 点乘表示求矩阵内积，二维数组称为矩阵积（mastrix product）。
    # w_grad = -np.sum(pred_error * X.T, 1)
    w_grad = -np.dot(X.T, pred_error)   # 这两种写法都可以
    b_grad = -np.sum(pred_error)
    return w_grad, b_grad

def _plot_curve(train, dev, title, legend, figname):
    # 绘图
    plt.plot(train)
    plt.plot(dev)
    plt.title(title)
    plt.legend(legend)
    plt.savefig('########' + figname)
    plt.show()


if __name__ == "__main__":
    np.random.seed(0)
    X_train_fpath = '#######/X_train'
    Y_train_fpath = '#######/Y_train'
    X_test_fpath = '#######/X_test'
    output_fpath = '#######/output_{}.csv'

    # 将csv文件复制入numpy array中
    # Python strip() 方法用于移除字符串头尾指定的字符（默认为空格或换行符）或字符序列。
    # 注意：该方法只能删除开头或是结尾的字符，不能删除中间部分的字符。
    with open(X_train_fpath) as f:
        next(f)
        X_train = np.array([line.strip('\n').split(',')[1:] for line in f],dtype=float)
    with open(Y_train_fpath) as f:
        next(f)
        Y_train = np.array([line.strip('\n').split(',')[1] for line in f],dtype=float)  
    with open(X_test_fpath) as f:
        next(f)
        X_test = np.array([line.strip('\n').split(',')[1:] for line in f],dtype=float)  

    # 数据标准化
    X_train, X_mean, X_std = _normalize(X_train, train=True)
    X_test, _, _= _normalize(X_test, train = False, specified_column = None, X_mean = X_mean, X_std = X_std)

    # 切分出训练集和验证集
    dev_ratio = 0.1
    X_train, Y_train, X_dev, Y_dev = _train_dev_split(X_train, Y_train, dev_ratio = dev_ratio)
    train_size = X_train.shape[0]
    dev_size = X_dev.shape[0]
    test_size = X_test.shape[0]
    data_dim = X_train.shape[1]
    print('Size of training set: {}'.format(train_size))
    print('Size of development set: {}'.format(dev_size))
    print('Size of testing set: {}'.format(test_size))
    print('Dimension of data: {}'.format(data_dim))
    
    # 开始训练
    # 使用小批次梯度下降法来训练。训练资料被分为许多小批次，针对每一个小批次，我们分别计算
    # 其梯度以及损失，并根据该批次来更新模型的参数。当一次循环完成，也就是整个训练集的所有小批次都被使用过
    # 一次以后，将所有训练资料打散并重新分成新的小批次，进行下一个循环。

    # 初始化weights和bias
    w = np.zeros((data_dim))
    b = np.zeros((1,))
    
    # 训练参数
    max_iter = 10
    batch_size = 8
    learning_rate = 0.2

    # 记录每次迭代的损失与精确度，用于画图
    train_loss = []
    dev_loss = []
    train_acc = []
    dev_acc = []

    # 记录参数更新次数
    step = 1

    # 重复训练
    for epoch in range(max_iter):
        # 每次循环随机选择训练开始的地方
        X_train, Y_train = _shuffle(X_train, Y_train)

        # Mini-batch training
        for idx in range(int(np.floor(train_size / batch_size))):
            X = X_train[idx*batch_size : (idx+1)*batch_size]
            Y = Y_train[idx*batch_size : (idx+1)*batch_size]

            # 计算梯度
            w_grad, b_grad = _gradient(X, Y, w, b)

            # 梯度下降更新参数
            # 学习率随着迭代次数下降
            w = w - learning_rate / np.sqrt(step) * w_grad
            b = b - learning_rate / np.sqrt(step) * b_grad
            step += 1 

        # 计算每轮循环训练中，训练集和验证集上的损失和准确度
        y_train_pred = _f(X_train, w, b)
        Y_train_pred = np.round(y_train_pred)
        train_acc.append(_arruracy(Y_train_pred, Y_train))
        train_loss.append(_cross_entropy_loss(y_train_pred, Y_train) / train_size)

        y_dev_pred = _f(X_dev, w, b)
        Y_dev_pred = np.round(y_dev_pred)
        dev_acc.append(_arruracy(Y_dev_pred, Y_dev))
        dev_loss.append(_cross_entropy_loss(y_dev_pred, Y_dev) / dev_size)

    print('Training loss: {}'.format(train_loss[-1]))
    print('Development loss: {}'.format(dev_loss[-1]))
    print('Training accuracy: {}'.format(train_acc[-1]))
    print('Development accuracy: {}'.format(dev_acc[-1]))


    # 绘图
    # loss curve
    _plot_curve(train_loss, dev_loss, 'Loss', ['train', 'dev'], 'loss.png')

    # Accuracy curve
    _plot_curve(train_acc, dev_acc, 'Accuracy', ['train', 'dev'], 'acc.png')


    # 进行预测
    predictions = _predict(X_test, w, b)
    with open(output_fpath.format('logistic'), 'w') as f:
        f.write('id, label\n')   
        # enumerate多用于在for循环中得到计数，利用它可以同时获得索引和值
        for i, label in enumerate(predictions):
            f.write('{},{}\n'.format(i, label))

    # 显示出最重要的权重
    ind = np.argsort(np.abs(w))[::-1]
    with open(X_test_fpath) as f:
        content = f.readline().strip('\n').split(',')
    features = np.array(content)
    for i in ind[0:10]:
        print(features[i], w[i])

5. 使用生成模型

5.1 建立模型

类1的类内均值为：
类1的类内协方差矩阵为：
类2同理可得

w，b的计算公式为：
数据x属于类1的概率计算公式为：

5.2 完整代码

import  numpy as np


def _normalize(X, train = True, specified_column = None, X_mean = None, X_std = None):
    # 这个函数用于标准化输入数据的特定列
    # 训练数据的平均值与标准差将在处理测试数据时重复使用
    # 
    # 参数Arguments:
    # X: 待处理数据
    # train: 'True'表示处理训练数据，'False'表示处理测试数据
    # specific_column: 需要标准化处理的列索引，如果为'None',则处理所有列
    # X_mean: 训练数据的平均值
    # X_std: 训练数据的标准差
    # 输出Outputs:
    # X：标准化后的数据
    # X_mean: 计算出的训练数据平均值
    # X_std: 计算出的训练数据标准差
    if specified_column == None:
        specified_column = np.arange(X.shape[1]) # 计算列数
    if train:
        # 计算每列的平均之后变为一行
        X_mean = np.mean(X[:, specified_column], 0).reshape(1, -1)
        # 计算每列的标准差后变为一行
        X_std = np.std(X[:,specified_column], 0).reshape(1, -1)
    X[:, specified_column] = (X[:, specified_column] - X_mean)/(X_std + 1e-8)
    return X, X_mean, X_std

def _sigmoid(z):
    # 用于预测的sigmoid函数
    # 限制输出值的范围为1e-8, 1-(1e-8)
    return np.clip(1 / (1.0 + np.exp(-z)), 1e-8, 1 - (1e-8))

def _f(X, w, b):
    # 这是一个逻辑回归函数
    # 
    # 参数
    # X: 输入数据, shape = [batch_size, data_dimension]
    # w: weight vector, shape = [data_dimension, ]
    # b: 偏置 bias, scalar
    # 输出
    # 预测X的每行被预测为1的概率，shape = [batch_size, ]
    return _sigmoid(np.matmul(X, w) + b) # 两个numpy数组的矩阵相乘

def _predict(X, w, b):
    # 根据逻辑回归结果预测分类
    # 实际利用了round函数的四舍五入，将结果输出为0, 1
    return np.round(_f(X, w, b)).astype(np.int)

def _arruracy(Y_pred, Y_label):
    # 计算预测准确度
    acc = 1 - np.mean(np.abs(Y_pred - Y_label))
    return acc


if __name__ == "__main__":
    np.random.seed(0)
    X_train_fpath = '########/X_train'
    Y_train_fpath = '########/Y_train'
    X_test_fpath = '########/X_test'
    output_fpath = '########/output_{}.csv'

    # 训练集和测试集的处理方法和logistic回归相同
    # 因为generative model有可解出的最佳解，因此不需要切分出验证集
    with open(X_train_fpath) as f:
        next(f)
        X_train = np.array([line.strip('\n').split(',')[1:] for line in f],dtype=float)
    with open(Y_train_fpath) as f:
        next(f)
        Y_train = np.array([line.strip('\n').split(',')[1] for line in f],dtype=float)  
    with open(X_test_fpath) as f:
        next(f)
        X_test = np.array([line.strip('\n').split(',')[1:] for line in f],dtype=float)  

    # 数据标准化
    X_train, X_mean, X_std = _normalize(X_train, train=True)
    X_test, _, _= _normalize(X_test, train = False, specified_column = None, X_mean = X_mean, X_std = X_std)

    # 计算类内平均值
    # 认为第一类为超过五万美元（取值为1），第二类为未超过五万美元（取值为0）
    X_train_0 = np.array([x for x, y in zip(X_train, Y_train) if y == 1])
    X_train_1 = np.array([x for x, y in zip(X_train, Y_train) if y == 0])
    
    mean_0 = np.mean(X_train_0, axis = 0)
    mean_1 = np.mean(X_train_1, axis = 0)  
    
    data_dim = 510
    # 计算类内协方差
    cov_0 = np.zeros((data_dim, data_dim))
    cov_1 = np.zeros((data_dim, data_dim))
    
    for x in X_train_0:
        cov_0 += np.dot(np.transpose([x - mean_0]), [x - mean_0]) / X_train_0.shape[0]
    
    for x in X_train_1:
        cov_1 += np.dot(np.transpose([x - mean_1]), [x - mean_1]) / X_train_1.shape[0]
    # 假设两类对应的分布共用一个协方差矩阵
    cov = (cov_0 * X_train_0.shape[0] + cov_1 * X_train_1.shape[0]) / X_train.shape[0]
    
    # 权重矩阵与偏差向量可以直接计算出来
    # 需要计算协方差矩阵的逆矩阵
    # 因为协方差矩阵可能几乎是奇异的，np.linalg.inv()会产生一个大的数值误差
    # 通过奇异值分解，可以高效、准确地求出矩阵的逆。
    u, s, v = np.linalg.svd(cov, full_matrices=False)
    inv = np.matmul(v.T * 1 / s, u.T)
    w = np.dot(inv ,mean_0 - mean_1)
    b = (-0.5) * np.dot(mean_0, np.dot(inv, mean_0)) + (0.5) * np.dot(mean_1, np.dot(inv, mean_1)) +  np.log(float(X_train_0.shape[0]) / X_train_1.shape[0]) 
    
    # 计算训练集上的准确性
    # 仍然用sigmoid函数分类
    Y_train_pred = _predict(X_train, w, b)
    print('训练准确率: {}'.format(_arruracy(Y_train_pred, Y_train)))

    # 进行预测
    predictions = _predict(X_test, w, b)
    with open(output_fpath.format('generative'), 'w') as f:
        f.write('id,label\n')
        for i, label in enumerate(predictions):
            f.write('{},{}\n'.format(i, label))

    # 显示出最重要的权重项
    ind = np.argsort(np.abs(w))[::-1]
    with open(X_test_fpath) as f:
        content = f.readline().strip('\n').split(',')
    features = np.array(content)
    for i in ind[0:10]:
        print(features[i], w[i])

Python使用aiohttp库进行异步处理 HTTP 请求和响应飞起来fly呀 Python http 网络协议 python
aiohttp是一个非常强大的Python库，专为异步HTTP客户端和服务器开发而设计，它利用了Python的asyncio核心库来实现高效的非阻塞网络编程。这使得开发者可以在处理I/O密集型任务，如网络请求时，更加有效地利用系统资源，从而提升程序的并发性能。安装aiohttp要开始使用aiohttp，首先需要安装这个库。可以通过pip，Python的包管理工具来安装：pipinstallaioh
记录使用python smtplib邮件发送 Wiktok python 前端 javascript
基于多源异构数据存储管理系统开发时遇到的邮件发送问题，这里做一下记录。importsmtplib#导入smtplib模块，用于发送邮件fromemail.mime.textimportMIMEText#从email.mime.text导入MIMEText类，用于构建文本邮件fromemail.headerimportHeader#从email.header导入Header类，用于设置邮件头部ema
百度困境剖析：业务、技术与市场多维度洞察萧十一郎@ 深度研究百度搜索引擎人工智能
一、引言1.1研究背景与意义百度作为中国互联网行业的先驱和领军企业之一，在搜索引擎、人工智能、信息流等多个领域占据着重要地位。自2000年成立以来，百度凭借其强大的搜索引擎技术，迅速崛起并成为中国最大的搜索引擎服务提供商，改变了人们获取信息的方式，在互联网信息检索市场长期占据主导地位。随着技术的不断进步和市场环境的日益复杂，百度近年来面临着诸多严峻的挑战和困境。在搜索引擎市场，尽管百度目前仍占据较
买卖股票的逻辑究竟藏于何处？是基于公司基本面，还是市场趋势等因素？股票程序化交易接口量化交易股票API接口 Python股票量化交易大数据股票买卖公司基本面市场趋势投资者决策股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>公司基本面与股票买卖逻辑公司业绩与价值评估公司的业绩是衡量其价值的重要指标。净利润、营收增长等数据反映公司的盈利能力。一家公司连续多年保持稳定的盈利增长，通常意味着它具有良好的经营状况。投资者会根据这些数据评估公司的内在价值，若股票价
Python实现前缀和 Syhaswm python前缀和 python 开发语言
文章目录系列文章目录前言一、前缀和是什么？二、一维前缀和与二维前缀和三、前缀和应用场景四、实现前缀和的方法1.运用函数实现前缀和（包括求区间和）2.引入accumulate第三方库3.for循环总结前言在算法和数据结构的领域中，前缀和是一种极为实用且基础的算法思想。它能显著提升我们处理数组或矩阵相关问题的效率，将原本可能需要多次重复计算的过程优化为常数时间的操作。无论是在竞赛编程中，还是在实际的软
吴恩达-机器学习-多元线性回归模型代码 StrawBerryTreea 机器学习机器学习线性回归 python 吴恩达
吴恩达《机器学习》2022版第一节第二周多元线性回归房价预测简单实现以下以下共两个实验，都是通过调用sklearn函数，分别实现了一元线性回归和多元线性回归的房价预测。一、一元线性回归importnumpyasnpnp.set_printoptions(precision=2)fromsklearn.linear_modelimportLinearRegression#输入数据X_train=np
AI赋能教育：深度解析大模型在教育场景中的应用与架构设计【无标题】和老莫一起学AI 人工智能语言模型产品经理 ai 自然语言处理大模型程序员
随着人工智能技术的飞速发展，尤其是大模型的崛起，教育行业迎来了全新的机遇和挑战。教学模式的变革、个性化学习的深化、教育管理的智能化，大模型正以不可忽视的力量推动着教育的数字化升级。在这篇文章中，我们将基于一张完整的应用设计架构图，从应用场景到AI核心能力、训练标注平台、智能处理引擎以及业务数据，全方位剖析大模型如何助力教育行业实现突破，真正实现“AI赋能教育，重塑未来”。一、应用场景：从传统教育到
Python+Requests+Pytest+YAML+Allure实现接口自动化测试界晓晓软件测试 python pytest 自动化软件测试功能测试自动化测试程序人生
本项目实现接口自动化的技术选型：Python+Requests+Pytest+YAML+Allure，主要是针对之前开发的一个接口项目来进行学习，通过Python+Requests来发送和处理HTTP协议的请求接口，使用Pytest作为测试执行器，使用YAML来管理测试数据，使用Allure来生成测试报告一、项目说明本项目在实现过程中，把整个项目拆分成请求方法封装、HTTP接口封装、关键字封装、测
奥比中光3D机器视觉相机能连接halcon吗？视觉人机器视觉机器视觉3D 3d 数码相机视觉检测 c#
奥比中光的设备与Halcon的兼容性可以通过以下方式实现：数据接口的通用性奥比中光的相机（如AstroPro、大白等）支持通过UVC协议获取彩色图像，深度数据则通过OpenNI或ROS2接口传输105。若Halcon支持这些协议或标准接口（如ROS消息、OpenCV图像流），则可通过直接调用或二次开发实现连接。例如，通过Python或C#脚本将图像数据从相机传输至Halcon的处理流程中。SDK与
机器学习--实现多元线性回归 y江江江江机器学习机器学习线性回归人工智能
机器学习—实现多元线性回归本节顺延机器学习--线性回归中的内容，进一步讨论多元函数的回归问题y′=h(x)+w⊤∙x+by^{\prime}=h(x)+w^\top\bulletx+by′=h(x)+w⊤∙x+b其中,wT⋅x就是W1X1+w2X2+w3X3+⋯+wNXN\text{其中,}w^\mathrm{T}\cdotx\text{就是}_{W_1X_1}+w_2X_2+w_3X_3+\cd
一个最简单的方法解决Python的TypeError: xxx() takes 1 positional argument but 2 were given Wiktok python 开发语言
当我们在类内写了函数进行调用的时候，有时侯并没有传递参数，所编写的函数方法也不需要参数，但运行会报错：TypeError:xxx()takes1positionalargumentbut2weregiven，参数请求的错误，某并未深究其中原因，但单纯就解决这个问题而言，根据某实际经验，只需要在你的目标调用函数里定义空参数即可解决报错问题。演示如下：假设报错：classMainPro:def__in
基于pytest+requests+allure+yaml实现接口自动化测试框架 csdn950212 测试开发 pytest 接口自动化测试
1.项目背景和目标：这是一个基于Python的接口自动化测试框架，主要目标是：-提供一个稳定、可维护的接口测试解决方案-实现测试用例与测试数据的解耦-提供详细的测试报告和日志记录-支持多环境配置和灵活的用例管理2.技术栈选型框架采用了以下核心技术：pytest：作为测试执行引擎，提供了强大的用例管理和参数化能力requests：处理HTTP请求，支持各种接口调用场景allure：生成美观的测试报告
Python标准库之OS库星浩前进中 #金融量化 python 开发语言
目录一、介绍二、目录操作1、获取当前工作目录2、删除目录(空目录)2.1、删除当前目录2.2、递归删除目录3、删除目录(非空目录)4、创建目录5、递归创建目录6、判断是否为目录7、改变当前目录到指定目录三、文件操作1、创建文件2、删除文件3、文件重命名4、判断是否为文件5、获取文件信息四、其他操作1、判断路径对象是否存在2、获取路径下所有的文件和目录3、深层遍历指定路径下的所有子文件夹、文件4、路
python+postgresql+psycopg2实现自动化数据库生成（数据库迁移） bao1771148504 数据库 postgresql 自动化 python
python+pgsql+psycopg2实现一键数据库生成1.tipsNavcat转储sql文件，存在主键自增，加入下面代码。CREATESEQUENCEIFNOTEXISTSt表名_id_seqSTART1000;手动导入表不全时，也请检查主键自增情况，加入上面代码。importpsycopg2frompsycopg2.extensionsimportISOLATION_LEVEL_AUTOC
python异常处理链与自定义异常体系设计懒大王爱吃狼 python python 开发语言 linux 数据库 python学习 Python基础
在Python中，异常处理链和自定义异常体系是两个重要的概念，它们有助于更好地管理程序中的错误和异常情况。异常处理链异常处理链指的是在捕获一个异常后，能够将其信息保留并传递给另一个异常或日志系统。这在多层调用或复杂系统中尤其有用，因为它允许你追踪异常最初发生的位置，同时也可以在每一层添加额外的上下文信息。Python本身并不直接支持异常链的某些高级特性（如Java中的initCause方法），但你
Python正则懒大王爱吃狼 python python 开发语言 Python基础学习 python学习
正则表达式（RegularExpressions，简称regex）是一种强大的文本处理工具，可以用于搜索、替换和解析字符串。Python的re模块提供了对正则表达式的支持。以下是一些基本用法和示例：导入re模块首先，你需要导入Python的re模块：importre基本匹配匹配单个字符.匹配除换行符以外的任意单个字符。[]匹配括号内的任意一个字符。例如[abc]匹配a、b或c。[^...]匹配不在
Python网络编程懒大王爱吃狼 python python 网络开发语言 pycharm Python基础 pycharm安装
Python网络编程涉及使用Python语言来创建网络应用程序，这些应用程序可以在网络上与其他计算机进行通信。Python提供了多个库和框架来简化网络编程的过程，其中一些最常用的包括socket库、http.server模块、asyncio库以及第三方库如requests、Twisted和aiohttp等。以下是一些Python网络编程的基本概念和使用示例：1.套接字编程（SocketProgra
【人工智能】人工智能学习基础知识汇总奋力向前123 人工智能 python 开发语言人工智能
第1章初识人工智能本章主要介绍人工智能的概念、诞生和发展历程。具体包括人工智能概念的提出和涉及的相关重要人物，以及人工智能发展过程中的几个阶段，包括诞生、两次浪潮与寒冬、稳健阶段和ABC新时代。本章的主要知识点如下：人工智能概念1.人工智能英文名为“ArtificialIntelligence”,简称Al。它是用人工的方法在机器(计算机)上实现的智能；或者说是人们使机器具有类似于人的智能。2.人工
Python+DeepSeek，奔跑吧大模型 Bj陈默 python 开发语言
在当今数字化浪潮中，人工智能与编程语言的融合正以前所未有的速度重塑着技术生态。Python作为最受欢迎的编程语言之一，以其简洁易读的语法、丰富的库和广泛的应用场景，成为了无数开发者的首选。而DeepSeek，作为人工智能领域的一颗新星，凭借其强大的大模型能力，为开发者们打开了一扇通往全新世界的大门。当Python遇上DeepSeek，一场技术的盛宴就此拉开帷幕。一、为什么选择Python与Deep
线性代数导引：张量与张量空间 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
线性代数，张量，张量空间，深度学习，机器学习，人工智能1.背景介绍在现代人工智能领域，深度学习和机器学习算法的蓬勃发展，使得对数据的高效处理和表示能力提出了更高的要求。线性代数作为数学基础，为理解和构建这些算法提供了坚实的基础。而张量，作为一种高维数组的表示形式，成为了深度学习和机器学习的核心数据结构。本篇文章将从线性代数的角度出发，深入探讨张量与张量空间的概念，并阐述其在深度学习和机器学习中的重
第五章序列 MPCTHU python python
在数学领域里，序列也称为数列，是一列有序的数。在程序设计中，序列是一类数据结构，用来存储一组有序排列的元素，并提供各种读写操作接口。5.1认识序列在python中，序列主要包括列表list，元组tuple，对象range、字符串str、字节串bytes、字节数组bytearray。大多数序列类型，包括可变类型和不可变类型支持下表的通用操作5.2操作序列5.2.1索引序列是以非负整数作为索引的有限有
【Python】Python与C的区别（超详细总结） Reese_Cool Python python c语言 java
文章目录语句结束符代码块表示变量声明函数定义注释格式Python的标识符数据输入input()函数数据输出print()函数语句结束符C语言C语言中每条语句必须以分号;结束。例如，inta=10;、printf("Hello,World!");。分号是语句的一部分，用于告诉编译器一条语句在哪里结束。如果忘记添加分号，编译器会报错，提示语法错误。Python语言Python语句一般不需要特定的结束符
Selenium 对页面元素的操作动作及其语法静静在思考 #Selenium selenium 测试工具
Selenium提供了丰富的操作动作，用于模拟用户在浏览器中的各种交互行为。以下为你详细介绍常见操作动作及其语法，并结合百度网站为例给出Python代码示例。1.打开网页语法：使用driver.get(url)方法，其中driver是浏览器驱动实例，url是要打开的网页地址。示例代码：fromseleniumimportwebdriverdriver=webdriver.Chrome()drive
Python教学-最常用的标准库之一——OS库懒大王爱吃狼 python python 服务器开发语言 Python基础 python学习 python爬虫
os库是Python标准库中的一个模块，它提供了一种方便的方式来使用操作系统相关的功能。os模块提供了很多函数，可以用来处理文件和目录、访问环境变量、执行系统命令等。以下是一些常用的os模块的功能和示例：1.文件和目录操作1.1当前工作目录os.getcwd()：获取当前工作目录。os.chdir(path)：改变当前工作目录。importoscurrent_dir=os.getcwd()prin
stdlib.h头文件 Vacant Seat
stdlib头文件里包含了C、C++语言的最常用的系统函数该文件包含了的C语言标准库函数的定义stdlib.h里面定义了五种类型、一些宏和通用工具函数。类型例如size_t、wchar_t、div_t、ldiv_t和lldiv_t；宏例如EXIT_FAILURE、EXIT_SUCCESS、RAND_MAX和MB_CUR_MAX等等；常用的函数如malloc()、calloc()、realloc()
LeetCode--------接雨水python newica LeetCode
题目不重述了。小菜一枚，思路还是比较欠缺，按照leetcode题解的精选，用python写了一下。加深理解吧。按行接雨水：思路：首先寻找数组的最大值，即最多一共有几行。然后分别求每一行的雨水量。从第一行开始，第一种情况是遇到比第一行低的块，可以存到一方水；第二种情况是遇到和第一行一样高或者比第一行要高的块，重新开始计算雨水量。直到最高行，雨水量计算完毕。思路比较清晰，可以看力扣官网题解精选有图。p
python tkinter 自制文本编辑器 ocean35 tkinter python 文本编辑器 tkinter python
成品如图：代码fromtkinterimport*fromtkinterimportfiledialogfromtkinterimportmessageboximporttimedefnodefined():pass#打开文件函数defopenfile():filename=filedialog.askopenfilename()f=open(filename,'r')f2=f.read()f.c
Java 基于 SpringBoot+Vue 的动漫平台（附源码，文档）程序员徐师兄 java spring boot vue.js 动漫平台动漫网站
博主介绍：✌程序员徐师兄、8年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战*✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《500套》Java微信小程序项目实战《200套》Python项目实战《200套
python Kivy SDL2报错: Unable to load image 岁月缱绻浮半生
pythonKivySDL2报错:Unabletoloadimage国内玩kivy的真的很少，教程也少。断断续续弄了两天，终于弄好了首先看一下我的报错[INFO][Logger]RecordloginC:\Users\AlucaRd\.kivy\logs\kivy_20-12-15_11.txt[INFO][deps]Successfullyimported"kivy_deps.gstreamer
成功解决 python+kivy的raise Exception(‘SDL2: Unable to load image‘) Unable to get a Window, abort. projectnone2019 python 开发语言后端
运行python+kivy一个小程序出错，代码如下：fromkivy.appimportAppfromkivy.uix.floatlayoutimportFloatLayoutclassSizeFloat(FloatLayout):def__init__(self,**kwargs):super().__init__(**kwargs)classSizeApp(App):defbuild(self
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

李宏毅2020机器学习深度学习(2) 分类 笔记+作业

目录