MELF晓宇

机器学习之多项式曲线拟合的Python实现

1、什么是多项式曲线拟合

多项式拟合就是我们需要得到一个无限逼近真实曲线的的多项式：
$w_0 + w_1x + w_2x^2 + … + w_kx^k = \sum_{i=0}^{k}w_ix^i$
注：

$k$ 为多项式的阶数

$w_0,…,w_k$ 为多项式的系数，记为 $W$

使用均方误差作为误差函数对拟合出的多项式进行评估，公式如下：
$\frac{1}{2} \sum_{i=1}^{n}(y(x_i,W)-t_n)^2=\frac{1}{2} (XW-T)^T(XW-T)$
其中：
$=\begin{bmatrix} w_0 \\ w_1 \\ \vdots \\ w_k \\ \end{bmatrix}，X=\begin{bmatrix} 1 & x_1 & \cdots & x_1^k \\ 1 & x_2 & \cdots & x_2^k \\ \vdots & \vdots & \ddots & \vdots \\ 1 & x_n & \cdots & x_n^k \\ \end{bmatrix}$
注：

$n$ 为样本的点数

$k$ 为拟合出的多项式的阶数

拟合数据的目的即为最小化误差函数，因为误差函数是多项式系数W的二次函数，所以存在唯一最小值，且在导数为零处取得。对W求导并令导数为零得到：
$\frac{\partial E(W)}{\partial W} = X^TXW-X^TT \\ W = (X^TX)^{-1}X^TT$
故可以通过矩阵运算得到W。

2、泛化能力

泛化能力（generalization ability）是指机器学习算法对新鲜样本的适应能力，简而言之是在原有的数据集上添加新的数据集，通过训练输出一个合理的结果。学习的目的是学到隐含在数据背后的规律，对具有同一规律的学习集以外的数据，经过训练的网络也能给出合适的输出，该能力称为泛化能力。

2.1、欠拟合

欠拟合（under-fitting）是指模型拟合程度不高，数据距离拟合曲线较远，模型没有很好地捕捉到数据特征，不能够很好地拟合数据。

2.2、过拟合

过拟合（over-fitting）其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越学到了很多没必要的特征，导致在验证数据集以及测试数据集中表现不佳。

3、如何对拟合结果做出评估

3.1、使用拟合优度指数进行评价

设 $y$ 为待拟合数值，其均值为 $\bar y$ ，拟合值为 $\hat y$ ，则：

总平方和（ $S S T$ ）:
$\sum_{i=1}^{n}(y_i- \bar y)^2$
回归平方和（ $S S E$ ）：
$\sum_{i=1}^{n}(\hat y_i- \bar y)^2$
残差平方和（ $S S E$ ）实际值与预测值之间差的平方之和：
$\sum_{i=1}^{n}(y_i - \hat y_i)^2$
则有：
$S S T = S S R + S S E$
决定系数（ $R^2$ ）:
$R^2 = \frac{SSR}{SST} = \frac{\sum_{i=1}^{n}(\hat y_i- \bar y)^2}{\sum_{i=1}^{n}(y_i - \hat y_i)^2} = 1 - \frac{SSE}{SST}$
通常认为，用 $\bar y$ 去预测 $y$ 是一个最差情况（实际上可能比这个还差，比如实际值都是 $1$ ，预测值却都是 $10000$ ），任何预测都应该比这个准。

于是 $R^2 = 1 - \frac{SSE}{SST}$ （也就是预测值和真实值的残差平方和）要小于平均值和真实值的残差平方和，即 $。 R_{2} 一般介于 0 和 1 之间，越大拟合效果越好，但如果模型出乎意料的非常差，可能为负。$

4、利用正则化改善过拟合

最小化误差函数用于衡量对于任意给定的 $w$ 值，函数 $y (x, W)$ 与训练数据的差异（即将 $x$ 带入函数 $y (x, W)$ 得到的值与训练数据集中相应的值得差异）。

其中，误差函数为：
$\frac{1}{2} \sum_{n=1}^{N} \{y(x_n,W)-t_n \}^2$
注：

$\frac{1}{2}$ 是为了方便计算引入的

$N$ 为样本的个数

可以通过选择使得 $E (w)$ 尽可能小的 $w$ 来解决曲线拟合问题。

由于误差函数是系数 $w$ 的二次函数，因此它关于系数的导数是 $w$ 的线性函数，所以误差函数的最小值有一个唯一解，记作 $W *$ ，可以用解析的方式求出。最终的多项式函数由函数 $y (x, W *)$ 给出。

在定义误差函数是增加惩罚项（这种惩罚项最简单的形式采用所有系数的平方和），使多项式系数被有效控制，不会过大。

则惩罚项为：
$w||^2 = wTw = {w_0}^2 + {w_1}^2 + … + {w_k}^2$
新定义的误差函数为：
$\tilde{E}(w) = \frac{1}{2} \sum_{n=1}^{N} \{y(x_n,w)-t_n \}^2+\frac{\lambda}{2}||w||^2$
注：

系数 $\lambda$ 控制了正则化项相对于平方和误差项的重要性，被称之为正则化系数。

求导置零得到：
$W=(X^TX+\lambda E_{m+1})^{-1}X^TT$

$W$ 为多项式的系数

通过改变 $\lambda$ 的大小（如： $\lambda$ 较小时 $ln\lambda = − 18$ ， $\lambda$ 较大时 $ln\lambda = − 0$ ））可以降低多项式的阶数，防止过拟合。

代码实现

import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model import Ridge
from sklearn.metrics import r2_score
from sklearn.preprocessing import PolynomialFeatures

from PolynomialFitting.PolynomialFittingTest import PolynomialFittingTest


class PolynomialFitting:
    @staticmethod
    def fitting(x_list, y_list, degree=2):
        """
        拟合
        :param y_list:Y坐标
        :param x_list: X坐标
        :param degree: 阶数
        :return:w参数矩阵, r2拟合优度指数, f可以参与计算的多项式
        """
        # 参数格式效验
        if not isinstance(x_list, list):
            raise Exception(print("X坐标参数类型错误"))
        if not isinstance(y_list, list):
            raise Exception(print("Y坐标参数类型错误"))
        if not isinstance(degree, int):
            raise Exception(print("多项式阶数错误"))

        # 将list装换为ndarray
        try:
            x_array = np.array(x_list)
            y_array = np.array(y_list)
        except:
            raise Exception(print("坐标转换失败"))

        # 对X坐标和Y坐标的形状进行比较，不一致则无法完成拟合
        x_shape = x_array.shape
        y_shape = y_array.shape
        if x_shape != y_shape:
            raise Exception("X坐标与Y坐标无法对应")

        # w为拟合后的多项式的系数
        try:
            w = np.polyfit(x_array, y_array, degree)
        except:
            raise Exception("多项式阶数过高")

        f = PolynomialFitting.get_fx(w)
        r2 = PolynomialFitting.get_r2(y_array, x_array, f)

        return w, r2, f

    @staticmethod
    def fitting_with_lambda(x_list, y_list, degree=2, lambda_=0.001):
        """
        正则化拟合（利用岭回归为其添加惩罚项）
        :param x_list: 训练集的X坐标
        :param y_list: 训练集的Y坐标
        :param degree: 要拟合的多项式的阶数
        :param lambda_:
        :return:
        """
        # 参数格式效验
        if not isinstance(x_list, list):
            raise Exception(print("X坐标参数类型错误"))
        if not isinstance(y_list, list):
            raise Exception(print("Y坐标参数类型错误"))
        if not isinstance(degree, int):
            raise Exception(print("多项式阶数错误"))
        if not isinstance(lambda_, float):
            raise Exception(print("lambda系数错误"))

        if lambda_ <= 0.0:
            raise Exception(print("非法的lambda值"))

        # 将list装换为ndarray
        try:
            x_array = np.array([x_list])
            y_array = np.array([y_list])
        except:
            raise Exception(print("坐标转换失败"))

        # 对X坐标和Y坐标的形状进行比较，不一致则无法完成拟合
        x_shape = x_array.shape
        y_shape = y_array.shape
        if x_shape != y_shape:
            raise Exception("X坐标与Y坐标无法对应")

        # 矩阵转置
        x_array = x_array.T
        y_array = y_array.T

        # 设置多项式的阶数
        poly = PolynomialFeatures(degree=degree)

        x_list_ploy = poly.fit_transform(x_array)

        # Ridge(岭回归)通过对系数大小施加惩罚来解决拟合的一些问题。
        # alpha >= 0 是控制系数收缩量的复杂性参数，alpha值越大，收缩量越大，模型对共线性的鲁棒性也更强。
        lr = Ridge(alpha=(lambda_ / 2))
        # Ridge 用 fit 方法完成拟合，并将模型系数 w 存储在其 coef_ 成员中
        lr.fit(x_list_ploy, y_array)
        # 获取多项式系数(参数从低向高)
        w = lr.coef_[0]
        # 逆序
        w_l = w.tolist()
        w_l.reverse()
        w = np.array(w_l)

        # 获取可以参与计算的多项式表达式
        f = PolynomialFitting.get_fx(w)
        # 计算r2拟合优度指数
        r2 = PolynomialFitting.get_r2(y_list, x_list, f)
        return w, r2, f

    @staticmethod
    def print_polynomial(w_list):
        """
        获取多项式
        :param w_list: 参数列表
        :return:
        """
        fx = "y = "
        for i in range(0, len(w_list)):
            param = w_list[i]
            order = len(w_list) - 1 - i
            if order:
                fx += "{} * x ^ {} + ".format(param, order)
            else:
                fx += "{}".format(param)
        return fx

    @staticmethod
    def get_fx(w_list):
        """
        获取可以参与计算的多项式
        :param w_list:w参数矩阵
        :return:可以参与计算的多项式
        """
        f = np.poly1d(w_list)
        return f

    @staticmethod
    def get_r2(y_ture, x_ture, f):
        """
        计算拟合优度指数
        :param y_ture:Y坐标真实值
        :param x_ture:X坐标真实值
        :param f:可以参与计算的多项式
        :return:r2拟合优度指数
        """
        # 计算R2
        # coefficient_of_determination = r2_score(y_ture, f(x_ture))
        r2 = r2_score(y_ture, f(x_ture))
        return r2

    @staticmethod
    def get_best_fitting(x_list, y_list):
        """
        获取最优拟合结果
        :param x_list: X坐标数组
        :param y_list: Y坐标数组
        :return:
        """
        degree = 1
        best_degree = 1
        w_r, r2_r, f_r = PolynomialFitting.fitting(x_list, y_list, degree)
        while True:
            try:
                # 多项式拟合
                w, r2, f = PolynomialFitting.fitting(x_list, y_list, degree)
                # print("多项式参数列表：{}".format(w))
                # print("多项式阶数：{}".format(order))
                # print("拟合优度指数：{}".format(r2))
                print("阶数：{}\t拟合优度指数：{}".format(degree, r2))

                if r2 <= 0 or r2 > 1:
                    break

                if w[0] == 0:
                    degree += 1
                    continue

                if r2 > r2_r:
                    w_r = w
                    r2_r = r2
                    f_r = f
                    best_degree = degree

                degree += 1
            except:
                break

            # time.sleep(0.5)
        print("正常结束")
        return w_r, r2_r, f_r, best_degree

    @staticmethod
    def get_best_fitting_with(x_real, y_real):
        best_degree = 2
        w_r, r2_r, f_r = PolynomialFitting.fitting_with_lambda(x_real, y_real)
        lambda_r = np.exp(0)

        for degree in range(2, 200):
            for i in range(0, -19, -1):
                lambda_ = np.exp(i)
                w, r2, f = PolynomialFitting.fitting_with_lambda(x_real, y_real, degree=degree, lambda_=lambda_)
                print("多项式阶数：{},lambda系数：{}".format(degree, lambda_))

                # print("多项式参数列表：{}".format(w_2))
                # print("多项式阶数：{}".format(degree))
                # print("lambda系数：{}".format(lambda_))
                # print("拟合优度指数：{}".format(r2_2))
                if r2 > r2_r:
                    w_r = w
                    r2_r = r2
                    f_r = f
                    best_degree = degree
                    lambda_r = lambda_

        return w_r, r2_r, f_r, best_degree, lambda_r


if __name__ == '__main__':
    # 生成测试数据
    X_train, y_train = PolynomialFittingTest.create_data(100)
    print(X_train)
    print(y_train)
    x_l = X_train.reshape((1, 100))[0].tolist()
    y_l = y_train.reshape((1, 100))[0].tolist()

    # 未考虑正则化
    w_1, r2_1, f1, best_degree_1 = PolynomialFitting.get_best_fitting(x_l, y_l)
    print("多项式参数列表：{}".format(w_1))
    print("多项式阶数：{}".format(best_degree_1))
    print("拟合优度指数：{}".format(r2_1))

    # 考虑正则化
    w_2, r2_2, f2, best_degree_2, lambda_2 = PolynomialFitting.get_best_fitting_with(x_l, y_l)
    print("多项式参数列表：{}".format(w_2))
    print("多项式阶数：{}".format(best_degree_2))
    print("lambda系数：{}".format(lambda_2))
    print("拟合优度指数：{}".format(r2_2))

    # 绘制画布
    plt.figure()
    # 解决中文显示问题
    plt.rcParams['font.sans-serif'] = ['SimHei']
    plt.rcParams['axes.unicode_minus'] = False
    # 绘制散点图
    plt.scatter(x_l, y_l)

    # 常规拟合
    y_pre_1 = f1(x_l)
    plt.plot(x_l, y_pre_1, color='b', label="常规拟合")

    # 绘制岭回归曲线
    y_pre_2 = f2(x_l)
    plt.plot(x_l, y_pre_2, color='r', label="岭回归")

    # 真实曲线
    y_sin = PolynomialFittingTest.sin_fun(X_train)
    plt.plot(x_l, y_sin, color='g', label="$sin(x)$")

    # 设置图片标题
    plt.title("预测曲线")
    # 显示图例
    plt.legend()
    plt.show()

参考资料

[Python] 多项式曲线拟合(Polynomial Curve Fitting)：https://blog.csdn.net/m0_38068229/article/details/105202554

机器学习入门之多项式曲线拟合：https://blog.csdn.net/xwl198937/article/details/52210156

Numpy实现多项式曲线拟合：https://www.cnblogs.com/zhjblogs/p/14725864.html

numpy进行多项式拟合：https://www.cnblogs.com/yjybupt/p/12972682.html

过拟合和欠拟合：https://blog.csdn.net/weixin_42575020/article/details/82949285

泛化能力_百度百科：https://baike.baidu.com/item/%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B/3323240

欠拟合_百度百科：https://baike.baidu.com/item/%E6%AC%A0%E6%8B%9F%E5%90%88/22692155

多项式曲线拟合：https://zhuanlan.zhihu.com/p/53056358

python pip及常用国内镜像源 sunny05296 python python pip 开发语言
pip常用国内镜像源pip默认从国外的python下载会很慢，建议使用一些国内的镜像源，常用的国内镜像源如下：#清华镜像源https://pypi.tuna.tsinghua.edu.cn/simple#中科大镜像源https://pypi.mirrors.ustc.edu.cn/simple#阿里云镜像源https://mirrors.aliyun.com/pypi/simplepip安装组件时
零基础上手Python数据分析 (7)：Python 面向对象编程初步 kakaZhui python 数据分析 excel
写在前面回顾一下，我们已经学习了Python的基本语法、数据类型、常用数据结构和文件操作、异常处理等。到目前为止，我们主要采用的是面向过程(ProceduralProgramming)的编程方式，即按照步骤一步一步地编写代码，解决问题。这种方式对于简单的任务已经足够，但当程序变得越来越复杂，代码量越来越大时，面向过程编程可能会显得力不从心，代码难以组织、复用和维护。代码复杂性带来的挑战：面向过程v
Nginx + CertBot 配置HTTPS泛域名证书(Rocky Linux 9.4)
#安装nginx此步省略，以nginx安装在'/usr/local/nginx-1.23.3'目录为例#1.安装certbot#更新包列表sudodnfupdate#安装EPEL仓库：EPEL仓库提供了许多有用的软件包，包括certbotsudodnfinstall-yepel-release#安装Certbot和Nginx插件。dnfinstall-ycertbotpython3-certbot
OCR提取+识别方案 ocr
1.内容提取通过YOLO提取需要识别的区域1.1安装ultralytics创建虚拟环境(可选)#创建虚拟环境python-mvenv.venv#激活虚拟环境###激活虚拟环境将更改shell的提示以显示您正在使用的虚拟环境，并修改环境，以便运行时python可以获得特定版本和安装的Python。例如：source.venv/bin/activate#显示虚拟环境中安装的所有软件包：python-m
OpenAI Agents SDK 中文文档中文教程（7） wtsolutions openai agents sdk python openai sdk 中文文档
英文文档原文详见OpenAIAgentsSDKhttps://openai.github.io/openai-agents-python/本文是OpenAI-agents-sdk-python使用翻译软件翻译后的中文文档/教程。分多个帖子发布，帖子的目录如下：(1)OpenAI代理SDK，介绍及快速入门(2)OpenAIagentssdk,agents，运行agents，结果，流，工具，交接(3)
oracle 时间格式化 to——datetime,精通 Oracle+Python，第 2 部分：处理时间和日期照月鱼yoyi oracle 时间格式化 to——datetime
作者：PrzemyslawPiotrowskiOracle和Python的日期处理介绍2007年9月发布从Python2.4版开始，cx_Oracle自身可以处理DATE和TIMESTAMP数据类型，将这些列的值映射到Python的datetime模块的datetime对象中。因为datetime对象支持原位的运算操作，这可以带来某些优势。内置的时区支持和若干专用模块使Python成为一台实时机器
Python --**kwargs 潇湘馆记 python
在Python中，**kwargs是一个特殊语法，用于在函数定义中接收任意数量的关键字参数（即键值对参数），并将这些参数以字典形式存储。它是Python中处理动态参数的强大工具，适用于需要灵活传递参数的场景。1.基本语法定义方式：在函数参数列表中使用**kwargs（名称可以自定义，但通常遵循kwargs约定）。参数类型：kwargs是一个字典，键是参数名，值是对应的参数值。示例defprint_
Python 数据分析实战：跨境电商行业发展解析萧十一郎@ python python 数据分析开发语言
目录一、案例背景二、代码实现2.1数据收集2.2数据探索性分析2.3数据清洗2.4数据分析2.4.1跨境电商消费者地域分布分析2.4.2跨境电商商品销售与价格关系分析2.4.3跨境电商行业未来发展预测三、主要的代码难点解析3.1数据收集3.2数据清洗-销售数据处理3.3数据分析-跨境电商消费者地域分布分析3.4数据分析-跨境电商商品销售与价格关系分析3.5数据可视化四、可能改进的代码4.1数据收集
用Python爬虫获取AliExpress商品信息：item_search API接口实战指南 JelenaAPI小小爬虫 Python API python 爬虫开发语言
引言在全球化电商的浪潮中，数据的力量不容小觑。对于电商分析师、市场研究者以及在线商家而言，能够快速获取商品信息是至关重要的。AliExpress作为全球知名的跨境电商平台，提供了丰富的商品数据。本文将介绍如何使用Python爬虫结合item_searchAPI接口，按关键字搜索并获取AliExpress上的商品信息。一、为什么选择Python爬虫Python因其简洁的语法和强大的库支持，成为编写爬
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
Qt上位机编程命名规范-执行版有追求的菜鸟 qt 开发语言
主要规范原则参考Qt上位机编程命名规范。1.文件/文件夹大小写分析考虑跨平台性，全小写是一种约定俗成的风格，在许多大型开源项目中（如Linux内核、Python标准库）被广泛使用。1.1.配合文件扩展名通常文件名小写配合小写扩展名（如.h,.cpp,.json），使整体风格统一：main.cppconfig.jsonutils.h1.2.文件夹和pri文件命名通常小写、下划线分开：control_
通过Bokeh实现大规模数据可视化的最佳实践【从静态图表到实时更新】步入烟尘算法指南信息可视化 Bokeh python
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
轻松帮你搞清楚Python爬虫数据可视化的流程 liuhaoran___ python
Python爬虫数据可视化的流程主要是通过网络爬取所需的数据，并利用相关的库将数据分析结果以图形化的方式展示出来，帮助用户更直观地理解数据背后的信息。Python爬虫+数据可视化步骤1.获取目标网站的数据使用`requests`或者`selenium`库从网页上抓取信息。对于动态加载内容的页面可以考虑结合JavaScript渲染引擎。2.解析HTML内容提取有用信息常见工具如BeautifulSo
python使用Bokeh库实现实时数据的可视化 Oona_01 python 信息可视化数据分析
Python语言以其丰富的数据科学生态系统而闻名,其中Bokeh库作为一种功能强大的可视化工具,为实时数据的可视化提供了优秀的支持,本文将介绍如何使用Bokeh库实现实时数据的可视化,并提供相关代码实例,需要的朋友可以参考下使用Python的Bokeh库进行实时数据可视化的实现Bokeh简介实时数据可视化的需求使用Bokeh实现实时数据可视化的步骤代码示例Bokeh的进阶应用总结使用Python的
Python解决“特定数组的逆序拼接”问题啥都鼓捣的小yao 经典算法练习 python 算法开发语言
Python解决“特定数组的逆序拼接”问题问题描述测试样例解决思路代码问题描述小U得到了一个数字n，他的任务是构造一个特定数组。这个数组的构造规则是：对于每个i从1到n，将数字n到i逆序拼接，直到i等于n为止。最终，输出这个拼接后的数组。例如，当n等于3时，拼接后的数组是[3,2,1,3,2,3]。测试样例样例1：输入：n=3输出：[3,2,1,3,2,3]样例2：输入：n=4输出：[4,3,2,
Python用Bokeh处理大规模数据可视化的最佳实践一键难忘 Bokeh python 开发语言
用Bokeh处理大规模数据可视化的最佳实践在大规模数据处理和分析中，数据可视化是一个至关重要的环节。Bokeh是一个在Python生态中广泛使用的交互式数据可视化库，它具有强大的可扩展性和灵活性。本文将介绍如何使用Bokeh处理大规模数据可视化，并提供一些最佳实践和代码实例，帮助你高效地展示大数据集中的重要信息。1.为什么选择Bokeh？Bokeh是一个专为浏览器呈现而设计的可视化库，它支持高效渲
Python 爬虫实战：社交媒体品牌反馈数据抓取与舆情分析西攻城狮北 python 爬虫媒体
一、引言在当今数字化时代，社交媒体已成为公众表达意见、分享信息的重要渠道。品牌的声誉和市场表现往往受到消费者在社交平台上的反馈和评价的影响，因此品牌舆情分析变得至关重要。本文将介绍如何使用爬虫技术爬取社交媒体上的品牌反馈数据，并通过数据分析技术，分析品牌的舆情动态。二、环境准备在开始之前，确保你的开发环境已经安装了以下必要的Python库：requests:用于发送HTTP请求。beautiful
Python预训练模型实现俄语音频转文字啥都鼓捣的小yao 人工智能 python 音视频人工智能
Python预训练模型实现俄语音频转文字使用CommonVoice8.0、Golos和MultilingualTEDx的训练和验证分割对俄语的facebook/wav2vec2-xls-r-1b进行了微调。使用此模型时，请确保您的语音输入以16kHz采样。我们只需要装好三个功能包，写好你的文件路径即可使用！importtorchimportlibrosafromtransformersimport
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
基于Python编程语言实现“机器学习”，用于车牌识别项目我的sun&shine Python python 机器学习计算机视觉
基于Python的验证码识别研究与实现1.摘要验证码的主要目的是区分人类和计算机，用来防止自动化脚本程序对网站的一些恶意行为，目前绝大部分网站都利用验证码来阻止恶意脚本程序的入侵。验证码的自动识别对于减少自动登录时长，识别难以识别的验证码图片有着重要的作用。对验证码图像进行灰度化、二值化、去离散噪声、字符分割、归一化、特征提取、训练和字符识别等过程可以实现验证码自动识别。首先将原图片进行灰度化处理
6.8:Python如何处理文件写入时出现的错误？小兔子平安 Python完整学习全解答 java windows html
Python是一种功能强大且易于学习的编程语言，已经成为了当今最流行的编程语言之一。随着Python应用领域的不断扩大，越来越多的人开始学习Python，希望能够掌握这个有用的工具，从而实现更多的创意和创新。而文件操作是Python编程中不可或缺的一部分，对于处理文件写入时的错误更是必须掌握的技能。本文主要介绍如何处理Python中文件写入时的错误。我们将详细讲解如何使用try-except语句、
Python3包开发的高效Cookiecutter模板：python-package-template 一只爪子
本文还有配套的精品资源，点击获取简介：本文介绍了一个名为python-package-template的Cookiecutter模板，用于简化Python包的开发过程。该模板遵循Python的最佳实践，并自动创建项目结构，包括setup.py、MANIFEST.in、LICENSE、README.md、.gitignore、requirements.txt、测试配置文件、CI配置文件、测试目录和文
python列表操作计算列表长度并输出,Python基础2：列表想吃草莓干
一、列表列表是按照特定顺序的排列组合，就像数学中的数列，列表中的元素具有⼀定的排列顺序。在Python中，列表用方括号[]来表示列表，比如：>>>a=['Python','C','Java']1、访问列表中的元素索引开始：0如果我们想要打印上述列表中Python，就需要我们访问列表中第一个元素，在Python中，列表的访问从0开始，索引数为元素的位置减去1，访问的元素位置放在方括号里面，如果我们想
Python项目自动化模板构建：深入理解Cookiecutter TEDDYYW
本文还有配套的精品资源，点击获取简介：Python项目的标准化构建过程对于代码的整洁和可维护性至关重要。本文将深入探讨如何利用"cookiecutter"这一Python命令行工具自动化项目的初始化过程。Cookiecutter通过读取预定义模板并根据用户输入自动生成项目结构，简化了项目设置。我们将详细了解"cookiecutter-python-master"模板的组成，包括标准项目结构、初始化
多阶段构建实现 Docker 加速与体积减小：含文件查看、上传及拷贝功能的 FastAPI 应用镜像构建九不多 Docker docker fastapi python YOLO
本文围绕使用Docker构建FastAPI应用镜像展开，着重介绍了多阶段构建的Dockerfile编写及相关操作。借助多阶段构建，不仅实现了Docker构建的加速，还有效减小了镜像体积。1.Dockerfile内容以下是我们要使用的Dockerfile内容：#第一个阶段-构建应用FROMdocker.1ms.run/python:3.9ASbuilder#设置工作目录WORKDIR/app#复制依
Python列表的创建只是没遇到 python
Python3列表序列是Python中最基本的数据结构。序列中的每个值都有对应的位置值，称之为索引，第一个索引是0，第二个索引是1，依此类推。Python有6个序列的内置类型，但最常见的是列表和元组。列表都可以进行的操作包括索引，切片，加，乘，检查成员。此外，Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用的Python数据类型，它可以作为一个方括号内的逗号分隔值出现
Python最佳实践项目Cookiecutter常见问题解决方案柯茵沙
Python最佳实践项目Cookiecutter常见问题解决方案python-best-practices-cookiecutterPythonbestpracticesprojectcookiecutter项目地址:https://gitcode.com/gh_mirrors/py/python-best-practices-cookiecutter项目基础介绍本项目是一个Python最佳实践的
Vision mamba(mamba_ssm)安装踩坑指南 ggitjcg 深度学习 python
在这篇博客中，我将分享我在linux环境安装和使用VisionMamba（mamba_ssm）过程中遇到的一些问题和解决方法。前置检查：PyTorch和Python版本在安装mamba_ssm前，请确保你的PyTorch和Python环境版本正确。以下代码可用来检查环境信息：importtorchprint("PyTorchVersion:{}".format(torch.__version__)
探秘 Cookiecutter：一个高效项目模板生成器尤琦珺Bess
探秘Cookiecutter：一个高效项目模板生成器cookiecutter项目地址:https://gitcode.com/gh_mirrors/coo/cookiecutter如果你是一位热衷于Python开发的程序员，或者你经常需要初始化新的项目，那么你可能会对感兴趣。这是一个强大的工具，它能够根据预定义的模板快速生成项目结构，极大地提高了开发效率。项目简介Cookiecutter是一个命令
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置