第三人称&寒飔

机器学习-一元线性回归与多元线性回归

前言

一、机器学习的三要素

二、线性模型的基本形式

三、线性回归

3.1一元线性回归

3.1.1最小二乘法

3.1.2极大似然估计

3.1.3求解和

3.1.4算法处理前的向量化

3.2多元线性回归

3.2.1最小二乘法导出

3.2.2证明为凸函数

3.2.3求解未知数集合

总结

前言

随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文主要记录了有关机器学习问题线性模型中的一元线性回归和多元线性回归问题，思路均来源于周志华老师《机器学习》第三章中一元线性回归以及多元线性回归部分的内容。

一、机器学习的三要素

1.模型：根据具体问题，确定假设空间——此篇介绍为线性模型；

2.策略：根据评价标准，确定选取最优模型的策略（通常会产生一个“损失函数”）——此篇以“均方误差”为标准，根据最小二乘法、最大似然估计法来确定损失函数最小的等价条件；

3.算法：求解损失函数，确定最优模型——此篇中计算等价条件中未知数 $\omega$ 与的取值。

二、线性模型的基本形式

对于给定的d个属性描述的示例 $\large x=(x1;x2;x3;....;xd)$ ,其中 $\large xi$ 为 $\large x$ 在第 $\large i$ 个属性上的取值。

线性模型：学得一个通过属性的线性组合来进行预测的函数形式为： $\large f(x)=\omega 1x1+\omega 2x2+...+\omega dxd+b$ ,转化为向量形式为： $\large f(x)=\omega ^{T}+b$ 。

$\large \omega =\left ( \omega 1;\omega 2;...;\omega d \right )$ ,将 $\large \omega$ 与 $\large b$ 学得之后,模型即可确定。

此种方法的优点在于形式简单，易于建模，可解释性强，其中 $\large \omega$ 直观的表达了各个属性在预测中的重要性，即为对标记结果的决定性程度。

以下从回归任务开始，继而讨论二分类和多分类任务。

三、线性回归

对于给定数据集 $\large D=\left \{ (x1,y1),(x2,y2),...,(xm,ym) \right \}$ ，其中 $\large xi=(xi1;xi2;xi3;...;xid)$ ， $\large yi\epsilon R$ 。“线性回归” 意在学得一个线性模型尽可能准确的预测实值输出标记。

3.1一元线性回归

若输入属性的数目仅为一个，则可省略属性的下标，转化为 $\large D=\left \{ (xi;yi) \right \}_{i=1}^{m}$ ，其中 $\large xi\epsilon R$ ;

对于离散的属性，若属性之间存在“序”的关系，则可对其进行连续化，以下示例：

一元线性回归目的：学得 $\large f(xi)=\omega xi+b$ ，使得 $\large f(xi)\approx yi$ ，重点即为确定 $\large \omega$ 与 $\large b$ 。

根本思路为：以均方误差作为性能量度，即目标为：试图将均方误差最小化。

以下先以“发际线高度”和“计算机水平”的关系一例来讲解两种计算方法，这两种方法殊途同归：

3.1.1最小二乘法

我们假设采集到的样本数据如下图分布：

可以看出样本点偏向于服从线性分布，构造出模型 $\large f(x)=\omega x+b$ 。（图中黑色直线）

要使均方误差最小，即满足:

$(\omega^{*},b^{*} )=argmin_{(\omega ,b)}\sum_{i=1}^{m}(f(xi)-yi)^{2}=argmin_{(\omega ,b)}\sum_{i=1}^{m}(yi-\omega xi-b)^{2}$ ，其中 $\large \omega ^{*}$ 与 $\large b^{*}$ 表示 $\large \omega$ 与 $\large b$ 的解； $\large argmin$ 表示使目标函数f(x)取最小值时的变量值。

对应的几何意义为“欧氏距离”，（对应图中蓝色线段长度），对应损失函数 $\large E(\omega ,b)=\sum_{i=1}^{m}(f(xi)-yi)^{2}=\sum_{i=1}^{m}(yi-\omega xi-b)^{2}$ 。

这种基于均方误差最小化，利用所有样本到直线上的欧式距离最短来进行模型求解的方法为“最小二乘法”。

3.1.2极大似然估计

对于离散型（或连续性）随机变量，假设其概率质量函数为 $P(x;\theta )$ ，即概率密度为 $p(x;\theta )$ ，其中为已知样本，例如有为来自的n个独立同分布的样本，则 $\theta$ 为待估计的参数值（可能为多个）。

其联合概率，即为“多元的概率分布中多个随机变量分别满足各自条件的概率”，用公式表示为： $L(\theta )=\prod_{i=1}^{n}P(xi;\theta )$ 。此为关于 $\theta$ 的函数，称为样本的似然函数。

根本想法：使得观测样本出现概率最大的分布即为代求分布，即意向求得 $\theta ^{*}$ 使得 $L(\theta )$ 取得最大值，即为 $\theta$ 的估计值。

具体计算方法参考下例：

另外，我们可以通过对数函数来简化似连乘项，转化为含连加项的对数似然函数： $lnL(\mu ,\sigma ^{2})$ 可大大减少计算量。

下面我们进入比较神奇的一步：

假设线性回归为以下模型： $y=\omega x+b+\epsilon$ ，其中 $\epsilon$ 为不受控制的随机误差，可以假设其服从均值为0的正态分布 $\epsilon \sim N(0,\sigma ^{2})$ ，(中心极限定理：在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布），则对应 $\epsilon$ 的概率密度函数为： $p(\epsilon )=\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{\epsilon ^{2}}{2\sigma ^{2}})$ ，将 $\epsilon$ 用 $y-(\omega x+b)$ 等价代替可得到下式： $p(y)=\frac{1}{\sqrt{2\pi }\sigma }exp(-\frac{(y-(\omega x+b)) ^{2}}{2\sigma ^{2}})$ 。

可以发现转化为了关于的函数，即为服从均值为 $(\omega x+b)$ 的正态分布，即 $y \sim N(\omega x+b,\sigma ^{2})$ ,则可使用极大似然估计的方法来估计 $\omega$ 和的值：

即可转化为：求使得 $lnL(\omega ,b)=mln\frac{1}{\sqrt{2\pi }\sigma }-\frac{1}{2\sigma ^{2}}\sum_{i=1}^{m}(yi-\omega xi-b)^{2}$ 取最大值的情况。

其中m与 $\sigma$ 为常数，则对似然函数的最大化等价于最小化 $\sum_{i=1}^{m}(yi-\omega xi-b)^{2}$ 。

惊讶的发现此等价条件与最小二乘法下得到的公式一样！

下面我们结合这个条件开始求解 $\omega$ 和的值：

3.1.3求解 $\omega$ 和

求解思路为：证明 $\sum_{i=1}^{m}(yi-\omega xi-b)^{2}$ 为关于 $\omega$ 和的凸函数 $\rightarrow$ 利用凸函数求最值的方法来求解出 $\omega$ 和。

①数学分析中对于凸函数的定义与高数中相反：

②多元函数导数的定义：

即为：将函数关于每一个变量的偏导数排列成列向量，以下列出多元函数的一阶导数、二阶导数的表达方式：

③综合以上两类定义，存在以下定理：

类比一元函数判断凹凸性，对于∈ $R^{n}$ 是非空开凸集， $f:D\subset R^{n}\rightarrow R$ ,且在上二阶连续可微，则若的Hessian矩阵在上是半正定的，则是上的凸函数。

则存在转化条件：证明 $\sum_{i=1}^{m}(yi-\omega xi-b)^{2}$ 为凸函数 $\Rightarrow$ 证明海塞矩阵半正定性。

④开始证明矩阵的正定性：

先对各个二阶偏导项进行化简：

$\frac{\partial E_{(\omega ,b)}}{\partial \omega }$ = $\frac{\partial }{\partial \omega }\left [ \sum_{i=1}^{m}(yi-\omega xi-b)^{2} \right ]$ = $\sum_{i=1}^{m}\frac{\partial }{\partial \omega } (yi-\omega xi-b)^{2}$ = $\sum_{i=1}^{m}2\cdot (yi-\omega xi-b)\cdot (-xi)$ = $2(\omega \sum_{i=1}^{m}xi^{2}-\sum_{i=1}^{m}(yi-b)xi)$ ；

$\frac{\partial^2 E_{(\omega ,b)}}{\partial \omega ^2}$ = $\frac{\partial }{\partial \omega }\left ( \frac{\partial E_{(\omega ,b)}}{\partial \omega } \right )$ = $\frac{\partial }{\partial \omega }\left [ 2(\omega \sum_{i=1}^{m}xi^{2}-\sum_{i=1}^{m}(yi-b)xi) \right ]$ = $2\sum_{i=1}^{m}xi^{2}\omega$ = $2\sum_{i=1}^{m}xi^{2}$ ;

$\frac{\partial E_{(\omega ,b)}}{\partial \omega\partial b }$ = $\frac{\partial }{\partial b }\left [ 2(\omega \sum_{i=1}^{m}xi^{2}-\sum_{i=1}^{m}(yi-b)xi) \right ]$ = $\frac{\partial }{\partial b }\left [ -2(\sum_{i=1}^{m}yixi-\sum_{i=1}^{m}bxi) \right ]$ = $2\sum_{i=1}^{m}xi$ 。

$\frac{\partial E_{(\omega ,b)}}{\partial b }$ = $\frac{\partial }{\partial b }\left [ \sum_{i=1}^{m}(yi-\omega xi-b)^{2} \right ]$ = $\sum_{i=1}^{m}\frac{\partial }{\partial b } (yi-\omega xi-b)^{2}$ = $\sum_{i=1}^{m}2\cdot (yi-\omega xi-b)\cdot (-1)$ = $2(mb-\sum_{i=1}^{m}(yi-\omega xi))$ ;

$\frac{\partial E_{(\omega ,b)}}{\partial b \partial \omega }$ = $2\sum_{i=1}^{m}xi$ ; $\frac{\partial^2 E_{(\omega ,b)}}{\partial b ^2}$ = 。

将以上计算结果表达式带入到海塞矩阵中，并通过半正定矩阵的判断定理——顺序主子式非负，整得此矩阵半正定，继而得出 $E(\omega ,b)$ 为关于 $\omega$ 和的凸函数：

以下只需证明： $4m\sum_{i=1}^{m}xi^{2}-4(\sum_{i=1}^{m}xi)^{2}$ $\geqslant 0$ 即可。

证： $4m\sum_{i=1}^{m}xi^{2}-4(\sum_{i=1}^{m}xi)^{2}$ = $4m\sum_{i=1}^{m}xi^{2}-4\cdot m\cdot \frac{1}{m}(\sum_{i=1}^{m}xi)\cdot (\sum_{i=1}^{m}xi)$ = $4m\sum_{i=1}^{m} xi^{2}-4 {m}\cdot \bar{x}\cdot \sum_{i=1}^{m}xi$ = $4m(\sum_{i=1}^{m} xi^{2}-\bar{x}\cdot \sum_{i=1}^{m}xi)$ ； 由于 $\sum_{i=1}^{m}xi\cdot \bar{x}$ = $\sum_{i=1}^{m} \bar{x}^{^{2}}$ 成立，

原式转化为： $4m(\sum_{i=1}^{m} xi^{2}-\bar{x}\cdot \sum_{i=1}^{m}xi)$ = $4m\sum_{i=1}^{m} (xi^{2}-\bar{x}\cdot xi-\bar{x}\cdot xi+\bar{x}\cdot xi)$ = $4m\sum_{i=1}^{m} (xi^{2}-\bar{x}\cdot xi-\bar{x}\cdot xi+\bar{x}^{2})$ = $4m\sum_{i=1}^{m}(xi-\bar{x})^{2}$ $\geqslant 0$ ,得证。

⑤根据凸函数求最值的方法求解出 $\omega$ 和：

令两偏导数为0：

$\frac{\partial E_{(\omega ,b)}}{\partial b }$ = $2(mb-\sum_{i=1}^{m}(yi-\omega xi))$ =0 （i） $\Rightarrow$ $b=\frac{1}{m}\sum_{i=1}^{m}(yi-\omega xi)$ $= \frac{1}{m}\sum_{i=1}^{m}yi-\omega \cdot \frac{1}{m}\sum_{i=1}^{m}xi$ $=\bar{y}-\omega \bar{x}$

$\frac{\partial E_{(\omega ,b)}}{\partial \omega }$ $2(\omega \sum_{i=1}^{m}xi^{2}-\sum_{i=1}^{m}(yi-b)xi)$ (ii) $\overset{b=\bar{y}-\omega \bar{x}}{\rightarrow}$

3.1.4算法处理前的向量化

对于这种连加项，若想要用Python来实现，只能通过用循环，但如果可以对此式进行向量化，则可以转化为矩阵运算，再利用NumPy类库，可大大增加计算效率。

向量化：代入 $\frac{1}{m}(\sum_{i=1}^{m}xi)^{2}$ = $\bar{x}\cdot \sum_{i=1}^{m}xi$ , 转化为： $\omega =\frac{\sum_{i=1}^{m}yi(xi-\bar{x})}{\sum_{i=1}^{m}(xi^{2}-xi\bar{x})}$

$\omega =\frac{\sum_{i=1}^{m}(yixi-yi\bar{x}-yi\bar{x}+\bar{x}\bar{y})}{\sum_{i=1}^{m}(xi^{2}-xi\bar{x}-xi\bar{x}+\bar{x}^{2})}=\frac{\sum_{i=1}^{m}(xi-\bar{x})(yi-\bar{y})}{\sum_{i=1}^{m}(xi-\bar{x})^{2}}$

令 $x=(x1,x2,..,xm)^{T}$ , $x_{d}=(x1-\bar{x},x2-\bar{x},...,xm-\bar{x})^{T}$ 为去除其均值后的;

$y=(y1,y2,..,ym)^{T}$ , $y_{d}=(y1-\bar{y},y2-\bar{y},...,ym-\bar{y})^{T}$ 为去除其均值后的。

则 $\omega =\frac{x_{d}^{T}y_{d}}{x_{d}^{T}X_{d}}$ 。

3.2多元线性回归

对于给定数据集 $\large D=\left \{ (x1,y1),(x2,y2),...,(xm,ym) \right \}$ ，更多的情形是样本由个属性来描述，此时试图学得 $f(xi)=\omega ^{T}xi+b$ ，使得 $\large f(xi)\approx yi$ ,即为“多元线性回归”。

与一元线性回归的研究方式相似，首先由最小二乘法导出损失函数 $E_{\hat{\omega }}$ ,再求解其中的参数，将两个参数吸收入向量·形式： $\hat{\omega}$ = $(\omega ;b)$ 。

3.2.1最小二乘法导出 $E_{\hat{\omega }}$

对于 $f(xi)=\omega ^{T}xi+b$ ，将也处理成向量乘积的形式,从而简化后续的计算式复杂度,得到与一元回归中类似的形式：

则总体表达式可转化为 $f(\hat{x_{i}})=\hat{\omega ^{T}}\hat{x_{i}}$ ;

由最小二乘法可得: $E_{\hat{\omega }}=\sum_{i=1}^{m}(yi-f(\hat{xi}))^{2}$ $=\sum_{i=1}^{m}(yi-\hat{\omega }^{T}\hat{xi})^{2}$ 即为简化后的损失函数的表达方式。

对损失函数的表达式进行向量化：

3.2.2证明 $E_{\hat{\omega }}$ 为凸函数

在上述过程中，我们通过对损失函数的向量化，得到它的向量表达式 $E_{\hat{\omega }}=(y-X\hat{\omega })^{T}(y-X\hat{\omega })$ ，若想证明其为凸函数，需要通过求取其标量对向量的偏导数，求取其海塞矩阵 $\bigtriangledown ^{2}E_{\hat{\omega }}$ ，并证明其半正定性（涉及到矩阵分析的内容）：

3.2.3求解未知数集合 $\hat{\omega}$

类比一元回归问题，利用凸函数的性质，求取 $\hat{\omega}$ 的值：

总结

以上思路来源于《机器学习》这本书第三章的内容，一元线性回归和多元线性回归为本书中的重点内容，公式推导过程复杂但不难理解，条理清晰，需要耐心。内容仅代表个人的思路和理解，如有错误欢迎指正！

Python多线程vs多进程：一场关于效率的“宫斗戏“，谁才是你的真命天子？
清晨的咖啡还冒着热气，你盯着监控面板上飙升的CPU使用率，键盘敲出的代码在"多线程"和"多进程"之间反复横跳——这可能是每个Python开发者都会经历的"效率抉择时刻"。当项目从"能跑就行"进化到"必须快跑"，多线程与多进程这对"欢喜冤家"就会跳出来，用各自的"十八般武艺"让你挑花眼。今天咱们就来扒开表象，从底层机制到实战案例，彻底搞懂这对CP的爱恨纠葛。一、GIL：多线程头顶的"紧箍咒"要聊多线
【mongodb】mongodb数据备份与恢复向往风的男子运维日常 DBA mongodb 数据库
本站以分享各种运维经验和运维所需要的技能为主《python零基础入门》：python零基础入门学习《python运维脚本》：python运维脚本实践《shell》：shell学习《terraform》持续更新中：terraform_Aws学习零基础入门到最佳实战《k8》暂未更新《docker学习》暂未更新《ceph学习》ceph日常问题解决分享《日志收集》ELK+各种中间件《运维日常》运维日常《l
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
数据存储：使用Python存储数据到redis详解数据知道爬虫和逆向教程 python redis 数据库非关系型数据库
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录一.安装相关库和进行连接二、存储数据到Redis2.1存储字符串2.2存储列表2.3存储集合2.4有序集合类型2.5存储哈希三、数据的持久化与过期设置3.1持久化3.2过期设置四、其它操作4.1删除操作4.2关闭连接4.3使用连接池4.4处理异常五、总结在Python中，我们可以使用redis-py库来与Redis数据库进行交互。以下是如何将数据
Python 中的循环小羊苏八 python 开发语言
目录前言一.for循环二.while循环三.break与continue四.循环与else总结前言Python中的循环：for、while、break、continue与循环中的else。在Python中，循环是控制程序流程的重要结构之一。它允许我们重复执行一段代码，直到满足特定条件为止。Python提供了两种主要的循环结构：for循环和while循环。此外，break和continue语句可以用
Python——pyautogui打地鼠游戏自动化脚本（基于图片定位）
以4399小游戏为例：4399游戏网importpyautoguiimportkeyboardimporttimeimportrandomimportloggingfromPILimportImageGrabimportos#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname)s-%(message)
最小二乘法(OLS)python 实践
参考链接：1，基本原理：https://zhuanlan.zhihu.com/p/1492809412，python实现：https://zhuanlan.zhihu.com/p/22692029实现结果线性回归：#--coding:utf-8--#简单线性回归demoimportnumpyasnpimportmatplotlib.pyplotaspltimportstatsmodels.apia
【Statsmodels和SciPy介绍与常用方法】机器学习司猫白 scipy statsmodels 统计
Statsmodels库介绍与常用方法Statsmodels是一个强大的Python库，专注于统计建模和数据分析，广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具，适合进行回归分析、时间序列分析等任务。本文将介绍Statsmodels的核心功能，并通过代码示例展示其常用方法。Statsmodels简介Statsmodels建立在NumPy和SciPy的基础上，
（五)PS识别：压缩痕迹挖掘-压缩量化表与 DCT 系数分析超龄超能程序猿机器学习 python 图像处理人工智能计算机视觉
（一)PS识别：Python图像分析PS识别之道（二）PS识别：特征识别-直方图分析的从原理到实现（三)PS识别：基于噪声分析PS识别的技术实现（四)PS识别：基于边缘纹理检测分析PS识别的技术实现一介绍本文将介绍一种基于量化表分析和DCT系数分析的图片PS检测方法，帮助你判断图片是否经过处理。二实现原理量化表分析在JPEG图片的压缩过程中，量化表起着关键作用。不同的软件或处理操作可能会改变量化表
Python高频面试题（四） Irene-HQ 测试 python 自动化测试 python 开发语言面试测试工具 github pycharm
以下是Python研发和自动化测试面试中‌更高阶的专项考点及典型问题‌一、并发与异步编程（高级）‌GIL全局解释器锁的应对策略‌问题：GIL如何影响Python多线程性能？如何绕过GIL限制？答案：GIL使同一时刻仅一个线程执行字节码，CPU密集型任务性能受限绕过方案：使用多进程（multiprocessing）、C扩展（如Cython）、异步IO（asyncio）‌46‌协程异步调用示例‌问题：
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
Python 编程基础作业总结
本周主要围绕Python基础编程展开了学习，通过一系列的作业题来巩固所学知识。这些题目涵盖了输入输出、条件判断、循环结构等多个基础知识点，下面将对每道作业题进行详细分析。1.计算指定月份第一天是星期几题目描述编写一个程序，接受用户输入的一个年份和一个月份，输出该月份的第一天是星期几。使用蔡乐公式计算星期。提示：使用蔡乐公式计算星期。W=((26*M-2)/10+D+Y+Y/4+C/4-2*C)%7
交叉编译Python-3.6.0到aarch64/aarch32 —— 支持sqlite3
参考https://datko.net/2013/05/10/cross-compiling-python-3-3-1-for-beaglebone-arm-angstrom/平台主机：ubuntu14.0464bit开发板：qemu+aarch64（参考：http://www.cnblogs.com/pengdonglin137/p/6442583.html）工具链：aarch64-linux-
python# python:3.5 aarch64构建镜像 Ling丶落 centos
构建失败从ubuntu中尝试构建FROMpython:3.5-slimLABELMAINTAINER="[email protected]"#installrelatedpackagesENVENVIRONMENTDOCKER_PRODWORKDIR/workCOPY./dataset.py/work/dataset.pyCOPY./model.py/work/model.pyCOPY./PyA
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
两步移动搜索法（2SFCA）python 我在北京coding python python 开发语言
实现两步移动搜索法（Two-StepFloatingCatchmentAreaMethod,2SFCA）是一种广泛应用于地理信息系统（GIS）领域的方法，用于评估设施的空间可达性。以下是基于Python和GeoPandas的一种实现方式。准备工作为了实现2SFCA方法，需要准备以下数据集：供给点：表示服务提供方的位置及其服务能力。需求点：表示潜在使用者的位置及其需求量。距离矩阵：描述供给点与需求点
Java、python中高级开发工程师岗位框架要求统计爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ java python 开发语言
一、主流框架使用频率框架/技术出现频率说明SpringBoot89%几乎成为Java后端开发的标配，用于快速构建微服务和独立应用。SpringCloud76%微服务架构必备，提供服务发现、配置管理、网关等核心组件。MyBatis/MyBatis-Plus72%最流行的ORM框架，MyBatis-Plus进一步简化开发。Spring68%基础框架，中高级岗位要求深入理解IoC、AOP原理。Hiber
PPOCRLabel 环境配置教程 ysh9888 人工智能算法计算机视觉 opencv
PPOCRLabel环境配置教程_哔哩哔哩_bilibili1安装conda2新建环境condacreate--nameppocrpython=3.8--channelhttps://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/condaactivateppocrpipinstall-rrequirements.txt-ihttps://pypi
response.split(“\n“)[0].strip() 是什么 ZhangJiQun&MXP 教学 2021 AI python python 机器学习人工智能语言模型自然语言处理
response.split(“\n”)[0].strip()是什么returnresponse.split("\n")[0].strip()这行代码在Python中通常用于对字符串进行处理并返回处理后的结果response.split("\n")：split()是Python字符串对象的一个方法，用于根据指定的分隔符将字符串拆分成一个列表。在这行代码中，"\n"作为分隔符，表示按照换行符来拆分字
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
Python函数 python知识
1文档字符串函数定义下的第一个字符串是文档字符串，用于解释函数。可以通过help(function_name)或function_name.__doc__来查看。2函数返回单个返回值：return一个值无返回值：函数执行完毕没有return语句，或者return后面没有值，会隐式地返回None返回多个值：实际上是返回一个包含所有值的元组(tuple)3参数函数声明：使用def关键字来创建函数默认参
Python-selenium爬取藏在歌词里 python selenium 开发语言
selenium前言使用python的requests模块还是存在很大的局限性，例如：只发一次请求；针对ajax动态加载的网页则无法获取数据等等问题。特此，本章节将通过selenium模拟浏览器来完成更高级的爬虫抓取任务。什么是seleniumSelenium是一个用于自动化Web应用程序测试的开源工具集。它提供了一组API和工具，可以与多种编程语言一起使用，如Java、Python、C#等，用于
python --飞浆离线ocr使用/paddleocr
依赖#python==3.7.3paddleocr==2.7.0.2paddlepaddle==2.5.2loguru==0.7.3frompaddleocrimportPaddleOCRimportcv2importnumpyasnpif__name__=='__main__':OCR=PaddleOCR(use_doc_orientation_classify=False,#检测文档方向use
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

机器学习-一元线性回归与多元线性回归

前言

一、机器学习的三要素

二、线性模型的基本形式

三、线性回归

3.1一元线性回归

3.1.1最小二乘法

3.1.2极大似然估计

3.1.3求解 和

3.1.4算法处理前的向量化

3.2多元线性回归

3.2.1最小二乘法导出

3.2.2证明为凸函数

3.2.3求解未知数集合

总结

你可能感兴趣的:(机器学习,python,人工智能)

3.1.3求解 $\omega$ 和

3.2.1最小二乘法导出 $E_{\hat{\omega }}$

3.2.2证明 $E_{\hat{\omega }}$ 为凸函数

3.2.3求解未知数集合 $\hat{\omega}$