CuCu011

机器学习基础模型回顾

1 导论

1.1 什么是机器学习？

机器学习的一个重要目标就是利用数学模型来理解数据，发现数据中的规律，用作数据分析和预测。

1.1.1 数据？

数据通常由一组向量组成，这组向量中的每一个向量都是一个样本，我们用 $x_{i}$ 来表示一个样本，其中 $i = 1, 2, 3 . . . N$ ，共 $N$ 个样本。每个样本 $x_{i} = \left ( x_{i1},x_{i2}...x_{ip},y_{i} \right )$ 共 $p + 1$ 个维度，$ x_{i1},x_{i2}…x_{ip} $称为特征，$ y_{i} $称为因变量或者响应变量。特征用来描述影响因变量$ y_{i}$的因素。例如，我们要探寻身高是否会影响体重的关系的时候，身高就是一个特征，体重就是因变量。

通常在一个数据表 $d a t a f r a m e$ 里面，一行表示一个样本 $x_{i}$ ，一列表示一个特征。

对数据形式的约定：

第 $i$ 个样本： $x_{i} = \left ( x_{i1},x_{i2}，...，x_{ip},y_{i} \right )^{T}$ ， $i = 1, 2, 3 . . . N$
因变量 $\left ( y_{1}, y_{2}，...，y_{N}\right )^{T}$
第 $k$ 个特征： $x^{\left ( k \right )} = \left ( x_{1k}, x_{2k} ,..., x_{Nk} \right )^{T}$
特征矩阵 $\left ( x_{1},x_{2}，...，x_{N} \right )^{T}$

1.1.2 有监督学习和无监督学习

根据数据是否有因变量，机器学习的任务可分为：有监督学习和无监督学习。

有监督学习：给定某些特征去估计因变量，即因变量存在的时候，我们称这个机器学习任务为有监督学习。例如，我们用房间面积、房屋所在地区、环境等级等因素去预测某个地区的房价。

根据因变量是否连续，有监督学习分为回归和分类。

回归

分类

有监督学习

因变量y是连续型变量如房价体重

因变量y是离散型变量如西瓜是好瓜还是坏瓜
无监督学习：给定某些特征，但不给定因变量。建模的目的是学习数据本身的结构和关系。例如，我们给定某电商用户的基本信息和消费记录，通过观察数据中的哪些类型的用户彼此间的行为和属性类似，形成一个客群。注意，我们本身并不知道哪个用户属于哪个客群，即没有给定因变量。

有监督学习

无监督学习

机器有监督学习

有因变量y 有特征向量预测结果或未来

无因变量y 无特征向量寻找数据中的结构

2 使用sklearn构建完成的机器学习项目流程

一般来说，一个完整的机器学习项目分为以下步骤：

（1）明确项目任务：回归/分类

（2）收集数据集并选择合适的特征

（3）选择度量模型性能的指标

（4）选择具体的模型并进行训练以优化模型

（5）评估模型的性能并调参

2.1 使用sklearn构建完整的回归项目

（1）回归问题

（2）收集数据集并选择合适的特征：

我们使用Boston房价数据集的原因：

（3）选择度量模型性能的指标：

MSE均方误差： $MSE\left ( y,\hat{y} \right ) = \frac{1}{n_{samples}}\sum_{i=0}^{n_{samples-1}}\left ( y_{i}-\hat{y_{i}} \right )^{2}$
MAE平均绝对误差： $MAE\left ( y,\hat{y} \right ) = \frac{1}{n_{samples}}\sum_{i=0}^{n_{samples-1}}\left | y_{i}-\hat{y_{i}} \right |$

$R^{2}$ 决定系数： $R^{2}\left ( y,\hat{y} \right ) = 1 - \frac{\sum_{i=1}^{n}\left ( y_{i}- \hat{y_{i}}\right )^{2}}{\sum_{i=1}^{n}\left ( y_{i}- \bar{y}\right )^{2}}$

解释方差得分： $ExplainedVariance\left ( y,\hat{y} \right ) = 1 - \frac{Var\left \{ y-\hat{y} \right \}}{Var\left \{ y \right \}}$

（4）选择具体的模型并进行训练

回归分析时一种预测性的建模技术，它研究的是因变量(目标)和自变量(特征)之间的关系。这种技术通常用于预测分析，时间序列模型以及发现变量之间的因果关系。通常使用曲线/线来拟合数据点，目标是使曲线到数据点的距离差异最小。

线性回归模型：

线性回归是回归问题的一种，线性回归假设目标值与特征之间线性相关，即满足一个多元一次方程。通过构建损失函数，来求解损失函数最小时的参数w。

数据集：

$\left \{ \left ( x_{1},y_{1} \right ),..., \left ( x_{N},y_{N} \right ) \right \} , x_{i}\epsilon R^{p}, y_{i} \epsilon R,i = 1,2,...,N$

$\left ( x_{1},x_{2},...,x_{N} \right ) ^{T}$

$\left ( y_{1},y_{2},...,y_{N} \right ) ^{T}$

假设X和Y之间存在线性关系，模型的具体形式为： $\hat{y} = f\left ( w \right ) = w^{T}x$ ，行向量x列向量=值，所以预测值y往往是一个数字。

最小二乘估计：

我们需要衡量真实值 $y_{i}$ 与线性回归模型的预测值 $w^{T}x$ 之间的差距，在这里我们使用二范数的平方和L(w)来描述这种差距：

$\sum_{i}^{N}\left \| w^{T}x_{i} -y_{i}\right \|_{2}^{2}$
$=\sum_{i}^{N}\left (w^{T}x_{i} -y_{i} \right )^{2}$
$=\left ( w^{T} X^{T} - Y^{T}\right )\left ( w^{T} X^{T} - Y^{T}\right )^{T}$
$w^{T}X^{T} Xw-2w^{T}X^{T}Y+YY^{T}$

Tips：为什么平方和不用绝对值？因为绝对值没法求导。

因此，我们需要找到 $L (w)$ 最小时对应的参数 $w$ ，即： $\hat{w}=argminL(w)$ ，即转化为求解最小化 $L (w)$ 的问题。

求导

令： $\frac{\partial L(w)}{\partial w}$ $2X^{T}Xw - 2X^{T}Y$ $= 0$

因此： $\hat{w}=\left (X^{T}X \right )^{-1}X^{T}Y$

几何解释：

向量a和向量b互相垂直，则 $\left \langle a,b \right \rangle = a^{T}b = 0$

平面X的法向量 $Y - X w$ 与平面 $X$ 互相垂直，因此 $X^{T}(Y-Xw)=0$ ，即： $\hat{w}=\left (X^{T}X \right )^{-1}X^{T}Y$

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bkeY4lgo-1626358562996)(C:\Users\DELL-PC\AppData\Roaming\Typora\typora-user-images\image-20210715204737292.png)]

概率视角：

3 作业

3.1 请详细阐述线性回归模型的最小二乘法表达。

最小二乘估计：

我们需要衡量真实值 $y_{i}$ 与线性回归模型的预测值 $w^{T}x$ 之间的差距，在这里我们使用二范数的平方和L(w)来描述这种差距：

$\sum_{i}^{N}\left \| w^{T}x_{i} -y_{i}\right \|_{2}^{2}$
$=\sum_{i}^{N}\left (w^{T}x_{i} -y_{i} \right )^{2}$
$=\left ( w^{T} X^{T} - Y^{T}\right )\left ( w^{T} X^{T} - Y^{T}\right )^{T}$
$w^{T}X^{T} Xw-2w^{T}X^{T}Y+YY^{T}$

Tips：为什么平方和不用绝对值？因为绝对值没法求导。

因此，我们需要找到 $L (w)$ 最小时对应的参数 $w$ ，即： $\hat{w}=argminL(w)$ ，即转化为求解最小化 $L (w)$ 的问题。

求导

令： $\frac{\partial L(w)}{\partial w}$ $2X^{T}Xw - 2X^{T}Y$ $= 0$

因此： $\hat{w}=\left (X^{T}X \right )^{-1}X^{T}Y$

3.2 在线性回归模型中，极大似然估计与最小二乘估计有什么联系和区别？

(12条消息) 最大似然估计和最小二乘估计的区别与联系_梦想腾飞-CSDN博客_极大似然估计和最小二乘估计的区别

(12条消息) 最大似然估计(MLE)与最小二乘估计(LSE)的区别_你若盛开，清风自来-CSDN博客

3.3 为什么多项式回归在实际问题中的表现经常不是很好？

当阶数越高，多项式的曲线越光滑，在数据点较少的边界波动较大，边界数据的预测精确度较低。

3.4 决策树模型与线性模型之间的联系与区别？

3.5 什么是KKT条件？

KKT(最优解的一阶必要条件)

3.6 为什么要引入原问题的对偶问题？

因为原问题与对偶问题就像是一个问题两个角度去看，如利润最大与成本最低等。有时侯原问题上难以解决，但是在对偶问题上就会变得很简单。再者，任何一个原问题在变成对偶问题后都会变成一个凸优化的问题，

3.7 使用CH1机器学习数学基础所学的内容，找到一个具体的数据集，使用线性回归模型拟合模型，要求不能使用sklearn，只能使用python和numpy。

波士顿房价预测

def openFileAndSplit():
    # 打开并且分割字符

    with open(r"F:\housing_data.txt", 'r') as f:

        for line in f.readlines():
            b = []
            for x in line.split():
                b.append(float(x))
            a.append(b)
            
def duoyuanxianxinghuigui():
    # 多元线性回归模型
    b = []
    # 分离最后一列
    for l in a:
        b.append([l.pop()])
        l.append(1)
    a1 = np.mat(a[0:449])
    a2 = np.mat(a[450:505])
    b1 = np.mat(b[0:449])
    b2 = np.mat(b[450:505])
    k = np.matmul(a1.transpose(1, 0), a1).I
    k = np.matmul(np.matmul(k, a1.transpose(1, 0)), b1)
    ans = np.matmul(a2, k).transpose(1, 0)
    # 均方差计算准确率
    accuRate = np.array(ans - b2.transpose(1, 0))[0]
    print(ans)
    print("准确率：")
    print(sum(accuRate * accuRate) / len(accuRate))


def main():
    openFileAndSplit()
    duoyuanxianxinghuigui()


main()

你可能感兴趣的:(datawhale,机器学习)

机器学习学习笔记（十七）—— 优化算法概述 lancetop-stardrms 机器学习机器学习
一、概观scipy中的optimize子包中提供了常用的最优化算法函数实现。我们可以直接调用这些函数完成我们的优化问题。optimize中函数最典型的特点就是能够从函数名称上看出是使用了什么算法。下面optimize包中函数的概览：1.非线性最优化fmin--简单Nelder-Mead算法fmin_powell--改进型Powell法fmin_bfgs--拟Newton法fmin_cg--非线性共
机器学习和深度学习有什么区别？ facaixxx2024 AI大模型机器学习深度学习人工智能
深度学习和机器学习有什么区别？深度学习是机器学习一个分支，机器学习包含深度学习。下面阿小云从定义、技术、数据需求、应用领域、模型复杂度和计算资源多维度来对比深度学习和机器学习的区别：二者的定义区别机器学习：是一种数据分析技术，通过算法使计算机能够在无明确编程的情况下进行学习和决策。深度学习：是机器学习的一个子领域，使用神经网络模型，尤其是深层神经网络模型，来处理、解释和分类数据。依赖算法和技术不同
AI趋势下，软件测试工程师怎么拥抱AI 悠然的笔记本人工智能
在AI趋势下，软件测试工程师怎么拥抱AI呢？以下是我的一些思考：一、掌握AI基础知识软件测试工程师需要学习机器学习、深度学习、自然语言处理等领域的基本原理和算法。这些基础知识有助于理解AI在测试中的应用基础，从而能够更好地利用AI技术提升测试效率和质量。二、掌握AI相关工具和技术编程语言：学习使用Python等编程语言，这是实现AI应用的常用工具之一。框架：掌握TensorFlow、PyTorch
什么是机器学习? CM莫问机器学习模型机器学习人工智能算法
一、概念（维基百科）机器学习是人工智能的一个分支。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。二、主要特点机器学习的主要特点包括：1、数据驱动：机器学习模型的性能主要依赖于输入的数据。数据的质量和数量直接影响模型的准确性和泛化能力，所谓“Garbagein,garbag
机器学习，我们主要学习什么？悠然的笔记本机器学习机器学习
机器学习的发展历程机器学习的发展历程，大致分为以下几个阶段：1.起源与早期探索（20世纪40年代-60年代）1949年：Hebb提出了基于神经心理学的学习机制，开启了机器学习的先河1950年代：机器学习的起源与人工智能的探索紧密相连。例如，1956年，达特茅斯会议标志着人工智能的诞生，机器学习作为其重要分支也开始受到关注1960年代：出现了早期的机器学习算法，如1967年诞生的K最近邻算法（KNN
机器学习的数学基础(三)——概率与信息论梦醒沉醉数学基础概率论信息论
目录1.随机变量2.概率分布2.1离散型变量和概率质量函数2.2连续型变量和概率密度函数3.边缘概率4.条件概率5.条件概率的链式法则6.独立性和条件独立性7.期望、方差和协方差7.1期望7.2方差7.3协方差8.常用概率分布8.1均匀分布U(a,b)U(a,b)U(a,b)8.2Bernoulli分布8.3Multinoulli分布8.4高斯分布(正态分布)N(x;μ,σ2)N(x;\mu,\s
XGBoost vs LightGBM vs CatBoost：三大梯度提升框架深度解析机器学习司猫白机器学习理论机器学习 xgboost lightgbm catboost 参数调优人工智能
梯度提升树（GradientBoostingDecisionTrees,GBDT）作为机器学习领域的核心算法，在结构化数据建模中始终占据统治地位。本文将深入解析三大主流实现框架：XGBoost、LightGBM和CatBoost，通过原理剖析、参数详解和实战对比，助你全面掌握工业级建模利器。一、算法原理深度对比1.XGBoost：工程优化的奠基者核心创新：二阶泰勒展开：利用损失函数的一阶导和二阶导
【深度学习】矩阵的理解与应用大数据追光猿深度学习矩阵算法线性代数机器学习 python 深度学习
一、矩阵基础知识1.什么是矩阵？矩阵是一个数学概念，通常表示为一个二维数组，它由行和列组成，用于存储数值数据。矩阵是线性代数的基本工具之一，广泛应用于数学、物理学、工程学、计算机科学、机器学习和数据分析等领域。1.1矩阵的表示一个矩阵通常用大写字母来表示，例如AAA，而矩阵中的元素则用小写字母来表示，例如aija_{ij}aij，其中iii表示行索引，jjj表示列索引。本质：矩阵是二维的张量矩阵的
计算机视觉CV学习路线我喝AD钙我的学习笔记计算机视觉学习人工智能
计算机视觉CV学习路线1.基础准备（可参考mooc学习）2.计算机视觉基础知识（可参考mooc学习、计算机图形学）3.经典计算机视觉算法（可参考吴恩达机器学习课程、国内外计算机图形学课程）4.深度学习基础（参考吴恩达和TF、Keras官网手册）5.深度学习在计算机视觉中的应用（李飞飞课程、arxiv论文原文和解析博客，实战参考gitee/github）6.现代计算机视觉技术（arxiv论文原文和解
Github上有哪些不错的Python开源项目？ cda2024 github python 开源
在当今快速发展的科技时代，Python已经成为编程语言界的明星，它简洁优雅的语法、强大的库支持以及广泛的社区贡献，使其在数据分析、机器学习、Web开发等多个领域大放异彩。而在GitHub这个全球最大的代码托管平台上，无数优秀的Python开源项目如雨后春笋般涌现，不仅为开发者提供了丰富的资源，也为技术爱好者提供了学习和实践的机会。本文将带你走进GitHub的Python开源世界，探索那些不容错过的
基于 JavaWeb 的 SSM+Maven 微信小程序快递柜管理系统设计和实现(源码+文档+部署讲解）秋野酱 java 课程设计前端 maven 微信小程序 java 课程设计
技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计、开题报告、任务书、中期检查PPT、系统功能实现、代码编写、论文编写和辅导、论文降重、长期答辩答疑辅导、腾讯会议一对一专业讲解辅导答辩、模拟答辩演练、和理解代码逻辑思路。文末获取源码联系文末获取源码联
在低功耗MCU上实现人工智能和机器学习电子科技圈 Silicon Labs 人工智能机器学习嵌入式硬件经验分享科技物联网 mcu
作者：SiliconLabs人工智能（AI）和机器学习（ML）技术不仅正在快速发展，还逐渐被创新性地应用于低功耗的微控制器（MCU）中，从而实现边缘AI/ML解决方案。这些MCU是许多嵌入式系统不可或缺的一部分，凭借其成本效益、高能效以及可靠的性能，现在能够支持AI/ML应用。这种集成化在可穿戴电子产品、智能家居设备和工业自动化等应用领域中，从AI/ML功能中获得的效益尤为显著。具备AI优化功能的
【Rust】——使用Drop Trait 运行清理代码和Rc＜T＞引用计数智能指针 Y小夜 Rust（官方文档重点总结）rust 开发语言后端
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，Python机器学习等主页链接：Y小夜-CSDN博客目录使用DropTrait运行清理代码通过std::mem::drop提早丢弃值
Python机器学习库之scikit-llm使用详解 Rocky006 python 开发语言
概要Pythonscikit-llm库是一个用于机器学习的强大工具，它基于scikit-learn库并扩展了一些机器学习算法和功能，可以帮助开发者更轻松地进行机器学习模型的训练和评估。安装可以使用pip工具来安装Pythonscikit-llm库：pip install scikit-llm安装完成后，就可以开始使用scikit-llm库进行机器学习任务了。特性支持多种机器学习算法，如线性回归、逻
基于深度学习的入侵检测系统设计与实现 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于深度学习的入侵检测系统设计与实现关键词：深度学习、入侵检测、网络安全、机器学习、神经网络、特征提取、实时分析文章目录基于深度学习的入侵检测系统设计与实现1.背景介绍1.1网络安全的重要性1.2传统入侵检测系统的局限性1.3深度学习在安全领域的应用前景2.核心概念与联系2.1入侵检测系统（IDS）概述2.2深度学习基础2.3深度学习在入侵检测中的应用3.核心算法原理&具体操作步骤3.1算法原理概
【机器学习基础】第六课：线性回归 x-jeff 机器学习基础机器学习线性回归人工智能
【机器学习基础】系列博客为参考周志华老师的《机器学习》一书，自己所做的读书笔记。1.线性模型基本形式给定由ddd个属性描述的示例x=(x1;x2;...;xd)\mathbfx=(x_1;x_2;...;x_d)x=(x1;x2;...;xd)，那么线性模型的基本形式可写为：f(x)=w1x1+w2x2+w3x3+...+wdxd+bf(\mathbfx)=w_1x_1+w_2x_2+w_3x_3
机器学习库 Welosthesightof 笔记
机器学习一個很棒的機器學習框架、庫和軟件的精選列表（按語言）。靈感來自於awesome-php。计算机视觉Scikit-Image-Python中图像处理算法的集合。Scikit-Opt-Python中的群智能（Python中的遗传算法、粒子群优化、模拟退火、蚁群算法、免疫算法、人工鱼群算法）SimpleCV-一个开源计算机视觉框架，可以访问多个高性能计算机视觉库，例如OpenCV。用Python
机器学习：入门方法与学习路径 (附资料) weixin_34051201 人工智能 java c/c++
◆◆◆1.引言也许你和这个叫『机器学习』的家伙一点也不熟，但是你举起iphone手机拍照的时候，早已习惯它帮你框出人脸；也自然而然点开今日头条推给你的新闻；也习惯逛淘宝点了找相似之后货比三家；亦或喜闻乐见微软的年龄识别网站结果刷爆朋友圈。恩，这些功能的核心算法就是机器学习领域的内容。套用一下大神们对机器学习的定义，机器学习研究的是计算机怎样模拟人类的学习行为，以获取新的知识或技能，并重新组织已有的
介绍 TensorFlow 的基本概念和使用场景。 AC使者 github sqlite 开发语言自然语言处理
TensorFlow是一个由Google开发的开源机器学习框架，旨在让开发者能够构建和训练各种深度学习模型。以下是TensorFlow的基本概念和使用场景：张量（Tensor）：在TensorFlow中，数据以张量的形式表示，可以理解为多维数组。张量是TensorFlow的基本数据单位，常用于存储训练数据和模型的参数。计算图（ComputationalGraph）：TensorFlow使用计算图来
人工智能训练师如何做文本数据标注？小宝哥Code 人工智能训练师人工智能
在人工智能训练中，文本数据标注是非常重要的一个环节。文本数据标注是对数据进行结构化、分类、分词、情感分析、命名实体识别（NER）等操作，为机器学习模型提供准确的输入。以下是常见的文本数据标注任务和对应的Python代码示例。1.文本分类标注文本分类标注是对文本数据进行分类的任务。通常我们会将文本数据标注为不同的类别，比如“体育”、“娱乐”、“政治”等。示例：假设我们有一组新闻文本，我们需要为其分配
计算机毕业设计吊炸天Python+Spark地铁客流数据分析与预测系统地铁大数据地铁流量预测 qq_80213251 java javaweb 大数据课程设计 python
开发技术SparkHadoopPython爬虫Vue.jsSpringBoot机器学习/深度学习人工智能创新点Spark大屏可视化爬虫预测算法功能1、登录注册界面，用户登录注册，修改信息2、管理员用户：（1）查看用户信息；（2）出行高峰期的10个时间段；（3）地铁限流的10个时间段；（4）地铁限流的前10个站点；（6）可视化大屏实时显示人流量信息。3、普通用户：（1）出行高峰期的10（5）可视化大
深入解析 Hydra 库：灵活强大的 Python 配置管理框架萧鼎 python基础到进阶教程 python 开发语言
深入解析Hydra库：灵活强大的Python配置管理框架在机器学习、深度学习和复杂软件开发项目中，管理和维护大量的配置参数是一项具有挑战性的任务。传统的argparse、json或yaml方式虽然能管理部分配置，但随着项目规模的增长，手动管理配置文件变得越来越复杂。Hydra作为一个现代化的Python配置管理框架，提供了动态配置、层级合并、运行时修改等强大功能，使得配置管理更加灵活和高效。本文将
《机器学习实战》专栏 No12：项目实战—端到端的机器学习项目Kaggle糖尿病预测带娃的IT创业者机器学习实战机器学习人工智能分类算法 python
《机器学习实战》专栏第12集：项目实战——端到端的机器学习项目Kaggle糖尿病预测本集为专栏最后一集，本专栏的特点是短平快，聚焦重点，不长篇大论纠缠于理论，而是在介绍基础理论框架基础上，快速切入实战项目和代码，所有代码都经过实践检验，是读者入门和熟悉上手的上佳知识材料在本集中，我们将通过Kaggle平台的经典糖尿病预测（PimaIndiansDiabetesDataset）数据集，系统回顾完整的
一文了解AI大模型相关知识点（含资料分享）大模型研究院人工智能机器学习自然语言处理深度学习语言模型大模型
前言，随着人工智能技术飞速发展，AI大模型在各行各业的应用日益广泛，是助力各行业提升产业智能化水平、优化业务流程等必不可少的推力，什么是AI大模型？AI大模型行业应用落地的背景？具体分为几类有哪些特点？现阶段AI大模型在落地过程中面临哪些挑战和可能的方案是什么？今天我们围绕以上几个点简单做个分享！一、AI大模型的定义和背景AI大模型指具有庞大规模和复杂计算结构的机器学习模型，这些模型通常由深度神经
SD模型微调之LoRA 好评笔记补档深度学习计算机视觉人工智能面试 AIGC SD stable diffusion
大家好，这里是Goodnote（好评笔记），关注公主号Goodnote，专栏文章私信限时Free。本文是SD模型微调方法LoRA的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习论文概念核心原理优点训练过程预训练模型加载选择微调的层LoRA优化的层Cross-Attention（跨注意力）层Self
Go 企业开发知识链 Wade_Crab golang 开发语言后端
Go企业级-全局篇Go企业级-全局篇，又名：Go企业级应用到底层开发（第4天）这个系列是准备做从go基础到Web开发，系统编程，云原生应用,网络编程,工具和脚本开发,机器学习，CGo编程，还有最后的编译器层级底层的分析，点上关注，方便每天阅读一键三连是我最大的动力。谢谢~~目录测试和调试Web开发跨平台Go企业中的常见组件生态Go企业流程1.测试和调试：概念：单元测试和集成测试：单元测试用于测试代
【Python】成功解决: OSError: [Errno 22] Invalid Argument 云天徽上 python运行报错解决记录 python 开发语言 pandas 机器学习 numpy
【Python】成功解决:OSError:[Errno22]InvalidArgument博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者
（《机器学习》完整版系列）附录 ——3、复合函数梯度的链式法则（链的次序不可交换）人工干智能周志华【西瓜书】辅导《机器学习》算法机器学习线性代数
推导了复合函数梯度的链式法统一形式。首创了的链式记号，非常易记：分子右挪+分数约分，特别是它强调了链的表达次序，由于矩阵积没有交换律，故该链的次序不可交换。注：修正了一般教材中的错误次序（在标量时正确）链式法则在此基础上，我们讨论复合函数的链式法则（只讨论复合后为标量函数的情况，即zzz为标量）。1.当自变量为标量xxx时，梯度为标量：∂z∂x\frac{\partialz}{\partialx}
利用DeepSeek提升编程效率:全面指南一小路一 DeepSeek使用服务器后端 AI编程 ai
利用DeepSeek提升编程效率:全面指南目录什么是DeepSeekDeepSeek的主要功能如何有效使用DeepSeekDeepSeekvs其他AI编程助手实际应用案例注意事项和最佳实践总结1.什么是DeepSeekDeepSeek是一个基于人工智能的编程助手,旨在帮助开发者提高编码效率和质量。它利用先进的自然语言处理和机器学习技术,为程序员提供智能代码补全、代码生成、错误检测等功能。2.Dee
从零开始玩转TensorFlow：小明的机器学习故事 1 山海青风 #机器学习机器学习 tensorflow 人工智能
1.引言故事简介小明是一个计算机专业的大三学生，近期在学校里接触到了机器学习。他在某次校园活动中发现，活动主办方总是难以准确预测学生的报名人数，导致准备的物料经常不够或浪费。于是，小明萌生了一个想法：能否通过一些历史数据，用机器学习的方式来预测每场活动的参与率？在老师的建议下，他选择了TensorFlow，一个流行且强大的深度学习框架，希望能将这个想法变成现实。2.开始TensorFlow的旅程场
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他