hearthougan

奇异值分解(SVD)小结

阵的简单理解

矩阵作用于向量

用矩阵的表达一个实体

特征值和特征向量

奇异值分解

Hermitian矩阵

共轭转置

酉矩阵

谈谈《数学之美》对SVD的理解

阵的简单理解

矩阵从我的理解来看，可以从两个角度来看。一个是矩阵是作用于向量，一个是矩阵表达一个实体。

矩阵作用于向量

对于线性空间中，对向量的变换就是通过矩阵对向量的作用来实现的，矩阵本身就表示着一种变换。假设目前所讨论的矩阵是非奇异的阶方阵。对矩阵对向量的变换，可以从两个不同的角度来看：一、从同一个坐标系来看，矩阵对向量的变换就是伸缩或者旋转。二、同一个向量，在不同坐标系下的度量。比如：

1、从第一个角度来看就是，向量经过矩阵的作用变成了向量，矩阵表示一种运行方式。

2、从第二个角度来看就是，那么矩阵就表示着一个坐标系（因为非奇异，故矩阵是有个线性无关的向量组成），就是在坐标系下的一个度量结果，只不过这里的矩阵不一定是单位矩阵，所以坐标轴上度量单位不一定是单位1。而向量是单位矩阵所表示的坐标系下的度量结果。即：

由上式可以看的出，一个向量，他在坐标系中的表示结果是向量，它在坐标系中的表示结果是向量，这表明什么？向量x和向量b，表示的是同一个向量，只不过是在不同的坐标系下，每个向量的度量结果不一样而已，即表现形式不同，但本质是一个东西。

我们知道一个向量在不同基下的坐标是不一样的，即向量在不同空间的测量结果是不一样的。如果举一个不恰当的例子，比如水，在零度以下是冰，在100度以上是水蒸气，你可以这样理解，水在0度的环境下的表现形式是冰，在100度的环境下的表现形式是水蒸气，他们只不过存在形式不同，但都是 $H_{2}O$ 。那么矩阵是不是也可以看成向量所处的环境呢？（我们目前都是假设矩阵是非奇异的），我想是可以的。无论是把矩阵看成是向量所处环境也好，还是看成空间坐标系也好，不可否认的是，矩阵包含着度量的能力，他可以表达一种空间信息，此时矩阵表示一种度量方式。

由此矩阵作用于向量或者矩阵，可以把矩阵看成是动态的形式。

用矩阵的表达一个实体

一副图像在计算时，它是以一个矩阵的形式表达的；在NLP中，文本与词的关系，也是以矩阵的形式存在的。此时矩阵表达一个具体的事物，此时矩阵就是一种静态的表示结果。

啰里啰嗦了那么多，就是为了加深理解矩阵的意义，矩阵在不同的情况下，其作用是不一样的。

特征值和特征向量

如果是n阶方阵，如果存在一个非零的常数 $\lambda$ 和一个n维的向量使得： $Av = \lambda v$ ,则称 $\lambda$ 是矩阵的特征值，就是其对应的特征向量。翻译成白话就是：如果矩阵使得一个向量伸缩，那么该向量就是矩阵的一个特征向量，伸缩的尺度就是特征值。

如果你觉得矩阵表达运动时比较好理解，那么特征向量就是，各个分运动的方向，对应的特征值，就是运动的距离。如果你觉得矩阵作为表达实体时比较好理解，那么特征向量，就是该实体的某一特征，对应的特征值就是该特征的重要程度。

尤其是矩阵表达一个实体时，矩阵的特征分解显得尤为重要，因为此时的矩阵往往是稀疏的，维度比较大的，在存储或者计算时会浪费很多资源，此时特征值和特征向量的作用就显得尤为重要了，我们可以选择几个特征值最大的向量，就可以表达该实体，这样就可以对原来的矩阵起到了很好的降维作用，而且可以消除很多噪声。可以参考这个例子。

奇异值分解

之前说的方阵都是n阶方阵，那么对于机器学习中很多时候面对的矩阵都是 $m\times n$ 的，这个时候，我们也想跟方阵一样找出对应的特征值和特征向量，那么有什么方法？答案就是奇异值分解，此时的奇异值就是对应n阶方阵的特征值，只不过此时不再称呼特征值和特征向量了，因为解法不同以及分解出来的矩阵表达的意义也不同。在说奇异值分解之前，先交代两个概念。Hermitian矩阵和酉矩阵。

Hermitian矩阵

如果阶复方阵是对称的，且对称单元互为共轭，即，矩阵的共轭转置矩阵等于它本身，称为Hermitian矩阵。例如：

$A= \begin{bmatrix} 2& 9+i\\ 9-i &7 \end{bmatrix}$

共轭转置

矩阵有实数矩阵和复数矩阵。转置矩阵仅仅是将矩阵的行与列对换，而共轭转置矩阵在将行与列对换后还要让每个元素共轭一下。共轭，就是将形如a+bi的数变成a-bi，实数的共轭是它本身。

故，实数矩阵的共轭转置矩阵就是转置矩阵，复数矩阵的共轭转置矩阵就是上面所说的行列互换后每个元素取共轭。

酉矩阵

我们说的正交矩阵是属于 $\mathbb{R}^{n*n}$ 的，是实数域上的。那么推广到复数域：

假设 $U\in C^{n\times n}$ ,为复数域，若：

$U^{T}U=UU^{T}=I$

则称就是酉矩阵。

定理：令 $A\in \mathbb{R}^{m\times n}(or\, \mathbb{C}^{m\times n})$ ，则存在正交矩阵（或者酉矩阵） $U\in \mathbb{R}^{m\times n}(or\, \mathbb{C}^{m\times n})$ 和 $V\in \mathbb{R}^{m\times n}(or\, \mathbb{C}^{m\times n})$ ，使得：

$A=U\Sigma V^{T}$

其中 $\Sigma =\begin{bmatrix} \Sigma_{1} &O \\ O& O \end{bmatrix}$ ，且 $\Sigma _{1}=diag(\sigma _{1},\sigma _{2},......,\sigma _{r})$ ，其对角线元素是按照从大到小的顺序排列的，即， $\sigma _{1}\geq \sigma _{2}\geq ......\geq \sigma _{r}\geq 0$ ，。

现在证明这个定理是怎么来的，为了方便理解，先交代几个引理。

引理一、Hermitian矩阵 $A^{T}A$ 可酉对角化，且特征值是非负的。

引理二、 $rank(A)=rank(A^{T}A)=rank(AA^{T})$ 。

引理三、的充要条件是 $A^{T}A=O$ 。

证明： $A=U\Sigma V^{T}$

设，根据引理一和引理二，可知 $A^{T}A$ 可以酉对角化，且 $rank(A^{T}A)=r$ ，那么存在一个阶的酉矩阵使得：

$V^{T}(A^{T}A)V=\begin{bmatrix} \lambda _{1} & 0 & ......& 0\\ 0 & \lambda _{2} & ...... & 0\\ \vdots & \vdots & ...... & \vdots \\ 0 & 0 & ...... & \lambda _{r} \end{bmatrix}=diag(\lambda _{1},\lambda _{2},......\lambda _{n})$

即： $A^{T}A=V\Sigma ^{2}V^{T}$ ，其中 $\lambda _{1}\geq \lambda _{2}\geq ......\lambda _{r}> 0=\lambda _{r+1}=......=\lambda _{n}$ 为 $A^{T}A$ 的非负特征根。

令 $\Sigma _{1}=diag(\sigma _{1},\sigma _{2},......,\sigma _{r})=diag(\sqrt{\lambda _{1}},\sqrt{\lambda _{2}},......\sqrt{\lambda _{r}})$ ,我们把酉矩阵拆分成两个子矩阵 $V_{1}$ 和 $V_{2}$ ，有：

$V_{1}=\begin{bmatrix} v_{1},v_{2},......,v_{r} \end{bmatrix}$

$V_{2}=\begin{bmatrix} v_{r+1},v_{r+2},......,v_{n} \end{bmatrix}$

易知， $A^{T}AV_{2}=V_{2}O\Rightarrow V_{2}^{T}A^{T}AV_{2}=O$ ，根据引理三可知 $AV_{2}=O$ 。

则有

$A^{T}AV_{1}=V_{1}\begin{bmatrix} \lambda _{1} & 0 & ......& 0\\ 0 & \lambda _{2} & ...... & 0\\ \vdots & \vdots & ...... & \vdots \\ 0 & 0 & ...... & \lambda _{r} \end{bmatrix}=V_{1}\Sigma _{1}^{2}$

由于 $\Sigma$ 是对角矩阵，故， $\Sigma ^{T}=\Sigma ,(\Sigma^{-1})^{T}=\Sigma^{-1}$ ， $V^{T}=V^{-1}$ 由此可得：

$\Rightarrow V_{1}^{T}A^{T}AV_{1}=\Sigma ^{2}$

$\Rightarrow \Sigma_{1}^{-1}V_{1}^{T}A^{T}AV_{1}=\Sigma$

$\Rightarrow \Sigma_{1}^{-1}V_{1}^{T}A^{T}AV_{1}\Sigma_{1}^{-1}=I$

令 $U_{1}=AV_{1}\Sigma_{1}^{-1}$ ，则有： $U_{1}^{T}U_{1}=I$ 。我们构造一个酉矩阵 $U_{2}$ ，使得 $U_{1}^{T}U_{2}=O$ ，也就是各向量之间是相互正交的，然拼接成和酉矩阵同等规模的酉矩阵 $U=\begin{bmatrix} U_{1} & U_{2} \end{bmatrix}$ 。

$U^{T}AV=\begin{bmatrix} U_{1}\\ U_{2} \end{bmatrix}A\begin{bmatrix} V_{1} & V_{2} \end{bmatrix}$

$=\begin{bmatrix} U_{1}^{T}AV_{1} &U_{1}^{T}AV_{2} \\ U_{2}^{T}AV_{1}& U_{2}^{T}AV_{2} \end{bmatrix}$

$=\begin{bmatrix} \Sigma _{1} &O \\ U_{2}^{T}U_{1}\Sigma _{1}& O \end{bmatrix}$

$=\begin{bmatrix} \Sigma_{1} &O \\ O & O \end{bmatrix}$

则 $A=U\Sigma V^{T}$ ，证毕。

我们对酉矩阵 $AA^{T}$ 进行奇异值分解，同理可以得出：

$AA^{T}=U\Sigma^{2} U^{T}$

我们已经知道对 $A^{T}A$ 的奇异值分解为：

$A^{T}A=V\Sigma ^{2}V^{T}$

如果矩阵 $A_{m\times n}$ 的秩是,则有：

$m\times m$ 酉矩阵的前列组成矩阵的列空间的标准正交基。

$n\times n$ 酉矩阵的前列组成矩阵的行空间（或者 $A^{T}$ 的列空间）的标准正交基。

U的后列组成矩阵 $A^{T}$ 的零空间的标准正交基。

的后列组成矩阵A的零空间的标准正交基。

我们之前说过，奇异值分解，就是为了找到最重要的特征，用这些特征来表示原来的矩阵，这样可以起到降维的作用，也可以起到消除噪声的作用。那么，当矩阵的秩 $r=rank(A)<h=min\begin{Bmatrix} m,n \end{Bmatrix}$ 时，由于奇异值 $\sigma _{r+1}=\sigma _{r+2}=.....\sigma _{h}=0$ ，因此矩阵的奇异值分解就可以写成：

$A=U_{r}\Sigma_{r} V_{r}^{T}$

这种情况就称为矩阵的截尾奇异值分解。

但是大多数的时候，有些奇异值不为0对应的特征向量我们也会舍弃，只会选取以少部分，就是大家常说的前10%甚至1%的奇异值会占总的奇异值的99%。如下图所示：

谈谈《数学之美》对SVD的理解

首先说明一下，吴军老师在数学之美讲解SVD的时候，有点是描述错误的，可能版本比较老，新版不知是否已经更正。在这里叙述时，会更正。

假如对新闻进行分类，把词和文本放到一个矩阵中，可以利用余弦定理来计算相似性；还可以利用对矩阵直接进行SVD分解一次解决。

矩阵描述了词和文章的关联性，每一行代表一个词，每一列代表一篇文章，如果有个词，篇文章，那么对应的矩阵如下：

$A= \begin{bmatrix} a_{11}& \cdots & a_{1j}& \cdots &a_{1M} \\ \vdots & \ddots & \vdots & \ddots &\vdots \\ a_{i1}& \cdots & a_{ij} & \cdots & a _{iM}\\ \vdots &\ddots & \vdots & \ddots &\vdots \\ a_{N1} &\cdots &a_{Ni} &\cdots & a_{NM} \end{bmatrix}$

其中第行第列的元素 $a_{ij}$ 表示，字典中第个单词出现在第篇文章中的加权词频（如TF-IDF），那么被分解的三个小矩阵：

第一个矩阵，表示对词进行分类的一个结果。矩阵是 $AA^{T}$ 的特征向量组成的矩阵， $A^{T}A$ 是 $N\times N$ 的，词 $\times$ 词的，表示的就是词与词之间的关系。是 $A^{T}A$ 的一个基，它可以表示词与词之间的空间分布，也就是语义相近与否，所以我们分解出来的第一个矩阵就是对词进行的分类结果。它的每一行表示一个词，每一列表示一个语义相近的词类。每个非零元素表述该词在相应语义中的相关性（重要性），数值越大越相关。
最后一个矩阵，表示是对文本的一个分类结果。矩阵是 $A^{T}A$ 的特征向量组成的空间， $A^{T}A$ 是 $M\times M$ 的，文章 $\times$ 文章，表示的是文章与文章之间的关系，它的每一列表示一篇文章，每一行表示一个主题，这一列中的每个元素表示在不同主题中的相关性。
第二个矩阵，表示词的语义类和文章的主题之间的关系。如下面这个矩阵：

$\Sigma =\begin{bmatrix} 0.7 &0.21 \\ 018&0.63 \end{bmatrix}$

在矩阵 $\Sigma$ 中，每一行表示一个语义，每一列表示一个主题。每一行的每个元素，表示该语义与主题之间的关系。0.7表示第一个语义与第一个主题相关，0.21表示第一个语义与第二个主题不相关。同理，0.18表示第二个语义与第一个主题不相关，0.63表示第二个语义与第二个主题相关。

到此SVD讲解完成，从理论到实际的物理意义，花了近两天的复习和总结，啰里啰嗦了这么多，也不知道是否阐述的明白。如有错误，欢迎指正。

参考：

《理解矩阵》孟岩

《数学之美》吴军

《矩阵分析》张贤达

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
golang学习笔记--MPG模型 xxzed golang #学习笔记学习笔记 golang
MPG模式：M（Machine）：操作系统的主线程P（Processor）：协程执行需要的资源（上下文context），可以看作一个局部的调度器，使go代码在一个线程上跑，他是实现从N：1到N：M映射的关键G（Goroutine）：协程，有自己的栈。包含指令指针（instructionpointer）和其它信息（正在等待的channel等等），用于调度。一个P下面可以有多个G1、当前程序有三个M,
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式 m0_57781768 语言模型 json 人工智能
深度解析：如何使用输出解析器将大型语言模型（LLM）的响应解析为结构化JSON格式在现代自然语言处理（NLP）的应用中，大型语言模型（LLM）已经成为了重要的工具。这些模型能够生成丰富的自然语言文本，适用于各种应用场景。然而，在某些应用中，开发者不仅仅需要生成文本，还需要将这些生成的文本转换为结构化的数据格式，例如JSON。这种结构化的数据格式在数据传输、存储以及进一步处理时具有显著优势。本文将深
使用LangChain和OpenAI实现高效文本标注 aehrutktrjk langchain python
使用LangChain和OpenAI实现高效文本标注引言在自然语言处理(NLP)领域，文本标注是一项重要且常见的任务。它涉及为文本分配标签，如情感、语言、风格等。本文将介绍如何使用LangChain和OpenAI的API来实现高效的文本标注系统。我们将探讨如何设置环境、定义标注模式，以及如何使用OpenAI的模型来执行标注任务。环境准备首先，我们需要安装必要的库并设置API密钥：%pipinsta
【开发环境搭建】Macbook M1搭建Java开发环境 weixin_44329069 java 开发语言
JDK安装与配置下载并安装JDK：ARM64DMG安装包下载链接：JDK21forMac(ARM64)。双击下载的DMG文件，按照提示安装JDK。配置环境变量：打开终端，使用vim编辑.bash_profile文件：vim~/.bash_profile在文件中添加以下内容来设置JAVA_HOME：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/j
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构汤萌妮Margaret
探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿，深度强化学习（DRL）因其在复杂任务中的卓越表现而备受瞩目。本文要介绍的是一个开源于GitHub的重量级项目：“ScalableDistributedDeep-RLwithImp
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
ResNet的半监督和半弱监督模型 Valar_Morghulis
Billion-scalesemi-supervisedlearningforimageclassificationhttps://arxiv.org/pdf/1905.00546.pdfhttps://github.com/facebookresearch/semi-supervised-ImageNet1K-models/权重在timm中也有：https://hub.fastgit.org/r
联邦学习 Federated learning Google I/O‘19 笔记努力搬砖的星期五笔记联邦学习机器学习机器学习 tensorflow
FederatedLearning:MachineLearningonDecentralizeddatahttps://www.youtube.com/watch?v=89BGjQYA0uE文章目录FederatedLearning:MachineLearningonDecentralizeddata1.DecentralizeddataEdgedevicesGboard:mobilekeyboa
PCL 怎样可视化深度图像 LeonDL168 PCL 计算机视觉人工智能视觉检测图像处理算法
本小节讲解如何可视化深度图像的两种方法，在3D视窗中以点云形式进行可视化（深度图像来源于点云），另一种是，将深度值映射为颜色，从而以彩色图像方式可视化深度图像。代码首先，在PCL（PointCloudLearning）中国协助发行的书提供光盘的第7章例2文件夹中，打开名为range_image_visualization.cpp的代码文件，同文件夹下可以找到相关的测试点云文件room_scan1.
【NLP5-RNN模型、LSTM模型和GRU模型】一蓑烟雨紫洛 nlp rnn lstm gru nlp
RNN模型、LSTM模型和GRU模型1、什么是RNN模型RNN（RecurrentNeuralNetwork)中文称为循环神经网络，它一般以序列数据为输入，通过网络内部的结构设计有效捕捉序列之间的关系特征，一般也是以序列形式进行输出RNN的循环机制使模型隐层上一时间步产生的结果，能够作为当下时间步输入的一部分（当下时间步的输入除了正常的输入外还包括上一步的隐层输出）对当下时间步的输出产生影响2、R
基于深度学习的文本引导的图像编辑 SEU-WYL 深度学习dnn 深度学习人工智能
基于深度学习的文本引导的图像编辑（Text-GuidedImageEditing）是一种通过自然语言文本指令对图像进行编辑或修改的技术。它结合了图像生成和自然语言处理（NLP）的最新进展，使用户能够通过描述性文本对图像内容进行精确的调整和操控。1.文本引导的图像编辑的挑战文本和图像之间的对齐：如何将文本中的语义信息准确地映射到图像中的特定区域或元素是一个关键挑战。这涉及到多模态数据的对齐和理解。编
甘超波：NLP婚姻中如何与老人相处甘超波
哈喽，大家好我是甘超波，是一名NLP爱好者，每天一篇原创文章或视频，分享我的实战经验和案例，希望给你些启发和帮助看一下，在家庭中子女与老人观念不一致时案例1：在教育孩子方面，老人习惯用老一套教育方式教育孙子，子女受不了老人这种习惯，从而发生口舌之争？2：在生活习惯方面，老人喜欢吃剩菜剩饭，子女受不了老人这种习惯，从而发生口舌之争？.....这样的事情，我相信你或多或少都听过和看过，甚至了深有感悟。
el-dialog高度设置夏之小星星前端 vue.js elementui css
el-dialog高度设置::v-deep.el-dialog{height:78vh;overflow:auto;}
elementuiPlus取消el-input的边框 qq_39016177 elementui
elementuiPlus取消el-input的边框1.通常取消边框的方法设置border为none2.还有其他类似边框的例如outlinebox-shadow这两个属性都是会产生边框效果3.el-input需要更改的话–如下需要修改box-shadow为空即可上代码:deep(.el-input__wrapper){align-items:center;background-color:#F7F
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
英伟达（NVIDIA）B200架构解读 weixin_41205263 芯际争霸 GPGPU架构 gpu算力人工智能硬件架构
H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。Transformer模型是一种自然语言处理（NLP）模型，广泛应用于机器翻译、文本生成等任务。TransformerEngine的电路设计原理主要包括以下几个方面：
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

奇异值分解(SVD)小结

阵的简单理解

矩阵作用于向量

用矩阵的表达一个实体

特征值和特征向量

奇异值分解

Hermitian矩阵

共轭转置

酉矩阵

谈谈《数学之美》对SVD的理解

你可能感兴趣的:(Machine,Learning,Deep,Learning,NLP)