西瓜皮装猕猴桃

张量分解浅谈（三 SVD）

本人以光速紧接着上篇CP 和NMF 分解后日夜兼程完成了这篇张量分解的续集，希望大家多多点赞，这一期我们将学习举足轻重的奇异值分解的相关知识和张量的压缩与Tucker分解，难度依然不小，后期也会为大家附上代码，希望大家能潜心钻研！

Tensor decomposition

一 . 奇异值分解原理

一 . 奇异值分解原理

奇异值分解是一个有着很明显的物理意义的一种方法，它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示，这些小矩阵描述的是矩阵的重要的特性！

特征值分解和奇异值分解两者有着很紧密的关系，特征值分解和奇异值分解的目的都是一样，就是提取出一个矩阵最重要的特征，但奇异值分解是特征分解在任意矩阵上的推广，我们我们还是要先来看看这个特征分解吧~~
$\boldsymbol{A} v=\lambda v$
这里的 $v$ 就是矩阵 $\boldsymbol{A}$ 的特征向量， $\lambda$ 也就是特征值了，这个求出来的特征向量相互之间也都是相互正交的，线代必备警告！

那特征值分解就是将原来的矩阵 $\boldsymbol{A}$ 分解成如下：
$\Sigma Q^{-1}$
同济线代上其实是有这个知识点的，不知道大家能不能调出尘封已久的记忆，这里的 $Q$ 矩阵是前面特征向量 $v$ 组成的， $\Sigma$ 是由 $\boldsymbol{A}$ 的特征值组成的对角矩阵 ！

在前面量子计算中我们就曾深入的探讨过各种矩阵，矩阵其实就是一种算子，一种线性变换的工具，如果某个矩阵乘以一个向量得到的新向量，其实就是相当于对原始向量做出了某种变换！在这里，我们依然采用这种方法，通过线性变化去理解它的意义所在：

有个对角矩阵： $M=\left[\begin{array}{ll}3 & 0 \\ 0 & 1\end{array}\right]$ ,乘以平面中的一个向量，如下：

结果为： $\left[\begin{array}{ll}3 & 0 \\ 0 & 1\end{array}\right]\left[\begin{array}{l}x \\ y\end{array}\right]=\left[\begin{array}{l}3 x \\ y\end{array}\right]$ ，相当于一个X轴方向上的拉伸，当你改变主对角线上的数字的时候，拉伸或伸缩的效果也是不同，问题又来了，如果不是对角矩阵作用又会是怎样？

当 $M=\left[\begin{array}{ll}1 & 1 \\ 0 & 1\end{array}\right]$ 时，效果如下：

显然这个有点不一样，它其实是将整个平面方格图沿着蓝色箭头的方向拉伸得到的结果，所以，不同的拉伸方向效果都是来源于不同的矩阵作用，我们只需要通过矩阵直接描述这个变换（拉伸或缩短的）的主要方向就好了！

我们要知道通过特征分解得到的 $\Sigma$ 矩阵中主对角线上特征值的排列顺序是和 $Q$ 矩阵中的特征向量的排列有着一一对应的关系！

当矩阵是高维的情况下，那么这个矩阵就是高维空间下的一个线性变换，这个线性变化可能没法通过图片来表示，但是可以想象，这个变换也同样有很多的变换方向，我们通过特征值分解得到的前N个特征向量，那么就对应了这个矩阵最主要的N个变化方向。而特征值就像是权重，哪个最大，哪个对应的特征向量方向就占比越大！

总结一下，特征值分解可以得到特征值与特征向量，特征值表示的是这个特征到底有多重要，而特征向量表示这个特征是什么，可以将每一个特征向量理解为一个线性的子空间，我们可以利用这些线性的子空间干很多的事情。不过，特征值分解也有很多的局限，比如说变换的矩阵必须是方阵(马上就会解决这个问题！)

是不是感觉世界都清晰了，当时理解了这个之后，我TM直接正道的光！我再一次认识到：线性代数是我见过最美妙牛逼的数学，没有之一，不接受反驳，不服来杠 |ू•ૅω•́)ᵎᵎᵎ

简单说了一下特征值分解，我们趁热打铁，直接上奇异值分解的车：

前面说特征值分解虽好，难免有局限性，比如只能是方阵，但是现实应用中强制是方阵明显就是在扯淡，所以，此时奇异值分解就闪亮登场！

$\Sigma V^{T}$
类比思想就很重要！假设 $\boldsymbol{A}$ 是个 $n\times m$ 的矩阵，那么得到的 $\boldsymbol{U}$ 就是一个 $n\times n$ 的方阵（其中向量相互正交，且称其为左奇异向量）， $\boldsymbol{\Sigma}$ 是一个 $n\times m$ 的矩阵（除了对角线的元素都是0，对角线上的元素称为奇异值）, $\boldsymbol{V}^{T}$ （V矩阵的转置）是一个 $n\times n$ 的矩阵，里面的各个向量也是相互正交的！

有小伙伴就问了，上面的介绍的不同向量可以理解，这个奇异值是什么东西，和前面的特征值有啥关系吗，唉，你猜对了，关系大了去了：

$\boldsymbol{A}\boldsymbol{A}^{T}$ 会得到一个方阵，在对这个方阵求特征值可以得到：
$\left(A^{T} A\right) v_{i}=\lambda_{i} v_{i}$
这里的 $v_{i}$ 就是上面刚说的右奇异向量，且：
$\begin{array}{l} \sigma_{i}=\sqrt{\lambda_{i}} \\ u_{i}=\frac{1}{\sigma_{i}} A v_{i} \end{array}$

这里的 $\boldsymbol{\sigma_{i}}$ 就是上面说的奇异值， $\boldsymbol{u_{i}}$ 就是上面说的左奇异向量! 这样我们就算是将特征值与奇异值分解联通起来了！

为了让大家更好的理解和使用，在我的纠结下，我还是和大家一块证明一下这个奇异值分解吧！

该部分是从几何层面上去理解二维的SVD：对于任意的 2 x 2 矩阵，通过SVD可以将一个相互垂直的网格图变换到另外一个相互垂直的网格图：

首先选择两个相互正交的单位向量 $\boldsymbol{v_{1}}$ 和 $\boldsymbol{v_{1}}$ ，向量 $\boldsymbol{Mv_{1}}$ 和 $\boldsymbol{Mv_{2}}$ 正交！

$\boldsymbol{u_{1}}$ 和 $\boldsymbol{u_{2}}$ 分别是 $\boldsymbol{Mv_{1}}$ 和 $\boldsymbol{Mv_{2}}$ 的单位向量（这是另一组正交基）

因为 $\begin{array}{l} M v_{1}=\sigma_{1} u_{1} \\ M v_{2}=\sigma_{2} u_{2} \end{array}$

则 $\sigma_{1},\sigma_{2}$ 分别为 $\boldsymbol{Mv_{1}}$ 和 $\boldsymbol{Mv_{2}}$ 的模（也称为矩阵 $\boldsymbol{M}$ 的奇异值）。

对于任意向量 $\boldsymbol{x}$ 有： $\boldsymbol{x}=\left(v_{1} \cdot \boldsymbol{x}\right) v_{1}+\left(v_{2} \cdot \boldsymbol{x}\right) v_{2}$

别懵，这只是一个数学技巧而已，例如：

当 $x=\left[\begin{array}{l}3 \\ 2\end{array}\right]$ 时, $\quad x=\left(\left[\begin{array}{l}1 \\ 0\end{array}\right]\left[\begin{array}{ll}3 & 2\end{array}\right]\right)\left[\begin{array}{l}1 \\ 0\end{array}\right]+\left(\left[\begin{array}{l}0 \\ 1\end{array}\right]\left[\begin{array}{ll}3 & 2\end{array}\right]\right)\left[\begin{array}{l}0 \\ 1\end{array}\right]$

整个推导，就这个转化技巧最关键！之后我们运用这个得到：

$\begin{array}{l} M x=\left(v_{1} \cdot x\right) M v_{1}+\left(v_{2} \cdot x\right) M v_{2} \\ M x=\left(v_{1} \cdot x\right) \sigma_{1} u_{1}+\left(v_{2} \cdot x\right) \sigma_{2} u_{2} \end{array}$
因为向量的内积可用向量的转置来表示，所以结合上面的推导：
$x=v_{1}^{T} x \sigma_{1} u_{1}+v_{1}^{T} x \sigma_{2} u_{2}$
同时去掉 $x$ :
$x=v_{1}^{T} \sigma_{1} u_{1}+v_{1}^{T} \sigma_{2} u_{2}$ 即：
$\Sigma V^{T}$
证明就算是完成了！

既然大差不差的搞懂了，我们做个题目来实现SVD 的计算：

矩阵 $\boldsymbol{A}$ 为： $\mathbf{A}=\left(\begin{array}{ll}0 & 1 \\ 1 & 1 \\ 1 & 0\end{array}\right)$
首先求出 $\boldsymbol{A^{T}A}$ 和 $\boldsymbol{AA^{T}}$
$\begin{array}{l} \mathbf{A}^{\mathbf{T}} \mathbf{A}=\left(\begin{array}{lll} 0 & 1 & 1 \\ 1 & 1 & 0 \end{array}\right)\left(\begin{array}{ll} 0 & 1 \\ 1 & 1 \\ 1 & 0 \end{array}\right)=\left(\begin{array}{ll} 2 & 1 \\ 1 & 2 \end{array}\right) \\ \mathbf{A} \mathbf{A}^{\mathbf{T}}=\left(\begin{array}{ll} 0 & 1 \\ 1 & 1 \\ 1 & 0 \end{array}\right)\left(\begin{array}{lll} 0 & 1 & 1 \\ 1 & 1 & 0 \end{array}\right)=\left(\begin{array}{lll} 1 & 1 & 0 \\ 1 & 2 & 1 \\ 0 & 1 & 1 \end{array}\right) \end{array}$
进而分别求出 $\boldsymbol{A^{T}A}$ 和 $\boldsymbol{AA^{T}}$ 的特征值和特征向量：

$\boldsymbol{A^{T}A}$ ： $\lambda_{1}=3 ; v_{1}=\left(\begin{array}{c}1 / \sqrt{2} \\ 1 / \sqrt{2}\end{array}\right) ; \lambda_{2}=1 ; v_{2}=\left(\begin{array}{c}-1 / \sqrt{2} \\ 1 / \sqrt{2}\end{array}\right)$
$\boldsymbol{AA^{T}}$ ： $\lambda_{1}=3 ; u_{1}=\left(\begin{array}{c}1 / \sqrt{6} \\ 2 / \sqrt{6} \\ 1 / \sqrt{6}\end{array}\right) ; \lambda_{2}=1 ; u_{2}=\left(\begin{array}{c}1 / \sqrt{2} \\ 0 \\ -1 / \sqrt{2}\end{array}\right) ; \lambda_{3}=0 ; u_{3}=\left(\begin{array}{c}1 / \sqrt{3} \\ -1 / \sqrt{3} \\ 1 / \sqrt{3}\end{array}\right)$

利用 $v_{i}=\sigma_{i} u_{i}, i=1,2$ 求奇异值：
$\begin{array}{l} \left(\begin{array}{ll} 0 & 1 \\ 1 & 1 \\ 1 & 0 \end{array}\right)\left(\begin{array}{l} 1 / \sqrt{2} \\ 1 / \sqrt{2} \end{array}\right)=\sigma_{1}\left(\begin{array}{c} 1 / \sqrt{6} \\ 2 / \sqrt{6} \\ 1 / \sqrt{6} \end{array}\right) \Rightarrow \sigma_{1}=\sqrt{3} \\ \left(\begin{array}{cc} 0 & 1 \\ 1 & 1 \\ 1 & 0 \end{array}\right)\left(\begin{array}{c} -1 / \sqrt{2} \\ 1 / \sqrt{2} \end{array}\right)=\sigma_{2}\left(\begin{array}{c} 1 / \sqrt{2} \\ 0 \\ -1 / \sqrt{2} \end{array}\right) \Rightarrow \sigma_{2}=1 \end{array}$

也可以用 $\sigma_{i}=\sqrt{\lambda_{i}}$ 直接求！

最终得到A的奇异值分解为：
$\Sigma V^{T}=\left(\begin{array}{ccc} 1 / \sqrt{6} & 1 / \sqrt{2} & 1 / \sqrt{3} \\ 2 / \sqrt{6} & 0 & -1 / \sqrt{3} \\ 1 / \sqrt{6} & -1 / \sqrt{2} & 1 / \sqrt{3} \end{array}\right)\left(\begin{array}{cc} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array}\right)\left(\begin{array}{cc} 1 / \sqrt{2} & 1 / \sqrt{2} \\ -1 / \sqrt{2} & 1 / \sqrt{2} \end{array}\right)$

奇异值 $\boldsymbol{\sigma}$ 跟特征值类似，在 $\boldsymbol{\Sigma}$ 矩阵中也是从大到小排列，而且 $\boldsymbol{\sigma}$ 的减少的特别快，在很多情况下，前10%甚至1%的奇异值的和就占了全部的奇异值之和的99%以上了！

也就是说，我们也可以用最大的k个的奇异值和对应的左右奇异向量来近似描述矩阵，即：

$A_{m \times n}=U_{m \times m} \Sigma_{m \times n} V_{n \times n}^{T} \approx U_{m \times k} \Sigma_{k \times k} V_{k \times n}^{T}$
其中k要比n小很多，也就是一个大的矩阵A可以用三个小的矩阵表示即可：

由于这个重要的性质，SVD可以用于PCA降维，来做数据压缩和去噪。也可以用于推荐算法，将用户和喜好对应的矩阵做特征分解，进而得到隐含的用户需求来做推荐。

我们上面说推导和证明的奇异值分解方法都是完全奇异值分解，但是实际在图像处理算法中使用的的是奇异值分解的紧凑形式和截断形式。紧奇异值分解是与原始矩阵等秩的奇异值分解，截断奇异值分解是比原始矩阵低秩的奇异值分解，我们简单了解一下就可以了：

紧奇异值分解定义： 对于 $m\times n$ 的实矩阵 $\boldsymbol{A}$ ，秩为： $rank(\boldsymbol{A})= r \leqslant min(m,n)$ ，那么矩阵 $\boldsymbol{A}$ 的 紧奇异值分解 为：
$\boldsymbol{A}= \boldsymbol{U_{r}} \boldsymbol{\Sigma_{r}}\boldsymbol{V_{r}^{T}}$
其实就是就是在列的方向上只取前 $r$ 列即可;
截断奇异值分解定义： 对于 $m\times n$ 的实矩阵 $\boldsymbol{A}$ ，秩 $rank(\boldsymbol{A}) =r$ ,d但是 $0 < k < r 0,则截断奇异值分解为： A ≈ U k Σ k V k T \boldsymbol{A}\approx \boldsymbol{U_{k}} \boldsymbol{\Sigma_{k}}\boldsymbol{V_{k}^{T}} 比较二者的公式应该就能明白了，只不过一个是等于号，一个是约等于！$

注意：紧奇异值分解还原后等于原矩阵，截断奇异值分解近似还原原矩阵。因此在对矩阵数据进行压缩时，紧奇异值分解对应无损压缩，截断奇异值分解对应有损压缩。

这里为大家附上代码链接：特征值，奇异值分解及其应用

前面的所有所有，都在解释矩阵的奇异值是怎么得到的，包括证明等等，但是奇异值到底是个什么东西，它与矩阵之间有什么千丝万缕的联系么？我们似乎还是有点蒙！

无论是特征值分解还是奇异值分解，都是为了让人们对矩阵（或者线性变换）的作用有一个直观的认识。这是因为我们拿过来一个矩阵，很多情况下只能看到一堆排列有序的数字，而看不到这些数字背后的真实含义，特征值分解和奇异值分解告诉了我们这些数字背后的真实含义，换句话说，它告诉了我们关于矩阵作用的本质信息！

对于奇异值来说，其实他反映的是一个矩阵的“奇异程度”。

这就又让我想到了大一线代课上老师说过：非满秩的方阵就是奇异矩阵，换句话说就是该方阵的行列式为0，但是有没有量化的标准衡量哪个矩阵更不满秩，或者更奇异呢？比如同样两个满秩矩阵，能否看出哪个更“满”，或者两个非满秩且同为秩r的矩阵，哪个更“奇异”呢？

奇异的程度在我看来秩越低越奇异（目前可以这么理解），相同秩情况下，上图都是秩为2，但我们可以看出A矩阵更接近秩为一！

看看这两个矩阵的奇异值：

猜的没错，第一个矩阵更奇异！

这意味着：一个矩阵越“奇异”，其越少的奇异值蕴含了越多的矩阵信息，矩阵的信息熵越小（这也符合我们的认知，矩阵越“奇异”，其行（或列）向量彼此越线性相关，越能彼此互相解释，矩阵所携带的信息自然也越少）。这些奇异值就是刚才我们所谈论的“本质信息”，而从矩阵中也能得到矩阵的“奇异程度”。

说了那么多，我们最后再来看看奇异值的几个性质：

奇异值对矩阵扰动的不敏感性：

在数学上可以证明，奇异值的变化不会超过相应矩阵的变化，即对任何的相同阶数的实矩阵A、B的按从大到小排列的奇异值 $\boldsymbol{\alpha_{i}}$ 和 $\boldsymbol{w}$
$\sum\left|\boldsymbol{\alpha_{i}}-\boldsymbol{w}_{i}\right| \leq\|A-B\|_{2}$
这个性质通常应用于人脸识别中，使用合适的分类器就可以把同一个人的不同姿态，表情的图像矩阵归为一个，具有高容错性！
奇异值的比例不变性：

$\alpha\boldsymbol{A}$ 的奇异值是 $\boldsymbol{A}$ 奇异值的 $\left | \alpha \right |$ 倍！

矩阵进行数乘变换，奇异值也成比例变化。同一个人脸在光线明暗不同情况的图像识别中，它们的矩阵奇异值是成比例变化的。奇异值向量归一化后可以视为一类！
奇异值的旋转不变性：

即若 $\boldsymbol{P}$ 是正交阵， $\boldsymbol{PA}$ 的奇异值与 $\boldsymbol{A}$ 的奇异值相同!

奇异值的比例和旋转不变性特征在数字图象的旋转、镜像、平移、放大、缩小等几何变化方面有很好的应用.

好这一期博客学习就到这里，下期再见！

前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
比亚迪创新脉冲自加热技术深度解析百态老人算法数据库
一、技术原理与核心创新比亚迪脉冲自加热技术通过电池包内部能量闭环利用实现低温环境下的高效自加热，其核心原理可分解为以下三级机制：内阻产热机制将电池包物理分割为两组（A/B），通过高频充放电（频率达数百Hz）使电流流经高内阻电芯产生焦耳热。在-30℃环境下，电池内阻可升高至常温的3-4倍，此时焦耳热功率密度可达：P=I2⋅Rint（其中I为脉冲电流，Rint为低温内阻）P=I^2\cdotR_{in
傅里叶级数分解问题
题目问题1.在区间[−l,l][-l,l][−l,l]上分解为完整傅里叶级数：(a)ezxe^{zx}ezx，其中z∈Cz\in\mathbb{C}z∈C；找出zzz的“例外”值；(b)cos⁡(ωx)\cos(\omegax)cos(ωx)，sin⁡(ωx)\sin(\omegax)sin(ωx)，其中00(\etal)^2+(n\pi)^2>0(ηl)2+(nπ)2>0对所有n≥1n\geq1
稀土-高分子复合材料：新一代功能材料的突破 DeepCeLa 稀土稀土科技磷酸镧
稀土元素（镧系及钪、钇）凭借其特殊的4f电子构型，在高分子材料改性中展现出独特价值。通过配位键合、物理掺杂或纳米复合等技术，稀土与聚合物基体结合可显著提升材料综合性能，并赋予多种特殊功能。一、核心优势稳定性升级：稀土离子（如Ce³⁺/Ce⁴⁺）通过捕获自由基和紫外光子，使材料热分解温度提升30-50℃，紫外耐受性提高5-8倍，适用于极端环境下的工程塑料。力学强化：稀土配合物可诱导聚合物结晶度提升，
深度学习预备知识 AmazingMQ 深度学习人工智能
1.Tensor张量定义：张量（tensor）表示一个由数值组成的数组，这个数组可能有多个维度（轴）。具有一个轴的张量对应数学上的向量，具有两个轴的张量对应数学上的矩阵，具有两个以上轴的张量目前没有特定的数学名称。importtorch#arange创建一个行向量x，这个行向量包含以0开始的前12个整数。x=torch.arange(12)print("x=",x)#x=tensor([0,1,2
前沿交叉：Fluent与深度学习驱动的流体力学计算体系 m0_75133639 流体力学深度学习人工智能航空航天 fluent 流体力学材料科学 CFD
基础模块流体力学方程求解1、不可压缩N-S方程数值解法（有限差分/有限元/伪谱法）·Fluent工业级应用：稳态/瞬态流、两相流仿真（圆柱绕流、入水问题）·Tecplot流场可视化与数据导出2、CFD数据的AI预处理·基于PCA/SVD的流场数据降维·特征值分解与时空特征提取深度学习核心3.物理机理嵌入的神经网络架构·物理信息神经网络（PINN）：将N-S方程嵌入损失函数（JAX框架实现）·神经常
浅谈函数传参 2501_90124553 c语言
//函数传参：指针传递代码如下：voidfun(int*ptr){/*改变了ptr的值，所以无法通过这种方式改变num*///intx=100;//ptr=&x;/*改变了ptr所指向内存的值，可以通过这种方式改变num*/*ptr=100;}intmain(){intnum=123;fun(&num);printf("num=%d\n",num);return0;}#endif
将oracle表字段json字符串分解提取并返回单列表 skillfulit oracle json 数据库
将oracle表字段json字符串分解提取并返回单列表oracle版本11gR2(11.2.0.4.0)原始表字段内容{"FRAME_INFO":["0,0,-1,1800,1800,5992,191,20","1,0,-1,2000,1800,5992,188,20","2,0,-1,1800,1800,5992,182,20","3,0,-1,1800,1800,5992,177,20","4
sorted排序浅谈
默认情况下，对字符串排序，是按照ASCII的大小比较的，由于’Z’<‘a’，结果，大写字母Z会排在小写字母a的前面。现在，我们提出排序应该忽略大小写，按照字母序排序。要实现这个算法，不必对现有代码大加改动，只要我们能用一个key函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串，实际上就是先把字符串都变成大写（或者都变成小写），再比较。这样，我们给sorted传入key函数，即可实现
请用人话给我讲讲向量和张量的联系和区别零点零一 AI资料 python 人工智能机器学习
请用人话给我讲讲向量和张量的联系和区别豆包咱们先从最熟悉的概念入手，一步步说清楚向量和张量的关系与区别，保证接地气。先搞懂“维度”：生活里的例子咱们先统一一个词：维度。你可以简单理解成“描述一个东西需要几个方向/参数”。比如一根直线，只有前后（或左右）一个方向，就是1维。一张纸，有左右和上下两个方向，就是2维。咱们生活的空间，有左右、上下、前后三个方向，就是3维。再复杂点，比如描述“今天的天气”，
从数据集视角看——大语言模型（LLMs）的训练、微调和推理爱看烟花的码农 AIGC NLP 语言模型人工智能自然语言处理
1.大语言模型训练的整体框架大语言模型的训练是一个复杂的过程，涉及数据准备、模型架构、优化策略和推理部署。以下是整体框架的详细分解：1.1训练阶段预训练：在海量文本数据上学习通用语言表示，类似于“学习语言的百科全书”。微调：针对特定任务调整模型参数，类似于“针对考试复习重点内容”。指令微调：在对话或指令数据集上优化，使模型更适合交互式任务。推理：使用训练好的模型进行预测或生成。1.2核心组件数据集
torch 填充补齐 AI算法网奇 python宝典 python
目录行填充补齐1.填充长度（Padding）2.掩码（Masking）3.排序优化（可选）行填充补齐importtorchfromtorch.nn.utils.rnnimportpad_sequence#原始序列（每个序列是二维张量，行数不同）batch_data=[torch.tensor([[1,2,3]])#1行#torch.tensor([[4,5,6],[7,8,9]]),#2行#tor
TensorBase开发者快速入门指南宗隆裙
TensorBase开发者快速入门指南tensorbasetensorbase/tensorbase:是一个现代的GPU加速的张量数据库。适合用于大规模数据分析和机器学习。项目地址:https://gitcode.com/gh_mirrors/te/tensorbase前言TensorBase是一个基于Rust构建的高性能时序数据库，专为大规模数据分析场景设计。本文将详细介绍如何搭建TensorB
pytorch 自动微分 this_show_time pytorch 人工智能 python 机器学习
自动微分1.基础概念1.1.**张量**1.2.**计算图**：1.3.**反向传播**1.4.**梯度**2.计算梯度2.1标量梯度计算2.2向量梯度计算2.3多标量梯度计算2.4多向量梯度计算3.梯度上下文控制3.1控制梯度计算（withtorch.no_grad()）3.2累计梯度3.3梯度清零(torch.zero_())自动微分模块torch.autograd负责自动计算张量操作的梯度，
产品经理岗位职责拆解火火PM打怪中产品经理
以下是产品经理岗位职责的详细分解表，涵盖工作内容、核心动作及输出成果：岗位职责具体工作内容输出成果1.日常版本迭代管理需求分析及PRD产出协调资源推动产品上线-收集业务/用户需求，分析可行性及优先级-撰写PRD文档，明确功能逻辑及交互流程-协调研发、测试、设计资源，制定迭代排期-监控开发进度，解决阻塞问题，组织验收-需求分析报告-PRD文档（含原型图/流程图）-版本排期表-上线验收报告2.跨部门协
AI驱动的个人工作革命：基于DeepSeek构建全场景智能工作助理（含源代码+多应用场景） AI_DL_CODE DeepSeek深度应用人工智能 DeepSeek 个人智能助理 LangChain 任务自动化知识管理大模型应用
摘要：本文详细阐述基于DeepSeek大模型构建个人工作助理的完整技术方案，通过LangChain实现任务分解、知识检索与工具调用的智能协同。方案融合向量数据库、多模态交互与个性化学习算法，构建涵盖邮件处理、会议管理、文档生成等15大核心工作场景的自动化系统。文中提供可运行代码、完整部署指南及效能测试数据，实现邮件处理效率提升13倍、会议纪要生成时间缩短100%、任务安排错误率降低83%的显著优化
MCP与Sequential Thinking：系统问题的分解与解决之道 Echo_Wish Python 进阶 python 人工智能算法
MCP与SequentialThinking：系统问题的分解与解决之道引言：复杂问题背后的逻辑思维在面对复杂问题时，我们常常感到手足无措，尤其是在需要将任务分解为多个步骤时。这是对个人思维能力的极大挑战，而掌握有效的思维工具则可以让事情事半功倍。今天我们讨论的两个工具：MCP（MutuallyExclusiveCollectivelyExhaustive）和SequentialThinking（顺
揭秘图像LLM：从像素到语言的智能转换 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 计算机视觉深度学习人工智能机器学习算法语言模型
图像LLM是怎么工作图像LLM（多模态大语言模型）的核心是将图像转化为语言模型能理解的“语言”，并与文本深度融合。以下结合CLIP、DALL-E、GPT-4V等主流模型，通过具体例子说明其工作机制：一、图像→特征向量：从像素到“密码”例子：识别“戴墨镜的猫”视觉编码器提取特征使用ResNet或ViT（VisionTransformer）作为图像编码器，将图片分解为局部像素块（如16x16像素）。每
文献略读：Frontier-Based 相关 Roche1imit 无人机规划探索相关论文笔记人工智能自动驾驶
文献略读：FrontierBased相关AFrontier-BasedApproachforAutonomousExploration该论文第一次提出了frontier-based方法frontier：已知空间和未探索空间的分解区域核心思想：Togainthemostnewinformationabouttheworld,movetotheboundarybetweenopenspaceandun
浅谈指针，内存与指针做函数参数 2501_90124553 C语言
一、概念1、指针==地址指针的目的是为了进行寻址操作，找到对应的内存2、内存（1）虚拟内存：实际是硬盘的一块区域（2)物理内存：计算机中安装的硬件内存（比如：内存条）RAM：随机存储器，用于临时存储数据，读写速度快(3)虚拟内存内存总大小：4G内存单元：每个内存单元大小节(byte)内存单元总数：4*1024*1024*1024内存块：地址空间连续的多个内存单元地址：每个内存单元都有一个对应的地址
深度学习基础2 TY-2025 深度学习深度学习人工智能
5.张量索引操作（1）索引操作行列索引列表索引print(data[[0,2],[1,2]])#返回(0,1)，(2,2)两个位置的元素print(data[[[0],[1]],[1,2]])#返回0，1行的1，2列共4个元素范围索引print(data[:3,:2])#前3行前2列数据print(data[2:,:2])#第2行到最后的前2列数据布尔索引tensor([[0,7,6,5,9],[
算法设计与分析：分治、动态规划与贪心算法的异同与选择 vortex5 算法动态规划贪心算法
在计算机科学中，算法是解决问题的核心。面对复杂问题，算法设计师常常需要将其分解为更小、更易管理的子问题。分治法、动态规划和贪心算法都是基于“原问题”和“子问题”概念的强大策略，但它们在处理子问题的方式、相互关系以及最终解决方案的保证上存在本质区别。理解这些差异对于选择最适合特定问题的算法至关重要。✅一、共同点：都涉及“原问题→子问题”这三种算法范式都遵循将复杂问题分解为更简单部分的思想，这是许多高
MapReduce学习笔记
1.MapReduce做什么Mapper负责“分”，即把复杂的任务分解为若干个“简单的任务”来处理。Reducer负责对map阶段的结果进行汇总。2.MapReduce工作机制实体一：客户端，用来提交MapReduce作业。实体二：JobTracker，用来协调作业的运行。实体三：TaskTracker，用来处理作业划分后的任务。实体四：HDFS，用来在其它实体间共享作业文件。3.编写MapRed
深度学习-Tensor
Tensor张量：与numpy中的ndarray不同之处：tensor可以在GPU或其他专用硬件上运行，以加速计算。一、Tensor初始化1.直接从数据中创建data=[[1,2],[3,4]]x_data=torch.tensor(data)2.从numpy数组创建np_array=np.array(data)x_np=torch.from_numpy(np_array)3.从另一个Tensor
Python 用 NumPy 进行矩阵分解
Python用NumPy进行矩阵分解关键词：NumPy,矩阵分解,线性代数,奇异值分解,QR分解,LU分解,特征值分解摘要：本文将深入探讨使用NumPy进行矩阵分解的各种技术。我们将从基础的线性代数概念出发，详细讲解五种核心矩阵分解方法：LU分解、QR分解、奇异值分解(SVD)、特征值分解和Cholesky分解。每种方法都将配有数学原理说明、NumPy实现代码和实际应用案例。文章还将介绍矩阵分解在
LSA主题模型：基于奇异值分解的主题模型 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LSA主题模型：基于奇异值分解的主题模型1.背景介绍主题模型是一种无监督的机器学习技术，用于发现大规模文本语料库中隐藏的语义结构。它能够自动识别文档集合中的主题，并根据这些主题对文档进行聚类和分类。主题模型在文本挖掘、信息检索、推荐系统等领域有着广泛的应用。LSA（LatentSemanticAnalysis）是一种经典的主题模型算法，基于奇异值分解（SVD）对词-文档矩阵进行分解，从而揭示词语和
Hadoop-Mapreduce入门
Hadoop-Mapreduce入门MapReduce介绍mapreduce设计MapReduce编程规范入门案例WordCountMapReduce介绍MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。知识。Map负责“分”，把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算，彼此间几乎没有依赖关系。Redu
JVM系列五：字节码与执行引擎深度解析
JVM系列五：字节码与执行引擎深度解析文章目录JVM系列五：字节码与执行引擎深度解析引言⚡五、字节码与执行引擎字节码文件结构字节码文件组成部分解析️Class文件结构详解实例分析字节码指令集介绍指令分类常用指令详解字节码示例分析⚙️执行引擎工作原理解释执行与即时编译（JIT）解释执行⚡即时编译（JIT）热点代码探测探测方法计数器详解示例代码️分层编译技术编译层级️分层编译配置性能对比️实战案例案例
破解FPS主线程阻塞的终极方案你一身傲骨怎能输 FPS射击游戏高级技术专栏性能优化
文章摘要FPS游戏中主线程等待其他线程（如物理、AI等）会引发性能瓶颈，导致帧率下降和卡顿。常见原因包括同步点过多、任务分配不均、锁滥用和数据依赖过强。优化方法包括：1）减少硬等待，采用异步处理；2）任务分解和负载均衡；3）使用无锁同步；4）流水线分阶段处理；5）设置超时降级策略。引擎层面可利用Unity的JobSystem或Unreal的TaskGraph系统进行优化。关键是通过Profiler
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

张量分解浅谈（三 SVD）

Tensor decomposition

一 . 奇异值分解原理

你可能感兴趣的:(张量分解浅谈)