静静的喝酒

机器学习笔记之高斯过程(二)高斯过程回归——权重空间角度

机器学习笔记之高斯过程——高斯过程回归[权重空间角度]

引言
- 回顾
- - 高斯过程
  - 贝叶斯线性回归
- 引子：贝叶斯方法求解非线性回归任务
- - 均值表示的推导过程
  - 方差表示的推导过程
  - 协方差函数(核函数)
- 高斯过程回归与线性贝叶斯回归的关系

引言

上一节简单介绍了高斯过程，本节将从权重空间角度(Weight-Space)介绍高斯过程回归

回顾

高斯过程

高斯过程(Gaussian Process)本质上是一组随机变量的集合，该集合中任意有限个随机变量均服从高斯分布。
定义基于时间/空间的连续域 为 $\mathcal T$ ，对应高斯过程表示为： $\{\xi_{t}\}_{t \in \mathcal T}$ 。

该随机过程中任意时刻 $\in \mathcal T$ 对应的随机变量 $\xi_t \in \{\xi_t\}_{t \in \mathcal T}$ 均服从高斯分布 $\mathcal N(\mu_t,\Sigma_t)$ 。
并且，从高斯过程 $\{\xi_t\}_{t \in \mathcal T}$ 中任意选出 $n$ 个时刻对应的随机变量： $\{\xi_{t_1},\xi_{t_2},\cdots,\xi_{t_n}\} \in \{\xi_t\}_{t \in \mathcal T}$ 同样服从高斯分布 $\mathcal N(\mu_{t_1 \to t_n},\Sigma_{t_1 \to t_n})$ 。

贝叶斯线性回归

贝叶斯线性回归(Bayesian Linear Regression)本质上是利用贝叶斯方法处理线性回归任务。不同于频率派的点估计(Point Estimation)，贝叶斯派将模型参数 $\mathcal W$ 视作随机变量，它针对线性回归问题主要分为两个步骤：

关于随机变量 $\mathcal W$ 的推断任务(Inference)：基于数据集合 $D a t a$ ，求解 $\mathcal W$ 的后验概率。
后验概率的高斯分布是基于’高斯分布的自共轭性质’。
$\mathcal N(\mathcal W \mid \mu_{\mathcal W},\Sigma_{\mathcal W})$ 这种表示描述的是‘关于 $\mathcal W$ 作为后验的条件高斯分布’。
$\mathcal P(\mathcal W \mid Data) \sim \mathcal N(\mathcal W \mid \mu_{\mathcal W},\Sigma_{\mathcal W})$
根据贝叶斯定理，将 $\mathcal P(\mathcal W \mid Data)$ 表示为如下形式。其中似然 $\mathcal P(\mathcal Y \mid \mathcal W,\mathcal X)$ 根据线性回归模型可表示为 包含0均值高斯噪声的线性关系；关于先验分布 $\mathcal P(\mathcal W)$ ，将其假设为一个0均值的高斯分布；
$\begin{aligned} \mathcal P(\mathcal W \mid Data) & = \frac{\mathcal P(\mathcal Y \mid \mathcal W,\mathcal X) \cdot \mathcal P(\mathcal W)}{\mathcal P(\mathcal Y \mid \mathcal X)} \\ & \propto \mathcal P(\mathcal Y \mid \mathcal W,\mathcal X) \cdot \mathcal P(\mathcal W) \\ & = \mathcal N(\mathcal W^T\mathcal X,\sigma^2) \cdot \mathcal N(0,\Sigma_{prior}) \end{aligned}$
对上式进行求解，可以得到后验概率 $\mathcal P(\mathcal W \mid Data)$ 的高斯分布形式：
贝叶斯线性回归推断任务推导过程传送门
$\mathcal N(\mu_{\mathcal W},\Sigma_{\mathcal W}) \to \begin{cases} \mu_{\mathcal W} = \frac{\mathcal A^{-1} \mathcal X^T\mathcal Y}{\sigma^2} \\ \Sigma_{\mathcal W} = \mathcal A^{-1} \\ \mathcal A = \frac{\mathcal X^T\mathcal X}{\sigma^2} + \Sigma_{prior}^{-1} \end{cases}$
基于推断得到的关于 $\mathcal W$ 的后验概率，对给定样本 $\hat x$ 的标签 $\hat y$ 进行预测(Prediction)。
首先是无高斯噪声估计(Noise-Free)：
- 这里需要使用‘基于随机变量之间存在线性关系，高斯分布的表达’传送门
- 公式中的 $\mathcal W$ 表示已经通过 $D a t a$ 学习的后验概率。
$\begin{cases} f(\hat x) = \mathcal W^T \hat x = \hat x^T \mathcal W \\ \mathcal P[f(\hat x) \mid Data,\hat x] \sim \mathcal N(\hat x^T \mu_{\mathcal W},\hat x^T \cdot \Sigma_{\mathcal W} \cdot \hat x) \end{cases}$ 其次是高斯噪声估计(Noise)：
$\begin{cases} \hat y = f(\hat x) + \epsilon \\ \mathcal P(\hat y \mid Data,\hat x) \sim \mathcal N(\hat x^T \mu_{\mathcal W},\hat x^T \cdot \Sigma_{\mathcal W} \cdot \hat x + \sigma^2) \end{cases}$

引子：贝叶斯方法求解非线性回归任务

假设此时的回归任务不是线性回归，而是非线性回归(Non-Linear)，如何处理该问题：
在核方法与核函数介绍一节中针对样本无法线性可分 的问题，介绍了一种非线性转换(Non-Linear Transformation)函数： $\phi(\cdot)$ 。
该函数的作用是将当前样本 $x^{(i)} \in \mathcal X$ 的特征转化为高维特征：
$x^{(i)} \to \phi(x^{(i)}) = z^{(i)} \quad x^{(i)} \in \mathbb R^p;z^{(i)} \in \mathbb R^q;q>p$
根据Cover定理思想，就是找到一个合适的 $\phi$ ，其目的是为了让 非线性 $\to$ 高维线性。
由于 $\phi$ 函数从低维向高维映射的过程中，可能存在映射结果 $z^{(i)}$ 维度远远高于 $x^{(i)}$ ，首先，计算这个高维映射 $\phi(x^{(i)})$ 的计算代价就很高；其次，求解内积 $[\phi(x^{(i)})]^T\phi(x^{(j)})$ 过程中计算代价更高。，实际上，找非线性转换函数的本质是找合适的核函数(Kernal Function)：
$\kappa(x^{(i)},x^{(j)}) = \left\langle\phi(x^{(i)}),\phi(x^{(j)})\right\rangle = [\phi(x^{(i)})]^T \cdot \phi(x^{(j)})$

需要知道：内积是从哪里出现的？
观察无高斯噪声估计(Noise-Free)：
$\begin{aligned} \mathcal P[f(\hat x) \mid Data,\hat x] & \sim \mathcal N(\hat x^T \mu_{\mathcal W},\hat x^T \cdot \Sigma_{\mathcal W} \cdot \hat x) \\ & = \mathcal N \left[\hat x^T \left(\frac{\mathcal A^{-1}\mathcal X^T\mathcal Y}{\sigma^2}\right) ,\hat x^T \cdot \mathcal A^{-1} \cdot \hat x\right] \quad \mathcal A^{-1} = \frac{\mathcal X^T\mathcal X}{\sigma^2} + \Sigma_{prior}^{-1} \end{aligned}$
随机变量集合 $\mathcal X =\{x_1,\cdots,x_p\}$ 是一个非线性回归任务，根据上面描述，需要对样本 $x^{(i)}$ 进行非线性转换。假设关于 $\mathcal X_{N \times p}$ 的非线性转换结果为：
$\phi(\mathcal X) = \left[\phi(x^{(1)}),\phi(x^{(2)}),\cdots,\phi(x^{(\mathcal N)})\right]^T_{N \times q}$
对应的无噪声模型表示为：
$\left[\phi(x)\right]_{1 \times q}^T \mathcal W_{q \times 1} \quad x \in \mathcal X$
从而关于 $\hat x$ 的预测任务表示为：
实际上就是将所有 $\hat x,\mathcal X$ 替换为 $\phi(\hat x),\phi(\mathcal X)$ .
$\mathcal P[f(\hat x) \mid Data,\hat x] \sim \mathcal N \left[[\phi(\hat x)]^T \left(\frac{\mathcal A^{-1}[\phi(\mathcal X)]^T\mathcal Y}{\sigma^2}\right) ,[\phi(\hat x)]^T \cdot \mathcal A^{-1} \cdot \phi(\hat x)\right] \quad \mathcal A = \frac{[\phi(\mathcal X)]^T\phi(\mathcal X)}{\sigma^2} + \Sigma_{prior}^{-1}$

至此，发现了：内积部分 $[\phi(\mathcal X)]^T\phi(\mathcal X)$ 出现在矩阵 $\mathcal A$ 中。如何求解 $\mathcal A^{-1}$ ?
最终的目的是将均值、方差 $\mu_{\mathcal W},\Sigma_{\mathcal W}$ 写成关于‘核函数’ $\kappa(\cdot,\cdot)$ 的方式,而 $\mu_{\mathcal W},\Sigma_{\mathcal W}$ 中均是以 $\mathcal A^{-1}$ 出现的。
这里引入一个关于求解矩阵逆 的定理： $\text{Woodbury Formula}$ 。
仅需要了解如何使用即可。
$(\mathcal A + \mathcal U \mathcal C \mathcal V)^{-1} = \mathcal A^{-1} - \mathcal A^{-1} \mathcal U (\mathcal C^{-1} + \mathcal V \mathcal A^{-1}\mathcal U)^{-1} \mathcal V\mathcal A^{-1}$

观察 $\mathcal A = \left[\frac{[\phi(\mathcal X)]^T\phi(\mathcal X)}{\sigma^2}\right]_{q \times q} + \left[\Sigma_{prior}^{-1}\right]_{q \times q}$ ：
$\mathcal A$ 自身是 $\times q$ 的矩阵。下面的步骤是为了直接凑均值项 $\frac{\mathcal A^{-1}\mathcal X \mathcal Y}{\sigma^2}$ .

均值表示的推导过程

首先，等式左侧 $\mathcal A$ 右乘一个 $\Sigma_{prior}$ ：
其中， $\mathcal I$ 表示单位矩阵； $\times q$
$\begin{aligned} \mathcal A \Sigma_{prior} & = \frac{\left[\phi(\mathcal X)\right]^T \phi(\mathcal X)}{\sigma^2}\Sigma_{prior} + \Sigma_{prior}^{-1}\Sigma_{prior} \\ & = \frac{\left[\phi(\mathcal X)\right]^T \phi(\mathcal X)}{\sigma^2}\Sigma_{prior} + \mathcal I_{q \times q} \end{aligned}$
在上步基础上，继续右乘一个 $[\phi(\mathcal X)]^T$ ：
提出一个公因式 $\frac{[\phi(\mathcal X)]^T}{\sigma^2}$ ,将两项合并，将 $\phi(\mathcal X)\Sigma_{prior} [\phi(\mathcal X)]^T$ 用核函数 $\mathcal K(\mathcal X,\mathcal X)$ 这个记号进行表示。
$\begin{aligned} \mathcal A \Sigma_{prior} [\phi(\mathcal X)]^T & = \frac{\left[\phi(\mathcal X)\right]^T \phi(\mathcal X) \Sigma_{prior}[\phi(\mathcal X)]^T}{\sigma^2} + [\phi(\mathcal X)]^T \\ & = \frac{[\phi(\mathcal X)]^T}{\sigma^2} \left\{\phi(\mathcal X) \Sigma_{prior}[\phi(\mathcal X)]^T + \sigma^2 \mathcal I\right\} \\ & = \frac{[\phi(\mathcal X)]^T}{\sigma^2} \left[\mathcal K (\mathcal X,\mathcal X) + \sigma^2 \mathcal I\right] \end{aligned}$
在上步基础上，左乘一个 $\mathcal A^{-1}$ ：
此时，等式左侧变成了 $\sigma_{prior}[\phi(\mathcal X)]^T$ ;
$\begin{aligned} \Sigma_{prior} [\phi(\mathcal X)]^T = \frac{\mathcal A^{-1} [\phi(\mathcal X)]^T}{\sigma^2}\left[\mathcal K (\mathcal X,\mathcal X) + \sigma^2 \mathcal I\right] \end{aligned}$
从而有：
相当于等式两边同乘 $[\mathcal K(\mathcal X,\mathcal X) + \sigma^2 \mathcal I]^{-1}$
$\frac{\mathcal A^{-1} [\phi(\mathcal X)]^T}{\sigma^2} = \Sigma_{prior} [\phi(\mathcal X)]^T [\mathcal K(\mathcal X,\mathcal X) + \sigma^2 \mathcal I]^{-1}$

至此，均值部分相当于上式基础上，左乘一个 $[\phi(\hat x)]^T$ ，再右乘一个 $\mathcal Y$ ：
这里面已知项有： $\Sigma_{prior}$ 是先验分布 $\mathcal P(\mathcal W)$ 的协方差矩阵； $\sigma^2$ 是回归模型的高斯噪声； $\mathcal K(\mathcal X,\mathcal X)$ 是 $\phi(\mathcal X)\Sigma_{prior} [\phi(\mathcal X)]^T$ 的表示；
$\begin{aligned} \mu_{\hat x} & = [\phi(x)]^T \cdot \mu_{\mathcal W} \\ & = [\phi(x)]^T \left[\frac{\mathcal A^{-1}[\phi(\mathcal X)]^T}{\sigma^2}\right] \cdot \mathcal Y \\ & = [\phi(x)]^T \Sigma_{prior} [\phi(\mathcal X)]^T [\mathcal K(\mathcal X,\mathcal X) + \sigma^2 \mathcal I]^{-1} \mathcal Y \end{aligned}$
小结：实际上上述的均值求解仅是将 $\mathcal A$ 带入到均值表达式中的求解过程，并没有使用 $\text{Woodbury Formula}$ 定理。

方差表示的推导过程

继续求解高维转换后的方差表示。方差部分表示如下：
$[\phi(\hat x)]^T \cdot \mathcal A^{-1} \cdot \phi(\hat x) \quad \mathcal A =\frac{[\phi(\mathcal X)]^T\phi(\mathcal X)}{\sigma^2} + \Sigma_{prior}^{-1}$
这里需要使用 $\text{Woodbury Formula}$ 对 $\mathcal A^{-1}$ 进行求解，或者使用上述拼凑的方式求解：
就是套公式~这里就不写过程了~
$\begin{aligned} \mathcal A^{-1} & = \left(\Sigma_{prior}^{-1} + \frac{1}{\sigma^2}[\phi(\mathcal X)]^T\phi(\mathcal X)\right)^{-1} \\ & = \Sigma_{prior} - \Sigma_{prior} [\phi(\mathcal X)]^T \left[\mathcal K(\mathcal X,\mathcal X) + \sigma^2 \mathcal I\right]^{-1} \phi(\mathcal X) \Sigma_{prior} \end{aligned}$

最终，经过非线性转换后的关于样本 $\hat x$ 的后验分布表示为：
注意：这个是‘无高斯噪声’(Noise-Free)的分布。
$\begin{aligned} \mathcal P[f(\hat x) \mid Data,\hat x] & \sim \mathcal N \left[[\phi(\hat x)]^T \left(\frac{\mathcal A^{-1}[\phi(\mathcal X)]^T\mathcal Y}{\sigma^2}\right) ,[\phi(\hat x)]^T \cdot \mathcal A^{-1} \cdot \phi(\hat x)\right] \\ & = \mathcal N(\mu_{\hat x},\Sigma_{\hat x}) \begin{cases} \mu_{\hat x} = [\phi(x)]^T \Sigma_{prior} [\phi(\mathcal X)]^T [\mathcal K(\mathcal X,\mathcal X) + \sigma^2 \mathcal I]^{-1} \\ \Sigma_{\hat x} = [\phi(\hat x)]^T \cdot \left\{\Sigma_{prior} - \Sigma_{prior} [\phi(\mathcal X)]^T \left[\mathcal K(\mathcal X,\mathcal X) + \sigma^2 \mathcal I\right]^{-1} \phi(\mathcal X) \Sigma_{prior}\right\} \cdot \phi(\hat x) \end{cases} \end{aligned}$
从简化运算的角度，在从几何角度观察多维高斯分布一节中介绍关于协方差矩阵的定义，可以将其定义为一个对角矩阵，甚至是各向同性。

协方差函数(核函数)

回顾上述公式：
就是上述公式的展开式~
$\mathcal N \left[\underbrace{[\phi(\hat x)]^T \Sigma_{prior}[\phi(\mathcal X)]^T [\mathcal K(\mathcal X,\mathcal X) + \sigma^2\mathcal I]^{-1} \mathcal Y}_{\mu_{\hat x}},\underbrace{[\phi(\hat x)]^T \Sigma_{prior} \phi(\hat x) - [\phi(\hat x)]^T \Sigma_{prior}[\phi(\mathcal X)]^T(\mathcal K(\mathcal X,\mathcal X) + \sigma^2\mathcal I)^{-1} \phi(\mathcal X) \Sigma_{prior}\phi(\hat x)}_{\Sigma_{\hat x}} \right]$
观察之前定义的符号 $\mathcal K(\mathcal X,\mathcal X)$ ：
$\mathcal K(\mathcal X,\mathcal X) = \phi(\mathcal X) \cdot \Sigma_{prior} \cdot [\phi(\mathcal X)]^T$
这个格式在上述公式中比比皆是：
$\begin{aligned} & \mu \text{ part}:\begin{cases}[\phi(\hat x)]^T \Sigma_{prior} [\phi(\mathcal X)]^T \\ \mathcal K(\mathcal X,\mathcal X) \end{cases} \\ & \Sigma \text{ part}:\begin{cases} [\phi(\hat x)]^T \Sigma_{prior} \phi(\hat x) \\ [\phi(\hat x)]^T \Sigma_{prior} [\phi(\mathcal X)]^T \\ \mathcal K(\mathcal X,\mathcal X) \\ \phi(\mathcal X) \Sigma_{prior} \phi(\hat x) \end{cases} \end{aligned} \quad \phi(\mathcal X) = [\phi(x^{(1)}),\phi(x^{(2)}),\cdots,\phi(x^{(N)})]_{N \times q}^T$

上述的所有格式，都可以用记号 $\mathcal K(\cdot ,\cdot)$ 进行表示。这个记号函数 $\mathcal K(\cdot ,\cdot)$ 到底是不是核函数？
这个高维转换函数 $\phi$ 中有可能是一个向量：某一个原始 $x_{p \times 1}$ ；也有可能是一个'数据集合' $\mathcal X_{N \times p}$
观察：由于先验分布的协方差矩阵 $\Sigma_{prior}$ 至少是半正定的，这里假设它的正定的，因而有：
$\Sigma_{prior} = \left[\sqrt{\Sigma_{prior}}\right]^2 = \left[\sqrt{\Sigma_{prior}}\right]^T\sqrt{\Sigma_{prior}}$
因此， $\mathcal K(x,x')$ 可表示为：
这里的 $x, x^{'}$ 只是两个宏观的量，它可以表示上述任意一组格式。
$\begin{aligned} \mathcal K(x,x') & = [\phi(x)]^T \Sigma_{prior} \phi(x') \\ & = [\phi(x)]^T \left[\sqrt{\Sigma_{prior}}\right]^T\sqrt{\Sigma_{prior}} \text{ }\phi(x') \\ & = \left[\sqrt{\Sigma_{prior}} \text{ }\phi(x)\right]^T\sqrt{\Sigma_{prior}} \text{ }\phi(x') \end{aligned}$
这里令 $\psi(x) = \sqrt{\Sigma_{prior}} \text{ }\phi(x),\psi(x') = \sqrt{\Sigma_{prior}} \text{ }\phi(x')$ ，则有：
$\mathcal K(x,x') = \left\langle\psi(x),\psi(x')\right\rangle$
至此，可以使用核技巧(Kernal trick)将上述格式全部使用核函数 进行表示，从而跳过高维转换函数 $\psi(\cdot)$ 的复杂计算问题。

至此，将 贝叶斯线性回归 + 高维非线性转换 处理非线性回归问题 转换成基于核函数的贝叶斯线性回归问题(Kernal Bayesian Linear Regression,Kernal BLR)

高斯过程回归与线性贝叶斯回归的关系

实际上，贝叶斯线性回归(Bayesian Linear Regression)和核技巧相结合，构成了 高斯线性回归(Gaussian Linear Regression)。

核技巧部分包括：非线性转换(Non-Linear Transformation) $\phi(\cdot)$ 部分以及内积(Inner Product) $\left\langle\phi(\cdot),\phi(\cdot)\right\rangle$ 部分。
这个关系就是‘权重空间视角’(Weight-Space)的结论。

高斯过程回归一般从两个视角进行描述：

(本节介绍的) 权重空间(Weight-Space)视角：即对模型参数 $\mathcal W$ 在非线性转换后，由 $\times 1$ 转换至 $\times 1$ 的过程。
关于先验概率分布 $\mathcal P(\mathcal W)$ 的分布也是随着‘非线性转换’维度的变化而变化。
$\begin{cases} f(\mathcal X) = [\mathcal X]_{N \times p}^T \mathcal W_{p \times 1} \\ \mathcal Y = f(\mathcal X) + \epsilon \quad \epsilon \sim \mathcal N(0,\sigma^2) \end{cases} \quad \Leftrightarrow \begin{cases} f(\mathcal X) = [\phi(\mathcal X)]_{N \times q}^T \mathcal W_{q \times 1} \\ \mathcal Y = f(\mathcal X) + \epsilon \quad \epsilon \sim \mathcal N(0,\sigma^2) \end{cases}$
从贝叶斯线性回归的两个阶段思路也可以理解：先求 $\mathcal W$ 的后验，再预测样本标签。
函数空间(Function-Space)视角：相比于权重空间视角，它不关注模型参数 $\mathcal W$ ，而是关注 $f(\mathcal X)$ 空间本身。
这两种视角没有区别，结果相同。

它将 $f(\mathcal X)$ 本身看做随机变量，并且 $f(\mathcal X)$ 本身是一个高斯过程(Gaussian Process)：
$f(\mathcal X) \sim GP[m(\mathcal X),\kappa(\mathcal X,x')]$
从高斯过程回归的角度，可以将其看做：贝叶斯线性回归 + 核函数的延伸。

下一节将介绍从函数空间视角观察高斯过程回归。

相关参考：
机器学习-高斯过程回归-权重空间角度

nginx性能优化及使用方面技巧智慧源点 nginx 性能优化 linux
优化Nginx进程数量配置参数如下：代码语言：javascript复制worker_processes1;#指定Nginx要开启的进程数，结尾的数字就是进程的个数，可以为auto这个参数调整的是Nginx服务的worker进程数，Nginx有Master进程和worker进程之分，Master为管理进程、真正接待“顾客”的是worker进程。进程个数的策略：worker进程数可以设置为等于CPU的
线代往事（1.2）为什么说如果AB=I，则BA=I？ duoyasong5907 数学(vip栏目)线性代数
参考mathstackexchange的回答。对于这句话：第一句话，首先由于III里的每个列向量都相互正交，所以I的值域是n维。而由于A
利用Pinecone和Hybrid Search实现高效向量检索 dgay_hua python
在当今数据驱动的世界中，快速准确的信息检索变得尤为重要。Pinecone作为一个功能强大的向量数据库，提供了广泛的功能，包括HybridSearch。本文将详细介绍如何使用Pinecone和HybridSearch构建高效的信息检索系统。1.技术背景介绍Pinecone是专为高效向量检索设计的数据库，可以处理高维数据。HybridSearch结合了密集向量和稀疏向量检索的优势，在提高检索准确性的同
蓝桥杯——算法训练——共线大柠丶蓝桥杯蓝桥杯算法职场和发展
问题描述给定2维平面上n个整点的坐标，一条直线最多能过几个点？输入格式第一行一个整数n表示点的个数以下n行，每行2个整数分别表示每个点的x,y坐标。输出格式输出一个整数表示答案。样例输入50011220323样例输出3数据规模和约定n<=1500，数据保证不会存在2个相同的点。点坐标在int范围内importjava.util.Scanner;/***@authorsjn*@date2022-2-
Kotlin关键字总结萌新洛尘 android Kotlin kotlin
Kotlin关键字可分为三类：1、硬关键字：这些关键字无论在什么情况下都不能用作标识符。2、软关键字：这些关键字可以在它们不起作用的上下文中用作标识符。3、修饰符关键字：这些关键字也可以在代码中用作标识符。一、硬关键字：as一一用于做类型转换或为import语句指定别名as?一一类型安全的类型转换运算符。break一一中断循环class一一声明类。continue一忽略本次循环剩下的语句，重新开始
深入解析 Java Stream API：从 List 到 Map 的优雅转换！！！小丁学Java #Lambda表达式 #方法引用 #Stream java list Stream Lambda 表达式方法引用 map Collectors
深入解析JavaStreamAPI：从List到Map的优雅转换大家好！今天我们来聊聊Java8中一个非常常见的操作：使用StreamAPI将List转换为Map。具体来说，我们将深入分析以下代码片段：MapinviteCodeMap=inviteCodes.stream().collect(Collectors.toMap(InviteCode::getId,ic->ic));这段代码看似简单，
kotlin中的数据转换 LCY133 spring后端 kotlin python 开发语言
在Kotlin中，将数字转换为字符串非常简单且灵活。以下是几种常用的方法及其示例：1.直接使用toString()方法所有数字类型（Int、Long、Double等）都提供了toString()方法，可以直接将数字转为字符串。valnumber=42valstr1=number.toString()//"42"valpi=3.14159valstr2=pi.toString()//"3.14159
基于Python编程语言实现“机器学习”，用于车牌识别项目我的sun&shine Python python 机器学习计算机视觉
基于Python的验证码识别研究与实现1.摘要验证码的主要目的是区分人类和计算机，用来防止自动化脚本程序对网站的一些恶意行为，目前绝大部分网站都利用验证码来阻止恶意脚本程序的入侵。验证码的自动识别对于减少自动登录时长，识别难以识别的验证码图片有着重要的作用。对验证码图像进行灰度化、二值化、去离散噪声、字符分割、归一化、特征提取、训练和字符识别等过程可以实现验证码自动识别。首先将原图片进行灰度化处理
如何使用JSON输出解析器解析语言模型的输出 vaidfl json 语言模型 easyui python
在现代AI应用中，让语言模型返回结构化的数据是一个重要的能力，特别是在需要进一步处理或集成的时候。本文将深入探讨如何利用JsonOutputParser来解析语言模型的JSON输出。技术背景介绍随着语言模型的普及，许多应用场景需要从自然语言处理任务中获取结构化的输出。针对这一需求，输出解析器应运而生，它能够帮助我们定义JSON模式，通过提示语言模型生成符合该模式的输出，并将其解析为JSON格式。核
JavaScript数组-遍历数组咖啡の猫 javascript 开发语言
在JavaScript开发过程中，数组是一种非常常见且强大的数据结构，用于存储一系列有序的数据项。遍历数组是处理这些数据项的基础操作之一，无论是为了显示、转换还是过滤数据。本文将详细介绍几种常见的遍历数组的方法及其应用场景，帮助你选择最适合当前任务的方式。一、为什么需要遍历数组？遍历数组意味着逐一访问数组中的每个元素，以便执行特定的操作，如打印输出、修改值或基于条件筛选数据。不同的场景可能需要不同
docker学习整理 24k小善 java 大数据云计算
一、Docker核心原理：像租房装修一样理解容器1.1容器vs虚拟机：合租vs买别墅虚拟机就像买别墅：每个别墅（虚拟机）自带独立地基（操作系统）、水电系统（系统资源），启动慢（分钟级）、资源占用大（GB级）[1][10]容器就像合租：大家共享小区基础设施（宿主机内核），但每个房间（容器）有自己的家具摆放（应用和依赖）。轻量（MB级）、秒级启动，还能随时搬走（迁移）[9]1.2镜像分层：乐高积木式打
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
关于forward函数 oioz 深度学习
定义forward函数是模型的核心前向传播逻辑，定义了输入数据如何在模型中传递和计算。它将输入数据通过模型的各层（如卷积层、全连接层等），计算出模型的输出。作用负责模型的主要计算逻辑。在训练和验证过程中都会被调用。特点必须实现：在PyTorch中，forward函数是模型的核心部分，必须显式定义。灵活性高：可以根据模型需要，自由定义forward函数的内容，包括各种计算操作。示例（PyTorch）
嵌入式系统中的状态机模式 boringhex.top MCU 嵌入式设计模式
在嵌入式系统中，状态机模式是一种常用的设计模式，通过定义系统的不同状态及其转换规则，帮助开发者更好地管理系统的行为和状态变化。本文将详细讲解状态机模式，并结合实例深入分析，帮助读者深入理解这一模式在嵌入式系统中的应用。状态机模式概述状态机模式（StateMachinePattern）是一种行为型设计模式，它允许对象在其内部状态改变时改变其行为。状态机模式通过将状态封装为独立的类，使得对象在不同状态
深入解析Intel HEX文件格式 boringhex.top MCU 嵌入式
IntelHEX文件格式是一种用于表示二进制数据的ASCII文本格式，广泛应用于嵌入式系统的固件存储和传输。1.IntelHEX文件格式简介IntelHEX文件格式是一种将二进制数据转换为ASCII文本的格式，适用于8位、16位和32位微处理器。它的主要优点是可以将二进制数据存储在非二进制介质（如纸带、穿孔卡片）上，并且可以通过CRT终端或行式打印机显示。ASCII表示：每个字节的二进制值被转换为
Hadoop 集群规划与部署最佳实践 AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2009年2月2日，ApacheHadoop项目诞生。它是一个开源的分布式系统基础架构，用于存储、处理和分析海量的数据。Hadoop具有高容错性、可靠性、可扩展性、适应性等特征，因而广泛应用于数据仓库、日志分析、网络流量监测、推荐引擎、搜索引擎等领域。由于Hadoop采用“分而治之”的架构设计理念，因此可以轻松应对数据量、计算能力和存储成本的增长。2013年底，
opencv对图像处理 syfirst1111 图像处理 opencv 计算机视觉
形态学转换：基于图像形状的操作，通常在二进制图像上执行。腐蚀、膨胀：腐蚀：求局部最小值，原图高亮部分被蚕食膨胀：求局部最大值，原图高亮部分部分扩张img=cv.imread(path)kenel=np.ones((5,5),np.uint8)#创建核结构img2=cv.erode(img,kenel)#腐蚀去噪img1=cv.dilate(img,kenel)#膨胀目标增大，填充孔洞图像平滑（去噪
MySQL 到 Hadoop：Sqoop 数据迁移 ETL Ice星空 ETL
文章目录ETL：Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS：OperationalDataStore-可操作数据存储2.DW：DataWarehouse-数据仓库3.DM：DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
java将动态图转换成静态图_如何用最简单的方法把静态图变成动图？ PEI Lobster java将动态图转换成静态图
在今日头条浏览文章时，我们经常会看到有些作者在文章中插入了一些动态图片，不但美化了页面，而且起到了简明扼要的说明作用，让读者对文章内容加深了理解，也提高了文章的阅读量和点击量。这样的动态效果是如何制作的呢？主要有两个步骤：首先要制作出图片动态效果的视频，一般是MP4格式，第二步用格式工厂等文件格式转换软件，把MP4转换为gif动画格式，然后就可以把它插入到网页中。这其中的难点和重点就在于制作图片的
Python语言程序设计 1 摸你就像摸自己 python
目录1Python基本语法元素￲1.1程序设计基本方法1.1.1计算机与程序设计1.1.2编译与解释1.1.3程序的基本编写方法—IPO1.1.4计算机编程1.2Python开发环境配置1.2.1Python语言概述1.2.2Python程序的编写与运行例1：计算圆面积例2：绘制同切圆例3：绘制五角星1.3实例一：温度转换1.3.1问题分析：实例编写：1.4Python程序语法元素分析1.4.1格
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
头条原创文章一键转换剪映生成视频 Mr数据杨 Python 视频剪辑 python moveipy 图文转视频西瓜视频剪映
随着技术的进步，平台逐渐为创作者提供了更多便捷的功能来增强内容的表达效果。近期，某平台新增了一个实用功能，允许用户将自己发布的文章通过后台的视频生成工具一键转换为短视频。然而，这一功能的使用存在一些限制，比如仅支持原创文章，并且生成的视频只能在该平台发布，暂时无法同步至其他社交平台。尽管如此，通过对生成视频的观察与分析，可以发现其处理方式与剪映等主流视频编辑软件有相似之处，这为进一步扩展视频的应用
MySQL 8.0新特性深度解析：窗口函数与JSON数据处理的10大技巧墨瑾轩一起学学数据库【一】mysql json
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣第1章：MySQL8.0简介嗨，亲爱的小伙伴们！欢迎来到MySQL8.0的奇妙世界，这里充满了新鲜和惊喜。MySQL8.0是一个数据库界的超级英雄，它带着一系列令人兴奋的新特性，比如窗口函数和JSON数据处理，来拯救我们的数据处理任务。1.1MySQL8.0的
Oracle SQL 开发实战：高效技巧与核心特性解析 McRfee sql
OracleSQL开发实战：高效技巧与核心特性解析OracleSQL开发实战：高效技巧与核心特性解析一、引言：OracleSQL的核心优势二、高效SQL编写技巧1.避免全表扫描的黄金法则2.用WITH子句简化复杂查询3.MERGE语句实现智能更新三、Oracle独有特性深度解析1.分析函数：窗口计算的利器2.CONNECTBY层级查询3.虚拟列（VirtualColumn）4.FLASHBACK闪
Linux下文件名中文乱码导致无法访问的问题解决方法无级程序员 linux 文件名乱码
一个基于openwrt路由器做文件服务器，硬盘里面有些文件的中文名乱码了，导致无法打开，也无法复制，想改名也无法操作，怎么办呢，网上搜了一大圈，都是说如何转换乱码，但文件都无法访问了，怎么转换？比如其中一个文件名是：“IVItripsummaryV1.0❁´◡`❁.xlsx"，我试着如下命令发现能唯一的找到它：ls"IVItripsummaryV1.0"*于是，试着改名：mv"IVItripsum
文本转语音常用的几个python库天蓝海乡 python 开发语言人工智能 nlp 语音识别
在Python编程领域，文本到语音（Text-to-Speech,TTS）的转换是一个常见的需求，尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库，它们可以帮助开发者实现文本到语音的转换，并且有的可以将转换后的语音保存为MP3文件。gTTS(GoogleText-to-Speech)gTTS是一个依赖于Google的文本转语音API的Python库。它能够将文本转换为自然听起
python之pyttsx3实现文字转语音播报 l8947943 python问题语音识别人工智能 pyttsx3 python朗读
1.pyttsx3是什么pyttsx3是Python中的文本到语音转换库，可以实现文本的朗读功能。2.pyttsx3的安装pipinstallpyttsx33.pyttsx3的demoimportpyttsx3pyttsx3.speak("Areyouok?")pyttsx3.speak("最近有许多打工人都说打工好难")戴上耳机直接跑即可。是不是很简单！那如果我们想对读音的速率，中英文问题进行自
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
在线生成自定义二维码 A__tao 其他
在线生成自定义二维码1.引言二维码已成为现代互联网的重要工具，广泛应用于链接分享、支付、身份认证等场景。然而，很多在线二维码生成工具功能有限，难以满足个性化需求。如果你需要自定义颜色、Logo、不同形状的二维码，那么推荐你使用gotool.top3.如何使用gotool.top生成自定义二维码？步骤1：访问二维码生成工具打开gotool.top，找到“二维码生成”工具。步骤2：输入二维码内容在输入
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比