golfbears

从一点一滴开始学习了解LDA-Learning Linear Discriminate Analysis from scratch

前言
参考文献
初涉LDA

看代码
看概念
看例子

类均值
类协方差矩阵
类内散度矩阵
类间散度矩阵
求解特征值和特征向量

多分类LDA的推导

类内散度矩阵
类间散度矩阵
投影空间

类内均值和空间均值
散度矩阵

后记
附录

前言

learning ** from scratch大都翻译为从0开始学叉叉，不过真没见过谁能从0开始学一个比较深的技术或者理论，所以这篇名戏谑一下这个词。接触LDA刚开始就对Discraminiate翻译记不住，是差异、辨别，歧视，为什么选择判别作为汉语呢？这只是一系列疑问的开始，因为刚开始接触这个概念，确实连一知半解都谈不上，只是从别人画的图中大概明白是干啥的，那么这个技术能帮助我解决现在的研究课题吗？下面总结记述对这个术语背后理论和实践的学习。正文将参考文献放在第一部分，因为没有这些文献真的无法理解和使用这项技术。而本文很多代码和样例都来自这些文献，先感谢各位作者的知识分享。

参考文献

《机器学习》周志华著清华大学出版社.
A Tutorial on Data Reduction-Linear Discriminant Analysis， Shireen Elhabian and Aly A. Farag， University of Louisville, CVIP Lab
Linear Discriminant Analysis (LDA) https://www.python-course.eu/linear_discriminant_analysis.php
Wine Data Set https://archive.ics.uci.edu/ml/datasets/wine
Linear Discriminant Analysis In Python. Cory Maklin. https://towardsdatascience.com/linear-discriminant-analysis-in-python-76b8b17817c2

初涉LDA

各种介绍此算法的文章都喜欢用一个二维分类点图，加两条直线为读者展现算法的魅力，这样做就是将二维数据最终投影到一维直线上，变成一维数据的同时，令分类的点更加直观，从而引出LDA的初衷：同类投影点尽可能接近，异类投影点尽可能远离。

看代码

一个欧洲域名的网站Python Machine Learning Tutorial对LDA应用很简单明了的演示了一下，在原文的基础上，我增加了测试集的操作，使得结果更加一目了然：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
from matplotlib import style
from sklearn.model_selection import train_test_split

style.use('fivethirtyeight')
from sklearn.neighbors import KNeighborsClassifier

# 0. Load in the data and split the descriptive and the target feature
df = pd.read_csv('data/wine.data', sep=',',
                 names=['target', 'Alcohol', 'Malic_acid', 'Ash', 'Akcakinity', 'Magnesium', 'Total_pheonols',
                        'Flavanoids', 'Nonflavanoids', 'Proanthocyanins', 'Color_intensity', 'Hue', 'OD280', 'Proline'])
X = df.iloc[:, 1:].copy()
target = df['target'].copy()

X_train, X_test, y_train, y_test = train_test_split(X, target, test_size=0.3, random_state=0)

# 1. Standardize the data
for col in X_train.columns:
    X_train[col] = StandardScaler().fit_transform(X_train[col].values.reshape(-1, 1))
# 1. Standardize the data
for col in X_test.columns:
    X_test[col] = StandardScaler().fit_transform(X_test[col].values.reshape(-1, 1))
# 2. Compute the mean vector mu and the mean vector per class mu_k
mu = np.mean(X_train, axis=0).values.reshape(13,
                                             1)  # Mean vector mu --> Since the data has been standardized, the data means are zero

mu_k = []

for i, orchid in enumerate(np.unique(df['target'])):
    mu_k.append(np.mean(X_train.where(df['target'] == orchid), axis=0))
mu_k = np.array(mu_k).T

# 3. Compute the Scatter within and Scatter between matrices
data_SW = []
Nc = []
for i, orchid in enumerate(np.unique(df['target'])):
    a = np.array(X_train.where(df['target'] == orchid).dropna().values - mu_k[:, i].reshape(1, 13))
    data_SW.append(np.dot(a.T, a))
    Nc.append(np.sum(df['target'] == orchid))
SW = np.sum(data_SW, axis=0)

SB = np.dot(Nc * np.array(mu_k - mu), np.array(mu_k - mu).T)

# 4. Compute the Eigenvalues and Eigenvectors of SW^-1 SB
eigval, eigvec = np.linalg.eig(np.dot(np.linalg.inv(SW), SB))

# 5. Select the two largest eigenvalues
eigen_pairs = [[np.abs(eigval[i]), eigvec[:, i]] for i in range(len(eigval))]
eigen_pairs = sorted(eigen_pairs, key=lambda k: k[0], reverse=True)
w = np.hstack((eigen_pairs[0][1][:, np.newaxis].real, eigen_pairs[1][1][:, np.newaxis].real))  # Select two largest

# 6. Transform the data with Y=X*w
Y = X_train.dot(w)
Y_p = X_test.dot(w)
# Plot the data
fig = plt.figure(figsize=(10, 10))
ax0 = fig.add_subplot(111)
ax0.set_xlim(-3, 3)
ax0.set_ylim(-4, 3)

for l, c, m in zip(np.unique(y_train), ['r', 'g', 'b'], ['s', 'x', 'o']):
    ax0.scatter(Y[0][y_train == l],
                Y[1][y_train == l],
                c=c, marker=m, label=l, edgecolors='black')
ax0.legend(loc='upper right')


for l, c, m in zip(np.unique(y_test), ['c', 'k', 'm'], ['p', '*', 'h']):
    ax0.scatter(Y_p[0][y_test == l],
                Y_p[1][y_test == l],
                c=c, marker=m, label=l, edgecolors='red')
ax0.legend(loc='upper right')


# Plot the voroni spaces
means = []

for m, target in zip(['s', 'x', 'o'], np.unique(y_train)):
    means.append(np.mean(Y[y_train == target], axis=0))
    ax0.scatter(np.mean(Y[y_train == target], axis=0)[0], np.mean(Y[y_train == target], axis=0)[1], marker=m, c='black',
                s=100)

mesh_x, mesh_y = np.meshgrid(np.linspace(-3, 3), np.linspace(-4, 3))
mesh = []

for i in range(len(mesh_x)):
    for j in range(len(mesh_x[0])):
        date = [mesh_x[i][j], mesh_y[i][j]]
        mesh.append((mesh_x[i][j], mesh_y[i][j]))

NN = KNeighborsClassifier(n_neighbors=1)
NN.fit(means, ['r', 'g', 'b'])
predictions = NN.predict(np.array(mesh))

ax0.scatter(np.array(mesh)[:, 0], np.array(mesh)[:, 1], color=predictions, alpha=0.3)

plt.show()

这段代码运行完的会画出如下的点图，其中图例的第一个123表示训练集的点阵，第二个123表示测试集的点阵。
上述图形说明了哪些问题呢？要想看清楚发生了什么，还要从原始数据入手，这个数据来自于UCI Marchine Learning Repository: Wine Data Set，记录了来自三个产区的不同葡萄酒的几十种化学成分，数据内容是这样的：

Region	Alcohol	Ash	Alcalinity of ash	Magnesium	Total phenols	Flavanoids	Nonflavanoid phenols	Proanthocyanins	Color intensity	Hue	OD280/OD315 of diluted wines	Proline
1	14.23	1.71	2.43	15.6	127	2.8	3.06	.28	2.29	5.64	1.04	3.92

Region是我们要的目标类别1，2，3。那么如何通过LDA挖掘13维数据，寻找这种映射呢？上面的代码实现这个功能，并且将13维的数据降到2维，画在了图上，让读者一目了然。通过上图可以看出，用训练集和拟合出来的 $w$ ，可以很好的将测试集的数据完成降维和分类。

看概念

对于二维数据集，就是寻找一条直线，令数据投影到这条直线上，并且满足同类投影点尽可能接近，异类投影点尽可能远离；新样本按照同样的方法投影到这条直线上，根据投影点的位置就可以确定样本的类别。类推到多维空间。概念非常朴素却蕴藏精辟的论点，投射、直线。或者说，如何找到这样一条“直线”已经让我这个半路出家的炼丹师差不多快晕死了。据说这是矩阵空间里的重要知识，我也许当初在大学里学过，只是很快的还给老师了。先囫囵吞枣的记住这个概念吧。下面引用（重抄一遍）西瓜书里的原文标准定义：
【1】给定数据集 $D={(x_i , y_i)}\sum_1^n,\quad y_i \in{0, 1}$ , 令 $X_i 、 \mu_i、\sum_i$ 分别表示第 $i\in$ {0 , 1} 类示例的集合、均值向量、协方差矩阵。若将数据投影到直线 $w$ 上 ,则两类样本的中心在直线上的投影分别为 $w^T\mu_0$ 和 $w^T\mu_1$ ；若将所有样本点都投影到直线上,则两类样本的协方差分别为 $w^T\sum_0 w$ 和 $w^T\sum_1 w$ . 由于直线是一维空间，因此 $w^T\mu_0$ 、 $w^T\mu_1$ 、 $w^T\sum_0 w$ 和 $w^T\sum_1 w$ 均为实数.

此处协方差矩阵是何物？
样本中心投影为啥是这个？
多维空间就不是实数了？ 
很多基础概念不甚了了。

欲使同类样例的投影点尽可能接近，可以让同类样例投影点的协方差尽可能小,即 $w^T\sum_0 w$ + $w^T\sum_1 w$ 尽可能小;而欲使异类样例的投影点尽可能远离,可以让类中心之间的距离尽可能大,即 $||w^T\mu_0 - w^T\mu_1||_2^2$ 尽可能大.同时考虑二者,则可得到欲最大化的目标：
$\begin{aligned} J(w)&=\frac {||w^T\mu_0 - w^T\mu_1||_2^2}{w^T\sum_0 w + w^T\sum_1 w} \\ &= \frac {w^T(\mu_0 - \mu_1)(\mu_0 - \mu_1) w}{w^T(\sum_0 + \sum_1) w}\\ &=\frac {w^T\bold S_b w}{w^T\bold S_w w} \end{aligned}$
此处定义了类内散度矩阵（within-class scatter matrix）：
$\begin{aligned} \bold{S_w} &= \sum_0+\sum_1\\ &= \sum _{x\in X_0}(x-\mu_0)(x-\mu_0)^T+\sum _{x\in X_1}(x-\mu_1)(x-\mu_1)^T \end{aligned}$
和类间散度矩阵（between-class scatter matrix）：
$\bold S_b = (\mu_0-\mu_1)(\mu_0-\mu_1)^T$
以上定义出了LDA的最大化目标（广义瑞利商）（晕*3）。那么如何根据最大化目标来求得我们心心念的 $w$ 呢？《西瓜书》已经用完全看不懂了。但这很自然的想到了典型的优化方法，求导并令导数等于0，参考文献【2】给出了公式推导：
$\begin{aligned} \frac{d}{dw}J(w) &= \frac{d}{dw} \left(\frac{w^T\bold S_b w}{w^T\bold S_w w} \right)=0\\ &\Rightarrow (w^T\bold S_w w) \frac{d}{dw} \left({w^T\bold S_b w} \right)-(w^T\bold S_b w) \frac{d}{dw} \left({w^T\bold S_w w} \right)=0\\ &\Rightarrow (w^T\bold S_w w)2S_bw - -(w^T\bold S_b w) 2S_ww=0 \end{aligned}$
令等式除以 $w^T\bold S_w w$ ：
$\begin{aligned} &\Rightarrow \left(\frac{w^T\bold S_w w}{w^T\bold S_w w} \right)S_bw - \left(\frac{w^T\bold S_b w}{w^T\bold S_w w} \right)=S_ww=0\\ &\Rightarrow S_bw -J(w)S_ww=0\\ &\Rightarrow S_w^{-1}S_bw -J(w)w=0\\ \end{aligned}$
上式就变成了矩阵求特征值的问题，公式如下：

$\begin{aligned} \Rightarrow & S_w^{-1}S_bw =\lambda w\\ &\lambda = J(w) \end{aligned}$
这个 $\lambda$ 被西瓜书引用为拉格朗日乘子，该公式可以理解为针对于两个矩阵 $S_w^{-1}S_b$ 的特征值 $\lambda$ 和特征向量 $w$ 的求解，最后推出 $w$ 的计算方法：
$\begin{aligned} w^*&=\mathop{argmax} \limits_{w}\ J(w)\\ &=\mathop{argmax} \limits_{w}\ \left(\frac{w^T\bold S_b w}{w^T\bold S_w w} \right)\\ &=S_w^{-1}(\mu_1-\mu_2) \end{aligned}$
这个公式尝试告诉我们保留最大的特征值。说实话，有些地方还是无法完全看懂，对于工程实施来说，似乎得到了追去 $w$ 方法。

看例子

这个例子依旧来自参考文献【2】，这是一个两维散点数据集：
$\begin{aligned} &class1：\bold X_1=(x_1,x_2)=\{(4,2),(2,4),(2,3),(3,6),(4,4) \} \\ &class2：\bold X_2=(x_1,x_2)=\{(9,10),(6,8),(9,5),(8,7),(10,8) \} \end{aligned}$
讲这些点画在图上

类均值

$\begin{aligned} &class1：\mu_1=\frac{1}{N_1}\sum_{x \in class1}x=\frac{1}{5}\left[\begin{pmatrix}4\\2\end{pmatrix},\begin{pmatrix}2\\4\end{pmatrix},\begin{pmatrix}2\\3\end{pmatrix},\begin{pmatrix}3\\6\end{pmatrix},\begin{pmatrix}4\\4\end{pmatrix} \right]=\begin{pmatrix}3\\3.8\end{pmatrix} \\ &class2：\mu_2=\frac{1}{N_1}\sum_{x \in class2}x=\frac{1}{5}\left[\begin{pmatrix}9\\10\end{pmatrix},\begin{pmatrix}6\\8\end{pmatrix},\begin{pmatrix}9\\5\end{pmatrix},\begin{pmatrix}8\\7\end{pmatrix},\begin{pmatrix}10\\8\end{pmatrix} \right]=\begin{pmatrix}8.4\\7.6\end{pmatrix} \end{aligned}$
这时候可以看均值在二维坐标系的位置

类协方差矩阵

$\begin{aligned} S_1&=\sum_{x \in class1}(\bold{x}-\bold{\mu_1})(\bold{x}-\bold{\mu_1})^T\\ &=\left[\begin{pmatrix}4\\2\end{pmatrix}-\begin{pmatrix}3\\3.8\end{pmatrix}\right]\left[\begin{pmatrix}4\\2\end{pmatrix}-\begin{pmatrix}3\\3.8\end{pmatrix}\right]^T+ \left[\begin{pmatrix}2\\4\end{pmatrix}-\begin{pmatrix}3\\3.8\end{pmatrix}\right]\left[\begin{pmatrix}2\\4\end{pmatrix}-\begin{pmatrix}3\\3.8\end{pmatrix}\right]^T+...\\ &=\begin{pmatrix}1&-0.25\\-0.25&2.2\end{pmatrix} \end{aligned}$
$\begin{aligned} S_2&=\sum_{x \in class2}(\bold{x}-\bold{\mu_2})(\bold{x}-\bold{\mu_2})^T\\ &=\left[\begin{pmatrix}9\\10\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]\left[\begin{pmatrix}9\\10\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]^T+ \left[\begin{pmatrix}6\\8\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]\left[\begin{pmatrix}6\\8\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]^T+...\\ &=\begin{pmatrix}2.3&-0.05\\-0.05&3.3\end{pmatrix} \end{aligned}$

类内散度矩阵

$\begin{aligned} S_w=S_1+S_2&=\begin{pmatrix}1&-0.25\\-0.25&2.2\end{pmatrix}+\begin{pmatrix}1&-0.25\\-0.25&2.2\end{pmatrix}\\ &=\begin{pmatrix}3.3&-0.3\\-0.3&5.5\end{pmatrix} \end{aligned}$

类间散度矩阵

$\begin{aligned} S_b&=\sum(\bold{\mu_1}-\bold{\mu_2})(\bold{\mu_1}-\bold{\mu_2})^T\\ &=\left[\begin{pmatrix}3\\3.8\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]\left[\begin{pmatrix}3\\3.8\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]^T\\ &=\begin{pmatrix}29.16&20.52\\20.52&14.44\end{pmatrix} \end{aligned}$

求解特征值和特征向量

回想上面的公式：
$\begin{aligned} & S_w^{-1}S_bw =\lambda w\\ \Rightarrow &|S_w^{-1}S_b -\lambda I|=0 \end{aligned}$
带入两个矩阵的值
$\begin{aligned} \Rightarrow &\left |\begin{pmatrix}3.3&-0.3\\-0.3&5.5\end{pmatrix}^{-1}\begin{pmatrix}29.16&20.52\\20.52&14.44\end{pmatrix} -\lambda\begin{pmatrix}1&0\\0&1\end{pmatrix} \right |=0\\ \Rightarrow &\left |\begin{pmatrix}0.3045&0.0166\\0.0166&0.1827\end{pmatrix}\begin{pmatrix}29.16&20.52\\20.52&14.44\end{pmatrix} -\lambda\begin{pmatrix}1&0\\0&1\end{pmatrix} \right |=0\\ \Rightarrow &\left |\begin{pmatrix}9.2213-\lambda&6.489\\4.2339&2.9794-\lambda\end{pmatrix} \right |=0\\ \Rightarrow &(9.2213-\lambda)(2.9794-\lambda)-6.489*4.2339=0\\ \Rightarrow &\lambda_1=0, \ \lambda_2=12.2007 \end{aligned}$
特征值解出来了，继续解特征向量
$\begin{aligned} &\begin{pmatrix}9.2213&6.489\\4.2339&2.9794\end{pmatrix} w_1=\lambda w_1\ , \ \lambda_1=0\\ \Rightarrow &\begin{pmatrix}9.2213&6.489\\4.2339&2.9794\end{pmatrix} w_1=0 w_1\\ \Rightarrow &w_1= \begin{pmatrix}-0.5755\\0.8178\end{pmatrix} \end{aligned}$
同理求出
$w_2= \begin{pmatrix}0.9088\\0.4173\end{pmatrix}$
利用上文的另外一个公式
$\begin{aligned} w^*&=\mathop{argmax} \limits_{w}\ J(w)\\ &=\mathop{argmax} \limits_{w}\ \left(\frac{w^T\bold S_b w}{w^T\bold S_w w} \right)\\ &=S_w^{-1}(\mu_1-\mu_2)\\ &=\begin{pmatrix}3.3&-0.3\\-0.3&5.5\end{pmatrix}^{-1}\left[\begin{pmatrix}3\\3.8\end{pmatrix}-\begin{pmatrix}8.4\\7.6\end{pmatrix}\right]\\ &=\begin{pmatrix}0.3045&0.0166\\0.0166&0.1827\end{pmatrix}\begin{pmatrix}-5.4\\-3.8\end{pmatrix}\\ &=\begin{pmatrix}0.9088\\0.4173\end{pmatrix} \end{aligned}$
有了 $w^*$ ，就可以进行线性变化，这个线性变化带有判别性质，其实在进行计算的初期已经有先验知识，分了两个类，这个是LDA中的分类原理。文献还有映射和pdf分析，篇幅长，暂时不去细嚼了，以后再说。

多分类LDA的推导

上文中第一个例子是三个产地（3分类）的葡萄酒，最后构建出LDA模型，用2维数据可以跟好的区分开来，其实这不是巧合，而是经典的LDA规律。而2维的数学例子最后降维到1维，其实是来自2分类的初始设计，这种降维的理念有点绕。【1】若将 W 视为一个投影矩阵,则N个分类 LDA 将样本投影到 N-1 维空间,N-1 通常远小子数据原有的属性数.于是,可通过这个投影来减小样本点的维数,且投影过程中使用了类别信息?因此LDA也常被视为一种经典的监督降降维技术。由此我们在应用和设计LDA模型的时候要牢记这个规律。而西瓜书的数学推导第一句就让我万劫不复了，所以还是顺着【2】的思路走下去。
假设我们有 $n$ 维特征向量 $X$ 对 $C$ 个类别做鉴别Discriminate，我们需要通过LDA设计一个新的映射，希望这个 $n$ 维向量降维到 $C$ -1维特征向量，同时测试集数据经过变换以后更加容易区分，所以我们引入下面的变换：
$y_i=w_i^Tx$
上式中 $w_i^T$ 是一个n维向量，可以将 $x$ 转换为一个值 $y$ ，我们需要设计 $C$ -1个这样的向量，有这些向量构成向量矩阵：
$\bold W=\left [w1|w2|...|w_{c-1} \right ]$
那么映射矩阵，或者所谓的投影矩阵来了：
$\begin{aligned} y_i=\bold W^Tx, \ x=\begin{bmatrix}x_1\\.\\.\\x_n\end{bmatrix}, \ y=\begin{bmatrix}y_1\\.\\.\\y_{c-1}\end{bmatrix} \end{aligned}$
畅想一下我们有海量的数据集合，用m来表示个数吧，用投影矩阵一样可以转换到另外一个空间：
$\begin{aligned} \bold Y=\bold W^T\bold X, \ X=\left\{ \begin{bmatrix}x_1^1\\.\\.\\x_n^1\end{bmatrix} \begin{bmatrix}x_1^2\\.\\.\\x_n^2\end{bmatrix}...\begin{bmatrix}x_1^m\\.\\.\\x_n^m\end{bmatrix} \right\}, Y=\left\{ \begin{bmatrix}y_1^1\\.\\.\\y_n^1\end{bmatrix} \begin{bmatrix}y_1^2\\.\\.\\y_n^2\end{bmatrix}...\begin{bmatrix}y_1^m\\.\\.\\y_n^m\end{bmatrix} \right\} \end{aligned}$
构想已经打好，剩下的就是如何实现了，一切都是依据二维推导，一点一点引伸到多维空间。

类内散度矩阵

看看这个二分类的类内散度矩阵
$\begin{aligned} S_w=S_1+S_2 \end{aligned}$
在C类空间可以扩展为：
$\begin{aligned} S_w=\sum_{i=1}^CS_i, \ S_i=\sum_{x \in class_i}(x-\mu_i)(x-\mu_i)^T, \mu_i=\frac{1}{N_i}\sum_{x \in class_i}x \end{aligned}$

类间散度矩阵

相比二分类的类间散度矩阵
$\begin{aligned} S_b&=\sum(\bold{\mu_1}-\bold{\mu_2})(\bold{\mu_1}-\bold{\mu_2})^T\\ \end{aligned}$
在C类空间，定义这样一种方式来衡量不同类别的离散程度。
$\begin{aligned} S_b&=\sum_{i=1}^CN_i(\bold{\mu_i}-\bold{\mu})(\bold{\mu_i}-\bold{\mu})^T\\ \mu&=\frac{1}{N}\sum_{\forall x}x=\frac{1}{N}\sum_{\forall x}N_i\mu_i,\ \ \mu_i=\frac{1}{N_i}\sum_{x \in class_i}x \end{aligned}$

投影空间

类内均值和空间均值

$\begin{aligned} \tilde{\mu_i}=\frac{1}{N_i}\sum_{y \in class_i}y \end{aligned}$
$\begin{aligned} \tilde{\mu}&=\frac{1}{N}\sum_{\forall y}y \end{aligned}$

散度矩阵

$\begin{aligned} \tilde{S_w}=\sum_{i=1}^C\tilde{S_i}=\sum_{i=1}^C\sum_{y \in class_i}(y-\tilde{\mu_i})(y-\tilde{\mu_i})^T \end{aligned}$
$\begin{aligned} \tilde{S_b}&=\sum_{i=1}^CN_i(\bold{\tilde{\mu_i}}-\bold{\tilde{\mu}})(\bold{\tilde{\mu_i}}-\bold{\tilde{\mu}})^T\\ \end{aligned}$
按照二维空间的方法，我们可以得出两个空间的散度矩阵变换关系：
$\begin{aligned} \tilde{S_w}=W^T\bold S_w W \end{aligned}$
$\begin{aligned} \tilde{S_b}&=W^T\bold S_b W \end{aligned}$
照葫芦画瓢构建多维空间的评价函数：
$\begin{aligned} J(w)&=\frac {|\tilde{S_b}|}{|\tilde{S_w}|} =\frac {|W^T\bold S_b W|}{|W^T\bold S_w W|} \end{aligned}$
寻求 $W^*$ 令上式最大化，眼花缭乱的变化不管了，最后

$\begin{aligned} \Rightarrow & S_w^{-1}S_bW^* =\lambda W^*\\ &\lambda = J(w)=Scalar \end{aligned}$
又变成了求矩阵特征值和特征向量的问题，这多维空间的矩阵运算不得不依靠工具来帮忙了。至此，公式推导就差不多这样吧。

后记

LDA这个学习动力来自一篇论文，可以最后学习下来，发现暂时对我面临的问题帮助不大，不过真的感慨经典的机器学习算法很精妙，文献【5】的实现有空再看吧。

附录

散点图python程序


import numpy as np
import matplotlib.pyplot as plt


X_1 = [(4,2),(2,4),(2,3),(3,6),(4,4)]
X_2 = [(9,10),(6,8),(9,5),(8,7),(10,8)]

fig = plt.figure(figsize=(10, 10))
ax0 = fig.add_subplot(111)
ax0.set_xlim(-1, 13)
ax0.set_ylim(-1, 13)

for x in X_1:
    ax0.scatter(x[0],
                x[1],
                c='b', marker='*', label='class1', edgecolors='green')

for x in X_2:
    ax0.scatter(x[0],
                x[1],
                c='r', marker='x', label='class2', edgecolors='black')
mu1 = np.mean(np.array(X_1),axis=0)

ax0.scatter(mu1[0],
                mu1[1],
                c='black', marker='p', label='mu_1', edgecolors='green', s=100)

mu2 = np.mean(np.array(X_2),axis=0)

ax0.scatter(mu2[0],
                mu2[1],
                c='purple', marker='h', label='mu_1', edgecolors='yellow', s=100)
#ax0.legend(loc='upper right')

plt.show()

pass

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI产品经理需要了解的算法知识 AI劳模人工智能产品经理 AI产品经理 AI产品经理入门零基础入门产品经理算法语言模型
1、自然语言生成（NLG）自然语言生成（NaturalLanguageGeneration，简称NLG）是一种人工智能技术，它的目标是将计算机的数据、逻辑或算法产生的信息转换成人类可读的自然语言文本。换句话说，NLG能让机器“学会”写文章、报告、故事或者其他任何形式的文字，就像人类作家那样。这项技术使得机器能够理解复杂的数据并将其转化为易于理解的语言，以适应不同的受众和情境。应用实例：金融报告自动
【Python】OpenAI API 宅男很神经 python 开发语言
【Python与OpenAIAPI深度探索：从基础到未来】第一章：OpenAIAPI概览与核心概念1.1OpenAIAPI是什么？能做什么？OpenAIAPI(ApplicationProgrammingInterface，应用程序编程接口)是一套允许开发者通过编程方式访问和使用OpenAI开发的各种先进人工智能模型的服务。这些模型经过海量数据的训练，能够在多种任务上达到甚至超越人类水平。通过AP
Python：操作 Word 对齐方式 Thomas Kant Python python word c#
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】Python：操作Word对齐方式详解（左对齐/右对齐/居中/两端对齐）在日常办公自动化中，我们经常需要对Word文档中的段落设置对齐方式，如左对齐、右对齐、居中、两端对齐等。本文将带你使用python-docx库
TestCafe ➜ Playwright fixture 架构迁移指南 Thomas Kant 自动化测试 playwright testcafe typescript 测试架构
亲爱的技术爱好者们，热烈欢迎来到Kant2048的博客！我是ThomasKant，很开心能在CSDN上与你们相遇～本博客的精华专栏：【自动化测试】【测试经验】【人工智能】【Python】
医疗金融预测与语音识别中的模型优化及可解释性技术突破智能计算研究中心其他
内容概要随着人工智能技术的纵深发展，模型优化与可解释性技术正在重塑医疗诊断、金融预测及语音识别领域的应用范式。在医疗领域，基于自适应学习的动态参数调整机制，结合迁移学习的跨场景知识复用，显著提升了疾病筛查模型的泛化能力；而金融预测场景中，联邦学习框架通过分布式数据协作，在保障隐私安全的前提下，实现了风险预测模型的多维度优化。语音识别领域则依托边缘计算架构，将模型压缩技术与实时推理引擎结合，有效解决
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

从一点一滴开始学习了解LDA-Learning Linear Discriminate Analysis from scratch