xxbbin

DATAWHALE协同过滤学习-task03矩阵分解(转)

矩阵分解

1. 隐语义模型与矩阵分解
2. 隐语义模型
3. 矩阵分解算法的原理
4.矩阵分解算法的求解
5.Basic SVD
6. 编程实现
7. 课后思考

1. 隐语义模型与矩阵分解

协同过滤算法的特点就是完全没有利用到物品本身或者是用户自身的属性，仅仅利用了用户与物品的交互信息就可以实现推荐，是一个可解释性很强，非常直观的模型，但是也存在一些问题，第一个就是处理稀疏矩阵的能力比较弱，所以为了使得协同过滤更好处理稀疏矩阵问题，增强泛化能力，从协同过滤中衍生出矩阵分解模型(Matrix Factorization,MF)或者叫隐语义模型, 两者差不多说的一个意思，就是在协同过滤共现矩阵的基础上，使用更稠密的隐向量表示用户和物品，
挖掘用户和物品的隐含兴趣和隐含特征，在一定程度上弥补协同过滤模型处理稀疏矩阵能力不足的问题。

2. 隐语义模型

隐语义模型最早在文本领域被提出，用于找到文本的隐含语义。在2006年，被用于推荐中，它的核心思想是通过隐含特征（latent factor）联系用户兴趣和物品（item），基于用户的行为找出潜在的主题和分类，然后对item进行自动聚类，划分到不同类别/主题(用户的兴趣)。

这么说可能有点抽象，所以下面拿项亮老师《推荐系统实践》里面的那个例子看一下：

如果我们知道了用户A和用户B两个用户在豆瓣的读书列表，从他们的阅读列表可以看出，用户A的兴趣涉及侦探小说、科普图书以及一些计算机技术书，而用户B的兴趣比较集中在数学和机器学习方面。那么如何给A和B推荐图书呢？
先说说协同过滤算法，这样好对比不同：
1 . 对于UserCF，首先需要找到和他们看了同样书的其他用户（兴趣相似的用户），然后给他们推荐那些用户喜欢的其他书。
2 . 对于ItemCF，需要给他们推荐和他们已经看的书相似的书，比如作者B看了很多关于数据挖掘的书，可以给他推荐机器学习或者模式识别方面的书。
而如果是隐语义模型的话，它会先通过一些角度把用户兴趣和这些书归一下类，当来了用户之后，首先得到他的兴趣分类，然后从这个分类中挑选他可能喜欢的书籍。

在这里插入图片描述

我们下面拿一个音乐评分的例子来具体看一下隐特征矩阵的含义。

假设每个用户都有自己的听歌偏好，比如A喜欢带有小清新的，吉他伴奏的，王菲的歌曲，如果一首歌正好是王菲唱的，并且是吉他伴奏的小清新，那么就可以将这首歌推荐给这个用户。也就是说是小清新，吉他伴奏，王菲这些元素连接起了用户和歌曲。当然每个用户对不同的元素偏好不同，每首歌包含的元素也不一样，所以我们就希望找到下面的两个矩阵：

1.潜在因子—— 用户矩阵Q
这个矩阵表示不同用户对于不同元素的偏好程度， 1代表很喜欢， 0代表不喜欢，比如下面这样：

2.潜在因子——音乐矩阵P
表示每种音乐含有各种元素的成分，比如下表中，音乐A是一个偏小清新的音乐，含有小清新的Latent Factor的成分是0.9，重口味的成分是0.1，优雅成分0.2…

利用上面的这两个矩阵，我们就能得出张三对音乐A的喜欢程度：

张三对小清新的偏好 * 音乐A含有小清新的成分 + 张三对重口味的偏好 * 音乐A含有重口味的成分 + 张三对优雅的偏好 * 音乐A含有优雅的成分…,

下面是对应的两个隐向量：

根据隐向量其实就可以得到张三对音乐A的打分，即：
0.6∗0.9+0.8∗0.1+0.1∗0.2+0.1∗0.4+0.7∗0=0.69
按照这个计算方式，每个用户对每首歌其实都可以得到这样的分数，最后就得到了我们的评分矩阵：

这里的红色表示用户没有打分，我们通过隐向量计算得到的。

上面例子中的小清晰，重口味，优雅这些就可以看做是隐含特征，而通过这个隐含特征就可以把用户的兴趣和音乐的进行一个分类，其实就是找到了每个用户每个音乐的一个隐向量表达形式（embedding的原理其实也是这样，那里是找到每个词的隐向量表达），这个隐向量就可以反映出用户的兴趣和物品的风格，并能将相似的物品推荐给相似的用户等。** 有没有感觉到是把协同过滤算法进行了一种延伸，把用户的相似性和物品的相似性通过了一个叫做隐向量的方式进行表达**

但是，真实的情况下我们其实是没有上面那两个矩阵的，音乐那么多，用户那么多，我们没有办法去找一些隐特征去表示出这些东西，另外一个问题就是即使能表示也不一定准，对于每个用户或者每个物品的风格，我们每个人都有不同的看法。所以事实上，我们有的只有用户的评分矩阵，也就是最后的结果，并且一般这种矩阵长这样：

这种矩阵非常的稀疏，如果直接基于用户相似性或者物品相似性去填充这个矩阵是不太容易的，并且很容易出现长尾问题，所以矩阵分解就可以比较容易的解决这个问题。

矩阵分解模型其实就是在想办法基于这个评分矩阵去找到上面例子中的那两个矩阵，也就是用户兴趣和物品的隐向量表达，然后就把这个评分矩阵分解成Q和P两个矩阵乘积的形式，这时候就可以基于这两个矩阵去预测某个用户对某个物品的评分了。然后基于这个评分去进行推荐。这就是矩阵分解算法的原理。

3. 矩阵分解算法的原理

在矩阵分解的算法框架下， 我们就可以通过分解协同过滤的共现矩阵来得到用户和物品的隐向量，就是上面的用户矩阵Q和物品矩阵P，这也是“矩阵分解”名字的由来。

阵分解算法将 m×n维的共享矩阵 R分解成 m×k维的用户矩阵 U和 k×n维的物品矩阵 V相乘的形式。其中m是用户数量， n是物品数量， k是隐向量维度，也就是隐含特征个数，只不过这里的隐含特征变得不可解释了，即我们不知道具体含义了，要模型自己去学。 k的大小决定了隐向量表达能力的强弱， k越大，表达信息就越强，理解起来就是把用户的兴趣和物品的分类划分的越具体。
那么如果有了用户矩阵和物品矩阵的话，我们就知道了如果想计算用户 u对物品i的评分，只需要
$Preference(u,j)=r_{ui}=p_{u}^Tq_{i}=\sum p_{u,k}q_{k,i}$
这里的 $p_{u}$ 就是用户 u的隐向量，就类似与上面的张三向量，注意这是列向量， $q_{i}$ 是物品i的隐向量，就类似于上面的音乐A向量，这个也是列向量，所以才用了 $p_{u}^Tq_{i}$ 得到了一个数，也就是用户的最终评分，计算过程其实和上面例子中一样。这里的 $p_{u,k}$ 和 $q_{k,i}$ 是模型的参数，也正是我们想办法要计算的， $p_{u,k}$ 度量的是用户 u的兴趣和第 k个隐类的关系，而 $q_{k,i}$ 度量了第 k个隐类和物品i之间的关系。

4.矩阵分解算法的求解

到矩阵分解，最常用的方法是特征值分解(EVD)或者奇异值分解(SVD），关于这两个的具体原理可以参考下面的链接: 奇异值分解(SVD)的原理详解及推导[^1] ，但是这两种方式在这里不用。
首先是EVD，它要求分解的矩阵是方阵，显然用户-物品矩阵不满足这个要求，而传统的SVD分解，会要求原始矩阵是稠密的，而我们这里的这种矩阵一般情况下是非常稀疏的，如果想用奇异值分解，就必须对缺失的元素进行填充，而一旦补全，空间复杂度就会非常高，且补的不一定对。然后就是SVD分解计算复杂度非常高，而我们的用户-物品矩阵非常大，所以基本上无法使用。

5.Basic SVD

2006年的Netflix Prize之后， Simon Funk公布了一个矩阵分解算法叫做Funk-SVD, 后来被Netflix Prize的冠军Koren称为Latent Factor Model(LFM)。 Funk-SVD的思想很简单： 把求解上面两个矩阵的参数问题转换成一个最优化问题，可以通过训练集里面的观察值利用最小化来学习用户矩阵和物品矩阵。
我们上面已经知道了，如果有了用户矩阵和物品矩阵的话，我们就知道了如果想计算用户 $u$ 对物品 $i$ 的评分，只需要
$Preference(u,j)=r_{ui}=p_{u}^Tq_{i}=\sum p_{u,k}q_{k,i}$
而现在，我们有真实的 $r_{u,i}$ , 但是没有 $p_{u}^Tq_{i}$ , 那么我们可以初始化一个啊，随机初始化一个用户矩阵 U和一个物品矩阵 V，然后不就有 $p_{u}^Tq_{i}$ 了？当然你说，随机初始化的肯定不准啊，但是，有了 $p_{u}^Tq_{i}$ 之后，我们就可以计算一个猜测的 $\hat{r}_{u,i}$ , 即: $\hat{r}_{u,i}=p_{u}^Tq_{i}$
这时候，肯定是不准，那么这个猜测的和真实值之间就会有一个误差：
$e_{u,i}=r_{u,i}-\hat{r}_{u,i}$
有了误差，我们就可以计算出总的误差平方和：
$SSE=\sum_{u,i} e_{u,i}^2=\sum \limits_{u,i} (r_{u,i}-\sum \limits_{k=1}^K p_{u,k}q_{k,i})^2$
有了损失，我们就可以想办法进行训练，把SSE降到最小，那么我们的两个矩阵参数就可以算出来。所以就把这个问题转成了最优化的的问题，而我们的目标函数就是：
$\mathop{min} \limits_{q*,p*} \sum \limits_{(u,i\in K)}=\sum \limits_{u,i} (r_{ui}-p_{u}^Tq_{i})^2$
这里的K表示所有用户评分样本的集合。
有了目标函数，那么我们就可以使用梯度下降算法来降低损失。那么我们需要对目标函数求偏导，得到梯度。我们的目标函数如果是上面的SSE，我们下面来推导一下最后的导数：
$SSE=\sum_{u,i} e_{u,i}^2=\sum \limits_{u,i} (r_{u,i}-\sum \limits_{k=1}^K p_{u,k}q_{k,i})^2$
首先我们求SSE在 $p_{u,k}$ （也就是Q矩阵的第u行k列）的梯度：
$\frac{\partial }{\partial p_{u,k}}SSE=\frac{\partial }{\partial p_{u,k}}(e_{ui}^2)=2e_{ui}\frac{\partial }{\partial p_{k,i}}e_{u,i}\\ =2e_{ui}\frac{\partial }{\partial p_{k,i}} (r_{u,i}-\sum \limits_{k=1}^K p_{u,k}q_{k,i})=-2e_{ui}p_{u,k}$
这时候，梯度就没有前面的系数了，有了梯度，接下来我们就可以用梯度下降算法更新梯度了：

这里的 η是学习率，控制步长用的，但上面这个有个问题就是当参数很多的时候，就是两个矩阵很大的时候，往往容易陷入过拟合的困境，这时候，就需要在目标函数上面加上正则化的损失，就变成了RSVD，关于RSVD的详细内容，可以参考下面给出的链接，由于篇幅原因，这里不再过多的赘述。但在实际中，单纯的 $\hat{r}_{u,i}=p_{u}^Tq_{i}$ 也是不够的，还要考虑其他的一些因素，比如一个评分系统，有些固有的属性和用户物品无关，而用户也有些属性和物品无关，物品也有些属性和用户无关。因此， Netfix Prize中提出了另一种LFM，在原来的基础上加了偏置项，来消除用户和物品打分的偏差，即预测公式如下：

这个预测公式加入了3项偏置 μ, $b_{u},b_{i}$ , 作用如下：

μ: 训练集中所有记录的评分的全局平均数。在不同网站中，因为网站定位和销售物品不同，网站的整体评分分布也会显示差异。比如有的网站中用户就喜欢打高分，有的网站中用户就喜欢打低分。而全局平均数可以表示网站本身对用户评分的影响。
$b_{u}} : 用户偏差系数，可以使用用户 u给出的所有评分的均值，也可以当做训练参数。这一项表示了用户的评分习惯中和物品没有关系的那种因素。比如有些用户比较苛刻，对什么东西要求很高，那么他评分就会偏低，而有些用户比较宽容，对什么东西都觉得不错，那么评分就偏高
$b_{i}$ : 物品偏差系数，可以使用物品i收到的所有评分的均值，也可以当做训练参数。这一项表示了物品接受的评分中和用户没有关系的因素。比如有些物品本身质量就很高，因此获得的评分相对比较高，有的物品本身质量很差，因此获得的评分相对较低。
加了用户和物品的打分偏差之后，矩阵分解得到的隐向量更能反映不同用户对不同物品的“真实”态度差异，也就更容易捕捉评价数据中有价值的信息，从而避免推荐结果有偏。注意此时的 $S S E$ 会发生变化：
此时如果把 $b_{u},b_{i}$ 当做训练参数的话，那么它俩的梯度是：
$\frac{\partial }{\partial b_{u}}SSE=-e_{ui}+\lambda b_{u} \\ \frac{\partial }{\partial b_{i}}SSE=-e_{ui}+\lambda b_{i}$
更新公式为：
$b_{u}=b_{u}+\eta(e_{u,i}-\lambda b_{u}) \\ b_{i}=b_{i}+\eta(e_{u,i}-\lambda b_{i})$
而对于 $p_{u,k}$ 和 $p_{k,i}$ 导数没有变化，更新公式也没有变化。

6. 编程实现

我们这里用代码实现一下上面的算法来预测上一篇文章里面的那个预测Alice对物品5的评分，看看矩阵分解到底是怎么进行预测或者是推荐的。我把之前的例子拿过来：

任务就是根据这个评分矩阵，猜测Alice对物品5的打分。

在实现SVD之前，先来回忆一下ItemCF和UserCF对于这个问题的做法，首先ItemCF的做法，根据已有的用户打分计算物品之间的相似度，得到物品的相似度矩阵，根据这个相似度矩阵，选择出前K个与物品5最相似的物品，然后基于Alice对这K个物品的得分，猜测Alice对物品5的得分，有一个加权的计算公式。 UserCF的做法是根据用户对其他物品的打分，计算用户之间的相似度，选择出与Alice最相近的K个用户，然后基于那K个用户对物品5的打分计算出Alice对物品5的打分。但是，这两种方式有个问题，就是如果矩阵非常稀疏的话，当然这个例子是个特例，一般矩阵都是非常稀疏的，那么预测效果就不好，因为两个相似用户对同一物品打分的概率以及Alice同时对两个相似物品打分的概率可能都比较小。另外，这两种方法显然没有考虑到全局的物品或者用户，只是基于了最相似的例子，很可能有偏。

那么SVD在解决这个问题上是这么做的：

1.首先，它会先初始化用户矩阵P和物品矩阵Q， P的维度是[users_num, F], Q的维度是[item_nums, F]，这个F是隐向量的维度。也就是把通过隐向量的方式把用户的兴趣和F的特点关联了起来。初始化这两个矩阵的方式很多，但根据经验，随机数需要和 $\frac{1}{\sqrt{F}}$ 成正比。下面代码中会发现。
有了两个矩阵之后，我就可以根据用户已经打分的数据去更新参数，这就是训练模型的过程，方法很简单，就是遍历用户，对于每个用户，遍历它打分的物品，这样就拿到了该用户和物品的隐向量，然后两者相乘加上偏置就是预测的评分，这时候与真实评分有个差距，根据上面的梯度下降就可以进行参数的更新
这样训练完之后，我们就可以得到用户Alice和物品5的隐向量，根据这个就可以预测Alice对物品5的打分。下面的代码的逻辑就是上面这两步，这里使用带有偏置项和正则项的那个SVD算法：

class SVD():
    def __init__(self, rating_data, F=5, alpha=0.1, lmbda=0.1, max_iter=100):
        self.F = F           # 这个表示隐向量的维度
        self.P = dict()          #  用户矩阵P  大小是[users_num, F]
        self.Q = dict()     # 物品矩阵Q  大小是[item_nums, F]
        self.bu = dict()   # 用户偏差系数
        self.bi = dict()    # 物品偏差系数
        self.mu = 0.0        # 全局偏差系数
        self.alpha = alpha   # 学习率
        self.lmbda = lmbda    # 正则项系数
        self.max_iter = max_iter    # 最大迭代次数
        self.rating_data = rating_data # 评分矩阵
        
        # 初始化矩阵P和Q, 方法很多， 一般用随机数填充， 但随机数大小有讲究， 根据经验， 随机数需要和1/sqrt(F)成正比
        cnt = 0    # 统计总的打分数， 初始化mu用
        for user, items in self.rating_data.items():
            self.P[user] = [random.random() / math.sqrt(self.F)  for x in range(0, F)]
            self.bu[user] = 0
            cnt += len(items) 
            for item, rating in items.items():
                if item not in self.Q:
                    self.Q[item] = [random.random() / math.sqrt(self.F) for x in range(0, F)]
                    self.bi[item] = 0
        self.mu /= cnt
        
    # 有了矩阵之后， 就可以进行训练, 这里使用随机梯度下降的方式训练参数P和Q
    def train(self):
        for step in range(self.max_iter):
            for user, items in self.rating_data.items():
                for item, rui in items.items():
                    rhat_ui = self.predict(user, item)   # 得到预测评分
                    # 计算误差
                    e_ui = rui - rhat_ui
                    
                    self.bu[user] += self.alpha * (e_ui - self.lmbda * self.bu[user])
                    self.bi[item] += self.alpha * (e_ui - self.lmbda * self.bi[item])
                    # 随机梯度下降更新梯度
                    for k in range(0, self.F):
                        self.P[user][k] += self.alpha * (e_ui*self.Q[item][k] - self.lmbda * self.P[user][k])
                        self.Q[item][k] += self.alpha * (e_ui*self.P[user][k] - self.lmbda * self.Q[item][k])
                    
            self.alpha *= 0.1    # 每次迭代步长要逐步缩小
    
    # 预测user对item的评分， 这里没有使用向量的形式
    def predict(self, user, item):
        return sum(self.P[user][f] * self.Q[item][f] for f in range(0, self.F)) + self.bu[user] + self.bi[item] + self.mu

下面我建立一个字典来存放数据，之所以用字典，是因为很多时候矩阵非常的稀疏，如果用pandas的话，会出现很多Nan的值，反而不好处理。

# 定义数据集， 也就是那个表格， 注意这里我们采用字典存放数据， 因为实际情况中数据是非常稀疏的， 很少有情况是现在这样
def loadData():
    rating_data={1: {'A': 5, 'B': 3, 'C': 4, 'D': 4},
           2: {'A': 3, 'B': 1, 'C': 2, 'D': 3, 'E': 3},
           3: {'A': 4, 'B': 3, 'C': 4, 'D': 3, 'E': 5},
           4: {'A': 3, 'B': 3, 'C': 1, 'D': 5, 'E': 4},
           5: {'A': 1, 'B': 5, 'C': 5, 'D': 2, 'E': 1}
          }
    return rating_data
 
# 接下来就是训练和预测
rating_data = loadData()
basicsvd = SVD(rating_data, F=10)
basicsvd.train()
for item in ['E']:
    print(item, basicsvd.predict(1, item))
 
## 结果：
E 3.252210242858994

通过这个方式，得到的预测评分是3.25，这个和隐向量的维度，训练次数和训练方式有关，这里只说一下这个东西应该怎么用，具体结果可以不用纠结。

7. 课后思考

矩阵分解算法后续有哪些改进呢?针对这些改进，是为了解决什么的问题呢？请大家自行探索RSVD，消除用户和物品打分偏差等。
矩阵分解的优缺点分析

优点：
– 泛化能力强：一定程度上解决了稀疏问题
– 空间复杂度低：由于用户和物品都用隐向量的形式存放，少了用户和物品相似度矩阵，空间复杂度由 $n^2$ 降到了 (n+m)∗f-
– 更好的扩展性和灵活性：矩阵分解的最终产物是用户和物品隐向量，这个深度学习的embedding思想不谋而合，因此矩阵分解的结果非常便于与其他特征进行组合和拼接，并可以与深度学习无缝结合。
但是，矩阵分解算法依然是只用到了评分矩阵，没有考虑到用户特征，物品特征和上下文特征，这使得矩阵分解丧失了利用很多有效信息的机会，同时在缺乏用户历史行为的时候，无法进行有效的推荐。所以为了解决这个问题， 逻辑回归模型及后续的因子分解机模型，凭借其天然的融合不同特征的能力，逐渐在推荐系统领域得到了更广泛的应用。

原文链接：
推荐系统组队学习之矩阵分解：: http://datawhale.club/t/topic/42

web前端进阶之Javascript设计模式面向对象篇 jia林
前言：在此说明Javascript设计模式所讲内容和知识点来自双越老师（wangEditor富文本开源作者）的视频，内容通俗易懂，受益匪浅，结合自己的学习心得整理成笔记，与大家分享，愿在前端的道路上越走越远.....从“写好代码”到“设计代码”的过程，不仅是技术的提升，更是编程思维的提升，而这其中最关键的就是设计模式，是否理解并掌握设计模式，也是衡量程序员能力的标准之一。学习前提使用过jquery
搜索技巧_野猫学习笔记野猫行天下
自从进入互联网时代，学霸们就越来越霸不了了，因为现在学富五车的人根本干不过会找车的人，你再怎么学富五车，也干不过人家会网络搜索。因此，为了让大家能继续保持学霸的地位，我今天就来跟大家聊聊怎样找车——如何才能利用网络快、准、狠地解决自己的所有问题。01使用专业化、高效的网站什么叫专业化、高效的网站，以了解兰陵王为例，你可以在以下3个网站上搜索，很快就能全方位地了解他（学识力、颜值力、防御力、摧毁力，
于“浦江经验”中解锁“三子”密钥小代不是小袋
“浦江经验”是20年前习近平同志主导创造、身体力行的实践经验，其要义是“变群众上访为领导下访，深入基层，联系群众，真下真访民情，实心实意办事”，是深化干群关系、加强基层治理的生动实践。广大党员干部要深入学习“浦江经验”，扑下身子、钻进“矛盾窝”“群众堆”，“想法子”“迈步子”“揪辫子”，真正顺乎民情、摸透实情、找准症结、干出实效。恪守为民情怀深入群众“想法子”。从人民大会堂到田间地头，从革命老区到
家庭教育指导能力第四天今日复盘104/365 张明杰
家庭教育指导能力第四天今日复盘104/365今天上午上完课后，下午考试，中午把资料看了看，顺便把今天考试的最后一题，如何看待中国家长教育焦虑？先从心理学角度来看这两个概念，对焦虑和家庭焦虑有了新的认识，这是概念性的问题，先定义，再看社会现象，家长的表现形式等。答题思路。结束后，又听义工的分享，吸收大能量。晚上回临沂的火车，买的硬座，明早到达临沂上班。课程上介绍的书还要整理一下，回头好好学习一下。感
2023-09-13 静恒定
致良知线上印证班学习第59天时间：2023年9月13日姓名：地区：志愿：我立志成为一名自省利他致良知的印证者，为实现中华民族伟大复兴而努力奋斗。｜当｜下｜即｜未｜来｜【自省利他致良知】今日功课1、读原文，准时交功课✔：2分2、日行一善✔：2分3、每日自省✔：2分（1）不抱怨，不说谎（2）时刻保持恩悲敬4、读原文、听导读、学习视频、音频课程心得✔:2分感恩阳明先生智慧指引，感恩各位古圣贤榜样引领，感
2021年 1月7日周四漯河市晴成长俱乐部
2021年1月7日周四漯河市晴13：32一，工作准备青年：我该如何重启？苏格拉底：既往不恋，当下不杂，未来不迎。13：43一，正念跑步——该如何更好地专注当下？14：01一，制作公众号二，学习准备14：24一，刻意学习1.书摘这里我有不同的观点：向你学习分两种，第一种是美德行为方面，就如学习孔子，就是把孔子当作榜样；第二种是理论知识方面，就如看一本书，就是参考他人的观点为我所用。我们要知道美德是不
探讨应用层网络协议栈设计-基础篇（一）橙子味虾片网络协议网络系统架构
本篇想从这几个方向聊：整套系统它的受众业务，为何要探讨和学习网络协议栈开发基础知识，各模块角色的定位，为什么要设计这几个模块如何进行设计框架、工作线程模式、各模块如何高效协作本篇探讨和可学习的知识点：基础模块定位线程竞争处理负载均衡设计工作模式设计快慢的分离为什么开启本篇文章：应用层网络协议栈的开发，它是一套通用的解决网络需求的系统，网络需求指的是对网络数据的监控、审计、研判、提取、防护、可视等；
快速排序Java代码简洁实现 SKY技术修炼指南算法
学习过数据结构的同学们都知道，快速排序算法是一种时间复杂度为O(nlogn)的排序算法，在各种排序算法中算是较为高效的方法，企业面试中也经常有手撕快排的环节。本文将阐述算法的基本思想，并用Java代码的形式实现快速排序代码。算法思想快速排序主要采用分治的基本思想，每次将一个位置上的数据归位，此时该数左边的所有数据都比该数小，右边所有的数据都比该数大，然后递归将已归位的数据左右两边再次进行快排，从而
DPDK-并行计算庞叶蒙 DPDK学习并行计算多核处理器超线程亲和性并发指令
0x01缘由继续学习DPDK在并行计算上的优化。对于DPDK的主要应用领域--数据包处理。资源局部优化、避免跨核共享、减少临界区碰撞、加快临界区皖苏完成速率，都不同程度地降低了不可并行部分和并发干扰部分的占比。0x02慨念多核处理器：在一个处理器中集成两个或者多个完整的内核（及计算引擎）。超线程（Hyper-Threading）:在一个处理器中提供两个逻辑执行现场，逻辑线程共享流水线、执行单元和缓
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
数据集标准化:软件2.0的基石工程 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
数据集标准化,软件工程,数据质量,机器学习,人工智能,数据治理,数据可信度1.背景介绍在当今数据爆炸的时代，数据已成为企业和组织的核心资产。然而，海量的原始数据往往杂乱无章，格式不统一，质量参差不齐，这严重阻碍了数据价值的挖掘和应用。数据标准化作为解决这一问题的关键技术，已成为软件2.0时代不可或缺的基石工程。软件2.0时代，人工智能、机器学习等技术蓬勃发展，对数据质量提出了更高的要求。传统的软件
李开复：AI 2.0 时代的意义 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
人工智能，深度学习，Transformer，大模型，通用人工智能，AI2.0，伦理问题，未来趋势1.背景介绍人工智能（AI）技术近年来发展迅速，从最初的局限于特定领域的应用，逐渐发展到能够处理更复杂的任务，甚至展现出一些类似人类智能的能力。2010年以来，深度学习技术的兴起，特别是Transformer模型的出现，为AI发展带来了新的突破。这些模型能够处理海量数据，学习复杂的模式，并在自然语言处理
读懂“浦江经验”中的“解‘题’密码” 小KU2023
8月20日，人民日报全文刊发题为《扑下身子“迎考”沉到一线“解题”——解码“浦江经验”》的报道，深情回顾时任浙江省委书记的习近平同志亲自倡导并带头到基层接访群众形成的“浦江经验”。学思想、见行动。面对新征程新使命、新形势新挑战，广大党员干部要深入学习、深刻领会“浦江经验”，练就“想为”之境界、“敢为”之担当、“善为”之能力，及时把群众的操心事、烦心事、揪心事办成放心事、舒心事、幸福事。学习“浦江经
junit mockito_如何学习Java中的单元测试：JUnit和Mockito课程 dfsgwe1231 单元测试编程语言 python 人工智能 java
junitmockito大家好，今天我将讨论JUnit和单元测试，这是任何软件开发人员的关键技能之一。您可能已经知道JUnit和Mockito是Java应用程序中最受欢迎的两个测试库，并且几乎在每个Java应用程序类路径中都可以找到它们。我经常与Java开发人员见面并一起工作，这些Java开发人员非常了解Java但还没有编写单个单元测试。当我问他们为什么不编写单元测试时，他们提出了许多借口，例如他
动力节点Spring学习笔记-王鹤（一）IOC控制反转架构师指路
Spring框架学习笔记（一）IOC控制反转官方下载地址动力节点spring资料视频观看地址https://www.bilibili.com/video/BV1nz4y1d7uy一、IOC控制反转1.1概述控制反转（IoC，InversionofControl），是一个概念，是一种思想。指将传统上由程序代码直接操控的对象调用权交给容器，通过容器来实现对象的装配和管理。控制反转就是对对象控制权的转移
系统学习图像算法Day.9——OpenCV学习——形态学滤波敏而好学无止境 OpenCV学习图像算法
形态学滤波定义：在我们图像处理中的形态学，往往指的时数学形态学——是一门建立在格论和拓扑学基础上的图像分析学科。形态学基本操作：膨胀、腐蚀膨胀dilate介绍：膨胀就是求局部最大值的操作。从数学角度讲，膨胀就是讲图像与核进行卷积。核与图像卷积，即计算核覆盖的区域的像素点的最大值，并把这个最大值赋值给参考点指定的像素。这样会使图像中的高亮区域逐渐增长。函数调用举例：Matimage=imread("
25岁从零开始学习平面设计，会不会太晚？ 93091cdf8ebb
很多新手小白想学平面设计，但是苦于不知从何处入门、怎么样去学。究竟怎样系统学习平面设计？今天就来谈谈平面设计系统学习的方法。更多学习设计内容关注V公众号广告设计之站了解平面设计平面设计是以“视觉”作为沟通和表现的方式，通过文字、图片等媒介有机结合，借此表达视觉上的讯息。平面设计的分类有很多，如：名片设计、标志设计、字体设计、VI视觉形象设计等等。所以设计师要掌握字体排印、视觉艺术、版面、电脑软件等
2019年陕西中考语文真题“综合性学习”解析悦阅空间
2019年陕西中考语文真题“综合性学习”解析咸阳乾县花口初中王娟新课标指出：综合性学习主要体现为语文知识的综合运用、听说读写能力整体的发展、语文课程与其他课程的沟通、书本学习与实践活动的紧密结合。2019年陕西中考语文“综合性学习”题目，以“我与青春有个约会”为主题，内容丰富，综合性强，活动形式由“写寄语”、“展风采”“、“宣誓言”、“有行动”四部分构成，分别考查了汉字笔顺、口语表达、句子修辞和方
这是一篇不要脸的自采访子不等于我
你日更的目的是为了什么？为了提高自己的逻辑思维和传递信息的能力。写作是把脑中非线性思考转变成线性的表达。高强度的输出会逼迫自己不断加大输入，从而提高知识的转化率，有效地提高学习效率。写作是个系统，从获取到筛选，从存储到提取，再把知识转化成技能一直到变现，每一步都不能偷懒，高质量写作是件有挑战的体力活，喜欢挑战的我不可能会错过。日更会不会降低写作的质量？刚开始时为了完成日更，质量不高很正常，这时需要
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
2023-09-25 2f8923d918d9
体力劳动对于小孩子来说，不仅是获得一定的技能和技巧，也不仅是进行道德教育，而且还是一个广阔无垠的惊人的丰富的思想世界。这个世界激发着儿童的道德的智力的审美的情感，如果没有这些情感，那么认识世界（包括学习）就是不可能的！
学习笔记-C语言：数组+字符串函数一只高傲的鹤 C语言学习笔记学习 c语言开发语言
一维数组1.定义数组：变量名称[元素数量]inta[34]floatb[30]C99之前:元素数量必须是编译时刻确定的字面量，示例如下#includeintmain(){intn,i;//元素n为变量printf("请输入字符串的个数：");scanf("%d",&n);chara[n+1];a[n]='\0';printf("请开始输入字符串：");getchar();for(i=0;iintm
【OpenCV+Cpp】day04图像混合
【OpenCV+Cpp】day04图像混合文章目录【OpenCV+Cpp】day04图像混合前言一、理论——线性混合操作二、相关API三、代码演示前言继续记录C++图像处理的学习过程，学习课件参考B站OpenCV_C++图像处理课程。OpenCV_C++图像处理课程本文分为理论、相关API和代码实现部分。一、理论——线性混合操作图像的线性混合即将两张图像以线性方式混合为一张图像，具体公式如下。以上
conda安装geemap Prophet.Z geemap GEE conda python 深度学习
打个卡，开始学习使用geemap网址：http://geemap.org/installation/conda安装geemap：打开Anacondaprompt终端，输入：condainstallgeemap-cconda-forge吴秋生老师建议创建一个新的conda环境来安装geemap。安装以下命令设置condaenv并按照geemap和pygis，其中包括geemap的所有可选的安装包。c
亲子日记第467篇 wzy知足常乐
2019年6月3日星期一（农历五月初一）天气晴新的一周开始了，祝儿子在新的一周里开心快乐！幸福每一天！吃了早饭，早早下楼，先拍会儿球活动活动筋骨吧！我们娘仨每人一个球，跟儿子学习，一起玩花样篮球。令我没想到的是昨天丫丫还不会拍，今天就能连续拍好几个了。丫丫，加油！你一定会越来越棒的！
有多少宝妈，在年复一年的带娃过程中，选择岁月静好丫丫_3ea7
当我们每天在为生活琐碎忙得团团转的时候，我们就习惯日复一日的重复着这个琐碎，不曾想跳出这个圈子尤其是当宝宝还小的时候，各种闹腾，各种折腾，吃，喝，拉，撒，总有一大堆的事情等着我们去做。前几天在群里就看到这样的讨论一个二胎妈妈，大概三十出几，在抱怨，＂我一个三十几岁的人，整天在家忙着一家大小吃喝拉撒，孩子又小，又会闹又会折腾，等孩子睡着才有一点自己的时间，刷下朋友圈，一整天就过了，哪有时间学习啊，再
87号日精进李佳蔓_ae18
敬爱的李老师，智慧的班主任，亲爱的跃友们：大家好！我是来自北京八分客健康科技有限公司公司的李雪春。今天是我的日精进行动第112天，给大家分享我今天的进步，我们互相勉励，携手前行。每天进步一点点，距离成功便不远。1、比学习：来华之梦学习《薪酬与产值》，菲二的计算方法和原理。2、比改变：自己改变了，周围的一切就都改变了。3、比付出：来华之梦学习，中间解决顾客问题。4、比谦卑：:劳谦虚己,则附之者众;骄
佛系青年的无病呻吟赵剑歌
我，今年21周岁，每天的生活一眼望得到头，不吃早饭成了常态，休班也是用来睡觉，变相的拒绝社交，我这样的人可以被称为佛系青年吗？图片来自于赵剑歌用花呗买的手机18年开始实习的时候，曾天真的想过专接本然后考研，因为岁数越大越觉得学历很重要，很多人在小的时候父母都跟他讲过早好好学习，不然长大后会后悔。不知道别人怎么样，反正我是后悔了。初中沉迷于电子游戏，高中沉迷于各种小说的我，有没有想到今天呢？每天过着
第二期《论语》学习打卡17 暖暖1314
2022年5月17日心得体会：1）最寒冷的时候，才知道松柏是最后才凋谢的。路遥知马力，日久见人心。唯有经历磨难，才能看到坚毅之力是如何的强大，相伴之人是如何地用心竭力。2）追求的至高境界是：做有智慧的人而不受惑于外物，做仁慈的人而不忧愁，做有勇气的人而不畏惧。智慧、仁义、勇气，值得毕生去探索和追寻。3）求学的四个阶段是：入门学习；立志于求道；守道义，以道立世、立身；能守道亦能懂得通达权变却又不逾矩
开启富而喜悦的人生，从成长、自律开始！ yy财富姐姐
今天是2021年3月6日，是我学习成长1000天打卡的第414天。今天继续学习《秘密》人类最重要的资产是头脑笑是最佳良药。卡西.古德曼，个人故事。我被诊断出患乳腺癌，但我以强烈的信心，真的在心中相信我已经痊愈了，每天我都会说:″感谢我已经好了"，一直持续不断的说:″感谢我已经好了"。我内心相信我已经痊愈，我看待自己，有如身体从来没有换过癌症一般。我自我疗愈的方法之一，就是去看喜剧电影，一直笑啊笑的
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方