winone361

***基于协同过滤，NMF和Baseline的推荐算法

摘要老早就想整理一篇推荐算法的入门博文，今天抽空写一下。本文以电影推荐系统为例，简单地介绍基于协同过滤，PMF概率矩阵分解，NMF非负矩阵分解和Baseline的推荐系统算法。NMF的实现具体可以参考Reference中的「基于矩阵分解的推荐算法，简单入门」一文，对我启发很大。

推荐算法协同过滤矩阵分解

目录[-]

杂谈

基于协同过滤的推荐算法

User-based的推荐算法

Item-based的推荐算法

SVD和PMF概率矩阵分解

基于NMF非负矩阵分解的推荐算法

基于Baseline的推荐算法

后记

Reference

杂谈

老早就想整理一篇推荐算法的入门博文，今天抽空写一下。本文以电影推荐系统为例，简单地介绍基于协同过滤，PMF概率矩阵分解，NMF非负矩阵分解和Baseline的推荐系统算法。NMF的实现具体可以参考Reference中的「基于矩阵分解的推荐算法，简单入门」一文，对我启发很大。

基于协同过滤的推荐算法

什么是协同过滤？协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF)，首先想一个简单的问题，如果你现在想看个电影，但你不知道具体看哪部，你会怎么做？大部分的人会问问周围的朋友，看看最近有什么好看的电影推荐，而我们一般更倾向于从口味比较类似的朋友那里得到推荐；或者，搜索与你喜欢的电影同类型的电影推荐。

User-based的推荐算法

如上图，我们收集到用户-电影评价矩阵，假设用户A对于物品D的评价为null，这时我们对比用户A、用户B、用户C的特征向量（以物品评价为特征），可以发现用户A与用户C的相似度较大，这时我们可以认为，对于用户C喜欢的物品D，用户A也应该喜欢它，这是就把物品D推荐给用户A。

Item-based的推荐算法

同理，我们对比物品A、物品B、物品C的特征向量（以用户对该物品的喜欢程度为特征），发现物品A与物品C很像，就把用品C推荐给喜欢物品A的用户C。

SVD和PMF概率矩阵分解

在实际业务场景中，user-Item矩阵有可能非常稀疏，存储率有可能连1%都达不到。怎么办呢？通常使用矩阵分解算法来提取出更有用的信息。SVD在矩阵分解方面可以参考基于SVD实现PCA的图像识别一文，把它分解成用户矩阵（左奇异特征向量矩阵）和物品矩阵（右奇异特征向量矩阵）分别代表各自的特性。

但是SVD算法的时间复杂度很大，不适合用来解决这种比数据量较大的问题，这时就有PMF概率矩阵分解。把用户-电影评分看成一个矩阵，r_ui表示u对电影i的评分，于是电影评分矩阵可以这样来估计：

其中P和Q就相当于SVD中的前k 个特征向量构成的矩阵，分别描述user-based和item-based。在PMF中使用SGD（随机梯度下降）进行优化时，使用如下的迭代公式：

我们把证明放到下一章节 NMF非负矩阵分解，NMF其实就是在PMF的基础上加入一点约束，具体约束公式如下：

基于NMF非负矩阵分解的推荐算法

我们知道，要做推荐系统，最基本的一个数据就是，用户-物品的评分矩阵，如下图所示：

矩阵中，描述了5个用户(U1,U2,U3,U4 ,U5)对4个物品(D1,D2,D3,D4)的评分(1-5分)，“-” 表示没有评分，现在目的是把没有评分的给预测出来，然后按预测的分数高低，给用户进行推荐。

如何预测缺失的评分呢？对于缺失的评分，可以转化为基于机器学习的回归问题，也就是连续值的预测，对于矩阵分解有如下式子，R是类似图的评分矩阵，假设N*M维(N表示行数，M表示列数)，可以分解为P跟Q矩阵，其中P矩阵维度N*K，P矩阵维度K*M。

对于P,Q矩阵的解释，直观上，P矩阵是N个用户对K个主题的关系，Q矩阵是K个主题跟M个物品的关系，至于K个主题具体是什么，在算法里面K是一个参数，需要调节的，通常10~100之间。

对于上式的左边项，表示的是R^ 第i 行，第j 列的元素值，对于如何衡量矩阵分解的好坏，我们给出如下风险函数：

有了风险函数，我们就可以采用梯度下降法不断地减小损失值，直到不能再减小为止，最后的目标，就是每一个元素(非缺失值)的e(i,j)的总和最小。我们可以得到如下梯度以及p、q的更新方式（其中α是学习步长，详见李航《统计机器学习》）：

在训练p、q参数过程中，为了防止过拟合，我们给出一个正则项，风险函数修改如下：

相应的p、q参数学习更新方式如下：

至此，我们就可以学习出p、q矩阵，将p x q就可以得到新的估计矩阵，由于加入了非负处理（缺失值部分的处理），我们可以发现原先缺失的地方有了一个估计值，这个估计值就作为了推荐的分值（其实就是拿非缺失值部分作参数学习训练，学习出来的结果当然不会有负数）。NMF实现代码如下：

 
     ? 
    
          package  
          nmf; 
         
          public  
          class  
          Nmf { 
         
          public  
          double 
          [][] RM, PM, QM; 
         
          public  
          int  
          Kc, Uc, Oc; 
         
          public  
          int  
          steps; 
         
          public  
          double  
          Alpha, Beta; 
         
          public  
          void  
          run() { 
         
          for  
          ( 
          int  
          s =  
          0 
          ; s < steps; s++) { 
         
          // 梯度下降更新 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Oc; j++) { 
         
          if  
          (RM[i][j] >  
          0 
          ) { 
         
          // 计算eij 
         
          double  
          e =  
          0 
          , pq =  
          0 
          ; 
         
          for  
          ( 
          int  
          k =  
          0 
          ; k < Kc; k++) { 
         
          pq += PM[i][k] * QM[k][j]; 
         
          } 
         
          e = RM[i][j] - pq; 
         
          // 更新Pik和Qkj，同时保证非负 
         
          for  
          ( 
          int  
          k =  
          0 
          ; k < Kc; k++) { 
         
          PM[i][k] += Alpha 
         
          * ( 
          2  
          * e * QM[k][j] - Beta * PM[i][k]); 
         
          // PM[i][k] = PM[i][k] > 0 ? PM[i][k] : 0; 
         
          QM[k][j] += Alpha 
         
          * ( 
          2  
          * e * PM[i][k] - Beta * QM[k][j]); 
         
          // QM[k][j] = QM[k][j] > 0 ? QM[k][j] : 0; 
         
          } 
         
          } 
         
          } 
         
          } 
         
          // 计算风险损失 
         
          double  
          loss =  
          0 
          ; 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Oc; j++) { 
         
          if  
          (RM[i][j] >  
          0 
          ) { 
         
          // 计算eij^2 
         
          double  
          e2 =  
          0 
          , pq =  
          0 
          ; 
         
          for  
          ( 
          int  
          k =  
          0 
          ; k < Kc; k++) { 
         
          pq += PM[i][k] * QM[k][j]; 
         
          } 
         
          e2 = Math.pow(RM[i][j] - pq,  
          2 
          ); 
         
          for  
          ( 
          int  
          k =  
          0 
          ; k < Kc; k++) { 
         
          e2 += Beta 
         
          /  
          2 
         
          * (Math.pow(PM[i][k],  
          2 
          ) + Math.pow( 
         
          QM[k][j],  
          2 
          )); 
         
          } 
         
          loss += e2; 
         
          } 
         
          } 
         
          } 
         
          if  
          (loss <  
          0.01 
          ) { 
         
          System.out.println( 
          "OK" 
          ); 
         
          break 
          ; 
         
          } 
         
          // if (s % 100 == 0) { 
         
          // System.out.println(loss); 
         
          // } 
         
          } 
         
          } 
         
          public  
          Nmf( 
          double 
          [][] RM,  
          double 
          [][] PM,  
          double 
          [][] QM,  
          int  
          Kc,  
          int  
          Uc, 
         
          int  
          Oc,  
          int  
          steps,  
          double  
          Alpha,  
          double  
          Beta) { 
         
          this 
          .RM = RM; 
         
          this 
          .PM = PM; 
         
          this 
          .QM = QM; 
         
          this 
          .Kc = Kc; 
         
          this 
          .Uc = Uc; 
         
          this 
          .Oc = Oc; 
         
          this 
          .steps = steps; 
         
          this 
          .Alpha = Alpha; 
         
          this 
          .Beta = Beta; 
         
          } 
         
          }

 
     ? 
    
          package  
          nmf; 
         
          import  
          java.util.Scanner; 
         
          public  
          class  
          Keyven { 
         
          public  
          static  
          void  
          main(String[] args) { 
         
          int  
          Uc =  
          5 
          , Oc =  
          4 
          , Kc =  
          2 
          ; 
         
          double 
          [][] RM =  
          new  
          double 
          [Uc][Oc]; 
         
          double 
          [][] PM =  
          new  
          double 
          [Uc][Kc]; 
         
          double 
          [][] QM =  
          new  
          double 
          [Kc][Oc]; 
         
          /* 
         
          * 5 3 0 1 4 0 0 1 1 1 0 5 1 0 0 4 0 1 5 4 
         
          */ 
         
          Scanner input =  
          new  
          Scanner(System.in); 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Oc; j++) { 
         
          RM[i][j] = input.nextDouble(); 
         
          } 
         
          } 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Oc; j++) { 
         
          System.out.printf( 
          "%.2f\t" 
          , RM[i][j]); 
         
          } 
         
          System.out.println(); 
         
          } 
         
          System.out.println(); 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Kc; j++) { 
         
          PM[i][j] = Math.random() %  
          9 
          ; 
         
          } 
         
          } 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Kc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Oc; j++) { 
         
          QM[i][j] = Math.random() %  
          9 
          ; 
         
          } 
         
          } 
         
          // 最多迭代5000次，学习步长控制为0.002，正则项参数设置为0.02 
         
          Nmf nmf =  
          new  
          Nmf(RM, PM, QM, Kc, Uc, Oc,  
          5000 
          ,  
          0.002 
          ,  
          0.02 
          ); 
         
          nmf.run(); 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Oc; j++) { 
         
          double  
          temp =  
          0 
          ; 
         
          for  
          ( 
          int  
          k =  
          0 
          ; k < Kc; k++) { 
         
          temp += PM[i][k] * QM[k][j]; 
         
          } 
         
          System.out.printf( 
          "%.2f\t" 
          , temp); 
         
          } 
         
          System.out.println(); 
         
          } 
         
          input.close(); 
         
          } 
         
          }

实验结果：

基于Baseline的推荐算法

要评估一个策略的好坏，就需要建立一个对比基线，以便后续观察算法效果的提升。此处我们可以简单地对推荐算法进行建模作为基线。假设我们的训练数据为： <user, item, rating>三元组，其中user为用户id， item为物品id(item可以是MovieLens上的电影，Amazon上的书，或是百度关键词工具上的关键词), rating为user对item的投票分数，其中用户u对物品i的真实投票分数我们记为rui，基线(baseline)模型预估分数为bui，则可建模如下：

其中mu（希腊字母mu）为所有已知投票数据中投票的均值，bu为用户的打分相对于平均值的偏差（如果某用户比较苛刻，打分都相对偏低，则bu会为负值；相反，如果某用户经常对很多片都打正分，则bu为正值）； bi为该item被打分时，相对于平均值得偏差，可反映电影受欢迎程度。 bui则为基线模型对用户u给物品i打分的预估值。该模型虽然简单，但其中其实已经包含了用户个性化和item的个性化信息，而且特别简单（很多时候，简单就是一个非常大的特点，特别是面对大规模数据时）。

基线模型中， mu可以直接统计得到，我们的优化函数可以写为（其实就是最小二乘法）：

也可以直接写成如下式子，因为它本身就是经验似然：

上述式子中u∈R(i) 表示评价过电影 i 的所有用户，|R(i)| 为其集合的个数；同理，i∈R(u) 表示用户 u 评价过的所有电影，|R(u)| 为其集合的个数。实现代码如下：

 
     ? 
    
          package  
          baseline; 
         
          public  
          class  
          Baseline { 
         
          public  
          double 
          [] bi, bu; 
         
          public  
          double 
          [][] RM; 
         
          public  
          int  
          Uc, Ic; 
         
          public  
          double  
          lamada2, lamada3; 
         
          public  
          Baseline( 
          double 
          [][] RM,  
          int  
          Uc,  
          int  
          Ic,  
          double  
          lamada2, 
         
          double  
          lamada3) { 
         
          this 
          .RM = RM; 
         
          this 
          .lamada2 = lamada2; 
         
          this 
          .lamada3 = lamada3; 
         
          this 
          .Uc = Uc; 
         
          this 
          .Ic = Ic; 
         
          this 
          .bu =  
          new  
          double 
          [Uc]; 
         
          this 
          .bi =  
          new  
          double 
          [Ic]; 
         
          } 
         
          public  
          void  
          run() { 
         
          // 计算μ 
         
          double  
          avg =  
          0 
          ; 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Ic; j++) { 
         
          avg += RM[i][j]; 
         
          } 
         
          } 
         
          avg = avg / Uc / Ic; 
         
          // 更新bi 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Ic; i++) { 
         
          double  
          bis =  
          0 
          ; 
         
          int  
          Icnt =  
          0 
          ;  
          // 点评过电影i的所有User个数 
         
          for  
          ( 
          int  
          tu =  
          0 
          ; tu < Uc; tu++) { 
         
          if  
          (RM[tu][i] !=  
          0 
          ) { 
         
          bis += RM[tu][i] - avg; 
         
          Icnt++; 
         
          } 
         
          } 
         
          bi[i] = bis / (( 
          double 
          )Icnt + lamada2); 
         
          } 
         
          // 更新bu 
         
          for  
          ( 
          int  
          u =  
          0 
          ; u < Uc; u++) { 
         
          double  
          bus =  
          0 
          ; 
         
          int  
          Ucnt =  
          0 
          ;  
          // 用户u点评过得电影Item个数 
         
          for  
          ( 
          int  
          ti =  
          0 
          ; ti < Ic; ti++) { 
         
          if  
          (RM[u][ti] !=  
          0 
          ) { 
         
          bus += RM[u][ti] - avg - bi[ti]; 
         
          Ucnt++; 
         
          } 
         
          } 
         
          bu[u] = bus / (( 
          double 
          )Ucnt + lamada3); 
         
          } 
         
          for  
          ( 
          int  
          u =  
          0 
          ; u < Uc; u++) { 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Ic; i++) { 
         
          if  
          (RM[u][i] ==  
          0 
          ) { 
         
          RM[u][i] = avg + bi[i] + bu[u]; 
         
          } 
         
          } 
         
          } 
         
          } 
         
          }

 
     ? 
    
          package  
          baseline; 
         
          import  
          java.util.Scanner; 
         
          public  
          class  
          Keyven { 
         
          public  
          static  
          void  
          main(String[] args) { 
         
          int  
          Uc =  
          5 
          , Ic =  
          4 
          ; 
         
          double 
          [][] RM =  
          new  
          double 
          [Uc][Ic]; 
         
          /* 
         
          * 5 3 0 1 4 0 0 1 1 1 0 5 1 0 0 4 0 1 5 4 
         
          */ 
         
          Scanner input =  
          new  
          Scanner(System.in); 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Ic; j++) { 
         
          RM[i][j] = input.nextDouble(); 
         
          } 
         
          } 
         
          Baseline bl =  
          new  
          Baseline(RM, Uc, Ic,  
          0 
          ,  
          0 
          ); 
         
          bl.run(); 
         
          for  
          ( 
          int  
          i =  
          0 
          ; i < Uc; i++) { 
         
          for  
          ( 
          int  
          j =  
          0 
          ; j < Ic; j++) { 
         
          System.out.printf( 
          "%.2f\t" 
          , RM[i][j]); 
         
          } 
         
          System.out.println(); 
         
          } 
         
          input.close(); 
         
          } 
         
          }

Baseline基线模型与NMF矩阵分解模型试验效果对比如下：

后记

什么是梯度下降？考虑下图一种简单的情形，风险函数为loss = kx，则总体损失就是积分∫kx dx，取梯度的反方向进行逐步更新至总体损失减小… …在我看来，其实，数据挖掘 = ①线性代数+②应用概率统计+③高数（积分、梯度等数理意义）+④李航《统计机器学习》神书+⑤算法与数据结构… …只要好好努力打好基础，人就能不断向前走下去^_^

Reference

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

百度电影推荐系统比赛小结 ——记我的初步推荐算法实践

白话NMF(Non-negative Matrix Factorization)

基于矩阵分解的推荐算法，简单入门（证明算法，非常有用！）

SVD因式分解实现协同过滤-及源码实现

探索推荐引擎内部的秘密，第 2 部分: 深入推荐引擎相关算法 - 协同过滤

推荐系统中近邻算法与矩阵分解算法效果的比较——基于movielens数据集

你可能感兴趣的:(***基于协同过滤，NMF和Baseline的推荐算法)

如何实现一个apply函数？风茫 Javascript javascript apply
在JavaScript中，apply是一个非常有用的方法，它允许你调用一个函数，并显式地指定该函数内部的this值。与call方法不同，apply方法接受参数的方式是一个数组或类数组对象。我们将手动实现一个类似apply的函数，以深入理解其工作原理。实现步骤1.定义myApply方法首先，我们需要在Function.prototype上定义一个新的方法myApply，这样所有的函数都可以调用它。F
SMOTE算法的改进与扩展 Java 第一深情不平衡数据分类机器学习人工智能
一、SMOTE的改进算法1、Boderline-SMOTE只考虑分布在分类边界附近的少数类样本，并将其作为根样本首先通过k-NN方法将原始数据中的少数类样本划分成“Safe”、“Danger”和“Noise”3类，其中“Danger”类样本是指靠近分类边界的样本。对属于“Danger”类少数类样本进行过采样，可增加用于确定分类边界的少数类样本。这样做可以增加这些关键区域的少数类样本数量，使得模型在
C++多线程 -- std::thread的基本用法 qzy0621 C++多线程 c++
依赖头文件：#include用法：std::thread和join或detach一起用std::threadt1(调用函数名称，调用函数参数1，调用函数参数2，。。。，调用函数参数n)t1.join();//表示同步（阻塞），调用线程走完，才能走后面的流程t1.detach();//表示异步，主线程只触发此线程，后面和此线程无关多线程传递参数#include#includevoidshow(con
c/c++读写照片、传输文件方式 qzy0621 C++笔记 c++
c/c++读写照片、传输文件方式运行库调用API调用ifstream和ofstream实现（只要是文件即可用）测量耗时时间可用计时器:StopWach链接运行库接口内部实现是对API的调用，如：std::fopen实际调用的API：CreateFilestd::fread实际调用的API：ReadFilestd::fwrite实际调用的API：WriteFile运行库调用seekg（）对文件定位，
TCP/IP学习笔记(5) --IP选路 ox0080 Linux 网络 linux网络
静态IP选路一个简单的路由表选路是IP层最重要的一个功能之一。前面的部分已经简单的讲过路由器是通过何种规则来根据IP数据包的IP地址来选择路由。这里就不重复了。首先来看看一个简单的系统路由表。命令:routeprint|more对于一个给定的路由器，可以打印出五种不同的flag。U表明该路由可用。G表明该路由是到一个网关。如果没有这个标志，说明和Destination是直连的，而相应的Gatewa
Chapter 4-16. Troubleshooting Congestion in Fibre Channel Fabrics mounter625 Linux kernel 服务器运维 linux kernel
ShowFCSIeExample4-17showstheNX-OScommandshowfcsieonCiscoMDSswitches.例4-17显示了CiscoMDS交换机上的NX-OS命令showfcsie。Example4-17NX-OScommandshowfcsieonCiscoMDSswitchesMDS9706-C#showfcsieIEListforVSAN:20---------
C语言之内存函数从未止步.. c语言 c语言 c++开发语言
在此之间，我们学过许多的字符函数，例如strcpy,strstr,strcmp等等，这里我们以strcpy函数进行举例：//实现将arr1拷贝到arr2中intmain(){intarr1[5]={1,2,
基于STC89C52的温度检测系统(DS18B20) @小张要努力嵌入式硬件 51单片机单片机 proteus mcu
引言在现代电子应用中，温度检测系统扮演着至关重要的角色。从工业生产到日常生活，准确的温度监测为各种设备的稳定运行和环境调控提供了有力保障。本文将介绍一种基于STC89C52单片机的温度检测系统，该系统利用DS18B20温度传感器进行温度数据采集，并通过LCD1602液晶显示屏实时显示温度数值。同时，借助Proteus仿真软件对整个系统进行设计与验证，确保其可行性和稳定性。系统硬件设计STC89C5
动态规划 43. 最长回文子序列 Mophead_Zarathustra 小白的代码随想录刷题笔记 Mophead的小白刷题笔记 leetcode python 代码随想录动态规划
动态规划43.最长回文子序列516.最长回文子序列-力扣（LeetCode）代码随想录难度5-中等太难了，依然不会做。看完题解只觉得恍然大悟原来如此，但是不看直接做就感觉定义和递推就跟挤牙膏一样挤不出，挤出来了也不一定对。与动态规划42.回文子串-CSDN博客要形成对比注意本题中，子序列的要求是：不一定连续思路：（摘录、修改自代码随想录）dp定义：（重要，因为这道题求的是长度，而不是回文子序列个数
字符函数和字符串函数很会做人算法
一、字符分类函数头文件是#include下面是函数的使用条件，有x的就代表只要符合体条件就返回真我们以islower为例写一段代码实现一下功能:将小写字符改成大写字符#define_CRT_SECURE_NO_WARNINGS#include#includeintmain(){inti=0;chararr[20]={"aJsfjsJsfH"};while(arr[i]!='\0'){if(islo
深入理解指针5 很会做人数据结构
一、回调函数是什么？回调函数就是一个通过指针调用的函数。如果你把函数的指针（地址）作为参数传递给另一个函数，当这个指针被用来调用其所指向的函数时，被调用的函数就是回调函数。回调函数不是由该函数的实现方直接调用，而是在特定的事件或条件发生时由另外的一方调用的，用于对该事件或条件进行响应。下面用代码进行理解当a等于1的时候才会打印hehe。#includevoidfunction(){printf("
JVM 深入浅出：一文看懂 JVM 内存结构 kkkllllss spring Java Java架构 spring boot spring redis java 架构
文章目录1.概述2.程序计数器3.Java虚拟机栈3.1.栈深度3.2.栈帧3.2.1.局部变量表3.2.2.操作数栈3.2.3.动态链接3.2.4.方法正常结束3.2.5.方法异常结束4.堆5.方法区5.1.去永久代过程6.运行时常量池7.本地方法栈8.参考资料1.概述JVM把内存进行了划分，不同的内存区域有不同的功能。有的内存区域是线程私有的，比如Java虚拟机栈、本地方法栈和程序计数器，每一
深入浅出JVM(一)---两种环境杨洪波 Java jvm java class api 语言引擎
如果你想真正掌握JAVA技术,请首先记住它的四个组成部分:JAVA语言,class文件格式,JVM和JAVAAPI.如果你说你学过JAVA,那么,你已经知道了,JAVA有两个环境:编译环境和运行环境.好,我们分别讨论.1)编译环境编译环境是什么?如果你装了JDK,那么,你的D:/j2sdk1.4.2目录下的所有东西,就是你的JAVA编译环境.编译环境的工作流程如下:你利用JAVA语言规范,或利用J
利用 HAI 平台进行 DeepSeek 模型训练的详细指南
摘要本文旨在为非专业用户提供在HAI平台上进行DeepSeek模型训练的详细步骤。从创建项目、上传数据集、配置训练参数到启动训练任务并监控训练过程，本文将逐步指导用户完成整个流程。此外，本文还包含可运行的示例代码模块和相关章节配图，以帮助用户更好地理解和操作。引言HAI（HyperAI）平台是一个强大的AI模型训练平台，但对于非专业用户来说，其复杂性可能会成为使用的障碍。本文将详细介绍如何在HAI
基于oracle linux的 DBI/DBD 标准化安装文档(三) oracle
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
FerretDB 2.0：开源 MongoDB 替代品的安装与使用指南田猿笔记 MongoDB 开源数据库 FerretDB
介绍FerretDB2.0是一个开源数据库，旨在作为MongoDB的替代品。它与MongoDB5.0+的驱动程序和工具兼容，适合需要避免MongoDB许可复杂性的开发者。它的核心特点是使用PostgreSQL作为后端，并通过DocumentDB扩展提升性能，研究表明某些工作负载可快20倍。安装与使用安装FerretDB2.0使用dockercompose需要以下步骤：创建docker-compos
LORA的魔法棒：在Stable Diffusion中挥洒注意力机制的优化咒语 ?? DTcode7 AI生产力 AI AIGC stable diffusion AI生产力前沿
LORA的魔法棒：在StableDiffusion中挥洒注意力机制的优化咒语??欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐：DTcode7的博客首页。一个做过前端开发的产品经理，经历过睿智产品的折磨导致脱发之后，励志要翻身农奴把歌唱，一边打入敌人内部一边持续提升自己，为我们广大开发同胞
Pycharm2018 激活 Deng.Pan Software activation Pycharm Pycharm Patch
测试条件：WIN10+JetBrainsPyCharm2018.2.2x64使用破解补丁激活方式可以使用很久。下载附件JetbrainsCrack-3.1-release-enc.jar，并放置到pycharm安装目录的\bin目录下，其实位置可随意，只要配置时文件填写对应的路径即可。找到Pycharm安装目录的\bin目录下找到pycharm.exe.vmoptions和pycharm64.ex
Debian/Ubuntu清理硬盘空间
在Debian/Ubuntu系统上清理硬盘空间的步骤在Debian或Ubuntu系统中，随着使用时间的增加，系统可能会逐渐积累大量的临时文件、软件包缓存、日志文件等，这些都可能导致硬盘空间的消耗。为了保持系统的高效运行，定期清理硬盘空间是必要的。下面将详细说明如何通过多种方式清理系统硬盘空间。1.删除不需要的软件包系统中安装的某些软件包在不再需要时，应该及时卸载，以释放空间。使用以下命令卸载不再需
@RequestParam、@RequestBody、@PathVariable YUELEI118 Java springboot
1.@RequestParam@RequestParam：get请求时如果用不到它的3个属性，可以省略；其他请求如果是通过param传送数据，必须使用该注释要点：可用于任何类型的请求（get请求数据在请求行中，post请求数据在请求体中）无论时在请求行还是请求体，格式都是：[email protected]属性v
华为云认证 - 云学堂「集证」有礼天氰色等烟雨华为云
华为云最近又出了一个新活动，我看了一下，奖励比上次的要好很多，本来不想搞的，这下不得不考虑一下了~还是一样，得先报名才能参与活动！特别提醒一下，企业账号是不能参加这次活动的，大家要用个人账户来报名。按以往的经历，不是实名认证的账号也可以参与进来。活动地址如下：DeveloperEvents_DeveloperAlliance-HuaweiCloudMeetlike-mindeddevelopers
使用vscode连接到华为云WordPress服务器北洋水师总督 vscode 华为云服务器
1.在vscode中安装扩展Remote-ssh2.连接到华为云服务器打开ssh按下Ctrl+Shift+P快捷键，出现窗口选择其中的Remote-SSH：ConnecttoHost输入远程主机的IP地址，前加root@。[email protected]输入密码，等待配置完成。连接成功
关于pycharm2024.3配置conda环境的问题解决 Cachezzz conda pycharm
开发搞了这么多年，已经很久没被环境的问题恶心到了，一点配置项来来回回改改个毛啊？啊？啊？啊？啊？啊？？？？？？？？？吐槽一下。那么进入正题：pycharm2024.3里面添加conda怎么弄？一、conda的问题为什么我的conda安装在【D】盘但是虚拟环境是安装在【C】盘？1.配置一下c盘的【.condarc】文件，打开，输入：envs_dirs:-D:\dev\Anaconda3-2024.6
力扣SQL题记录（持续） Dxecozy leetcode sql
此贴用于个人写SQL题记录，主要是用于记录新的知识和一些个人觉得的难题思路，便于复习目录Leetcode高频SQL50题基本题基本条件筛选多表连接新知识CHAR_LENGTH()函数的使用，用于计算字符长度Leetcode高频SQL50题基本题基本条件筛选1757.可回收且低脂的产品584.寻找用户推荐人595.大的国家1148.文章浏览I多表连接1378.使用唯一标识码替换员工ID新知识CHAR
【AI Agent教程】各种Agent开发框架都是如何实现ReAct思想的？深入源码学习一下同学小张大模型人工智能学习笔记经验分享 AIGC AI Agent ReAct
大家好，我是同学小张，持续学习C++进阶知识和AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，共同学习和进步。驱动大模型有很多种方式，例如纯Prompt方式、思维链方式、ReAct方式等。ReAct方式是AIAgent最常用的实现思路之一，它强调在执行任务时结合推理（Reasoning）和行动（Acting）两个方面，使得Agent能够在复杂和动态的环境中更有效地工作。本文我们来看看常用的那
【设计模式】建造者模式浅慕Antonio 设计模式设计模式建造者模式 c++
三、建造者模式3.3建造者模式建造者(Builder)模式也称构建器模式、构建者模式或生成器模式，同工厂模式或原型模式一样，也是一种创建型模式。建造者模式比较复杂，不太常用，但这并不表示不需要了解和掌握该模式。建造者模式通常用来创建一个比较复杂的对象(这也是建造者模式本身比较复杂的主要原因),该对象的构建一般是需要按一定顺序分步骤进行的。例如，建造一座房子(无论是平房、别墅还是高楼),通常都需要按
图片压缩及水印添加概述华为云微认证大嘴巴子华为网络技术华为华为云网络
一、图片压缩和水印添加概述（1）为更好地传输，存储和辨识数据；使用压缩降低图片大小，节约了成本；图片压缩：简单易用；；图片压缩软件：功能单一；网页在线图片压缩；自设图片压缩代码：需要变成基础；使用云服务批量压缩：适合批量处理，可结合自设代码；（2）水印：logo增加辨识，盖章表示版权；附加信息，可增加了地点等信息；二、函数工作流简介（1）是华为云提供的一款无服务器计算服务，它包含了函数和工作流两个
五、AIGC大模型_09手动实现ReAct_Agent 学不会lostfound AI 人工智能 react_agent LangGraph Multi-Agent PlanAndExecute AIGC
0、前言在上一章节中，我们了解到：create_react_agent是LangGraph提供的一个预构建方法（fromlanggraph.prebuiltimportcreate_react_agent），它可以将语言模型（LLM）和一组工具（Tools）结合起来，创建一个能够根据用户输入自动调用工具的智能代理，这个代理可以根据用户的请求，决定是否需要调用某个工具，并将工具的输出反馈给用户这个函
计算机网络进化论：从比特流到量子通信的深层解构 ox0080 #北漂+滴滴出行 VIP 激励网络计算机网络
第一章物理媒介与链路层（1960-1970）1.1比特流物理编码//曼彻斯特编码实现vectormanchester_encode(uint8_tbyte){vectorbits;for(inti=7;i>=0;--i){boolbit=(byte>>i)&1;bits.push_back(bit);//前半周期bits.push_back(!bit);//后半周期}returnbits;}物理层
基于STC89C52的CD4511译码显示数字设计 @小张要努力单片机嵌入式硬件 51单片机 proteus mcu
摘要本文深入探讨基于STC89C52单片机的数字显示系统设计，剖析CD4511译码驱动芯片工作原理，结合Proteus仿真验证功能。通过硬件电路、软件编程及原理分析，完整呈现单片机控制数码管显示的实现过程，为相关开发提供理论与实践参考。一、引言在单片机应用中，数码管显示是基础模块。CD4511作为BCD码译码驱动芯片，可简化单片机与数码管接口设计。STC89C52凭借丰富资源与稳定性能，成为驱动C
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l