Dark_Scope

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

〇.说明

本文的所有代码均可在 DML 找到，欢迎点星星。

一.引入

推荐系统（主要是CF）是我在参加百度的电影推荐算法比赛的时候才临时学的，虽然没拿什么奖，但是知识却是到手了，一直想写一篇关于推荐系统的文章总结下，这次借着完善DML写一下，权当是总结了。不过真正的推荐系统当然不会这么简单，往往是很多算法交错在一起，本文只是入门水平的总结罢了。（本文所用测试数据是movielens100k）

本文采用的评测标准是RMSE，数值越小算法越好，在movielens100k 的 u1数据上对每个要求预测的评分输出训练集总的平均分，其RMSE是：

二.Item Based and User Based

1.原理

Item-based和User-Based是CF算法中最基础的两个了，其算法思想很intuitive：

User-based就是把与你有相同爱好的用户所喜欢的物品(并且你还没有评过分)推荐给你

（图自【1】）

Item-based则与之相反，把和你之前喜欢的物品近似的物品推荐给你：

（图自【1】）

更一般的，我们此次使用的数据集是要求你预测某个用户对某个item的评分，以Item-based为例，使用上面提到的算法思想就是检测该用户评过的所有物品和待预测物品的相似度，而两个物品的相似度我们可以找出所有同时对两个物品进行评价的评分，然后计算其皮尔逊相似度，按照相似度计算加权平均值即可，具体过程可以看下面的实现（和《集体智慧编程》中的类似）

2.实现

from __future__ import division
import numpy as np
import scipy as sp
class  Item_based_C:
	def __init__(self,X):
		self.X=np.array(X)
		print "the input data size is ",self.X.shape
		self.movie_user={}
		self.user_movie={}
		self.ave=np.mean(self.X[:,2])
		for i in range(self.X.shape[0]):
			uid=self.X[i][0]
			mid=self.X[i][1]
			rat=self.X[i][2]
			self.movie_user.setdefault(mid,{})
			self.user_movie.setdefault(uid,{})
			self.movie_user[mid][uid]=rat
			self.user_movie[uid][mid]=rat
		self.similarity={}
		pass
	def sim_cal(self,m1,m2):
		self.similarity.setdefault(m1,{})
		self.similarity.setdefault(m2,{})
		self.movie_user.setdefault(m1,{})
		self.movie_user.setdefault(m2,{})
		self.similarity[m1].setdefault(m2,-1)
		self.similarity[m2].setdefault(m1,-1)

		if self.similarity[m1][m2]!=-1:
			return self.similarity[m1][m2]
		si={}
		for user in self.movie_user[m1]:
			if user in self.movie_user[m2]:
				si[user]=1
		n=len(si)
		if (n==0):
			self.similarity[m1][m2]=1
			self.similarity[m2][m1]=1
			return 1
		s1=np.array([self.movie_user[m1][u] for u in si])
		s2=np.array([self.movie_user[m2][u] for u in si])
		sum1=np.sum(s1)
		sum2=np.sum(s2)
		sum1Sq=np.sum(s1**2)
		sum2Sq=np.sum(s2**2)
		pSum=np.sum(s1*s2)
		num=pSum-(sum1*sum2/n)
		den=np.sqrt((sum1Sq-sum1**2/n)*(sum2Sq-sum2**2/n))
		if den==0:
			self.similarity[m1][m2]=0
			self.similarity[m2][m1]=0
			return 0
		self.similarity[m1][m2]=num/den
		self.similarity[m2][m1]=num/den
		return num/den
	def pred(self,uid,mid):
		sim_accumulate=0.0
		rat_acc=0.0
		for item in self.user_movie[uid]:
			sim=self.sim_cal(item,mid)
			if sim<0:continue
			#print sim,self.user_movie[uid][item],sim*self.user_movie[uid][item]
			rat_acc+=sim*self.user_movie[uid][item]
			sim_accumulate+=sim
		#print rat_acc,sim_accumulate
		if sim_accumulate==0: #no same user rated,return average rates of the data
			return  self.ave
		return rat_acc/sim_accumulate
	def test(self,test_X):
		test_X=np.array(test_X)
		output=[]
		sums=0
		print "the test data size is ",test_X.shape
		for i in range(test_X.shape[0]):
			pre=self.pred(test_X[i][0],test_X[i][1])
			output.append(pre)
			#print pre,test_X[i][2]
			sums+=(pre-test_X[i][2])**2
		rmse=np.sqrt(sums/test_X.shape[0])
		print "the rmse on test data is ",rmse
		return output

sim_cal()为相似度计算,pred(uid,mid)预测uid号用户对mid号电影评分,然后我们在test()中计算RMSE,来看看结果:

可以看到与全部输出平均值比较有一定的提升,但是效果似乎并不好,因为这个算法确实有些简单,但是这个算法的思想对CF算法都很有指导意义

三.matrix factorization model 和 Baseline Predictors

这里没有实现是因为下面的SVD其实就是matrix factorization model和Baseline Predictor的结合,所以为了方便我们先在这里介绍这两个东西.

1.matrix factorization model

把我们的用户评分想象成一个表:

(图忘了是哪的了....)

每一行代表一个用户,每一列代表一个物品,这其实就是一个矩形,只是我们拥有的这个矩形可能是非常稀疏的,也就是我们知道的评分占总量很少,,但现在我们知道它是一个矩形,一个矩形自然可以表示为另两个矩形的乘积:

这也就是matrix factorization model的原理了,我们需要做的就是通过已有数据来学习右边的两个矩形,更intuitive的你可以把总的矩形里的每个评分看成是该用户的特征向量与物品特征向量的内积:(这里符号变得有些多,你理解了意思就成)

2.Baseline Predictors

Baseline Predictors就简单多了，我们设定μ是平均值，然后分别用bi和bu来代表具体用户和物品的“偏好”，也就是

这两个参数我们当然可以当成一个优化任务来计算，比如最小二乘：

也可以用比较快的方法来，因为实际上这就是经验似然：

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现_第5张图片

四.SVD and ++ and so on

（图来自【2】）

1.SVD及其衍生算法的原理

SVD算法其实就是上面介绍的matrix factorization的一种，加上baseline predictor算是一种优化而已，最简单的SVD是优化下面的Loss function：

采用随机梯度下降进行优化：

虽然看起来比较简单，但实际上对预测的效果已经超出Item-based很多了，而从SVD衍生出很多其它的算法，利用了更多的信息，我们在这里只予以介绍而不加实践。

SVD++

可以看到，SVD中并没有利用好一个用户评价了哪些电影这种信息，这代表无论评分高低，在看电影之前这些电影对他来说是有吸引力的，更一般的，如果你有用户查看过电影介绍的数据，同样也可以加以利用，SVD++就是加入了这些信息：

R(u)表示用户rate过的电影，这样加入参数后使模型更加复杂了，但其效果也就更好了，具体的优化过程就不贴了，反正还是那样，对Loss function求导而已。

timeSVD++

无论是netflix还是movielens的数据，它的最后一列是用户作出该评价的时间，timeSVD++就是将时间这个信息加以了利用，比较直观的理解就是影片的受欢迎程度可能是随着时间的变化而变化的，某些电影可能还具有周期性，如何加入这个信息呢？：

是pu成为一个随着时间变化而变化的参数：

2.SVD的实现

说了那么多高大上的衍生算法，我们还是来实现一下最基础的SVD吧：

from __future__ import division
import numpy as np
import scipy as sp
from numpy.random import random
class  SVD_C:
	def __init__(self,X,k=20):
		'''
			k  is the length of vector
		'''
		self.X=np.array(X)
		self.k=k
		self.ave=np.mean(self.X[:,2])
		print "the input data size is ",self.X.shape
		self.bi={}
		self.bu={}
		self.qi={}
		self.pu={}
		self.movie_user={}
		self.user_movie={}
		for i in range(self.X.shape[0]):
			uid=self.X[i][0]
			mid=self.X[i][1]
			rat=self.X[i][2]
			self.movie_user.setdefault(mid,{})
			self.user_movie.setdefault(uid,{})
			self.movie_user[mid][uid]=rat
			self.user_movie[uid][mid]=rat
			self.bi.setdefault(mid,0)
			self.bu.setdefault(uid,0)
			self.qi.setdefault(mid,random((self.k,1))/10*(np.sqrt(self.k)))
			self.pu.setdefault(uid,random((self.k,1))/10*(np.sqrt(self.k)))
	def pred(self,uid,mid):
		self.bi.setdefault(mid,0)
		self.bu.setdefault(uid,0)
		self.qi.setdefault(mid,np.zeros((self.k,1)))
		self.pu.setdefault(uid,np.zeros((self.k,1)))
		if (self.qi[mid]==None):
			self.qi[mid]=np.zeros((self.k,1))
		if (self.pu[uid]==None):
			self.pu[uid]=np.zeros((self.k,1))
		ans=self.ave+self.bi[mid]+self.bu[uid]+np.sum(self.qi[mid]*self.pu[uid])
		if ans>5:
			return 5
		elif ans<1:
			return 1
		return ans
	def train(self,steps=20,gamma=0.04,Lambda=0.15):
		for step in range(steps):
			print 'the ',step,'-th  step is running'
			rmse_sum=0.0
			kk=np.random.permutation(self.X.shape[0])
			for j in range(self.X.shape[0]):
				i=kk[j]
				uid=self.X[i][0]
				mid=self.X[i][1]
				rat=self.X[i][2]
				eui=rat-self.pred(uid,mid)
				rmse_sum+=eui**2
				self.bu[uid]+=gamma*(eui-Lambda*self.bu[uid])
				self.bi[mid]+=gamma*(eui-Lambda*self.bi[mid])
				temp=self.qi[mid]
				self.qi[mid]+=gamma*(eui*self.pu[uid]-Lambda*self.qi[mid])
				self.pu[uid]+=gamma*(eui*temp-Lambda*self.pu[uid])
			gamma=gamma*0.93
			print "the rmse of this step on train data is ",np.sqrt(rmse_sum/self.X.shape[0])
			#self.test(test_data)
	def test(self,test_X):
		output=[]
		sums=0
		test_X=np.array(test_X)
		#print "the test data size is ",test_X.shape
		for i in range(test_X.shape[0]):
			pre=self.pred(test_X[i][0],test_X[i][1])
			output.append(pre)
			#print pre,test_X[i][2]
			sums+=(pre-test_X[i][2])**2
		rmse=np.sqrt(sums/test_X.shape[0])
		print "the rmse on test data is ",rmse
		return output

行数各种少有木有，我们测试一下：在向量长度k=30，执行轮数steps=25,参数gamma=0.04,Lambda=0.15

a=SVD_C(train_X,30)
a.train()
a.test(test_X)

结果：

可以达到0.927左右，比之前的提高已经很多了，事实上如果你对参数进一步优化，并且增加向量大小和迭代步数，在movielens1M的数据上可以到到0.87左右的rmse，这就是最烦人的调参了，我就不在这里详述这种痛苦的经历了.......

五.CF with RBM

又到了相当的蛋疼RBM了，RBM的CF，单模型效果和SVD相似，只是error在不同的地方，所以结合起来可以提升效果，总觉得RBM不够intuitive，这次实现也遇到很多困难，所以这一节的质量不高，见谅

1.原理

首先……你得了解一下RBM……一个能量模型，Hinton的招牌作品，DeepLearning就是由这个火起来的(DBN)

这里我就不细讲RBM了，有兴趣大家找下面的ref看，直接看看CF FOR RBM这个模型吧：

严格来说这是condional RBM，基本思路是把V用softmax的形式表示成一个向量，然后去掉改用户没有评价的部分，作为RBM的V层，共用一个Hidden层，主要参数有：Vik，Wikj，Dij,vb(bias of visual layer), hb(bias of hidden)。

这是主要的学习过程，其中的公式参见【3】：

看着是有点烦，但如果你看懂了这个结构，还是很简单明了的，与普通的RBM比较，只是在visible层的sample和update有一定的变化，主要体现在：a)sample一个v[item]的时候按随机值向上累计v[item][1...5]，超过随机值的那个值设置为1，其它为0；b)update的时候按照softmax的格式来处理每一组v[item]。

2.实现

这个实现写了两三天了，而且目前效果不好，RMSE只能到0.98，不知道哪里出了问题，我已经排查过好几次了，不过还是发到这里希望大家能够帮我找出问题，代码可读性也不是很好，因为为了向量化使用了大量的切片操作，堪称丑陋，绝对没有一些C++版本的代码可读性好，但还是发在这里吧，希望有人能加以指正，万分感谢。sigh……

from __future__ import division
import numpy as np
import scipy as sp
from numpy.random import normal,random,uniform
'''
   this code still have some problem,I can only get 0.98 rmse on movielens data
   If you can figure it out,PLEASE!!! tell me . 
'''
class TEMP:
	def __init__(self):
		self.AccVH=None
		self.CountVH=None
		self.AccV=None
		self.temp.CountV=None
		self.temp.AccH=None
class  CF_RMB_C:
	def __init__(self,X,UserNum=943,HiddenNum=30,ItemNum=1682,Rate=5):
		self.X=np.array(X)
		self.HiddenNum=HiddenNum
		self.ItemNum=ItemNum
		self.UserNum=UserNum
		self.Rate=Rate
		self.movie_user={}
		self.user_movie={}
		self.bik=np.zeros((self.ItemNum,self.Rate))
		self.Momentum={}
		self.Momentum['bik']=np.zeros((self.ItemNum,self.Rate))
		self.UMatrix=np.zeros((self.UserNum,self.ItemNum))
		self.V=np.zeros((self.ItemNum,self.Rate))
		for i in range(self.X.shape[0]):
			uid=self.X[i][0]-1
			mid=self.X[i][1]-1
			rat=self.X[i][2]-1
			self.UMatrix[uid][mid]=1
			self.bik[mid][rat]+=1
			self.movie_user.setdefault(mid,{})
			self.user_movie.setdefault(uid,{})
			self.movie_user[mid][uid]=rat
			self.user_movie[uid][mid]=rat
		pass
		self.W=normal(0,0.01,(self.ItemNum,self.Rate,HiddenNum))
		self.Momentum['W']=np.zeros(self.W.shape)
		self.initialize_bik()
		self.bj=np.zeros((HiddenNum,1)).flatten(1)
		self.Momentum['bj']=np.zeros(self.bj.shape)
		self.Dij=np.zeros((self.ItemNum,self.HiddenNum))
		self.Momentum['Dij']=np.zeros((self.ItemNum,self.HiddenNum))
	def initialize_bik(self):
		for i in range(self.ItemNum):
			total=np.sum(self.bik[i])
			if total>0:
				for k in range(self.Rate):
					if self.bik[i][k]==0:
						self.bik[i][k]=-10
					else:
						self.bik[i][k]=np.log(self.bik[i][k]/total)
			
	def test(self,test_X):
		output=[]
		sums=0
		test_X=np.array(test_X)
		#print "the test data size is ",test_X.shape
		for i in range(test_X.shape[0]):
			pre=self.pred(test_X[i][0]-1,test_X[i][1]-1)
			#print test_X[i][2],pre
			output.append(pre)
			#print pre,test_X[i][2]
			sums+=(pre-test_X[i][2])**2
		rmse=np.sqrt(sums/test_X.shape[0])
		print "the rmse on test data is ",rmse
		return output
	def pred(self,uid,mid):
		V=self.clamp_user(uid)
		pj=self.update_hidden(V,uid)
		vp=self.update_visible(pj,uid,mid)
		ans=0
		for i in range(self.Rate):
			ans+=vp[i]*(i+1)
		return ans
	def clamp_user(self,uid):
		V=np.zeros(self.V.shape)
		for i in self.user_movie[uid]:
			V[i][self.user_movie[uid][i]]=1
		return V
	def train(self,para,test_X,cd_steps=3,batch_size=30,numEpoch=100,Err=0.00001):
		for epo in range(numEpoch):
			print 'the ',epo,'-th  epoch is running'
			kk=np.random.permutation(range(self.UserNum))
			bt_count=0
			while bt_count<=self.UserNum:
				btend=min(self.UserNum,bt_count+batch_size)
				users=kk[bt_count:btend]
				temp=TEMP
				temp.AccVH=np.zeros(self.W.shape)
				temp.CountVH=np.zeros(self.W.shape)
				temp.AccV=np.zeros(self.V.shape)
				temp.CountV=np.zeros(self.V.shape)
				temp.AccH=np.zeros(self.bj.shape)
				watched=np.zeros(self.UMatrix[0].shape)
				for user in users:
					watched[self.UMatrix[user]==1]=1
					sv=self.clamp_user(user)
					pj=self.update_hidden(sv,user)
					temp=self.accum_temp(sv,pj,temp,user)
					#AccVH+=pj*
					for step in range(cd_steps):
						sh=self.sample_hidden(pj)
						vp=self.update_visible(sh,user)
						sv=self.sample_visible(vp,user)
						pj=self.update_hidden(sv,user)
					deaccum_temp=self.deaccum_temp(sv,pj,temp,user)
				self.updateall(temp,batch_size,para,watched)	
				#updateall============================================	
				bt_count+=batch_size
			self.test(test_X)

	def accum_temp(self,V,pj,temp,uid):
		for i in self.user_movie[uid]:
			temp.AccVH[i]+=np.dot(V[i].reshape(-1,1),pj.reshape(1,-1))
			temp.CountVH[i]+=1
			temp.AccV[i]+=V[i]
			temp.CountV[i]+=1
		temp.AccH+=pj
		return temp
	def deaccum_temp(self,V,pj,temp,uid):
		for i in self.user_movie[uid]:
			temp.AccVH[i]-=np.dot(V[i].reshape(-1,1),pj.reshape(1,-1))
			temp.AccV[i]-=V[i]
		temp.AccH-=pj
		return temp	
	def updateall(self,temp,batch_size,para,watched):
		delatW=np.zeros(temp.CountVH.shape)
		delatBik=np.zeros(temp.CountV.shape)
	
		delatW[temp.CountVH!=0]=temp.AccVH[temp.CountVH!=0]/temp.CountVH[temp.CountVH!=0]
		delatBik[temp.CountV!=0]=temp.AccV[temp.CountV!=0]/temp.CountV[temp.CountV!=0]
		delataBj=temp.AccH/batch_size

		self.Momentum['W'][temp.CountVH!=0]=self.Momentum['W'][temp.CountVH!=0]*para['Momentum']
		self.Momentum['W'][temp.CountVH!=0]+=para['W']*(delatW[temp.CountVH!=0]-para['weight_cost']*self.W[temp.CountVH!=0])
		self.W[temp.CountVH!=0]+=self.Momentum['W'][temp.CountVH!=0]

		self.Momentum['bik'][temp.CountV!=0]=self.Momentum['bik'][temp.CountV!=0]*para['Momentum']
		self.Momentum['bik'][temp.CountV!=0]+=para['bik']*delatBik[temp.CountV!=0]
		self.bik[temp.CountV!=0]+=self.Momentum['bik'][temp.CountV!=0]

		self.Momentum['bj']=self.Momentum['bj']*para['Momentum']
		self.Momentum['bj']+=para['bj']*delataBj
		self.bj+=self.Momentum['bj']

		for i in range(self.ItemNum):
			if watched[i]==1:
				self.Momentum['Dij'][i]=self.Momentum['Dij'][i]*para['Momentum']
				self.Momentum['Dij'][i]+=para['D']*temp.AccH/batch_size
				self.Dij[i]+=self.Momentum['Dij'][i]
		
	np.seterr(all='raise')
	def update_hidden(self,V,uid):
		r=self.UMatrix[uid]
		hp=None
		for i in self.user_movie[uid]:
			if hp==None:
				hp=np.dot(V[i],self.W[i]).flatten(1)
			else:
				hp+=np.dot(V[i],self.W[i]).flatten(1)
		pj=1/(1+np.exp(-self.bj-hp+np.dot(r,self.Dij).flatten(1)))
		#pj=1/(1+np.exp(-self.bj-hp))
		return pj		
	def sample_hidden(self,pj):
		sh=uniform(size=pj.shape)
		for i in range(sh.shape[0]):
			if sh[i]

 
  【Reference】 
  
       【1】探索推荐引擎内部的秘密，第 2 部分: 深入推荐引擎相关算法 – 协同过滤  http://topgeek.org/?p=365 
   
  
       【2】Yehuda Koren and Robert Bell,    ”Advances in Collaborative Filtering” 
   
  
       【3】Gilles Louppe and Pierre Geurts,"Collaborative filtering Scalable approaches using restricted Boltzmann machines" 
   
  
       【4】SALAKHUTDINOV, R., MNIH, A., ANDHINTON, G. E. Restricted Boltzmann machines for collaborative filtering. InProceedings of the 24th international con-ference on Machine learning (2007), ACM, p. 798.

前端react框架实现打包时间动态加入配置展示在指定页面
注意：当前方法特定为create-react-app构建框架，其他的构建流程不同，不能直接照搬react-scripts的方式。✅目标：在React打包（build）时，自动将当前时间写入代码中某个变量或console.log中，例如：console.log('BuildTime:2025-06-2415:09');✅实现思路：React默认使用create-react-app（CRA），它基于W
Python爬虫短视频平台数据抓取：抓取视频和评论技术方案数据狐（DataFox） 2025年爬虫实战项目 python 爬虫开发语言
一、摘要本方案提供完整的Python爬虫实现流程，涵盖短视频平台(以抖音为例)的视频与评论数据采集技术，包含环境配置、核心代码实现及反爬优化策略。通过模拟浏览器操作、API接口分析及数据持久化处理，实现高效合规的数据采集。二、引言短视频平台数据具有巨大商业价值，但直接爬取面临动态渲染、加密参数等反爬机制挑战。本方案采用混合技术路线，结合网页解析与移动端API分析，平衡效率与成功率。三、环境配置基础
终端里的AI黑魔法：OpenCode深度体验与架构揭秘许泽宇的技术分享人工智能 AICode
“你以为AI只能在网页上点点鼠标？不，真正的极客，AI要在终端里飞！”各位码农、终端党、AI爱好者们，今天我要带你们走进一个神秘的世界——OpenCode。这是一个让AI在你终端里“蹦迪”的神器。你还在用ChatGPT网页版复制粘贴代码？你还在羡慕ClaudeCode的智能补全？醒醒吧，OpenCode已经把AI搬进了终端，开源、可扩展、还不挑AI模型，关键是——它真的很酷！一、什么是OpenCo
真实案例出发，再谈retrofit封装何小Ai同学 android-基础 android retrofit
原文链接：Anthony的简书博客项目代码：CameloeAnthony/Ant前言在使用了一段时间的Retrofit之后，今天终于在这里讲解到了网络的部分。目前开源的HTTP框架有很多，Volley，AndroidAsyncHttp，以及OkHttp+Retrofit等。而我在自己的使用中选择了Retrofit，这里就从基础到原理，再到实例的方式，讲解我对Retrofit做出的一些封装和使用。来
力扣刷题--数组--第一天高的好想出去玩啊刷题 leetcode 算法 python
一、数组数组特点：连续内存空间存储得数据元素类型一致数组可以通过下标索引查找数据元素，可以删除、替换、添加元素等1.1二分查找使用二分查找需满足得条件：数组是有序的；数组中没有重复元素；查找的target是唯一的。注意写代码时数组左右区间。题目链接给定一个n个元素有序的（升序）整型数组nums和一个目标值target，写一个函数搜索nums中的target，如果目标值存在返回下标，否则返回-1
简说 MISRA-C++ is0815 c++
MISRA-C++是嵌入式系统中广泛采用的C++编码规范，旨在提高代码安全性、可靠性和可维护性。以下是MISRA-C++的详细要求，涵盖核心规则分类、禁用特性及最佳实践：一、核心规则分类1.语言使用限制禁用动态内存分配（new/delete、std::malloc）风险：内存碎片、分配失败导致运行时崩溃替代：静态数组、对象池或定制内存分配器禁用异常处理（try/catch/throw）风险：异常展
Lagent：从零搭建你的 Multi-Agent Oculus Reparo！人工智能
https://github.com/InternLM/Tutorial/blob/camp4/docs/L2/Agent/task.md一、Lagent框架中Agent的使用目标通过Lagent框架，基于InternLM2.5，搭建一个WebDemo，体验其智能体功能与工具集成能力。步骤与实现环境准备激活环境：condaactivatelagent确保已获取API授权令牌，并写入环境变量。代码实
Class00.4自动求导代码 Morning的呀深度学习 python 深度学习 pytorch
Class00.4自动求导代码importtorch#定义一个4个元素的向量x=torch.arange(4.0)x#支持梯度计算x.requires_grad_(True)#计算梯度x.grad#计算向量点积#torch.dot(a,b):向量点积计算y=2*torch.dot(x,x)#打印结果y#进行反向传播#2x²的导数是4xy.backward()#计算梯度x.grad#进行结果验证x.
VB.NET Socket TCP服务器和客户端 DonovanZxq PC VB.NET SOCKET c#websocket tcp/ip
多线程,1服务器,多客户端可以有多个客户端连入服务器，服务器对所有客户端群发。模拟实验使用场景：多个客户端申请服务器TCP连接,服务器把自己的数据，比如压力，温度等发送给所有的客户端（比如工程师站，现场监控屏幕等）服务器：FORM代码ImportsSystem.TextPublicClassForm1PrivatemessageAsStringPrivateWithEventsmodbusTcpS
c# 核心技术指南——第2章 c# 语言基础伦比兔 C#核心技术指南 c#开发语言
本书中几乎所有的程序和代码片段都可以作为交互式示例在LINQPad中运行。阅读本书时使用这些示例可以加快你的学习进度。在LINQPad中编辑执行这些示例可以立即得到结果，无须在VisualStudio中建立项目和解决方案。2.1第一个C#程序在C#中，语句按顺序执行，每个语句都以分号结尾。类将函数成员和数据成员聚合在一起形成面向对象的构建单元。Console类将处理命令行的输入输出功能聚合在一起，
单表高效管理异构数据：点位管理引擎快速上手指南 DolphinDB智臾科技工业物联网物联网 DolphinDB 物联网点位点位管理数据处理
点位即设备上用于采集、监测和控制的各类传感器和执行器，是物联网应用场景中最重要的数据单位，通过对众多点位进行管理，企业可以实现设备监控预警、实时监测等方案。高效地存储和管理点位数据对于每一个企业和用户而言都是至关重要的。在本篇文章中，我们将详细介绍如何使用DolphinDB点位管理引擎（IOTDB引擎）来管理和存储复杂的点位数据，提升点位数据管理效率。本教程提供完整的测试代码和测试数据，初学者也可
【C#程序设计】教学讲义——第二章：简单C#程序设计刘一哥GIS 《GIS程序设计》C#程序设计谭浩强面向对象类
教学目录2.1面向对象的概念2.2建立简单的应用程序2.3窗体和Label控件2.4文本框-属性2.5按钮控件本章小结2.1面向对象的概念2.1.1对象和类1.对象对象是客观世界中对象的模型化。对象是有着特殊数据（属性）与操作（行为）的实体，对象的操作（行为）称为方法。程序中的对象是模型化了的客观世界的对象，它是代码和数据的封装体，用数据表示属性，用代码（过程或函数）表示方法。一个程序对象的属性用
C#哈希加密：原理、实现与应用阿蒙Armon C#工作中的应用 c#哈希算法开发语言
C#哈希加密：原理、实现与应用在当今数字化时代，数据安全是每个应用程序都必须重视的问题。哈希加密作为一种重要的加密技术，在密码存储、数据完整性验证、数字签名等领域发挥着关键作用。本文将深入探讨C#中哈希加密的原理、常用算法以及实际应用，并通过代码示例展示如何在C#中实现哈希加密。一、哈希加密基础哈希加密（也称为哈希函数或散列函数）是一种将任意长度的输入数据转换为固定长度输出的算法。这个固定长度的输
java 学习底层代码算法好学且牛逼的马 java
#33写算法题黑马的视频争取简单的过一遍要考试啦密码的写底层代码秘密的底层代码有点长啊看不懂难找了几个视频课看看吧想看中文版jdkapi吧算了慢慢看先把几个顶级父类给看会了objectsystemstringstringbuilder算法单路递归packagecom.itheima.Recursion;publicclasssingleRecursion{ publicstaticvoidma
Java 集合list 手搓底层源码好学且牛逼的马算法
#32Java八股集合基础用法掌握速通小林不是很全老韩详细底层byd课程质量一般八股文听书算法题不会写byd密码的还没开始看双指针技巧秒杀七道链表题目|labuladong的算法笔记等等熬夜看笔记实现底层代码后面非常长但是也只写到了list完map和set明天写collection这段代码展示了Java集合框架的核心接口层次结构。`Collection`是整个集合框架的根接口，定义了集合操作的基本
DTO、VO、POJO转换性能测试 ZuuuuYao Java 开发语言 java
PO、DTO、VO、BO对象转换性能测试一、Java对象转换性能测试（一）测试对象mapstruct（二）测试对象modelmapper二测试代码(1)准备UserEntity(2)准备UserVO(3)编写mapstruct的映射器UserStructMapper(4)准备测试类(5)输出结果三、测试报告四、结论一、Java对象转换性能测试（一）测试对象mapstructMapstruct是一个
VSCode更改程序编译之后生成文件的保存路径一low永逸安装IDE vscode
目录目标过程如何生成json代码其他参考目标想把程序文件和生成文件分开来，生成在当前文件的out文件夹过程在保存代码的文件夹下面再建一个保存生成文件的文件夹，我生成了out文件夹打开.vscode文件夹下面settings.json文件（这个json文件可以自己生成或复制过来，不影响使用）在settings.json中加入以下代码，我主要使用C++语言，所以只改这个，不同系统的shell语法不一样
MyBatis逆向工程生成 (生成pojo、mapper.xml、mapper.java) weixin_30701521 java 数据库
MyBatis逆向工程生成mybatis需要程序员自己编写sql语句，mybatis官方提供逆向工程，可以针对单表自动生成mybatis执行所需要的代码（mapper.java、mapper.xml、pojo…），可以让程序员将更多的精力放在繁杂的业务逻辑上。企业实际开发中，常用的逆向工程方式：由数据库的表生成java代码。之所以强调单表两个字，是因为Mybatis逆向工程生成的Mapper所进行
Django ORM 1. 创建模型（Model）博观而约取 Python django 数据库 python
1.ORM介绍什么是ORM？ORM，全称Object-RelationalMapping（对象关系映射），一种通过对象操作数据库的技术。它的核心思想是：我们不直接写SQL，而是用Python对象（类/实例）来操作数据库表和记录。ORM就像一个“翻译官”，帮我们把Python代码翻译成数据库能听懂的SQL命令。为什么使用ORM?Django中的ORM提供了一个高层次、抽象化的接口来操作数据库，它的优
XML命名空间：避免元素名称冲突的利器 t0_54coder 编程问题解决手册 xml 服务器运维
在XML文档的编写和解析过程中，命名空间（Namespace）是一个非常重要的概念。它不仅有助于避免元素名称的冲突，还促进了代码的重用和模块化。本文将详细探讨XML命名空间的基本概念、语法、使用方式以及如何应用于属性。1.XML命名空间的基本概念XML命名空间是一种避免元素名称冲突的方法。通过使用命名空间，XML文档可以重用其他XML文档中的元素或属性，而无需每次都重新创建它们。这对于处理多个来源
机器学习模型监控警报系统设计：Prometheus+Evidently 实战教程大熊计算机机器学习 prometheus 人工智能
1.系统架构设计：从数据采集到智能告警（1）监控系统核心组件交互图预测请求监控指标告警规则通知渠道预测结果质量报告时序数据模型服务PrometheusExporterPrometheusServerAlertmanager邮件/Slack/WebhookEvidently服务可视化仪表盘图解：系统采用双引擎架构，Prometheus负责基础监控指标采集与告警触发，Evidently执行深度模型分析
构建LangChain应用程序的示例代码：63、如何使用Petting Zoo库定义和运行多智能体模拟环境 Hugo_Hoo langchain 人工智能 AI编程
多智能体模拟环境:PettingZoo在这个例子中，我们展示如何使用模拟环境定义多智能体模拟。与我们的单智能体Gymnasium示例类似，我们创建了一个具有外部定义环境的智能体-环境循环。主要区别在于我们现在使用多个智能体实现这种交互循环。我们将使用PettingZoo库，它是Gymnasium的多智能体对应版本。安装pettingzoo和其他依赖!pipinstallpettingzoopyga
【HarmonyOS next】ArkUI-X休闲益智记忆翻牌【进阶】 harmonyos-next
本文通过记忆翻牌游戏实现，揭秘网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于ArkUI-X的Web组件技术，我们实现了一套代码双端运行的混合架构。一、跨平台实现架构//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:web_webvie
【HarmonyOS Next】ArkUI-X休闲益智接水果【进阶】 harmonyos-next
本文通过ArkUI-X实现跨平台接水果游戏，深入探究网络图片在HarmonyOS与iOS设备上的渲染差异，并提供专业级优化方案。基于WebView的混合架构，我们实现了单代码库双端适配的高效开发模式。一、跨平台架构设计//ArkTS核心实现importweb_webviewfrom'@ohos.web.webview';@Entry@ComponentstructIndex{controller:
【HarmonyOS next】ArkUI-X休闲益智儿童拼图【进阶】 harmonyos-next
【HarmonyOSnext】ArkUI-X休闲益智儿童拼图【进阶】一、前言：当拼图遇上跨端开发最近在开发一款跨平台的儿童拼图游戏时，我深刻体会到了ArkUI-X框架的威力——同一套代码竟能同时在华为Mate60Pro和iPhone15上流畅运行！这不仅节省了开发成本，更重要的是确保了多端用户体验的一致性。今天我们就来聊聊这个项目的核心技术点，特别是拖动坐标计算和图片剪影生成这两个让人"又爱又恨"
反射&枚举&以及lambda表达式观音山保我别报错 java 开发语言
反射,Java代码中,让一个对象,认识到自己,也叫做"自省"自己清楚的认识自己谁是最认识对象的??程序员程序员是非常清楚,某个对象是属于哪个类的这个对象里面有哪些属性(属性的名字,类型,private/public,其他的修饰符注解之类的)这个对象里有哪些方法(方法的名字,参数列表,private/public)这个类的父类是谁这个类实现了接口有哪些这些东西程序员只需要看看代码,就知道这些事情了程
Markdown 叶子202422 Python学习记录 python
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML图表FLowchart流程图导出与导入导出导入欢迎使用Mark
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
一文教你学会使用 ts 泛型；ts 泛型常用知识点 GGhhccc javascript 开发语言前端 typescript
文章目录1.泛型是什么？为什么要用泛型？2.泛型如何使用泛型类泛型约束3.泛型部分实用工具类型ExcludeExtractOmitPick4.结语最近回头复习了一下ts泛型的知识，做一些笔记的总结分享~1.泛型是什么？为什么要用泛型？引用官网的例子，此时有一个需求：我们要定义一个函数，他会返回任何传入他的值。这个情况下，我们如果已知他的数据类型（假定是number），就可以写出以下代码：funct
【Golang】用gorm实现分页的功能在成都搬砖的鸭鸭 Golang golang 开发语言后端 1024程序员节
目录1、背景2、go库下载3、初始化数据【1】建表【2】插入数据【3】查看数据4、代码示例【1】gorm结构体定义【2】分页结构体定义【3】封装分页方法【4】封装获取数据库连接方法【5】查询列表接口【6】启动http服务【7】调用获取列表接口5、总结1、背景在提供列表接口时一般要用到分页，对于存储在某些数据库中的数据进行分页起来非常的方便，下文给出一个通过gorm进行分页并通过http返回数据的例
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

〇.说明

一.引入

二.Item Based and User Based

1.原理

2.实现

三.matrix factorization model 和 Baseline Predictors

1.matrix factorization model

2.Baseline Predictors

四.SVD and ++ and so on

1.SVD及其衍生算法的原理

SVD++

timeSVD++

2.SVD的实现

五.CF with RBM

1.原理

2.实现

【Reference】

你可能感兴趣的:(机器学习,代码)