Dark_Scope

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

〇.说明

本文的所有代码均可在 DML 找到，欢迎点星星。

一.引入

推荐系统（主要是CF）是我在参加百度的电影推荐算法比赛的时候才临时学的，虽然没拿什么奖，但是知识却是到手了，一直想写一篇关于推荐系统的文章总结下，这次借着完善DML写一下，权当是总结了。不过真正的推荐系统当然不会这么简单，往往是很多算法交错在一起，本文只是入门水平的总结罢了。（本文所用测试数据是movielens100k）

本文采用的评测标准是RMSE，数值越小算法越好，在movielens100k 的 u1数据上对每个要求预测的评分输出训练集总的平均分，其RMSE是：

二.Item Based and User Based

1.原理

Item-based和User-Based是CF算法中最基础的两个了，其算法思想很intuitive：

User-based就是把与你有相同爱好的用户所喜欢的物品(并且你还没有评过分)推荐给你

（图自【1】）

Item-based则与之相反，把和你之前喜欢的物品近似的物品推荐给你：

（图自【1】）

更一般的，我们此次使用的数据集是要求你预测某个用户对某个item的评分，以Item-based为例，使用上面提到的算法思想就是检测该用户评过的所有物品和待预测物品的相似度，而两个物品的相似度我们可以找出所有同时对两个物品进行评价的评分，然后计算其皮尔逊相似度，按照相似度计算加权平均值即可，具体过程可以看下面的实现（和《集体智慧编程》中的类似）

2.实现

from __future__ import division
import numpy as np
import scipy as sp
class  Item_based_C:
	def __init__(self,X):
		self.X=np.array(X)
		print "the input data size is ",self.X.shape
		self.movie_user={}
		self.user_movie={}
		self.ave=np.mean(self.X[:,2])
		for i in range(self.X.shape[0]):
			uid=self.X[i][0]
			mid=self.X[i][1]
			rat=self.X[i][2]
			self.movie_user.setdefault(mid,{})
			self.user_movie.setdefault(uid,{})
			self.movie_user[mid][uid]=rat
			self.user_movie[uid][mid]=rat
		self.similarity={}
		pass
	def sim_cal(self,m1,m2):
		self.similarity.setdefault(m1,{})
		self.similarity.setdefault(m2,{})
		self.movie_user.setdefault(m1,{})
		self.movie_user.setdefault(m2,{})
		self.similarity[m1].setdefault(m2,-1)
		self.similarity[m2].setdefault(m1,-1)

		if self.similarity[m1][m2]!=-1:
			return self.similarity[m1][m2]
		si={}
		for user in self.movie_user[m1]:
			if user in self.movie_user[m2]:
				si[user]=1
		n=len(si)
		if (n==0):
			self.similarity[m1][m2]=1
			self.similarity[m2][m1]=1
			return 1
		s1=np.array([self.movie_user[m1][u] for u in si])
		s2=np.array([self.movie_user[m2][u] for u in si])
		sum1=np.sum(s1)
		sum2=np.sum(s2)
		sum1Sq=np.sum(s1**2)
		sum2Sq=np.sum(s2**2)
		pSum=np.sum(s1*s2)
		num=pSum-(sum1*sum2/n)
		den=np.sqrt((sum1Sq-sum1**2/n)*(sum2Sq-sum2**2/n))
		if den==0:
			self.similarity[m1][m2]=0
			self.similarity[m2][m1]=0
			return 0
		self.similarity[m1][m2]=num/den
		self.similarity[m2][m1]=num/den
		return num/den
	def pred(self,uid,mid):
		sim_accumulate=0.0
		rat_acc=0.0
		for item in self.user_movie[uid]:
			sim=self.sim_cal(item,mid)
			if sim<0:continue
			#print sim,self.user_movie[uid][item],sim*self.user_movie[uid][item]
			rat_acc+=sim*self.user_movie[uid][item]
			sim_accumulate+=sim
		#print rat_acc,sim_accumulate
		if sim_accumulate==0: #no same user rated,return average rates of the data
			return  self.ave
		return rat_acc/sim_accumulate
	def test(self,test_X):
		test_X=np.array(test_X)
		output=[]
		sums=0
		print "the test data size is ",test_X.shape
		for i in range(test_X.shape[0]):
			pre=self.pred(test_X[i][0],test_X[i][1])
			output.append(pre)
			#print pre,test_X[i][2]
			sums+=(pre-test_X[i][2])**2
		rmse=np.sqrt(sums/test_X.shape[0])
		print "the rmse on test data is ",rmse
		return output

sim_cal()为相似度计算,pred(uid,mid)预测uid号用户对mid号电影评分,然后我们在test()中计算RMSE,来看看结果:

可以看到与全部输出平均值比较有一定的提升,但是效果似乎并不好,因为这个算法确实有些简单,但是这个算法的思想对CF算法都很有指导意义

三.matrix factorization model 和 Baseline Predictors

这里没有实现是因为下面的SVD其实就是matrix factorization model和Baseline Predictor的结合,所以为了方便我们先在这里介绍这两个东西.

1.matrix factorization model

把我们的用户评分想象成一个表:

(图忘了是哪的了....)

每一行代表一个用户,每一列代表一个物品,这其实就是一个矩形,只是我们拥有的这个矩形可能是非常稀疏的,也就是我们知道的评分占总量很少,,但现在我们知道它是一个矩形,一个矩形自然可以表示为另两个矩形的乘积:

这也就是matrix factorization model的原理了,我们需要做的就是通过已有数据来学习右边的两个矩形,更intuitive的你可以把总的矩形里的每个评分看成是该用户的特征向量与物品特征向量的内积:(这里符号变得有些多,你理解了意思就成)

2.Baseline Predictors

Baseline Predictors就简单多了，我们设定μ是平均值，然后分别用bi和bu来代表具体用户和物品的“偏好”，也就是

这两个参数我们当然可以当成一个优化任务来计算，比如最小二乘：

也可以用比较快的方法来，因为实际上这就是经验似然：

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现_第5张图片

四.SVD and ++ and so on

（图来自【2】）

1.SVD及其衍生算法的原理

SVD算法其实就是上面介绍的matrix factorization的一种，加上baseline predictor算是一种优化而已，最简单的SVD是优化下面的Loss function：

采用随机梯度下降进行优化：

虽然看起来比较简单，但实际上对预测的效果已经超出Item-based很多了，而从SVD衍生出很多其它的算法，利用了更多的信息，我们在这里只予以介绍而不加实践。

SVD++

可以看到，SVD中并没有利用好一个用户评价了哪些电影这种信息，这代表无论评分高低，在看电影之前这些电影对他来说是有吸引力的，更一般的，如果你有用户查看过电影介绍的数据，同样也可以加以利用，SVD++就是加入了这些信息：

R(u)表示用户rate过的电影，这样加入参数后使模型更加复杂了，但其效果也就更好了，具体的优化过程就不贴了，反正还是那样，对Loss function求导而已。

timeSVD++

无论是netflix还是movielens的数据，它的最后一列是用户作出该评价的时间，timeSVD++就是将时间这个信息加以了利用，比较直观的理解就是影片的受欢迎程度可能是随着时间的变化而变化的，某些电影可能还具有周期性，如何加入这个信息呢？：

是pu成为一个随着时间变化而变化的参数：

2.SVD的实现

说了那么多高大上的衍生算法，我们还是来实现一下最基础的SVD吧：

from __future__ import division
import numpy as np
import scipy as sp
from numpy.random import random
class  SVD_C:
	def __init__(self,X,k=20):
		'''
			k  is the length of vector
		'''
		self.X=np.array(X)
		self.k=k
		self.ave=np.mean(self.X[:,2])
		print "the input data size is ",self.X.shape
		self.bi={}
		self.bu={}
		self.qi={}
		self.pu={}
		self.movie_user={}
		self.user_movie={}
		for i in range(self.X.shape[0]):
			uid=self.X[i][0]
			mid=self.X[i][1]
			rat=self.X[i][2]
			self.movie_user.setdefault(mid,{})
			self.user_movie.setdefault(uid,{})
			self.movie_user[mid][uid]=rat
			self.user_movie[uid][mid]=rat
			self.bi.setdefault(mid,0)
			self.bu.setdefault(uid,0)
			self.qi.setdefault(mid,random((self.k,1))/10*(np.sqrt(self.k)))
			self.pu.setdefault(uid,random((self.k,1))/10*(np.sqrt(self.k)))
	def pred(self,uid,mid):
		self.bi.setdefault(mid,0)
		self.bu.setdefault(uid,0)
		self.qi.setdefault(mid,np.zeros((self.k,1)))
		self.pu.setdefault(uid,np.zeros((self.k,1)))
		if (self.qi[mid]==None):
			self.qi[mid]=np.zeros((self.k,1))
		if (self.pu[uid]==None):
			self.pu[uid]=np.zeros((self.k,1))
		ans=self.ave+self.bi[mid]+self.bu[uid]+np.sum(self.qi[mid]*self.pu[uid])
		if ans>5:
			return 5
		elif ans<1:
			return 1
		return ans
	def train(self,steps=20,gamma=0.04,Lambda=0.15):
		for step in range(steps):
			print 'the ',step,'-th  step is running'
			rmse_sum=0.0
			kk=np.random.permutation(self.X.shape[0])
			for j in range(self.X.shape[0]):
				i=kk[j]
				uid=self.X[i][0]
				mid=self.X[i][1]
				rat=self.X[i][2]
				eui=rat-self.pred(uid,mid)
				rmse_sum+=eui**2
				self.bu[uid]+=gamma*(eui-Lambda*self.bu[uid])
				self.bi[mid]+=gamma*(eui-Lambda*self.bi[mid])
				temp=self.qi[mid]
				self.qi[mid]+=gamma*(eui*self.pu[uid]-Lambda*self.qi[mid])
				self.pu[uid]+=gamma*(eui*temp-Lambda*self.pu[uid])
			gamma=gamma*0.93
			print "the rmse of this step on train data is ",np.sqrt(rmse_sum/self.X.shape[0])
			#self.test(test_data)
	def test(self,test_X):
		output=[]
		sums=0
		test_X=np.array(test_X)
		#print "the test data size is ",test_X.shape
		for i in range(test_X.shape[0]):
			pre=self.pred(test_X[i][0],test_X[i][1])
			output.append(pre)
			#print pre,test_X[i][2]
			sums+=(pre-test_X[i][2])**2
		rmse=np.sqrt(sums/test_X.shape[0])
		print "the rmse on test data is ",rmse
		return output

行数各种少有木有，我们测试一下：在向量长度k=30，执行轮数steps=25,参数gamma=0.04,Lambda=0.15

a=SVD_C(train_X,30)
a.train()
a.test(test_X)

结果：

可以达到0.927左右，比之前的提高已经很多了，事实上如果你对参数进一步优化，并且增加向量大小和迭代步数，在movielens1M的数据上可以到到0.87左右的rmse，这就是最烦人的调参了，我就不在这里详述这种痛苦的经历了.......

五.CF with RBM

又到了相当的蛋疼RBM了，RBM的CF，单模型效果和SVD相似，只是error在不同的地方，所以结合起来可以提升效果，总觉得RBM不够intuitive，这次实现也遇到很多困难，所以这一节的质量不高，见谅

1.原理

首先……你得了解一下RBM……一个能量模型，Hinton的招牌作品，DeepLearning就是由这个火起来的(DBN)

这里我就不细讲RBM了，有兴趣大家找下面的ref看，直接看看CF FOR RBM这个模型吧：

严格来说这是condional RBM，基本思路是把V用softmax的形式表示成一个向量，然后去掉改用户没有评价的部分，作为RBM的V层，共用一个Hidden层，主要参数有：Vik，Wikj，Dij,vb(bias of visual layer), hb(bias of hidden)。

这是主要的学习过程，其中的公式参见【3】：

看着是有点烦，但如果你看懂了这个结构，还是很简单明了的，与普通的RBM比较，只是在visible层的sample和update有一定的变化，主要体现在：a)sample一个v[item]的时候按随机值向上累计v[item][1...5]，超过随机值的那个值设置为1，其它为0；b)update的时候按照softmax的格式来处理每一组v[item]。

2.实现

这个实现写了两三天了，而且目前效果不好，RMSE只能到0.98，不知道哪里出了问题，我已经排查过好几次了，不过还是发到这里希望大家能够帮我找出问题，代码可读性也不是很好，因为为了向量化使用了大量的切片操作，堪称丑陋，绝对没有一些C++版本的代码可读性好，但还是发在这里吧，希望有人能加以指正，万分感谢。sigh……

from __future__ import division
import numpy as np
import scipy as sp
from numpy.random import normal,random,uniform
'''
   this code still have some problem,I can only get 0.98 rmse on movielens data
   If you can figure it out,PLEASE!!! tell me . 
'''
class TEMP:
	def __init__(self):
		self.AccVH=None
		self.CountVH=None
		self.AccV=None
		self.temp.CountV=None
		self.temp.AccH=None
class  CF_RMB_C:
	def __init__(self,X,UserNum=943,HiddenNum=30,ItemNum=1682,Rate=5):
		self.X=np.array(X)
		self.HiddenNum=HiddenNum
		self.ItemNum=ItemNum
		self.UserNum=UserNum
		self.Rate=Rate
		self.movie_user={}
		self.user_movie={}
		self.bik=np.zeros((self.ItemNum,self.Rate))
		self.Momentum={}
		self.Momentum['bik']=np.zeros((self.ItemNum,self.Rate))
		self.UMatrix=np.zeros((self.UserNum,self.ItemNum))
		self.V=np.zeros((self.ItemNum,self.Rate))
		for i in range(self.X.shape[0]):
			uid=self.X[i][0]-1
			mid=self.X[i][1]-1
			rat=self.X[i][2]-1
			self.UMatrix[uid][mid]=1
			self.bik[mid][rat]+=1
			self.movie_user.setdefault(mid,{})
			self.user_movie.setdefault(uid,{})
			self.movie_user[mid][uid]=rat
			self.user_movie[uid][mid]=rat
		pass
		self.W=normal(0,0.01,(self.ItemNum,self.Rate,HiddenNum))
		self.Momentum['W']=np.zeros(self.W.shape)
		self.initialize_bik()
		self.bj=np.zeros((HiddenNum,1)).flatten(1)
		self.Momentum['bj']=np.zeros(self.bj.shape)
		self.Dij=np.zeros((self.ItemNum,self.HiddenNum))
		self.Momentum['Dij']=np.zeros((self.ItemNum,self.HiddenNum))
	def initialize_bik(self):
		for i in range(self.ItemNum):
			total=np.sum(self.bik[i])
			if total>0:
				for k in range(self.Rate):
					if self.bik[i][k]==0:
						self.bik[i][k]=-10
					else:
						self.bik[i][k]=np.log(self.bik[i][k]/total)
			
	def test(self,test_X):
		output=[]
		sums=0
		test_X=np.array(test_X)
		#print "the test data size is ",test_X.shape
		for i in range(test_X.shape[0]):
			pre=self.pred(test_X[i][0]-1,test_X[i][1]-1)
			#print test_X[i][2],pre
			output.append(pre)
			#print pre,test_X[i][2]
			sums+=(pre-test_X[i][2])**2
		rmse=np.sqrt(sums/test_X.shape[0])
		print "the rmse on test data is ",rmse
		return output
	def pred(self,uid,mid):
		V=self.clamp_user(uid)
		pj=self.update_hidden(V,uid)
		vp=self.update_visible(pj,uid,mid)
		ans=0
		for i in range(self.Rate):
			ans+=vp[i]*(i+1)
		return ans
	def clamp_user(self,uid):
		V=np.zeros(self.V.shape)
		for i in self.user_movie[uid]:
			V[i][self.user_movie[uid][i]]=1
		return V
	def train(self,para,test_X,cd_steps=3,batch_size=30,numEpoch=100,Err=0.00001):
		for epo in range(numEpoch):
			print 'the ',epo,'-th  epoch is running'
			kk=np.random.permutation(range(self.UserNum))
			bt_count=0
			while bt_count<=self.UserNum:
				btend=min(self.UserNum,bt_count+batch_size)
				users=kk[bt_count:btend]
				temp=TEMP
				temp.AccVH=np.zeros(self.W.shape)
				temp.CountVH=np.zeros(self.W.shape)
				temp.AccV=np.zeros(self.V.shape)
				temp.CountV=np.zeros(self.V.shape)
				temp.AccH=np.zeros(self.bj.shape)
				watched=np.zeros(self.UMatrix[0].shape)
				for user in users:
					watched[self.UMatrix[user]==1]=1
					sv=self.clamp_user(user)
					pj=self.update_hidden(sv,user)
					temp=self.accum_temp(sv,pj,temp,user)
					#AccVH+=pj*
					for step in range(cd_steps):
						sh=self.sample_hidden(pj)
						vp=self.update_visible(sh,user)
						sv=self.sample_visible(vp,user)
						pj=self.update_hidden(sv,user)
					deaccum_temp=self.deaccum_temp(sv,pj,temp,user)
				self.updateall(temp,batch_size,para,watched)	
				#updateall============================================	
				bt_count+=batch_size
			self.test(test_X)

	def accum_temp(self,V,pj,temp,uid):
		for i in self.user_movie[uid]:
			temp.AccVH[i]+=np.dot(V[i].reshape(-1,1),pj.reshape(1,-1))
			temp.CountVH[i]+=1
			temp.AccV[i]+=V[i]
			temp.CountV[i]+=1
		temp.AccH+=pj
		return temp
	def deaccum_temp(self,V,pj,temp,uid):
		for i in self.user_movie[uid]:
			temp.AccVH[i]-=np.dot(V[i].reshape(-1,1),pj.reshape(1,-1))
			temp.AccV[i]-=V[i]
		temp.AccH-=pj
		return temp	
	def updateall(self,temp,batch_size,para,watched):
		delatW=np.zeros(temp.CountVH.shape)
		delatBik=np.zeros(temp.CountV.shape)
	
		delatW[temp.CountVH!=0]=temp.AccVH[temp.CountVH!=0]/temp.CountVH[temp.CountVH!=0]
		delatBik[temp.CountV!=0]=temp.AccV[temp.CountV!=0]/temp.CountV[temp.CountV!=0]
		delataBj=temp.AccH/batch_size

		self.Momentum['W'][temp.CountVH!=0]=self.Momentum['W'][temp.CountVH!=0]*para['Momentum']
		self.Momentum['W'][temp.CountVH!=0]+=para['W']*(delatW[temp.CountVH!=0]-para['weight_cost']*self.W[temp.CountVH!=0])
		self.W[temp.CountVH!=0]+=self.Momentum['W'][temp.CountVH!=0]

		self.Momentum['bik'][temp.CountV!=0]=self.Momentum['bik'][temp.CountV!=0]*para['Momentum']
		self.Momentum['bik'][temp.CountV!=0]+=para['bik']*delatBik[temp.CountV!=0]
		self.bik[temp.CountV!=0]+=self.Momentum['bik'][temp.CountV!=0]

		self.Momentum['bj']=self.Momentum['bj']*para['Momentum']
		self.Momentum['bj']+=para['bj']*delataBj
		self.bj+=self.Momentum['bj']

		for i in range(self.ItemNum):
			if watched[i]==1:
				self.Momentum['Dij'][i]=self.Momentum['Dij'][i]*para['Momentum']
				self.Momentum['Dij'][i]+=para['D']*temp.AccH/batch_size
				self.Dij[i]+=self.Momentum['Dij'][i]
		
	np.seterr(all='raise')
	def update_hidden(self,V,uid):
		r=self.UMatrix[uid]
		hp=None
		for i in self.user_movie[uid]:
			if hp==None:
				hp=np.dot(V[i],self.W[i]).flatten(1)
			else:
				hp+=np.dot(V[i],self.W[i]).flatten(1)
		pj=1/(1+np.exp(-self.bj-hp+np.dot(r,self.Dij).flatten(1)))
		#pj=1/(1+np.exp(-self.bj-hp))
		return pj		
	def sample_hidden(self,pj):
		sh=uniform(size=pj.shape)
		for i in range(sh.shape[0]):
			if sh[i]<pj[i]:
				sh[i]=1.0
			else:
				sh[i]=0.0
		return sh
	def update_visible(self,sh,uid,mid=None):
		if mid==None:
			vp=np.zeros(self.V.shape)
			for i in self.user_movie[uid]:
				
				vp[i]=np.exp(self.bik[i]+np.dot(self.W[i],sh))
				vp[i]=vp[i]/np.sum(vp[i])
			return vp
		vp=np.exp(self.bik[mid]+np.dot(self.W[mid],sh))
		vp=vp/np.sum(vp)
		return vp
	def sample_visible(self,vp,uid):
		sv=np.zeros(self.V.shape)
		for i in self.user_movie[uid]:
			r=uniform()
			k=0
			for k in range(self.Rate):
				r-=vp[i][k]
				if r<=0:break
			sv[i][k]=1
		return sv

【Reference】

【1】探索推荐引擎内部的秘密，第 2 部分: 深入推荐引擎相关算法 – 协同过滤 http://topgeek.org/?p=365

【2】Yehuda Koren and Robert Bell, ”Advances in Collaborative Filtering”

【3】Gilles Louppe and Pierre Geurts,"Collaborative filtering Scalable approaches using restricted Boltzmann machines"

【4】SALAKHUTDINOV, R., MNIH, A., ANDHINTON, G. E. Restricted Boltzmann machines for collaborative filtering. InProceedings of the 24th international con-ference on Machine learning (2007), ACM, p. 798.

基于SpringBoot的餐厅点餐系统的设计与实现毕设小助手 spring boot 后端 java
收藏关注不迷路//项目拿到就可以直接使用，但是用于作业或者毕设需要自己懂代码之后进行自行修改//支持毕设定制//远程支持//可联系博主----------同类型文章可以联系博主----------争取每天三篇，有需要的用户可以关注查看哦~今日第三篇-发布的文章皆有源码，私信联系可获取源码~本项目设计与实施了一个基于SpringBoot的餐厅点餐系统，探讨了该系统在提高点餐效率、优化订单管理和提升顾
动力电池PACK线标配：18650电池自动点焊机的规模化应用 b***2511 人工智能大数据制造
在新能源汽车产业高速发展的背景下，动力电池作为核心部件，其生产效率与质量直接关系到整车的性能与市场竞争力。动力电池PACK线作为电池模组组装的关键环节，正经历着从手工操作向自动化、智能化转型的深刻变革。在这一进程中，18650电池自动点焊机凭借其高效、精准的特性，已成为动力电池PACK线的标配设备，推动着行业规模化应用的深入发展。在传统的动力电池组装过程中，电池极耳的焊接主要依赖手工操作，不仅效率
06_项目集成 Spring Actuator 并实现可视化页面耀耀_很无聊【后端开发】Java 碎碎念 spring java 后端
06_项目集成SpringActuator并实现可视化页面一、引入SpringActuator依赖在pom.xml文件中添加以下依赖：org.springframework.bootspring-boot-starter-actuator⚙️二、SpringActuator配置2.1配置端点访问前缀SpringBoot默认的Actuator端点访问地址是：http://localhost:8080
知识积累----空转转录因子TF活性的计算框架追风少年ii 空间数据分析 hotspot 傅里叶变换机器学习
作者，EvilGenius关于我们外显子的分析课程，我们来一次预报名吧，课表如下第一节：外显子分析基础知识与框架（包括基础文件的格式等）第二节：fastq数据处理到callSNV+基础认知（简单判断谱系突变和体系突变、以及GT:AD:AF:DP等基础信息）第三节（可能需要拆分成2节课）：各大数据库如何注释突变信息（clinvar、cosmic、gnomad、HGMD、hotspot、oncoKB、
golang实现从request请求返回的response中提取网站图标的faviconMMH3, faviconMD5, faviconPath, faviconData, faviconURL
golang实现从request请求返回的response中提取网站图标的faviconMMH3,faviconMD5,faviconPath,faviconData,faviconURL，其中faviconData类型为[]byte，其余为string类型。在Go中提取网站的favicon（网站图标）并计算其MMH3和MD5哈希值，同时获取路径、原始数据和URL，可以通过以下步骤实现：packa
给pycharm配置conda环境无响应...如何解决？ bug菌¹ 全栈Bug调优(实战版)pycharm conda java python
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！备注：部分问题/疑难杂症搜集于互联网。全文目录：问题描述解决方案（请知悉：如下方案不保证一定适配你的问题）问题分析解决方案总结文末福利，等你来拿！✨️WhoamI?问题描
python线程同步锁_python的Lock锁，线程同步 weixin_39649660 python线程同步锁
一、Lock锁凡是存在共享资源争抢的地方都可以使用锁，从而保证只有一个使用者可以完全使用这个资源一旦线程获得锁，其他试图获取锁的线程将被阻塞acquire(blocking=True,timeout=-1):默认阻塞，阻塞可以设置超时时间，非阻塞时，timeout禁止设置，成功获取锁，返回True，否则返回Falsereleas():释放锁，可以从任何线程调用释放，已上锁的锁，会被重置为unloc
【实习日记】day02 verse_armour 实习日记 python linux 开发语言
今日工作小结与技术备忘今天我们主要围绕一个基于Poetry和Conda的MONAI检测项目，解决了一系列从环境配置到依赖安装的复杂问题。整个过程就像一次深度探案，最终成功理清了所有障碍。一、今日遇到的主要问题与解决方案我们今天解决了四个核心的“拦路虎”：1.Poetry安装与网络问题现象：最初，在安装Poetry依赖时，出现Nomatchingdistributionfoundfordulwich
并发与并行：python多线程详解 m_merlon python 服务器 Python进阶教程 python
简介多进程和多线程都可以执行多个任务，线程是进程的一部分。线程的特点是线程之间可以共享内存和变量，资源消耗少，缺点是线程之间的同步和加锁比较麻烦。在cpython中，截止到3.12为止依然存在全局解释器锁（GIL）,不能发挥多核的优势，因此python多线程更适合IO密集型任务并发提高效率，CPU密集型任务推荐使用多进程并行解决。注：此说法仅适用于python（如：c++的多线程可以利用到多核并行
Linux (Ubuntu) conda：未找到命令报错处理司南锤 cs基础 linux linux ubuntu conda
检查安装路径：确认Anaconda或Miniconda是否已经安装。通常，安装路径在用户主目录下，例如~/anaconda3或~/miniconda3。添加路径到环境变量：如果知道Anaconda或Miniconda的安装路径，可以手动将路径添加到环境变量中。例如，如果安装路径是~/anaconda3，可以在终端中输入以下命令：exportPATH=~/anaconda3/bin:$PATH为了使
17.RestClient实现数据聚合功能带过滤条件卷土重来… windows
@OverridepublicMap>filters(RequestParamsparam){Map>res=newHashMapbrandList=getAggByName(aggregations,"brandAgg");ListcityList=getAggByName(aggregations,"cityAgg");ListstarList=getAggByName(aggregation
python协程与异步并发，同步与阻塞，异步与非阻塞，Python异步IO、协程与同步原语介绍，协程的优势和劣势网小鱼的学习笔记 Python python 服务器开发语言
协程与异步软件系统的并发使用异步IO，无非是我们提的软件系统的并发，这个软件系统，可以是网络爬虫，也可以是web服务等并发的方式有多种，多线程，多进程，异步IO等多线程和多进程更多应用于CPU密集型的场景，比如科学计算的事件都消耗在CPU上面，利用多核CPU来分担计算任务多线程和多进程之间的场景切换和通讯代价很高，不适合IO密集型的场景，而异步IO就是非常适合IO密集型的场景，例如网络爬虫和web
使用Python和FFmpeg实现RGB到YUV444的转换追逐程序梦想者 ffmpeg python 开发语言
使用Python和FFmpeg实现RGB到YUV444的转换如果你需要将RGB图像转换为YUV444格式的图像，那么本文将为你提供一个简单且可靠的方法。我们将使用Python和FFmpeg来完成这个任务。首先，让我们了解一下什么是RGB和YUV。RGB表示红、绿、蓝三种颜色的组合，是最常见的图像格式之一。另一方面，YUV是一种亮度-色度编码，用于视频压缩和传输，它将图像分成明亮度（Y）和色度（U和
如何利用ssh使得pycharm连接服务器的docker容器内部环境 SoulMatter docker 容器运维 pycharm ssh
如题，想要配置服务器的python编译器环境，来查看容器内部环境安装的包的情况。首先，需要确定容器的状态，使用dockerps查看，只有ports那一栏有内容才证明容器暴露了端口出来。如果没有暴露，就需要将容器打包成镜像，然后将镜像再启动一个容器才可以。步骤如下：如何打包镜像：(里面包括了将镜像从A服务器远程传输到B服务器后使用的方法，如果是在本服务器自己使用，那么忽略远程传输的步骤）#创建一个基
大数据项目-Django基于大数据技术实现的农产品销售系统 IT实战课堂-玲琳娜计算机毕业设计大数据 java spark 爬虫
《[含文档+PPT+源码等]Django基于大数据技术实现的农产品销售系统》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、包运行成功以及课程答疑与微信售后交流群、送查重系统不限次数免费查重等福利！数据库管理工具：phpstudy/Navicat或者phpstudy/sqlyog后台管理系统涉及技术：后台使用框架：Django前端使用技术：Vue,HTML5,CSS3、JavaScrip
产品背景知识——在线推理和离线推理爱吃芝麻汤圆 #产品背景知识推理
产品背景知识——在线推理和离线推理一、核心区别：从4个维度对比1.数据处理方式与时效性在线推理（实时推理）数据特点：处理实时流入的单条或小批量数据（如用户点击、交易请求）。时效性要求：需在毫秒级到秒级内返回结果，延迟直接影响用户体验或业务决策。典型场景：电商推荐系统（用户浏览商品时实时推荐）、金融风控（交易时实时欺诈检测）。离线推理（批量推理）数据特点：处理历史累积的大规模数据集（如TB级日志、数
Python读取红外图像 - 实现红外图像的读取和处理程序员杨弋 Python全栈工程师学习指南 python 计算机视觉 opencv
在许多工业、安防等领域中，红外图像无疑是一种不可或缺的重要资源，因此，能够快速、准确地读取和处理红外图像，对于工程师和科学家来说非常必要。Python作为一种强大的编程语言，提供了丰富的图像处理库，允许我们轻松地读取和处理红外图像，本文将介绍如何使用Python读取红外图像，并对其进行简单的处理。首先需要准备一个目标红外图像文件，这里我们以bmp格式的文件为例：importcv2img=cv2.i
java运行python脚本同时实现传参响应接收小天丶1 java python java 开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、java部分示例二、python代码示例前言提示：这里可以添加本文要记录的大概内容：主要帮助从事java开发却涉及一些计算操作的时候发现没有python库更高效的解决方式提示：以下是本篇文章正文内容，下面案例可供参考一、java部分示例//调用Python脚本//pythonl路径pythonl路径Stringpyth
2025华为od机试真题B卷【池化资源共享】C++实现 MISAYAONE 华为od c++开发语言华为od机试 2025B卷算法
目录题目思路Code题目有一个局部互联区域内的n台设备，每台设备都有一定数量的空闲资源，这些资源可以池化共享。用户会发起两种操作1.申请资源:输入1x，表示本次申请需要x个资源。系统要返回当前资源池中能满足此申请且剩余资源最少的设备ID;如果有多台设备满足条件，返回设备ID最小的;如果没有任何设备能满足，返回0并不做任何分配。2.释放资源:输入2y，表示将第y次申请(不一定是成功分配的那一次)释放
2025华为od机试真题B卷【停车场费用统计】Python实现 MISAYAONE OD机试华为od python 开发语言华为od机试 2025B卷
目录题目思路Code题目停车场统计当日总收费，包月的车不统计，不包月的车半个小时收一块钱，不满半小时不收钱，如果超过半小时，零头不满半小时按半小时算，每天11:30-13:30时间段不收钱，如果一辆车停车时间超过8小时后不收费。现提供停车场进出车辆的统计信息，需要你来计算停车场统计当日的总收费。输入描述第一行输入一个整数n表示今日进出停车场的包月的车辆数下一个行输入包月车的车牌号，以空格分割接下来
基于大模型的胆囊结石全流程预测与诊疗系统技术方案
目录一、系统架构设计1.1数据采集与预处理模块1.2大模型核心算法模块二、全流程系统流程图三、系统集成方案3.1模块交互流程3.2数据流示意图四、系统部署拓扑图五、核心模块实现细节5.1术前风险预测算法5.2术中监测算法5.3术后并发症预测模型六、关键技术验证方案6.1模型验证流程6.2临床试验设计框架七、典型应用场景流程7.1腹腔镜手术决策流程一、系统架构设计1.1数据采集与预处理模块#数据采集
成为高级Python开发人员的完整学习路线与核心知识体系
引言Python已成为全球最受欢迎的编程语言之一，其简洁的语法和强大的生态系统使其在数据科学、Web开发、自动化、人工智能等领域占据重要地位。然而，从初级Python程序员到真正的高级开发人员，需要掌握一系列深入的知识点和实践经验。本文将详细介绍成为高级Python开发人员必备的核心知识体系，并提供系统化的学习资源，帮助你规划专业发展路径。第一部分：Python语言基础进阶1.Python语言特性
【安卓笔记】注解反射，优雅的findViewById liosen 安卓笔记笔记
0.环境：电脑：Windows10AndroidStudio:2024.3.2编程语言:Java上一篇：注解的创建（重要提示，安卓新版本不再支持下面的代码。以下仅提供思路）如果需要使用findViewById的工具，推荐使用ButterKnife如果是需要优雅简单使用框架，可以使用MVVM框架，Android官方推荐的ViewBinding1.创建工具类，用于实现findViewById我这里直接
【AI】闭环反馈：构建从用户处学习的人工智能秋说 AI广延人工智能 AI
文章目录前言AI产品性能的双重视角：模型指标vs用户信号模型指标：AI系统的“内部视角”用户信号：AI产品的“外部视角”用户信号类型用户信号的价值模型指标为何难以独立支撑产品成功如何设计AI产品的全面反馈闭环一、统一成功标准：模型指标+用户价值二、用户信号的数据采集策略三、整合多源数据流四、分析与洞察从反馈到改进：迭代驱动的闭环循环一、识别并优先解决核心问题二、将用户信号转化为模型改进方向三、产品
2025.06.11华为暑期实习机试真题【物流运输】Java/Python/C++/JS/C 实现 MISAYAONE python 华为 java 华为暑期实习机试 c++
目录题目思路Code题目物流公司每天都要处理很多物流的运输工作，整个城市共有N个地点。共有N-1条公路，每2个地点之间都能通过公路连通。物流公司总部位于1号地点。今天有一辆物流运偷车共有M条物流运输任务，物流运输车每天的工作流程如下:先要从总部出发去收取所有的寄件货物，收到所有货物后回到总部扫描货物，再从总部出发将货物送至所有的送件地址,送完后最终回到总部，算作完成了今天的运输工作，请问该辆物流运
【MongoDB】基础知识全面解析：从入门到核心概念韩悸桉数据库 mongodb 数据库
一、MongoDB是什么？MongoDB是一种开源文档型NoSQL数据库，以灵活的JSON格式（BSON）存储数据，无需固定表结构，适合处理半结构化和非结构化数据。与传统关系型数据库（如MySQL）相比，它具有以下特点：灵活的数据模型：文档结构可动态调整，适应业务需求变化。水平扩展性：支持分片集群，轻松应对海量数据存储。高性能读写：通过索引优化和内存缓存提升查询效率。二、核心概念与术语对比Mong
安全左移（Shift Left Security）：软件安全的演进之路秋说 Security 安全建设软件安全
文章目录一、背景：传统安全的尴尬处境二、安全左移：让安全成为开发的“第一等公民”三、安全左移的关键实施阶段1.需求阶段：嵌入安全需求建模2.设计阶段：威胁建模与架构审计3.编码阶段：安全编码规范与静态分析4.构建与测试阶段：自动化安全检测5.发布阶段：容器与CI/CD安全审计6.运营阶段：安全监控与持续响应四、实现路径：从理念到落地的三步走Step1：安全理念转型Step2：工具链集成与自动化保障
C语言控制结构深度解析：从底层原理到高效实战技巧 Bryan Ding c语言开发语言
一、程序逻辑的核心密码程序设计的本质是对现实问题的抽象和逻辑表达。C语言作为结构化编程语言的典范，其控制结构构成了程序逻辑的骨架。三大基本结构构成所有程序的逻辑基础：顺序结构：代码的自然执行顺序选择结构：if/else语句实现分支判断循环结构：for/while实现重复操作二、选择结构的底层实现1.if语句的机器级实现if (condition){ //代码块}编译后的汇编代码示例： cmp
Golang Channel 详细原理和使用技巧
1.简介Channel(一般简写为chan)管道提供了一种机制:它在两个并发执行的协程之间进行同步，并通过传递与该管道元素类型相符的值来进行通信,它是Golang在语言层面提供的goroutine间的通信方式.通过Channel在不同的goroutine中交换数据，在goroutine之间发送和接收消息,并且可以通过Channel实现Go依赖的CSP的并发模型这种同步模式chan可以理解为一个管道
Y-Combinator推导的Golang描述武昌库里写JAVA 面试题汇总与解析 spring boot vue.js 宠物管理课程设计 java
缘起在做计算的本质指称语义的时候，遇到了需要在Python匿名递归调用。Python的lambda表达式本身不支持，需要借助Y-Combinator技术实现。于是研究了下Y-Combinator。中文世界了很多Blog介绍和推导Y-Combinator的文章。然而大部分的文章都省略了推导的关键步骤和推导的依据。仿佛读者都默认已经懂得Y-Combinator了。最后我在Youtube上找到了Ruby
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现

〇.说明

一.引入

二.Item Based and User Based

1.原理

2.实现

三.matrix factorization model 和 Baseline Predictors

1.matrix factorization model

2.Baseline Predictors

四.SVD and ++ and so on

1.SVD及其衍生算法的原理

SVD++

timeSVD++

2.SVD的实现

五.CF with RBM

1.原理

2.实现

【Reference】

你可能感兴趣的:(从item-base到svd再到rbm，多种Collaborative Filtering(协同过滤算法)从原理到实现)