礼拜天吃芋圆

推荐系统实践（三）ICF和UCF

ICF和UCF
一、原理
ICF是基于物品的推荐（利用物品之间的相似度计算预测值）

UCF是基于用户的最近邻推荐

1.UCF
（1）输入：An×m的评分（用户n，物品m）
（2）1.计算用户之间的相关系数person系数：（得到的值在-1~1之间，越接近1的越好）

得到与A用户近似的N个用户。
person系数的理解：在计算中不考虑平均值的差异使得用户间可以比较。
没有考虑两用户是否仅同时对很少的物品进行评分，解决办法：重要性赋权
没考虑很多领域会存在一些所有人都喜爱的物品，让两个用户对争议的物品达到共识会比广受换烟的物品达到共识更有价值。解决办法：对物品评分变换，降低对广受欢迎物品有相同看法的相对重要性，用方差权重因子

选择近邻：用户相似度定义一个具体的阈值，或者讲规模大小限制为一个固定值，只考虑k个最邻近。
阈值过过高，邻近规模小；阈值过低，邻近规模不会明显降低。

2.欧几里得相似度

3.余弦相似度

Tanimoto相似度：

（3）再用得到用户来近似求解a中对物品p的缺失评分。
用户a对物品p的预测值：pred(a,p)

问题：
1.矩阵太稀疏
2.用户和物品量太大，计算机太大
3.对于新物品，没评分。

2.ICF（1）
（1）输入：An×m的评分（用户n，物品m）

（2）计算两物品之间的关系，余弦相似度：（没考虑用户平均值差异）

改进版的余弦相似度：

或者：

（3）预测评分：pred(u,p) 与预测物品近邻的物品

数据预处理：
其想法是事先构建一个物品相似度矩阵，描述所有物品两两之间的相似度。在运行时，通过确定与p最相似的物品并计算u对这些邻近物品评分的加权总和来得到用户u对物品p的预测评分。近邻数量受限于当前用户评过分的物品个数。由于这样的物品数量一般都比较少，因此计算预测值可以在线上交互应用允许的短时间内完成。

N个物品得到的相似度的矩阵是An×n的。但实际上项数会极低，而且还可以采取进一步的方法降低复杂度。可选的方案有，仅考虑那些与其他物品同时评分数最少的物品，或者对每个物品只记录有限的近邻。

ICF（2） Slope One
例子：
顾客吃过后，会有相关的星级评分。假设评分如下：
评分可乐鸡翅红烧肉
小明 4 5
小红 4 3
小伟 2 3
小芳 3 ？
问题：请猜测一下小芳可能会给“红烧肉”打多少分？
思路：把两道菜的平均差值求出来，可乐鸡翅减去红烧肉的平均偏差：[（4-5）+（4-3）+（2-3）]/3=-0.333。一个新客户比如小芳，只吃了可乐鸡翅评分为3分，那么可以猜测她对红烧肉的评分为：3-（-0.333）=3.333

这就是slope one 算法的基本思路，非常非常的简单。

算法：
Slope One 算法是由 Daniel Lemire 教授在 2005 年提出的一个Item-Based 的协同过滤推荐算法。和其它类似算法相比, 它的最大优点在于算法很简单, 易于实现, 执行效率高, 同时推荐的准确性相对较高。
Slope One算法是基于不同物品之间的评分差的线性算法，预测用户对物品评分的个性化算法。主要两步：
Step1:计算物品之间的评分差的均值，记为物品间的评分偏差(两物品同时被评分)；

Step2:根据物品间的评分偏差和用户的历史评分，预测用户对未评分的物品的评分。
Step3:将预测评分排序，取topN对应的物品推荐给用户。

举例：
假设有100个人对物品A和物品B打分了，R(AB)表示这100个人对A和B打分的平均偏差;有1000个人对物品B和物品C打分了， R(CB)表示这1000个人对C和B打分的平均偏差；

总结：
该算法适用于物品更新不频繁，数量相对较稳定并且物品数目明显小于用户数的场景。依赖用户的用户行为日志和物品偏好的相关内容。
优点：
1.算法简单，易于实现，执行效率高；
2.可以发现用户潜在的兴趣爱好；
缺点：
依赖用户行为，存在冷启动问题和稀疏性问题。

二、代码：
1.ICF
使用的Movie数据集：（主函数）

# 为用户3推荐未看过的10个电影
if __name__ == "__main__":
    cf = ItemBasedCF("./data/ml-100k/u.data")
    cf.ItemSimilarity()
    print(cf.Recommend("3"))

（1）读取数据，并转成字典形式

    def readData(self):
        """
        读取文件，并生成用户-物品，测试集
        用户-物品的评分表
        训练集
        """
        self.train = {}
        # 打开文件，读取训练集
        for line in open(self.train_file):
            user, item, score, _ = line.strip().split("\t")
            self.train.setdefault(user, {})
            self.train[user][item] = int(score)
            # print(self.train())    #得到的是字典的形式，例如：'411': {'172': 5, '651': 4}
            #print(self.train().items())  #得到的是  dict_items([('411', {'172': 5, '651': 4})])
            #print(self.train().keys())  #dict_keys(['411'])

（2）计算相似度：
构造item-item的共现矩阵C，N记录items被多少个不同用户购买。最后相似度计算:self.W[i][j] = cij / (math.sqrt(N[i] * N[j]))

    def ItemSimilarity(self):
        """
        计算物品之间的相似度
        """
        C = {} #items-items矩阵 行为次数的矩阵   共现矩阵
        N = {} #记录items被多少个不同用户购买
        #遍历训练数据，获取用户对有过行为的物品
        for user, items in self.train.items():
            #遍历该用户每件物品项
            for i in items.keys():

                #该物品被用户购买计数加1
                if i not in N.keys():
                    N.setdefault(i, 0)
                N[i] += 1

                # 物品-物品共现矩阵数据加1
                if i not in C.keys():
                    C.setdefault(i, {})
                for j in items.keys():
                    if i == j:
                        continue
                    if j not in C[i].keys():
                        C[i].setdefault(j, 0)
                    C[i][j] += 1
        #计算相似度矩阵，   计算物品-物品的相似度，余弦相似度
        self.W = {}
        for i, related_items in C.items():
            if i not in self.W.keys():
                self.W.setdefault(i, {})
            for j, cij in related_items.items():
                self.W[i][j] = cij / (math.sqrt(N[i] * N[j]))
        return self.W

(3)推荐物品：对给定user的已知item，求出每个item对应的K个最相似的物品，对每个物品，用rank保存最后的相似度×score的值（rank[j] += score * wj，items相似度*score）。最后，返回概率最大的几个物品的值。

    #给用户user推荐，前K个相关用户喜欢的
    def Recommend(self, user, K=3, N=10):
        """
        给用户推荐物品，取相似度最大的K个物品，推荐排名靠前的10个物品
        """
        '''

                :param user: 用户(str)
                :param K:  相似度的前K个          W[item].items()
                :param N:  最后算出来的结果的前N个
                :return:   返回最后的前N个值 rank
        '''
        # 用户对物品的偏好值
        rank = {}
        # 用户产生过行为的物品项和评分
        action_item = self.train[user]
        #print(action_item) #用户 ‘3’ 行为的数组  {'335': 1, '245': 1, '337': 1,}
        for item, score in action_item.items():
            # print(sorted(self.W[item].items(), key=lambda x:x[1], reverse=True))
            # print("-----------------------------------------------------------------")
            # print(sorted(self.W[item].items(), key=lambda x:x[1], reverse=True)[0:K])  #和物品相似度高的前K的物品

            #遍历与item最相似的前K个物品，获得这些物品及相似分数
            for j, wj in sorted(self.W[item].items(), key=lambda x: x[1], reverse=True)[0:K]:
                #若有该物品，跳过
                if j in action_item.keys():
                    continue
                if j not in rank.keys():
                    rank.setdefault(j, 0)
                rank[j] += score * wj
        return sorted(rank.items(), key=lambda x: x[1], reverse=True)[0:N]

总结：
整体的代码为：

import math


class ItemBasedCF:

    def __init__(self, train_file):
        """
        初始化对象
        """
        self.train_file = train_file
        self.readData()

    def readData(self):
        """
        读取文件，并生成用户-物品，测试集
        用户-物品的评分表
        训练集
        """
        self.train = {}
        # 打开文件，读取训练集
        for line in open(self.train_file):
            user, item, score, _ = line.strip().split("\t")
            self.train.setdefault(user, {})
            self.train[user][item] = int(score)
            # print(self.train())    #得到的是字典的形式，例如：'411': {'172': 5, '651': 4}
            #print(self.train().items())  #得到的是  dict_items([('411', {'172': 5, '651': 4})])
            #print(self.train().keys())  #dict_keys(['411'])

    def ItemSimilarity(self):
        """
        计算物品之间的相似度
        """
        C = {} #items-items矩阵 行为次数的矩阵   共现矩阵
        N = {} #记录items被多少个不同用户购买
        #遍历训练数据，获取用户对有过行为的物品
        for user, items in self.train.items():
            #遍历该用户每件物品项
            for i in items.keys():

                #该物品被用户购买计数加1
                if i not in N.keys():
                    N.setdefault(i, 0)
                N[i] += 1

                # 物品-物品共现矩阵数据加1
                if i not in C.keys():
                    C.setdefault(i, {})
                for j in items.keys():
                    if i == j:
                        continue
                    if j not in C[i].keys():
                        C[i].setdefault(j, 0)
                    C[i][j] += 1
        #计算相似度矩阵，   计算物品-物品的相似度，余弦相似度
        self.W = {}
        for i, related_items in C.items():
            if i not in self.W.keys():
                self.W.setdefault(i, {})
            for j, cij in related_items.items():
                self.W[i][j] = cij / (math.sqrt(N[i] * N[j]))
        return self.W



    #给用户user推荐，前K个相关用户喜欢的
    def Recommend(self, user, K=3, N=10):
        """
        给用户推荐物品，取相似度最大的K个物品，推荐排名靠前的10个物品
        """
        '''

                :param user: 用户(str)
                :param K:  相似度的前K个          W[item].items()
                :param N:  最后算出来的结果的前N个
                :return:   返回最后的前N个值 rank
        '''
        # 用户对物品的偏好值
        rank = {}
        # 用户产生过行为的物品项和评分
        action_item = self.train[user]
        #print(action_item) #用户 ‘3’ 行为的数组  {'335': 1, '245': 1, '337': 1,}
        for item, score in action_item.items():
            # print(sorted(self.W[item].items(), key=lambda x:x[1], reverse=True))
            # print("-----------------------------------------------------------------")
            # print(sorted(self.W[item].items(), key=lambda x:x[1], reverse=True)[0:K])  #和物品相似度高的前K的物品

            #遍历与item最相似的前K个物品，获得这些物品及相似分数
            for j, wj in sorted(self.W[item].items(), key=lambda x: x[1], reverse=True)[0:K]:
                #若有该物品，跳过
                if j in action_item.keys():
                    continue
                if j not in rank.keys():
                    rank.setdefault(j, 0)
                rank[j] += score * wj
        return sorted(rank.items(), key=lambda x: x[1], reverse=True)[0:N]


# 为用户3推荐未看过的10个电影
if __name__ == "__main__":
    cf = ItemBasedCF("./data/ml-100k/u.data")
    cf.ItemSimilarity()
    print(cf.Recommend("3"))

2.UCF
1.读取数据data：

    def readData(self):
        """
        读取文件，并生成用户-物品，测试集
        用户-物品的评分表
        训练集
        """
        self.train={}
        for line in open(self.train_file):
            user,item,score,_ = line.strip().split('\t') #.strip()移除空格
            self.train.setdefault(user,{})
            self.train[user][item] = int(score)
            #print(self.train())    #得到的是字典的形式，例如：'411': {'172': 5, '651': 4}

        self.test = {}
        for line in open(self.test_file):
            user, item, score, _ = line.strip().split('\t')  # .strip()移除空格
            self.test.setdefault(user, {})
            self.test[user][item] = int(score)

2.求相似度:构造user-user的共线矩阵，并求解相似度：self.W[u][v] = cuv / math.sqrt(N[u] * N[v])

    def UserSimilarity(self):
        self.item_users = {}  #item和user关系矩阵
        for user, items in self.train.items():
            for i in items.keys():
                if i not in self.item_users.keys():
                    self.item_users.setdefault(i, set())
                self.item_users[i].add(user)
        # print(self.item_users)  #得到每一个Item 有多少个User使用

        C = {} #User 和User的共线矩阵
        N = {} #Item中  user出现几次
        # Cor = {} #关系矩阵

        for i, users in self.item_users.items():
            for u in users:
                if u not in N.keys():
                    N.setdefault(u, 0)
                N[u] += 1
                if u not in C.keys():
                    C.setdefault(u, {})
                for v in users:
                    if u == v:
                        continue
                    if v not in C[u].keys():
                        C[u].setdefault(v, 0)
                    C[u][v] += 1

                # #生成关系矩阵Cor
                # if u not in Cor.keys():
                #     Cor.setdefault(u,[])
                # for v in users:
                #     if u == v:
                #         continue
                #     Cor[u].append(v)
                # #print(Cor[u])

3.推荐：给定user，求出user对应的K个最近似的user，对每个user有其对应的items，用rank保存最后的相似度×score（也就是rvi）的值（rank[i] += rvi * wuv用户相似度*score）最后，返回概率最大的几个物品的值。

    def Recommend(self,user,K=3,N=10):
        '''
        :param user:
        :param K:
        :param N:
        :return:
        '''
        rank = {}
        action_item = self.train[user].keys()   # 找到用互‘3’的行为商品
        for v, wuv in sorted(self.W[user].items(), key=lambda x: x[1], reverse=True)[0:K]:
            for i, rvi in self.train[v].items():
                if i in action_item:
                    continue
                if i not in rank.keys():
                    rank.setdefault(i, 0)
                rank[i] += rvi * wuv
        return sorted(rank.items(), key=lambda x: x[1], reverse=True)[0:N]

主函数:


if __name__=='__main__':
    cf = UserBasedCF('./data/ml-100k/u.data','./data/ml-100k/u.data')
    print(cf.Recommend('3'))

ICF（2）Slope One

def loadData():
    items={'A':{1:5,2:3},
           'B':{1:3,2:4,3:2},
           'C':{1:2,3:5}}
    users={1:{'A':5,'B':3,'C':2},
           2:{'A':3,'B':4},
           3:{'B':2,'C':5}}
    return items,users

#***计算物品之间的评分差
#items:从物品角度，考虑评分
#users:从用户角度，考虑评分
def buildAverageDiffs(items,users,averages):
    #遍历每条物品-用户评分数据
    for itemId in items:
        for otherItemId in items:
            average=0.0 #物品间的评分偏差均值
            userRatingPairCount=0 #两件物品均评过分的用户数
            if itemId!=otherItemId: #若无不同的物品项
                for userId in users: #遍历用户-物品评分数
                    userRatings=users[userId] #每条数据为用户对物品的评分
                    #当前物品项在用户的评分数据中，且用户也对其他物品由评分
                    if itemId in userRatings and otherItemId in userRatings:
                        #两件物品均评过分的用户数加1
                        userRatingPairCount+=1
                        #评分偏差为每项当前物品评分-其他物品评分求和
                        average+=(userRatings[otherItemId]-userRatings[itemId])
                averages[(itemId,otherItemId)]=average/userRatingPairCount



#***预测评分
#users:用户对物品的评分数据
#items：物品由哪些用户评分的数据
#averages：计算的评分偏差
#targetUserId：被推荐的用户
#targetItemId：被推荐的物品
def suggestedRating(users,items,averages,targetUserId,targetItemId):
    runningRatingCount=0 #预测评分的分母
    weightedRatingTotal=0.0 #分子
    for i in users[targetUserId]:
        #物品i和物品targetItemId共同评分的用户数
        ratingCount=userWhoRatedBoth(users,i,targetItemId)
        #分子
        weightedRatingTotal+=(users[targetUserId][i]-averages[(targetItemId,i)])\
        *ratingCount
        #分母
        runningRatingCount+=ratingCount
    #返回预测评分
    return weightedRatingTotal/runningRatingCount

# 物品itemId1与itemId2共同有多少用户评分
def userWhoRatedBoth(users,itemId1,itemId2):
    count=0
    #用户-物品评分数据
    for userId in users:
        #用户对物品itemId1与itemId2都评过分则计数加1
        if itemId1 in users[userId] and itemId2 in users[userId]:
            count+=1
    return count

if __name__=='__main__':
    items,users=loadData()
    averages={}
    #计算物品之间的评分差
    buildAverageDiffs(items,users,averages)
    #预测评分:用户2对物品C的评分
    predictRating=suggestedRating(users,items,averages,2,'C')
    print ('Guess the user will rate the score :',predictRating)

ICF，UCF的区别：
Item CF 和 User CF两个方法都能很好的给出推荐，并可以达到不错的效果。但是他们之间还是有不同之处的，而且适用性也有区别。
1.计算复杂度方面：
在电商平台上，用户数量超级多： ItemCF时间复杂度低
在新闻推荐方面：UCF低

2.适用场景：
社交网络上 UCF更加具有解释性。比如我知道我的某个同学买了，我就会买
基于内容的推荐上 ICF更具有解释性。

参考：
https://blog.csdn.net/xidianliutingting/article/details/51916578

探索双11商业奇迹：基于天猫销售数据的可视化之旅丁思锨
探索双11商业奇迹：基于天猫销售数据的可视化之旅【下载地址】天猫双11销售数据可视化资源文件天猫双11销售数据可视化资源文件项目地址:https://gitcode.com/open-source-toolkit/4e377在数字时代的大潮下，数据可视化已成为揭示商业秘密的强大武器。今天，我们特别推荐一个开源项目——“天猫双11销售数据可视化资源”，它如同一把钥匙，为你解锁双十一消费狂欢的深层洞见
第一节：kafka golang sarama初体验锅锅来了 Golang实战案例 kafka golang 运维开发
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、sarama是什么？typeClient：主要操作元数据typeClusterAdmin:二、小试牛刀1.创建项目2.创建kafka_client.go总结前言关于Kafka的开发库，以Java的居多，Golang语言的开发库，主要推荐的是sarama项目地址：https://github.com/IBM/sarama
PMP备考神器:免费刷题小程序推荐才聚PMP 人工智能职场和发展
【PMP考试通】是一款专门为备考PMP的免费刷题小程序。【PMP考试通】涵盖了考试中的所有考点，能帮你顺利通过PMP考试。还有最新的考试咨讯提供给大家，随时了解考试的动态，考试更安心。有两种练习模式，可以实现不同的练习需求。1、考试模式:完全模拟考试，做完之后计算得分，并可以查看相应解析2、练习模式:练习与学习，遇到不能解答的题目时，可以直接查看解析，学习当前知识点3、做题类型:章节练习、每日一练
高性价比二手服务器CPU你知多少? 专注VB编程开发20年 CPU 二手
以前E33220这些都不太好的吧,现在不知有哪种二手服务器CPU核心多,主频高,性价比更高,闲鱼二手上哪些值的买,多少钱根据2025年二手服务器CPU市场现状，结合核心数、主频、价格及兼容性，以下推荐四款高性价比型号（价格参考2025年5-6月闲鱼行情）：⚡‌一、性能怪兽：IntelXeonE5-2696v3（18核36线程）‌‌核心参数‌：18核36线程｜基础2.3GHz/睿频3.8GHz｜L3
基于django+Spark+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等) 阿勇学长大数据项目实战案例 Java精品毕业设计实例 Python数据可视化项目案例大数据 django spark 国漫推荐与可视化平台毕业设计 Java
博主介绍：✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
Git常见使用北珣. git
基本操作创建仓库1.先创建一个文件,再进入到对应的文件夹中#创建文件mkdir[file_name]#进入该文件cd[file_name]2.创建对应的Git仓库(在对应的文件夹内)#创建对应的仓库gitinit#可以查看当前文件内的内容llfile_name#查看tree目录tree.git/配置本地仓库必须要配置的配置项:nameemail为了方便操作,推荐在初始化仓库之后就进行配置#配置gi
企业级RAG系统架构设计与实现指南（Java技术栈）在未来等你大模型应用开发 AI 技术编程 Java Spring
企业级RAG系统架构设计与实现指南（Java技术栈）开篇：RAG系统的基本概念与企业应用价值在当今快速发展的AI技术背景下，检索增强生成（Retrieval-AugmentedGeneration,RAG）已成为构建智能问答、知识库管理、个性化推荐等应用的核心技术之一。RAG系统通过结合信息检索与自然语言生成（NLG），能够有效提升模型对特定领域数据的适应能力，避免传统大模型在训练数据不足或数据更
【用户权限】超级用户（二）
超级用户Linux系统中的root账号通常用于系统的维护和管理，对操作系统的所有资源具有所有访问权限在大多数版本的Linux中，都不推荐直接使用root账号登录系统在Linux安装的过程中，系统会自动创建一个用户账号，而这个默认的用户就称为“标准用户”sudosu是substituteuser的缩写，表示使用另一个用户的身份sudo命令用来以其他身份来执行命令，预设的身份为root用户使用sudo
ai工具推荐系列：文生图，图生图工具liblibAi 风生水气 ai应用体验人工智能深度学习神经网络
在ai应用泛滥的今天，你是否也想通过简单的描述来创作一张这样高质量的图片？你可能听过一些比较知名软件，比如Midjourney，Stability.ai等，但是这些软件在国内访问起来都不是很方便。今天推荐一个国内可以访问的且可以生成较高自由度的图片生成工具---liblibAi。相比于国内其他的文生图，图生图工具，它拥有更多的参数可供调节，可以从不同粒度约束图片最终的生成效果。对于专业的同学来说更
Java进阶学习 m0_67403013 面试学习路线阿里巴巴 android 前端后端
进阶学习过程的几个方面第一阶段的学习是java基础的学习和javaEE的学习。第二阶段就是java学习的进阶啦。主要是面试书籍，下面是书籍推荐：多线程、并发实战java高并发程序设计和java并发编程的艺术：——“java高并发程序设计”，这本书主要是为了看第二本书做铺垫，直接看第二本书可能会很吃力。实战java高并发程序设计主要看：前4章、5.1、5.2、5.3、5.10、5.11和第6章。——
使用Picgo+Cloudflare R2构建图床 Chrislime 云计算网络网络安全缓存
R2是Cloudflare推出的非结构性Objectstorage（对象存储）服务。本文将介绍我推荐R2的原因以及与Picgo联动的使用方式。为什么选择R2正如我在博客中多次提到，Cloudflare是一家服务范围遍及全球的网络资源供应商。因此对象存储自然也会成为其主打服务之一选择R2的理由有以下：10GB免费空间无流量费免费CDN节点及DDos防护服务国际化兼容S3无政治原因的审查得益于Clou
AI如何提升个性化广告精准度——让投放更智能、更懂用户 Echo_Wish 前沿技术人工智能人工智能
AI如何提升个性化广告精准度——让投放更智能、更懂用户随着人工智能（AI）技术的发展，个性化广告已经从粗暴推送演变为智能匹配，广告主再也不想把预算砸给不感兴趣的人，而是精准触达有购买意向的用户。AI在广告投放中的核心优势在于深度数据分析、智能推荐、实时优化，让广告投放更精准、更有效。今天，我们就来聊聊AI如何提升个性化广告的精准度，并用Python代码演示其中的关键技术。1.为什么传统广告投放越来
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
【HarmonyOS NEXT】使用半模态实现动态高度底部弹窗奔跑的露西鸿蒙 HarmonyOS windows linux 服务器
一、背景在开发过程中，底部弹窗是一种常见的交互方式，下面总结如何实现高度根据内容动态调整的底部弹窗，并提供两种实现方案常见场景：当弹窗内容由动态数据驱动时（比如商品详情、任务列表、评论区等），内容高度可能随数据量变化数据少时弹窗矮一点数据多时弹窗高一点（但不超过屏幕80%）支持拖拽收起、点击空白关闭头部/底部可能有固定高度的模块（如标题栏、操作按钮）二、实现步骤第一步：创建基础底部弹窗推荐使用半模
Java 开发新手必看：Eclipse 基础操作 Java大师兄学大数据AI应用开发 java eclipse python ai
Java开发新手必看：Eclipse基础操作关键词：Java开发、Eclipse、基础操作、新手入门、集成开发环境摘要：本文专为Java开发新手打造，详细介绍了Eclipse这一强大集成开发环境的基础操作。从背景知识入手，逐步解释核心概念，深入剖析核心算法原理，通过项目实战展示具体操作，还介绍了实际应用场景、工具资源推荐以及未来发展趋势。旨在帮助新手快速上手Eclipse，开启Java开发之旅。背
基于Python的京东商品信息采集实战：用Playwright+Pandas打造高效数据抓取工具 Python爬虫项目 2025年爬虫实战项目 python pandas 开发语言爬虫游戏笔记
一、项目背景与目标在当今电商生态中，价格、销量、评论等商品信息对用户和商家来说至关重要。无论是做数据分析、电商监控，还是构建商品推荐系统，第一步都是：获取真实的商品数据。本项目以京东商城搜索结果页为目标，通过构建一个高效、可复用的商品信息采集爬虫系统，实现对商品名称、价格、店铺、评论数、链接等核心信息的提取。二、技术路线概述我们采用如下技术架构：模块技术选型浏览器自动化Playwright（现代、
HarmonyOS（OHOS）引擎编译常见问题 harmonyos
ohos引擎产物编译相关问题flutter_engine环境编译配置参考FlutterOpenHarmony化引擎编译环境推荐配置版本python3.8-3.11,3.12版本会出现报错java17DevEco-Studio/command-line-tools,5.0.3.300+包含了ohpm,hvigorw,node,OpenHarmonySDKXcode14.3如何生成flutter.ha
高可用系统：让服务永不中断的秘密爱吃青菜的大力水手 linux 运维服务器
高可用系统：让服务永不中断的秘密在数字化时代，系统的高可用性（HighAvailability,HA）至关重要。无论是电商平台还是金融服务，系统宕机都可能带来巨大损失。那么，什么是高可用系统？它又是如何实现的呢？本文将为您揭开高可用系统的神秘面纱，带您了解集群、节点、脑裂等核心概念，并推荐最经济实用的集群架构。什么是集群与节点？集群（Cluster）集群是一组协同工作的服务器，共同完成任务。它们就
Selenium测试安全策略：防止逆向工程软件工程实践软件工程最佳实践 AI软件构建大数据系统架构 selenium 网络 tcp/ip ai
Selenium测试安全策略：防止逆向工程关键词：Selenium自动化测试、逆向工程、代码安全、敏感信息保护、测试脚本防护摘要：本文从Selenium自动化测试的实际场景出发，深入解析测试脚本面临的逆向工程风险（如敏感信息泄露、测试逻辑被破解），通过生活案例类比技术概念，系统讲解代码混淆、敏感信息加密、日志脱敏等核心安全策略，并提供可落地的实战代码与工具推荐，帮助测试人员构建“防逆向”的安全测试
Serverless架构下的持续交付实践软件工程实践软件工程最佳实践 AI软件构建大数据系统架构 serverless 架构运维 ai
Serverless架构下的持续交付实践关键词：Serverless架构、持续交付、DevOps、无服务器计算、自动化部署摘要：本文深入探讨了Serverless架构下的持续交付实践。首先介绍了Serverless架构和持续交付的背景知识，接着解释了相关核心概念及其关系，详细阐述了核心算法原理与操作步骤，通过数学模型加深理解，结合实际项目案例展示了代码实现与解读，探讨了实际应用场景，推荐了相关工具
WPF中获取主窗体周杰伦fans ai学习参考 WPF笔记学习C#的笔记 wpf
在WPF的MVVM模式中，通常不直接引用主窗体（MainWindow），而是通过依赖注入、事件聚合器或命令参数传递等方式实现逻辑解耦。以下是几种推荐方法：方法1：依赖注入（推荐）在ViewModel中定义一个接口，通过构造函数注入主窗体服务。步骤：定义接口（可选）：publicinterfaceIMainWindowService{voidShowMessage(stringmessage);}在
探索Android开发新境界：Kotlin协程实战乐园黎情卉Desired
探索Android开发新境界：Kotlin协程实战乐园AndroidCoroutinesPlaygroundAndroidCoroutinesPlayground项目地址:https://gitcode.com/gh_mirrors/an/AndroidCoroutinesPlayground在快速迭代的移动开发领域，异步处理和代码结构的清晰性至关重要。今天，我们向您隆重推荐一个极佳的开源项目——
Python Flask Web教程004：Flask 变量规则若北辰 flask python 前端
FlaskWeb教程004：Flask变量规则1.Flask变量规则2.实例3.转换器构建规则4.规范的URL5.路由尾部有无斜杠的区别路由尾部斜杠的影响推荐使用带尾斜杠的路由结论1.Flask变量规则通过向规则参数添加变量部分，可以动态构建URL。此变量部分标记为。它作为关键字参数传递给与规则相关联的函数。2.实例在以下示例中，route()装饰器的规则参数包含附加到URL'/hello’的。因
Flask(六) 数据库操作SQLAlchemy @昵称不存在 Flask 数据库 flask
文章目录一、准备工作二、最小化可运行示例✅补充延迟绑定方式（推荐方式）三、数据库基本操作（增删改查）1.插入数据（增）2.查询数据（查）3.更新数据（改）4.删除数据（删）四、其他有用方法五、常用字段类型六、初始化数据库脚本（推荐）sqlalchemy实例基本使用常见方法速查多表查询（JOIN）原始SQL语句（可选）示例：分页+排序推荐：使用Flask-SQLAlchemy提供的简写风格完整的Fl
重排利器：行列式点过程（DPP）在推荐系统中的应用 Jay Kay 推荐算法数学建模推荐算法
在推荐系统的重排阶段，我们常面临结果同质化问题——精排结果相似物料扎堆，导致用户体验单调。行列式点过程（DeterminantalPointProcesses,DPP）通过数学建模相关性与多样性的平衡，成为解决该问题的经典方案。一、DPP的核心思想DPP将推荐列表视为一个点过程，其核心是计算子集出现的概率。给定候选集(Z)（精排输出的Top-N物料），DPP定义子集(Y\subseteqZ)出现的
推荐算法特征工程实战：用户与物料动态画像构建指南 Jay Kay 推荐算法推荐算法算法机器学习
在推荐系统的特征工程中，动态画像是提升推荐精准性的核心武器。通过捕捉用户行为偏好和物料热度变化，算法能实现千人千面的精准推荐。本文结合两张关键图表，深入解析动态画像的构建方法与工程实践。一、用户动态画像：六大维度精准刻画兴趣偏好用户动态画像基于六个关键维度构建（如表2-1所示），形成"6W"行为模型：用户粒度物料属性时间粒度动作类型统计对象统计方法1.核心维度解析（附典型场景）维度可选值应用场景用
Git安装全攻略：避坑指南与最佳实践编程在手天下我有 git
1、系统环境检查确认操作系统版本（Windows/macOS/Linux）及位数（32/64位）检查是否已安装旧版Git，避免版本冲突确保系统环境变量配置权限2、下载安装包注意事项官方下载地址推荐（避免第三方镜像源）选择与系统匹配的安装包类型（如Windows选.exe，macOS选.dmg）验证安装包完整性（校验SHA值或数字签名）3、安装过程中的关键选项路径选择：避免中文或特殊字符路径组件选择
[特殊字符] Git团队协作实战指南真实的菜 git git elasticsearch 大数据
Git团队协作实战指南让多人开发不再是噩梦！从菜鸟到大神的团队协作进阶之路快速导航为什么团队协作这么重要？⚔️代码冲突？别慌！代码审查：让Bug无处遁形团队规范：统一江湖️神器推荐：工欲善其事沟通艺术：话说三分权限管理：该给的给，该收的收CI/CD：让机器替你干活问题追踪：一个都不能少新人培训：从零到英雄最佳实践：前人栽树常见坑点：踩坑指南实战案例：真刀真枪工具箱：装备升级为什么团队协作这么重要？
信息检索简介——文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2005年8月17日至9月3日在美国加利福尼亚州伯克莱纳举行了SIGIR国际会议（中文全称“计算机信息retrieval国际会议”），这是信息检索领域的顶级会议之一。该会议由ACM主办，主题涵盖了包括文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等多个热门方向。此次会议是第一次将信息检索作为一个学科，并取得重大突破。本文试图对SIGIR进行一个完整的介绍，阐述
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

推荐系统实践（三）ICF和UCF

你可能感兴趣的:(推荐算法实践)