ZYH@Smart3S

Python推荐系统学习笔记（4）基于协同过滤的个性化推荐算法实战---UserCF算法（上）

一、相关概念：

1、关于协同过滤：

协同过滤（Collaborative Filtering Recommendation）技术是推荐系统中应用最早和最为成功的技术之一。协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人通过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的目的进而帮助别人筛选信息，回应不一定局限于特别感兴趣的，特别不感兴趣信息的纪录也相当重要。它一般采用最近邻技术，利用用户的历史喜好信息计算用户之间的距离，然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度，系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求，能处理非结构化的复杂对象，如音乐、电影。

协同过滤分为用户协同过滤（User Collaborative Filtering ，UserCF）以及物品协同过滤（Item Collaborative Filtering ，ItemCF）两种形式，简而言之就是：

（1）UserCF：根据用户的相似性，推荐与目标用户相似的用户所喜好的物品。适用于实时新闻，突发信息推荐。

（2）ItemCF ：根据物品的相似性，推荐目标用户所喜好的物品所相似的物品。适用于图书，电子商务，电影推荐。

本文使用UserCF算法，以电影评价数据为例构建推荐系统。

2、UserCF相似性度量公式：

（1）基于评分的相似性度量公式：

sim(u,v) 代表用户 u 和 v 的相似度，I 代表用户 u 和 v 同时评分的物品的集合，Ru,i 代表用户 u 对物品 i 的评分（Rv,i 同理），上划线R 代表用户 u 或 v 的评分的平均值。

（2）基于行为（喜好）的相似性度量公式：

S u,v 代表用户 u 和 v 的相似度；N(u) 和 N(v) 代表用户 u 或 v 行为过的物品集合；分子表示两用户所评分物品的重合程度 ;分母是归一化，惩罚了操作过多的用户对其它用户的相似程度。

在两种相似性度量公式中，基于评分的相似性度量公式更适用于含有用户评分数据的情景下，基于行为（喜好）的相似性度量公式多用于头条推荐以及减少计算量的情景下。

此外还有其它计算公式：（x和y分别代表每个用户对不同物品的评分）

（1）欧几里得（欧氏）距离：

（2）皮尔逊相关系数：

（3）Cosine（余弦）相似度：

3、评分预测公式：

对物品进行推荐的过程，实际上就是对物品的评分进行预测，将较大预测评分的物品推荐给用户的过程，借助相似性度量结果，可以进行物品评分的预测。

（1）基于评分的UserCF的评分预测公式：

Pu,i 代表用户 u 对物品 i 的预测评分，v 代表所有与用户 u 相似的用户个体，rv,i 代表用户 v 对物品 i 的评分，Su,v 代表用户 u 与用户 v 的相似度。

（2）基于喜好的UserCF的行为得分（喜好程度）预测公式：

v 是用户 u 的相似度前 k 的用户，i 是需要进行预测的且用户 u 没有行为过用户 v 行为过的物品，Suv是用户 u 和用户 v 的相似度，rvi 是用户 v 对物品 i 是实际评分。

4、UserCF的局限性：

存在的问题：

（1）对于一个新用户，很难找到其相似用户。

（2）对于一个物品，可能所有近邻用户都没有对其进行打分。

原理局限：

（1）矩阵稀疏问题，在用户-评分矩阵中，用户仅对少量物品进行了评分，造成矩阵0项过多。

（2）当用户数量较多达数百万时，计算损耗较大。

（3）人是善变的，算法无法考虑到人性问题。

用户冷启动问题：用户数据缺失或稀少时无法进行用户相似度计算，解决办法：

（1）引导用户把自己的一些属性表达出来。

（2）利用现有的开放数据平台。

（3）根据用户注册属性。

（4）推荐排行榜单。

二、ItemCF推荐实战：

本文使用PyCharm为代码编写平台。

1、数据集准备：

本实例使用MovieLens 数据集（下载地址：http://files.grouplens.org/datasets/movielens/ml-latest-small.zip，或者https://download.csdn.net/download/smart3s/10946693）中的ratings.csv（用户ID对电影ID的评分）以及movies.csv（电影类别明细）。如下：

ratings.csv movies.csv

2、项目结构：

data文件夹用于存储电影评分数据，production文件夹用于存放推荐代码，util文件夹用于存放用于读取数据的工具文件。

3、reader.py：用于读取用户的点击序列（即每个用户对那些电影进行过评分）以及电影信息（id，名称，类别）。

import os

#获得用户的点击序列
def get_user_click(rating_file):
    #如果路径不存在，返回空数据
    if not os.path.exists(rating_file):
        return {}
    #打开文件
    fp=open(rating_file)
    num=0
    #用于传回的数据
    user_click={}
    #循环数据
    for line in fp:
        #第一行是表头，需要跳过处理
        if num==0:
            num+=1
            continue
        #根据逗号提取每个项目
        item=line.strip().split(',')
        if len(item)<4:
            continue
        [userid,itemid,rating,timestamp]=item
        if float(rating)<3.0:  #如果评分低于3分，则视为该用户不喜欢该电影
            continue
        #将单一用户的点击序列添加至返回数据
        if userid not in user_click:
            user_click[userid]=[]
        user_click[userid].append(itemid)
    fp.close()
    return user_click

#获取电影信息数据
def get_item_info(item_file):
    #若路径不存在则返回空
    if not os.path.exists(item_file):
        return {}
    num=0
    item_info={}
    fp=open(item_file,'r', encoding='UTF-8')
    for line in fp:
        #第一行是表头，需要跳过处理
        if num==0:
            num+=1
            continue
        #根据逗号提取每个项目
        item=line.strip().split(',')
        if len(item)<3: #若单行小于三项过滤（去除问题行）
            continue

        if len(item)==3:
            [itemid,title,genres]=item
        #这个elif语句是由于，有的电影名称中含有逗号，因此造成项数过多，需要另行处理
        elif len(item)>3:
            itemid=item[0]
            genres=item[-1] #获取最后一项
            title=",".join(item[1:-1]) #第一个到最后一个的拼接成为电影名称
        #将电影信息数据返回
        if itemid not in item_info:
            item_info[itemid]=[title,genres]
    fp.close()
    return item_info

4、UserCF.py: 核心算法文件

（1）模块准备：

import sys
sys.path.append("../util")
import util.reader as reader#导入reader
import math
import operator

（2）主方法：

def main_flow():
    #获取用户的点击序列数据
    user_click=reader.get_user_click("../data/ratings.csv")
    #将用户的点击序列转换成电影的被点击序列
    item_click_by_user = transfer_user_click(user_click)
    #获取电影信息数据
    item_info=reader.get_item_info("../data/movies.csv")
    
    #计算用户相似度
    user_sim=cal_user_sim(item_click_by_user)
    #计算推荐结果
    recom_result=cal_recom_result(user_click,user_sim)
    #输出推荐结果
    debug_recom_result(item_info,recom_result,"158")

（3）transfer_user_click函数：将用户的点击序列转换为电影的被点击序列。

#将用户的点击序列转换为电影的被点击序列
def transfer_user_click(user_click):
    #用于返回的数据
    item_click_by_user={}
    #循环用户的点击序列数据
    for user in user_click:
        #获得单一用户的点击序列列表
        item_list=user_click[user]
        #循环点击序列列表
        for itemid in item_list:
            #存储被点击的电影ID的用户
            item_click_by_user.setdefault(itemid,[])
            item_click_by_user[itemid].append(user)
    return item_click_by_user

（4）cal_user_sim方法：计算各个用户间的相似度。

#计算用户相似度
def cal_user_sim(item_click_by_user):
    co_appear={}
    user_click_count={}
    #循环电影的被点击序列
    for itemid,user_list in item_click_by_user.items():
        #循环每个电影的被点击序列的用户列表索引
        for index_i in range(0,len(user_list)):
            #统计各用户id的评分行为个数
            user_i=user_list[index_i]
            user_click_count.setdefault(user_i,0)
            user_click_count[user_i]+=1
            #计算每个用户id和其他用户id的重合程度（共同对电影做出行为的数量）
            for index_j in range(index_i+1,len(user_list)):
                user_j=user_list[index_j]

                #计算所有用户id中，两两id的共同行为电影数量
                co_appear.setdefault(user_i,{})
                co_appear[user_i].setdefault(user_j,0)
                co_appear[user_i][user_j]+=base_contribution_score()

                co_appear.setdefault(user_j, {})
                co_appear[user_j].setdefault(user_i, 0)
                co_appear[user_j][user_i] += base_contribution_score()

    #用户相似度数据
    user_sim_info={}
    #排序后的用户相似度数据
    user_sim_info_sorted={}
    #计算相似度
    for user_i,relate_user in co_appear.items():
        user_sim_info.setdefault(user_i,{})
        for user_j,cotime in relate_user.items():
            user_sim_info[user_i].setdefault(user_j,0)
            user_sim_info[user_i][user_j]=cotime/math.sqrt(user_click_count[user_i]*user_click_count[user_j])

    #对用户相似度数据进行排序
    for user in user_sim_info:
        user_sim_info_sorted[user]=sorted(user_sim_info[user].items(),key=operator.itemgetter(1),reverse=True)

    return user_sim_info_sorted

#基础贡献度函数，默认取1
def base_contribution_score():
    return 1

（5）cal_recom_result方法：计算各个用户的推荐结果。

#计算推荐结果
def cal_recom_result(user_click,user_sim):
    #用于返回的推荐结果
    recom_result={}
    #取用户样本中用户的3个相似用户进行推荐
    topk_user=3
    #选取单一相似用户所行为的前5个电影作为推荐
    item_num = 5

    for user,item_list in user_click.items():
        #当相似用户行为过的电影当前用户行为过，需要过滤掉该电影
        tmp_dict={}
        for itemid in item_list:
            tmp_dict.setdefault(itemid,1)

        recom_result.setdefault(user,{})
        #循环与当前用户相似度前topk的用户信息
        for zuhe in user_sim[user][:topk_user]:
            userid_j,sim_score=zuhe
            if userid_j not in user_click:
                continue
            for itemid_j in user_click[userid_j][:item_num]:
                #过滤掉相似用户与当前用户共同行为过的电影
                if itemid_j in tmp_dict:
                    continue
                #存储推荐信息
                recom_result[user].setdefault(itemid_j,sim_score)
    return recom_result

（6）debug_recom_result方法：输出设定id的推荐信息：

#输出推荐信息
def debug_recom_result(item_info,recom_result,fix_user):
    #userid无效则返回
    if fix_user not in recom_result:
        print("invalid user for recoming result")
        return
    #循环输出推荐的电影信息
    for itemid in recom_result[fix_user]:
        if itemid not in item_info:
            continue
        recom_score=recom_result[fix_user][itemid]
        print(",".join(item_info[itemid])+"\t"+str(recom_score))

（7）运行UserCF.py：

if __name__=="__main__":
    main_flow()

结果：输出了与该用户相似的3个用户所行为过且该用户为行为过的15（5X3）个电影的过滤结果。

三、参考资料

1、https://www.imooc.com/learn/1029

2、https://www.imooc.com/learn/990

3、https://study.163.com/course/introduction/1004092024.htm

4、https://blog.csdn.net/yimingsilence/article/details/54934302

5、https://blog.csdn.net/xiaokang123456kao/article/details/74735992

6、项亮. 推荐系统实践[M]. 人民邮电出版社, 2012.

【算法】回溯算法专题① ——子集型回溯 python 查理零世算法 python
目录引入变形实战演练总结引入子集https://leetcode.cn/problems/subsets/description/给你一个整数数组nums，数组中的元素互不相同。返回该数组所有可能的子集（幂集）。解集不能包含重复的子集。你可以按任意顺序返回解集。示例1：输入：nums=[1,2,3]输出：[[],[1],[2],[1,2],[3],[1,3],[2,3],[1,2,3]]示例2：输
python学习笔记 YYYYYY02020 python 学习笔记
1print不用添加";"，但是加了也行print("666")print('666')print("6'6'6")print("6\"6\'6")print("""666666555""")print("张三"+"李四")2math#引入函数库importmatha=1b=2c=3#b**2就是b的平方x=(-b+(b**2-4*a*c)**(1/2))/2*ax=(-b+math.sqrt(b
Java 在包管理与模块化中的优势：与其他开发语言的比较 nbsaas-boot 开发语言 java
在开发复杂的、规模庞大的软件系统时，包管理和模块化设计起着至关重要的作用。它们不仅决定了代码的组织和可维护性，还直接影响到团队协作效率、扩展性和性能。在众多编程语言中，Java凭借其成熟的生态系统、强类型系统和标准化的包管理机制，成为了大型企业级应用开发的首选之一。本文将探讨Java在包管理和模块化方面的优势，并与其他流行语言（如Rust、Go、Python、JavaScript和C#）进行对比，
python 从知网的期刊导航页面抓取与农业科技相关的数据 go5463158465 python python 科技开发语言
要从知网的期刊导航页面抓取与农业科技相关的数据，并提取《土壤学报》2016年06期的结果，可以使用requests库来获取网页内容，BeautifulSoup库来解析HTML。由于知网页面结构可能会发生变化，在实际使用中，需要根据页面结构的实际情况进行调整。以下是实现该功能的Python代码示例：importrequestsfrombs4importBeautifulSoupdefcrawl_ag
Github 2025-02-01 开源项目月报 Top20 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本月(2025-02-01统计)共有20个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目8TypeScript项目3JupyterNotebook项目2Rust项目2HTML项目2C++项目1Ruby项目1JavaScript项目1Svelte项目1非开发语言项目1Go项目1Ollama:本地大型语言模型设置与运行创建周
Python常用库---pycurl Bingo_大侠 python笔记 python httpx
pycurl简介PyCURL是一个Python接口，它是多协议文件传输库的LIbCURL。类似于URLLIBPython模块，PyCURL可以用来从Python程序获取URL所标识的对象。然而，除了简单的获取，PyCURL公开了LIbCURL的大部分功能，包括：速度-LIbCURL非常快，并且PycURL作为LiCURL之上的薄包装器也是非常快的。PycURL被标榜为比请求快几倍。特性包括多协议支
苦逼测试第十七式：性能测试与瓶颈诊断——简单工具实现高效分析 Python测试之道 python 测试提效 python 功能测试自动化
性能测试关乎系统的稳定性与用户体验，是测试工程师不可忽视的一环。然而，性能测试往往因工具复杂、配置繁琐、瓶颈难以定位而让测试工程师望而却步。特别是小型项目或初学者，面对JMeter、LoadRunner等工具的高学习曲线，常常无从下手。那么，有没有一种简单高效的方式，可以快速上手性能测试，并实现性能瓶颈诊断？答案是：有！本文将结合Python的轻量级工具（如Locust和k6），通过易于实现的解决
python建模的步骤_python基础教程之Python 建模步骤|python基础教程|python入门|python教程... 谭俊云 python建模的步骤
#%%#载入数据、查看相关信息importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportLabelEncoderprint('第一步：加载、查看数据')file_path=r'D:\train\201905data\liwang.csv'band_data=pd.read_csv(file_path,encoding='UTF-8'
python常用库-time asihacker python基础 python 编程语言字符串
python常用库-time第一章时间库time文章目录python常用库-time前言一、time基本使用总结前言提示：time时间库的基本用法。提示：以下是本篇文章正文内容，下面案例可供参考一、time基本使用time模块提供各种时间相关的功能。代码如下（示例）：importtime#将当前时间转换为时间字符串print(time.asctime())#将指定时间转换时间字符串，时间元组的后面
python注意事项：range遍历越索引现象、列表边遍历边修改出现的问题 JU HE python 基础（语法以及多线程等操作）python 开发语言
文章目录前言一、range遍历越索引现象QS1:遍历range(2,2)会发生什么？不会报错，但是也不会遍历到任何内容QS1:遍历range(3,2)会发生什么？不会报错，但是也不会遍历到任何内容二、列表边遍历边修改注意事项（Java的List系列集合使用for-each循环或Iterator遍历集合时也会有下面问题）1避免直接修改列表长度：特别是边遍历边append和pop元素2边遍历边修改里面
No such file or directory: ‘/tmp/tmpxxx/tmpxxx.py‘ Coding的叶子 python tmp mmcls mmclssificatio python
在运行python程序过程中，“Nosuchfileordirectory”是个经常容易出现的错误。这个错误比较常见的原因是路径下缺乏相应的文件，或者缺少相应的python库。解决方法主要是在：（1）在路径下添加缺失的文件或目录。（2）在程序中通过sys.path.append增加文件或目录所在路径。（3）通过pip安装缺失的库。但是，以上所述的情况都不能解决本文所说的错误。我们可以看到，提示的确
python中的time模块 renpingsheng788
time模块－－时间获取和转换time模块提供各种时间相关的功能与时间相关的模块有：time,datetime,calendar必要说明：这个模块的功能不是适用于所有的平台这个模块中定义的大部分函数是调用C平台上的同名函数实现一些术语和约定的解释：1.时间戳(timestamp)的方式：通常来说，时间戳表示的是从1970年1月１日开始按秒计算的偏移量(time.gmtime(0))此模块中的函数无
图像边缘检测与轮廓提取详解及python实现闲人编程 python python 计算机视觉开发语言 Roberts Prewitt Canny 边缘检测
目录图像边缘检测与轮廓提取详解第一部分：图像边缘检测与轮廓提取概述1.1什么是边缘检测和轮廓提取？1.2边缘检测与轮廓提取的应用领域1.3为什么需要边缘检测和轮廓提取？第二部分：常见的图像边缘检测算法2.1Sobel算子2.2Canny边缘检测2.3拉普拉斯算子（LaplacianofGaussian，LoG）2.4Prewitt算子2.5Roberts交叉算子第三部分：图像轮廓提取的基本方法3.
使用 Python 实现无人机实时路径规划的 MPC 算法闲人编程 python python 无人机算法 MPC 路径优化
目录使用Python实现无人机实时路径规划的MPC算法引言1.模型预测控制（MPC）概述1.1定义1.2MPC的基本原理1.3代价函数1.4MPC的特点2.Python中的MPC算法实现2.1安装必要的库2.2定义类2.2.1无人机模型类2.2.2MPC控制器类2.3示例程序3.MPC算法的优缺点3.1优点3.2缺点4.改进方向5.应用场景结论使用Python实现无人机实时路径规划的MPC算法引言
python简单入门---time库的使用不停--- Python入门
time库函数-时间获取：time()ctime()gmtime()-时间格式化：strftime()strptime()-程序计时：sleep(),perf_counter()version1函数描述time()获取当前时间戳即计算机内部时间值，浮点数ctime()获取当前时间并且以易读方式表示，返回字符串––gmtime()获取当前时间，表示为计算机可处理的时间格式>>>time.time()
python的time库老狗在江湖 python time库
time库是python中处理时间的标准库：用处：1.主要用于计算机时间的表达2.提供获取系统时间并格式化输出功能3.提供系统级精确计时功能，用于程序性能分析调用方法：importtimetime.函数名()time库的三种常用函数时间获取：time()ctime()gmtime()时间格式化：strftime()strptime()程序计时：sleep()perf_counter()time库的
基于python的天气预报系统的设计与实现桃宝护卫队 python 开发语言
基于python的天气预报系统的设计与实现DesignandImplementationofaWeatherForecastSystembasedonPython完整下载链接:基于python的天气预报系统的设计与实现文章目录基于python的天气预报系统的设计与实现摘要第一章引言1.1研究背景1.2研究目的1.3研究意义第二章相关技术和方法2.1Python编程语言2.2天气预报接口2.3数据获
python 时间库 time qianchenzhihai python 学习
在开始之前，首先要说明这几点：1.在Python中，通常有这几种方式来表示时间：1）时间戳2）格式化的时间字符串3）元组（struct_time）共九个元素。由于Python的time模块实现主要调用C库，所以各个平台可能有所不同。2.UTC（CoordinatedUniversalTime，世界协调时）亦即格林威治天文时间，世界标准时间。在中国为UTC+8。DST（DaylightSavingT
100种算法【Python版】第44篇——龙格-库塔法 AnFany 算法 python 人工智能龙格-库塔微分方程 ODE
本文目录1算法说明2算法示例：使用龙格-库塔法求解微分方程3算法应用：捕食者-猎物模型4算法可解决问题1算法说明龙格-库塔法最初由德国数学家卡尔·龙格（CarlRunge）和马丁·库塔（WilhelmKutta）在20世纪初提出。它们为求解常微分方程（ODE）提供了一种有效的数值方法，尤其是在处理初值问题时。龙格-库塔法的设计旨在通过提高计算的精度和稳定性，使数值解能更好地逼近真实解。最常用的版本
AI模型升级版0.02 pps-key python AI写作学习 gpt
根据您的需求，我将提供一个升级版的AI对话模型的实现代码，该模型可以在Windows上运行，并支持训练和微调。我们将使用HuggingFace的transformers库和torch库来实现这个目标。同时，我会结合最新的技术趋势，例如强化微调（ReinforcementFine-Tuning），来提升模型的性能。步骤1：安装必要的库首先，确保您的Windows系统上安装了Python（推荐Pyth
python 安装库报错 IOError: [Errno 2] No such file or directory: ‘/tmp/pip-build-qxKbBk/numpy/setup.py‘ 一个人的Coding python pip numpy
我的博客尝试在Ubuntu环境中安装python库时报错：$pipinstallnumpyCollectingnumpyDownloadinghttps://files.pythonhosted.org/packages/1c/8a/0db635b225d2aa2984e405dc14bd2b0c324a0c312ea1bc9d283f2b83b038/numpy-2.0.1.tar.gz(18.
CAPL与外部接口闲人编程 CAPL编程核心25讲 microsoft 服务器运维 CAPL 外部接口 python CANoe
CAPL与外部接口目录CAPL与外部接口1.引言2.CAPL与C/C++交互2.1CAPL与C/C++交互简介2.2CAPL与C/C++交互实现3.CAPL与Python交互3.1CAPL与Python交互简介3.2CAPL与Python交互实现4.CAPL与MATLAB交互4.1CAPL与MATLAB交互简介4.2CAPL与MATLAB交互实现5.案例说明5.1案例1：CAPL与C/C++交互实
mac 安装多个python版本泡了个面 macos python 开发语言
python相关学习资料：https://edu.51cto.com/video/1158.htmlhttps://edu.51cto.com/video/4102.htmlhttps://edu.51cto.com/video/3832.html安装多个Python版本在Mac上的指南作为一名经验丰富的开发者，我经常被问到如何在Mac上安装和管理多个Python版本。这篇文章将详细指导你如何实现
MacBook 安装多版本Python和版本切换详解 GL_C python 开发语言 macos
Mac苹果电脑安装多版本Python和版本切换详解文章概要：本文详细讲解了如何在macbook电脑上通过homebrew安装多版本python，以及如何切换多版本，在不同项目使用不同版本python。本文内容来自：谷流仓AI-ai.guliucang.com前提条件使用电脑：苹果电脑MacOS需要安装好homebrew并设置好镜像源(具体如何安装homebrew参考这篇文章,安装过程中会提示选择什
量化交易系统中+如何实现实时数据分析和决策支持？ openwin_top 量化交易系统开发数据分析数据挖掘数据库架构量化交易机器学习人工智能
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位在量化交易系统中，实现实时数据分析和决策支持是至关重要的。以下是详细的步骤和示例，说明如何实现这一目标。1.数据收集首先，需要收集实时市场数据。这些数据通常来自交易所、市场数据供应商或其他金融数据服
python买卖股票_121. 买卖股票的最佳时机（Python）王小度 python买卖股票
题目难度：★☆☆☆☆类型：数组给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易(即买入和卖出一支股票)，设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天(股票价格=1)的时候买入，在第5天(股票价格=6)的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价
Python----魔法函数__enter__/__exit__的用法 redrose2100 Python python
【原文链接】1、with上下文管理器的用法with用的最多的可能就是打开文件，读写文件的场景，如下代码：withopen("demo.txt","w+",encoding="utf8")asf:f.write("helloworld")其等同于如下代码：f=open("demo.txt","w+",encoding="utf8")f.write("helloworld")f.close()使用wi
Python——魔法方法林浩233 python 开发语言
Python魔法方法魔法方法基本介绍具体方法讲解1.__call__（）2.__enter__（）2.__exit__（）3.__new__（）4.__init__（）__new__方法与__init__方法5.__iter__（）6.__next__（）7.__str__（）8.__getitem__（）9.__setitem__（）10.__delitem__（）11.__getattribu
chatgpt赋能python：初学者指南：用Python进行股票买卖 laingziwei ChatGpt python chatgpt 人工智能计算机
初学者指南：用Python进行股票买卖股票市场是一个复杂的世界，但是有一些简单的工具可以帮助你进入这个市场。Python是一个流行的编程语言，在金融领域也广泛应用。在本文中，我们将介绍如何使用Python进行股票交易。Python如何支持股票买卖Python可以通过第三方库来实现股票交易。Python有许多开源库如twsapi,alpaca-trade-api,td-ameritrade-pyth
python求解买卖股票 jhsignal python leetcode 动态规划
1.假设您有一个数组，其中第i代表的元素是第i天给定股票的价格，如果您只允许最多完成一次交易，请设计一个算法找到最大的利润。注：买入股票之前不能出售股票。示例：输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格；同时，你不能在买入前卖出股票。defmaxp
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默

Python推荐系统学习笔记（4）基于协同过滤的个性化推荐算法实战---UserCF算法（上）

一、相关概念：

二、ItemCF推荐实战：

4、UserCF.py: 核心算法文件

三、参考资料

你可能感兴趣的:(Python,Python,UserCF,个性化推荐,协同过滤,推荐系统)