caxiou

【毕业设计】协同过滤商品推荐系统 - python 深度学习

文章目录

0 前言
1 简介
2 常见推荐算法
- 2.1 协同过滤
- 2.2 分解矩阵
- 2.3 聚类
- 2.4 深度学习
3 协同过滤原理
4 系统设计
- 4.1 示例代码(py)
5 系统展示
- 5.1 系统界面
- 5.2 推荐效果
6 最后

0 前言

Hi，大家好，这里是丹成学长的毕设系列文章！

对毕设有任何疑问都可以问学长哦!

这两年开始，各个学校对毕设的要求越来越高，难度也越来越大… 毕业设计耗费时间，耗费精力，甚至有些题目即使是专业的老师或者硕士生也需要很长时间，所以一旦发现问题，一定要提前准备，避免到后面措手不及，草草了事。

为了大家能够顺利以及最少的精力通过毕设，学长分享优质毕业设计项目，今天要分享的新项目是

基于协同过滤的商品推荐系统

学长这里给一个题目综合评分(每项满分5分)

难度系数：4分
工作量：4分
创新点：3分

选题指导, 项目分享：

https://gitee.com/yaa-dc/BJH/blob/master/gg/cc/README.md

1 简介

推荐系统，是当今互联网背后的无名英雄。

我们在某宝首页看见的商品，某条上读到的新闻，某度上的搜索列表，甚至在各种地方看见的广告，都有赖于推荐算法和系统.

本片文章讲述有哪些常用的推荐算法, 协同过滤推荐算法的原理, 以及如何使用协同过滤算法设计一个商品推荐毕业设计系统.

2 常见推荐算法

2.1 协同过滤

协同过滤(Collaborative Filtering)作为推荐算法中最经典的类型，包括在线的协同和离线的过滤两部分。所谓在线协同，就是通过在线数据找到用户可能喜欢的物品，而离线过滤，则是过滤掉一些不值得推荐的数据，比比如推荐值评分低的数据，或者虽然推荐值高但是用户已经购买的数据。

协同过滤的模型一般为m个物品，m个用户的数据，只有部分用户和部分数据之间是有评分数据的，其它部分评分是空白，此时我们要用已有的部分稀疏数据来预测那些空白的物品和数据之间的评分关系，找到最高评分的物品推荐给用户。

一般来说，协同过滤推荐分为三种类型。第一种是基于用户(user-based)的协同过滤，第二种是基于项目(item-based)的协同过滤，第三种是基于模型(model based)的协同过滤。

基于用户的协同过滤的基本原理是，根据所有用户对物品或者信息的偏好，发现与当前用户口味和偏好相似的用户群，然后基于这些用户的历史偏好，为当前用户进行推荐。

假设用户A喜欢物品A、物品C，用户B喜欢物品B，用户C喜欢物品A、物品C和物品D。从这些用户的历史偏好中，我们可以看出用户A和用户C的偏好是类似的。同时我们可以看到用户C喜欢物品D，所以我们可以猜想用户A可能也喜欢物品D，因此可以把物品D推荐给用户A。

2.2 分解矩阵

这是一个非常优雅的推荐算法，因为当涉及到矩阵分解时，我们通常不会太多地去思考哪些项目将停留在所得到矩阵的列和行中。但是使用这个推荐引擎，我们清楚地看到，u是第i个用户的兴趣向量，v是第j个电影的参数向量。

所以我们可以用u和v的点积来估算x(第i个用户对第j个电影的评分)。我们用已知的分数构建这些向量，并使用它们来预测未知的得分。

例如，在矩阵分解之后，Ted的向量是(1.4; .8)，商品A的向量是(1.4; .9)，现在，我们可以通过计算(1.4; .8)和(1.4; .9)的点积，来还原商品A-Ted的得分。结果，我们得到2.68分。
　　　　

2.3 聚类

上面两种算法都极其简单，适用于小型系统。在这两种方法中，我们把推荐问题当做一个有监督机器学习任务来解决。

现在，该开始用无监督学习来解决问题了。

假设我们正在建立一个大型推荐系统，这时协同过滤和矩阵分解花费的时间更长了。第一个浮现在脑海里的解决之道，就是聚类。

业务开展之初，缺乏之前的用户数据，聚类将是最好的方法。

不过，聚类是一种比较弱的个性化推荐，因为这种方法的本质是识别用户组，并对这个组内的用户推荐相同的内容。

当我们有足够数据时，最好使用聚类作为第一步，来缩减协同过滤算法中相关邻居的选择范围。这个方法还能挺高复杂推荐系统的性能。

每个聚类都会根据其中用户的偏好，来分配一组典型的偏好。每个聚类中的用户，都会收到为这个聚类计算出的推荐内容。

2.4 深度学习

在过去的十年中，神经网络已经取得了巨大的飞跃。如今，神经网络已经得以广泛应用，并逐渐取代传统的机器学习方法。

接下来，我要介绍一下YouTube如何使用深度学习方法来做个性化推荐。

毫无疑问，由于体量庞大、动态库和各种观察不到的外部因素，为YouTube用户提供推荐内容是一项非常具有挑战性的任务。

根据《Deep Neural Networks for YouTube Recommendations》( https://static.googleusercontent.com/media/research.google.com/ru//pubs/archive/45530.pdf )，YouTube的推荐系统算法由两个神经网络组成：一个用于候选生成，一个用于排序。如果你没时间仔细研究论文，可以看看我们下面给出的简短总结。

以用户的浏览历史为输入，候选生成网络可以显著减小可推荐的视频数量，从庞大的库中选出一组最相关的视频。这样生成的候选视频与用户的相关性最高，然后我们会对用户评分进行预测。

这个网络的目标，只是通过协同过滤提供更广泛的个性化。

进行到这一步，我们得到一组规模更小但相关性更高的内容。我们的目标是仔细分析这些候选内容，以便做出最佳的选择。

这个任务由排序网络完成。

所谓排序就是根据视频描述数据和用户行为信息，使用设计好的目标函数为每个视频打分，得分最高的视频会呈献给用户。

通过这两步，我们可以从非常庞大的视频库中选择视频，并面向用户进行有针对性的推荐。这个方法还能让我们把其他来源的内容也容纳进来。

推荐任务是一个极端的多类分类问题。这个预测问题的实质，是基于用户(U)和语境©，在给定的时间t精确地从库(V)中上百万的视频类(i)中，对特定的视频观看(Wt)情况进行分类。

3 协同过滤原理

使用基于物品的协同过滤，需要维护一个物品相似度矩阵；使用基于用户的协同过滤，需要维护一个用户相似度矩阵。

两用户之间的相似度的计算其实很简单，用户i与用户j的相似度 = （i、j都打开过的网页数）/根号（i打开过的网页数 * j打开过的网页数）。这个计算与“基于物品的协同过滤”中的物品之间相似度的计算是类似的。

上面是一个用户相似度计算的案例。我们试着计算A和D之间的相似度。从“用户打开过的网页”可以看出，A和D都打开过的网页只有d，也就是1个。用户A打开过的网页数=3，用户D打开过的网页数=3。所以A和D的相似度=1/根号（3*3）。其他的计算也是类似的。

有了用户之间的相似度之后，就可以计算推荐度了。假设e是刚刚发布的文章，这时候用户B、C、D都浏览到e新闻的标题，其中C、D点击了，我们就可以计算A对e的兴趣度。

A对e的兴趣度=A与B的相似度B对e的兴趣度 + A与C的相似度C对e的兴趣度 + A与D的相似度*D对e的兴趣度。因为我们这里用的不是评分制，而是考虑是否点击，那么D点击了e，D对e的兴趣度=1。

A对e的兴趣度 = 1/根号(6)*1 + 1/根号(6)*1 + 1/根号(9)*1

所以，比如100篇新的文章出来之后，对部分用户进行了曝光，然后就可以根据用户相似度，来预计其他用户对这篇文章的兴趣度，进而挑选这100篇中预计兴趣度最高的30篇曝光给这群用户。

4 系统设计

4.1 示例代码(py)

from abc import ABCMeta, abstractmethod
import numpy as np
from collections import defaultdict


class CF_base(metaclass=ABCMeta):
    def __init__(self, k=3):
        self.k = k
        self.n_user = None
        self.n_item = None

    @abstractmethod
    def init_param(self, data):
        pass

    @abstractmethod
    def cal_prediction(self, *args):
        pass

    @abstractmethod
    def cal_recommendation(self, user_id, data):
        pass

    def fit(self, data):
        # 计算所有用户的推荐物品
        self.init_param(data)
        all_users = []
        for i in range(self.n_user):
            all_users.append(self.cal_recommendation(i, data))
        return all_users


class CF_knearest(CF_base):
    """
    基于物品的K近邻协同过滤推荐算法
    """

    def __init__(self, k, criterion='cosine'):
        super(CF_knearest, self).__init__(k)
        self.criterion = criterion
        self.simi_mat = None
        return

    def init_param(self, data):
        # 初始化参数
        self.n_user = data.shape[0]
        self.n_item = data.shape[1]
        self.simi_mat = self.cal_simi_mat(data)
        return

    def cal_similarity(self, i, j, data):
        # 计算物品i和物品j的相似度
        items = data[:, [i, j]]
        del_inds = np.where(items == 0)[0]
        items = np.delete(items, del_inds, axis=0)
        if items.size == 0:
            similarity = 0
        else:
            v1 = items[:, 0]
            v2 = items[:, 1]
            if self.criterion == 'cosine':
                if np.std(v1) > 1e-3:  # 方差过大，表明用户间评价尺度差别大需要进行调整
                    v1 = v1 - v1.mean()
                if np.std(v2) > 1e-3:
                    v2 = v2 - v2.mean()
                similarity = (v1 @ v2) / np.linalg.norm(v1, 2) / np.linalg.norm(v2, 2)
            elif self.criterion == 'pearson':
                similarity = np.corrcoef(v1, v2)[0, 1]
            else:
                raise ValueError('the method is not supported now')
        return similarity

    def cal_simi_mat(self, data):
        # 计算物品间的相似度矩阵
        simi_mat = np.ones((self.n_item, self.n_item))
        for i in range(self.n_item):
            for j in range(i + 1, self.n_item):
                simi_mat[i, j] = self.cal_similarity(i, j, data)
                simi_mat[j, i] = simi_mat[i, j]
        return simi_mat

    def cal_prediction(self, user_row, item_ind):
        # 计算预推荐物品i对目标活跃用户u的吸引力
        purchase_item_inds = np.where(user_row > 0)[0]
        rates = user_row[purchase_item_inds]
        simi = self.simi_mat[item_ind][purchase_item_inds]
        return np.sum(rates * simi) / np.linalg.norm(simi, 1)

    def cal_recommendation(self, user_ind, data):
        # 计算目标用户的最具吸引力的k个物品list
        item_prediction = defaultdict(float)
        user_row = data[user_ind]
        un_purchase_item_inds = np.where(user_row == 0)[0]
        for item_ind in un_purchase_item_inds:
            item_prediction[item_ind] = self.cal_prediction(user_row, item_ind)
        res = sorted(item_prediction, key=item_prediction.get, reverse=True)
        return res[:self.k]


class CF_svd(CF_base):
    """
    基于矩阵分解的协同过滤算法
    """

    def __init__(self, k=3, r=3):
        super(CF_svd, self).__init__(k)
        self.r = r  # 选取前k个奇异值
        self.uk = None  # 用户的隐因子向量
        self.vk = None  # 物品的隐因子向量
        return

    def init_param(self, data):
        # 初始化，预处理
        self.n_user = data.shape[0]
        self.n_item = data.shape[1]
        self.svd_simplify(data)
        return data

    def svd_simplify(self, data):
        # 奇异值分解以及简化
        u, s, v = np.linalg.svd(data)
        u, s, v = u[:, :self.r], s[:self.r], v[:self.r, :]  # 简化
        sk = np.diag(np.sqrt(s))  # r*r
        self.uk = u @ sk  # m*r
        self.vk = sk @ v  # r*n
        return

    def cal_prediction(self, user_ind, item_ind, user_row):
        rate_ave = np.mean(user_row)  # 用户已购物品的评价的平均值(未评价的评分为0)
        return rate_ave + self.uk[user_ind] @ self.vk[:, item_ind]  # 两个隐因子向量的内积加上平均值就是最终的预测分值

    def cal_recommendation(self, user_ind, data):
        # 计算目标用户的最具吸引力的k个物品list
        item_prediction = defaultdict(float)
        user_row = data[user_ind]
        un_purchase_item_inds = np.where(user_row == 0)[0]
        for item_ind in un_purchase_item_inds:
            item_prediction[item_ind] = self.cal_prediction(user_ind, item_ind, user_row)
        res = sorted(item_prediction, key=item_prediction.get, reverse=True)
        return res[:self.k]


if __name__ == '__main__':
    # data = np.array([[4, 3, 0, 5, 0],
    #                  [4, 0, 4, 4, 0],
    #                  [4, 0, 5, 0, 3],
    #                  [2, 3, 0, 1, 0],
    #                  [0, 4, 2, 0, 5]])
    data = np.array([[3.5, 1.0, 0.0, 0.0, 0.0, 0.0],
                     [2.5, 3.5, 3.0, 3.5, 2.5, 3.0],
                     [3.0, 3.5, 1.5, 5.0, 3.0, 3.5],
                     [2.5, 3.5, 0.0, 3.5, 4.0, 0.0],
                     [3.5, 2.0, 4.5, 0.0, 3.5, 2.0],
                     [3.0, 4.0, 2.0, 3.0, 3.0, 2.0],
                     [4.5, 1.5, 3.0, 5.0, 3.5, 0.0]])
    # cf = CF_svd(k=1, r=3)
    cf = CF_knearest(k=1)
    print(cf.fit(data))

5 系统展示

5.1 系统界面

5.2 推荐效果

6 最后

Spark大数据处理讲课笔记4.8 Spark SQL典型案例酒城译痴无心剑 #Spark基础学习笔记（1）spark 笔记 sql
文章目录零、本讲学习目标一、使用SparkSQL实现词频统计（一）提出任务（二）实现任务1、准备数据文件2、创建Maven项目3、修改源程序目录4、添加依赖和设置源程序目录5、创建日志属性文件6、创建HDFS配置文件7、创建词频统计单例对象8、启动程序，查看结果9、词频统计数据转化流程图二、使用SparkSQL计算总分与平均分（一）提出任务（二）完成任务1、准备数据文件2、新建Maven项目3、修
Python迭代器和生成器的区别及其各自实现方式和使用场景
目录1.迭代器(Iterator)1.1迭代器的创建1.2自定义迭代器2.生成器(Generator)2.1生成器的创建2.2生成器一个范围2.3生成器死循环2.4生成器大文件处理3.区别对比4.总结1.迭代器(Iterator)迭代器提供了一种惰性（lazyevaluation）获取数据的方法，使得我们能够逐步访问序列中的元素，而无需一次性加载所有数据。其主要优点包括节省内存、提高性能、支持自定
Python推导式，常见语句和内置函数拉不拉嘟妍算法
目录1.Python推导式1.1列表推导式1.2字典推导式1.3集合推导式2.常见语句2.1赋值语句2.2条件语句2.2.1if-elif-else2.2.3match-case2.3循环语句2.3.1for循环2.3.2while循环2.3.3range2.4循环控制语句2.4.1break2.4.2continue2.4.3pass2.5函数定义语句2.6异常处理语句2.6.1try-exce
Python的基础变量类型之字符串和数字类型拉不拉嘟妍 python 开发语言
目录1.基础变量类型1.1字符串str1.1.1基本特征1.1.2字符串操作1.1.2.1字符串连接1.1.2.2相邻的两个或多个字符串字面值会自动合并1.1.2.3字符串多次重复1.1.2.4字符串下标访问1.1.2.5字符串切片访问1.1.2.4关系判断1.1.2.5格式化表达式1.1.2.6f-string1.2数字类型1.2.1整数int1.2.2浮点数float1.2.3布尔类型bool
【大数据学习 | Spark-Core】RDD的概念与Spark任务的执行流程 Vez'nan的幸福生活大数据 spark oracle sql json
1.RDD的设计背景在实际应用中，存在许多迭代式计算，这些应用场景的共同之处是，不同计算阶段之间会重用中间结果，即一个阶段的输出结果会作为下一个阶段的输入。但是，目前的MapReduce框架都是把中间结果写入到HDFS中，带来了大量的数据复制、磁盘IO和序列化开销。显然，如果能将结果保存在内存当中，就可以大量减少IO。RDD就是为了满足这种需求而出现的，它提供了一个抽象的数据架构，我们不必担心底层
基于Python根据两个字符串给出相似度/近似度_Python实现字符串语义相似度算法（附上多种实现算法）袁袁袁袁满 Python实用技巧大全 python 算法开发语言相似度自然语言处理相似度算法 sklearn
以下是几种基于语义的字符串相似度计算方法，每种方法都会返回0.0到1.0之间的相似度分数（保留一位小数）。文章目录方法1：计算Levenshtein距离(基于字符的相似度)方法2：使用Sentence-BERT预训练模型方法3：使用spaCy进行语义相似度比较方法4：使用spaCy和词向量方法5：使用UniversalSentenceEncoder(USE)方法6：使用BERT-as-Servic
网上在天猫购物真的会便宜的吗？省妞铭泽导师
天猫购物真的会更便宜吗？揭秘省钱新利器——省妞App在数字化时代，网购已成为我们日常生活中不可或缺的一部分，而天猫作为阿里巴巴旗下的综合性电商平台，凭借其丰富的商品种类、便捷的购物体验和强大的品牌背书，赢得了广大消费者的青睐。然而，面对琳琅满目的商品和各式各样的促销活动，许多消费者不禁会问：天猫购物真的会更便宜吗？今天，我们就来探讨这个问题，并在此过程中向大家推荐一款省钱新利器——省妞App。天猫
python 自动获取通达信自定义板块股票 2503_92652889 python 开发语言前端
对于个人量化开发投资者来讲，有两个事情最难，1、一个好的策略，2、好的行情数据源。好的策略相信大部分人自己都会有想对应的策略，但想把这些策略全部搬到量化平台还是挺难的，今天介绍一个比较简单的方案。使用通达信的预警功能，或者是使用策略股票池功能，来自动计算哪些标的符合自己的要求。然后通过下面的py代码就可以直接读取到数据，并保存在dltp.csv文件中进行存储。当然这是第一步获取标的。其后是获取行情
Python基础-列表香辣西红柿炒蛋 Python python
list列表由多个元素组成的数据类型>>>可迭代的数据类型[],列表中的每一个元素，用逗号隔开a=[]#创建了一个空列表b=[3,4,5,"hello","python",3.14,5.55]print(type(a))#print(type(b))#读取列表的元素下标print(b[2])#5列表的元素个数len()print(len(b))#7切片：切片开始位置的索引（包含），切片结束位置的索
Python 进阶（九）：网络编程海哥编程 Python进阶 python 网络开发语言
目录1.简介2.使用2.1API介绍2.2TCP方式2.3UDP方式1.简介网络编程主要的工作就是在发送端将信息通过指定的协议进行组装包，在接收端按照规定好的协议对包进行解析并提取出对应的信息，最终达到通信的目的。传输协议主要有TCP和UDP，TCP需要建立连接，是可靠的、基于字节流的协议，通常与IP协议共同使用；UDP不需要建立连接，可靠性差，但速度更快。网络编程有一个重要的概念socket（套
Python爬虫进阶：解决反爬虫机制的技巧程序员威哥 python 爬虫开发语言
✨前言在爬虫初学阶段，我们常常使用requests和BeautifulSoup就能轻松抓取网页数据。但当目标网站对爬虫设置了各种“反爬虫机制”时，简单的方法往往无效，甚至直接被封禁IP或跳转到验证页面。本篇文章将深入讲解常见的反爬虫机制类型，并配合Python解决策略与代码实例，帮助你掌握破解反爬的核心技巧，提升数据抓取成功率与稳定性。️一、常见反爬虫机制类型反爬类型说明举例网站User-Agen
如何用python爬虫下载视频_用python做爬虫下载视频 weixin_39675963 如何用python爬虫下载视频
用python有一段时间了，对python是十二分喜爱，在我看来python是个好工具，可以轻松简洁的帮我完成一些我想要完成的工作。下面和大家分享一下我用python爬取某网站视频的案例。用python去保存网站的视频，主要是为了后续的查看和备份。如果有需要做爬虫研究的同学可以一起探讨下。本文主要用到requests库和BeautifulSoup库。1.抓取视频第一步，分析目标网站的地址本文中我爬
深入解析 Pandas：Python 数据分析的强大工具 chy存钱罐 pandas python 数据分析
引言在当今数据驱动的时代，数据分析成为了从各个领域挖掘价值的关键手段。Python作为一种广泛应用于数据科学的编程语言，拥有众多强大的库来支持数据分析任务。其中，Pandas无疑是最为耀眼的明星之一。Pandas为Python提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。无论是数据清洗、预处理，还是复杂的数据分析和建模，Pandas都能发挥巨大的作用，极大地提升数据处理
2025年03月中国电子学会青少年软件编程（Python）等级考试试卷（一级）答案 + 解析伶俐角少儿编程 python 少儿编程青少年编程等级考试中国电子学会等级考试
青少年软件编程（Python）等级考试试卷（一级）分数：100题数：37一、单选题(共25题，共50分)1.下列哪个软件不能运行Python程序？（）A.JupyterNotebookB.PycharmC.原版的ScratchD.IDLE正确答案：C答案解析：本题考察的Python编程软件，原版的Scratch不是Python的编程软件2.下面print语句，哪一个是正确的用法？（）A.print
2025年03月中国电子学会青少年软件编程（Python）等级考试试卷（四级）答案 + 解析伶俐角少儿编程 python 青少年编程中国电子学会青少年编程等级考试少儿编程
青少年软件编程（Python）等级考试试卷（四级）分数：100题数：38一、单选题(共25题，共50分)1.下列程序段的运行结果是？（）defs(n):ifn==3:return4else:returnn+s(n-1)print(s(5))A.1B.12C.13D.15正确答案：C答案解析：函数f作用是如果是3，返回值是4，如果是非3，就返回n+s(n-1)。因实参为5，运行后返回值依次是5+s(
python爬虫入门：批量下载图片有盐、在见 python 爬虫开发语言
引言：爬虫也被称为网络蜘蛛（Spider），是一种自动化的软件程序，能够在互联网上漫游，按照一定的规则和算法抓取数据。爬虫技术广泛应用于搜索引擎、数据挖掘、信息提取等领域，是互联网技术的重要组成部分。摘要：很多初学者对于一个这样新奇的事务当然愿意去探索，我也一样，突然想要学一点关于python爬虫的知识，说干就干！那就学！如果以下说的有错误，及时指出，定会修改。本文将介绍如何从图片网站批量下载图片
Python列表去重的4种核心方法详解与实战指南 PythonicCC python 开发语言
在Python开发中，处理列表数据时经常需要去除重复元素。本文将详细介绍4种最实用的列表去重方法，包括它们的实现原理、代码示例和性能特点，并提供实际应用建议。方法1：集合(set)去重法（最快速）原理与实现利用集合自动去除重复元素的特性，转换为集合后再转回列表：original_list=[11,77,33,55,33,55,77,99,44,77]unique_list=list(set(ori
返利网站哪个最好用，返利最高的软件app有哪些？小小编007
现在网上购物基本没有人不知道返利了吧？淘宝，拼多多，京东等各大电商平台90%以上商品都有隐藏优惠券和返利。以前商家靠刷单提升商品销量和排名，但这是各大平台网站禁止的。所以返利模式就慢慢兴起来了，而且规模越来越大。众多返利软件网站，哪个app给的返利最高，商品最全，用户体验最好呢？果冻宝盒是一个上架于2016年12月的综合导购返利app，经过近6年发展，平台包含淘宝，京东，拼多多，唯品会，网易考拉，
Flask转发 [Siemens.Sistar.Api.dll] Braumat API---＞DLL to restAPI
文章目录importosimportclr#导入pythonnet提供的clr模块fromtypingimportAnyimportfunc_timeoutfromfunc_timeoutimportfunc_set_timeoutfromfunc_timeout.exceptionsimportFunctionTimedOut#加载DLL文件current_path=os.getcwd()dll
CloudSimPy 开源项目使用教程黎连研Shana
CloudSimPy开源项目使用教程1.项目的目录结构及介绍CloudSimPy是一个数据中心作业调度仿真框架，基于离散事件仿真框架SimPy，利用Python语言进行实现。项目的目录结构如下：CloudSimPy/├──core/│├──config/│├──job/│├──machine/│├──cluster/│├──algorithm/│├──scheduler/│├──broker/│├
Java 大视界 -- Java 大数据在智能教育在线学习平台用户活跃度提升与留存策略研究中的应用（354）青云交大数据新视界 Java 大视界 java 智能教育在线学习平台用户活跃度留存策略个性化推荐行为分析
Java大视界--Java大数据在智能教育在线学习平台用户活跃度提升与留存策略研究中的应用（354）引言：正文：一、Java构建的用户行为感知系统1.1多维度行为数据实时分析1.2用户画像动态更新（全周期标签）二、Java驱动的个性化学习与留存策略2.1智能推荐引擎（课程/练习匹配）2.2留存策略自动化（全周期干预）三、实战案例：从“流失”到“留存”的蜕变3.1K12平台：让“跟不上”的学生留下来
Flask后端框架的路由系统详解 AI大模型应用实战 flask python 后端 ai
Flask后端框架的路由系统详解关键词：Flask、路由系统、URL映射、视图函数、装饰器、动态路由、RESTfulAPI摘要：本文深入探讨Flask框架的路由系统，从基础概念到高级应用全面解析。文章首先介绍路由的基本原理，然后详细讲解Flask的路由实现机制，包括静态路由、动态路由、HTTP方法处理等核心功能。通过Python代码示例和Mermaid流程图，展示路由系统的内部工作原理。最后，结合
Python爬虫实战：全方位解析前程无忧（51job）职位详情爬取及反爬破解 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据库 selenium
1.引言在现代求职招聘市场，前程无忧（51job）作为国内领先的招聘网站，聚合了海量的职位信息。对这些数据进行抓取和分析，不仅能帮助求职者精准定位岗位，也助力企业洞察招聘趋势。本文将从零开始，带你用Python技术完整爬取51job职位详情页数据，讲解反爬破解策略，并附带实用代码示例。2.前程无忧（51job）简介与数据价值平台规模：覆盖全国各行业、数百万条岗位信息。数据特点：职位描述详细，职位标
Python 爬虫（一）：爬虫伪装
目录1简介2伪装策略2.1RequestHeaders问题2.2IP限制问题3总结1简介对于一些有一定规模或盈利性质比较强的网站，几乎都会做一些防爬措施，防爬措施一般来说有两种：一种是做身份验证，直接把虫子挡在了门口，另一种是在网站设置各种反爬机制，让虫子知难而返。2伪装策略我们知道即使是一些规模很小的网站通常也会对来访者的身份做一下检查，如验证请求Headers，而对于那些上了一定规模的网站就更
Python爬虫教程：爬取知识产权裁判文书数据 Python爬虫项目 python 爬虫开发语言数据分析自动化
引言知识产权（IP）裁判文书是法院在处理知识产权案件时作出的判决、裁定等法律文书。这些文书包含了案件的基本信息、法院的判决意见以及对案件相关知识产权的解释。爬取知识产权裁判文书数据不仅有助于法律工作者、学者进行案例分析和法律研究，也为企业提供了分析竞争对手和行业趋势的宝贵数据。本文将介绍如何使用Python爬虫技术来抓取中国法院网、裁判文书网等网站上的知识产权裁判文书。通过本文，你将学会如何获取并
Java 大视界 -- Java 大数据机器学习模型在金融市场波动预测与资产配置动态调整中的应用（355）青云交大数据新视界 Java 大视界 java 大数据机器学习金融市场波动预测资产配置 LSTM
Java大视界--Java大数据机器学习模型在金融市场波动预测与资产配置动态调整中的应用（355））引言：正文：一、Java构建的金融数据处理架构1.1多源数据实时融合与清洗1.2跨市场数据关联（风险传导分析）二、Java驱动的市场波动预测模型2.1LSTM+随机森林融合预测（股市案例）2.2资产配置动态调整（风险预算模型）三、实战案例：从“被动亏损”到“主动盈利”3.1公募基金：加息波动中的1.
[hot 100] 移动零-Python3 每日一道力扣算法数据结构指针
1.左指针始终指向左侧无零序列尾后一个位置，右边指针如果指到非零值则和左指针进行交换2.如果右指针指到非零值，则交换后，左指针向右移到左序列尾的后一个位置，为下一次交换做准备3.如果右指针指向0，则右指针向右移动指向下一次可能交换的值
使用Mac进行深度学习时遇到.DS_Store报错解决办法每日一道力扣 macos 深度学习人工智能
mac在每个文件夹中都会有一个隐藏文件.DS_Store用来记录一些位置信息。在我们使用os.listdir(path)时，会获取路径中的所有文件夹名称，因此会把.DS_Store也收纳进来，导致报错因此需要找到获取文件夹名称那一步，使用编译器中的debug功能，看看.DS_Store被存储到了哪里，并删除，下面举一个复现VGG代码时的例子:此时os.listdir(file_path)执行后，l
去读个书，是性价比最高的投资兮若耶
这里的“去读个书”，指的是那种沉浸式的、系统的学习一门课程，让自己从思维方式、社会资源和能力的角度，重新提升某种高度。领英有报告显示，98%愿意进一步学习，65%的人计划未来一年之内深度学习，41%的人还愿意花10万元以上投资MBA教育项目。可见学习真的是生活时尚和一种好的投资方式。作为一个现代职场人，必须要学会把学习本身作为一种必备的发展和投资手段，除了拥有不被后浪拍在沙滩上的能力，同时也保证自
python 字符串常用处理函数 CATTLECODE python java 前端
以下是Python中字符串常用处理函数的系统整理，涵盖字符串创建、修改、查找、分割、判断等核心操作。根据功能分类说明，并附带简洁示例，方便快速查阅和使用。一、字符串创建与基础操作创建字符串Python支持单引号、双引号、三引号创建字符串：s1='Hello'#单引号s2="World"#双引号s3='''Multi-linestring'''#三引号支持多行字符串[6](@ref)访问字符与切片索
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$