@李忆如

系列文章梗概

本次大作业主要是以电影推荐系统为例，介绍并实践不同框架下推荐系统的构建。在问题背景介绍部分，首先从推荐算法与关联分析引入，通过推荐系统的动机、架构、评估、应用详解了推荐系统，并对电影推荐系统做了定义与数据集介绍。在推荐系统的算法部分，先分类综述了推荐算法，随后详解了不同类型的协同过滤算法并在本地不同框架下做了推荐实践。在MapReduce部分，首先通过背景与全流程详解了MapReduce的原理，并通过WordCount实现了配置与简单应用，后续完成了基于MapReduce的电影推荐系统构建。在Spark部分，首先通过生态与全流程详解了Spark的原理，后续完成了基于Spark的电影推荐系统。在对比分析部分，分别从原理、数据处理方式、性能等对比MapReduce与Spark框架，并基于两个构建出的推荐系统做性能对比验证，并总结了两种框架的优缺点与选择标准与依据。在方法补充与实践部分，拓展了协同过滤之外的其他推荐算法并实际构建出了对应的电影推荐系统。在系统界面构建部分，简述了系统界面的设计，详解了不同框架、不同数据集下的数据可视化，并分别在Web、APP、Uni-app上构建了相对完整的电影推荐系统，在总结部分，对一些实验趣事与结论进行了补充。参考部分根据类别划分，汇总了本次实验的参考文献与资料。

系列文章目录

第一章推荐系统从入门到入门（1）——推荐系统综述与协同过滤_@李忆如的博客-CSDN博客

第二章推荐系统从入门到入门（2）——简单推荐系统构建（无框架、Tensorflow）

3.基于协同过滤的系统构建

在了解协同过滤的相关概念、原理、流程后，在本部分将实践构建基于不同原理的协同过滤电影推荐系统（不同框架、数据可视化、Web应用在后文介绍与构建），以基于用户与基于矩阵分解的协同过滤电影推荐系统为例。

3.1 基于用户的协同过滤电影推荐系统

3.1.1 原理与系统设计

在2.2与2.2.1中对基于用户的协同过滤算法做了简介，其核心是根据用户之间的评分行为相似度预测用户评分。对于本实验特定任务（电影推荐），核心即为找到与推荐用户相似的用户，并参考他/她的喜好与评价进行推荐，原理可视化为图16所示：

图16 基于用户的协同过滤电影推荐原理

在系统构建前，先对相关实现进行设计，总结如表11：

表11 基于用户的协同过滤电影推荐系统实现设计

数据集	MovieLens Latest Datasets（ml-latest-small）
框架与环境	无框架、本地Pycharm
相似度度量	余弦相似度

3.1.2 预构建

在了解完相关原理，设计好了系统后，在本部分对系统进行预构建及解析。

在构建前对数据集做介绍，如表11所示，本次实验测试使用的是MovieLens Latest Datasets（ml-latest-small），是MovieLens的一个小数据子集，形式上与MovieLens保持一致（包含用户与电影信息与评价）。具体来说，在该电影系统中使用了610个用户为9742部电影打分，生成了100836行的数据集。本次使用数据包括：movies.csv和ratings.csv，部分数据展示如图17所示：

图17 测试数据展示

如表11所示，本次实验测试使用的相似度度量指标是余弦相似度，在2.2.2（2）中有定义，根据式6去编写度量函数评估用户间的相似度，代码如图18所示：

图18 余弦相似度代码

Tips：为统一样式，本报告代码图片均在Carbon | Create and share beautiful images of your source code渲染，风格为Seti。

至此，本系统的介绍与准备全部结束，可以正式开始系统的构建。

3.1.3 系统构建

在本实验中，无框架的基于用户的协同过滤电影推荐系统构建步骤总结如表12：

表12 无框架的基于用户的协同过滤电影推荐系统构建步骤

输入: 电影数据集（主要使用：movies.csv和ratings.csv）

过程：

1、数据读取：读取文件，保存评分结果

2、生成评分列表：根据电影和评分列表数据生成每个用户对看过的电影的评分列表

3、生成评分矩阵：生成单个用户对所有电影的评分矩阵

4、推荐：对于选取用户，找出相似用户，根据规则产生推荐

5、系统构建（后文详解）：数据可视化，搭建Web服务（or APP or uni-app）

输出：电影推荐列表

（1）数据读取

本实验测试中，数据集重要信息保存在movies.csv和ratings.csv，故编写read_movies与read_userRating两个函数去对应读取数据，用list二维列表保存电影和用户对电影的评分结果，行表示电影和用户对电影的评分，列为电影的属性和评分结果，用movies，ratings分别存储两个函数返回的结果。在实现上，核心是数据遍历+csv分解，代码如图19所示：

图19 数据读取代码

（2）评分列表生成

由于本部分实验系统基于用户，故因生成每个用户看过的电影的评分列表（根据（1）读入的数据，即电影与评分列表）。在实现上，核心是遍历+01判断（是否看过此电影），代码如图20所示，评分列表部分展示如图21所示：

图20 评分列表生成代码

图21 评分列表展示

（3）评分矩阵生成

由协同过滤简介（2.1）中所述可知，用户-评分矩阵是相似度度量所需的重要数据，所以在生成评分列表后，要对应构建每个用户对所有电影的评分矩阵，核心为遍历+判断赋值（有评分的在矩阵里赋值，无评分赋0，与矩阵定义保持一致），代码如图22所示，部分评分矩阵展示（以输入用户id=50为例）如图23所示：

图22 评分矩阵生成代码

图23 部分评分矩阵展示

Tips：一行为一个用户对所有电影的评分矩阵（第一行为被推荐用户）。

（4）推荐

成功读取数据，生成评分列表与评分矩阵后，进入推荐系统的核心——推荐，由2.2.2所述，推荐的核心则是相似度度量。在本测试实验中以推荐用户id=50，topn中n=10为例详解推荐过程。

本测试实验代码实现逻辑为：根据每个用户的评分向量（矩阵）求该用户与目标用户的余弦相似度。用列表保存每个用户的id和该用户与目标用户余弦相似度结果，根据余弦相似度结果排序，选取topn个用户。并用这n个用户的id再一次生成他们对所有电影的评分矩阵，用它们的余弦相似度求和并开平方，方便后面计算推荐电影评分。

核心代码如图24所示，余弦相似度部分数据展示如图25所示，推荐评分结果部分数据展示如图26所示，针对本样例（id=50，topn中n=10）的推荐结果如图27所示：

图24 无框架基于用户的协同过滤推荐核心代码

图25 余弦相似度部分数据展示

分析：由图25所示，本地输出了每一个用户与被推荐用户的（余弦）相似度，根据相似度去推荐电影是推荐的核心，也是推荐原理可视化的一种解释。

图26 部分推荐评分展示

图27 电影推荐样例

Tips：Yiru是个人程序水印。

分析：如图27所示，本测试实验设计的无框架的基于用户的协同过滤推荐系统算法模块可以成功运行（数据可视化、系统模块等后文详解搭建），验证了设计与程序实现的合理性与正确性。

（5）系统评估

对本测试实验的设计与实现进行性能评估，首先在程序中引入time类，使用perf_counter方法记录实验耗时，在ml-latest-small将推荐进行20次，记录平均运行时间为25.414s。

本部分测试方法相对性能较差，对环境、设计与实现进行多维分析，总结主要原因如下：

环境上，使用本地CPU环境，且无计算框架，算力不足，难以处理大数据问题。
设计上，指标单一，数据量小，系统模型效果有待评估与优化。
实现上，反复使用遍历，时间复杂度高，随数据量增大效率将大大降低。

至此，无框架的基于用户的协同过滤电影推荐系统构建与分析完成，后续将探究不同语言、不同框架下不同协同过滤方式的电影推荐系统的构建，核心流程与代码逻辑与本部分相似，故代码仅作核心部分或有差异展示，避免赘述。

（6）完整代码

完整代码如下：

import math
import csv
import time


def read_movie(filename):
    with open(filename, encoding='utf-8') as f:
        reader = csv.reader(f)
        movies = [[row[0], row[1], row[2]] for row in reader]
    return movies


def read_userRating(filename):
    # userId, movieId, rating, timestamp
    with open(filename, encoding='utf-8')as f:
        reader = csv.reader(f)
        ratings = [[row[0], row[1], row[2]] for row in reader]
    return ratings


def ratingsArray(movies, ratings):  # 生成评分矩阵
    user_rating_array = []
    number = 0
    user_rating_list = []
    for userRating in ratings:  # 建立用户的评分列表集合
        if str(number) == userRating[0]:
            user_rating_list.append([userRating[1], userRating[2]])
            # print(number,userRating[0],userRating[1], userRating[2])
        else:
            user_rating_array.append([number, user_rating_list])
            # print(number, user_rating_list)
            user_rating_list = []
            number = number + 1
            user_rating_list.append([userRating[1], userRating[2]])
    user_rating_array.append([number, user_rating_list])  # 添加最后一个
    # print(user_rating_array)
    return user_rating_array


def CosSimilarity(UserId, user_rating_list, movies):
    # test_rating_list = user_rating_list[UserId][1]
    testAllMovieRating = GetAllMovieRating(user_rating_list[UserId][1], movies)
    print(UserId, testAllMovieRating)
    # print(test_rating_list)
    # print(len(user_rating_list))  # 611个，包含下标0
    resCos = []
    for id in range(len(user_rating_list)):
        if id == UserId or id == 0:
            continue
        userAllMovieRating = GetAllMovieRating(user_rating_list[id][1], movies)
        # print(id, userAllMovieRating)
        # 计算余弦相似度
        Cos = CosFunction(testAllMovieRating, userAllMovieRating)
        resCos.append([id, Cos])
    print(resCos)
    # key=(lambda x:x[1]),reverse=True
    res1 = sorted(resCos, key=(lambda x: x[1]), reverse=True)  # 取前10个与目标用户相似的用户
    res1 = res1[:10]
    print(res1)

    # 求前20个用户的所有电影评分矩阵
    res1AllMovieRating = []
    for item in res1:
        userAllMovieRating = GetAllMovieRating(user_rating_list[item[0]][1], movies)
        print(item[0], userAllMovieRating)
        res1AllMovieRating.append([item[0], userAllMovieRating])

    # 前20个用户的Cos余弦相似度求和
    sum2 = 0
    for i in range(len(res1)):
        sum2 = sum2 + math.sqrt(res1[i][1])
    # sum2 = math.sqrt(sum2)
    print(sum2)

    # 求所有电影对目标用户的推荐评分，目标用户看过的电影推荐评分设置为0
    MovieRecommend = []
    for i in range(len(testAllMovieRating)):
        recommend = 0
        sum1 = 0
        for j in range(len(res1)):
            sum1 = sum1 + res1[j][1] * float(res1AllMovieRating[j][1][i])
        recommend = sum1 / sum2
        if testAllMovieRating[i] != 0:
            recommend = 0
        MovieRecommend.append([i, recommend])
    print(MovieRecommend)
    MovieTop = sorted(MovieRecommend, key=(lambda x: x[1]), reverse=True)  # 根据推荐评分对电影排序
    print(MovieTop)
    Recommend = MovieTop[:10]
    print(Recommend)

    return Recommend


def CosFunction(test, user):  # 计算两用户之间余弦相似度
    sum1 = 0
    sum2 = 0
    sum3 = 0
    for i in range(len(test)):
        sum1 = sum1 + test[i] * user[i]
        sum2 = sum2 + math.pow(test[i], 2)
        sum3 = sum3 + math.pow(user[i], 2)
    CosTotal = sum1 / (math.sqrt(sum2)
                       * math.sqrt(sum3))
    # print(CosTotal)
    return CosTotal


def GetAllMovieRating(user_rating, movies):  # 单个用户对九千多部电影的评分矩阵
    userAllMovieRating = []
    # print(user_rating)
    for movie in movies:
        movieId = movie[0]
        userRating = 0
        for userMovieId, userMovieRating in user_rating:
            if movieId == userMovieId and userMovieRating != 'rating':
                # print(userMovieRating)
                userRating = float(userMovieRating)
                break
        userAllMovieRating.append(userRating)
    userAllMovieRating[0] = 0  # 把下标为0项置为0 下标为0不代表是电影
    return userAllMovieRating


def RecommendMovies(movies, recommend):
    print("-------------- Yiru recommend for you --------------")
    for item, item2 in recommend:
        print(movies[item][1], '\t', movies[item][2])


if __name__ == '__main__':
    start = time.perf_counter()
    movies = read_movie('movies.csv')
    ratings = read_userRating('ratings.csv')
    user_rating_list = ratingsArray(movies, ratings)

    recommend = CosSimilarity(50, user_rating_list, movies)

    RecommendMovies(movies, recommend)
    end = time.perf_counter()
    print("运行耗时", end - start)

3.2 基于矩阵分解的协同过滤电影推荐系统

3.2.1 原理与系统设计

在2.3.2中对基于矩阵分解的协同过滤算法做了简介，其核心是利用用户-项目评分矩阵（图12）预测用户对项目的评分。对于本实验特定任务（电影推荐），核心即为通过模型最小化观众-电影矩阵构成的损失函数，并根据训练好的模型进行推荐，原理可视化为图28所示：

图28 基于矩阵分解的协同过滤电影推荐原理

在系统构建前，先对相关实现进行设计，总结如表13：

表13 基于矩阵分解的协同过滤电影推荐系统实现设计

数据集	MovieLens Latest Datasets（ml-latest-small）
框架与环境	Tensoerflow（非必要）、本地Pycharm
模型评估	平方差损失函数

3.2.2 优化问题求解

若使用基于矩阵分解，实际上该问题（电影推荐）就变成一个机器学习问题，故最重要的部分就是优化问题的求解（如何最小化损失函数），故本部分根据其原理对优化问题及求解进行推导。

3.2.3 系统构建（无框架）

在了解原理与系统设计，推导了优化问题求解过程后，正式进入系统构建，本实验以无框架与有框架的两种基于矩阵分解的协同过滤电影推荐系统构建来探究同方法不同框架（系统）的影响与效果对比。

本部分先介绍无框架的系统构建，步骤总结在表14：

表14 无框架的基于矩阵分解的协同过滤电影推荐系统构建步骤

输入: 电影数据集（主要使用：movies.csv和ratings.csv）

过程：

1、数据读取：读取文件，保存评分结果

2、初始化：将需要构建的矩阵随机初始化，构造损失函数，初始化矩阵参数梯度

3、梯度下降：利用梯度下降不断更新参数

4、评分与预测：利用喜好矩阵与内容矩阵得到预测评分，根据评分进行推荐

5、系统构建（后文详解）：数据可视化，搭建Web服务（or APP or uni-app）

输出：电影推荐列表

在数据读取、遍历、初始化等操作中代码逻辑与基于用户的协同过滤类似，在3.1.3中有详解，在本部分仅做核心代码解析。

（1）损失函数

本测试实验是基于矩阵分解，在Python中多维数组与矩阵运算相关函数定义在numpy库中，是本部分最重要的库，详细用法可见：NumPy。

如式10所示，本实验选择平方差损失函数，代码实现如图30所示：

图30 损失函数代码

（2）梯度与梯度下降

本测试实验中梯度推导如式12，故根据其定义在代码上定义梯度，并根据梯度下降原理去编写梯度下降代码，如图31所示：

图31 梯度定义及梯度下降实现代码

（3）评分与推荐

在梯度下降结束后，得到用户对电影的评分，根据topn原则进行排序后推荐，评分与推荐的核心代码如图32所示，电影推荐样例（以用户id=50，topn中n=10为例）如图33所示：

图33 评分与推荐核心代码

图34 电影推荐样例

分析：如图34所示，本测试实验设计的无框架的基于矩阵分解的协同过滤推荐系统算法模块可以成功运行（数据可视化、系统模块等后文详解搭建），验证了设计与程序实现的合理性与正确性。

（4）完整代码

完整代码如下：

# -*- coding: utf-8 -*-

import warnings

warnings.filterwarnings("ignore")

import pandas as pd
import numpy as np
import time

# 获取数据
ratings_df = pd.read_csv('real_ratings.csv')
movies_df = pd.read_csv('movies.csv')

userNo = max(ratings_df['userId']) + 1
movieNo = max(ratings_df['movieRow']) + 1

# 创建电影评分表
rating = np.zeros((userNo, movieNo))

for index, row in ratings_df.iterrows():
    rating[int(row['userId']), int(row['movieRow'])] = row['rating']


def recommend(userID, lr, alpha, d, n_iter, data):
    '''
    userID(int):推荐用户ID
    lr(float):学习率
    alpha(float):权重衰减系数
    d(int):矩阵分解因子(即元素个数)
    n_iter(int):训练轮数
    data(ndarray):用户-电影评分矩阵
    '''
    # 获取用户数与电影数
    m, n = data.shape
    # 初始化参数
    x = np.random.uniform(0, 1, (m, d))
    w = np.random.uniform(0, 1, (d, n))
    # 创建评分记录表，无评分记为0，有评分记为1
    record = np.array(data > 0, dtype=int)
    # 梯度下降，更新参数
    for i in range(n_iter):
        x_grads = np.dot(np.multiply(record, np.dot(x, w) - data), w.T)
        w_grads = np.dot(x.T, np.multiply(record, np.dot(x, w) - data))
        x = alpha * x - lr * x_grads
        w = alpha * w - lr * w_grads
    # 预测
    predict = np.dot(x, w)
    # 将用户未看过的电影分值从低到高进行排列
    for i in range(n):
        if record[userID - 1][i] == 1:
            predict[userID - 1][i] = 0
    recommend = np.argsort(predict[userID - 1])
    a = recommend[-1]
    b = recommend[-2]
    c = recommend[-3]
    d = recommend[-4]
    e = recommend[-5]
    a1 = recommend[-6]
    b1 = recommend[-7]
    c1 = recommend[-8]
    d1 = recommend[-9]
    e1 = recommend[-10]
    print('-------- Yiru recommend for you--------\n1:%s\n2:%s\n3:%s\n4:%s\n5:%s\n6:%s\n7:%s\n8:%s\n9:%s\n10:%s。' \
          % (movies_df['title'][a], movies_df['title'][b], movies_df['title'][c], movies_df['title'][d],
             movies_df['title'][e], movies_df['title'][a1], movies_df['title'][b1], movies_df['title'][c1],
             movies_df['title'][d1],
             movies_df['title'][e1]))


start = time.perf_counter()
recommend(172, 1e-4, 0.999, 20, 100, rating)
end = time.perf_counter()
print("耗时：", end - start)

3.2.4 系统构建（Tensorflow）

本部分介绍基于Tensorflow的系统构建，步骤总结在表15：

表15 基于矩阵分解的协同过滤电影推荐系统（Tensorflow）构建步骤

输入: 电影数据集（主要使用：movies.csv和ratings.csv）

过程：

1、数据读取与处理：读取文件，清洗数据，划分训练测试集

2、初始化：创建电影评分矩阵rating和评分记录矩阵record

3、模型构建：根据相关矩阵与目标函数构建模型

4、训练与评估：训练模型，根据损失函数值等指标评估效果

5、推荐：使用训练好的模型，对指定用户进行电影推荐

6、系统构建（后文详解）：数据可视化，搭建Web服务（or APP or uni-app）

输出：电影推荐列表

下面对基于Tensorflow的系统构建的核心代码与效果进行展示与解析。

（1）数据处理

在本测试实验中对movies.csv和ratings.csv进行了简单处理，生成了moviesProcessed.csv，便于后续模型使用，初始化与处理后数据样式样例如图35所示：

图35 初始化与数据处理效果样例

（2）模型构建

本测试实验模型主要信息来源于评分矩阵rating和评分记录矩阵record，构建核心为参数设置与损失函数定义等，代码如图36所示：

图36 模型构建核心代码

（3）训练与评估

在本测试实验中，模型的训练主要使用tensorflow中的summary方法，用法详见：Module: tf.summary | TensorFlow v2.11.0 (google.cn)。设置迭代次数阈值或损失函数阈值等条件停止训练输出模型，使用损失函数值errors评估模型，代码如图37所示：

图37 模型训练与评估核心代码

（4）推荐

在得到评估结果达到要求的模型后，可使用模型对对应用户进行电影推荐，样例（以用户id=50，topn中n=10为例）如图38所示：

图38 电影推荐样例

分析：如图38，本部分设计的基于矩阵分解的协同过滤推荐系统（Tensorflow）算法模块可以成功运行（数据可视化、系统模块等后文详解搭建），验证了设计与程序实现的合理性与正确性。

（5）完整代码

完整代码如下：

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# 改进：要划分训练集和测试集，并在进行模型评估阶段，可参考之前做过的协同过滤推荐系统中的，
# 通过prediction[ground_truth.nonzero()]来筛选只考虑测试数据集中的预测评分
import pandas as pd
import numpy as np
# import tensorflow as tf
import tensorflow._api.v2.compat.v1 as tf
tf.disable_v2_behavior()

# 第一步：------------------------收集和清洗数据

ratings_df = pd.read_csv('ratings.csv')
# print(ratings_df.tail())
# tail命令用于输入文件中的尾部内容。tail命令默认在屏幕上显示指定文件的末尾5行。
# 相对应的有：ratings_df.head()
movies_df = pd.read_csv('movies.csv')
movies_df['movieRow'] = movies_df.index
# 生成一列‘movieRow’，等于索引值index
# print(movies_df.tail())

movies_df = movies_df[['movieRow', 'movieId', 'title']]
# 筛选三列出来
movies_df.to_csv('moviesProcessed.csv', index=False, header=True, encoding='utf-8')
# 生成一个新的文件moviesProcessed.csv
print(movies_df.tail())

ratings_df = pd.merge(ratings_df, movies_df, on='movieId')
# print(ratings_df.head())
ratings_df = ratings_df[['userId', 'movieRow', 'rating']]
# 筛选出三列
ratings_df.to_csv('ratingsProcessed.csv', index=False, header=True,
                  encoding='utf-8')
# 导出一个新的文件ratingsProcessed.csv
print(ratings_df.head())

# 第二步：-----------------------创建电影评分矩阵rating和评分纪录矩阵record

userNo = ratings_df['userId'].max() + 1
# userNo的最大值
movieNo = ratings_df['movieRow'].max() + 1
# movieNo的最大值

rating = np.zeros((movieNo, userNo))
print(rating.shape)
# 创建一个值都是0的数据
flag = 0
ratings_df_length = np.shape(ratings_df)[0]

print(np.shape(ratings_df))
# 查看矩阵ratings_df的第一维度是多少
for index, row in ratings_df.iterrows():
    # interrows（），对表格ratings_df进行遍历
    # rating[int(row['movieRow']), int(row['userId'])] = row['rating']
    # 等价于：
    rating[int(row['movieRow'])][int(row['userId'])] = row['rating']
    # 在rating表里的'movieRow'行和'userId'列处，填上row的‘评分’，即ratings_df对应的评分
    flag += 1
    # if (ratings_df_length-flag) % 5000 == 0:
    #     print(u'还剩多少待处理：%d' %(ratings_df_length-flag))
# print(rating[3][450])
record = rating > 0
record = np.array(record, dtype=int)
print(record)


# 第三步：----------------------------构建模型

def normalizeRatings(rating, record):
    m, n = rating.shape
    # m代表电影数量，n代表用户数量
    rating_mean = np.zeros((m, 1))
    # 每部电影的平均得分
    rating_norm = np.zeros((m, n))
    # 处理过的评分
    for i in range(m):
        idx = (record[i, :] != 0)
        # 每部电影的评分，[i，:]表示每一行的所有列
        rating_mean[i] = np.mean(rating[i, idx])
        # 第i行，评过份idx的用户的平均得分
        # np.mean() 对所有元素求均值
        rating_norm[i, idx] = rating[i, idx] - rating_mean[i]
        # rating_norm = 原始得分-平均得分
    return rating_norm, rating_mean


rating_norm, rating_mean = normalizeRatings(rating, record)
rating_norm = np.nan_to_num(rating_norm)
# 对值为NaNN进行处理，改成数值0
# print(rating_norm)
rating_mean = np.nan_to_num(rating_mean)
# 对值为NaNN进行处理，改成数值0
# print(rating_mean)

# 构建模型
num_features = 12
X_parameters = tf.Variable(tf.random.normal([movieNo, num_features], stddev=0.35))
Theta_parameters = tf.Variable(tf.random.normal([userNo, num_features], stddev=0.35))
# tf.Variables()初始化变量
# tf.random_normal()函数用于从服从指定正太分布的数值中取出指定个数的值，mean: 正态分布的均值。stddev: 正态分布的标准差。dtype: 输出的类型
loss = 1 / 2 * tf.reduce_sum(
    ((tf.matmul(X_parameters, Theta_parameters, transpose_b=True) - rating_norm) * record) ** 2) + \
       0.5 * (1 / 2 * (tf.reduce_sum(X_parameters ** 2) + tf.reduce_sum(Theta_parameters ** 2)))
# 基于内容的推荐算法模型
train = tf.train.AdamOptimizer(1e-3).minimize(loss)

# https://blog.csdn.net/lenbow/article/details/52218551
# Optimizer.minimize对一个损失变量基本上做两件事
# 它计算相对于模型参数的损失梯度。
# 然后应用计算出的梯度来更新变量。


# 第四步：------------------------------------训练模型

# tf.summary的用法 https://www.cnblogs.com/lyc-seu/p/8647792.html
tf.summary.scalar('train_loss', loss)
# 用来显示标量信息
summaryMerged = tf.summary.merge_all()
# merge_all 可以将所有summary全部保存到磁盘，以便tensorboard显示。
filename = 'movie_tensorborad.csv'
writer = tf.summary.FileWriter(filename)
# 指定一个文件用来保存图。
sess = tf.Session()
# https://www.cnblogs.com/wuzhitj/p/6648610.html
init = tf.global_variables_initializer()
sess.run(init)
# 运行
for i in range(2000):
    _, movie_summary = sess.run([train, summaryMerged])
    # 把训练的结果summaryMerged存在movie里
    writer.add_summary(movie_summary, i)
    # 把训练的结果保存下来

# 第五步：-------------------------------------评估模型

Current_X_parameters, Current_Theta_parameters = sess.run([X_parameters, Theta_parameters])
# Current_X_parameters为电影内容矩阵，Current_Theta_parameters用户喜好矩阵
predicts = np.dot(Current_X_parameters, Current_Theta_parameters.T) + rating_mean
# dot函数是np中的矩阵乘法，np.dot(x,y) 等价于 x.dot(y)
errors = np.sqrt(np.sum(((predicts - rating) * record) ** 2))
# sqrt(arr) ,计算各元素的平方根
print(u'模型评估errors：', errors)

# 第六步：--------------------------------------构建完整的电影推荐系统

user_id = input(u'您要想哪位用户进行推荐？请输入用户编号：')
sortedResult = predicts[:, int(user_id)].argsort()[::-1]
# argsort()函数返回的是数组值从小到大的索引值; argsort()[::-1] 返回的是数组值从大到小的索引值
print('-------- Yiru recommend for you --------')
# center() 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串。默认填充字符为空格。
idx = 0
for i in sortedResult:
    print(u'评分: %.2f, 电影名: %s' % (predicts[i, int(user_id)] - 2, movies_df.iloc[i]['title']))
    # .iloc的用法：https://www.cnblogs.com/harvey888/p/6006200.html
    idx += 1
    if idx == 10:
        break

3.2.5 原理补充

对于矩阵分解等需要用到机器学习、深度学习等模型的方法，参数的选择与确定是一个核心问题，不同的选择会使模型效果大相径庭。模型训练过程中重要的参数总结如表16，以矩阵分解中算法收敛效果与模型中的正则项系数λ和矩阵维度k为例，关系如图39（Netflix电影推荐系统）所示：

表16 训练过程中的重要参数总结

1、损失函数：

损失可以衡量模型的预测值和真实值的不一致性，由一个非负实值函数损失函数定义

2、优化器：

为使损失最小，定义loss后可根据不同优化方式定义对应的优化器

3、epoch：

学习回合数，表示整个训练过程要遍历多少次训练集

4、学习率：

学习率描述了权重参数每次训练之后以多大的幅度（step）沿梯下降的方向移动

5、归一化：

在训练神经神经网络中通常需要对原始数据进行归一化，以提高网络的性能

6、Batchsize：

每次计算损失loss使用的训练数据数量

图39 参数对模型效果的影响样例

3.2.6 效果对比

对本测试实验的两种（是否使用tensorflow）设计与实现进行性能评估，首先在程序中引入time类，使用perf_counter方法记录实验耗时，在ml-latest-small将推荐进行20次，记录平均运行时间。数据汇总如表17：

表17 基于矩阵分解的协同过滤电影推荐系统不同实现的性能对比

实现	平均运行时间
无框架	10.71s
Tensorflow	0.93s（有模型），69.88s（无模型）

根据两种构建方式的设计与性能对比，Tensorflow在初次使用没有模型的时候效率较低（需要进行模型的训练与评估），但在后续的使用中性能很高（暂不谈推荐效果）。

而无框架矩阵分解则是每次对数据进行初始化、梯度下降等操作，性能稳定且优于本实验构建的无框架基于用户协同过滤推荐系统（25.414s）。

你可能感兴趣的:(机器学习实践,tensorflow,大数据,人工智能,推荐算法,自然语言处理)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
深度 Qlearning：在直播推荐系统中的应用 AGI通用人工智能之禅程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
深度Q-learning：在直播推荐系统中的应用关键词：深度Q-learning,强化学习,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。面对海量的直播内容,用户很难快速找到自己感兴趣的内容。因此,个性化推荐系统在直播平台中扮演着越来越重要的角色。1.2研究现状目前,主流的个性化推荐算法包括协同过滤、基于内容的推荐等。这些方法在一定程度上缓
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修