程序终结者

基于大数据框架的协同过滤算法餐饮推荐系统【Update2023-6-25】

开始之前

设计思路

首先这位作者的推荐系统给了我很大的构思启发。
Github地址：https://github.com/share23/Food_Recommender
他的系统采用实时大数据技术组件，具体有Spark Streaming，HDFS分布式存储，Hbase存储计算，消息队列采用Kafka，Flume，其中的餐饮数据是用python生成，加上linux的contab模拟流式数据。推荐模块使用ALS算法加评分。
他的系统架构和技术组件选用给了我很大帮助，包括系统业务逻辑代码，让我顺利完成了我的毕业设计。

我的推荐系统设计背景是普通本科的计算机专业毕设，所以我在原作者的基础上进行了较大的调整。具体使用三台CentOS虚拟机，砍掉了实时处理组件，使用数据仓库（Data Warehouse）的设计理念，加入了基于用户、物品和ALS评分的协同过滤推荐算法，解决冷启动问题。

我的餐饮推荐系统是基于PySpark技术，综合运用Django框架、MySQL数据库等技术设计实现。具体来说，在数据采集阶段，使用Python爬虫获取公开数据；预处理阶段，通过MapReduce进行数据清洗，HDFS负责存储ods层；核心推荐功能采用Spark框架实现协同过滤算法。

系统启动使用流程

在答辩现场应该演示什么？

Step1：启动虚拟机集群，启动大数据相关组件；
Step2：在PyCharm的命令行终端启动Django服务器；
Step3：进入Web端，可以对菜品进行浏览，评分；
Step4：选择不同方式的推荐，查看推荐结果，重点突出计算推荐的过程。

一、数据采集清洗

该阶段需要完成的工作是：
1.构建完整的符合协同过滤推荐算法需求的餐饮数据集，其中包含餐饮数据以及用户历史行为数据；
2.完成采集数据的清洗工作，构建ODS层上传至HDFS中；
3.将HDFS中的数据转移至本地DWD层，为CF推荐做预处理。

1.1 爬虫采集

这里我采用了最简单的方式实现数据的采集收集。这个python脚本很可能会随着网页的更新而失去作用，仅供参考。

需要的主要字段有：菜品ID，菜品名字，菜品口味，菜品图片的URL。
注意，我在数据库中只体现了这些字段，其实在ODS层中完全可以添加更多字段，但是与本次毕业设计的既定目标已经偏离，不宜加过多需求。所以我遵循的原则是一切从简，尽量用最少的数据完成协同过滤算法的流程，并且做好网页的可视化。

我为什么没有用户的历史行为数据？
因为我不需要抓取，我只需要模拟出少部分的用户评分数据即可完成基于用户历史行为的协同过滤推荐。

值得注意的是，如果需要后期完善的话，餐饮相关的数据集也可以从网上进行下载，包含更丰富的字段，可以满足更多的机器学习需求。

import requests
from bs4 import BeautifulSoup


head = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36',
}

# 目标保存文件
file = open('./cai.txt', 'w+')

# 获取菜品分类页面
recipeTypeResponse = requests.get(url="https://home.meishichina.com/recipe-type.html", headers=head)
recipeTypeResponse.encoding = recipeTypeResponse.apparent_encoding
soup = BeautifulSoup(recipeTypeResponse.text, 'html.parser')

# 食谱大类列表
divNodeList = soup.find_all('div', class_="category_sub clear")
for divNode in divNodeList:
    # # 这里只获取第一个大类
    # divNode = soup.find_all('div', class_="category_sub clear")[0]
    file.writelines(divNode.find('h3').text+": \n")
    # 获取每个大类里的所有小类
    aNodeList = divNode.find_all('a')
    for aNode in aNodeList:
        file.writelines("【" + aNode.text + "】\n")
        recipeTypeHref = aNode.get('href')
        caiResponse = requests.get(url=recipeTypeHref, headers=head)
        caiSoup = BeautifulSoup(caiResponse.text, 'html.parser')
        caiList = caiSoup.find('div', class_="ui_newlist_1 get_num").select('a[title]:not(:has(*))')
        for cai in caiList:
            # 获取菜的详情信息
            caiName = cai.get('title')
            caiHref = cai.get('href')
            caiDetailResponse = requests.get(caiHref, headers=head)
            caiDetailResponse.encoding =caiDetailResponse.apparent_encoding
            caiDetailSoup = BeautifulSoup(caiDetailResponse.text, 'html.parser')
            # 图片链接
            caiImg = caiDetailSoup.find('div', class_="recipe_De_imgBox")
            caiImgSrc = caiImg.find('img').get('src')
            caikouweiDiv = caiDetailSoup.find('div', class_="recipeCategory_sub_R mt30 clear")
            caikouweiLiList = caikouweiDiv.find_all('li')
            caikouwei = "未知"
            caigongyi = "未知"
            for li in caikouweiLiList:
                caikouweiTag = li.find('span', class_="category_s2")
                if caikouweiTag.text == '口味':
                    caikouwei = li.select('a[title]')[0].text
                if caikouweiTag.text == '工艺':
                    caigongyi = li.select('a[title]')[0].text
            # # 口味
            # caikouwei = caikouweiList[6].select('a[title]')[0].text
            # # 工艺
            # caigongyi = caikouweiList[7].select('a[title]')[0].text
            file.writelines(caiName + "\t" + caikouwei + "\t" + caigongyi + "\tImg url:" + caiImgSrc + "\n")
            print(caiName + " ==> 完成！")
        print("【" + aNode.text + "】完成！")

1.2 mapreduce阶段清洗数据

这里使用到了Hadoop中的MapReduce计算框架和HDFS分布式存储框架。首先将爬虫采集到的数据读入MapReduce，进行简单的数据清洗操作，然后将文件输出到HDFS中存放。MR中的清洗只是为了增加毕业设计中需求技术的一个操作，可以不做，因为数据就是我自己生成的，我自己爬取的，我完全可以按照我想要的格式去拿数据，造数据，但是为了模拟真实的生产环境（论文有的写），虽然只抓取了几百条数据，但是也添加了数据清洗阶段。

package foodclean;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

import java.io.IOException;

public class FoodClean {
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        // 1. 初始化配置
        Configuration conf = new Configuration();
        conf.set("fs.defaultFS", "hdfs://hadoop10:8020");
        //2. 创建job
        Job job = Job.getInstance(conf);
        job.setJarByClass(FoodClean.class);

        //3. 设置输入格式化工具和输出格式化
        job.setInputFormatClass(TextInputFormat.class);
        job.setOutputFormatClass(TextOutputFormat.class);

        //4. 设置输入路径和输出路径
        TextInputFormat.addInputPath(job, new Path("/food_clean/cai.txt"));
        TextOutputFormat.setOutputPath(job, new Path("/food_clean/out"));

        //5. 设置mapper和reducer
        job.setMapperClass(StartCleanMapper.class);
        //job.setReducerClass(WordCount.WordCountReducer.class);

        // 6. 设置mapper的kv类型和reducer的kv类型
        job.setMapOutputKeyClass(Text.class);
        job.setMapOutputValueClass(NullWritable.class);

        // 7. 启动job
        boolean b = job.waitForCompletion(true);
        System.out.println(b);


    }

    static class StartCleanMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
        @Override
        protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
            if (value.toString().contains("Img url:")) { //筛选出包含图
                String[] parts = value.toString().split("\t"); // 使用制表符作为分隔符
                String httpUrl = parts[3].substring(8); //截取多余字
                //  1 拔丝苹果	酸甜	拔丝	  Img url:https://i3.
                //  2 xxxx      xxx xx   xxx
                //  ...
                String result = key.toString() + "\t" + parts[0] + "\t" + parts[1] + "\t" + parts[2] + "\t" + httpUrl;
                context.write(new Text(result), NullWritable.get());     
            }
        }
    }
}

数据清洗成功，并且存储在HDFS中。

1.3 在Django中进行数据库转移

通过在PyCharm中编写Django程序，创建MySQL数据库。Django中的特性功能，数据库管理。首先要在Django中配置好数据库连接、用户、密码等。而且localhost主机要有Navicate数据库管理工具，方便查看数据。

1.3.1 数据库转移设计：

models.py

from django.db import models

class Foodlist(models.Model):
    foodid = models.IntegerField(primary_key=True)
    fname = models.CharField(max_length=50)
    ftaste = models.CharField(max_length=50)
    cooking_method = models.CharField(max_length=50)
    img_url = models.CharField(max_length=255)


class Rating(models.Model):
    foodid = models.ForeignKey(Foodlist, on_delete=models.CASCADE)
    username = models.CharField(max_length=50)
    rating = models.IntegerField()


class Recommendation(models.Model):
    re_foodid = models.IntegerField(primary_key=True)
    re_fname = models.CharField(max_length=50)
    re_username = models.CharField(max_length=255)
    re_food_url = models.CharField(max_length=255)

1.3.2 mysql数据库内容

这里和Django代码中的数据库设计是一一对应的，MySQL中的数据库是Django生成的。

数据库：

food_recommend

表：

ratings_foodlist：foodid是餐品的唯一id，fname是餐品的名字，ftaste是餐品的口味，cooking_method是餐品的制作方法，img_url是餐品图片；

ratings_rating：id是该表数据行的顺序id，foodid_id是餐品的唯一外键id，username是评分的用户名，rating是用户对餐品的评分；

ratings_recommendation：id是该表数据行的顺序id，re_foodid是经过推荐之后的餐品id，re_username是评分的用户名，re_food_ur是经过推荐之后的餐品图片；

1.3.3 启动命令：

这是操作Django进行数据库转移操作的命令。

C:\Users\Lenovo\.conda\envs\pythonProject1\python.exe manage.py makemigrations
C:\Users\Lenovo\.conda\envs\pythonProject1\python.exe manage.py migrate
C:\Users\Lenovo\.conda\envs\pythonProject1\python.exe manage.py runserver

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-stxa9SZH-1686719313916)(毕设.assets\image-20230413235952699.png)]

1.4 hdfs2mysql脚本datax

在这里也可以用其他工具导入mysql，如sqoop，甚至可以用hive，之所以选mysql是因为我当时关系型数据库就会mysql。

脚本启动命令

python /opt/installs/datax/bin/datax.py /opt/installs/datax/job/hdfs2mysql.json

{
    "job": {
        "setting": {
            "speed": {
                "channel": 2
            }
        },
        "content": [
            {
                "reader": {
                    "name": "hdfsreader",
                    "parameter": {
                        "path": "/food_clean/out/part-r-00000",
                        "defaultFS": "hdfs://hadoop10:8020",
                        "column": [
                               {
                                "index": 0,
                                "type": "long"
                               },
                               {
                                "index": 1,
                                "type": "string"
                               },
                               {
							   "index": 2,
                                "type": "string"
                               },
							    {
							   "index": 3,
                                "type": "string"
                               },
							    {
							   "index": 4,
                                "type": "string"
                               }
							   
                        ],
                        "fileType": "text",
                        "encoding": "UTF-8",
                        "fieldDelimiter": "\t"
                    }

                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "column": ["foodid","fname","ftaste","cooking_method","img_url"],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://hadoop13:3306/food_recommend?com.mysql.jdbc.faultInjection.serverCharsetIndex=45",
                                "table": ["ratings_foodlist"]
                            }
                        ],
                        "password": "0000",
                        "preSql": [],
                        "session": [],
                        "username": "root",
                        "writeMode": "insert"
                    }
                }
            }
        ]
    }
}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WIZrB9VN-1686719313917)(毕设.assets\image-20230413235732664.png)]

执行结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-K51bNQ2S-1686719313918)(毕设.assets\image-20230414000048379.png)]

1.5 mysql去重操作

CREATE TEMPORARY TABLE temp_table 
SELECT MAX(foodid) AS max_id
from ratings_foodlist
GROUP BY fname

DELETE FROM ratings_foodlist 
WHERE foodid NOT IN (
    SELECT max_id 
    FROM temp_table
);

DROP TEMPORARY TABLE temp_table;

这个语句会先创建一个临时表，该表包含每个 fname 的最大 ID，然后将该临时表与 ratings_foodlist 表进行比较，删除不在临时表中的记录，最后删除临时方法可以避免在子查询中更新同一个表的问题。如果不创建临时表会You can't specify target table 'ratings_foodlist' for update in FROM clause

0614更新：
其实不做去重操作也ok，有重复的数据并不影响CF算法的建模和计算，至于推荐结果的准确度和科学性，它并不是本科生毕业设计的考虑范围，能跑起来就万事大鸡。

二、建模和推荐

ALS

#!/usr/bin/env python
# coding: utf-8

# In[7]:
from pyspark.ml.evaluation import RegressionEvaluator
from pyspark.ml.feature import StringIndexer, VectorAssembler
from pyspark.ml.recommendation import ALS
from pyspark.sql import SparkSession
from pyspark.sql.functions import *

SparkSession.builder.config('spark.driver.extraClassPath',
                            '/opt/installs/spark3.1.2/jars/mysql-connector-java-8.0.20.jar')


# In[8]:


def get_data(table_name, re_spark):
    url = "jdbc:mysql://hadoop13:3306/food_recommend?characterEncoding=UTF-8&useSSL=false&serverTimezone=GMT%2B8"
    properties = {"user": "root", "password": "0000", "driver": "com.mysql.cj.jdbc.Driver"}
    df = re_spark.read.jdbc(url=url, table=table_name, properties=properties)
    return df


# In[17]:


spark = SparkSession.builder.appName("FoodRecommendation").getOrCreate()
foodlist_df = get_data("ratings_foodlist", spark)
rating_df = get_data("ratings_rating", spark)
foodlist_df.show(10, truncate=False)
rating_df.show(10, truncate=False)

# In[18]:


# 将类别、风格、颜色、品牌字符串转为数值类型，离散变量数值化
ftaste_indexer = StringIndexer(inputCol="ftaste", outputCol="ftaste_index")
method_indexer = StringIndexer(inputCol="cooking_method", outputCol="method_index")
user_indexer = StringIndexer(inputCol='username', outputCol='user_id')

# 将所有特征向量化
feature_columns = ["ftaste_index", "method_index"]
assembler = VectorAssembler(inputCols=feature_columns, outputCol="features")

# 对数据进行特征工程
indexed_foodlist_df = ftaste_indexer.fit(foodlist_df).transform(foodlist_df)
indexed_foodlist_df = method_indexer.fit(indexed_foodlist_df).transform(indexed_foodlist_df)
foodlist_df_with_features = assembler.transform(indexed_foodlist_df)

foodlist_df.show(10, truncate=False)
foodlist_df_with_features.show(10, truncate=False)

# In[41]:


# 使用编码器拟合数据，并转换数据集，以添加新的user_id列
indexed_df = user_indexer.fit(rating_df).transform(rating_df).withColumn('user_id', col('user_id').cast('integer'))
features = foodlist_df_with_features.select("foodid", "features", "img_url")
users = indexed_df.select("username", "foodid_id", "user_id", "rating").withColumnRenamed("foodid_id", "foodid")
# features 包含字段 "foodid", "features", "img_url"
# users 包含字段 "username", "foodid", "user_id", "rating"
indexed_df.show(10, truncate=False)
features.show(10, truncate=False)
users.show(10, truncate=False)

# In[42]:


rec_df = users.join(features.select("foodid", "features"), "foodid", how='left').select("user_id", "foodid", "rating",
                                                                                        "features")

(training, test) = rec_df.randomSplit([0.8, 0.2])

als = ALS(rank=10, maxIter=10, regParam=0.01, userCol="user_id", itemCol="foodid", ratingCol="rating",
          coldStartStrategy="drop")
model = als.fit(rec_df)

# In[44]:
# 对测试集进行预测并进行评估
predictions = model.transform(test)
evaluator = RegressionEvaluator(metricName="rmse", labelCol="rating", predictionCol="prediction")
rmse = evaluator.evaluate(predictions)
mae = evaluator.setMetricName("mae").evaluate(predictions)
print("Root-mean-square error = " + str(rmse))
print("Mean absolute error = " + str(mae))

# 得到全部用户的推荐结果
user_recs = model.recommendForAllUsers(5)
user_recs_with_foodid = user_recs.select("user_id", "recommendations.foodid", "recommendations.rating")
user_recs_with_foodid.show(truncate=False)
foodid_df = user_recs_with_foodid.select("user_id", explode("foodid").alias("foodid"), "rating")
foodid_df.show(truncate=False)

# In[45]:


users_unique = users.groupBy('user_id').agg(first('username').alias('username'))
users = foodid_df.selectExpr("user_id", "foodid").join(users_unique.selectExpr("user_id", "username"), "user_id",
                                                       how='left').join(foodlist_df.select("foodid", "img_url"),
                                                                        "foodid", how='left').selectExpr(
    "foodid as re_foodid", "username as re_username", "img_url as re_food_url")
users.show(truncate=False)

# In[46]:


users = foodid_df.selectExpr("user_id", "foodid").join(foodlist_df.select("foodid", "fname", "img_url"), "foodid",
                                                       how='left').join(users_unique.selectExpr("user_id", "username"),
                                                                        "user_id", how='left').selectExpr(
    "foodid as re_foodid", "fname as re_fname", "username as re_username", "img_url as re_food_url")
users.show(truncate=False)

# In[47]:


users.write.format("jdbc").option("url",
                                  "jdbc:mysql://hadoop13:3306/food_recommend?characterEncoding=UTF-8&useSSL=false&serverTimezone=GMT%2B8") \
    .option("dbtable", "ratings_recommendation") \
    .option("user", "root") \
    .option("password", "0000") \
    .option("driver", "com.mysql.cj.jdbc.Driver") \
    .mode("overwrite") \
    .save()

# In[ ]:

Item-based

from pyspark.ml.evaluation import RegressionEvaluator
from pyspark.ml.recommendation import ALS
from pyspark.sql import SparkSession
from pyspark.ml.feature import StringIndexer
# 数据库连接函数
SparkSession.builder.config('spark.driver.extraClassPath',
                            '/opt/installs/spark3.1.2/jars/mysql-connector-java-8.0.20.jar')


# In[8]:

def get_data(table_name, re_spark):
    url = "jdbc:mysql://hadoop13:3306/food_recommend?characterEncoding=UTF-8&useSSL=false&serverTimezone=GMT%2B8"
    properties = {"user": "root", "password": "0000", "driver": "com.mysql.cj.jdbc.Driver"}
    df = re_spark.read.jdbc(url=url, table=table_name, properties=properties)
    return df


# 初始化 SparkSession
spark = SparkSession.builder.appName("FoodRecommendation_ItemBased").getOrCreate()

# 获取数据
foodlist_df = get_data("ratings_foodlist", spark)
rating_df = get_data("ratings_rating", spark)

# 显示数据
print("Foodlist Data:")
foodlist_df.show(10, truncate=False)
print("Rating Data:")
rating_df.show(10, truncate=False)

# 数据预处理：确保 ALS 算法所需的列的数据类型正确
# rating_df = rating_df.withColumn("user_id", rating_df["username"].cast("integer"))
rating_df = rating_df.withColumn("food_id", rating_df["foodid_id"].cast("integer"))
rating_df = rating_df.withColumn("rating", rating_df["rating"].cast("float"))

# userid的处理为数值
user_indexer = StringIndexer(inputCol="username", outputCol="user_id")
user_indexer_model = user_indexer.fit(rating_df)
rating_df = user_indexer_model.transform(rating_df)


# 显示处理后的评分数据
print("Processed Rating Data:")
rating_df.show(10, truncate=False)

# 数据划分：将数据划分为训练集和测试集
(training, test) = rating_df.randomSplit([0.8, 0.2])

# 构建基于物品的协同过滤模型
als = ALS(
    rank=10,
    maxIter=10,
    regParam=0.01,
    userCol="user_id",
    itemCol="food_id",
    ratingCol="rating",
    coldStartStrategy="drop",
    implicitPrefs=False,  # 将此设置为 False 以进行显式反馈，基于物品的协同过滤
)

# 拟合模型
model = als.fit(training)

# 对测试集进行预测
predictions = model.transform(test)

# 显示预测结果
print("Predictions:")
predictions.show(10, truncate=False)

# 评估模型
evaluator = RegressionEvaluator(metricName="rmse", labelCol="rating", predictionCol="prediction")
rmse = evaluator.evaluate(predictions)
print("Root-mean-square error = " + str(rmse))

# 为所有物品生成推荐
item_recs = model.recommendForAllItems(5)

# 显示推荐结果
print("Item Recommendations:")
item_recs.show(truncate=False)


# Predictions:
# +---+--------+------+---------+-------+-------+----------+
# |id |username|rating|foodid_id|food_id|user_id|prediction|
# +---+--------+------+---------+-------+-------+----------+
# |22 |zhangsan|3.0   |28       |28     |0.0    |0.75916743|
# +---+--------+------+---------+-------+-------+----------+
#
# Root-mean-square error = 2.240832567214966
# Item Recommendations:
# +-------+---------------------------------+
# |food_id|recommendations                  |
# +-------+---------------------------------+
# |623    |[{0, 4.9992123}, {1, 2.999935}]  |
# |28     |[{1, 4.9966803}, {0, 0.75916743}]|
# |16114  |[{0, 4.995712}, {1, 0.69256437}] |
# |178    |[{0, 3.9965696}, {1, 0.5540514}] |
# |470    |[{0, 3.9965696}, {1, 0.5540514}] |
# |5203   |[{0, 2.9974272}, {1, 0.4155385}] |
# |1811   |[{0, 4.995712}, {1, 0.69256437}] |
# |2822   |[{0, 2.9974272}, {1, 0.4155385}] |
# |35119  |[{1, 3.997344}, {0, 0.6073338}]  |
# |28347  |[{0, 1.9982848}, {1, 0.2770257}] |
# |4771   |[{1, 4.9966803}, {0, 0.75916743}]|
# |3274   |[{1, 4.9966803}, {0, 0.75916743}]|
# |45383  |[{0, 3.9965696}, {1, 0.5540514}] |
# |31051  |[{1, 2.9980083}, {0, 0.45550042}]|
# +-------+---------------------------------+


#
# 这是基于物品的协同过滤模型的输出结果。我们逐一解释一下：
#
# Predictions：这个表格显示了模型对测试集中的评分进行的预测。对于每个用户-物品对，模型预测用户对该物品的评分。例如，对于用户zhangsan（user_id为0）和物品28，模型预测的评分为0.75916743。实际评分为3.0，所以预测误差为2.240832567214966。
#
# Root-mean-square error：这是模型预测评分和实际评分之间的均方根误差（RMSE）。RMSE值越低，模型预测的准确性越高。
#
# Item Recommendations：这个表格显示了为每个物品生成的推荐用户。对于每个物品（food_id），推荐系统为其推荐一组用户，这些用户可能对该物品感兴趣。例如，对于物品623，推荐给用户0（评分为4.9992123）和用户1（评分为2.999935）。这些推荐是根据用户之间的相似性和他们对其他物品的评分生成的。
#
# 这些输出可以帮助你了解模型的性能以及为每个物品生成的推荐。你可以根据这些推荐来为用户提供个性化的物品推荐。


# 这里的数据表示物品623对于用户0的预测评分是4.9992123，对于用户1的预测评分是2.999935。评分越高，表示用户对该物品的喜欢程度越高。因此，根据这个预测结果，物品623更适合用户0，而不是用户1。
#
# RMSE（均方根误差）是用于评估整个模型预测评分和实际评分之间的误差。RMSE值越低，表示模型预测的整体准确性越高，但这并不直接关系到单个物品对于某个用户的推荐。

user-based

from pyspark.ml.evaluation import RegressionEvaluator
from pyspark.ml.feature import StringIndexer
from pyspark.ml.recommendation import ALS
from pyspark.sql import SparkSession
from pyspark.sql.functions import col

def get_data(table_name, re_spark):
    url = "jdbc:mysql://hadoop13:3306/food_recommend?characterEncoding=UTF-8&useSSL=false&serverTimezone=GMT%2B8"
    properties = {"user": "root", "password": "0000", "driver": "com.mysql.cj.jdbc.Driver"}
    df = re_spark.read.jdbc(url=url, table=table_name, properties=properties)
    return df

spark = SparkSession.builder \
    .appName("FoodRecommendation") \
    .config('spark.driver.extraClassPath', '/opt/installs/spark3.1.2/jars/mysql-connector-java-8.0.20.jar') \
    .getOrCreate()

foodlist_df = get_data("ratings_foodlist", spark)
rating_df = get_data("ratings_rating", spark)

user_indexer = StringIndexer(inputCol="username", outputCol="user_id").fit(rating_df)
food_indexer = StringIndexer(inputCol="foodid_id", outputCol="food_id").fit(rating_df)

indexed_rating_df = user_indexer.transform(rating_df)
indexed_rating_df = food_indexer.transform(indexed_rating_df)

print('foodlist_df.show rating_df.show')
foodlist_df.show(10, truncate=False)
rating_df.show(10, truncate=False)
indexed_rating_df.show()
# 训练ALS模型
als = ALS(rank=10, maxIter=10, regParam=0.01,
          userCol="user_id", itemCol="food_id", ratingCol="rating",
          coldStartStrategy="drop")

(training, test) = indexed_rating_df.randomSplit([0.8, 0.2])
model = als.fit(training)

# 预测和评估
predictions = model.transform(test)
evaluator = RegressionEvaluator(metricName="rmse", labelCol="rating", predictionCol="prediction")
rmse = evaluator.evaluate(predictions)
print("Root-mean-square error = " + str(rmse))
# Root-mean-square error = 0.022859573364257812

# 获取用户推荐
user_recs = model.recommendForAllUsers(5)
user_recs.show(truncate=False)

# 23/04/24 14:52:58 WARN LAPACK: Failed to load implementation from: com.github.fommil.netlib.NativeRefLAPACK
# Root-mean-square error = 0.030036449432373047
# +-------+---------------------------------------------------------------------------------+
# |user_id|recommendations                                                                  |
# +-------+---------------------------------------------------------------------------------+
# |1      |[{11, 5.001959}, {15, 5.001959}, {0, 4.9699636}, {3, 4.0015674}, {12, 4.0015674}]|
# |0      |[{5, 5.0003386}, {2, 5.0003386}, {8, 5.0003386}, {1, 4.9684596}, {13, 4.0002704}]|
# +-------+---------------------------------------------------------------------------------+


#
# 基于模型ALS算法和基于物品算法都是流行的协同过滤推荐算法，它们都有一些优势和劣势。相比之下，基于用户的算法有以下两个优势：
#
# 解释性更好
# 基于用户的协同过滤算法更加直观，因为它可以告诉我们每个用户对哪些物品有偏好，可以更容易地解释推荐结果。
# 而基于物品的协同过滤算法只能告诉我们哪些物品与某个物品相似，而无法告诉我们哪些用户对这些物品感兴趣。
#
# 可扩展性更好
# 基于用户的协同过滤算法相对于基于物品的协同过滤算法具有更好的可扩展性。因为在基于用户的协同过滤算法中，
# 每个用户的偏好可以被认为是相对独立的。因此，它可以更容易地扩展到大量用户的情况下，而不需要考虑物品的数量。
# 而在基于物品的协同过滤算法中，考虑到每个物品需要与其他物品计算相似度，因此在物品数量较大时，计算成本会变得更高。
#

三、网页加入评分入库

3.1 food_list.html网页代码

{% extends 'base.html' %}

{% block title %}
    餐饮推荐系统
{% endblock %}

{% block content %}
    <h1 class="text-center my-5">请对以下菜品打上您心中的分数h1>

    <div class="container">
        {% for food in food %}
            <div class="row">
                <div class="col-md-4">
                    <div class="food-card">
                        <div class="image-container">
                            <img src="{{ food.img_url }}" alt="{{ food.fname }}"
                                 class="img-fluid rounded">
                        div>
                        <div class="food-info">
                            <h4>{{ food.fname }}h4>
                            <p>口味：{{ food.ftaste }}p>
                            <p>烹饪方法：{{ food.cooking_method }}p>
                            <form method="post" action="{% url 'rate_food' %}">
                                {% csrf_token %}
                                <select name="rating">
                                    <option value="" disabled selected>请选择评分option>
                                    <option value="1">1option>
                                    <option value="2">2option>
                                    <option value="3">3option>
                                    <option value="4">4option>
                                    <option value="5">5option>
                                select>
                                <input type="hidden" name="foodid_id" value="{{ food.foodid }}">
                                <input type="hidden" name="username" value="admin">
                                <button type="submit" class="btn btn-primary">提交评分button>
                            form>
                        div>
                    div>
                div>
            div>
        {% endfor %}
    div>
    
    <a href="#top" class="anchor">TOPa>

    <style>
        .container {
            display: grid;
            grid-template-columns: repeat(auto-fit, minmax(300px, 1fr));
            gap: 20px;
            justify-items: center;
        }

        .food-card {
            transition: transform 0.3s;
            box-sizing: border-box;
            width: 300px;
        }

        .food-card:hover {
            transform: scale(1.05);
        }

        .food-card img {
            max-height: 200px;
            object-fit: cover;
            width: 100%;
            height: 100%;
        }

        .food-info {
            margin-top: 10px;
            transition: color 0.3s;
        }

        .food-card:hover .food-info h4,
        .food-card:hover .food-info p {
            color: #007bff;
        }

        .anchor {
            position: fixed;
            bottom: 60px;
            right: 20px;
            padding: 10px 20px;
            background-color: #666666;
            color: #fff;
            text-decoration: none;
            border-radius: 5px;
            z-index: 9999;
        }

        .anchor:hover {
            background-color: #999999;
            text-decoration: none;
            color: #fff;
        }

        .button-container button {
            padding: 10px 20px;
            background-color: #007bff;
            color: #fff;
            border: none;
            border-radius: 5px;
            cursor: pointer;
        }

        .button-container button:hover {
            background-color: #0056b3;
        }
    style>

{% endblock %}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NJpLmZWn-1686719313919)(毕设.assets/Snipaste_2023-04-23_22-57-36.png)]

3.2 recommendations.html页代码

{% extends 'base.html' %}

{% block title %}
    餐饮推荐系统
{% endblock %}

{% block content %}
    <h1 class="text-center my-5">请对以下菜品打上您心中的分数h1>

    <div class="container">
        {% for food in food %}
            <div class="row">
                <div class="col-md-4">
                    <div class="food-card">
                        <div class="image-container">
                            <img src="{{ food.img_url }}" alt="{{ food.fname }}"
                                 class="img-fluid rounded">
                        div>
                        <div class="food-info">
                            <h4>{{ food.fname }}h4>
                            <p>口味：{{ food.ftaste }}p>
                            <p>烹饪方法：{{ food.cooking_method }}p>
                            <form method="post" action="{% url 'rate_food' %}">
                                {% csrf_token %}
                                <select name="rating">
                                    <option value="" disabled selected>请选择评分option>
                                    <option value="1">1option>
                                    <option value="2">2option>
                                    <option value="3">3option>
                                    <option value="4">4option>
                                    <option value="5">5option>
                                select>
                                <input type="hidden" name="foodid_id" value="{{ food.foodid }}">
                                <input type="hidden" name="username" value="admin">
                                <button type="submit" class="btn btn-primary">提交评分button>
                            form>
                        div>
                    div>
                div>
            div>
        {% endfor %}
    div>
    
    <a href="#top" class="anchor">TOPa>

    <style>
        .container {
            display: grid;
            grid-template-columns: repeat(auto-fit, minmax(300px, 1fr));
            gap: 20px;
            justify-items: center;
        }

        .food-card {
            transition: transform 0.3s;
            box-sizing: border-box;
            width: 300px;
        }

        .food-card:hover {
            transform: scale(1.05);
        }

        .food-card img {
            max-height: 200px;
            object-fit: cover;
            width: 100%;
            height: 100%;
        }

        .food-info {
            margin-top: 10px;
            transition: color 0.3s;
        }

        .food-card:hover .food-info h4,
        .food-card:hover .food-info p {
            color: #007bff;
        }

        .anchor {
            position: fixed;
            bottom: 60px;
            right: 20px;
            padding: 10px 20px;
            background-color: #666666;
            color: #fff;
            text-decoration: none;
            border-radius: 5px;
            z-index: 9999;
        }

        .anchor:hover {
            background-color: #999999;
            text-decoration: none;
            color: #fff;
        }

        .button-container button {
            padding: 10px 20px;
            background-color: #007bff;
            color: #fff;
            border: none;
            border-radius: 5px;
            cursor: pointer;
        }

        .button-container button:hover {
            background-color: #0056b3;
        }
    style>

{% endblock %}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-A9CU1kYd-1686719313930)(毕设.assets/image-20230423232004274.png)]

3.3 views.py视图层

import os

from django.conf import settings
from django.http import HttpResponse
from django.shortcuts import render, redirect
from .models import Foodlist, Rating, Recommendation
import subprocess


# food_list.html中使用的数据库
def food_list(request):
    food = Foodlist.objects.all()
    return render(request, 'food_list.html', {'food': food})


# 增加提交数据库功能
def rate_food(request):
    if request.method == 'POST':
        username = request.POST['username']
        rating = request.POST['rating']
        foodid_id = int(request.POST['foodid_id'])
        foodlist = Foodlist.objects.get(foodid=foodid_id)  # 根据 foodid 获取 Foodlist 实例
        rating = Rating(username=username, rating=rating, foodid=foodlist)  # 修改字段名为foodid
        rating.save()
        return redirect('rate_food')  # 根据需要跳转到成功页面
    else:
        # 处理 GET 请求，渲染表单页面
        food_list = Foodlist.objects.all()  # 获取所有食品对象，用于渲染表单页面
        return render(request, 'food_list.html', {'food': food_list})


def recommendations(request):
    re_username = request.GET.get('re_username')
    re = request.GET.get('re')

    if re_username:
        recommend = Recommendation.objects.filter(re_username=re_username)
    else:
        recommend = []
    if re == "yes":
        print("yes")
        subprocess.run(['python', 'ratings/utils/food_recommend.py'])
    context = {
        're_username': re_username,
        'recommendations': recommend,
    }

    return render(request, 'recommendations.html', context)

3.4 urls.py路由层

from django.urls import path
from ratings.views import food_list, rate_food, recommendations
from django.conf.urls.static import static
from django.conf import settings
from . import views

urlpatterns = [
    path('', food_list, name='food_list'),
    path('rate_food/', rate_food, name='rate_food'),
    path('recommendations/', views.recommendations, name='recommendations'),
] + static(settings.MEDIA_URL, document_root=settings.MEDIA_ROOT)

3.5 后端

views.py

from django.shortcuts import render, redirect
from .models import Foodlist
from .forms import FoodlistForm

def manage_food(request):
    if request.method == 'POST':
        # 添加新菜品
        if 'add_food' in request.POST:
            form = FoodlistForm(request.POST)
            if form.is_valid():
                form.save()
        # 删除菜品
        elif 'delete_food' in request.POST:
            food_id = request.POST.get('foodid')
            Foodlist.objects.filter(foodid=food_id).delete()

    # 获取菜品列表
    food_list = Foodlist.objects.all()
    form = FoodlistForm()
    context = {'food_list': food_list, 'form': form}
    return render(request, 'manage_food.html', context)

url层

from django.urls import path
from . import views

urlpatterns = [
    # 其他路由...
    path('manage_food/', views.manage_food, name='manage_food'),
]

html

{% extends 'base.html' %}

{% block content %}
    后端管理界面

    
        
            
                添加菜品
                
                    {% csrf_token %}
                    {{ form.as_p }}
                    
                
            
            
                删除菜品
                
                    {% csrf_token %}
                    菜品 ID：
                    
                    
                
            
        
        
            
                菜品列表
                
                        {% for food in food_list %}
                            
                        {% endfor %}
                    
                    
                        
                            ID
                            菜品名
                            口味
                            烹饪方法
                            图片 URL
                        
                    
                    
                                {{ food.foodid }}
                                {{ food.fname }}
                                {{ food.ftaste }}
                                {{ food.cooking_method }}
                                {{ food.img_url }}

ID	菜品名	口味	烹饪方法	图片 URL
{{ food.foodid }}	{{ food.fname }}	{{ food.ftaste }}	{{ food.cooking_method }}	{{ food.img_url }}

forms.py

from django import forms
from .models import Foodlist

class FoodlistForm(forms.ModelForm):
    class Meta:
        model = Foodlist
        fields = ['foodid', 'fname', 'ftaste', 'cooking_method', 'img_url']
        labels = {
            'foodid': '菜品 ID',
            'fname': '菜品名',
            'ftaste': '口味',
            'cooking_method': '烹饪方法',
            'img_url': '图片 URL',
        }

你可能感兴趣的:(Hadoop生态,算法,hadoop,spark,hdfs)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
最超值的Mac——Mac mini 初心么么哒
你知道最超值的Mac是什么吗？自2005年以来，Macmini一直是Apple台式机产品线中的主要产品。最初推出是为了让对Mac好奇的Mac进入Apple生态系统的一种简单方式，现在新的AppleSiliconMacmini可能是任何寻找新Mac的人的最有吸引力的购买。什么是AppleSiliconMacmini？M1Macmini是Apple最小的台式电脑，同时也是最快的台式电脑之一。最新型号由
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持