山水阳泉曲

推荐召回中ALS(交替最小二乘法)算法验证

文章目录

需求
流程设计
- 步骤1: 数据准备
- 步骤2: 模型训练
- 步骤3: 评估指标选择
- 步骤4: 性能评估
代码实现
- 导入依赖
- Mysql获取数据
- 分批加载到矩阵
- - 目标
  - coo_matrix
  - vstack
- bm25_weight
- 模型训练
测试
评估
完整代码

需求

为了验证推荐系统中ALS（交替最小二乘）算法的召回效果以及离线数据推荐的效果，我们需要进行一系列的实验步骤。这些步骤包括数据准备、模型训练、评估指标的选择以及最终的性能评估

流程设计

步骤1: 数据准备

加载数据：从MySQL数据库中加载用户-物品评分数据。
确保数据集足够大，并且用户和物品都有足够的评分记录。
划分数据集：将数据集划分为训练集和测试集。可以采用80%的数据作为训练集，剩余20%作为测试集。
对于每个用户，从其评分记录中随机选择一部分作为测试集。
构建用户-物品评分矩阵：使用训练集构建用户-物品评分矩阵。确保评分矩阵中用户ID和物品ID都减去了1，以适应从0开始的索引。

步骤2: 模型训练

初始化ALS模型：
使用AlternatingLeastSquares类初始化ALS模型。
设置模型的超参数，例如因子数量（factors）、正则化系数（regularization）和迭代次数（iterations）。
应用BM25权重：
可以选择性地应用BM25权重来优化用户-物品评分矩阵，以增强稀疏数据的效果。
训练模型：
使用训练集中的用户-物品评分矩阵训练ALS模型。

步骤3: 评估指标选择

定义评估指标：
选择合适的评估指标来衡量推荐系统的性能，常见的评估指标包括精确度（Precision）、召回率（Recall）、F1分数等。
在本例中，我们将主要关注召回率（Recall），因为它衡量的是推荐系统能够成功找到相关物品的能力。

步骤4: 性能评估

离线数据推荐：
对于测试集中的每个用户，使用训练好的模型进行推荐。
根据每个用户的测试集记录来评估推荐结果。
计算召回率：
对于每个用户，计算推荐结果中实际出现的测试集物品比例。
平均所有用户的召回率，得到整体的召回率。
结果分析：
分析召回率的结果，评估ALS模型在推荐系统中的有效性。
可以尝试不同的超参数组合，以寻找最佳的模型配置。

代码实现

导入依赖

import pandas as pd
import numpy as np
from sqlalchemy import create_engine
from scipy.sparse import coo_matrix, vstack
from implicit.als import AlternatingLeastSquares
from implicit.nearest_neighbours import bm25_weight

Mysql获取数据

# MySQL数据库配置
DATABASE_TYPE = 'mysql'
DBAPI = 'test'
USERNAME = 'test'
PASSWORD = 'test'
HOST = '127.0.0.1'  # 或者是数据库服务器的IP地址
PORT = 3306
DATABASE = 'test'


# 创建数据库连接
engine = create_engine(f"{DATABASE_TYPE}+{DBAPI}://{USERNAME}:{PASSWORD}@{HOST}:{PORT}/{DATABASE}")
print(engine)
# SQL查询语句
query = "SELECT * FROM user_rate"

分批加载到矩阵

目标

使用coo_matrix构建一个稀疏矩阵，足够容纳user-item，
分批从数据库加载数据，变换为矩阵

coo_matrix

 batch_user_item_matrix = coo_matrix((batch_df['score'], (batch_df['uid'] - 1, batch_df['mediaid'] - 1)), shape=(n_users, n_items))
        print("用户-物品评分",batch_user_item_matrix)

coo_matrix函数是SciPy库中的一部分，用于创建一个基于坐标格式（Coordinate
Format）的稀疏矩阵。这种类型的矩阵非常适合从零开始构建矩阵，尤其是在需要逐个元素填充的情况下。

coo_matrix((data, (row, col)), shape=None, dtype=None, copy=False)
参数说明：

data：一个一维数组，包含非零元素的值。
row：一个一维数组，与data对应，表示每个非零元素所在的行索引。
col：一个一维数组，与data对应，表示每个非零元素所在的列索引。
shape：可选参数，表示矩阵的形状，默认情况下，它会根据row和col的最大值自动确定。
dtype：可选参数，表示矩阵中元素的数据类型。
copy：可选参数，布尔值，表示是否复制输入数据。

coo_matrix的功能特点
1 构建稀疏矩阵： coo_matrix允许您通过提供非零元素的位置和值来构建一个稀疏矩阵。
2 节省内存：对于大部分元素为0的大矩阵来说，使用稀疏矩阵可以显著减少内存占用。

3 高效操作：稀疏矩阵提供了许多高效的矩阵运算，如加法、乘法等。
4 转换为其他格式： coo_matrix可以轻松转换为其他稀疏矩阵格式，如CSR（Compressed SparseRow）或CSC（Compressed Sparse Column）等。

vstack

vstack（垂直堆叠）是SciPy库中的函数，用于将多个稀疏矩阵垂直堆叠在一起形成一个新的稀疏矩阵。vstack函数通常用于将多个较小的稀疏矩阵合并成一个较大的矩阵，特别是在处理分批加载的数据时非常有用。
基本用法：

vstack(blocks, format=None, dtype=None)
参数：
blocks：一个包含多个稀疏矩阵的元组或列表，这些矩阵将被垂直堆叠。
format：可选参数，指定输出矩阵的格式，默认为输入矩阵的格式。
dtype：可选参数，指定输出矩阵中元素的数据类型。

vstack的功能

垂直堆叠将多个稀疏矩阵沿着垂直方向堆叠在一起。
兼容不同格式 vstack支持多种稀疏矩阵格式，如COO、CSR、CSC等。
数据类型转换：
通过dtype参数指定输出矩阵的数据类型。
灵活的格式转换可以在堆叠后转换输出矩阵的格式

# 分批加载数据
def load_data_in_batches(engine, query, batch_size):
    # 确定用户和物品的总数
    n_users = pd.read_sql_query("SELECT MAX(uid) AS max_user_id FROM user_rate", engine)['max_user_id'][0] + 1
    n_items = pd.read_sql_query("SELECT MAX(mediaid) AS max_item_id FROM user_rate", engine)['max_item_id'][0] + 1
    print("矩阵",n_users,n_items)
    # 初始化一个空的稀疏矩阵
    user_item_matrix = None
    
    # 分批处理数据
    offset = 0
    while True:
        # 获取当前批次的数据
        batch_df = pd.read_sql_query(f"{query} LIMIT {batch_size} OFFSET {offset}", engine)
        print("分批数据",batch_df)
        # 如果没有更多的数据，则停止循环
        if batch_df.empty:
            break
        #if offset>20: # 测试使用
        #    break
        # 创建当前批次的用户-物品评分矩阵
        batch_user_item_matrix = coo_matrix((batch_df['score'], (batch_df['uid'] - 1, batch_df['mediaid'] - 1)), shape=(n_users, n_items))
        print("用户-物品评分",batch_user_item_matrix)
        # 将当前批次的矩阵添加到总矩阵中
        if user_item_matrix is None:
            user_item_matrix = batch_user_item_matrix
        else:
            user_item_matrix = vstack([user_item_matrix, batch_user_item_matrix])
        
        # 更新偏移量
        offset += batch_size
    
    # 将coo_matrix转换为csr_matrix
    user_item_matrix = user_item_matrix.tocsr()
    print(user_item_matrix)
    return user_item_matrix

user_item_matrix.tocsr()
参照常见稀疏矩阵格式及转换

bm25_weight

# 应用BM25权重
user_item_matrix = bm25_weight(user_item_matrix.T).T
print("user_item_matrix BM2",user_item_matrix)

bm25_weight函数被用来对用户-物品评分矩阵进行加权处理，以提高推荐质量。这里两次使用转置操作的原因在于bm25_weight函数的输入期望是物品-用户评分矩阵，而不是用户-物品评分矩阵。

第一次转置 (user_item_matrix.T)：

原始的user_item_matrix是一个用户-物品评分矩阵，其中行代表用户，列代表物品。
user_item_matrix.T将矩阵转置，使行代表物品，列代表用户。这样就变成了一个物品-用户评分矩阵，这符合bm25_weight函数的输入要求。

调用bm25_weight函数：

bm25_weight函数期望输入是一个物品-用户评分矩阵，即转置后的user_item_matrix.T。这个函数会对输入矩阵进行BM25加权处理，这是一种文本检索领域常用的技术，用于改善文档排名。在推荐系统中，它可以提高推荐的质量。

第二次转置 (bm25_weight(user_item_matrix.T).T)

经过bm25_weight处理后，输出仍然是一个物品-用户评分矩阵。
再次转置是为了将结果转换回原始的用户-物品评分矩阵格式，即行代表用户，列代表物品

模型训练

# 初始化ALS模型
model = AlternatingLeastSquares(factors=50, regularization=0.01, iterations=20)
print("user_item_matrix bgn fit")
# 训练模型
model.fit(user_item_matrix)
print("user_item_matrix end fit",user_item_matrix)
user_item_matrix = user_item_matrix.tocsr()
print("tocsr",user_item_matrix)

AlternatingLeastSquares是implicit库中的一个类，用于实现交替最小二乘（Alternating Least Squares,> ALS）算法。
ALS是一种广泛应用于协同过滤推荐系统的方法，主要用于解决用户-物品评分矩阵中的缺失值问题，从而生成用户对未评分物品的预测评分或推荐。

AlternatingLeastSquares的主要特性

交替更新：
ALS算法通过交替更新用户因子矩阵和物品因子矩阵来最小化预测评分与实际评分之间的平方误差。
正则化：
ALS算法通常包含正则化项以避免过拟合。
隐式反馈：
implicit库中的AlternatingLeastSquares特别设计用于处理隐式反馈数据，即用户的行为数据（如点击、浏览等），而不是显式的评分数据。
可扩展性：
implicit库利用了稀疏矩阵运算，使得ALS算法能够高效地处理大规模数据集。

model = AlternatingLeastSquares(
      factors=50, 
      regularization=0.01, 
      iterations=20
      )

参数说明

factors：用户和物品的因子数量。
regularization：正则化系数，用于控制模型复杂度。
iterations：迭代次数，即交替更新用户和物品因子的轮数

测试

recommend方法参数
user_id：要为其生成推荐的用户ID。
user_vector：用户-物品评分矩阵中对应用户的行向量。
N：要返回的推荐物品数量。
filter_already_liked_items：是否过滤掉用户已经评分过的物品

 测试用户1 的推荐
user_id = 1  # 示例用户ID
# 使用user_item_matrix的行索引来获取用户向量
user_vector = user_item_matrix[user_id - 1]
print("用户向量",user_vector)
# 获取用户推荐 过滤已经点击的
recommendations = model.recommend(user_id - 1, user_vector, N=10, filter_already_liked_items=True)
print("推荐",recommendations)

评估

在推荐系统中，通常需要评估模型的性能。常用的评估指标包括精确率、召回率、F1分数等

from implicit.evaluation import precision_at_k, recall_at_k

# 假设test_user_item_matrix是测试集的用户-物品评分矩阵
precision = precision_at_k(model, user_item_matrix, test_user_item_matrix, K=10)
recall = recall_at_k(model, user_item_matrix, test_user_item_matrix, K=10)

print(f"Precision@10: {precision:.4f}")
print(f"Recall@10: {recall:.4f}")

完整代码

import pandas as pd
import numpy as np
from sqlalchemy import create_engine
from scipy.sparse import coo_matrix, vstack
from implicit.als import AlternatingLeastSquares
from implicit.nearest_neighbours import bm25_weight

# MySQL数据库配置
DATABASE_TYPE = 'mysql'
DBAPI = 'pymysql'
USERNAME = 'test'
PASSWORD = 'test'
HOST = '127.0.0.1'  # 或者是数据库服务器的IP地址
PORT = 3306
DATABASE = 'test'


# 创建数据库连接
engine = create_engine(f"{DATABASE_TYPE}+{DBAPI}://{USERNAME}:{PASSWORD}@{HOST}:{PORT}/{DATABASE}")
print(engine)
# SQL查询语句
query = "SELECT * FROM user_rate"

# 分批加载数据
def load_data_in_batches(engine, query, batch_size):
    # 确定用户和物品的总数
    n_users = pd.read_sql_query("SELECT MAX(uid) AS max_user_id FROM user_rate", engine)['max_user_id'][0] + 1
    n_items = pd.read_sql_query("SELECT MAX(mediaid) AS max_item_id FROM user_rate", engine)['max_item_id'][0] + 1
    print("矩阵",n_users,n_items)
    # 初始化一个空的稀疏矩阵
    user_item_matrix = None
    
    # 分批处理数据
    offset = 0
    while True:
        # 获取当前批次的数据
        batch_df = pd.read_sql_query(f"{query} LIMIT {batch_size} OFFSET {offset}", engine)
        print("分批数据",batch_df)
        # 如果没有更多的数据，则停止循环
        if batch_df.empty:
            break
        if offset>20:
            break
        # 创建当前批次的用户-物品评分矩阵
        batch_user_item_matrix = coo_matrix((batch_df['score'], (batch_df['uid'] - 1, batch_df['mediaid'] - 1)), shape=(n_users, n_items))
        print("用户-物品评分",batch_user_item_matrix)
        # 将当前批次的矩阵添加到总矩阵中
        if user_item_matrix is None:
            user_item_matrix = batch_user_item_matrix
        else:
            user_item_matrix = vstack([user_item_matrix, batch_user_item_matrix])
        
        # 更新偏移量
        offset += batch_size
    
    # 将coo_matrix转换为csr_matrix
    user_item_matrix = user_item_matrix.tocsr()
    print(user_item_matrix)
    return user_item_matrix

# 设置批处理大小
batch_size = 10  # 每次处理1000个评分记录

# 加载数据并构建用户-物品评分矩阵
user_item_matrix = load_data_in_batches(engine, query, batch_size)

# 应用BM25权重
user_item_matrix = bm25_weight(user_item_matrix.T).T
print("user_item_matrix BM2",user_item_matrix)
# 初始化ALS模型
model = AlternatingLeastSquares(factors=50, regularization=0.01, iterations=20)
print("user_item_matrix bgn fit")
# 训练模型
model.fit(user_item_matrix)
print("user_item_matrix end fit",user_item_matrix)
user_item_matrix = user_item_matrix.tocsr()
print("tocsr",user_item_matrix)
# 获取用户推荐
user_id = 1  # 示例用户ID
# 使用user_item_matrix的行索引来获取用户向量
user_vector = user_item_matrix[user_id - 1]
print("用户向量",user_vector)

#recommendations = model.recommend(user_id - 1, user_vector, N=10)
# 获取用户推荐 过滤已经点击的
recommendations = model.recommend(user_id - 1, user_vector, N=10, filter_already_liked_items=True)

print("推荐",recommendations)
#recommendations = model.recommend(user_id - 1, user_item_matrix[user_id - 1], N=10)

# 输出推荐结果
item_ids, scores = recommendations
for item_id, score in zip(item_ids, scores):
    print(f"Item ID: {item_id + 1}, Score: {score:.12e}")

Python Requests 与 RESTful API 的交互实践 AI天才研究院 AI人工智能与大数据 python restful 交互 ai
PythonRequests与RESTfulAPI的交互实践关键词：PythonRequests、RESTfulAPI、HTTP请求、API交互、JSON数据处理摘要：本文将带你从“零基础”到“实战高手”，用通俗易懂的语言和生活案例，拆解PythonRequests库与RESTfulAPI交互的核心逻辑。我们将学习如何用Requests发送GET/POST/PUT/DELETE等常见HTTP请求，
机器学习，支持向量机svm和决策树xgboost介绍 suixinm 支持向量机机器学习决策树
支持向量机(SVM)和XGBoost都是非常强大且应用广泛的机器学习算法，但它们基于不同的原理，各有其优势和劣势，适用于不同的场景。以下是两者的主要区别和优劣势对比：1.核心思想与模型类型:SVM:核心思想:找到一个最优的超平面（在特征空间中），将不同类别的样本分隔开，并且使得该超平面到两类样本中最近的样本点（支持向量）的距离（间隔）最大化。核心是几何间隔最大化。模型类型:单个模型（虽然是核方法，
Google 相机增强（GCam）框架原理初探：图像质量与计算摄影的系统性突破观熵影像技术全景图谱：架构调优与实战数码相机影像 Camera
Google相机增强（GCam）框架原理初探：图像质量与计算摄影的系统性突破关键词：GCam、GoogleCamera、HDR+、SuperResZoom、Camera2API、多帧合成、算法流程、图像增强、夜视模式、Pixel相机移植摘要：GCam（GoogleCamera）作为Pixel系列设备图像质量表现的核心支撑，其背后的增强框架融合了Google长期积累的计算摄影技术，从HDR+到Sup
【学习】《算法图解》第十章学习笔记：贪婪算法程序员
一、贪婪算法概述贪婪算法（GreedyAlgorithm）是一种在每一步选择中都采取当前状态下最好或最优的选择，从而希望导致结果是最好或最优的算法。贪婪算法不从整体最优上加以考虑，它所做出的选择只是在某种意义上的局部最优选择。（一）算法适用场景贪婪算法适用于具有"贪心选择性质"的问题，即局部最优选择能导致全局最优解的问题。主要应用于：需要求解最优化问题问题具有贪心选择性质问题具有最优子结构性质（二
算法: 冒泡排序 Code溪算法 java 算法数据结构
冒泡排序是一种简单的排序算法，通过相邻元素的比较和交换，使较大的元素逐渐"浮"到数组末尾。时间复杂度:最佳O(n)|平均O(n²)|最差O(n²)空间复杂度:O(1)稳定性:稳定应用场景/前提条件适用于小规模数据对几乎已排序的数据效率较高算法步骤比较相邻的元素。如果第一个比第二个大，就交换它们对每一对相邻元素做同样的工作，从开始第一对到结尾的最后一对这步做完后，最后的元素会是最大的数针对所有的元素
15. 条件语句 if_elif_else 丰收连山 python 数据库开发语言
一、基础语法结构if语句的基本格式概念定义if语句是Python中的条件控制语句，用于根据条件的真假执行不同的代码块。其基本结构如下：if条件:代码块使用场景if语句适用于需要根据条件决定是否执行某段代码的情况，例如：检查用户输入是否合法判断变量是否符合预期值根据计算结果选择不同的处理方式常见误区或注意事项条件表达式后必须加冒号（:）代码块必须缩进（通常4个空格或1个制表符）条件表达式的结果应为布
Python中if及else使用 moclocd Python编程 python
if、else使用{Python的if判断语句可以单独使用，也可搭配else使用：如：if(变量名运算符数值或另一个变量名)://括号可加可不加，如果不加，第一个变量名前就需要加一个空格。语句组1//语句组可多写，但是!!!语句组一定要和if的判断条件对齐!!!不然会报错!!!{例：if(a>=0):print(a)}或：if(变量名运算符数值或另一个变量名):语句组1else:语句组2//els
Python的判断语言if/elif/else Star___J python 开发语言后端
Python的判断语句分为"单分支"、"二分之"、"多分支"。Python判断语言"单分支"语句:if:if条件:代码块它包含这样几个部分:if关键字，表示这是一条判断语句；表示判断的条件，当这个条件被满足(即条件为真)时，执行中的代码，条件不满足时，中的代码不会被执行；冒号表示判断代码的开始；表示条件满足时，执行代码块。例如:x=5ifx>1:#if后面跟的就是条件，如果x大于1代码就会继续执行
【力扣—剑指 Offer（第 2 版）简单题目解析汇总】 Wupke 剑指offer 数据结构与算法学习 LeetCode leetcode 剑指offer 数据结构与算法
【力扣—剑指Offer（第2版）简单题目解析汇总】说明1、基本字符串数组数组-排序矩阵/模拟枚举2、算法动态规划深度优先搜索广度优先搜索递归分治记忆化搜索快速选择二分查找3、基础数据结构树（二叉树）二叉搜索树栈队列堆（优先队列）哈希表链表4、技巧性题目双指针位运算计数设计说明简单题目共计38道，按照标签分类为：基本、算法、基础数据结构、技巧等，具体如下。1、基本字符串剑指Offer05.替换空格.
【GitHub开源项目实战】高频交易系统实战解析：基于 Nautilus Trader 的策略回测与事件驱动架构优化观熵 GitHub开源项目实战 github 开源架构
高频交易系统实战解析：基于NautilusTrader的策略回测与事件驱动架构优化关键词：高频交易、事件驱动架构、NautilusTrader、量化回测、算法交易、PythonCython、交易引擎、回测系统、交易策略框架、实战优化摘要：本篇博客围绕GitHub上高质量的开源项目nautechsystems/nautilus_trader展开系统性实战解析。NautilusTrader是一套为专业
Python 中 if 和 else 基础知识的详解和使用点云SLAM Python python 开发语言 python基础学习 Python中流程控制语法 if和else语法人工智能基础计算机语言
一、基本语法结构if条件1:#条件1为真时执行的代码块elif条件2:#条件1不成立，条件2成立时执行else:#所有条件都不成立时执行注意：elif是“elseif”的缩写，可以有多个；else可省略；条件表达式必须是可以返回布尔值的语句（True或False）；Python使用缩进表示代码块，通常是4个空格。二、常见条件表达式表达式含义x==y等于x!=y不等于x>y,x=y,x0:print
【点云压缩】Haar小波变换与RAHT自适应区域层级变换丶契阔算法
Haar小波小波变换由一堆小波基和其系数组成，小波基又分为母小波（低频的）和父小波（高频的）。常用于二维图形处理的小波变换是Haar小波变换，Haar小波变换具有压缩比、抗干扰、速度快的特点，经过小波变换后的系数数据会变得具有规律性，方便后续处理算法进行压缩，同时一些值较小的分量置0不影响图片整体观感。截取了PCL-AVS-PCC一段小波变换点云压缩的代码voidWaveletCoreTransf
从零开始大模型开发与微调：PyTorch中的卷积函数实现详解 AI天才研究院 AI人工智能与大数据 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
从零开始大模型开发与微调：PyTorch中的卷积函数实现详解1.背景介绍1.1大模型开发的意义1.2卷积神经网络在大模型中的应用1.3PyTorch框架简介2.核心概念与联系2.1卷积的数学定义2.2卷积神经网络的组成2.2.1卷积层2.2.2池化层2.2.3全连接层2.3卷积与大模型的关系3.核心算法原理具体操作步骤3.1卷积的前向传播3.2卷积的反向传播3.3卷积的优化策略3.3.1卷积核大小
python多线程：自定义线程类实现线程体、多线程锁机制、死锁问题的解决网小鱼的学习笔记 Python python 开发语言
自定义线程类实现线程体其实threading.Thread是threading模块内的一个类，我们可以自行设计一个类，让这个类继承threading.Thread类，接着在def_init_()内调用threading_Thread_init()方法，然后再所设计的类类别设计run方法，这个概念就称为自定义线程。自定义线程类实现线程体importthreadingimporttime#自定义子线程
C++(20/23)标准模板库编程 - 1 C++ 回顾 akluse C++c++开发语言
引言现代C++编程最引人注目的特点或许并非其语言本身的表达性语法与语义，而是标准模板库(STL)。STL是一个包含多功能模板类与算法的庞大集合。若运用得当，STL能显著简化和提升高性能优质软件的开发流程。然而对于许多C++程序员——无论是初学者还是资深开发者——要掌握如何有效运用STL的编程结构往往令人望而生畏。《实用C++STL编程》作为指导性教材，将教会您如何成功应用STL的类、算法及其他编程
插入排序解析老一岁算法数据结构排序算法
可以将插入排序类比为整理扑克牌的过程：左手持已排序的牌（初始为空）右手从桌上未排序的牌堆中逐张取牌将取到的牌插入左手正确位置最终左手持完全有序的牌前言一、算法工作原理插入排序是一种基于比较的简单排序算法，其核心思想是逐步构建有序序列。算法将待排序数组视为两个部分：已排序部分（初始时仅包含第一个元素）和未排序部分。通过不断从未排序部分取出元素，在已排序部分中找到适当位置插入，最终完成整个数组的排序。
深度剖析数据中台：大数据领域的核心技术架构大数据洞察大数据架构 java ai
深度剖析数据中台：大数据领域的核心技术架构关键词：数据中台、大数据、核心技术架构、数据治理、数据服务摘要：本文旨在对数据中台这一大数据领域的核心技术架构进行深度剖析。首先介绍了数据中台的背景，包括其目的、适用读者、文档结构和相关术语。接着阐述了数据中台的核心概念、原理和架构，通过文本示意图和Mermaid流程图进行直观展示。详细讲解了核心算法原理及具体操作步骤，并结合Python源代码进行说明。引
DOCKER教程 weixin_34388207 运维操作系统 python
2019独角兽企业重金招聘Python工程师标准>>>注意事项1.官方申明docker还是在开发完善中，不建议在运营的产品中使用它，但是现在离正式版越来越接近了，请关注我们的博客http://blog.docker.io/2013/08/getting-to-docker-1-0/2.系统注意事项-由于现在的docker的局限性，现在只能使用在64位的服务器上边安装教程ubntu安装教程（12.0
Python简单理解1-10阶乘和运算小张不嚣张꒰ঌ(˚ᆺ˚)໒꒱ Python爬虫基础集合 python 后端
简单理解for循环实现1-10的阶乘运算基本思路;首先分析阶乘的关系如1!=12!=2*1=23!=3*2*1=64!=4*3*2*1=245!=5*4*3*2*1=120....10!=10*9*8*7*6*5*4*3*2*1=3628800自2以后的阶乘都是前面数的阶乘再乘以本身的数。如4的阶乘4!=43!(32*1),因此我们可以使用for循环来执行代码，定义一个变量啊a和一个总和sum然后
python实现回文数的判断简单理解
回文数的判断及解析第一种方法：第二种方法：回文数：简单来说就是，无论是从前往后读还是从后往前读，都是一样的第一种方法：通过字符串的一些特定的功能来判断是不是回文数a=str(input("请输入你要输入的数字:"))#输入字符串b=a[::-1]#倒序输出ifa==b:#判断是否相等print(f'{a}是回文数')else:print('{}不是回文数'.format(a))#format方法输
运筹系列91：vrp算法包PyVRP IE06 运筹学人工智能
1.介绍PyVRP使用HGS（hybridgeneticsearch）算法求解VRP类问题。在benchmark上的评测结果如下，看起来还不错：2.使用例子2.1CVRPCOORDS=[(456,320),#location0-thedepot(228,0),#location1(912,0),#location2(0,80),#location3(114,80),#location4(570,1
使用Python加载SubRip (.srt)字幕文件进行文本处理 zbb258 python 开发语言
SubRip文件格式是一种非常基础的字幕文件格式，通常使用扩展名.srt。这种格式的字幕文件是由一组组格式化的纯文本行组成，每组之间由一个空行分隔。字幕通常从1开始按顺序编号。时间码格式为小时:分钟:秒,毫秒，且时间单位固定为两个零填充的数字，分数固定为三个零填充的数字(例如00:00:00,000)。由于该程序是在法国编写的，分数分隔符使用逗号。在这篇文章中，我们将演示如何使用Python库加载
Flask + GPT 实践红鼻子时代 flask项目 flask gpt python
一、前言本篇文章会介绍从零开始构建一个基于Flask+GPT的小项目的过程。总共有四个版本的迭代，包括：1、调用GPT接口并渲染到前端页面；2、使用Flask提供的session来实现登录和登出功能；3、用SQLAlchemy管理数据库，实现用户注册和登录；4、记录和分页查看用户与GPT的对话历史。二、项目环境与依赖Python版本：建议3.7+Flask：最常用的PythonWeb框架之一ope
设计哈希集合【set】【拉链法】【位运算法】【定长拉链法】 - 哈希表本质深度解析 weixin_47868976 哈希算法散列表算法
LeetCode705设计哈希集合-哈希表本质深度解析题目描述设计一个哈希集合（HashSet），不使用任何内建的哈希表库，实现以下操作：add(key):向哈希集合中插入值keyremove(key):将给定值key从哈希集合中删除contains(key):返回哈希集合中是否存在这个值key数据范围:0data;public:MyHashSet(){//10^6+1大小的数组，key直接作为索
堆排序实现及复杂度分析 hixiaoyang 算法排序算法数据结构
一、算法概述堆排序(HeapSort)是一种基于二叉堆数据结构的比较排序算法。它利用了堆这种数据结构的特性：最大堆：每个节点的值都大于或等于其子节点的值最小堆：每个节点的值都小于或等于其子节点的值堆排序是不稳定排序算法，时间复杂度为O(nlogn)，空间复杂度为O(1)二、算法步骤1.构建初始堆将无序数组构建成一个最大堆（升序排序时）2.交换与调整将堆顶元素（最大值）与末尾元素交换缩小堆的范围，重
Web3.0 技术应用溯源系统建设天机️灵韵区块链区块链 web3.0
Web3.0技术与溯源（TrackandTrace）的结合，是区块链等去中心化技术在实际应用中的典型场景之一。通过Web3.0的底层技术，可以构建透明、不可篡改且可验证的溯源系统，解决传统供应链、商品流通等领域的数据信任问题。以下是两者的深度关联与具体应用：一、Web3.0如何赋能溯源？区块链的不可篡改性核心机制：区块链通过哈希链、共识算法（如PoW/PoS）确保数据一旦上链，无法被单一方修改或删
AI原生应用监控：实时领域偏见预警系统设计原理 Agentic AI人工智能与大数据 CSDN AI-native 人工智能 ai
AI原生应用监控：实时领域偏见预警系统设计原理关键词AI监控、算法偏见、实时预警、公平性AI、模型监控、偏见检测、AI治理摘要在人工智能驱动决策日益普及的今天，AI系统中的隐性偏见已成为影响公平性、可信度和业务连续性的关键风险。本文深入探讨了AI原生应用监控的核心挑战，重点剖析了实时领域偏见预警系统的设计原理与实现方法。通过将复杂的算法偏见比作"数字世界的隐形滤镜"，我们揭示了偏见如何在AI系统中
【加密】对称加密DES和非对称加密AES、数字签名 bdview 算法区块链密码学 openssl java
目录对称加密1.1定义1.2优缺点1.3常用对称加密算法非对称加密(AsymmetricCryptography)非对称加密(现代加密算法)2.1定义数字签名非常好的文章：《三分钟了解对称加密和非对称加密是如何工作的》https://zhuanlan.zhihu.com/p/108627377主要加密算法有哪些：https://blog.csdn.net/baidu_22254181/articl
python初学者编程指南源码_Python可以这样学 PDF 带讲义代码版 weixin_39980917 python初学者编程指南源码
给大家带来的一篇关于Python编程相关的电子书资源，介绍了关于学Python方面的内容，本书是由清华大学出版社出版，格式为PDF，资源大小22MB，董付国编写，目前豆瓣、亚马逊、当当、京东等电子书综合评分为：7.9。内容介绍读者评价已刷完，重点看前面部分基础知识，后面的挑着感兴趣的领域看。前面基础知识讲得不够系统，如果不是刷过别的python书的话单靠本书不一定能吃透。后半应用领域讲得较散，既不
Python的GUI库选择指南（深度拓展）
前文我们分析了python的GUI库，有很多，面向应用场景也不尽相同，如何在使用过程中，选择合适的GUI库呢？可以查看：python有哪些常用的GUI（图形用户界面）库及选择指南-CSDN博客初学者推荐：Tkinter或PySimpleGUI，简单易学，文档丰富。复杂应用：PyQt5或WxPython，提供完整的功能集和高级组件。移动应用：Kivy或BeeWare（Toga），支持跨平台部署到iO
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found