jieHeEternity

LightFR: Lightweight Federated Recommendation with Privacy-preserving Matrix Factorization

代码链接
ACM TOIS 2023 CCF-A

论文试图解决一个什么问题

本论文试图解决以下问题：

开发一种轻量级且隐私保护的联邦推荐系统（FRS），以降低资源成本并提高隐私保护能力。
通过学习哈希技术获得用户和项目的二进制表示，从而有效解决效率和隐私问题。
设计一种在服务器和客户端之间高效的联邦离散算法，以嵌入用户偏好到离散汉明空间，同时降低服务器和客户端的资源利用，保护用户隐私。

论文提出了一种名为LightFR的轻量级联邦推荐方法，它通过矩阵分解和隐私保护的学习哈希技术实现轻量级、高效且安全的推荐。

这篇文章的主要研究方法

这篇文章的主要研究方法是提出一种名为LightFR的轻量级联邦推荐系统，它结合了矩阵分解和学习哈希技术，具有较低的存储、通信开销和推理时间，同时增强了用户隐私保护能力。LightFR通过在服务器和客户端生成高质量的二进制代码，有效解决了联邦设置下的离散优化问题。作者还设计了一种高效的联邦离散算法，以在服务器和客户端之间进行协作优化，同时降低资源利用率和保护用户隐私。

这个领域目前存在什么问题，以及这篇文章需要解决什么问题？

这个领域目前存在的问题有：

现有的联邦推荐系统（FRS）在资源效率和隐私保护方面存在挑战。
高成本的资源消耗和通信开销限制了现有方法在大规模推荐场景中的应用。
提高用户隐私保护的能力对于现实世界的FRS至关重要，但现有方法在这方面的考虑不足。

这篇文章需要解决的问题是：

开发一种轻量级且隐私保护的FRS，同时具有低成本资源消耗和提高隐私保护能力。
通过学习哈希技术获得用户和项目的二进制表示，从而有效解决联邦设置中的离散优化问题。
设计一个高效的联邦离散算法，以在服务器和客户端之间嵌入用户偏好，同时降低资源利用和保护隐私。

目前已经有的工作在解决该领域的问题上的不足之处？

效率和隐私问题：现有的联邦推荐系统（FRS）对于效率和隐私方面的考虑并不充分。在大规模推荐场景中，资源消耗和推理时间成为主要挑战。
高度依赖实数表示：现有方法大多基于实数表示，这可能导致较高的资源消耗和隐私泄露风险。
传输原始模型参数：一些现有的FRS方法在服务器和客户端之间传输原始的模型参数，这可能导致用户隐私信息泄露。
缺乏轻量级模型：现有的FRS方法通常需要在资源受限的客户端上部署较大的模型，这可能导致效率和隐私保护方面的问题。
局限于特定场景：现有方法通常针对特定场景设计，难以广泛应用于其他场景。例如，一些方法仅适用于隐式反馈数据，而其他方法则仅适用于显式反馈数据。

模型的鲁棒性怎么样？

模型的鲁棒性表现良好。在实验中，LightFR在多个指标上优于其他联邦推荐方法，如推荐准确性、资源节省和数据隐私。此外，通过在实际数据上进行不同的实验，研究发现该方法在面对不同类型的攻击时具有较好的鲁棒性。总的来说，LightFR在保护用户隐私的同时，实现了高效的联邦推荐。

模型的实验是如何设计的？

实验设计包括以下几个方面：
数据集：使用四个不同规模的公开数据集（MovieLens-1M、Filmtrust、Douban-Movie 和 Ciao）进行实验分析，以全面反映模型性能。

评估指标：使用两个常用的评估指标，即 Hit Ratio（HR）和 Normalized Discounted Cumulative Gain（NDCG），以评估模型性能和验证其有效性。
实验方法：
对比中心化经典矩阵分解模型（如PMF、SVD++和DDL）和联邦矩阵分解基线（如FederatedMF）与提出的 LightFR 模型。
分析不同超参数（如二进制编码长度 f、权衡参数 λ 和选定客户比例 p）对性能的影响。

总结：实验结果表明，LightFR 模型在保持较高推荐精度的同时，具有较高的存储/通信效率、推理效率和隐私保护能力。因此，LightFR 是一种有效且隐私保护的轻量级联邦推荐方法。

本文最核心的创新点：

本文的最核心创新点包括以下几点：

提出了一种轻量级的联邦推荐系统（LightFR），它通过学习哈希技术获得用户和项目的二进制表示，从而有效解决资源效率和隐私保护问题。
设计了一种高效的联邦离散算法，用于在服务器和客户端之间进行训练离散参数，实现了在保护隐私的方式下提高资源效率。
从理论角度证明了LightFR在存储/通信效率、推理效率和隐私保护方面的优越性。
通过大量实验证明，LightFR在推荐准确性、资源节约和数据隐私方面明显优于现有的联邦推荐方法。

这个代码中，客户端和服务端之间是怎么进行梯度更新和传输的呢？

客户端的梯度更新
1.更新过程:

在 LightFR 类的 train_model 方法中，首先从所有客户端中随机选择一部分进行训练（基于
self.configs.client_ratio)。对于每个选中的客户端，创建一个 Client 实例，并使用 client_update 方法更新客户端的哈希表示（client.bu）。

2.client_update方法：
这个方法是在 Client 类中定义的。它对客户端的哈希表示进行迭代更新，以更好地反映用户的偏好和行为。
更新是基于用户的实际评分数据和全局项目特征（client.D）。
更新过程涉及计算预测误差、应用正则化项，并使用符号函数（np.sign）调整哈希码的每一位。

客户端与服务端的梯度传输

客户端到服务端:

在 LightFR 的 train_model 方法中，客户端完成哈希表示的更新后，这些更新信息（哈希表示）在内存中保留。
代码中没有直接显示客户端将梯度信息发送到服务端的过程。但从逻辑上讲，在一个实际的联邦学习环境中，客户端会将其更新的哈希表示或相关梯度信息发送给服务端。

2.服务端更新

服务端根据收到的客户端信息更新全局项目特征（self.D)。
服务端更新涉及遍历所有项目并对它们的特征进行批量更新，这可能是基于从多个客户端聚合的信息。

3.损失计算和反馈：
在每轮更新后，服务端计算整体损失并可能根据此调整全局更新策略。
损失信息可以反馈给客户端，以指导后续的本地更新。

总结

在提供的代码中，客户端使用其本地数据独立更新哈希表示。这些更新在内存中保留，并可以被服务端用来更新全局模型。尽管代码中没有直接显示客户端和服务端之间的通信过程，但在一个完整的联邦学习系统中，客户端的更新通常会被发送到服务端，服务端则根据这些信息进行全局模型的更新。这样的设计旨在优化模型的整体性能，同时保护每个客户端的数据隐私。

代码解读

Client.py

import numpy as np
from Metrics import Metrics
class Client:
    def __init__(self, configs):
        self.bu = None #客户端的哈希表示
        self.D = None  # 与项目相关的全局参数
        self.data_u = None #特定客户端的用户数据
        self.data_bin_u = None #特定客户端的用户数据的二进制表示
        self.data_len_u = None #特定客户端的用户数据的长度
        self.configs = configs
    def client_update(self, client, master_flag):
        '''
        client process, could be implemented in parallel
        :param master_flag:
        :param bu:
        :param D:
        :param data_u:
        :param data_bin_u:
        :param l:
        :return:
        '''
        while True:
            flag = 0
            for k in range(self.configs.code_len):
                dk = client.D[:, k]
                buk_hat = np.sum(
                    ( client.data_u - np.dot(client.D, client.bu.T)) * dk * client.data_bin_u) + 2 * self.configs.lambdaa * client.data_len_u * client.bu[k]
                buk_new = np.sign(self.K(buk_hat, client.bu[k]))
                if (client.bu[k] != buk_new):
                    flag = 1
                    client.bu[k] = buk_new
            if (flag == 0):
                break
            master_flag = 1

        return client.bu, master_flag

    def get_inter_params(self, i, k):
        di = self.D[i, :]
        grads = (self.data_u[i] - np.dot(self.bu, di.T)) * self.bu[k] * self.data_bin_u[i]
        grads_len = self.data_bin_u[i]
        return grads, grads_len

    def K(self, x, y):
        return x if x != 0 else y

    def calculate_loss(self):
        local_loss = np.sum((self.data_u - np.dot(self.D, self.bu)) ** 2 * self.data_bin_u)
        return local_loss

    def evaluate_local(self, items, val_data):
        configs = {'top_k': 10, 'num_negative_test': 49, }
        metric = Metrics(configs)
        bus = self.bu
        dis = self.D[items]
        rating_pred = np.multiply(bus, dis)
        preds = np.sum(rating_pred, axis=1)
        val_data['pred'] = preds.tolist()

        hr = metric.get_hit_ratio(val_data)
        ndcg = metric.get_ndcg(val_data)
        return hr, ndcg

Client.py定义解读
属性：

self.bu: 客户端的哈希表示，代表用户的特征。
self.D:与项目相关的全局参数，可能是由服务端维护并与客户端共享的项目特征。
self.data_u: 特定客户端的用户数据，如用户的评分或交互数据。
self.data_bin_u: 用户数据的二进制表示，用于某些类型的计算。
self.data_len_u: 用户数据的长度，可能用于计算或正则化。
self.configs:客户端的配置设置，如哈希码的长度、正则化参数等。

方法
client_update:

这是客户端更新其哈希表示的主要方法。它通过迭代过程调整用户的哈希码，以更好地反映用户数据。
使用的主要计算包括评分预测的误差计算和正则化。
更新条件基于哈希码的每一位是否发生变化。

get_inter_params:

用于计算与特定项目和用户哈希码位相关的梯度信息。
这个信息可能用于服务端的聚合过程。

K

一个辅助函数，用于处理特殊情况，比如当输入为0时返回另一个值。

calculate_loss:

计算客户端的本地损失，基于用户的实际评分和通过哈希码和项目特征预测的评分之间的差异。

evaluate_local:

在本地数据上评估模型的性能，如计算命中率（HR）和归一化累积增益（NDCG）。这对于评估客户端模型的推荐质量很重要。

总结:
这个 Client 类体现了联邦学习在推荐系统中的应用，其中每个客户端独立地更新其模型（哈希表示），并可以在本地进行模型性能评估。整个过程旨在优化用户的哈希表示，使其能够更好地捕捉用户的偏好和行为模式，同时在联邦学习的框架下保持用户数据的隐私性。

Base.py

# -*- coding: utf-8 -*-
import numpy as np
import scipy.linalg as la
from collections import defaultdict
from math import log
import pandas as pd
import torch
from DataLoader import DataLoaderCenter
from Metrics import Metrics


class Base:

    def __init__(self):
        self.user = {}
        self.item = {}
        self.id2user = {}
        self.id2item = {}
        self.u_i_r = defaultdict(dict)
        self.i_u_r = defaultdict(dict)
        self.minVal = 0.5
        self.maxVal = 4
        self.dataset_name = 'filmtrust'
        self.federated_train_data_path = 'data/' + self.dataset_name + '/' + self.dataset_name + '_train.csv'
        self.federated_valid_data_path = 'data/' + self.dataset_name + '/' + self.dataset_name + '_val.csv'
        self.federated_test_data_path = 'data/' + self.dataset_name + '/' + self.dataset_name + '_test.csv'
        pass


    def init_model(self):
        self.generate_vocabulary()
        self.rating_matrix, self.rating_matrix_bin, self.globalmean = self.get_rating_matrix()
        self.B = np.sign(np.array(np.random.randn(len(self.user), self.configs.code_len) / (self.configs.code_len ** 0.5)))
        self.D = np.sign(np.array(np.random.randn(len(self.item), self.configs.code_len) / (self.configs.code_len ** 0.5)))
        self.loss, self.last_delta_loss = 0.0, 0.0

    def trainSet(self):
        with open(self.federated_train_data_path, 'r') as f:
            for index, line in enumerate(f):
                if index != 0:  # 去除headers
                    u, i, r = line.strip('\r\n').split(',')
                    r = 2 * self.configs.code_len * (float(r)) - self.configs.code_len
                    yield (int(u), int(i), float(r))

    def containUser(self, user_id):
        if user_id in self.user:
            return True
        else:
            return False

    def containItem(self, item_id):
        if item_id in self.item:
            return True
        else:
            return False

    def valid_test_Set(self, path):
        with open(path, 'r') as f:
            for index, line in enumerate(f):
                if index != 0:  # 去除headers
                    u, i, r = line.strip('\r\n').split(',')
                    # r = 2 * self.code_len * (float(int(r) - self.minVal) / (self.maxVal - self.minVal) + 0.01) - self.code_len
                    yield (int(u), int(i), float(r))

    def read_federated_valid_dataset(self, path):
        data_val = pd.read_csv(path)
        return data_val

    def generate_vocabulary(self):
        for index, line in enumerate(self.trainSet()):
            user_id, item_id, rating = line
            self.u_i_r[user_id][item_id] = rating
            self.i_u_r[item_id][user_id] = rating
            if user_id not in self.user:
                self.user[user_id] = len(self.user)
                self.id2user[self.user[user_id]] = user_id
            if item_id not in self.item:
                self.item[item_id] = len(self.item)
                self.id2item[self.item[item_id]] = item_id

        for index, line in enumerate(self.valid_test_Set(self.federated_valid_data_path)):
            user_id, item_id, rating = line
            self.u_i_r[user_id][item_id] = rating
            self.i_u_r[item_id][user_id] = rating
            if user_id not in self.user:
                self.user[user_id] = len(self.user)
                self.id2user[self.user[user_id]] = user_id
            if item_id not in self.item:
                self.item[item_id] = len(self.item)
                self.id2item[self.item[item_id]] = item_id

        for index, line in enumerate(self.valid_test_Set(self.federated_test_data_path)):
            user_id, item_id, rating = line
            self.u_i_r[user_id][item_id] = rating
            self.i_u_r[item_id][user_id] = rating
            if user_id not in self.user:
                self.user[user_id] = len(self.user)
                self.id2user[self.user[user_id]] = user_id
            if item_id not in self.item:
                self.item[item_id] = len(self.item)
                self.id2item[self.item[item_id]] = item_id


    def get_rating_matrix(self):
        rating_matrix = np.zeros((len(self.user), len(self.item)))  # (943, 1596)
        globalmean = 0.0
        lens = 0
        for index, line in enumerate(self.trainSet()):
            lens += 1
            user_id, item_id, rating = line
            globalmean += rating
            rating_matrix[self.user[user_id]][self.item[item_id]] = int(rating)
        rating_matrix_bin = (rating_matrix > 0).astype('int')
        globalmean = globalmean / (lens)
        return rating_matrix, rating_matrix_bin, globalmean

    def K(self, x, y):
        return x if x != 0 else y

    def valid_test_model(self, path):
        pre_true_dict = defaultdict(list)
        for index, line in enumerate(self.valid_test_Set(path)):
            user_id, item_id, rating = line
            if (self.containUser(user_id) and self.containItem(item_id)):
                bu = self.B[self.user[user_id], :]
                di = self.D[self.item[item_id], :]
                pre = np.dot(bu, di)
            elif (self.containUser(user_id) and not self.containItem(item_id)):
                pre = sum(self.u_i_r[user_id].values()) / float(len(self.u_i_r[user_id]))
            elif (not self.containUser(user_id) and self.containItem(item_id)):
                pre = sum(self.i_u_r[item_id].values()) / float(len(self.i_u_r[item_id]))
            else:
                pre = self.globalmean
            pre_true_dict[user_id].append([pre, rating])
        metrics = Metrics()
        ndcg_10 = metrics.calDCG_k(pre_true_dict, 10)
        return ndcg_10

Base.py定义解读
这段代码定义了一个名为 Base 的类，它是一个推荐系统的基础架构。这个类包括初始化、构建词汇表、生成评分矩阵以及评估模型的方法。以下是对代码中各个部分的详细解读：
类初始化 (__init__)
初始化中定义了多个字典和路径变量，用于存储用户和项目的信息以及训练、验证和测试数据的路径。
生成词汇表 (generate_vocabulary)
从训练集、验证集和测试集中提取用户-项目评分信息，建立两个双向映射：用户ID与内部索引的映射 (self.user 和 self.id2user)，以及项目ID与内部索引的映射 (self.item 和 self.id2item)。
构建用户到项目 (self.u_i_r) 和项目到用户 (self.i_u_r) 的评分字典。

生成评分矩阵 (get_rating_matrix)
创建一个用户-项目评分矩阵 (rating_matrix)，其中每个元素代表用户对项目的评分。
生成一个二值评分矩阵 (rating_matrix_bin)，表示用户是否对项目进行了评分。
计算全局平均评分 (globalmean)。

模型初始化 (init_model)
调用 generate_vocabulary 方法并生成评分矩阵。
初始化用户和项目的隐特征矩阵 (self.B 和 self.D)，这些矩阵用随机值填充并通过符号函数处理。

训练集和验证/测试集的处理 (trainSet, valid_test_Set)
这些方法从指定路径读取训练集和验证/测试集数据。
用户和项目存在性检查 (containUser, containItem)
检查特定的用户ID或项目ID是否存在于已定义的用户或项目字典中。
评估模型 (valid_test_model)
使用验证或测试集数据评估模型的性能。
计算每个用户的预测评分和实际评分，然后使用这些数据计算归一化累积增益（NDCG）。
总结
Base 类提供了一个推荐系统基本框架，包括数据处理、模型初始化和评估。这个类能够处理用户和项目的交互数据，生成评分矩阵，并对推荐模型的性能进行评估。通过这种方式，它为构建更复杂的推荐系统模型提供了基础。

Configs.py

class Configs:
    def __init__(self):
        self.code_len = 64
        self.threshold = 1e-4
        self.global_rounds = 50
        self.client_ratio = 0.6
        self.lambdaa = 0.6

Configs类的定义
Configs类的属性
self.code_len:
表示哈希码的长度。在这个上下文中，它可能指的是用户或项目的哈希表示中使用的二进制位的数量。
在这个例子中，哈希码长度设置为 64，这意味着每个用户或项目将被表示为一个包含 64 位的向量。
self.threshold:
这是一个阈值参数，可能用于确定训练过程中的收敛标准或用于其他类型的判断。
在这里，阈值设置为 1e-4（即 0.0001），这可能表示当模型在连续迭代中的改进低于这个值时，训练可以停止。
self.global_rounds:
指定全局训练轮数。在联邦学习的背景下，这可能指的是所有客户端参与模型更新的总轮数。
这里设置为 50，意味着整个训练过程将进行 50 轮迭代。
self.client_ratio:
这个参数可能用于确定在每轮训练中参与的客户端比例。
0.6 表示每轮有 60% 的客户端将被随机选中参与模型的更新。
self.lambdaa:
这是正则化参数，通常用于控制模型复杂性，以避免过拟合。
设置为 0.6，这个参数在计算损失函数或进行参数更新时可能被用作正则化项的权重。

总结:
Configs 类作为一个配置存储器，提供了一种便捷的方式来管理和调整模型训练过程中使用的多个参数。通过调整这些参数，可以控制模型的训练行为，如迭代次数、客户端参与度以及正则化程度等，这对于优化模型的性能和效率至关重要。

DataLoader类:

import torch
import numpy as np
from torch.utils.data import Dataset, DataLoader as TDataLoader


class DataLoader():
    def __init__(self, configs, client_data):
        self.configs = configs
        self.train_data, self.val_data, self.test_data = client_data['train'], client_data['val'], client_data[
            'test']

    def get_train_dataloader(self):
        users, items, labels = torch.LongTensor(np.array(self.train_data['user_id'])), torch.LongTensor(
            np.array(self.train_data['item_id'])), torch.FloatTensor(np.array(self.train_data['ratings']))

        dataset = UserItemRatingDataset(user_tensor=users, item_tensor=items, target_tensor=labels)
        return TDataLoader(dataset, batch_size=self.configs['local_batch_size'], shuffle=True)

    def get_val_dataloader(self):

        if self.val_data.empty:
            users, items, labels = torch.LongTensor(self.val_data['user_id']), torch.LongTensor(
                self.val_data['item_id']), torch.FloatTensor(self.val_data['ratings'])
        else:
            users, items, labels = torch.LongTensor(np.array(self.val_data['user_id'])), torch.LongTensor(
                np.array(self.val_data['item_id'])), torch.FloatTensor(np.array(self.val_data['ratings']))

        dataset = UserItemRatingDataset(user_tensor=users, item_tensor=items, target_tensor=labels)

        client_data_len = len(items)  # 100 for implicit feedback, actual length for explicit feedback during validation in each local client

        return TDataLoader(dataset, batch_size=client_data_len, shuffle=False)

    def get_test_dataloader(self):

        if self.test_data.empty:
            users, items, labels = torch.LongTensor(self.test_data['user_id']), torch.LongTensor(
                self.test_data['item_id']), torch.FloatTensor(self.test_data['ratings'])
        else:
            users, items, labels = torch.LongTensor(np.array(self.test_data['user_id'])), torch.LongTensor(
                np.array(self.test_data['item_id'])), torch.FloatTensor(np.array(self.test_data['ratings']))

        dataset = UserItemRatingDataset(user_tensor=users, item_tensor=items, target_tensor=labels)

        client_data_len = len(items)

        return TDataLoader(dataset, batch_size=client_data_len, shuffle=False)


class DataLoaderCenter():
    def __init__(self, configs, val_data):
        self.configs = configs
        self.val_data= val_data

    def get_train_dataloader(self):
        users, items, labels = torch.LongTensor(np.array(self.train_data['user_id'], dtype='int32')), torch.LongTensor(
            np.array(self.train_data['item_id'], dtype='int32')), torch.FloatTensor(
            np.array(self.train_data['ratings'], dtype='float32'))

        dataset = UserItemRatingDataset(user_tensor=users, item_tensor=items, target_tensor=labels)

        return TDataLoader(dataset, batch_size=self.configs['local_batch_size'], shuffle=True)

    def get_val_dataloader(self):

        if self.val_data.empty:
            users, items, labels = torch.LongTensor(self.val_data['user_id']), torch.LongTensor(
                self.val_data['item_id']), torch.FloatTensor(self.val_data['ratings'])
        else:
            users, items, labels = torch.LongTensor(np.array(self.val_data['user_id'], dtype='int32')), torch.LongTensor(
                np.array(self.val_data['item_id'], dtype='int32')), torch.FloatTensor(np.array(self.val_data['ratings'], dtype='float32'))

        dataset = UserItemRatingDataset(user_tensor=users, item_tensor=items, target_tensor=labels)

        data_len = self.configs['num_negative_test'] + 1

        return TDataLoader(dataset, batch_size=data_len, shuffle=False)

    def get_test_dataloader(self):

        if self.test_data.empty:
            users, items, labels = torch.LongTensor(self.test_data['user_id']), torch.LongTensor(
                self.test_data['item_id']), torch.FloatTensor(self.test_data['ratings'])
        else:
            users, items, labels = torch.LongTensor(np.array(self.test_data['user_id'], dtype='int32')), torch.LongTensor(
                np.array(self.test_data['item_id'], dtype='int32')), torch.FloatTensor(np.array(self.test_data['ratings'], dtype='float32'))

        dataset = UserItemRatingDataset(user_tensor=users, item_tensor=items, target_tensor=labels)

        data_len = self.configs['num_negative_test'] + 1

        return TDataLoader(dataset, batch_size=data_len, shuffle=False)


class UserItemRatingDataset(Dataset):
    """Wrapper, convert  Tensor into Pytorch Dataset"""

    def __init__(self, user_tensor, item_tensor, target_tensor):
        """
        args:

            target_tensor: torch.Tensor, the corresponding rating for  pair
        """
        self.user_tensor = user_tensor
        self.item_tensor = item_tensor
        self.target_tensor = target_tensor

    def __getitem__(self, index):
        return self.user_tensor[index], self.item_tensor[index], self.target_tensor[index]

    def __len__(self):
        return self.user_tensor.size(0)


if __name__ == '__main__':
    configs = {
        'dataset': 'ml-1m',
        'data_type': 'explicit',
        'num_negative_train': 4,
        'num_negative_test': 49,
        'local_batch_size': 100,
        'cold_nums': 10
    }
    dr = DataReader(configs)
    # client_data = dr.get_data_by_client(0)
    data = dr.get_train_val_test_data()
    dl_center = DataLoaderCenter(configs, data)
    td = dl_center.get_train_dataloader()
    vd = dl_center.get_val_dataloader()
    for index, data in enumerate(vd):
        if index == 0:
            print(data)

这段代码定义了一个数据加载的类 DataLoader 和 DataLoaderCenter，以及一个PyTorch Dataset 子类 UserItemRatingDataset。这些类用于将推荐系统中的用户、项目和评分数据转换为适用于机器学习模型训练和评估的格式。以下是对代码中各个部分的详细解读：
DataLoader 和 DataLoaderCenter 类
这两个类的作用是从提供的数据中创建可用于训练、验证和测试的数据加载器 (DataLoader)。

1.初始化

接收配置参数 (configs) 和客户端数据 (client_data)。
分别处理训练集、验证集和测试集的数据。

2.获取数据加载器：
get_train_dataloader, get_val_dataloader, get_test_dataloader 方法分别用于创建训练集、验证集和测试集的DataLoader。
这些方法首先将数据转换为适用于PyTorch的张量格式，然后创建一个 UserItemRatingDataset 实例，最后使用 TDataLoader 返回一个数据加载器。

3.UserItemRatingDataset类

main.py

# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
import torch
from Base import Base
from Client import Client
from Configs import Configs
from DataLoader import DataLoaderCenter



class LightFR(Base):

    def __init__(self):
        super(LightFR, self).__init__()
        self.configs = Configs()
        pass

    def get_random_client_list(self):
        size = int(len(self.user) * self.configs.client_ratio)
        random_client_list = np.random.choice(list(self.user.values()), size)
        return random_client_list

    def get_client_data(self, client_id):
        client = Client(self.configs)
        client.bu = self.B[client_id, :]
        client.D = self.D
        client.data_u = self.rating_matrix[client_id, :]
        client.data_bin_u = self.rating_matrix_bin[client_id, :]
        client.data_len_u = len(self.u_i_r[self.id2user[client_id]])
        return client


    def train_model(self):
        current_round = 0
        last_loss = 0.0
        while (current_round < self.configs.global_rounds-40):
            master_flag = 0
            current_round += 1
            sampled_clients = self.get_random_client_list()
            #runing on clients, could be implemented in parallel
            for u in sampled_clients:
                client = self.get_client_data(u)
                bu, master_flag = client.client_update(client, master_flag)
            # running on the server
            for i in range(len(self.item)):
                while True:
                    flag = 0
                    di = self.D[i, :]
                    for k in range(self.configs.code_len):
                        # The following can be uploaded by the client side, and we upload the intermediate gradients, i.e., grads_a and grads_b, instead of the raw rating or the user codes. We can use the client-style computation as descriped in the paper, such as B[u,k], rating_matrix[u,i] and rating_matrix_bin[u,i], but it runs slowly.
                        # For efficient training, we use the batch-style computation to calculate the gradients.
                        # The intermediate gradients can be divided into multiple clients, that is loss_total=(self.rating_matrix[:, i] - np.dot(self.B, di.T)) can be reformulated into loss_user=(self.rating_matrix[u, i] - np.dot(self.B[u,:], di.T)), so the loss_total can be regarded as the aggregation from the multiple local loss_user.
                        bk = self.B[sampled_clients, k]
                        grads_a = (self.rating_matrix[sampled_clients, i] - np.dot(self.B[sampled_clients], di.T)) * bk * self.rating_matrix_bin[sampled_clients, i]
                        grads_b = len(self.rating_matrix_bin[sampled_clients, i])
                        # the following performs the simulated aggregation process
                        dik_hat = np.sum(grads_a) + grads_b * di[k]
                        dik_new = np.sign(self.K(dik_hat, di[k]))
                        if (di[k] != dik_new):
                            flag = 1
                            di[k] = dik_new
                    if (flag == 0):
                        break
                    self.D[i, :] = di
                    master_flag = 1

            # calculating the loss for all the clients and upload its loss into the server and then aggregate them
            self.loss = 0.0
            for u in range(len(self.user)):
                client = self.get_client_data(u)
                local_loss = client.calculate_loss()
                self.loss += local_loss

            federated_valid_hr_10, federated_valid_ndcg_10 = self.federated_valid_test_model(
                self.federated_valid_data_path)
            delta_loss = self.loss - last_loss
            print('current_round %d: current_loss = %.5f, delta_loss = %.5f valid_HR@10=%.5f valid_NDCG@10=%.5f' %
                  (current_round, self.loss, delta_loss, federated_valid_hr_10, federated_valid_ndcg_10))
            if (master_flag == 0):
                break
            if (abs(delta_loss) < self.configs.threshold or abs(delta_loss) == abs(self.last_delta_loss)):
                break
            self.last_delta_loss = delta_loss
            last_loss = self.loss
        federated_valid_hr_10, federated_valid_ndcg_10 = self.federated_valid_test_model(self.federated_test_data_path)
        print('test HR@10 = %.5f, NGCD@10 = %.5f' % (federated_valid_hr_10, federated_valid_ndcg_10))


    def federated_valid_test_model(self, path):
        val_data = self.read_federated_valid_dataset(path)
        configs = {'top_k': 10, 'num_negative_test': 49, }
        dl = DataLoaderCenter(configs, val_data)
        val_dataloader = dl.get_val_dataloader()
        hr_10, ndcg_10 = 0.0, 0.0
        len = 0

        # one batch represents a client since there is the same user in a batch
        for batch_id, batch in enumerate(val_dataloader):
            len += 1
            assert isinstance(batch[0], torch.LongTensor)
            users, items, ratings = batch[0], batch[1], batch[2]
            val_data = pd.DataFrame(zip(users.tolist(), items.tolist(), ratings.tolist()),
                                    columns=['user_id', 'item_id', 'ratings'])
            items = [self.item[item] for item in items.tolist()]
            user_id = self.user[int(users[0])]
            client = self.get_client_data(user_id)
            hr, ndcg = client.evaluate_local(items, val_data)

            hr_10 += hr[10]
            ndcg_10 += ndcg[10]

        hr_10 /= len
        ndcg_10 /= len
        return hr_10, ndcg_10
    def main(self):
        self.init_model()
        self.train_model()
if __name__ == '__main__':
    model = LightFR()
    model.main()

main.py类的定义:

这段代码定义了LightFR类，它继承自Base类并实现了一个联邦学习框架。LightFR类中包含了模型的初始化、训练过程和验证/测试方法。以下是对主要方法的详细解读：

初始化 (__init__)
- 调用基类 Base 的构造函数。
- 初始化配置参数 (self.configs)。
获取随机客户端列表 (get_random_client_list)
- 基于配置中的客户端比例 (self.configs.client_ratio) 随机选择一部分用户作为参与训练的客户端。
获取客户端数据 (get_client_data)
- 创建一个 Client 类实例，用于处理特定客户端的数据。
- 初始化客户端相关的属性，如哈希表示、用户和项目数据。
训练模型
这是模型训练的主要过程。
- 客户端更新：遍历随机选择的客户端列表，并调用 client_update 方法更新客户端的哈希表示。
- 服务端更新：遍历所有项目，并更新全局项目特征 (self.D)。
- 损失计算：计算所有客户端的累计损失，并在每轮更新后检查是否满足终止条件。

import pandas as pd
import torch
import numpy as np
import math
from sklearn import metrics as sk_metrics

# from reader.data_reader import DataReader
# from loader.data_loader import DataLoader


class Metrics(object):
    def __init__(self, configs):
        super(Metrics, self).__init__()
        self.configs = configs

    def get_hit_ratio(self, test_data: pd.DataFrame):  # for implicit feedback
        top_k = self.configs['top_k']
        hrs = {}
        if test_data.empty:
            for current_top_k in range(1, top_k + 1):
                hrs[current_top_k] = 0.0
            return hrs

        assert 'pred' in test_data.columns, "没有预测值"
        test_data['rank'] = test_data['pred'].rank(method='first', ascending=False)
        test_data_rank = int(test_data.head(1)['rank'])

        for current_top_k in range(1, top_k + 1):
            if test_data_rank <= current_top_k:
                hrs[current_top_k] = 1.0
            else:
                hrs[current_top_k] = 0.0
        return hrs

    def get_ndcg(self, test_data: pd.DataFrame):  # for implicit feedback
        top_k = self.configs['top_k']
        ndcgs = {}
        if test_data.empty:
            for current_top_k in range(1, top_k + 1):
                ndcgs[current_top_k] = 0.0
            return ndcgs

        assert 'pred' in test_data.columns, "没有预测值"
        test_data['rank'] = test_data['pred'].rank(method='first', ascending=False)
        test_data_rank = int(test_data.head(1)['rank'])
        for current_top_k in range(1, top_k + 1):
            if test_data_rank <= current_top_k:
                ndcgs[current_top_k] = math.log(2) * 1.0 / math.log(1 + test_data_rank)
            else:
                ndcgs[current_top_k] = 0.0
        return ndcgs

    def get_hit_ratio_explicit_client(self, test_data: pd.DataFrame):  # for explicit feedback
        top_k = self.configs['top_k']
        hrs = {}
        if test_data.empty:
            for current_top_k in range(1, top_k + 1):
                hrs[current_top_k] = 0.0
            return hrs

        assert 'pred' in test_data.columns, "没有预测值"

        data = test_data[['pred', 'ratings']].to_numpy()

        real_value_list = sorted(data, key=lambda x: x[1], reverse=True)
        predict_value_list = sorted(data, key=lambda x: x[0], reverse=True)

        test_data['rank'] = test_data['pred'].rank(method='first', ascending=False)
        test_data_rank = int(test_data.head(1)['rank'])

        for current_top_k in range(1, top_k + 1):
            if test_data_rank <= current_top_k:
                hrs[current_top_k] = 1.0
            else:
                hrs[current_top_k] = 0.0
        return hrs

    def get_ndcg_explicit_client(self, test_data: pd.DataFrame):  # for explicit feedback
        top_k = self.configs['top_k']
        ndcgs = {}
        if test_data.empty:
            for current_top_k in range(1, top_k + 1):
                ndcgs[current_top_k] = 0.0
            return ndcgs
        assert 'pred' in test_data.columns, "没有预测值"

        data = test_data[['pred', 'ratings']].to_numpy()

        real_value_list = sorted(data, key=lambda x: x[1], reverse=True)
        predict_value_list = sorted(data, key=lambda x: x[0], reverse=True)

        for current_top_k in range(1, top_k + 1):
            if len(real_value_list) >= current_top_k:
                idcg, dcg = 0.0, 0.0
                for i in range(current_top_k):
                    idcg += (pow(2, real_value_list[i][1]) - 1) / (math.log(i + 2, 2))
                    dcg += (pow(2, predict_value_list[i][1]) - 1) / (math.log(i + 2, 2))
                if idcg != 0:
                    ndcgs[current_top_k] = float(dcg / idcg)
                else:
                    ndcgs[current_top_k] = 0.0
            else:
                ndcgs[current_top_k] = 0.0
        return ndcgs

    def get_auc(self, test_data: pd.DataFrame):
        pass

    def get_mrr(self, test_data: pd.DataFrame):
        pass

    def get_rmse(self, test_data: pd.DataFrame):
        assert 'pred' in test_data.columns, "没有预测值"
        y = test_data['ratings']
        y_hat = test_data['pred']
        value = sk_metrics.mean_squared_error(y, y_hat) ** 0.5
        return value

    def get_mae(self, test_data: pd.DataFrame):
        assert 'pred' in test_data.columns, "没有预测值"
        y = test_data['ratings']
        y_hat = test_data['pred']
        value = sk_metrics.mean_absolute_error(y, y_hat)
        return value

    def get_rmse_client(self, test_data: pd.DataFrame):
        assert 'pred' in test_data.columns, "没有预测值"
        y = test_data['ratings']
        y_hat = test_data['pred']
        l = len(y)
        value = abs(y - y_hat) ** 2
        value = value.sum()
        result = math.sqrt(value / l)
        return result

    def get_mae_client(self, test_data: pd.DataFrame):
        assert 'pred' in test_data.columns, "没有预测值"
        y = test_data['ratings']
        y_hat = test_data['pred']
        l = len(y)
        value = abs(y - y_hat)
        value = value.sum()
        result = value / l
        return result

    def calDCG_k(self, dictdata, k):
        nDCG = []
        for key in dictdata.keys():
            listdata = dictdata[key]
            real_value_list = sorted(listdata, key=lambda x: x[1], reverse=True)
            idcg = 0.0
            predict_value_list = sorted(listdata, key=lambda x: x[0], reverse=True)
            dcg = 0.0
            if len(listdata) >= k:
                for i in range(k):
                    idcg += (pow(2, real_value_list[i][1]) - 1) / (log(i + 2, 2))
                    dcg += (pow(2, predict_value_list[i][1]) - 1) / (log(i + 2, 2))
                if (idcg != 0):
                    nDCG.append(float(dcg / idcg))
            else:
                continue
        ave_ndcg = np.mean(nDCG)
        # print(nDCG)
        return ave_ndcg


if __name__ == '__main__':
    configs = {
        'dataset': 'filmtrust',
        'data_type': 'implicit',
        'num_negative_train': 4,
        'num_negative_test': 99,
        'local_batch_size': 100,
        'top_k': 10
    }
    dr = DataReader(configs)
    client_data = dr.get_data_by_client(0)
    dl = DataLoader(configs, client_data)
    test_data = dl.get_test_dataloader()

    metric = Metrics(configs)

    for batch_id, batch in enumerate(test_data):
        assert isinstance(batch[0], torch.LongTensor)
        users, items, labels = batch[0], batch[1], batch[2]
        if batch_id == 0:
            pred = np.random.uniform(0, 1, 100)
            test_data = pd.DataFrame(
                {'user_id': users,
                 'item_id': items,
                 'label': labels,
                 'pred': pred}
            )
            print(test_data)
            value1 = metric.get_hit_ratio(test_data)
            print(f'value1:{value1}')
            value2 = metric.get_ndcg(test_data)
            print(f'value2:{value2}')
            value3 = metric.get_rmse(test_data)
            print(f'value3:{value3}')
            value4 = metric.get_mae(test_data)
            print(f'value4:{value4}')

这段代码中定义了一个名为‘Metrics‘的类，用于计算推荐系统中的多种性能指标，包括命中率 (Hit Ratio)、归一化累积增益 (NDCG)、均方根误差 (RMSE) 和平均绝对误差 (MAE)。以下是对这个类中主要方法的解读：
Metrics类
初始化 (init)：接收配置参数 configs，这些配置参数包含了评估指标时所需的信息，如 top_k。
性能评估方法

你可能感兴趣的:(深度学习,联邦学习,算法,人工智能,联邦学习,推荐系统)

实时光线追踪技术：Ray Tracing_2024-07-21_02-55-16.Tex chenjj4003 游戏开发 python 算法人工智能矩阵线性代数骨骼绑定开发语言
实时光线追踪技术：RayTracing实时光线追踪技术教程基础知识光线追踪原理光线追踪是一种渲染技术，它通过模拟光线在场景中的传播和反射来生成图像。在实时光线追踪中，这一过程被优化以在有限的时间内完成，通常用于游戏和实时动画。其核心原理是逆向追踪，即从观察者（摄像机）发出光线，而不是从光源发出，这样可以减少计算量。示例：光线追踪的基本算法#Python示例代码，展示如何计算光线与场景中物体的交点c
DeepSeek：智能搜索与分析的新纪元 XRC2231 学习
在人工智能浪潮席卷全球的今天，DeepSeek如同一颗璀璨的新星，以其独特的魅力和强大的功能，在AI领域脱颖而出。DeepSeek，这一基于深度学习和数据挖掘技术的智能搜索与分析系统，不仅重新定义了搜索引擎的边界，更以其卓越的性能和广泛的应用场景，为全球用户带来了前所未有的智能体验。本文将从DeepSeek的定义、特点、应用场景、优势等方面进行全面而深入的介绍，带您领略这一新兴技术的独特魅力。一、
图像质量评价学习笔记02：IQA模型性能评价指标（PLCC、SROCC、KROCC、RMSE）可靠的豆包蟹同志图像质量评估IQA 图像处理计算机视觉人工智能算法
性能好的图像质量评价（IQA）算法，其质量评测分数会与主观质量分数高度一致，IQA有许多评价指标，为了衡量方法测试结果与主观评价之间的一致性，视频质量专家组VQEG（VideoQualityExpertsGroup，目前国际上对视频质量进行标准化及性能测试的权威组织）提出了四个可以验证客观评价结果和主观评价结果之间的紧密程度的四个指标：PLCC、SROCC、KROCC和RMSE，也是目前最常用的I
哈尔滨工业大学DeepSeek公开课人工智能：大模型原理技术与应用-从GPT到DeepSeek｜附视频下载方法你觉得205 人工智能机器学习大数据 ai 知识图谱 python 运维
导读INTRODUCTION今天继续哈尔滨工业大学车万翔教授带来了一场主题为“DeepSeek技术前沿与应用”的报告。本报告深入探讨了大语言模型在自然语言处理（NLP）领域的核心地位及其发展历程，从基础概念出发，延伸至语言模型在机器翻译、拼音输入法、语音识别等任务中的关键作用。强调了语言模型不仅辅助其他NLP任务，本身也蕴含大量知识，如地理信息、语义理解和推理能力。随着技术的发展，尤其是trans
X.509数字证书的签名和指纹汽车通信技术【付费专栏】车载以太网协议数字证书
X.509是一种非常普遍的数字证书标准，由国际电信联盟（ITU）制定。它定义了证书的格式和一种验证证书有效性的方法。X.509证书的结构遵循特定的语法和编码规则，通常使用ASN.1(AbstractSyntaxNotationOne)进行描述和编码。一个典型的X.509证书通常包含：版本、序列号、签名算法、颁发者、有效期、使用者、公钥、签名、指纹等。其中，版本号表示证书是哪个版本的，不同版本的数字
访问者模式【行为模式C++】 GoWjw 设计模式访问者模式
1.概述访问者模式是一种行为设计模式，它能将算法与其所作用的对象隔离开来。访问者模式主要解决的是数据与算法的耦合问题，尤其是在数据结构比较稳定，而算法多变的情况下。为了不污染数据本身，访问者会将多种算法独立归档，并在访问数据时根据数据类型自动切换到对应的算法，实现数据的自动响应机制，并确保算法的自由扩展。访问者模式在实际开发中使用的非常少，因为它比较难以实现并且应用该模式肯能会导致代码的可读性变差
策略模式烟沙九洲设计模式策略模式 java
策略（Strategy）模式属于行为型模式的一种。策略模式的核心思想是定义一系列算法，将每个算法封装起来，并使它们可以互换。策略模式让算法独立于使用它的客户而变化，从而实现了算法族的独立扩展和替换。策略模式指在一个方法中，某些关键步骤的算法依赖调用方传入的策略，传入不同的策略，即可获得不同的结果，大大增强了系统的灵活性。策略模式的核心思想是在一个计算方法中把容易变化的算法抽出来作为“策略”参数传进
模板方法模式烟沙九洲设计模式模板方法模式 java
模板方法（TemplateMethod）模式属于行为型模式的一种。模板方法模式定义了一个操作中的算法骨架，并将一些步骤延迟到子类中实现。模板方法模式的核心思想是：父类定义骨架，子类实现某些细节。模板方法模式允许子类在不改变算法结构的情况下，重新定义算法中的某些特定步骤。Java标准库有很多模板方法模式的应用。比如集合类中的AbstractList、AbstractQueuedSynchronize
【论文复现】——基于SIFT特征点结合ICP的点云配准方法点云侠点云配准专题开发语言计算机视觉算法 3d c++
目录一、论文概述二、代码实现三、结果展示1、初始位置2、配准结果四、实验心得一、论文概述在点云配准过程中，针对迭代最近点(ICP)算法对点云初始位置依赖性强且迭代速度慢的问题，提出一种基于尺度不变特征变换(SIFT)特征点结合ICP的点云配准方法。首先利用SIFT算法提取待配准点云和目标点云的特征点;接着计算出特征点的快速点特征直方图(FPFH)特征;然后依据该特征使用采样一致性初始配准(SA
数字签名与数字证书 TABE_ 计算机网络数字签名数字证书
这里写目录标题数字签名数字证书数字证书的原理数字证书的特点如何验证证书机构的公钥不是伪造的数字签名数字签名是非对称密钥加密技术与数字摘要技术的应用，数字签名就是用加密算法加密报文文本的摘要（摘要通过hash函数得到）而生成的内容。发送报文时，发送方用一个哈希函数从报文文本中生成报文摘要，然后用发送方的私钥对这个摘要进行加密生成数字签名，之后将数字签名和报文一起发送给接收方，即数字证书。接收方首先用
零基础入门机器学习：用Scikit-learn实现鸢尾花分类藍海琴泉机器学习 scikit-learn 分类
适合人群：机器学习新手|数据分析爱好者|需快速展示案例的学生一、引言：为什么要学这个案例？目的：明确机器学习解决什么问题，建立学习信心。机器学习定义：让计算机从数据中自动学习规律（如分类鸢尾花品种）。为什么选鸢尾花数据集：数据量小、特征明确，适合教学演示。Scikit-learn优势：提供现成算法和工具，无需从头写数学公式。二、环境准备：5分钟快速上手目的：搭建可运行的代码环境，避免卡在工具安装环
访问者模式烟沙九洲设计模式访问者模式 java
访问者（Visitor）模式属于行为型模式的一种。访问者模式主要用于分离算法和对象结构，从而在不修改原有对象的情况下扩展新的操作。它适用于数据结构相对稳定，而操作（行为）容易变化的场景。访问者模式允许在不修改现有类的情况下，为类层次结构中的对象定义新的操作。访问者模式通过将操作封装到一个独立的类（即访问者）中，使得对象结构与操作解耦。访问者模式使用了一种名为双分派（在运行时根据两个对象的类型动态选
机器学习--DBSCAN聚类算法详解 2201_75491841 机器学习算法聚类人工智能
目录引言1.什么是DBSCAN聚类？2.DBSCAN聚类算法的原理3.DBSCAN算法的核心概念3.1邻域（Neighborhood）3.2核心点（CorePoint）3.3直接密度可达（DirectlyDensity-Reachable）3.4密度可达（Density-Reachable）3.5密度相连（Density-Connected）4.DBSCAN算法的步骤5.DBSCAN算法的优缺点5
软考中级软件设计师考点知识点笔记总结 day06 莫问alicia 软考中级软件设计师笔记数据结构算法
文章目录6、树和二叉树6.1、树的基本概念6.2、二叉树的基本概念6.3、二叉树的遍历6.4、查找二叉树（二叉排序树）BST6.5、构造霍夫曼树+6.6、线索二叉树6.7、平衡二叉树7、图7.1、存储结构-邻接矩阵7.2、存储结构-邻接表7.3、图的遍历7.4、拓扑排序7.5、最小生成树普利姆算法7.6、克鲁斯卡尔算法6、树和二叉树6.1、树的基本概念结点的度：一个结点的度是指该结点拥有的子树数量
机器学习实战第一章机器学习基础 LuoY、 Machine Learning 机器学习算法人工智能
第一章机器学习1.1何谓机器学习1.2关键术语1.3机器学习的主要任务1.4如何选择合适的算法1.5开发机器学习应用程序的步骤1.6Python语言的优势1.1何谓机器学习 1、简单地说，机器学习就是把无序的数据转换成有用的信息； 2、机器学习能让我们自数据集中受启发，我们会利用计算机来彰显数据背后的真实含义； 3、机器学习横跨计算机科学、工程技术和统计学等多个学科，需要多学科的
HTML实现酷炫3D相册算法与编程之美编程之美 css html js css3 javascript
欢迎点击「算法与编程之美」↑关注我们！本文首发于微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。欢迎加入团队圈子！与作者面对面！直接点击！目录1、创建文件目录2、调背景色3、制作3D相册4、将图片散开，围成一圈。5、绘制透明底盘6、最终效果1、创建文件目录在Hbuilder在新建一个目录，创建css和js文件。图12、调背景色在style块里面给整个页面渲染成黑色调。*{padd
蓝桥杯备赛计划 laitywgx 蓝桥杯职场和发展
1-2小时的蓝桥杯PythonB组冲刺日程表（持续1个月，聚焦高频考点）：第一周：核心算法突破Day1（周一）学习重点：动态规划（01背包问题）学习资源：AcWing《蓝桥杯辅导课》第8讲（背包问题模板）代码模板速记：#一维01背包模板n,V=map(int,input().split())dp=[0]*(V+1)for_inrange(n):w,v=map(int,input().split()
机器学习怎么做特征工程全栈你个大西瓜人工智能机器学习人工智能特征工程数据预处理特征变换特征降维特征构造
一、特征工程通俗解释特征工程就像厨师做菜前的食材处理：原始数据是“生肉和蔬菜”，特征工程是“切块、腌制、调料搭配”，目的是让机器学习模型（食客）更容易消化吸收，做出更好预测（品尝美味）。二、为什么要做特征工程？数据质量差：原始数据常有缺失、噪声、不一致问题（如年龄列混入“未知”）。模型限制：算法无法直接理解原始数据（如文本、日期需要数值化）。提升效果：好特征能显著提升模型性能（准确率提升10%~5
【机器学习】机器学习四大分类藓类少女机器学习机器学习分类人工智能
机器学习的方法主要可以分为四大类，根据学习方式和数据标注情况进行分类：1.监督学习（SupervisedLearning）特点：有标注数据（即训练数据有明确的输入(X)和输出(Y)）。学习目标是找到一个映射(f(X)\approxY)。适用于分类和回归问题。主要算法：分类（Classification）：逻辑回归（LogisticRegression）支持向量机（SVM）朴素贝叶斯（NaïveBa
大模型学习终极指南：从新手到专家的必经之路，全网最详尽解析，你敢挑战吗？大模型入门教程学习人工智能 AI 大模型大模型学习大模型教程 AI大模型
随着人工智能技术的飞速发展，大模型（Large-ScaleModels）已经成为推动自然语言处理（NLP）、计算机视觉（CV）等领域进步的关键因素。本文将为您详细介绍从零开始学习大模型直至成为专家的全过程，包括所需掌握的知识点、学习资源以及实践建议等。无论您是初学者还是有一定基础的专业人士，都能从中获得有价值的指导。一、基础知识准备在开始学习大模型之前，需要先掌握一些基础知识，这些知识将为后续的学
编程内容简述！恶霸不委屈开发语言青少年编程汇编 java python
编程是指通过计算机语言来开发软件、程序和应用的过程，通常通过编写一系列的指令，来让计算机完成特定的任务。编程可以涉及多个领域和技术，以下是一些主要的编程内容：1.编程语言编程语言是程序员与计算机进行沟通的桥梁，不同的编程语言适用于不同的任务。常见的编程语言有：Python：简单易学，适用于数据分析、人工智能、网页开发等。JavaScript：网页开发中不可或缺的语言，用于动态网页和前端开发。Jav
高频交易：当速度与智慧在金融市场中“飙车”（策略＋算法）西蒙斯.果 python numpy pandas
高频交易：当速度与智慧在金融市场中“飙车”高频交易（High-FrequencyTrading,HFT）就像金融市场的“闪电侠”，利用强大的计算机和复杂的算法，在毫秒甚至微秒内完成交易。它的目标是抓住市场中的微小机会，赚取“快钱”。以下是对高频交易策略和算法的详细介绍，带点幽默感，让你在了解金融科技的同时也能会心一笑。---一、高频交易策略：金融市场的“快闪族”1\.做市策略：买卖价差的“中间商”
大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
国产模型能否挑战 GPT-4？一文拆解 DeepSeek-V3 架构与实战应用 AI筑梦师人工智能学习框架架构深度学习 python agi 人工智能 tensorflow
✳️一、引言✅1.1DeepSeek-V3发布背景与定位随着大模型技术的快速演进，从GPT-3到GPT-4，全球在通用人工智能方向取得了长足进展。但与此同时，开源社区始终缺乏一个真正兼顾性能、效率、中文能力和实用性的高质量大模型。DeepSeek-V3的推出正是在这个背景下的一次关键突破。DeepSeek-V3是由中国团队DeepSeek开发的第三代大语言模型，它具备以下几个核心特性：开源可商用：
Github上神仙级大模型项目：大语言模型(LLM)入门学习路线图，三个月让你从大模型基础到精通！ AI大模型-大飞 github 语言模型学习人工智能 AI大模型程序员 AI
Github项目上有一个大语言模型学习路线笔记，它全面涵盖了大语言模型的所需的基础知识学习，LLM前沿算法和架构，以及如何将大语言模型进行工程化实践。这份资料是初学者或有一定基础的开发/算法人员入门活深入大型语言模型学习的优秀参考。这份资料重点介绍了我们应该掌握哪些核心知识，并推荐了一系列优质的学习视频和博客，旨在帮助大家系统性地掌握大型语言模型的相关技术。大语言模型（LargeLanguageM
Agent、RAG、LangChain的概念及作用北极冰雨大模型人工智能
Agent：概念：在人工智能中，Agent通常指的是能够执行任务或做出决策的实体，可以是简单的程序，也可以是复杂的系统，如自动化客服助手、推荐系统等，甚至可以是软件代理、机器人或虚拟助手等各种形式。作用：它能利用内置的大语言模型来做出规划，决定执行哪些步骤，以及每个步骤需要调用哪些工具（如RAG），之后调用相应的工具，最终完成任务。例如，在客服问答场景中，Agent可以根据用户的问题，规划出需要查
AtCoder备赛冲刺必刷题（C++） | 洛谷 AT_abc396_a Triple Four 热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：AT_abc396_a[ABC396A]
算法及数据结构系列 - 滑动窗口诺亚凹凸曼算法及数据结构算法数据结构 java
系列文章目录算法及数据结构系列-二分查找算法及数据结构系列-BFS算法算法及数据结构系列-动态规划算法及数据结构系列-双指针算法及数据结构系列-回溯算法算法及数据结构系列-树文章目录滑动窗口框架思路经典题型76.最小覆盖子串567.字符串的排列438.找到字符串中所有字母异位词3.无重复字符的最长子串滑动窗口框架思路/*滑动窗口算法框架*/voidslidingWindow(strings,str
QHDBO基于量子计算和多策略融合的蜣螂优化算法算法小狂人算法改进智能优化算法量子计算算法
2.DBO基本的蜣螂算法通过模拟蜣螂在自然界中的四种行为（滚动、产卵、觅食和偷窃）来执行种群位置更新。2.1滚动蜣螂在自然界中，蜣螂必须通过太阳导航，使其球滚动的路线尽可能直线。方程(1)用于原始论文中更新滚动蜣螂的位置：xi(t+1)=xi(t)+α⋅k⋅xi(t−1)+b⋅Δx(1)x_i(t+1)=x_i(t)+\alpha\cdotk\cdotx_i(t-1)+b\cdot\Deltax\
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST