_Old_Summer

深度学习推荐算法模型-论文和PyTorch实现

一 AutoRec

1.1 论文

1.2 代码

二 Deep Crossing

2.1 论文

2.2 代码

三 NeuralCF

3.1 论文

3.2 代码

四 PNN

4.1 论文

4.2 代码

五 Wide&Deep

5.1 论文

5.2 代码

六 DCN

6.1 论文

6.2 代码

七 FNN

7.1 论文

7.2 代码

八 DeepFM

8.1 论文

8.2 代码

九 NFM

9.1 论文

9.2 代码

十 AFM

10.1 论文

10.2 代码

注意，这篇文章里的代码是我按照论文所述利用PyTorch自己写的，里面肯定有些细节没表达出来，也难免有错误，推荐看论文的原代码了解更多模型细节

一 AutoRec

1.1 论文

论文题目：《AutoRec: Autoencoders Meet Collaborative Filtering》2015 WWW

论文地址：《AutoRec: Autoencoders Meet Collaborative Filtering》

深度学习在推荐系统中的首次尝试

利用基于自编码器的协同过滤（Collaborative filtering,CF），在Movielens、Netflix数据集上超越了以往的CF。模型结构如下图所示

CF通过用户-物品的交互矩阵（每一行是用户 u 对不同物品 i 的评价，每一列是不同用户对物品 i的评价）发掘出用户的兴趣，然后根据用户的兴趣推荐相应的物品给用户。

将用户-交互矩阵的每一行（User-based AutoRec）

或者每一列（Item-based AutoRec）

输入到自编码器中，利用如下损失函数对自编码器进行优化（以Item-based AutoRec为例）

其中 h() 是自编码器的输出， r 是真实的物品列向量

自编码器的第 u 个输出就是模型预测的用户 u 对当前物品 i 的评分。依次输入不同的物品列向量，就会得到用户 u 对所有的物品评分，根据预测的评分向用户进行推荐。

（

是不是感到好奇，为什么作者说输出是评分就是评分了，感觉这模型也没做什么事情啊，就是输入进去一个向量，又输出一个向量。

首先要知道自编码器是干什么的，自编码器是一种无监督学习模型，分为两个组成部分-编码器和解码器。

编码器相当于对输入进行了降维、压缩，目的是提取输入里面的重要信息，生成对于输入的一个编码，就是图里的这部分

解码器通过编码器输出的编码尝试还原最初的输入，如果编码器提取的信息比较好，解码器输出的解码会非常接近最初的输出，就是图中的这部分

那么如何让编码器提取到更重要的信息呢，是通过损失函数来约束的，就是文中的这个

在编解码器中也称其为‘重构损失’。

不停的利用损失函数进行训练，慢慢的编码器就会学会从输入中提取出重要的信息。

）

1.2 代码

# coding=UTF-8
import torch
import torch.nn as nn


# 基于自编码器的推荐模型
class AutoRec(nn.Module):
    # 初始化网络层
    def __init__(self, feature_dim, hidden_dim):
        # feature_dim:用户/物品评分向量维度
        # hidden_dim:隐层维度
        super(AutoRec, self).__init__()
        self.feature_dim = feature_dim
        self.hidden_dim = hidden_dim

        # 编码器
        self.encoder = nn.Sequential(
            nn.Linear(in_features=self.feature_dim, out_features=self.hidden_dim, bias=True),
            # 论文里说ReLU激活效果是最差的
            # 用了sigmoid
            nn.Sigmoid(),
        )

        # 解码器
        self.decoder = nn.Sequential(
            nn.Linear(in_features=self.hidden_dim, out_features=self.feature_dim, bias=True),
            nn.Sigmoid(),
        )

        # 初始化网络层
        self.init_layer()

    def init_layer(self):
        # 遍历所有网络层
        for layer in self.modules():
            if isinstance(layer, nn.Linear):
                layer.bias.data.fill_(1)

    # 前向传递,构建计算图
    def forward(self, x):
        # x是输入的用户评分向量或者物品评分向量
        # 先进行编码
        encoder_x = self.encoder(x)
        # 然后进行解码
        decoder_x = self.decoder(encoder_x)
        # 返回结果
        return decoder_x


# 定义损失函数
class AutoRecLoss(nn.Module):
    # 初始化
    def __init__(self):
        super(AutoRecLoss, self).__init__()

    # 计算损失函数
    def forward(self, r, pre_r, w, v):
        return nn.MSELoss(r, pre_r)


# # pytorch的优化器中自带L2正则化
# AutoRec = AutoRec(100, 50)
# # 正则化平衡因子
# lamuda = int(input())
# optimer = torch.optim.Adam(AutoRec.parameters(), lr=0.001, weight_decay=lamuda / 2)

# 模型测试
if __name__ == '__main__':
    # 随机生成一个用户-物品评分矩阵
    x = torch.randn(50, 100)
    # 将每个用户评分向量输入到AutoRec中
    auto_rec = AutoRec(100, 50)
    output = auto_rec(x)
    print(output)

二 Deep Crossing

2.1 论文

论文题目：《Deep Crossing: Web-Scale Modeling without Manually Crafted Combinatorial Features》2016 KDD

论文地址：《Deep Crossing: Web-Scale Modeling without Manually Crafted Combinatorial Features》

利用深度学习自动学习有效的特征表示，代替以往耗时的手工特征工程。

Deep Crossing 会从输入的数据中学习出有效的特征表示，利用学习到的特征进行接下来的预测。

Deep Crossing的提出是为了解决这一问题：当用户在微软必应中搜索关键词时，系统如何根据他搜索的关键词推荐相应的广告。下面是这一过程中一些参与对象的解释

首先需要对输入到模型中的原始特征（比如用户年龄、搜索词、搜索时间......）进行一些处理，比如用one-hot对其进行编码，再输入到模型中。模型结构如下图所示

对输入进来的原始特征进行Embedding

(

Embedding，嵌入，是深度学习中的一个比较重要的想法。

深度学习中的嵌入指的是如何更合理的用向量表示一个物体。比如词嵌入指的是利用向量表示一个词语，这个向量在欧式空间中也能够体现出词语语义级别的信息。图嵌入指的是利用向量表示图结构数据中的节点或者整个图，使向量在欧式空间中也能够体现出节点之间的连接关系。

具体到实现上就是一个全连接层，也就是一个线性变换，其中的参数是通过训练过程学习得到的。

也能够起到将稀疏向量稠密化的作用，比如这里的嵌入。

）

然后将每个Embedding的结果进行拼接，作为一个新的特征向量

将特征向量输入到带有残差连接的全连接层中，进行不同特征之间的组合（这也是Deep Crossing这个名称的由来，以往的特征组合都是利用公式显示的指出，比如FM，而Deep Crossing利用神经网络去学习这种组合）

然后进行CTR预测，利用损失函数（交叉熵损失）

对网络中的参数进行优化。

2.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


# DeepCrossing中特征交叉使用的残差全连接层
class ResidualBlock(nn.Module):
    def __init__(self, feature_dim, out_dim, use_residual=True):
        super(ResidualBlock, self).__init__()
        # 是否使用残差连接
        self.use_residual = use_residual
        # 输入特征的维度
        self.feature_dim = feature_dim
        # 中间隐层输出特征的维度
        self.out_dim = out_dim
        # 特征交叉所用的全连接层
        self.feature_interaction_layer = nn.Sequential(
            # 论文中的残差全连接层用了
            # 两个线性变换层
            # 使用了偏置
            # 激活函数是ReLU
            # 在论文的Figure 2中
            nn.Linear(in_features=feature_dim, out_features=out_dim, bias=True),
            nn.ReLU(True),
            nn.Linear(in_features=out_dim, out_features=feature_dim, bias=True),
        )

    # 前向传递,建立计算图
    def forward(self, x):
        # x是输入进来的特征
        # 由Embedding+concat得到
        residual_out = self.feature_interaction_layer(x)
        # 如果使用残差连接
        if self.use_residual:
            # 进行残差连接
            residual_out = residual_out + x
        # 激活
        # 还是ReLU函数
        # 看论文中的Figure 2
        residual_out = F.relu(residual_out)
        return residual_out


class DeepCrossing(nn.Module):
    # 初始化网络层
    # 看论文的Figure 1
    # 输入特征中有些需要进行嵌入表示
    # 另外一些特征没有进行嵌入表示
    def __init__(
            self,
            embedding_layer_num=5,
            residual_layer_num=3,
            need_embd_dim=100,
            without_embd_dim=10,
            embedding_dim=50,
            output_dim=25,
    ):

        super(DeepCrossing, self).__init__()
        # 嵌入层的数量
        self.embedding_layer_num = embedding_layer_num
        # 特征交叉层的数量
        self.multiple_residual_units_num = residual_layer_num
        # 输入中需要进行嵌入的特征的维度
        self.input_dim = need_embd_dim
        # 输入中不需要进行嵌入的特征的维度
        self.other_input_dim = without_embd_dim
        # 嵌入向量的维度
        self.embedding_dim = embedding_dim
        # multiple_residual_units中间隐层输出的维度
        self.output_dim = output_dim

        # 嵌入层
        self.embedding_layer_block = nn.Linear(self.input_dim, self.embedding_dim, bias=True)
        self.embedding_layer = nn.ModuleList()
        for i in range(self.embedding_layer_num):
            self.embedding_layer.append(self.embedding_layer_block)

        # Multiple Residual Units,特征交叉层
        self.multiple_residual_units = nn.ModuleList()
        for i in range(self.multiple_residual_units_num):
            self.multiple_residual_units.append(
                ResidualBlock(self.embedding_layer_num * self.embedding_dim + self.other_input_dim, self.output_dim))
        # 注意这里和嵌入层最后处理的不同
        # 因为在论文的Figure 1中
        # multiple_residual_units是垂直结构的,所以需要展开为顺序的关系
        # 而嵌入层是水平结构,用一个list保存即可
        self.multiple_residual_units = nn.Sequential(*self.multiple_residual_units)

        # scoring layer
        # CTR结果预测
        # 二分类问题
        self.scoring_layer = nn.Linear(in_features=self.embedding_layer_num * self.embedding_dim + self.other_input_dim, out_features=2, bias=False)

    # 前向传递,建立计算图
    def forward(self, x_list, x):
        # 需要进行嵌入的特征数量必须等于嵌入层的数量
        assert len(x_list) == self.embedding_layer_num
        # 对需要进行嵌入的特征进行嵌入表示
        embedding_result = []
        for i in range(self.embedding_layer_num):
            temp_result = self.embedding_layer[i](x_list[i])
            # 注意论文的嵌入层有一个截断操作,在论文的公式(2)中
            temp_result = torch.clamp(temp_result, min=0.0)
            embedding_result.append(torch.tensor(temp_result, dtype=torch.float32))
        # 对嵌入结果进行连接
        embedding_result = torch.cat(embedding_result, dim=-1)
        embedding_result = torch.cat([embedding_result, x], dim=-1)

        # 进行特征交叉
        feature_interaction = self.multiple_residual_units(embedding_result)
        
        # 结果预测
        out = self.scoring_layer(feature_interaction)
        return out


# 模型测试
if __name__ == '__main__':
    # 随机生成需要进行嵌入的特征
    x_list = [[0, 1], [1, 0]]
    x_list = torch.tensor(x_list, dtype=torch.float32)
    # 随机生成不需要进行嵌入的特征
    x = [16, 14, 13]
    x = torch.tensor(x, dtype=torch.float32)
    deep_crossing = DeepCrossing(
        embedding_layer_num=2,
        residual_layer_num=1,
        need_embd_dim=2,
        without_embd_dim=3,
        embedding_dim=5,
        output_dim=10
    )
    output = deep_crossing(x_list, x)
    print(output)

三 NeuralCF

3.1 论文

论文题目：《Neural Collaborative Filtering》2017 WWW

论文地址：《Neural Collaborative Filtering》

神经网络形式的矩阵分解方法---NCF（Neural network--based Collaborative Filtering）.

以往的矩阵分解（MF）方法通过将用户-物品交互矩阵进行分解，分别得到用户和物品的隐向量，然后用隐向量的内积衡量用户对相应物品的喜爱程度，进行推荐。

作者认为使用内积这种方式阻碍了MF的泛化性，无法充分捕获用户和物品隐向量之间的交互。本文利用前馈神经网络去学习用户和物品隐向量之间的交互，替代以往利用内积的方式。模型结构如下图所示

首先将输入的用户、物品的稀疏特征（比如用户-物品交互矩阵中的某一行和某一列）进行嵌入(Embedding),这步的结果相当于以前矩阵分解方法中得到的用户、物品的隐向量，然后将Embedding结果连接（concat）输入到前馈神经网络中进行不同特征的组合（特征交叉），最后得到模型的预测值。

然后计算模型预测值和真实值之间的损失，更新网络参数。损失函数为（交叉熵损失）

模型表达式为

上面的这个是标准的NCF，作者在论文中由此提出了一种拓展的NCF---GMF，拓展的部分是特征交叉的方式。

GMF结构如图

融合了两种特征交叉方式，左边的是对嵌入结果进行哈达玛积（两个矩阵逐元素相乘）

右面是上面说的NCF，利用多层前馈神经网络进行特征交叉。然后将左、右的特征交叉结果连接，进行CTR预测，模型表达式为

3.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


class NCF(nn.Module):
    # 初始化
    def __init__(self, user_feature_dim, item_feature_dim, embedding_dim, output_dim_list):
        super(NCF, self).__init__()
        # 用户特征的维度
        self.user_feature_dim = user_feature_dim
        # 物品特征的维度
        self.item_feature_dim = item_feature_dim
        # 嵌入向量的维度
        self.embedding_dim = embedding_dim
        # 特征交叉层输出维度列表
        self.output_dim_list = output_dim_list
        # 用户特征嵌入层
        self.user_embedding = nn.Linear(self.user_feature_dim, self.embedding_dim)
        # 物品特征嵌入层
        self.item_embedding = nn.Linear(self.item_feature_dim, self.embedding_dim)
        # 特征交叉层
        self.neural_cf_layers = nn.ModuleList()
        # 添加全连接层
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = embedding_dim * 2
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                # 论文中使用的激活函数是ReLU,在论文的第4页
                nn.ReLU(),
            )
            self.neural_cf_layers.append(layer)
            # 更新下一个线性层的输入维度是当前线性层的输出维度
            input_dim = self.output_dim_list[i]
        # 按顺序展开
        self.neural_cf_layers = nn.Sequential(*self.neural_cf_layers)

        # 输出层,二分类
        # 论文最后的输出层没有使用偏置
        self.output_layer = nn.Linear(self.output_dim_list[-1], 2, bias=False)

    # 前向传递,建立计算图
    def forward(self, user_feature, item_feature):
        # 分别对输入的用户特征和物品特征进行嵌入
        user_embedding = self.user_embedding(user_feature)
        item_embedding = self.item_embedding(item_feature)
        # 连接
        feature = torch.cat([user_embedding, item_embedding], dim=-1)
        # 进行特征交叉
        feature_interaction = self.neural_cf_layers(feature)
        out = self.output_layer(feature_interaction)
        out = F.sigmoid(out)
        return out


# 看论文中的Figure 3
class GMF(nn.Module):
    # 初始化网络层
    def __init__(
            self,
            user_feature_dim,
            item_feature_dim,
            embedding_dim,
            output_dim_list,
    ):
        super(GMF, self).__init__()
        # 用户的特征维度
        self.user_feature_dim = user_feature_dim
        # 物品的特征维度
        self.item_feature_dim = item_feature_dim
        # 嵌入向量的维度
        self.embedding_dim = embedding_dim
        # 特征交叉层每层的输出维度
        self.output_dim_list = output_dim_list
        # MLP嵌入网络
        self.mlp_user_embedding_layer = nn.Linear(self.user_feature_dim, self.embedding_dim, bias=True)
        self.mlp_item_embedding_layer = nn.Linear(self.item_feature_dim, self.embedding_dim, bias=True)
        # MF嵌入网络
        self.mf_user_embedding_layer = nn.Linear(self.user_feature_dim, self.embedding_dim, bias=True)
        self.mf_item_embedding_layer = nn.Linear(self.item_feature_dim, self.embedding_dim, bias=True)
        # 特征交叉层
        self.neural_cf_layers = nn.ModuleList()
        # 添加全连接层
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = embedding_dim * 2
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                # 论文中使用的激活函数是ReLU,在论文的第4页
                nn.ReLU(),
            )
            self.neural_cf_layers.append(layer)
            # 更新下一个线性层的输入维度是当前线性层的输出维度
            input_dim = self.output_dim_list[i]
        # 按顺序展开
        self.neural_cf_layers = nn.Sequential(*self.neural_cf_layers)
        # 输出层,进行CTR预测
        self.output_layer = nn.Linear(self.embedding_dim + self.output_dim_list[-1], 2, bias=False)

    # 前向传递,建立计算图
    def forward(self, user_feature, item_feature):
        # 进行嵌入
        mlp_user_embedding = self.mlp_user_embedding_layer(user_feature)
        mlp_item_embedding = self.mlp_item_embedding_layer(item_feature)
        mf_user_embedding = self.mf_user_embedding_layer(user_feature)
        mf_item_embedding = self.mf_item_embedding_layer(item_feature)
        mlp_input = torch.cat([mlp_user_embedding, mlp_item_embedding], dim=-1)
        mlp_resault = self.neural_cf_layers(mlp_input)
        # 哈达玛积也叫元素积
        # PyTorch中的普通*法就是哈达玛积
        gmf_resault = mf_user_embedding * mf_item_embedding
        # 连接
        final_resault = torch.cat([gmf_resault, mlp_resault], dim=-1)
        out = self.output_layer(final_resault)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    # 随机生成用户特征和物品特征
    user_feature = torch.randn(1, 10)
    item_feature = torch.randn(1, 10)
    ncf = NCF(user_feature_dim=10, item_feature_dim=10, embedding_dim=20, output_dim_list=[10, 5, 4])
    output = ncf(user_feature, item_feature)
    print(output)
    gmf = GMF(user_feature_dim=10, item_feature_dim=10, embedding_dim=20, output_dim_list=[10, 5, 4])
    output = gmf(user_feature, item_feature)
    print(output)

四 PNN

4.1 论文

论文题目：《Product-based Neural Networks for User Response Prediction》2016 ICDM

论文地址：《Product-based Neural Networks for User Response Prediction》

推荐系统中所使用的输入数据一般都是高维的稀疏向量

以往的逻辑回归、FM方法等，都依赖手工特征工程去提取隐含在数据中的高阶特征。近几年来因为神经网络能够自动从数据中学习出有效的特征表示，受到了人们的重视，提出了基于嵌入表示（Embedding）+前馈神经网络（多层感知机,MLP)的方式，去学习不同特征之间的组合信息。但是这种方式无法捕获不同特征域中特征的交互关系，对于此，本文提出了PNN（Product-based Neural Network）去学习不同特征域间的特征组合信息。

PNN模型结构如图

论文中是从上往下介绍的，感觉有点别扭，这里按照从下往上来吧。

Input:输入是不同特征域的稀疏特征向量，比如年龄、地址、购买日期......这些，用one-hot或者multi-hot编码的向量

Embedding:将输入分别进行嵌入（Embedding） ,注意这里为了后面的计算，嵌入向量的维度是相同的，比如最后不同特征域的稀疏特征向量都用500维的嵌入向量进行表示。

Product:这层是模型的创新之处，以往的模型得到嵌入向量之后，直接就是连接(concat),然后输入到前馈神经网络中了，这里作者分为z和p两部分捕获不同特征域中特征之间的组合。其中z部分捕获特征的线性组合

p部分捕获非线性的特征组合信息，根据p计算方式的不同，作者提出了两种不同类型的PNN---IPNN、OPNN。

其中IPNN中的p部分利用内积捕获不同特征之间的交互信息

而OPNN的p部分利用外积捕获不同特征之间的交互信息

两个特征的内积结果是一个数，直接放在p部分里就行，但是两个特征的外积结果是一个矩阵，作者的处理方式是将所有外积的结果矩阵进行相加，然后再进行行向量化，这样就能放在p里了。

（注意前面的z部分是N个数据，p部分是 $\binom{n}{2}$ 个数据）

然后分别将z部分的数据，p部分的数据输入到一个全连接层进行线性变换

然后将线性变换结果进行连接（concat），输入到后面的前馈神经网络中，进一步进行不同特征之间的组合，后面就是常规过程了，没啥说的，激活函数用了ReLU,最后一层用了sigmoid

利用交叉熵损失更新网络参数

4.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


# 论文中的 Fig.1
class PNN(nn.Module):
    # 初始化网络层
    def __init__(
            self,
            feature_dim,
            field_num,
            embedding_dim,
            output_dim_list,
    ):
        super(PNN, self).__init__()
        # 输入的不同域特征的维度
        self.feature_dim = feature_dim
        # 不同域的特征数量
        self.field_num = field_num
        # 特征嵌入维度
        self.embedding_dim = embedding_dim
        # 特征交叉层不同层的输出维度
        self.output_dim_list = output_dim_list

        # 嵌入层
        self.embedding_layer = nn.ModuleList()
        for i in range(self.field_num):
            self.embedding_layer.append(nn.Linear(self.feature_dim, self.embedding_dim, bias=False))
        # z部分
        self.z = nn.Linear(self.field_num * self.embedding_dim, self.field_num * self.embedding_dim, bias=True)
        self.z.bias = nn.Parameter(torch.ones(self.field_num * self.embedding_dim))
        # 特征交叉层
        self.hidden_layer = nn.ModuleList()
        for i in range(len(self.output_dim_list)):
            if i == 0:
                # z部分的n个数据+p部分的n*(n-1)/2个数据
                input_dim = self.field_num * self.embedding_dim + int(self.field_num * (self.field_num - 1) / 2)
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                nn.ReLU(True),
            )
            self.hidden_layer.append(layer)
            # 更新下一层的输入维度是当前层的输出维度
            input_dim = self.output_dim_list[i]
        self.hidden_layer = nn.Sequential(*self.hidden_layer)
        # 输出层
        self.output_layer = nn.Linear(self.output_dim_list[-1], 2, bias=True)

    # 前向传递,建立计算图
    def forward(self, x_list):
        # 进行嵌入
        # 特征列表的长度必须等于特征域的数量
        assert len(x_list) == self.field_num
        embedding_resault = []
        for i in range(self.field_num):
            embedding_resault.append(self.embedding_layer[i](x_list[i]))
        # z部分,线性变换
        embedding_feature = torch.cat(embedding_resault, dim=-1)
        z_result = self.z(embedding_feature)
        # p部分,计算内积
        embedding_feature = torch.stack(embedding_resault, dim=0)
        # 计算内积矩阵
        innear_product = torch.matmul(embedding_feature, embedding_feature.T)
        # 获取上三角除对角线的内积值
        innear_result = torch.triu(innear_product, diagonal=1)
        innear_result = innear_result[innear_result != 0]
        # 转换维度
        innear_result = innear_result.reshape(1, -1).squeeze()
        # 输入后面特征交叉层的特征
        input_feature = torch.cat([z_result, innear_result], dim=-1)
        # 特征交叉结果
        interaction_result = self.hidden_layer(input_feature)
        out = self.output_layer(interaction_result)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    # 随机生成不同特征域的特征
    x_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    x_list = torch.tensor(x_list, dtype=torch.float32)
    pnn = PNN(feature_dim=3, field_num=3, embedding_dim=6, output_dim_list=[5, 4])
    output = pnn(x_list)
    print(output)

五 Wide&Deep

5.1 论文

论文题目：《Wide & Deep Learning for Recommender Systems》2016 RecSys

论文地址：《Wide & Deep Learning for Recommender Systems》

谷歌2016提出的用于谷歌应用商店APP推荐的模型。

wide指的是模型的记忆性（是一个线性模型，像逻辑回归一样直接根据输入进来的特征产生推荐结果，就像模型记住了这个特征组合一样），deep指的是模型的泛化性（是一个神经网络，通过神经网络捕获不同特征组合之间的高阶信息，这样即使遇见了以前很少见过的特征组合也能产生相应的推荐结果）

模型结构如图

wide部分是直接将特征输入到一个线性模型中

具体应用时用了cross-product对输入的特征进行了变换

（这个虽然给出了公式，但具体是人工事先设计的---让特定的特征组合值是1，其它是0）

deep部分是先将特征进行嵌入，然后将得到的嵌入向量输入到前馈神经网络中捕获不同的特征组合信息。

最后将两部分的结果连接，输入到输出层进行预测，利用交叉熵损失更新网络的参数

5.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


class WideDeep(nn.Module):
    # 初始化网络层
    def __init__(
            self,
            deep_feature_dim,
            wide_feature_dim,
            embedding_dim,
            output_dim_list
    ):
        super(WideDeep, self).__init__()
        # deep部分特征的维度
        self.deep_feature_dim = deep_feature_dim
        # wide部分特征的维度
        self.wide_feature_dim = wide_feature_dim
        # 特征嵌入向量的维度
        self.embedding_dim = embedding_dim
        # deep部分中间网络层的输出维度列表
        self.output_dim_list = output_dim_list

        # 嵌入层
        self.embedding_layer = nn.Linear(deep_feature_dim, embedding_dim, bias=True)

        # deep部分
        self.deep = nn.ModuleList()
        # 添加全连接层
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = embedding_dim
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                # 论文中使用的激活函数是ReLU,在论文的Figure 4
                nn.ReLU(),
            )
            self.deep.append(layer)
            # 更新下一个线性层的输入维度是当前线性层的输出维度
            input_dim = self.output_dim_list[i]
        # 按顺序展开
        self.deep = nn.Sequential(*self.deep)
        # 输出层
        self.output_layer = nn.Linear(wide_feature_dim + self.output_dim_list[-1], 2, bias=True)

    # 前向传递,建立计算图
    def forward(self, wide_feature, deep_feature):
        embedding_resault = self.embedding_layer(deep_feature)
        deep_resault = self.deep(embedding_resault)
        final_resault = torch.cat([wide_feature, deep_resault], dim=-1)
        out = self.output_layer(final_resault)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    wide_feature = torch.randn(1, 20)
    deep_feature = torch.randn(1, 30)
    wide_deep = WideDeep(wide_feature_dim=20, deep_feature_dim=30, embedding_dim=50, output_dim_list=[30, 15, 10])
    output = wide_deep(wide_feature, deep_feature)
    print(output)

六 DCN

6.1 论文

论文题目：《Deep & Cross Network for Ad Click Predictions》2017 KDD

论文地址：《Deep & Cross Network for Ad Click Predictions》

作者认为上文的wide部分没有充分的进行特征交叉，而且特征交互方式也是通过人工指定的，缺少泛化性，对wide部分进行了改进。模型结构如下图所示

就Cross那部分代替了原先的wide部分，别的没有变化

cross部分的表达式为

是当前网络层的输入， $x_{l+1}$ 是当前网络层的输出，就是网络下面的那个通过连接（concat）得到的特征向量。（相当于特征交叉+残差连接）

计算过程如下图所示

6.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


# cross layer中的层
class CrossLayer(nn.Module):
    def __init__(self, input_dim):
        super(CrossLayer, self).__init__()
        self.weight = nn.Linear(input_dim, 1, bias=False)
        self.bias = nn.Parameter(torch.zeros(input_dim))

    def forward(self, x0, xi):
        interaction_out = self.weight(xi) * x0 + self.bias
        return interaction_out


# cross layer中的子模块
class CrossLayerBlock(nn.Module):
    def __init__(self, input_dim, layer_num):
        super(CrossLayerBlock, self).__init__()
        # cross层的数量
        self.layer_num = layer_num
        # 输入特征的维度
        self.input_dim = input_dim
        self.layer = nn.ModuleList(CrossLayer(self.input_dim) for _ in range(self.layer_num))

    def forward(self, x0):
        xi = x0
        for i in range(self.layer_num):
            xi = xi + self.layer[i](x0, xi)
        return xi


# 论文中的Figure 1
class DCN(nn.Module):
    # 初始化网络层
    def __init__(self, input_dim, embedding_dim, cross_layer_num, deep_layer_num):
        super(DCN, self).__init__()
        # 输入特征的维度
        self.input_dim = input_dim
        # 嵌入向量的维度
        self.embedding_dim = embedding_dim
        # cross layer的数量
        self.cross_layer_num = cross_layer_num
        # deep layer的数量
        self.deep_layer_num = deep_layer_num

        # 嵌入层
        self.embedding_layer = nn.Linear(self.input_dim, self.embedding_dim, bias=False)
        # cross layer
        self.cross_layer = CrossLayerBlock(self.embedding_dim, self.cross_layer_num)
        # deep layer
        self.deep_layer = nn.ModuleList()
        for i in range(self.deep_layer_num):
            layer = nn.Sequential(
                nn.Linear(self.embedding_dim, self.embedding_dim, bias=True),
                nn.ReLU(),
            )
            self.deep_layer.append(layer)
        self.deep_layer = nn.Sequential(*self.deep_layer)
        # 输出层
        self.output_layer = nn.Linear(self.embedding_dim * 2, 2, bias=True)

    # 前向传递,建立计算图
    def forward(self, x):
        # 进行特征嵌入
        x_embedding = self.embedding_layer(x)
        # cross layer
        cross_resault = self.cross_layer(x_embedding)
        # deep layer
        deep_resault = self.deep_layer(x_embedding)
        temp_resault = torch.cat([cross_resault, deep_resault], dim=-1)
        out = self.output_layer(temp_resault)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    x = torch.randn(1, 10)
    dcn = DCN(10, 20, 2, 2)
    output = dcn(x)
    print(output)

七 FNN

7.1 论文

论文题目：《Deep Learning over Multi-fifield Categorical Data – A Case Study on User Response Prediction》2016 ECIR

论文地址：Deep Learning over Multi-field Categorical Data: A Case Study on User Response Prediction

模型结构如下图所示

输入是不同域中的特征，然后对比下图中FM的表达式和FNN中的Dense Real Layer

先训练得到一个FM，然后利用FM中的相应参数初始化FNN的Dense Real Layer。

然后将得到的结果连接(concat)输入到后面的前馈神经网络中

最终得到模型的CTR预测（注意作者前馈神经网络中用的激活函数）

还是通过交叉熵损失训练网络

后面作者还给出了一个SNN，就是一个前馈神经网络，分别尝试了使用RBM（受限玻尔兹曼机）和DAE（去噪自编码器）训练 FNN中用FM参数初始化的那层权重。

7.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


class FNN(nn.Module):
    # 初始化网络层
    def __init__(
            self,
            dense_input_dim,
            dense_output_dim,
            output_dim_list,
    ):
        super(FNN, self).__init__()
        # dense layer的输入维度
        self.dense_input_dim = dense_input_dim
        # dense layer的输出维度
        self.dense_output_dim = dense_output_dim
        # hiden layer的输出层维度列表
        self.output_dim_list = output_dim_list

        # dense layer
        self.dense_layer = nn.Linear(self.dense_input_dim, self.dense_output_dim, bias=True)
        # hiden layer
        self.hiden_layer = nn.ModuleList()
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = self.dense_output_dim
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                nn.Tanh()
            )
            self.hiden_layer.append(layer)
            input_dim = self.output_dim_list[i]
        self.hiden_layer = nn.Sequential(*self.hiden_layer)
        # # 利用预先训练的FM参数初始化FNN的参数
        # self.__init_layer()
        # 输出层
        self.output_layer = nn.Linear(self.output_dim_list[-1], 2, bias=True)

    # # 初始化FNN参数
    # def __init_layer(self, w, b):
    #     # 遍历FNN的网络层
    #     for m in self.modules():
    #         if isinstance(m, nn.Linear):
    #             m.weight.data = w
    #             m.bias.data = b
    #             break

    # 前向传递,建立计算图
    def forward(self, x):
        dense_result = self.dense_layer(x)
        out = self.hiden_layer(dense_result)
        out = self.output_layer(out)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    x = torch.randn(1, 10)
    fnn = FNN(dense_input_dim=10, dense_output_dim=20, output_dim_list=[15, 10, 5])
    output = fnn(x)
    print(output)

八 DeepFM

8.1 论文

论文题目：《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction 》2017 IJCAI

论文地址：《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》

对wide&deep模型的wide部分利用FM层进行了改进，模型结构为

输入是不同特征域（性别，年龄，地址......）的one-hot稀疏编码向量，然后经过Embedding层嵌入，得到嵌入向量，常规操作，没啥说的，说一下模型提出的FM层

像PNN的product层，‘+’这里是特征的线性组合，后面的'X'是不同特征之间的内积（m*(m-1)/2个结果）,连接，输入到输出层中

作者还对比了一下和FNN、PNN、wide&deep的区别

8.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


class DeepFM(nn.Module):
    # 初始化网络层
    def __init__(
            self,
            field_num,
            feature_dim,
            embedding_dim,
            output_dim_list,
    ):
        super(DeepFM, self).__init__()
        # 不同域的特征个数
        self.field_num = field_num
        # 输入的不同域特征的维度
        self.feature_dim = feature_dim
        # 特征嵌入维度
        self.embedding_dim = embedding_dim
        # 特征交叉层不同层的输出维度
        self.output_dim_list = output_dim_list

        # 嵌入层
        self.embedding_layer = nn.ModuleList()
        for i in range(self.field_num):
            self.embedding_layer.append(nn.Linear(self.feature_dim, self.embedding_dim, bias=False))
        # FM layer
        self.fm_layer = nn.Linear(self.field_num * self.embedding_dim, 1, bias=False)
        # hidden layer
        self.hidden_layer = nn.ModuleList()
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = self.field_num * self.embedding_dim
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                nn.ReLU(True),
            )
            self.hidden_layer.append(layer)
            # 更新下一层的输入维度是当前层的输出维度
            input_dim = self.output_dim_list[i]
        self.hidden_layer = nn.Sequential(*self.hidden_layer)
        # 输出层
        input_dim = 1 + int(self.field_num * (self.field_num - 1) / 2) + self.output_dim_list[-1]
        self.output_layer = nn.Linear(input_dim, 2, bias=True)

    # 前向传递,建立计算图
    def forward(self, x_list):
        # 进行嵌入
        # 特征列表的长度必须等于特征域的数量
        assert len(x_list) == self.field_num
        embedding_resault = []
        for i in range(self.field_num):
            embedding_resault.append(self.embedding_layer[i](x_list[i]))
        # FM的线性变换
        embedding_feature = torch.cat(embedding_resault, dim=-1)
        l_result = self.fm_layer(embedding_feature)
        # hiddent layer部分
        hiddent_result = self.hidden_layer(embedding_feature)
        # FM计算内积部分
        embedding_feature = torch.stack(embedding_resault, dim=0)
        # 计算内积矩阵
        innear_product = torch.matmul(embedding_feature, embedding_feature.T)
        # 获取上三角除对角线的内积值
        innear_result = torch.triu(innear_product, diagonal=1)
        innear_result = innear_result[innear_result != 0]
        # 转换维度
        innear_result = innear_result.reshape(1, -1).squeeze()
        fm_result = torch.cat([l_result, innear_result], dim=-1)
        input_feature = torch.cat([fm_result, hiddent_result], dim=-1)
        out = self.output_layer(input_feature)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    # 随机生成不同特征域的特征
    x_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    x_list = torch.tensor(x_list, dtype=torch.float32)
    deepFM = DeepFM(feature_dim=3, field_num=3, embedding_dim=6, output_dim_list=[5, 4])
    output = deepFM(x_list)
    print(output)

九 NFM

9.1 论文

论文题目：《Neural Factorization Machines for Sparse Predictive Analytics》2017 SIGIR

论文地址：《Neural Factorization Machines for Sparse Predictive Analytics》

NFM利用神经网络克服FM表达能力不强，无法捕获高阶的特征交叉信息问题。

FM的表达式为

NFM利用神经网络替换了最后二阶特征交叉的部分

神经网络结构为

输入还有Embedding，后面的前馈神经网络就不用说了，常规操作了，说一下NFM引入的Bi-Interaction Layer

其中的是第 i 个特征的嵌入向量表示，Bi-Interaction Layer对这些嵌入向量两两做哈达玛积，然后相加，输入到后面的前馈神经网络中

最终NFM的表达式为

NFM在Bi-Interaction Layer还使用了Dropout的策略，对于Bi-Interaction Layer的输出和前馈神经网络的输出还使用了BN(Batch Normalization

9.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


class NFM(nn.Module):
    # 初始化层
    def __init__(
            self,
            field_num,
            feature_dim,
            embedding_dim,
            output_dim_list,
    ):
        super(NFM, self).__init__()
        # 特征域的个数
        self.field_num = field_num
        # 特征维度
        self.feature_dim = feature_dim
        # 嵌入维度
        self.embedding_dim = embedding_dim
        # hidden层的输出维度
        self.output_dim_list = output_dim_list

        # 嵌入层
        self.embedding_layer = nn.ModuleList()
        for i in range(self.field_num):
            layer = nn.Linear(self.feature_dim, self.embedding_dim, bias=False)
            self.embedding_layer.append(layer)
        # hidden layer
        self.hidden_layer = nn.ModuleList()
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = self.embedding_dim
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                # nn.BatchNorm1d(),
                nn.ReLU(),
            )
            self.hidden_layer.append(layer)
            input_dim = self.output_dim_list[i]
        self.hidden_layer = nn.Sequential(*self.hidden_layer)
        # 输出层
        self.output_layer = nn.Linear(self.output_dim_list[-1], 2, bias=True)

    # 前向传递,建立计算图
    def forward(self, x_list):
        assert len(x_list) == self.field_num
        # 嵌入
        embedding_result = []
        for i in range(self.field_num):
            embedding_result.append(self.embedding_layer[i](x_list[i]))

        # Bi-interaction pooling
        batch_size = x_list[0].size()[0]
        bi_pool_result = torch.empty(batch_size, self.embedding_dim)
        for i in range(self.field_num):
            for j in range(self.field_num):
                bi_pool_result += embedding_result[i] * embedding_result[j]
        out = self.hidden_layer(bi_pool_result)
        out = self.output_layer(out)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    # 随机生成不同特征域的特征
    x_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    x_list = torch.tensor(x_list, dtype=torch.float32)
    nfm = NFM(field_num=3, feature_dim=3, embedding_dim=10, output_dim_list=[5, 4])
    output = nfm(x_list)
    print(output)

十 AFM

10.1 论文

论文题目：《Attentional Factorization Machines: Learning the Weight of Feature Interactions via Attention Networks》2017 IJCAI

论文地址：《Attentional Factorization Machines: Learning the Weight of Feature Interactions via Attention Networks》

NFM的Bi-Interaction Layer对特征交叉的结果直接进行了加和，它隐含了一个假设：所有的特征交叉对最终结果的影响是相同的，AFM认为要有区别的对待不同特征交叉的结果，而引入了注意力机制。

模型结构为

大部分跟NFM是相同的，但是在特征交叉（哈达玛积）之后，将结果输入到了注意力网络中（就是一层全连接层，别想的太复杂）中学习注意力权重，然后带注意力权重求和

注意力权重计算公式为

最后AFM模型表达式为

10.2 代码

import torch
import torch.nn as nn
import torch.nn.functional as F


class AFM(nn.Module):
    # 初始化网络层
    def __init__(
            self,
            field_num,
            feature_dim,
            embedding_dim,
            output_dim_list,
            attention_dim,
    ):
        super(AFM, self).__init__()
        # 特征域的个数
        self.field_num = field_num
        # 特征维度
        self.feature_dim = feature_dim
        # 嵌入维度
        self.embedding_dim = embedding_dim
        # hidden层的输出维度
        self.output_dim_list = output_dim_list
        # 注意力网络隐层输出维度
        self.attention_dim = attention_dim

        # 嵌入层
        self.embedding_layer = nn.ModuleList()
        for i in range(self.field_num):
            layer = nn.Linear(self.feature_dim, self.embedding_dim, bias=False)
            self.embedding_layer.append(layer)
        # 注意力网络
        self.attention_layer = nn.Sequential(
            nn.Linear(self.embedding_dim, self.attention_dim, bias=True),
            nn.ReLU(),
            nn.Linear(self.attention_dim, 1, bias=False)
        )
        # hidden layer
        self.hidden_layer = nn.ModuleList()
        for i in range(len(self.output_dim_list)):
            if i == 0:
                input_dim = self.embedding_dim
            layer = nn.Sequential(
                nn.Linear(input_dim, self.output_dim_list[i], bias=True),
                nn.ReLU(),
            )
            self.hidden_layer.append(layer)
            input_dim = self.output_dim_list[i]
        self.hidden_layer = nn.Sequential(*self.hidden_layer)
        # 输出层
        self.output_layer = nn.Linear(self.output_dim_list[-1], 2, bias=True)

    # 前向传递,建立计算图
    def forward(self, x_list):
        assert len(x_list) == self.field_num
        # 嵌入
        embedding_result = []
        for i in range(self.field_num):
            embedding_result.append(self.embedding_layer[i](x_list[i]))

        # attention-based pooling
        pair_wise_interaction_result = []
        for i in range(self.field_num):
            for j in range(i + 1, self.field_num):
                pair_wise_interaction_result.append(embedding_result[i] * embedding_result[j])
        # 注意力权重
        attention_weight = []
        for i in pair_wise_interaction_result:
            attention_weight.append(self.attention_layer(i))
        attention_weight = torch.tensor(attention_weight, dtype=torch.float32)
        attention_weight = F.softmax(attention_weight, dim=-1)
        result = 0
        for i in range(len(attention_weight)):
            result += attention_weight[i] * pair_wise_interaction_result[i]
        out = self.hidden_layer(result)
        out = self.output_layer(out)
        out = F.sigmoid(out)
        return out


# 模型测试
if __name__ == '__main__':
    # 随机生成不同特征域的特征
    x_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
    x_list = torch.tensor(x_list, dtype=torch.float32)
    afm = AFM(field_num=3, feature_dim=3, embedding_dim=10, attention_dim=5, output_dim_list=[5, 4])
    output = afm(x_list)
    print(output)

你可能感兴趣的:(算法,深度学习,pytorch,推荐算法)

AI原生应用领域反馈循环：助力应用持续进化 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native ai
AI原生应用领域反馈循环：助力应用持续进化关键词：AI原生应用、反馈循环、持续进化、数据驱动、用户体验摘要：本文围绕AI原生应用领域的反馈循环展开探讨。首先介绍了反馈循环在AI原生应用中的重要性，接着详细解释了反馈循环的核心概念及其相关要素。通过具体的算法原理和操作步骤展示了反馈循环如何在技术层面实现。以实际项目案例说明反馈循环在实际开发中的应用和效果。还探讨了反馈循环在不同场景下的应用，推荐了相
AI原生应用性能优化：混合推理的7个最佳实践 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据 AI-native 性能优化 ai
AI原生应用性能优化：混合推理的7个最佳实践关键词：AI原生应用、性能优化、混合推理、最佳实践、推理效率摘要：本文主要探讨了AI原生应用性能优化中混合推理的相关内容。首先介绍了文章的背景、目的、预期读者和文档结构等信息，接着对混合推理的核心概念进行了通俗易懂的解释，并阐述了各核心概念之间的关系，给出了核心概念原理和架构的文本示意图以及Mermaid流程图。详细讲解了核心算法原理和具体操作步骤，用数
c++STL库与快速排序浪子小院基础精讲 c++算法开发语言数据结构
什么是STL库STL=StandardTemplateLibrary，标准模板库，是一系列软件的统称。从根本上说，STL是一些“容器”的集合，这些“容器”有list,vector,set,map等，STL也是算法和其他一些组件的集合。前面已经学习过的中sort函数、中string类都是STL的内容。STL库还有很多内容，比如：向量（vector）、栈（stack）、队列（queue）、优先队列（p
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能自动驾驶 unix ai
AI伦理与自动驾驶：当机器掌握方向盘时的道德抉择关键词：AI伦理、自动驾驶、道德算法、电车难题、责任归属、技术监管、人机协作摘要：本文深入探讨自动驾驶技术发展过程中面临的伦理挑战，从经典的"电车难题"出发，分析AI决策系统在生死抉择中的道德困境。我们将剖析自动驾驶的伦理框架设计原则，探讨技术实现方案，并通过代码示例展示伦理算法如何嵌入自动驾驶系统。文章还将讨论法律责任划分、社会接受度等现实问题，最
利用大数据领域Doris提升企业数据决策效率大数据洞察大数据网络 ai
利用大数据领域Doris提升企业数据决策效率关键词：大数据、Doris、企业数据决策、数据处理、效率提升摘要：本文围绕利用大数据领域的Doris来提升企业数据决策效率展开。首先介绍了背景，包括目的、预期读者、文档结构和相关术语。接着阐述了Doris的核心概念、架构以及与其他系统的联系。详细讲解了Doris的核心算法原理和具体操作步骤，并给出Python代码示例。同时介绍了相关的数学模型和公式。通过
Python 运用 Matplotlib 绘制动画图的流程 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib 开发语言 ai
Python运用Matplotlib绘制动画图的流程关键词：Python、Matplotlib、动画图、绘制流程、动画原理摘要：本文详细介绍了使用Python的Matplotlib库绘制动画图的完整流程。从背景知识入手，阐述了Matplotlib动画绘制的目的和适用读者群体，接着深入剖析了核心概念，包括动画的基本原理和架构。通过核心算法原理的讲解和Python源代码示例，展示了如何实现动画绘制。同
什么是 Paxos和Raft MonkeyKing.sun paxos raft
Raft和Paxos是两种经典的分布式一致性算法（ConsensusAlgorithms），广泛应用于数据库、分布式系统、微服务架构中，用来确保在多个节点中即使有部分节点故障，系统仍然可以就“某一值”达成一致（即：分布式共识）。它们不是区块链专属，但在联盟链、私有链或数据库复制系统中常被用来替代PoW、PBFT等共识机制。一、什么是Paxos？定义：Paxos是一种保证在部分节点失效或网络延迟时，
什么是DPoS（Delegated Proof of Stake，委托权益证明） MonkeyKing.sun DPoS
DPoS（DelegatedProofofStake，委托权益证明）是一种基于PoS（权益证明）演进而来的共识算法，设计初衷是提高性能、增强治理效率、实现社区自治。一、什么是DPoS（委托权益证明）？DPoS是一种将记账权“委托给投票选出的代表节点”的共识机制。普通用户不直接参与出块，而是通过投票选出“代表人”代为记账和验证交易。可以理解为：“股东大会投票选董事会代表他们管理公司”。二、DPoS的
day39 心落薄荷糖 Python训练营 python
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
【图像处理入门】12. 综合项目与进阶：超分辨率、医学分割与工业检测小米玄戒Andrew 图像处理：从入门到专家图像处理人工智能深度学习算法 python 计算机视觉 CV
摘要本周将聚焦三个高价值的综合项目，打通传统算法与深度学习的技术壁垒。通过图像超分辨率重建对比传统方法与深度学习方案，掌握医学图像分割的U-Net实现，设计工业缺陷检测的完整流水线。每个项目均包含原理解析、代码实现与性能优化，帮助读者从“技术应用”迈向“系统设计”。一、项目1：图像超分辨率重建（从模糊到清晰的跨越）1.技术背景与核心指标超分辨率（SR）是通过算法将低分辨率（LR）图像恢复为高分辨率
Python机器学习元学习库higher 音程机器学习人工智能 python 机器学习
higher是一个用于元学习（Meta-Learning）和高阶导数（Higher-ordergradients）的Python库，专为PyTorch设计。它扩展了PyTorch的自动微分机制，使得在训练过程中可以动态地计算参数的梯度更新，并把这些更新过程纳入到更高阶的梯度计算中。一、主要用途higher主要用于以下场景：元学习（Meta-Learning）比如MAML（Model-Agnosti
OpenCV CUDA模块设备层-----线性插值函数log() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该函数用于创建线性插值访问器，支持对GPU内存中的图像数据进行双线性插值采样。主要应用于图像缩放、旋转等几何变换中需要亚像素级精度的场景。为输入图像构造一个基于“双线性插值”的访问器对象LinearInterPtrSz，可以在CUDA核函数中按需访问缩放后的像素值
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
Densenet模型花卉图像分类深度学习乐园分类数据挖掘人工智能
项目源码获取方式见文章末尾！600多个深度学习项目资料，快来加入社群一起学习吧。《------往期经典推荐------》项目名称1.【基于CNN-RNN的影像报告生成】2.【卫星图像道路检测DeepLabV3Plus模型】3.【GAN模型实现二次元头像生成】4.【CNN模型实现mnist手写数字识别】5.【fasterRCNN模型实现飞机类目标检测】6.【CNN-LSTM住宅用电量预测】7.【VG
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
算法训练营|数组总结慧泽huize 数据结构算法 leetcode python c++
时间复杂度：算法执行语句的次数空间复杂度：算法在运行过程中临时占存储空间大小数组（C++）：存放在连续内存空间的相同类型固定大小的数据的集合，不能删除，只能覆盖列表（Python）：数据可以是不同类型，列表长度可变1.二分查找循环不变量原则，清楚区间定义时间复杂度：O(logn)空间复杂度：O(1)2.双指针法快指针找到新数组元素，慢指针指向新数组下标时间复杂度：O(n)空间复杂度：O(1)3.双
手把手教程：在 VS2017 32位 Windows 环境下编译 OR-Tools 9.6 并集成到 C++ 项目 A小庞 C++知识算法 c++开发语言 or-tools 算法库
OR-Tools是Google开源的优化算法库，支持路径规划、线性规划、约束编程等多种功能。本文将详细介绍在VisualStudio201732位Windows环境下编译OR-Tools9.6的两种方法：联网自动下载依赖和手动编译依赖项，并提供避坑指南。方法一：联网自动下载依赖（推荐新手）步骤1：克隆OR-Tools仓库gitclonehttps://github.com/google/or-to
Google的OR-Tools：运筹学与优化的强大工具 A小庞算法调度算法 or-tools Google
在当今数字化时代，优化问题无处不在，从物流配送到生产计划，从资源调度到交通流量优化，这些看似复杂的问题都可以通过专业的工具来解决。Google的OR-Tools正是这样一款强大的运筹学和优化工具包，它为开发者提供了丰富的算法和功能，帮助解决各种复杂的优化问题。一、OR-Tools简介OR-Tools（OperationsResearchTools）是Google开源的一个用于组合优化的软件套件，旨
第十届“信也科技杯”全球 AI 算法大赛火热开赛！巅峰对决 · 超三十万奖金等你挑战猫头虎猫头虎精品博客专栏科技人工智能神经网络计算机视觉语音识别机器学习目标检测
巅峰对决·超三十万奖金等你挑战！第十届“信也科技杯”全球AI算法大赛火热开赛！第十届信也科技杯全球AI算法大赛活动目录合作单位赛事概况赛事奖励赛事日程速览即刻报名参赛电脑端报名报名选手交流群关于“信也科技杯”关于信也科技合作单位“信也科技杯”是由信也科技主办的数据算法竞赛平台，信也科技与两大全球顶级AI会议合作不仅是IJCAI2025官方合作单位，“信也科技杯”也被CIKM2025AnalytiC
《聚类算法》入门--大白话篇：像整理房间一样给数据分类
一、什么是聚类算法？想象一下你的衣柜里堆满了衣服，但你不想一件件整理。聚类算法就像一个聪明的助手，它能自动帮你把衣服分成几堆：T恤放一堆、裤子放一堆、外套放一堆。它通过观察衣服的颜色、大小、款式这些特征，把相似的放在一起，不相似的分开。在计算机世界里，聚类算法就是帮我们把杂乱的数据分成有意义的组。它不需要提前知道答案（这就是"无监督学习"），而是像侦探一样，从数据中发现隐藏的规律。二、最常见的三种
基于MATLAB的资源优化与工期固定-资源均衡分析方法研究【附代码】拉勾科研工作室 matlab 开发语言
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）资源均衡优化相关理论与问题分类在现代工程项目中，资源的合理分配和使用是确保项目按时完成、成本可控的关键因素。资源均衡优化作为项目管理中的核心环节，旨在通过调整资源的使用方案，使资源消耗在整个工期内尽可能平稳，避免
医学图像增强的层级化模糊与虚拟仪器无参考质量评价研究【附代码】拉勾科研工作室计算机视觉图像处理人工智能
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）层级模糊隶属度的X光医学图像增强算法针对X光医学图像普遍存在的对比度差、细节模糊等问题，本算法提出了一种基于层级模糊隶属度的增强方法。该方法的核心思想在于利用拉普拉斯金字塔分解图像，并在多尺度下分层计算模糊隶属度
C8051F单片机在三轴伺服转台动力学模型与伺服算法仿真中的应用【附设计】
自动化设计|控制系统|毕业设计指导|工业自动化解决方案✨专业领域：程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列编程三菱/欧姆龙应用PIC单片机触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以私信或查
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解汀、人工智能 LLM工业级落地实践人工智能 LLM 自然语言处理 NL2SQL 大模型应用 Text2SQL gpt
NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理1.MindSQL(库)MindSQL是一
强化学习 16G实践以下是基于CQL（Conservative Q-Learning）与QLoRA（Quantized Low-Rank Adaptation）结合的方案相关开源项目及资源，【ai技】行云流水AI笔记开源人工智能
根据你提供的CUDA版本（11.5）和NVIDIA驱动错误信息，以下是PyTorch、TensorFlow的兼容版本建议及环境修复方案：1.版本兼容性表框架兼容CUDA版本推荐安装命令（CUDA11.5）PyTorch11.3/11.6pipinstalltorchtorchvisiontorchaudio--extra-index-urlhttps://download.pytorch.org/
深度学习实战：基于嵌入模型的AI应用开发 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能深度学习 ai
深度学习实战：基于嵌入模型的AI应用开发关键词：嵌入模型（EmbeddingModel）、深度学习、向量空间、语义表示、AI应用开发、相似性搜索、迁移学习摘要：本文将带你从0到1掌握基于嵌入模型的AI应用开发全流程。我们会用“翻译机”“数字身份证”等生活比喻拆解嵌入模型的核心原理，结合Python代码实战（BERT/CLIP模型）演示如何将文本、图像转化为可计算的语义向量，并通过“智能客服问答”“
【k近邻】 K-Nearest Neighbors算法原理及流程 F_D_Z 机器学习方法数理算法学习机器学习 k近邻算法 k-近邻算法
【k近邻】K-NearestNeighbors算法原理及流程【k近邻】K-NearestNeighbors算法距离度量选择与数据维度归一化【k近邻】K-NearestNeighbors算法k值的选择【k近邻】Kd树的构造与最近邻搜索算法【k近邻】Kd树构造与最近邻搜索示例k近邻算法（K-NearestNeighbors，简称KNN）是一种常用的监督学习算法，可以用于分类和回归问题。在OpenCV中
高通手机跑AI系列之——3D姿势估计伊利丹~怒风 Qualcomm 智能手机 AI编程 arm python 人工智能
目录环境准备手机软件算法Demo代码功能分析关键模块解析示例代码代码效果环境准备手机测试手机型号：RedmiK60Pro处理器：第二代骁龙8移动--8gen2运行内存：8.0GB，LPDDR5X-8400，67.0GB/s摄像头：前置16MP+后置50MP+8MP+2MPAI算力：NPU48TopsINT8&&GPU1536ALUx2x680MHz=2.089TFLOPS提示：任意手机均可以，性能
矩阵题解——螺旋矩阵 II【LeetCode】 chao_789 我的学习记录矩阵篇_刷题笔记算法 leetcode python 数据结构矩阵
59.螺旋矩阵II第一个算法：基于层数和偏移量的方法算法逻辑思路：初始化阶段：创建n×n的零矩阵，设置起始点(0,0)，计算需要循环的层数(n//2)，初始化计数器为1核心循环逻辑：通过偏移量控制每一层的边界外层循环：遍历每一层(offset从1到loop)内层四个循环：按顺时针方向填充当前层左→右：填充上边，范围[starty,n-offset)上→下：填充右边，范围[startx,n-offs
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe