蕉叉熵

用Keras实现一个DeepFM

本文仅提供一个思路，有问题欢迎指出，转载请注明，谢谢。

一、数据格式

在设计模型之间，首先要明确数据的格式应该是怎样的。我们假设现在要解决的问题是一个CTR预估问题，数据集是 (X,y) ，每一个样本都是高度稀疏的高维向量。假设我们有两种 field 的特征，连续型和离散型，连续型 field 一般不做处理沿用原值，离散型一般会做One-hot编码。离散型又能进一步分为单值型和多值型，单值型在Onehot后的稀疏向量中，只有一个特征为1，其余都是0，而多值型在Onehot后，有多于1个特征为1，其余是0。
下面给出一个两个样本的例子，其中shop_score是连续型field，gender是单值离散型field，interest是多值离散型field。可以看到shop_score的取值是实数，gender的取值是离散值，interest的取值是离散值序列。

label	shop_score	gender	interest
0	0.2	male	football, cooking
1	0.8	female	cooking

对各field进行Onehot后，可见单值离散field对应的独热向量只有一位取1，而多值离散field对应的独热向量有多于一位取1，表示该field可以同时取多个特征值。

label	shop_score	gender=m	gender=f	interest=f	interest=c
0	0.2	1	0	1	1
1	0.8	0	1	0	1

进一步，我们对每个field中的特征取值分别单独编码或联合编码，则确定了特征的index，这在libsvm和libffm数据格式中是需要的。

field	feature	encoding separate	encoding union
shop_score (1)		1	1
gender (2)	male	1	2
gender (2)	female	2	3
interest (3)	football	1	4
interest (3)	cooking	2	5

libsvm格式：

01 1 : 0.2 1 : 0.8 2 : 1 3 : 1 4 : 1 5 : 1 5 : 1

libffm格式：

01 1 : 1 : 0.2 1 : 1 : 0.8 2 : 2 : 1 2 : 3 : 1 3 : 4 : 1 3 : 5 : 1 3 : 5 : 1

可见，连续field和单值field对样本长度的贡献恒定为1，但多值离散型field可能会导致样本长度不一样。对不定长样本的处理方法自然是padding补零了，但我选择对每个多值field分别进行padding，原因有二。首先，若对样本整体进行padding，万一想要进行截断，可能会截掉某些连续field和单值field，分别padding则可以分别截断，而不影响其他的field。第二，对每个field的不同特征单独编码互不影响，不需要维护一个全局的字典，每次只需要处理一个field的特征，甚至可以实现并行处理以及节省内存的特征Encoding方案。
FM所需的数据格式正是libsvm格式，既需要数值本身（Value），也需要特征取值在字典中的index（ID）。假如我们采用对每个field的不同特征取值单独编码的方式，则可以实现一些简便性优化。首先，数值型field的ID永远是1，因此可以省略ID；第二，单值离散型field的Value永远是1，因此可以省略Value；第三，多值离散型field可以用padding+masking的方式省略ID。
给每个field分配ID和Value时，为了用0做padding，ID编码需要从1开始。如下所示，shop_score作为连续型特征，每个样本的ID和Value列表长度都是1，所有样本共用同一ID，而所有样本的Value保持原值；gender作为单值离散型field，每个样本的ID和Value列表长度都是1，ID是编码后的特征编号，由于是离散型，Value全是1；interest作为多值离散型field，ID和Value列表的长度应该取该field的最长长度，第一个样本的interestfield长度是2，因此两个样本的ID和Value列表长度都应padding补零到定长2，每个样本的ID列表是各特征取值的编码值，而Value在ID的非零位置上取1。

ID_shop_score = [[1], [1]] # 多余，可省略
Value_shop_score = [[0.2], [0.8]]

ID_gender = [[1], [2]]
Value_gender = [[1], [1]] # 多余，可省略

ID_interest = [[1,2], [2,0]]
Value_gender = [[1,1], [1,0]] # 多余，可省略

根据上面给出的规则，我对各种field提取ID和Value提供参考方法如下：

连续型field
- ID：np.ones()或舍弃
- Value : 沿用原 ndarray
单值离散型field
- ID：sklearn.preprocessing.LabelEncoder()
- Value: np.ones()或舍弃
多值离散型field
- ID：sklearn.preprocessing.LabelEncoder() + padding + 加一
- Value: np.ones() + padding 或舍弃

二、一个DeepFM需要哪些模块

在动手写代码之前，先要对模型结构做一个宏观地观察，看看具体要实现哪些模块。上图是DeepFM论文中给出的整体网络结构图，可见要实现一个DeepFM，实现两个部分即可：FM部分和DNN部分，FM又可以进一步分为一次项和二次项。
从根源上，DeepFM的各模块共享同一输入，输入是由各个field的Onehot编码横向拼接而成的高维稀疏向量。首先，原始输入的各个field经过加权（实际上是Embedding为1维）后，求和可得一次项；其次，原始输入的各个field（不同长度）的Embedding（等长， k 维latent vector），一方面两两内积，然后求和可得二次项，另一方面作为输入全连接到DNN。

三、Keras实现

FM部分

3.1 如何用Embedding实现 FM一次项 ∑wixi

\sum i w i x i = (\sum i \in N (w i x i)) + ⎛ ⎝ \sum i \in S C, x i j \neq 0 w i j ⎞ ⎠ + ⎛ ⎝ \sum i \in M C \sum x i j \neq 0 w i j ⎞ ⎠

画个图分析一下，如上所述，我们的输入数据有三种field，在One-hot处理后代入FM一次项的公式运算。每个field各有一个权值向量 w ，连续型field的 w 长度为1，离散型field的 w 长度为特征的取值个数。
首先，连续型field对一次项的贡献等于自身数值乘以权值 w ，可以用Dense(1)层实现，任意个连续型field输入到同一个Dense层即可，因此在数据处理时，可以先将所有连续型field拼成一个大矩阵，同时如上所述，ID可以省略。
其次，单值离散型field根据样本特征取值的index，从 w 中取出对应权值（标量），由于离散型特征值为1，故它对一次项的贡献即取出的权值本身。取出权值的过程称为 table-lookup，可以用Embedding(n,1)层实现（ n 为该field特征取值个数）。若将所有单值离散型field的特征值联合编码，则可使用同一个Embedding Table进行lookup，不需要对每个field单独声明Embedding层。因此在数据处理时，可以先将所有单值离散型field拼起来并联合编码，同时如上所述，Value可以省略，只关心lookup出来的权值 w 即可。
最后，多值离散型field可以同时取多个特征值，为了batch training，必须对样本进行补零padding。相似地可用Embedding层实现，Value并不是必要的，但Value可以作为mask来使用，当然也可以在Embedding中设置mask_zero=True。
如下图所示，假设我们有 m 个连续型field， n 个单值离散型field， q 个多值离散型field，每个多值离散型field的最长长度为 Li(i=1,2,⋯,q) 。

网络实现

MyMeanPool
其功能是对2d或3d的tensor，指定一个axis进行求均值。例如[100,5,6]的矩阵，指定axis=1求均值，会变成[100,6]大小的矩阵。

from keras import backend as K
from keras.engine.topology import Layer
import tensorflow as tf

class MyMeanPool(Layer):
    def __init__(self, axis, **kwargs):
        self.supports_masking = True
        self.axis = axis
        super(MyMeanPool, self).__init__(**kwargs)

    def compute_mask(self, input, input_mask=None):
        # need not to pass the mask to next layers
        return None

    def call(self, x, mask=None):
        if mask is not None:
            if K.ndim(x)!=K.ndim(mask):
                mask = K.repeat(mask, x.shape[-1])
                mask = tf.transpose(mask, [0,2,1])
            mask = K.cast(mask, K.floatx())
            x = x * mask
            return K.sum(x, axis=self.axis) / K.sum(mask, axis=self.axis)
        else:
            return K.mean(x, axis=self.axis)

    def compute_output_shape(self, input_shape):
        output_shape = []
        for i in range(len(input_shape)):
            if i!=self.axis:
                output_shape.append(input_shape[i])
        return tuple(output_shape)

Network Codes

# coding:utf-8
from keras.layers import *
from keras.models import Model
from MyMeanPooling import MyMeanPool
from keras.utils import plot_model

'''Input Layers'''
# numeric fields
in_score = Input(shape=[1], name="score") # None*1
in_sales = Input(shape=[1], name="sales") # None*1
# single value categorical fields
in_gender = Input(shape=[1], name="gender") # None*1
in_age = Input(shape=[1], name="age") # None*1
# multiple value categorical fields
in_interest = Input(shape=[3], name="interest") # None*3, 最长长度3
in_topic = Input(shape=[4], name="topic") # None*4, 最长长度4

'''First Order Embeddings'''
numeric = Concatenate()([in_score, in_sales]) # None*2
dense_numeric = Dense(1)(numeric) # None*1
emb_gender_1d = Reshape([1])(Embedding(3, 1)(in_gender)) # None*1, 性别取值3种
emb_age_1d = Reshape([1])(Embedding(10, 1)(in_age)) # None*1, 年龄取值10种
emb_interest_1d = Embedding(11, 1, mask_zero=True)(in_interest) # None*3*1
emb_interest_1d = MyMeanPool(axis=1)(emb_interest_1d) # None*1
emb_topic_1d = Embedding(22, 1, mask_zero=True)(in_topic) # None*4*1
emb_topic_1d = MyMeanPool(axis=1)(emb_topic_1d) # None*1

'''compute first order'''
y_first_order = Add()([dense_numeric,
                       emb_gender_1d, 
                       emb_age_1d,
                       emb_interest_1d,
                       emb_topic_1d]) # None*1

'''define model'''
model = Model(inputs=[in_score, in_sales,
                      in_gender, in_age,
                      in_interest, in_topic],
              outputs=[y_first_order])

'''plot model'''             
plot_model(model, 'model.png', show_shapes=True)

3.2 如何用Embedding实现FM二次项 ∑∑(vi⋅vj)⋅xixj

由于FM的二次项是不同特征之间的交叉（一般是不同field之间的交叉），不能分field实现，必须将每个field输入Embedding后拼接起来，再求二次项。
在写代码之前，我们化简一下FM的二次项，减少一点计算复杂度。可以化简也是FM的一个优点，像FFM就做不到了。

= = \sum d i = 1 \sum d j = i + 1 < v i, v j > x i x j \sum d i = 1 \sum d j = i + 1 \sum k f = 1 (v i, f x i) (v j, f x j) 1 2 \sum k f = 1 ((\sum d i = 1 v i, f x i) 2 - \sum d i = 1 (v i, f x i) 2)

假设 V 矩阵大小是 [max_feat, K]， X 矩阵大小是 [batch_size, max_len]，则先求Embedding VX ，大小为 [batch_size, F, K]（这里的F是所有field拼接后的最长长度）。求和项内部第一项 (∑di=1vi,fxi)2 ，即Embedding先在第1维求和变成[batch_size, K]，然后逐元素求平方（还是[batch_size, K]）；第二项 ∑di=1(vi,fxi)2 是Embedding先逐元素求平方（还是[batch_size, F, K]），再对第一维求和，变成[batch_size, K]。两项相减之后除以2，对第1维求和，变成[batch_size, 1]，即各样本二次项的值。
如图中所示，维度为1的连续型field要Embedding成 K 维，只需使用Dense(K)层即可。维度为1的单值离散型field则用Embedding(output_dim=K)层即可。维度为 Li 的多值离散型field做Embedding成 K 维，在Embedding(output_dim=K)之后，还要对axis=1做meanpooling，将Embedding平均。

网络实现

MySumLayer

from keras import backend as K
from keras.engine.topology import Layer
import tensorflow as tf

class MySumLayer(Layer):
    def __init__(self, axis, **kwargs):
        self.supports_masking = True
        self.axis = axis
        super(MySumLayer, self).__init__(**kwargs)

    def compute_mask(self, input, input_mask=None):
        # do not pass the mask to the next layers
        return None

    def call(self, x, mask=None):

        if mask is not None:
            # mask (batch, time)
            mask = K.cast(mask, K.floatx())
            if K.ndim(x)!=K.ndim(mask):
                mask = K.repeat(mask, x.shape[-1])
                mask = tf.transpose(mask, [0,2,1])
            x = x * mask
            if K.ndim(x)==2:
                x = K.expand_dims(x)
            return K.sum(x, axis=self.axis)
        else:
            if K.ndim(x)==2:
                x = K.expand_dims(x)
            return K.sum(x, axis=self.axis)

    def compute_output_shape(self, input_shape):
        output_shape = []
        for i in range(len(input_shape)):
            if i!=self.axis:
                output_shape.append(input_shape[i])
        if len(output_shape)==1:
            output_shape.append(1)
        return tuple(output_shape)

Network Codes

# coding:utf-8
from keras.layers import *
from keras.models import Model
from MyMeanPooling import MyMeanPool
from MySumLayer import MySumLayer
from keras.utils import plot_model

'''Input Layers'''
# numeric fields
in_score = Input(shape=[1], name="score") # None*1
in_sales = Input(shape=[1], name="sales") # None*1
# single value categorical fields
in_gender = Input(shape=[1], name="gender") # None*1
in_age = Input(shape=[1], name="age") # None*1
# multiple value categorical fields
in_interest = Input(shape=[3], name="interest") # None*3, 最长长度3
in_topic = Input(shape=[4], name="topic") # None*4, 最长长度4

latent = 8
'''Second Order Embeddings'''
emb_score_Kd = RepeatVector(1)(Dense(latent)(in_score)) # None * 1 * K
emb_sales_Kd = RepeatVector(1)(Dense(latent)(in_sales)) # None * 1 * K
emb_gender_Kd = Embedding(3, latent)(in_gender)
emb_age_Kd = Embedding(10, latent)(in_age)
emb_interest_Kd = Embedding(11, latent, mask_zero=True)(in_interest) # None * 3 * K
emb_interest_Kd = RepeatVector(1)(MyMeanPool(axis=1)(emb_interest_Kd)) # None * 1 * K
emb_topic_Kd = Embedding(22, latent, mask_zero=True)(in_topic) # None * 4 * K
emb_topic_Kd = RepeatVector(1)(MyMeanPool(axis=1)(emb_topic_Kd)) # None * 1 * K

emb = Concatenate(axis=1)([emb_score_Kd,
                           emb_sales_Kd,
                           emb_gender_Kd,
                           emb_age_Kd,
                           emb_interest_Kd,
                           emb_topic_Kd]) # None * 9 * K

'''compute'''
summed_features_emb = MySumLayer(axis=1)(emb) # None * K
summed_features_emb_square = Multiply()([summed_features_emb,summed_features_emb]) # None * K

squared_features_emb = Multiply()([emb, emb]) # None * 6 * K
squared_sum_features_emb = MySumLayer(axis=1)(squared_features_emb) # Non * K

sub = Subtract()([summed_features_emb_square, squared_sum_features_emb]) # None * K
sub = Lambda(lambda x:x*0.5)(sub) # None * K

y_second_order = MySumLayer(axis=1)(sub) # None,

model = Model(inputs=[in_score, in_sales,
                      in_gender, in_age,
                      in_interest, in_topic],
              outputs=[y_second_order])

plot_model(model, 'model.png', show_shapes=True)

3.3 如何实现一个DNN

DNN从FM二次项倒数第二步生成的 None*F*K Embedding 张量开始，先用Flatten层平铺，然后经过若干层神经网络，每一层后面可以加上dropout防止过拟合和BatchNormalization加速收敛。

实现

MyFlatten
原始的Keras.layers.Flatten不支持masking，可参考我的另一篇博客。

from keras import backend as K
from keras.engine.topology import Layer
import tensorflow as tf
import numpy as np

class MyFlatten(Layer):
    def __init__(self, **kwargs):
        self.supports_masking = True
        super(MyFlatten, self).__init__(**kwargs)

    def compute_mask(self, inputs, mask=None):
        if mask==None:
            return mask
        return K.batch_flatten(mask)

    def call(self, inputs, mask=None):
        return K.batch_flatten(inputs)

    def compute_output_shape(self, input_shape):
        return (input_shape[0], np.prod(input_shape[1:]))

Network Codes

...

'''deep parts'''
y_deep = MyFlatten()(emb) # None*(6*K)
y_deep = Dropout(0.5)(Dense(128, activation='relu')(y_deep))
y_deep = Dropout(0.5)(Dense(64, activation='relu')(y_deep))
y_deep = Dropout(0.5)(Dense(32, activation='relu')(y_deep))
y_deep = Dropout(0.5)(Dense(1, activation='relu')(y_deep))

model = Model(inputs=[in_score, in_sales,
                      in_gender, in_age,
                      in_interest, in_topic],
              outputs=[y_deep])

plot_model(model, 'model.png', show_shapes=True)

3.4 完整的DeepFM

实现


...

'''deepFM'''
y = Concatenate(axis=1)([y_first_order, y_second_order,y_deep])
y = Dense(1, activation='sigmoid')(y)

model = Model(inputs=[in_score, in_sales,
                      in_gender, in_age,
                      in_interest, in_topic],
              outputs=[y])

plot_model(model, 'model.png', show_shapes=True)

DeepFM的各个部分分别实现好之后，剩下的就简单多了。
完整的代码我放在了https://github.com/SongDark/DeepFM_keras.

总结与说明

本文介绍了如何用Keras实现一个DeepFM，写完这部分代码花了我不少时间，网络并不复杂，但我一开始把问题复杂化了，写完之后发现有部分结构是多余的，又回炉重写。此外，有一些骚操作Keras不支持，例如支持masking的求和与求均值，这些都要自己重新实现，好在Keras自定义层比较简单。
这个版本的代码只是提供一种思路，它肯定不是最优的，还可以继续优化。它最大的缺点就是对每一个field都要定义对应的Input层和Embedding层，假如有100个field，代码看起来会非常冗长，很糟糕。
代码完成后我的收获有以下几点，首先，即使论文看起来很简单，但实现起来却有很多坑，有些坑你不亲自跳进去是发现不了的。第二，要善于查API，Keras只是一个框架而已，本质上和tensorflow、pytorch一样都是攻击，它还有很大的自由发展的空间。第三，要善于化简，比如离散型field对目标的贡献就是权值本身，二次项的计算可以化简等等。第四，要常做总结和记录，比如这篇博客事实上就属于实验记录的性质。第五，画图帮助理解。
最后，我感觉DeepFM虽然有深度部分，但它仍然偏向于处理离散型特征，因为我在尝试加入归一化后的连续型特征后，模型效果变差了。

本文仅提供一个思路，有问题欢迎指出，转载请注明，谢谢。

参考资料

【论文】DeepFM: A Factorization-Machine based Neural Network for CTR Prediction
【代码】LB:0.08425 Bonne chance 系列之 NN embeding（Keras实现的部分PNN）
【API】Keras中文文档
【博客】在Keras模型中使用预训练的词向量
【博客】TensorFlow Estimator of Deep CTR-DeepFM/NFM/AFM/FNN/PNN 知乎
【问题】Mean or max pooling with masking support in Keras
【博客】因子分解机（libffm+xlearn）
【博客】深入FFM原理与实践(美团)
【API】Keras序列预处理
【github】陈成龙 DeepFM（基于tensorflow）
【github】CTR中的DNN
【github】TensorFlow Estimator of Deep CTR

一招解决!环境排放3.0项目光伏市场不能提现提现,,男子步步沦陷被骗数十万昌龙律法
很多人想要通过股票赚钱，但是由于缺乏知识和经验，就会寻求一些股票群的帮助。然而，不是所有的股票群都是真诚的，有些股票群可能是骗局，目的是为了从投资者身上骗取钱财或者利用投资者进行操纵。数字经济数字体育数字农业慈善投票大赛骗局揭晓近日，刘先生在家刷到了一个炒股视频称扫二维码进微信群可以免费教授炒股，信以为真的史先生便加入了群聊，不料进群后刚聊了几句关于炒股的内容，史先生就被人举报了，随后群主便解散了
微信二维码扫描登录流程详解黑塞123 QT 二维码登录流程
二维码扫描登录流程细节（项目经验）1：获取二维码信息PC会优先存放服务器生成的唯一密钥：比如source、secret以密文形式存储大致发送字段：sourcesecretmac(mac地址)服务器生成二维码信息：二维码字符、二维码过期时间、二维码状态。并将mac与二维码信息绑定后2：获取二维码状态、校验二维码是否过期客户端解析二维码信息生成二维码开启定时器1:轮询检测二维码过期时间（二维码过期暂停
基于YOLOv8的Web端交互式目标检测系统设计与实现 YOLO实战营 YOLO 前端目标检测人工智能 ui 目标跟踪计算机视觉
1.引言目标检测是计算机视觉领域的一项重要任务，它在安防监控、自动驾驶、医疗影像分析等领域有着广泛的应用。近年来，随着深度学习技术的快速发展，YOLO(YouOnlyLookOnce)系列算法因其出色的速度和精度平衡而备受关注。本文将详细介绍如何基于最新的YOLOv8模型构建一个Web端交互式目标检测系统，包含完整的UI界面设计和数据集处理流程。本系统将实现以下功能：基于YOLOv8的高效目标检测
基于卷积神经网络与小波变换的医学图像超分辨率算法复现神经网络15044 python 算法 cnn 算法人工智能图像处理开发语言神经网络深度学习
基于卷积神经网络与小波变换的医学图像超分辨率算法复现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家，觉得好请收藏。点击跳转到网站。1.引言医学图像超分辨率技术在临床诊断和治疗规划中具有重要意义。高分辨率的医学图像能够提供更丰富的细节信息，帮助医生做出更准确的诊断。近年来，深度学习技术在图像超分辨率领域取得了显著进展。本文将复现一种结合卷积神经网络(CNN)、小波变
2024年普通人怎么拿香港身份？diy优才获批经验分享优才DIY申请
2024年普通人怎么拿香港身份？diy优才获批经验分享最近特别多人来问香港身份，可能都想趁着24年最后一波窗口期赶紧上岸吧申请得早，获批概率大，我是这样认为的，因为我就是在优才开放名额的时候就准备申请了，自己没有办法快速搞定，就半diy，也非常nice~如果你也想半diy申请香港身份，资料包⬇️申请+续签资料免费送，需要的可以找我免费领优才diy全套模板包~（文末查看资料包内容）~不要但最近跟好几
Oracle 数据泵导出表部分列的实现方案：从 12c 新特性到低版本兼容 zone-- oracle 数据库
在Oracle数据库日常运维中，经常会遇到“只导出表中部分列”的需求——例如某张表包含数十个字段，但业务仅需迁移其中3-5个核心字段的数据。传统的导出工具（如exp或expdp）虽能通过QUERY参数过滤行记录，却无法实现列的筛选。本文基于实践经验，详解不同Oracle版本下导出表部分列的解决方案，包括12c及以上版本的便捷方法和11g及以下版本的兼容方案。12c及以上版本：利用VIEWS_AS_
深度学习系列-----＞环境搭建（Ubuntu）二师兄用飘柔深度学习历程深度学习 ubuntu 人工智能 pytorch python
1、前言电脑基础系统硬件情况：系统：ubuntu18.04、显卡：GTX1050Ti；后续的环境搭建都在此基础上进行。此次学习选择Pytorch作为深度学习的框架，选择的原因主要由于PyTorch在研究领域特别受欢迎，较多的论文框架也是基于其开发。2、anaconda+python3安装测试在学习深度学习的过程中会涉及到使用不同版本python包的问题，而anaconda可以便捷获取包且对包能够进
深度学习-常用环境配置瑶山 AI linux 人工智能 windows CUDA PyTorch
目录Miniconda安装安装NVIDIA显卡驱动安装CUDA和cnDNNCUDAcuDNNPyTorch安装手动下载测试Miniconda安装最新版Miniconda搭建Python环境_miniconda创建python虚拟环境-CSDN博客安装NVIDIA显卡驱动直接进NVIDIA官网：NVIDIAGeForce驱动程序-N卡驱动|NVIDIA在这里有GeForce驱动程序，立即下载，这是下
机器学习初学者理论初解 Mikhail_G 机器学习人工智能
大家好!为什么手机相册能自动识别人脸？为什么购物网站总能推荐你喜欢的商品？这些“智能”背后，都藏着一位隐形高手——机器学习（MachineLearning）。一、什么是机器学习？简单说，机器学习是教计算机从数据中自己找规律的技术。就像教孩子认猫：不是直接告诉他“猫有尖耳朵和胡须”，而是给他看100张猫狗照片，让他自己总结出猫的特征。传统程序vs机器学习传统程序：输入规则+数据→输出结果（例：按“温
Embedding与向量数据库玖月初玖大模型应用开发基础人工智能 embedding 数据库
1.Embedding是什么EmbeddingModel是一种机器学习模型，它的核心任务是将离散的、高维的符号（如单词、句子、图片、用户、商品等）转换成连续的、低维的向量（称为“嵌入”或“向量表示”），并且这个向量能有效地捕捉原始符号的语义、关系或特征。1.1通俗理解EmbeddingModel是让计算机“理解”世界的核心工具，把“文字、图片、音频”等信息变成一串有意义的数字我们称之为“向量”。类
【提示词优化技巧】利用大模型进行提示词自优化 weixin_37763484 大模型人工智能
看到一篇帖子，里面记录了如下的提示词优化技术，我使用ai进行了解读。整体来看，这个方法非常合理，能减少人工干预，值得试一试。原始方法如下：1.主题：构建高效Prompt的系统化流程：一种元提示工程方法在与大型语言模型（LLM）的交互中，提示词（Prompt）的质量直接决定了输出的上限。传统的Prompt撰写高度依赖工程师的经验和直觉，缺乏一套系统化的构建与优化流程，导致效率瓶颈和质量波动。本文提出
【华为419机考真题】服务器能耗统计，JAVA 题解梦想橡皮擦华为服务器 java 华为OD机试华为OD
最近更新的博客华为od2023|什么是华为od，od薪资待遇，od机试题清单华为OD机试真题大全，用Python解华为机试题|机试宝典【华为OD机试】全流程解析+经验分享,题型分享,防作弊指南华为od机试，独家整理已参加机试人员的实战技巧本篇题解：服务器耗能题目描述服务器有三种运行状态：空载，单任务，多任务，每个时间片的能耗的分别为111、333、444，每个任务由起始时间片和结束时间片定义运行时
《我不惧怕成为这样“强硬”的姑娘》读书笔记05 幺拐妖怪
在大学那些年因为我考取的并不是什么名牌大学，所以我一直羡慕着那些考上名牌大学的学霸们。作者刘媛媛与北大的那些年让我意识到：学霸之所以是学霸，是因为他们都在抓住飞逝的光阴，为着出厂的一刻做准备，努力变成一盒优质的牛奶。反观我的大学四年，好像都沉浸在社团活动里面，对学业并不怎么上心，而且也没怎么多多跟专业的老师们沟通交流，获取学习经验和心得。在大学里面，我也看到过许多不同的人，有些人在学校里面就肆意开
财富进化之路，永无止境 2020.03.20 超有才华第322次百字悟超有才华
猫叔五堂课的最后一次分享，是讲自己的成长历程的谈心。1、多输出《大话西游》唐僧台词很有趣：你想要啊？悟空，你要是想要的话你就说话嘛，虽然你很有诚意地看着我，你不说我怎么知道你想要呢。输出有价值的内容，让别人快速理解并践行才有用。2、多输入米瑟大大讲过：我们无法给别人，我们自己没有的东西。定位冠军战略教练，需要具备多元思维模型和素材，胸无点墨，画不出波澜壮阔。3、卖经验什么成就了你，你用来成就别人，
感觉就是创造安利女神谌宝连
当你的感觉和愿望产生冲突时，感觉将会是胜利者。你每次通过感觉、言语或行动付出爱时，就替你周围的场域增添了更多爱，你给的爱越多，你的磁场就越强大，你的磁场里面有什么就会吸引什么。通过思考和感受的能力，你掌控了一切事物。你的感觉就是你的神，每天花七分钟去想象并感觉自己已经拥有想要的事物，无论在什么样的情况下，我都要保持喜悦与快乐，因为我从经验中学到我们的快乐或痛苦。很大一部分是取决于我们的性情，而不是
2023年第10期(NeuroImage)：DomainATM：多中心医学图像数据标准化工具箱影浮科技ImageFlow
基本信息1.标题：DomainATM:Domainadaptationtoolboxformedicaldataanalysis.2.期刊：NeuroImage3.IF/JCR/分区：7.4/Q1/中科院一区4.DOI：10.1016/j.neuroimage.2023.119863目录1、导读2、背景动机3、研究目的4、工具箱介绍5、测试试验6、局限不足1导读域适应（DA）是基于机器学习的现代医
2021-08-26 项城069吴喜红
班主任经验培训心得——四个时间花2021年8月26日，我校举行全员班主任素质提升培训，一个半小时的培训干货满满，我收获很多。从徐银鸽校长关于“用心绽放四个时间花”的班级管理经验分享中，我感到自己在班主任工作道路上还在蹒跚学步阶段，要想取得更好的职业幸福感努力提高自己势在必行。这次的学习，印象最深的是徐校长对班级管理中的阶段划分，四个阶段，开学第一天、开学第一周、开学第一月，而后365天......
老板让我介绍一下公司发财北小程序产品运营内容运营矩阵大数据
11年深耕，从源头定义系统开发的“放心之选”在数字经济加速奔跑的今天，一套稳定、高效、贴合业务的系统，早已成为企业破局增长的“核心引擎”。而选择什么样的开发伙伴，直接决定了这套引擎的“动力上限”。我们，一家拥有11年系统开发经验的源头开发商，始终坚信：真正的技术服务，不仅要“能做”，更要“做好”“做透”。全场景覆盖，从需求到落地无缝衔接11年的行业浸润，让我们深谙不同企业的数字化痛点。无论是想抢占
在NLP深层语义分析中，深度学习和机器学习的区别与联系
在自然语言处理（NLP）的深层语义分析任务中，深度学习与机器学习的区别和联系主要体现在以下方面：一、核心区别特征提取方式机器学习：依赖人工设计特征（如词频、句法规则、TF-IDF等），需要领域专家对文本进行结构化处理。例如，传统情感分析需人工定义“情感词库”或通过词性标注提取关键成分。深度学习：通过神经网络自动学习多层次特征。例如，BERT等模型可从原始文本中捕获词向量、句法关系甚至篇章级语义，无
20220812成就感日志225/365 kidII
奋斗是人生的底色，你会经历很多人事物，学会更多的东西。从学习上掌握技能，从学习上享受生活，即便是辛苦也没有关系，生活没有不辛苦的，但是要辛苦的有意义。与其说平凡的过一辈子，不如吃苦耐劳，选择自己喜欢的生活，一点点的付出，积累很多的经验，未来才会有希望。虽然我们渴望成就感，但也需要平衡生活，让自己越来越幸福。1.【日思】：今日最重要的一件事情。调整（训练3h，4k+2h信息1+1.5h信息2+自私的
在网上怎么做兼职，整理六个正规兼职副业让你轻松赚钱氧惠佣金真的高
很多人应该都或多或少的接触过网络兼职吧?网上的兼职种类很多，有真有假，一般有经验的人都知道哪些靠谱哪些不靠谱。怎么获得鉴别兼职真假的经验和技能呢?这就需要我们多尝试和试错了。只有经历的多才能有自己的一个操作体系，以后不论做什么都比较容易。下面推荐几个不错的兼职平台分享给大家。1，亚马逊。亚马逊最大的一个好处，不像国内的某宝，拼夕夕之类的，上个新产品，如果没有推广，没有销量，很少有人能搜到你的产品，
致自己的几句话 sundy007
图片发自App1.昨天的成功对今天的你来说，如果还是大事，说明你今天什么大事都没做！2.如果现在的你和一年前的你一样，意味着你没有成长。即使成绩依旧表现不错，让客户着迷，那依然是吃老本的行为！3.一个人最难做的是否定自己，尤其是自己过去成功的经验，如果不否定，总重复过去的套路，就没有了学习进步的空间！4.这个世界有偶然的运气，也有必然的运气。人应该追求必然的运气，通过努力踏踏实实的达到某个状态，某
深度学习--利用梯度下降法进行多变量的二分类（感知机）白话学生nit 深度学习分类人工智能
其实这一节涉及到了感知机的相关知识，就把这一节当作是学习感知机的引子吧。什么是二分类我们先来说一下什么是二分类，二分类指的是将结果分为两个互斥的类别，通常用来表示问题的两种可能。为什么用感知机学习二分类常见的解决问题的模型有很多，这里我们使用感知机模型。至于为什么，因为感知机模型很多地方用起来比较简便，就拿我们这一节的问题举一下例子，我们需要依照房子的价格对房子进行分类。在感知机模型中，我们可以使
迁移学习：知识复用的智能迁移引擎 | 从理论到实践的跨域赋能范式大千AI助手人工智能 Python #OTHER 迁移学习人工智能机器学习算法神经网络大模型迁移
让AI像人类一样“举一反三”的通用学习框架本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、核心定义与基本概念迁移学习（TransferLearning）是一种机器学习范式，其核心思想是：将源领域（SourceDomain）学到的知识迁移到目标领域（TargetDomain），以提升目标任务的性能
如何用 Python 绕过 cloudflare（5秒盾）抓取数据：也不是很难嘛！炒青椒不放辣 Web爬虫进阶实战 python cloudflare 爬虫 5秒盾逆向
大家好！我是爱摸鱼的小鸿，关注我，收看每期的编程干货。逆向是爬虫工程师进阶必备技能，当我们遇到一个问题时可能会有多种解决途径，而如何做出最高效的抉择又需要经验的积累。本期文章将以实战的方式，带你全面了解cloudflare（5秒盾）以及如何绕过使用cloudflare服务的网站从而抓取数据特别声明：本篇文章仅供学习与研究使用，不用做任何非法用途，相关URL和API等均已做脱敏处理，若有侵权请联系作
Web3.0 能为你带来哪些实质性的改变与突破战族狼魂 Web3专栏 web3
如今各种大厂裁员消息层出不穷，今年又添飞书、剪映、微软、思科...这有一张网友整理的去年互联网大厂裁员裁员信息表：目前国内很多大厂都在裁员，非常现实、且越来越多35+技术人，正在面临这样的问题，那么Web3.0确实为35岁以上的程序员提供了新的出路，但不是“包赚不赔的风口”，而是一次结构性的技能重塑机会。它的技术迭代周期更长、更加去中心化与开放，对“经验型程序员”来说，是个有门槛但值得投入的方向。
结合自身，制定一套明确的 Web3 学习路线和技术栈建议战族狼魂 Web3专栏 web3 学习
目录✅一、结合自身，明确方向和目的✅二、技术路线和建议技术路线图（按阶段划分）第一阶段：巩固Web3基础（1-2周）第二阶段：NFT平台开发实战（4-6周）第三阶段：钱包整合与增强功能（2-4周）第四阶段：部署&打磨作品（2-3周）✅技术栈建议求职建议（Web3方向）招聘关键词（建议你在招聘网站用这些关键词搜索）：项目展示建议：Bonus：后续可拓展方向（你有后端经验）✅三、参考具体规划✅一、结合
聊天主播适合哪个平台，谈谈我的经验糖葫芦不甜
选择合适的平台对于聊天主播而言至关重要，它不仅关乎内容的传播效果，还直接影响到粉丝积累与收入增长。5星公会，免费加入，一对一指导扶持↓微信在文章底部。抖音和快手作为短视频领域的巨头，近年来在直播领域也持续发力。这两个平台拥有庞大的用户基数和高度活跃的社区氛围，为聊天主播提供了广阔的舞台。虽然斗鱼和虎牙以游戏直播起家，但它们在泛娱乐直播领域也占据了重要地位。这两个平台在游戏玩家中具有极高的知名度，同
AI原生应用中的用户画像构建：从理论到实践全解析
AI原生应用中的用户画像构建：从理论到实践全解析关键词：用户画像、AI原生应用、特征工程、机器学习、个性化推荐、数据隐私、模型优化摘要：本文全面解析AI原生应用中用户画像构建的全过程，从基础概念到核心技术，再到实际应用和未来趋势。我们将用通俗易懂的方式讲解用户画像如何像"数字身份证"一样工作，深入探讨特征提取、模型构建等关键技术，并通过实际案例展示用户画像在推荐系统、精准营销等场景中的应用。文章还
破局黄勇在路上
image.png三十多岁了，一般人是路越走越宽，有的人都是所在行业的中坚力量了。而尴尬的是，我越来越觉得我的路却是越走越窄，感觉快要走进死胡同的尽头了。人无远虑，必有近忧，快撞南墙了，最近不得不思考自己的窘境和出路，就算骗自己也要相信：“一切都还来得及。”所以，最近的文章主要都是在总结自己的过往，并结合最近学习李笑来老师，吴军老师，陈海贤老师等的得到专栏以及书籍文章，谈谈自己的成长得失，总结经验
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

用Keras实现一个DeepFM

用Keras实现一个DeepFM

一、数据格式

二、一个DeepFM需要哪些模块

三、Keras实现

FM部分

3.1 如何用Embedding实现 FM一次项 ∑wixi ∑ w i x i

网络实现

3.2 如何用Embedding实现FM二次项 ∑∑(vi⋅vj)⋅xixj ∑ ∑ ( v i ⋅ v j ) ⋅ x i x j

网络实现

3.3 如何实现一个DNN

实现

3.4 完整的DeepFM

实现

总结与说明

参考资料

你可能感兴趣的:(机器学习,深度学习,竞赛经验)

3.1 如何用Embedding实现 FM一次项 ∑wixi

3.2 如何用Embedding实现FM二次项 ∑∑(vi⋅vj)⋅xixj