凝眸伏笔

【DNN】DeepFM原理及源码

1、总结

三句话看透DeepFM，论文链接，发表于2017年。

Wide&Deep中Wide侧还需要人工构造特征交叉，而DeepFM在Wide侧用一个FM模型替换了LR，能够自动学习到所有二次交叉项的系数。

关键在于Deep侧与Wide侧共享一个embedding矩阵来映射categorical/id特征到稠密向量
Deep侧将embedding结果喂入DNN，来学习深层交互的权重，着重“扩展”
Wide侧将embedding结果喂入FM，来学习二次交互的权重，着重“记忆”

2.DeepFM模型：

先来看一下DeepFM的模型结构：

DeepFM包含两部分：神经网络部分与因子分解机部分，分别负责低阶特征的提取和高阶特征的提取。这两部分共享同样的输入。DeepFM的预测结果可以写为：

FM部分

模型结构：

FM部分是一个因子分解机。关于因子分解机可以参阅文章[Rendle, 2010] Steffen Rendle. Factorization machines. In ICDM, 2010.。因为引入了隐变量的原因，对于几乎不出现或者很少出现的隐变量，FM也可以很好的学习。

Deep部分

深度部分是一个前馈神经网络。与图像或者语音这类输入不同，图像语音的输入一般是连续而且密集的，然而用于CTR的输入一般是及其稀疏的。因此需要重新设计网络结构。具体实现中为，在第一层隐含层之前，引入一个嵌入层来完成将输入向量压缩到低维稠密向量。

嵌入层(embedding layer)的结构如上图所示。当前网络结构有两个有趣的特性，1）尽管不同field的输入长度不同，但是embedding之后向量的长度均为K。2)在FM里得到的隐变量Vik现在作为了嵌入层网络的权重。

这里的第二点如何理解呢，假设我们的k=5，首先，对于输入的一条记录，同一个field 只有一个位置是1，那么在由输入得到dense vector的过程中，输入层只有一个神经元起作用，得到的dense vector其实就是输入层到embedding层该神经元相连的五条线的权重，即vi1，vi2，vi3，vi4，vi5。这五个值组合起来就是我们在FM中所提到的Vi。在FM部分和DNN部分，这一块是共享权重的，对同一个特征来说，得到的Vi是相同的。

标签：

点击的label为1，其他为0。预测的结果，也即是网络的输出为用户点击的概率，也就是标签为1的概率。

损失函数：

logloss，文中没有写出来logloss的公式，在实验阶段，对比的时候，有不同算法之间losloss的对比。

3代码阅读注释：

搜索了一下，看着chenglongchen大佬的代码比较受欢迎，哈哈，围观下。

FM部分

FM 一阶部分：我们知道FM中有wx一项，这里是一阶特征，下面是计算wx的结果。

def first_order_part(self, sparse_id, sparse_value):
     with tf.variable_scope("first-order"):
         W    = tf.get_variable("weight",(self.feature_size, 1), \
                  initializer=tf.random_normal_initializer(0.0, 0.01))
         y_first_order = tf.nn.embedding_lookup(W, sparse_id) # None * F * 1
         y_first_order = tf.reduce_sum(tf.multiply(y_first_order, \
                               sparse_value), 1)  # None * 1
         return y_first_order

FM二阶部分：可以看作两项，第一部分就是“和平方”，第二部分就是“平方和”。代码就是公式的直译。

那我们先看看公式：

def second_order_part(self, sparse_id, sparse_value):
    with tf.variable_scope("second-order"):
        V = tf.get_variable("weight",(self.feature_size, self.factor_size),
                initializer=tf.random_normal_initializer(0.0, 0.01))
        self.embeddings = tf.nn.embedding_lookup(V, sparse_id)
        # None * F * K
        self.embeddings = tf.multiply(self.embeddings, sparse_value) 

        # 平方和：None * K
        sum_squared_part = tf.square(tf.reduce_sum(self.embeddings, 1)) 
        # 和平方：None * K
        squared_sum_part = tf.reduce_sum(tf.square(self.embeddings), 1) 

        y_second_order = 0.5 * tf.subtract(sum_squared_part, \
                                    squared_sum_part)
        return y_second_order

Deep 部分：

def deep_part(self):
    with tf.variable_scope("deep-part"):
        y_deep = tf.reshape(self.embeddings, shape=[-1, \
                        self.field_size * self.factor_size]) # None * (F*K)
        for i in range(0, len(self.deep_layers)):
            y_deep = tf.contrib.layers.fully_connected(y_deep, \ 
                         self.deep_layers[i], activation_fn= \
                         self.deep_layers_activation, scope = 'fc%d' % i)
        return y_deep

Deep + FM

def forward(self, sparse_id, sparse_value):
    sparse_value   = tf.expand_dims(sparse_value, -1)

    y_first_order  = self.first_order_part(sparse_id, sparse_value)
    y_second_order = self.second_order_part(sparse_id, sparse_value)
    y_deep         = self.deep_part()

    with tf.variable_scope("deep-fm"):
        deep_out    = tf.concat([y_first_order, y_second_order, y_deep], axis=1)
        deep_out    = tf.contrib.layers.fully_connected(deep_out, 1, \
            activation_fn=tf.nn.sigmoid, scope = 'deepfm_out')

        return tf.reduce_sum(deep_out, axis=1)

4.其他

参数：

(1)dropout: 0.5;

(2) network structure: 400-400-400;

(3) optimizer: Adam;

(4) activation function: tanh for IPNN, relu for other deep models.

To be fair, our proposed DeepFM uses the same setting. The optimizers of LR and FM are FTRL and Adam respectively, and the latent dimension of FM is 10.

DeepFM与其它算法的比较

通过第一节，大家了解到推荐其实是特征利用的一种博弈。现在就通过特征利用程度介绍下DeepFM与其它算法的区别：

逻辑回归(LR)：更多考虑线性特征，缺少特征交叉性和高阶特征

DNN：考虑了高阶特征，缺少了对于低阶特征的考虑

CNN：考虑近邻特征的关系。较单一，适合图片分类

RNN：考虑更多的是数据时序性，较单一

FM：考虑更多低阶特征，缺少高阶特征

Wide&Deep：同时考虑了低阶特征和高阶特征，但是低阶特征需要手动交叉生成，对用户不友好

DeepFM：兼顾了低阶和高阶特征，且计算过程中不需要用户干预；

优点：

1.DeepFM将Wide&Deep的Wide部分的LR换成了FM,能更好地更新V_i,V_j(无需二者同时出现再一个record中再更新参数);
2.DeepFM无需人为的构建专家特征,能同时学习低阶和高阶的特征,达到的效果也是当时最好的;和一些早期的其他算法比较,无需任何初始化;

缺点：

2.DeepFM对于特征的交叉处理是否可以细化，过多的组合会带来很多不必要的冗余；

其他点：

Wide & Deep模型已经为模型带来了非常大的提升，同时也考虑了模型的低阶的交叉和高阶的交叉,从全局看上去已经做得非常好了，但是一旦使用Deep的方式我们就需要考虑到下面几个问题：

我们的Embedding是否学习的好（做过nlp的朋友都有这样的体验，使用预训练的embedding一般都会有帮助),所以embedding的学习是非常重要的;
因为全局上看,基本框架已经很不错了，那么细节的处理能否更加完善呢，比如Wide的左侧可以认为是人为的专家组合之后加入LR的模式,能否融入其他的形式,例如我们之前用的FM,FFM；
能否使我们的模型更加自动化,如何实现端到端的学习预测也是经常会考虑的。

参考：

0.论文链接：https://arxiv.org/pdf/1703.04247.pdf

1.原理及实现：https://www.cnblogs.com/wkang/p/9881921.html

2.原理及实现：https://www.jianshu.com/p/6f1c2643d31b

3.滴滴同学的讲解含代码：https://www.infoq.cn/article/0vXxt3_WwTHyNOo7Lrca

4.chenglongchen大佬代码github：https://github.com/ChenglongChen/tensorflow-DeepFM/blob/master/DeepFM.py

5.分层次代码：https://zhuanlan.zhihu.com/p/32563337

你可能感兴趣的:(DNN)

京东宣布加薪：两年时间实现20薪；苹果AI使iPhone16全系8GB内存；AI教母李飞飞从英伟达等融资2.3亿美元| 极客头条极客日报人工智能
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN（ID：CSDNnews）一分钟速览新闻点！京东集团宣布再次启动加薪：将用两年时间实现20薪美团Apple授权专营店将开始iPhone16系列预售小米回应摄像头被曝有陌生人说话：取回设备进行检测，目前设备状态一切正常Unity宣布全面取消向游戏开发商
深度神经网络详解：原理、架构与应用阿达C 活动 dnn 计算机网络人工智能神经网络机器学习深度学习
深度神经网络（DeepNeuralNetwork，DNN）是机器学习领域中最为重要和广泛应用的技术之一。它模仿人脑神经元的结构，通过多层神经元的连接和训练，能够处理复杂的非线性问题。在图像识别、自然语言处理、语音识别等领域，深度神经网络展示了强大的性能。本文将深入解析深度神经网络的基本原理、常见架构及其实际应用。一、深度神经网络的基本原理1.1神经元和感知器神经元是深度神经网络的基本组成单元。一个
Ubuntu 开机出现 recovering journal 无法进入图形界面解决流程(不通用，自用) Artintel 学习 ubuntu
远程连接进入命令行：rm-rf/etc/X11/xorg.confcp/etc/X11/xorg.conf.failsafe/etc/X11/xorg.confsudoservicelightdmstopsudoapt-getremovenvidia*cdjohn/qudong+cuda9.0\+\cudnn/sudochmoda+xnv.runsudo./nv.run-no-x-check-no
Yolo-v3利用GPU训练make时发生错误：/usr/bin/ld: cannot find -lcuda 徐小妞66666
一.利用GPU训练Yolov3时，首先要修改MakeFile文件，修改格式如下：GPU=1(原来为0)CUDNN=1(原来为0)NVCC=/usr/local/cuda/bin/nvcc(新建,注意自己本机的地址)二.此时make产生错误/usr/bin/ld:cannotfind-lcuda1.查看MakeFile文件找到该行代码：LDFLAGS+=-L/usr/local/cuda/lib64
vue3项目中使用 vue-i18n国际化插件，实现多语言效果回忆哆啦没有A梦第三方库使用的问题 vue相关问题（vue3 vue2）第三方应用jsdk使用问题 vue.js 前端 javascript
**i18来源：**国际化的英文单词internationalization太长了，掐头去尾取首字母i和尾字母n，中间刚好还有18个字母，就缩写为了i18n。安装直接下载/CDNnpm/yarn安装npminstallvue-i18n//oryarnaddvue-i18n基本使用创建语言包在项目中创建一个locales目录，用于存放不同语言版本的翻译文件。例如，可以在locales目录下创建en.
【环境搭建：onnx模型部署】onnxruntime-gpu安装与测试（python）(1) 2401_83703835 程序员 python 深度学习 pytorch
cuda==10.2cudnn==8.0.3onnxruntime-gpu==1.5.0or1.6.0pipinstallonnxruntime-gpu==1.6.0###2.2方法二：onnxruntime-gpu不依赖于本地主机上cuda和cudnn在conda环境中安装，不依赖于本地主机上已安装的cuda和cudnn版本，灵活方便。这里，先说一下已经测试通过的组合：*python3.6,cu
使用TensorRT对YOLOv8模型进行加速推理 fengbingchun Deep Learning CUDA/TensorRT YOLOv8 TensorRT
这里使用GitHub上shouxieai的infer框架对YOLOv8模型进行加速推理，操作过程如下所示：1.配置环境，依赖项，包括：(1).CUDA:11.8(2).cuDNN:8.7.0(3).TensorRT:8.5.3.1(4).ONNX:1.16.0(5).OpenCV:4.10.02.cloneinfer代码：https://github.com/shouxieai/infer3.使用
ONNX Runtime、CUDA、cuDNN、TensorRT版本对应可keke ML&DL pytorch deep learning
文章目录ONNXRuntime的安装ONNXRuntime与CUDA、cuDNN的版本对应ONNXRuntime与ONNX的版本对应ONNXRuntime、TensorRT、CUDA版本对应ONNXRuntime的安装官方文档注意，到目前为止，onnxruntime-gpu在CUDA12.x和CUDA11.x下的安装命令是不同的，仔细阅读官方文档。验证安装python>>>importonnxru
关于深度森林的一点理解 Y.G Bingo 机器学习方法机器学习神经网络
2017年年初，南京大学周志华老师上传了一篇名为：DeepForest：TowardsAnAlternativetoDeepNeuralNetworks的论文，一石激起千层浪，各大媒体纷纷讨论着，这似乎意味着机器学习的天色要变，实则不然，周志华老师通过微博解释道，此篇论文不过是为机器学习打开了另一扇窗，是另一种思维，而不是真的去替代深度神经网络（DNN）。下面我就简单概括一下我对这篇论文的理解，如
百度飞桨paddle安装包括CUDA,cuDNN,opencv的安装小甲学长 opencv 百度 paddlepaddle
conda创建新环境这部分代码均在AnacondaPrompt中写，要求已有Anaconda第一步：创建condacreate--nameyourEnvpython=3.6–name：也可以缩写为【-n】，【yourEnv】是新创建的虚拟环境的名字，创建完，可以装anaconda的目录下找到envs/yourEnv目录python=2.7：是python的版本号。也可以指定为【python=3.6
获利超70万元，快手开除泄密员工；华为三折叠手机预约人数破200万；马斯克回应特斯拉要与x.AI分享收入 | 极客头条极客日报华为智能手机人工智能
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN（ID：CSDNnews）一分钟速览新闻点！开启预订不到24小时，华为三折叠手机预约人数破200万美团上线自研地图：推出导航功能替代第三方服务中国人工智能核心产业规模已接近6000亿元快手通报：一员工利用公司数据获利，严重违纪解除合同苹果将在新一代i
HALCON 错误代码 #7709 聪明不喝牛奶 Halcon+CSharp 深度学习 halcon 深度学习
前言最近在研究halcon的深度学习，在环境配置上花了不少的功夫搞定，结果正要开始训练分类的第二个train文件就出现了一个错误，报7709，折腾了三天才解决。原因报7709主要的原因有如下几个原因：1、就是你选的cuda版本和cudnn的不匹配，这个原因应该大家在选择的时候注意一下版本对比的话可以避免，基本上不是这个原因造成的。2、显卡的驱动版本的过低，需要下载一个驱动精灵升级一下显卡的驱动，但
用“说”智能控制灯具开关语音识别芯片NRK3603 九芯电子九芯电子语音芯片方案语音识别人工智能语音识别技术语音识别芯片语音芯片
用“说”智能控制灯具开关是一种基于语音识别技术的智能家居设备，它通过内置的语音识别芯片，利用离线识别算法，将用户的语音指令实现对灯具的控制，NRK3603语音识别芯片成为客户低成本的离线语音识别方案。功能特性：1.内核和存储高性能32bitRlsc内核，主频160MHZ，内置4MBSPIFLASH。2.AI算法：离线语音识别，采用最新的神经网络(TDNN)算法，具有识别精准，误判率低等优势，5米远
环境安装-1：Python3.8+CUDA11.6.1+cuDNN8.6+Tensorflow-gpu2.6.1 w坐看云起时环境安装 tensorflow python 人工智能
环境配置建议多看几个别人的安装过程的图文，不要着急，慢慢来，我们肯定行，加油！一、知识储备1.CUDACUDA是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。（来自百度词条）2.cuDNNNVIDIACUDA深度神经网络库(cuDNN)是一个GPU加速的深度神经网络基元库，能够以高度优化的方式实现标准例程（如前向和反
postgresql linux 命令,postgresql基本命令使用空木道长 postgresql linux 命令
基本命令使用psql命令行pg的命令行操作与mysql的有很大的差异，进入pg命令行后可以使用?查看pg的操作命令查看pg的操作命令#首先在linux命令行登录pg，postgres是pg的默认用户psql-hlocalhost-p5432-Upostgres#查看有哪些用户\dg#查看有哪些数据库\l#查看有哪些表\d#切换数据库\cdnname#例如切换为数据库test，则使用命令\ctest
淘宝将全面接入微信支付；苹果陷接班人危机，库克挽留多位资深高管；Vue 3.5正式版发布 | 极客头条极客日报微信
「极客头条」——技术人员的新闻圈！CSDN的读者朋友们好，「极客头条」来啦，快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|郑丽媛出品|CSDN（ID：CSDNnews）一分钟速览新闻点！淘宝、天猫发公告称，计划接入微信支付苹果客服回应苹果税抽佣30%：建议通过电脑端充值三星电子回应中国销售部门裁员：必要的业务调整和人员优化京东方回应苹果将彻底放弃LCD传闻：对单一客户具体合作信息不予回应
Ubuntu下安装CUDA和cuDNN _Mallow_ ubuntu linux
Ubuntu下安装CUDA和cuDNNCUDA1.查看显卡是否支持CUDA网址https://developer.nvidia.com/cuda-gpus。2.CUDA版本选择查看ubuntu版本是否对应要下载的CUDA，比如我选择的是11.7,对应CUDATOOLKITDOCUMENTION。在systemrequirements中查看版本，在pre-installationoactions有所
Ubuntu20.04安装CUDA和cuDNN Czi. Python学习 tensorflow python 深度学习
这里写目录标题1.简介1.1测试TensorFlow能否使用GPU2.安装CUDA11.22.1下载安装包2.2安装2.3配置环境变量2.3.1打开bashrc2.3.2末尾加上2.3.3内容生效2.4测试CUDA11.2是否安装成功3.安装cuDNN3.1官网下载安装包3.2安装cuDNN3.3测试4.完全卸载CUDA和cuDNN1.简介由于Tensoflow-gpu对cuda版本严格的要求，T
C 语言老兵不服 Rust！Linux 内核爆发内讧，核心维护者被迫退出：真的吵累了 CSDN资讯 rust linux 开发语言后端运维
整理|郑丽媛出品|CSDN（ID：CSDNnews）从几年前传闻Rust要进驻Linux内核，到如今RustforLinux项目的目标是让Rust成为Linux内核模块开发的第二语言，期间Linux社区内有关于Rust的争论就不曾停止，近期更是达到了一个新高峰。上周，一位负责RustforLinux的核心维护者WedsonAlmeidaFilho决定退出此项目，原因是他已疲于应对社区内越来越多与技
开发者“疯狂”整活：用纯 C 语言，从头编写一个 Rust 编译器！ CSDN资讯 rust 开发语言后端
近日，一个项目在HN上引起了许多开发者的注意——一名富有创新精神的开发者正在尝试使用C语言来编写Rust编译器。这位开发者表示：为了引导Rust发展，无论付出什么代价都值得。原文链接：https://notgull.net/announcing-dozer/作者|JohnNunley翻译|郑丽媛出品|CSDN（ID：CSDNnews）细心的Rust爱好者可能已经注意到，我最近不太活跃。导致这种情况
【Ubuntu20.04】配置深度学习环境糊涂懿深度学习人工智能
参考Ubuntu20.04配置深度学习环境（全网最细最全）NVIDIA显卡驱动安装安装CUDA通过终端nvidia-smi查看自己能安装的最高CUDA版本，在官方网址下载需要的版本。安装cuDNN在官方网址选择适配于自己安装的CUDA版本的cuDNN安装Anaconda（借用一下这张图）InstallerType那里一定要选择第三个runfile，可以选择不再安装NVIDIA驱动了，最后一个初始化
深度学习(二) 小泽爱刷题深度学习人工智能
CuDNN（CUDADeepNeuralNetworklibrary）是NVIDIA为加速深度学习计算而开发的高性能GPU加速库，专门优化了深度神经网络（DNN）的常见操作，如卷积、池化、归一化和激活函数等。CuDNN的主要作用是通过利用GPU的并行计算能力，提高深度学习模型在GPU上的运行效率。CuDNN的作用加速卷积操作：卷积操作是深度学习中特别是在卷积神经网络（CNN）中最重要且最计算密集的
nvidia cuda镜像说明九品神元师 linux 人工智能 python 运维
nvidia/cuda:11.1.1-cudnn8-runtime:这是一个运行时镜像，适用于在已安装CUDA11.1.1和cuDNN8的环境中运行深度学习应用程序。该镜像包含运行时所需的库和工具，但不包含开发工具或头文件。nvidia/cuda:11.1.1-cudnn8-devel:这是一个开发镜像，适用于在已安装CUDA11.1.1和cuDNN8的环境中进行深度学习模型的开发。该镜像包含了编
linux安装 cuda.run,Ubuntu18.04下安装CUDA和cudnn weixin_39535527 linux安装 cuda.run
安装前需要注意的问题：1需要安装对应的驱动，具体参考下图：安装过程可以参考：Ubuntu18.04安装nvidia显卡驱动2由于Cuda-9只支持gcc-6以下的版本，而Ubuntu18.04系统默认安装的gcc-7版，所以需要gcc降级，具体可以查看：linux下gcc、g++不同版本的安装和切换1.下载cuda.xxx.run文件这里需要注意的是cuda9并没有18.04的安装包，所以下载16
[opencv]DNN图像分类 FL1623863129 opencv opencv dnn 分类
OpenCV是一个计算机视觉开源库，提供了处理图像和视频的能力。OpenCV的影响力非常大，有超过47000的社区用户，以及超过1400万次的下载量。其应用领域横跨图像处理、交互式艺术、视频监督、地图拼接和高级机器人等。作为一个有十几年历史的开源项目，OpenCV拥有广大的用户群体和开发者群体。在数字的世界中，一幅图像由多个点（像素）组成。图像处理就是对其中一个像素或者一个区域内的像素（块）进行处
DNN学习平台（GoogleNet、SSD、FastRCNN、Yolov3）吾名招财人工智能 MFC界面应用 dnn opencv 神经网络
DNN学习平台（GoogleNet、SSD、FastRCNN、Yolov3）前言相关介绍1，登录界面：2，主界面：3，部分功能演示如下（1）识别网络图片（2）GoogleNet分类（3）人脸识别（4）SSD目标检测（5）FasterRCNN目标检测资源链接（含源码）前言还记得上学那会儿刚学完几个深度学习模型的C++简单部署应用，当时特别兴奋，外加那会儿还能自己写界面生成应用程序了，就想着做一个
【CUDA】在Windows10，GTX1050，cuda11.1上安装cuda环境丶2136 环境相关机器学习 gpu算力人工智能
目录一、检查系统要求和准备工作二、安装NVIDIA驱动程序三、下载并安装CUDAToolkit11.1四、安装cuDNN五、验证cuDNN是否安装成功（可选）六、设置环境变量七、验证安装八、测试CUDA环境在Windows10上为GTX1050显卡和CUDA11.1配置CUDA环境涉及几个步骤，包括安装NVIDIA驱动、CUDA工具包和cuDNN。以下是详细的步骤：一、检查系统要求和准备工作操作系
【CUDA】在Windows11，GTX3060上安装cuda环境丶2136 环境相关机器学习 gpu算力人工智能
目录一、检查系统要求和准备工作二、安装NVIDIA驱动程序三、下载并安装CUDAToolkit11.7四、安装cuDNN五、验证cuDNN是否安装成功（可选）六、设置环境变量七、验证安装八、测试CUDA环境总结在本文中，我们将逐步介绍如何在Windows11操作系统上为NVIDIAGTX3060显卡和CUDA11.7安装CUDA环境。请按照以下步骤操作。一、检查系统要求和准备工作在开始安装之前，请
[2020]tensorflow2.1-GPU + CUDA +CUDNN配置过程记录夏迪End
最近几天做视频数据集的时候要用到tensorflow2的gpu训练版本，要安装对应版本的cuda和cudnn，网上的教程五花八门，我尝试了很多论坛的方法，有些能用有些不可以（也可能是我操作错误），经过两天调试终于能够运行了。1介绍使用的版本：Win10，python3.7，tensorflow2.1-GPU，CUDA10.1,CUDNN7.6.5，显卡驱动版本是425.31（用的IDE是pycha
推荐系统中稀疏特征Embedding的优化表示方法少喝冰美式 embedding 算法机器学习人工智能 ai 大模型大语言模型
本文将介绍两个与稀疏特征Embedding相关的工作。推荐或者CTR预估任务有一个很突出的特点：存在海量稀疏特征。海量意味着数量巨大，稀疏意味着即使在很大的训练数据里，大量特征出现频次也非常低，这往往是由于引入了大量ID类特征带来的。对于DNN排序系统，是否能够找到好的特征Embedding表达方式，对于系统效果是至关重要的。虽然说，如何更好地表征稀疏特征对于模型的泛化能力至关重要，但是，关于这块
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他