Rory602

DeepFM模型

在推荐系统中，学习特征的交互对于最大化CTR是非常重要的。尽管现有的方法都取得很大的成功，对于低阶和高阶的特征交互研究很少，还需要一些实验和特征工程。在本文中，我们展示了低阶和高阶交互的端对端学习。采用的模型是DeepFM，它将推荐系统的FM模型和深度模型进行整合。通过和谷歌的Wide&Deep模型对比，DeepFM的wide和deep部分共享输入，不需要对原始数据进行特征工程。基于bench-mark data和commercial data对DeepFM在CTR预估方面进行综合试验。

1.简介

在推荐系统中，CTR预估是非常重要的，它的任务就是估计用户点击推荐项目的概率。在许多推荐系统中，它们的目标就是最大化点击次数，通过CTR返回用户对物品的点击可能性的排序。在其他的一些应用领域，例如在线广告，它们的目标是提高广告收入，所以它们的策略调整为CTR×bid，其中，bid是用户每次点击所带来的收益。

学习用户的隐含交互特征对于CTR预估是非常重要的。在我们研究主流的app市场时发现，用户常在午餐时间下载有关外卖的app，表明app的种类和时间戳是CTR预估重要的信息。

另外，我们发现青少年男性喜欢射击游戏和角色扮演游戏，这表明app的种类、用户的性别、用户的年龄对于CTR预估是一个有用的信息。通常，用户低阶和高阶的交互特征在点击预估中扮演着重要的角色。

最有挑战性的在于寻找有效的交互特征。有些特征是根据专家的先验知识设计的，特别容易理解。有些交互特征隐藏在数据中，很难根据先验知识发现，这只能通过自动化学习捕获。。即使对于易于理解的交互，专家似乎也不可能对它们进行详尽的建模，尤其是当功能数量很大时。

2.研究现状

FTRL是线性模型，不具备学习交叉特征能力。通常需要手工设计一些二阶交互特征，对于高阶特征的缺乏泛化能力。FM原则上可以进行高阶交叉，考虑到计算的复杂性，在实际应用中，通常使用二阶交叉。

CNN更加偏向学习相邻特征的交互性，RNN对于点击存在序列依赖性。PNN和FNN很难捕捉低阶特征交互。Wide&Deep同时考虑了低阶和高阶的特征交互，在这个模型中，将线性模型（“wide”）和深度模型组合在一起。在这个模型中需要两部分输入，“wide part"和"deep part”，“wide part”特征工程部分以来专家经验。

我们可以发现，现存的模型偏好低阶、高阶特征的交互，或者依赖特征工程。在本文中，我们可以不需要任何特征工程，端对端学习所有不同阶特征交互。我们的主要贡献存在以下几点：

我们整合FM模型和DNN模型生成新的神经网络模型DeepFM（Figure 1），FM模型学习低阶特征的交互，DNN学习高阶特征交互。和Wide&Deep不同的是，DeepFM可以端对端训练，不需要进行特征工程。
DeepFM由于它的“wide part”和“deep part”,模型的训练更加高效。
基于benchmark data和commercial data对DeepFM进行评估和现有的模型进行对比。

3.模型实现

假设我们的训练数据包含n个样本， $(\chi, y)$ ，其中 $\chi$ 是m-fileds数据，记录user和iterm， $y\in{(0,1)}$ 描述用户的点击行为，1表示用户点击item，否则是0。 $\chi$ 可能包括类别变量和连续变量。类别变量进行onehot操作，数值变量不做改变，或者对数值变量进行离散化，然后进行onehot编码。然后每个样本可以用 $(x, y)$ 表示，其中， $x=\left[x_{\text {field}_{1}}, x_{\text {field}_{2}}, \ldots, x_{\text {filed}_{j}}, \ldots, x_{\text {field}_{m}}\right]$ 是一个多维向量， $x_{\text {filed}_{j}}$ 代表 $\chi$ 的 $j$ -th filed。通常来说， $x$ 是高维稀疏的。CTR预测就是建立 $\hat{y}=CTR_{model}(x)$ 估计用户在给定背景（特征）情况下点击的概率。

3.1DeepFM

我们的目标是学习特征低阶和高阶的特征交互。如Figure 1所示，DeepFM有两个组件构成，FM部分和Deep部分，它们共享输入。对于特征 $i$ ， $w_i$ 作为权重衡量特征一阶特征重要性，向量隐向量 $V_i$ 是衡量该特征和其他特征的交互影响。 $V_i$ 喂给FM衡量二阶交互效应，同时喂给Deep部分用于衡量高阶交互效应。所有的参数，包括： $w_i,V_i$

和网络参数 $W^{(l)},b^{(l)})$ 在预测模型一起进行训练：
$\hat{y}=sigmoid(y_{FM}+y_{DNN})\qquad(1)$
其中， $\hat{y}\in(0,1)$ 是CTR预测值， $y_{FM}$ 是FM部分输出， $y_{DNN}$ 是深度部分的输出。

FM是在推荐系统中，用于学习特征交互的因子分解机。模型是由线性部分（一阶）和二阶特征交互组成，二阶特征交互是由两个隐向量内积表示。当特征稀疏的情况下，FM比之前的方法更能有效的捕捉二阶特征的交互效应。在之前的方法中，特征 $i$ 和特征 $j$ 只有在特征 $i$ 和特征 $j$ 都有记录的情况下才能学习。但是在FM模型中，可以通过隐向量 $V_i$ 和 $V_j$ 的内积衡量。由于这种弹性设置，当特征 $i$ 或者特征 $j$ 出现在数据记录中，FM模型可以训练隐向量 $V_i(V_j)$ 。由于交互特征很少同时出现在训练数据中，通过FM模型可以更好的学习。

如Figure2所示，FM的输出是加法单元和内积单元的求和：
$y_{FM}=\langle w,x \rangle+\sum_{j_1=1}^{d}\sum_{j_2=j_1+1}^{d}\langle V_i,V_j\rangle x_{j_1}\cdot x_{j_2} \qquad(2)$
其中， $w\in R^d$ 和 $V_i\in R^k(k是给定的)^2$ 。加法单元 $(\langle w,x\rangle)$ 反应1阶特征的重要性，内积单元反映二阶特征的交互效应。

Deep部分是学习高阶特征交互的前向传播的神经网络。如图3所示，特征向量直接作为神经网络的输入。图像和音频的处理输入的数据是连续和稠密的，而CTR的输入不同，它们需要对网络结构进行重新的设计。特别地，CTR原始的输入数据是稀疏的，高维的，类别变量和数值变量混合在一起。这表明，在输入到隐藏层之前，embedding层需要将输入向量压缩成低维稠密向量，以避免过拟合。

Figuire4展示来自输入层到embedding层的子网络结构。我们需要指出该网络结构有意思的两点。1）输入特征向量的维度是不同的，但是，他们的embedding的大小都是相同（ $k$ ）。2）作为一种网络权重的FM模型隐向量（ $V$ ）是通过压缩输入向量到embedding向量生成的。在有关于 $V$ 的处理过程中，有些人是通过FM模型预训练 $V$ ,我们没有那么做，我们将FM模型作为全局学习的一部分，此外还有DNN。embedding层的输出如下：
$a^{(0)}=\left[e_{1}, e_{2}, \ldots, e_{m}\right] \qquad(3)$
$e_i$ 是embedding第 $i$ 个filed，m是field的数量。然后， $a^{(0)}$ 是神经网络的输入，前向传播过程如下：
$a^{(l+1)}=\sigma\left(W^{(l)} a^{(l)}+b^{(l)}\right)\qquad(4)$
其中， $l$ 是层的深度， $\sigma$ 是激活函数。 $a^{(l)}，W^{(l)},b^{(l)}$ 分别是输出、模型的权重、 $l$ 层的常熟项。然后，产生稠密的实数特征向量。作为sigmoid函数的输入，进行CTR预测： $y_{D N N}=\sigma\left(W^{|H|+1} \cdot a^{H}+b^{|H|+1}\right)$ ,其中， $∣ H ∣$ 是隐藏层的层数。

需要重点指出的是FM和DNN共享特征的embedding层，这样有两个好处：1）同时能够学习低阶和高阶的特征交互。2）不像Wide&Deep需要特征工程，DeepFM不需要进行特征工程。

3.2和其他神经网络模型的对比

本节对DeepFM和现存的其他用于CTR预测的深度模型进行对比。

FNN模型：FNN是通过FM模型初始化的神经网络模型。通过FM进行预训练存在两方面的限制：1）embedding层的参数受FM模型的影响。2）FM模型预训练的引入，导致模型的效率降低。除此之外，FNN只能捕捉高阶的特征交互。

PNN:为了捕捉高阶特征的交互，PNN在embedding层和第一个隐藏层之间引入乘积层。根据乘积方式的不同，PNN存在以下3种情况：IPNN.OPNN和PNN*，其中，IPNN是基于向量的内积。OPNN是外积，PNN*是兼顾内积和外积。

为了使计算更加高效，作者对内积个外积计算采用近似的方式：1）内积计算随机删除一些神经元。2）外积是将m个k维的特征向量压缩成1个k维的向量。由于压缩会导致很多信息丢失，所以我们认为，这种结果是不稳定的。尽管内积更加值得信赖，但是，计算复杂度较高，因为乘积层的输出需要连接隐藏层所有的输出。和PNN相比，DeepFM直接连接最后一层输出（只有一个神经元），像FNN一样，所有的PNNs忽略低阶特征交互。

这个模型利用 FM代替LR，这个操作类似DeepFM，DeepFM共享FM和Deep之间的Embedding层。Embedding共享机制通过低阶和高阶特征交互影响特征表示。

总结：DeepFM和其他深度模型的对比如下图所示：

4.实验

4.1实验设置

数据集：

1)Criteo Dataset: 包括4500万用户的点击记录。其中13个连续变量，26个类别变量。将数据集按照9:1进行划分，90%用于训练，10%用于测试。

2)Company Dataset: 为了验证DeepFM在工业化CTR预估中表现，我们使用Company*dataset。我们收集来自Company* APP Store中连续7天用户点击数据用于训练。下一天的数据作为测试。整个过程大约有10条数据，在这个数据集中，有app特征数据（唯一标示，类别）、user的特征数据（用户是否下载app）、上下文特征（操作的时间）。

评估方式

使用auc和logloss（交叉熵）

模型比较

我们对9个模型进行实验：LR、FM、FNN、PNN(3种情况)、Wide&Deep(wide部分包括LR和FM)和DeepFM。Wide&Deep将这两种情况分别命名为LR&DNN和FM&DNN。

参数设置

FNN&PNN: (1) dropout:0.5 (2) 网络结构：400-400-400；（3）优化器：Adam （4）激活函数：IPNN采用tanh，其他深度模型采用relu。为了公平起见，DeepFM采用同样的设置。LR和FM分别采用FTRL和Adam优化器，FM隐向量的维度是10.

4.2效果评估

效率评估
$评估公式=\begin{array}{c} \text { ltraining time of deep } C T R \text { model } \\ \hline \text { |training time of } L R | \end{array}$
Figure 6左侧是cpu训练，右侧是GPU训练，结论如下：

FNN的预训练导致模型整体效率降低。
尽管在GPU上IPNN和PNN*训练的效率有了显著的提升，由于内积操作的原因，计算过程复杂度仍然较高。
DeepFM在效率方面获得较好的表现。

效果对比

特征交互会提高CTR模型的预估的效果。未采用特征交互的LR模型效果比其他模型效果差。
同时学习高阶和低阶交互特征的DeepFM比只采用低阶交互的FM或者高阶特征交互的（FNN,IPNN,OPNN,PNN*）模型效果好。
共享特征embedding层相对于采用分离式embedding层的（LR&DNN和FM&DNN）效果好。

4.3超参数研究

基于Company*dataset，调研以下参数对模型修过的影响：1）激活函数；2）drop rate ;3)每层网络神经元的个数；4）隐含层个数；5）网络的形状

激活函数

relu和tanh比sigmoid更适合深度模型。在本文中，我们比较relu和tanh的模型效果。如Figure 7所示，relu比tanh更适合深度模型，IPNN除外。可能原因：relu会导致数据的稀疏性。

Dropout

Dropout对模型的精度和复杂性进行折中的方法。我们设置dropout为1.0.0.9,0.8，0.7,0.6,0.5。如Figure8所示，当设置合适的dropout，模型会达到最好的效果。

每层网络神经元的个数

当其他影响因素保持不变时，增加每层网络神经元的个数会增加模型的复杂性。从Figure 9中发现，增加神经元的个数不能总是带来效果的提升。举例来说，当神经元的个数从400增加到800时，DeepFM模型整体表现比较稳定，OPNN甚至表现出模型效果下降。这是因为过于复杂的模型容易导致过拟合，在本数据集中，200或者400是比较不错的选择。

隐藏层的个数

如Figure10所示，随着隐藏层个数的增加，模型效果开始提升，增加到一定的程度，模型效果开始下降。这也是过拟合的原因导致。

网络结构

我们尝试测试不同的网络结构：常数型、增加型、下降型、锥形型。当我们改变网络结构时，我们固定隐含层的个数和神经元的总数。例如，我们的隐含层是3，总体神经元个数是600，四种不同的网络结构分别是：常数型（200-200-200），增加型(100-200-300),下降型(300-200-100）,锥形型(150-300-150)。如Figure 11所示，常数型的网络结构比其他三种效果要好。

5.结论

DeepFM克服现存模型的不足，具有良好的模型效果。主要的优势有以下几点：1）不需要进行预训练；2）学习到高阶和低阶的特征交互；3）引入特征embedding，避免特征工程。在实际数据集应用中，获得良好的效果，主要体现以下两点：1）根据auc和logloss评估，效果最好。2）通过和其他模型的对比，效率最高。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
【加密算法基础——RSA 加密】 XWWW668899 网络服务器笔记 python
RSA加密RSA（Rivest-Shamir-Adleman）加密是非对称加密，一种广泛使用的公钥加密算法，主要用于安全数据传输。公钥用于加密，私钥用于解密。RSA加密算法的名称来源于其三位发明者的姓氏：R:RonRivestS:AdiShamirA:LeonardAdleman这三位计算机科学家在1977年共同提出了这一算法，并发表了相关论文。他们的工作为公钥加密的基础奠定了重要基础，使得安全通
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p