ForcedOverflow

【论文阅读】POI2Vec: Geographical Latent Representation for Predicting Future Visitors

《POI2Vec: Geographical Latent Representation for Predicting Future Visitors》

Shanshan Feng, Gao Cong, Bo An, Yeow Meng Chee. 2017,AAAI
附件：论文

Abstract

随着位置感知型（location-aware）社交媒体应用的日益普及，兴趣点（POI）推荐得到了广泛的研究。然而现有的大部分研究是从用户的角度出发，为用户推荐POI。相比之下，我们考虑一个新的研究问题，即预测未来某个时期访问特定POI的用户。问题的难点在于难以有效地学习POI的序列转换以及用户偏好，并将其整合从而进行预测。我们提出了一个新的能够结合地理因素影响的潜在表示模型POI2Vec，在建模用户流动行为的过程中，这是非常重要的。我们注意到现有的表示模型没有包含地理因素的影响，我们进一步提出一种方法来联合建模用户偏好和POI顺序转换的影响，以预测给定POI的潜在访问者。我们在2个真实的数据集上进行实验，证明我们提出的方法优于最新的POI预测和未来用户预测方法。

Introduction

现有研究：

关于用户移动行为和POI推荐的建模问题，Cho, Myers, and Leskovec 2011; Ye et al. 2011
用户流动性受到其最近访问点及个人兴趣的高度影响，Cheng et al. 2013
word2vec，Mikolov and Dean 2013; Mikolov et al. 2013
利用word2vec模拟用户的连续签到，Liu, Liu, and Li 2016
hierarchical softmax，Morin and Bengio 2005
对于分层softmax的每一项，构造合适的二叉树，Mnih and Hinton 2009

在POI2Vec中，每个POI被表示为一个潜在的低维空间中的向量，两个向量之间的内积反映了两个POI之间的相关性，利用分层的softmax来学习潜在的向量。
我们提出了一种新的能够结合POI地理坐标的构建二叉树的方法，即将POI分到不同的区域中，在每个区域的POI上构建一个二叉树。由于一个POI可能会影响领近地区的POI，因此我们将一个POI分配给多个邻近区域。在生成的二叉树中，一个POI可能会出现多次，来描述其和其他POI的关系。此外，我们还对用户的偏好进行建模，即每个用户用一个潜在向量表示。
我们通过考虑用户偏好和顺序迁移来共同学习用户和POI的潜在表示。为了预测POI的潜在访问者，我们考虑最近位置的用户和最近位置未知的用户。对最近位置已知的用户，我们结合用户偏好和序列迁移进行预测，对于最近位置未知的用户，仅考虑用户偏好。主要工作：

结合POI的地理影响，预测未来几小时内的潜在访问者。
结合用户偏好和POI序列影响来预测POI的未来访问者。

Related Work

位置推荐，Lian et al. 2014; Li, Ge, and Zhu 2016
基于协同过滤方法的位置推荐，Yuan et al. 2013a; Ye et al. 2011
基于因子分解模型，Cheng et al. 2012; Li et al. 2015
对某个位置的用户推荐问题，Yuan et al. 2013b; Zhao et al. 2015
利用马尔科夫链对序列的影响建模，Zhang, Chow, and Li 2014
利用隐马尔科夫链模型对序列的影响建模，Ye, Zhu, and Cheng 2013
利用因式分解的个性化马尔科夫链（FPMC）模拟个性化的POI迁移，Rendle, Freudenthaler, and Schmidt-Thieme 2010
使用度量嵌入（Metric Embedding）来建模用户偏好和POI迁移进行建模，Feng et al。2015
考虑兴趣点推荐的时间影响，Zhang and Wang 2015; Zhao et al. 2016; Liu et al. 2016
合并类别转换模式，He et al. 2016
利用word2vec进行产品推荐，Wang et al. 2015
利用word2vec对签到序列进行建模，Liu, Liu, and Li 2016

Future Visitor Prediction Problem

我们用 $\mathcal{U}$ 来表示用户的集合，用 $\mathcal{L}$ 表示POI的集合，则每个POI $\mathcal{l}$ 都与其地理坐标 $<\mathcal{l}^{Lat},\mathcal{l}^{Lon}>$ 。 $\mathcal{H}$ 表示历史签到数据集。每一个签到元祖 $(\mathcal{u},\mathcal{l},\mathcal{t})$ 表示用户 $\mathcal{u}$ 在时间 $\mathcal{t}$ 时访问地点 $\mathcal{l}$ 。给定POI，我们的目标是确定在几小时内将会访问POI的潜在访问者，定义如下：
定义1： 考虑用户集合 $\mathcal{U}$ 和POI集合 $\mathcal{L}$ ，给定POI $\mathcal{l}$ ，当前时间 $\mathcal{t}$ 和时间阈值 $\mathcal{\tau}$ ，问题目标是确定在时间内访问该POI的用户集合 $[\mathcal{t}, \mathcal{t}+\mathcal{\tau}]$ 。

POI2Vec Representation Model

POI2Vec序列转换模型

潜在的表示方法 神经网络语言模型（Mikolov and Dean 2013; Le and Mikolov 2014）的最新进展表明，潜在表示方法可以有效地捕捉到单词之间的顺序语义关系，我们通过对两个签到数据集的分析得出，POI频率分布也遵循幂律分布和词频分布。我们可以据此用word2vec对签到序列进行建模。

给定一个用户 $\mathcal{u}$ 以及其当前的位置 $\mathcal{l}_{\mathcal{c}}^{\mathcal{u}}$ ，上下文 $C(\mathcal{l}_{\mathcal{c}}^{\mathcal{u}})$ 是用户 $\mathcal{u}$ 在访问 $\mathcal{l}_{\mathcal{c}}^{\mathcal{u}}$ 之前，在给定的时间域内访问的POI。我们定义 $C(\mathcal{l}_{\mathcal{c}}^{\mathcal{u}})=\{\mathcal{l}_{\mathcal{c}}^{\mathcal{u}},0<\Delta(\mathcal{l}_{\mathcal{i}}^{\mathcal{u}},\mathcal{l}_{\mathcal{c}}^{\mathcal{u}})<\tau\}$ ，其中， $\Delta(\mathcal{l}_{\mathcal{i}}^{\mathcal{u}},\mathcal{l}_{{c}}^{\mathcal{u}})$ 是访问 $\mathcal{l}_{\mathcal{i}}^{\mathcal{u}}$ 和 $\mathcal{l}_{\mathcal{c}}^{\mathcal{u}}$ 之间的时间间隔。POI序列建模的目标是给定POI的上下文，估计访问一个POI的概率。
对于每一个POI $l$ ，我们都用一个 $D$ 维潜在空间的向量 $w(l)\in R^D$ 表示，我们采用连续词袋模型（CBOW）（Mikolov and Dean 2013），即根据上下文预测某个词的概率。概率 $P r (l ∣ C (l))$ 通过softmax定义如下：
$Pr(l|C(l))=e^{w(l)\cdot \boldsymbol{\Phi}(C(l))}/Z(C(l))$
其中， $\boldsymbol{\Phi}(C(l))=\sum_{l_c\in C(l)} w(l_c)$ 是上下文POI向量之和， $Z(C(l))=\sum_{l_i\in\mathcal{L}}e^{w(l_i)\cdot \boldsymbol{\Phi}(C(l))}$ 是正则项。
我们采用分层的softmax，利用二叉树进行计算。二叉树的节点对应于每一个POI项。

纳入地理影响 地理影响是建模序列迁移和用户偏好的一个非常重要的因素，而现有的基于频率的softmax结构不能捕捉到地理影响。因此我们为POI2Vec模型开发了一种地理二叉树结构，将空间信息合并到二叉树中。由于附近的POI具有较高的相关性，因此应将它们在二叉树中的位置也安排的更近。我们将POI划分为二元区域的层次结构，使得附近的POI更可能聚集到同一个区域来。为构建POI的二叉层次结构，我们将每个区域递归地分割成两个相同大小的子区域，知道区域至少有一边的长度小于 $2\times\theta$ ，其中 $\theta$ 是区域边长大小的阈值。这样，区域就是一个面积大于 $\theta\times\theta$ 平方的矩形。这些地域也应该以二叉树的形式表示。如图所示，我们首先将POI分成两个相等的区域 $R_0$ 和 $R_1$ 。然后将 $R_0$ 分成 $R_{00}$ 和 $R_{01}$ ，将 $R_1$ 分成 $R_{10}$ 和 $R_{11}$ 。

为了将POI分配到其可能产生影响的多个区域，监狱用户的移动受到空间距离的影响，因此我们考虑了每个POI的影响区域。影响区域定义为以每个POI为中心的 $\theta\times\theta$ 大小的正方形。如果POI $l$ 的影响区域与二叉树中的区域 $R$ 重叠，则将 $l$ 分配给区域 $R$ 。例如，图中以POI $l_1$ 为中心的正方形覆盖到了区域 $R_{01}$ 和 $R_{11}$ ，那么 $l_1$ 就被分配到区域 $R_{01}$ 和 $R_{11}$ 中。
由于影响区域 $\theta\times\theta$ 的大小要小于区域，因此容易证明：

命题1： 在POI2Vec模型中，一个POI所属的区域数量为1，2或4
我们用 $\Omega^l$ 表示POI $l$ 的区域集合。如果一个POI被分配到多个区域买这些区域的概率分布计算方法如下： $l$ 属于区域 $R_i$ 的概率是 $Pr(R_i)=S_{R_i}^l/\sum_{R_k\in\Omega^l}S_{R_k}^l$ ，其中 $S_{R_i}^l$ 是 $l$ 的影响区域与区域 $R_i$ 之间重叠部分的大小。
对于每个区域，我们根据POI的频率构建哈夫曼树（Mikolov and Dean 2013）。在生成的二叉树中，上层是空间区域，下层是每个区域的POI，如下图所示。一个POI可能会有多个路径，例如， $l_1$ 在生成的二叉树中出现了两次，一次是在 $R_{01}$ 中，一次是在 $R_{11}$ 中。

POI2Vec的两个优点：

在构建二叉树的过程中，考虑了POI地理因素的影响，是的同一地区节点下的POI在地理上更加接近。
与传统每个POI只能出现一次相比，一个POI可以在二叉树中出现多次。

概率估计 分层的softmax模型通过估计从根节点到叶节点的路径概率来近似softmax。在二叉树中，叶子结点是POI，其他节点是内节点。每个内节点被视为一个二进制分类器，叶子结点 $l$ 的路径被定义为内节点的序列 $path=(b_0^l,b_1^l,...,b_n^l)$ ，则沿路径观察到 $l$ 的概率：
$Pr(l|C(l))^{path}=\prod_{b_i^l\in path}Pr(b_i^l|\Phi(C(l)))$
二叉树中每一个内节点 $b$ 都有一个潜在的向量 $\Psi(b_i^l)\in \mathcal{R}^D$ ，可以看做是二元分类器的参数。这里的 $Pr(b_i^l|\Phi(C(l)))$ 被定义为
$Pr(b_i^l|\Phi(C(l)))=\sigma(\Psi(b_i^l)\cdot\Phi(C(l)))$
其中 $\sigma(x)=\cfrac{1}{1+e^{-x}}$ 是sigmod函数。

例如，在图Figure2中， $l_1$ 的一条路径是 $path_1=(b_0,b_1,b_4,b_i)$ ，对于二叉树中的分类器，我们将左边定义为"true"，右边定义为"false"。则该路径的概率可以表示为 $Pr(l_1|C(l_1))^{path1}=\sigma(\Psi(b_0)\cdot\Phi(C(l_1)))\times(1-\sigma(\Psi(b_1)\cdot\Phi(C(l_1)))\times\sigma(\Psi(b_4)\cdot\Phi(C(l_1)))\times\sigma(\Psi(b_i)\cdot\Phi(C(l_1)))$
在POI2Vec模型中，由于每个POI都有多个所属区域，因此再生成树中一个POI可有多条路径。我们需要计算所有的概率。我们将 $\mathcal{P}(l)$ 定义为POI $l$ 的路径集合，每条路径 $path_k$ 与概率 $Pr(path_k)$ 相关联,，其概率与区域概率 $Pr (R_k)$ 相同。则根据给定的上下文 $C (l)$ 计算观察到 $l$ 的概率为：
$Pr(l|C(l))=\prod_{path_k\in\mathcal{P}(l)}Pr(path_k)\times Pr(l|C(l))^{path_k}$

参数学习： POI2Vec模型的目标是使得观察到的所有连续POI的后验概率最大化，假设观测值彼此独立：
$\Theta=arg max_{\Theta}\prod_{(l,C(l))\in\mathcal{H}}Pr(l|C(l))$
其中 $\Theta=\{W(\mathcal{L}),\Psi(\mathcal{B})\}$ 是参数集合。这里 $W(\mathcal{L})$ 表示所有POI $l\in\mathcal{L}$ 的潜在表示， $\Psi(\mathcal{B})$ 是内节点的参数集合。二叉树的叶子结点数是 $(a\times|\mathcal{L}|)$ ，内节点数是 $(a\times|\mathcal{L}-1|)$ 。我们可以由Stochastic Gradient Descent (SGD)方法 (Rong 2014)获得所有的参数。

为用户偏好拓展POI2Vec模型

用户偏好是建模用户移动性和预测目标POI潜在用户的另一个重要因素。我们拓展了POI2Vec模型来共同学习POI的用户偏好和序列迁移。与POI类似，每个用户 $u$ 都由一个向量 $x(u)\in\mathcal{R}^D$ 来表示。
根据Feng et al. 2015可知，一些连续的POI之间时间间隔可能很大。我们规定对于在最近的时间间隔 $\tau$ 内没有上下文的签到，则该签到只与用户偏好有关。用户访问POI的概率估计为：
$Pr(l|u)=e^{(w(l)\cdot x(u))}/Z(u)$
其中， $Z(u)=\sum_{l_i\in\mathcal{L}}e^{(w(l)\cdot x(u))}$ 是正则项。与 $P r (l ∣ C (l))$ 类似， $P r (l ∣ u)$ 也可以由分层的softmax计算。
对于存在上下文的check-in，其受到用户偏好和上下文的共同影响，假设用户偏好与上下文相互独立，则给定用户 $u$ 和位置信息上下文 $C (l)$ ， $l$ 的概率是：
$Pr(l|u,C(l))=Pr(l|u)\times Pr(l|C(l))$
根据上下文的存在与否，一个签到（check-in）的概率可计算为：
$Pr(u,l,t)=\left\{\begin{array}{cc} Pr(l|u,C(l)), & if\ C(l)\ exists\\ Pr(l|u), & otherwise \end{array}\right.$
模型的目标是最大化所有check-in的后验概率：
$\Theta=arg\ max_\Theta \prod_{(u,l,t)\in\mathcal{H}}Pr(u,l,t)$
其中， $\Theta=\{W(\mathcal{L}),X(\mathcal{U}),\Psi(\mathcal{B})\}$ 是参数集合， $X(\mathcal{U})$ 是所有用户的潜在表示。

预测未来的访问者

我们可以用学习到的用户 $X(\mathcal{U})$ 的潜在表示和POI $W(\mathcal{L})$ 的表示来找到将来访问POI的用户。
我们首先考虑最近几小时有签到记录的用户。给定时间点 $t$ ，如果一个用户在时间域 $[t-\tau,t]$ 内有签到记录，我们认为这个用户是一个具有近期位置的用户。对于这些用户，我们利用这些近期位置来确定他们访问特定POI的倾向。如果用户在 $[t-\tau,t]$ 期间访问了多个POI，我们只保留最新的POI $l^c$ ，这代表了他最新的位置。另外，我们也利用用户偏好。给定的目标POI $l$ 和用户 $u$ 以及其最新位置 $l^c$ ，未来 $u$ 访问 $l$ 的概率可定义为： $\mathcal{F}(x(u)\cdot w(l),w(l^c)\cdot w(l))$ ，其中 $x(u)\cdot w(l)$ 反映了用户偏好， $w(l^c)\cdot w(l)$ 反应了序列影响。这里的 $\mathcal{F}()$ 是一个结合用户偏好和序列影响的聚合函数。
聚合函数 $\mathcal{F}(a,b)=Max(a,b)$ 通过取较大值来获得更重要的因素；而函数 $\mathcal{F}(a,b)=Sum(a,b)$ 是将两个因素进行线性组合。
对于过去几小时内没有签到记录的用户，我们只利用用户偏好来预测这些用户访问指定POI的可能性，由 $x(u)\cdot w(l)$ 计算获得。
对于每一个用户 $u\in \mathcal{U}$ 我们计算其分数：
$s(u,l)=\left\{\begin{array}{cc} \mathcal{F}(x(u)\cdot w(l),w(l^c)\cdot w(l)), & with\ recent\ positions\\ x(u)\cdot w(l), & otherwise \end{array}\right.$
我们按照分数对所有用户进行排名，并选择前K个用户作为目标位置的潜在访问者。

Experiments

数据集：

the Foursquare check-ins within Singapore (Yuan et al. 2013a)
the Gowalla check-ins within Houston (Liu et al. 2013)
预处理： 删除少于5个chenk-in纪录的用户和少于5个用户访问的POI。90%作为训练集，5%作为调整集，5%作为测试集。
目标：
POI预测任务中评估序列迁移的潜在表示的质量。
评估未来游客预测的准确性。
参数设置：
时间域 $\tau=6\ hours$
维数 $D = 200$
区域大小阈值 $\theta=0.1$
学习率0.005

序列转换的潜在表示

4个baseline的比较实验：

FMC：分解的分解马尔可夫链模型（Rendle，Freudenthaler和Schmidt-Thieme 2010），它利用矩阵分解来模拟顺序转换。
ME：矩阵嵌入模型（Feng et al。2015），
它将每个POI投射到一个潜在的欧几里得空间中的一个对象中。
NS：word2vec的负采样（Mikolov and Dean 2013），用于建模POI序列（Liu，Liu，Li 2016）。
HS：分层的softmax和哈夫曼树（Mikolov和Dean，2013）。

未来用户预测

3个baseline的比较试验：

FPMC：分解个性化马尔可夫链，将用户偏好与马尔可夫转换线性结合（Cheng et al。2013）。
PRME：个性化排名度量嵌入，它将用户偏好和马尔可夫过渡线性融合（Feng et al。，2015）。
CWRAP：探索位置的上下文来建模用户偏好。

POI2Vec的4种方法：

U：只利用用户的偏好来预测潜在的访问者。
URP：我们只考虑有近期位置的用户。
MAX：最大聚合函数。
SUM：利用Sum聚合函数来整合用户偏好和序列影响。

实验结果

Conclusions and Future Work

一些研究问题存在进一步的探索方向。
首先，用户的运动受到多种因素的影响，我们可以考虑其他信息，如时间对访客预测问题的影响。
其次，我们构建二叉树的方法与空间上的各项没有关系，可以利用其他信息，如使用产品分类来进行产品推荐。

【论文笔记ing】Pointerformer: Deep Reinforced Multi-Pointer Transformer for the Traveling Salesman Problem Booksort online笔记论文论文阅读 transformer 深度学习
论文中使用一个PointerFormer模型编码器部分：可逆残差模型堆叠解码器部分：指针网络自回归对于一次任务而言，推理阶段：编码器部分：一次解码器部分：循环N次，直至任务结束在训练阶段，使用强化学习，对于一个N个节点的TSP实例，算法中会以不同的起点，跑N次，得到N个轨迹，以满足TSP的对称特性，表示这都是属于一个TSP问题的（真实）解然后会计算这样表示归一化奖励，得到一个advantage,然
【论文笔记】GaussianFusion: Gaussian-Based Multi-Sensor Fusion for End-to-End Autonomous Driving
原文链接：https://arxiv.org/abs/2506.00034v1简介：现有的多传感器融合方法多使用基于注意力的拉直(flatten)融合或通过几何变换的BEV融合，但前者可解释性差，后者计算开销大（如下图(a)(b)所示）。本文提出GaussianFusion（下图(c)），一种基于高斯的多传感器融合框架，用于端到端自动驾驶。使用直观而紧凑的高斯表达，聚合不同传感器的信息。具体来说，
【论文笔记】RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation AustinCyy 论文笔记论文阅读
论文信息论文标题：RAGLAB:AModularandResearch-OrientedUnifiedFrameworkforRetrieval-AugmentedGeneration-EMNLP24论文作者：XuanwangZhang-NanjingUniversity论文链接：https://arxiv.org/abs/2408.11381代码链接：https://github.com/fat
Llama改进之——RoPE旋转位置编码愤怒的可乐 NLP项目实战 #LLaMA RoPE 旋转位置编码
引言旋转位置编码(RotaryPositionEmbedding,RoPE)将绝对相对位置依赖纳入自注意力机制中，以增强Transformer架构的性能。目前很火的大模型LLaMA、QWen等都应用了旋转位置编码。之前在[论文笔记]ROFORMER中对旋转位置编码的原始论文进行了解析，重点推导了旋转位置编码的公式，本文侧重实现，同时尽量简化数学上的推理，详细推理可见最后的参考文章。复数与极坐标复数
Llama改进之——均方根层归一化RMSNorm 愤怒的可乐 NLP项目实战 #llama
引言在学习完GPT2之后，从本文开始进入Llama模型系列。本文介绍Llama模型的改进之RMSNorm(均方根层归一化)。它是由RootMeanSquareLayerNormalization论文提出来的，可以参阅其论文笔记1。LayerNorm层归一化(LayerNorm)对Transformer等模型来说非常重要，它可以帮助稳定训练并提升模型收敛性。LayerNorm针对一个样本所有特征计算
论文笔记＜交通灯＞＜多智能体＞CoLight管理交通灯青椒大仙KI11 论文阅读
今天看的是论文Colight:学习网络级合作进行交通信号控制论文提出的CoLight模型是一种基于强化学习和图注意力网络的交通信号灯控制方法，旨在解决城市道路网络中的交通信号的写作问题，提升车辆通行效率。问题定义为：将交通信号控制问题建模为马尔可夫博弈，每个路口由一个智能体控制，智能体通过观察部分系统状态（当前相位和各车道车辆数），选择动作（下一时间段的相位），目标是最小化路口周围车道的平均队列长
《基于超声的深度学习模型用于降低BI-RADS 4A乳腺病变的恶性率》论文笔记 MobileNet 往事随风、、论文笔记机器学习深度学习论文阅读人工智能机器学习健康医疗
《APPLICATIONOFDEEPLEARNINGTOREDUCETHERATEOFMALIGNANCYAMONGBI-RADS4ABREASTLESIONSBASEDONULTRASONOGRAPHY》《基于超声的深度学习模型用于降低BI-RADS4A乳腺病变的恶性率》原文地址：链接文章目录摘要简介方法患者图像获取与处理深度学习模型统计分析结果讨论结论摘要本研究旨在开发一个基于超声（US）图像
论文笔记--Language Models are Unsupervised Multitask Learners Isawany 论文阅读论文阅读语言模型 transformer chatgpt 自然语言处理
论文笔记GPT-2--LanguageModelsareUnsupervisedMultitaskLearners1.文章简介2.文章导读2.1概括2.2文章重点技术2.2.1数据集WebText2.2.2分词方法3.GPT-1&GPT-24.文章亮点5.原文传送门6.References1.文章简介标题：LanguageModelsareUnsupervisedMultitaskLearners
You Only Look Once Unified, Real-Time Object Detection论文笔记 __Lo__ 目标检测论文阅读深度学习
文章结构统一检测框架(UnifiledDetection)核心思想YOLO将目标检测视为一个端到端的回归问题，输入的图像经过SingleForwardPass，直接输出物体的信息（边界框的位置、边界框的置信度、类别概率）；优势在于速度快，全局理解上下文，这里全局理解上下文的意思是识别物体和背景的关系，减少误检。网络设计网格划分（GridDivision）将图像划分为一个S×S的网格，文中S=7；共
【论文笔记】UnifiedQA：新SOTA，生成模型一统问答任务 iLuz 深度学习自然语言处理
目录引言模型介绍1.输入格式2.实验结果总结引言问答任务有多种形式，常见的有抽取式问答(EX)、摘要式问答(AB)、多选题式问答(MC)、判断式问答(YN)。一般的解决方案是针对不同形式的问答任务设计不同的模型。例如，抽取式问答、多选题式问答、判断式问答可以转化为分类任务，摘要式问答可以转换为生成任务。尽管任务形式不同，但模型所需的语义理解和推理能力是共通的，或许不需要format-special
[论文笔记] [2008] [ICML] Extracting and Composing Robust Features with Denoising Autoencoders Alexzhuan DL 神经网络机器学习
在06年以前，想要去训练一个多层的神经网络是比较困难的，主要的问题是超过两层的模型，当时没有好的策略或方法使模型优化的很好，得不到预期的效果。在06年，Hinton提出的stackedautoencoders改变了当时的情况，那时候的研究者就开始关注各种自编码模型以及相应的堆叠模型。这篇的作者提出的DAE（DenoisingAutoencoders）就是当时蛮有影响力的工作。那个时候多层模型效果得
【论文笔记】SecAlign: Defending Against Prompt Injection with Preference Optimization AustinCyy 论文笔记论文阅读
论文信息论文标题：SecAlign:DefendingAgainstPromptInjectionwithPreferenceOptimization-CCS25论文作者：SizheChen-UCBerkeley；Meta,FAIR论文链接：https://arxiv.org/abs/2410.05451代码链接：https://github.com/facebookresearch/SecAli
CLIP论文笔记：Learning Transferable Visual Models From Natural Language Supervision Q同学的nlp笔记论文阅读语言模型人工智能 nlp 自然语言处理
导语会议：ICML2021链接：https://proceedings.mlr.press/v139/radford21a/radford21a.pdf当前的计算机视觉系统通常只能识别预先设定的对象类别，这限制了它们的广泛应用。为了突破这一局限，本文探索了一种新的学习方法，即直接从图像相关的原始文本中学习。本文开发了一种简单的预训练任务，通过预测图片与其对应标题的匹配关系，从而有效地从一个包含4亿
论文笔记：Large Language Models are Zero-Shot Next LocationPredictors UQI-LIUWJ 论文笔记论文阅读语言模型人工智能
1intro下一个地点预测（NL）包括基于个体历史访问位置来预测其未来的位置。NL对于应对各种社会挑战至关重要，包括交通管理和优化、疾病传播控制以及灾害响应管理NL问题已经通过使用马尔可夫模型、基于模式的方法以及最近的深度学习（DL）技术（进行了处理。然而，这些方法并不具备地理转移能力因此，一旦这些模型在某个地理区域训练完毕，如果部署到不同的地理区域，它们将面临严重的性能下降尽管已经做出努力改善地
论文笔记：LSTPrompt: Large Language Models as Zero-Shot Time Series Forecastersby Long-Short-Term Prompt UQI-LIUWJ 论文笔记论文阅读语言模型 prompt
202402arxiv1intro1.1大模型+时间序列预测一般有两种类型的方法使用海量时间序列数据重新训练一个时间序列领域的大模型论文笔记：TimeGPT-1_timegpt论文-CSDN博客直接利用现有的大模型，设计prompt，将时间序列数据转换成大模型理解的文本，实现时间序列预测代价小+有成熟的可供使用的大模型1.2本文思路之前的方法大多集中在如何将时间序列数据转换成文本上将时间序列的数字
【论文笔记】ResNet论文的全面解析浩瀚之水_csdn #论文阅读笔记人工智能
论文：DeepResidualLearningforImageRecognition发表时间：2015发表作者：(MicrosoftResearch)He-Kaiming,Ren-Shaoqing,Sun-Jian论文链接：论文链接一、ResNet论文基本信息论文标题与发表信息论文标题：《DeepResidualLearningforImageRecognition》发表时间：2015年，并在20
论文笔记：TrafficPredict: Trajectory Prediction for Heterogeneous Traffic-Agents CvBeginner 论文笔记轨迹预测计算机视觉
论文笔记：TrafficPredict:TrajectoryPredictionforHeterogeneousTraffic-Agents摘要这是百度在AAAI2019发布的一篇文章。这篇文章提出了一种基于4D-graph的方法实现复杂场景下的轨迹预测，研究对象包含行人、机动车和自行车。实现方法本文提出了一个基于LSTM的算法，名为TrafficPredict。构建了一个4DGraph，输入是轨
论文笔记：MobileNetV2: Inverted Residuals and Linear Bottlenecks 菜鸡信息技术 Deep Learning
MobileNetV2:InvertedResidualsandLinearBottlenecksMobileNetV2是MobileNetV1的改进版，Invertedresidual是个非常精妙的设计！MobileNetV1引入depthwiseseparableconvolution代替standardconvolution，减少运算量。MobileNetV1的结构其实非常简单，是类似于VG
AIGC视频生成模型：ByteDance的PixelDance模型好评笔记 AIGC 深度学习人工智能计算机视觉机器学习 transformer 论文阅读
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录热门专栏机器学习深度学习
Meta的AIGC视频生成模型——Emu Video 好评笔记 AIGC 深度学习人工智能机器学习 transformer 校招面试八股
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍Meta的视频生成模型EmuVideo，作为Meta发布的第二款视频生成模型，在视频生成领域发挥关键作用。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言相关工作文本到图像（T2I）扩散模型视频生成/预测文本到视频（T2V）生成分解生成方法预备知识EmuVideo生成步骤图
[论文笔记] 超详细解读DeepSeek v3全论文技术报告心心喵论文笔记论文阅读
DeepSeek-V3是一个强大的专家混合（Mixture-of-Experts，MoE）语言模型，总共671B参数，每个token激活37B参数（可以理解为有多个专家，但每个token只会选择一部分专家进行推理，所以一个token的预测，只会用到37B参数），DeepSeek-V3使用了多头潜在注意力（
[论文笔记] pai-megatron qwen1.5报错心心喵论文笔记 python
Qwen1.5-0.5b-chat使用example中fintune.py报错·Issue#77·QwenLM/Qwen1.5·GitHub解决方案：transformers升级到4.37.0pipinstallsetuptools==65.5.1pipinstalltransformers==4.37.0
基于不确定性感知学习的单图像自监督3D人体网格重建（论文笔记与思考） Gamma and Beta 读博笔记算法笔记学习 3d 论文阅读
文章目录论文解决的问题提出的算法以及启发点论文解决的问题首先这是Self-Supervised3DHumanmeshrecoveryfromasingleimagewithuncertainty-awarelearning（AAAI2024）的论文笔记。该文中主要提出了一个自监督的framework用于人体的姿态恢复。主要是解决了现有的方法对大型数据集的依赖。提出的算法以及启发点论文总体的框架其实
LLM论文笔记 28: Universal length generalization with Turing Programs Zhouqi_Hua 大模型论文阅读论文阅读语言模型自然语言处理笔记人工智能
Arxiv日期：2024.10.4机构：HarvardUniversity关键词图灵机CoT长度泛化核心结论TuringPrograms的提出提出TuringPrograms，一种基于图灵机计算步骤的通用CoT策略。通过将算法任务分解为逐步的“磁带更新”（类似图灵机的读写操作），允许模型通过简单的文本复制与局部修改完成复杂计算通用性：适用于任何算法任务（加法、乘法、SGD），不依赖任务特定的数据格
LLM论文笔记 27: Looped Transformers for Length Generalization Zhouqi_Hua 大模型论文阅读论文阅读语言模型人工智能论文笔记笔记
Arxiv日期：2024.9.25关键词长度泛化transformer结构优化核心结论1.RASP-L限制transformer无法处理包含循环的任务的长度泛化2.LoopTransformer显著提升了长度泛化能力InputInjection显著提升了模型的长度泛化性能，尤其在二进制加法等复杂任务上效果显著在推理中，通过输出置信度判断迭代停止点的策略能够实现接近最佳的性能主要方法Transfor
Fast-BEV：A Fast and Strong Bird’s-Eye View Perception Baseline——论文笔记 m_buddy BEV Perception 论文阅读人工智能深度学习
参考代码：Fast-BEV一稿多投的另一篇：Fast-BEV:TowardsReal-timeOn-vehicleBird’s-EyeViewPerception1.概述介绍：这篇文章提供了一种可实际部署的BEV感知方案，能够在当今车端主流计算单元上（NvidiaOrin）实现不错的帧率。从camera到BEV的转换思想来自于M2BEV，但是对这个转换方法中使用查找表和映射方法改进，使得整体视角转
读论文笔记-Flamingo：少样本视觉语言模型 joseanne_josie 论文阅读语言模型人工智能
读论文笔记-Flamingo：少样本视觉语言模型Plomblems本文拟解决多模态机器学习中，如何将训练好的模型快速适应到少量标注数据的新任务中的问题。Motivations已有的VLM虽然能在zero-shot的场景下适应于新任务，但他们只解决了有限的使用情况（如CLIP只解决了图片分类），由于主要缺乏生成语言的能力其不能应用于开放性任务。其他的一些方法虽然研究了基于视觉的语言生成但在数据量少的
论文笔记-基于多层感知器（MLP）的多变量桥式起重机自适应安全制动与距离预测 sagima_sdu 论文阅读
《IETCyber-SystemsandRobotics》出版山东大学TenglongZhang和GuoliangLiu团队的研究成果，文章题为“AdaptiveSafeBrakingandDistancePredictionforOverheadCranesWithMultivariationUsingMLP”。摘要桥式起重机的紧急制动及其制动距离预测是其安全运行中的关键难题。本文采用多层感知器
论文笔记：How Can Large Language Models Understand Spatial-Temporal Data? UQI-LIUWJ 论文笔记论文阅读语言模型人工智能
arxiv2024011introLLM在NLP和CV领域表现出色，但将它们应用于时空预测任务仍然面临挑战，主要问题包括：数据不匹配传统的LLMs设计用于处理序列文本数据，而时空数据具有复杂的结构和动态性，这两者之间存在显著差异模型设计限制现有的时空预测方法通常需要为特定领域设计专门的模型，这限制了模型的通用性和适应性数据稀缺和泛化能力传统的时空预测方法在面对数据稀缺或稀疏的情况下表现不佳，且泛化
SentiGAN: Generating Sentimental Texts via Mixture Adversarial Networks论文笔记 catbird233 深度生成模型笔记
另一篇很好的解释：https://www.itcodemonkey.com/article/6378.html摘要在自然语言生成领域,不同情感标签的生成越来越受到人们的关注。近年来,生成性对抗网(gan)在文本生成方面取得了良好的效果。然而,gan产生的文本通常存在质量差、缺乏多样性和模式崩溃的问题。本文提出了一个新的框架--sentyan,它有多个生成器和一个多类判别器,以解决上述问题。在我们的
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D