阿牛大牛中

地图上的‘词向量’：揭秘 Space2Vec 的魔法

文章目录

1. 背景
- 1.1 从NLP到空间世界
- 1.2 地理信息处理的问题
- 1.3 动机来源
2. 问题设定
3. 方法
- 3.1 Encoder
- - 3.1.1 Point Feature Encoder
  - 3.1.2 **Point Space Encoder**（重点）
- 3.2 Decoder
- - 3.2.1 Location Decoder
  - 3.2.2 Spatial Context Decoder
- 3.3 无监督学习

目前在调研处理地理位置坐标的方法，完善之前地理大模型的文章，现在调研一下这篇ICLR 2020的文章 Spece2Vec全名叫：MULTI-SCALE REPRESENTATION LEARNING FOR SPA- TIAL FEATURE DISTRIBUTIONS USING GRID CELLS。看看其中编码地图的思路或者方法能否有借鉴的地方。

论文地址：https://arxiv.org/pdf/2003.00824

代码地址：https://github.com/gengchenmai/space2vec

1. 背景

1.1 从NLP到空间世界

近年来（注意文章时间是2020年），自监督的文本编码模型在自然语言处理（NLP）中大放异彩。像 Word2Vec、GloVe、ELMo、BERT 这些模型，核心思路都是将“词语”转化为向量形式，这些向量不仅考虑词语本身，还融入了它在句子中的位置与上下文关系。这种向量化的表示方式极大提升了模型对语义的理解能力，并推动了 NLP 的飞跃式发展。

而在空间信息科学（GIScience）中，我们其实面临着非常类似的问题：一个地点的意义，往往不只取决于它的坐标位置，更依赖于它周围的空间环境。比如，一个 POI（Point of Interest）周围若都是餐厅，那它大概率也是商业相关的设施。因此，能否像处理文本一样，也为“空间中的每一个点”构建语义丰富的向量表示，就成为了空间人工智能迈向通用性的重要一步。

1.2 地理信息处理的问题

目前主流的空间表示方法，大多采取固定规则将地理坐标“离散化”，例如将城市划分成规则格子（tile embedding），或者将坐标直接喂入神经网络模型中。然而，这些方法在面对现实世界的多样空间分布时显得力不从心。不同类型的 POI 分布形式差异极大，例如女装店往往集中在商业区，而学校则分布均匀。若只用一个固定大小的网格对所有类型统一建模，不是会导致过拟合（格子太小），就是信息稀疏（格子太大）。

如下图所示，女装类 POI 在地图上呈现出高度聚集的分布，而教育类 POI 则分布更均匀。使用 Ripley’s K 方法分析可以发现，不同 POI 类型的密度增长曲线在不同尺度下变化明显。如果我们强行用相同尺度对它们建模，只会让模型性能在不同类型间失衡。因此，亟需一种支持“多尺度表达”的新方法，能同时适应局部聚集与大范围均匀的分布模式。

1.3 动机来源

值得一提的是，空间表示的“多尺度”问题，其实早已在生物学领域得到了回答。神经科学研究表明，哺乳动物的大脑中存在一种叫做“网格细胞（Grid Cells）”的神经元，它们以周期性的模式自动记录动物在空间中的位置。这种编码方式天然具有多尺度特性，帮助生物精准定位与路径导航。进一步研究发现，这种机制可以用多个角度相差 60° 的余弦函数叠加来模拟，构成一种六边形的周期性编码结构。

受到这一机制的启发，研究者提出了 Space2Vec 模型，通过引入多频率的正余弦函数，实现对地理位置的多尺度编码，并结合注意力机制来建模点与周围环境之间的空间关系。这个模型不仅在结构上模仿了大脑的导航系统，还在实际任务中展现出对不同空间分布的强适应性，为地理人工智能开辟了新的可能。

2. 问题设定

作者希望设计一个模型，能够对空间中的点进行“分布式表示”（Distributed Representation），即将地理空间中的每一个点表示成一个具有语义意义的向量。这种表示形式类似于自然语言处理中常见的词向量模型，但这里的“词”是地图上的“点”。

设一组空间点集合为：

$\mathcal{P} = {p_i}$

其中每个点 $p_i$ 表示一个 POI（Point of Interest），可以用位置和属性表示为：

$p_i = (\mathbf{x}_i, \mathbf{v}_i)$

$\mathbf{x}_i \in \mathbb{R}^L$ ：表示点的位置坐标（例如二维地图坐标 L=2）
$\mathbf{v}_i$ ：表示与该点相关的属性信息，如 POI 类型、名称、容量等。

我们希望学习一个函数：

$f_{\mathcal{P}, \theta}(\mathbf{x}) : \mathbb{R}^L \rightarrow \mathbb{R}^d$

这个函数将任意坐标 $\mathbf{x}$ 映射为一个 d-维的向量表示，其中 $\theta$ 是模型的可训练参数。

这个函数的目标是捕捉空间中点的分布特性 $f_{\mathcal{P}, \theta}(\mathbf{x})$ ，从而为任意位置生成有意义的向量表示。换句话说，这个表示不仅仅反映了点的几何位置，也蕴含了其语义背景。

在类比自然语言处理任务中：

词语的含义 = 词本身 + 它在句子中的位置；
地理空间中的点的含义 = 点的属性（如类型）+ 它在地图中的位置。

因此，属性 $\mathbf{v}_i$ （例如“博物馆”）和坐标 $\mathbf{x}_i$ 就分别类比为 NLP 中的“词的种类”和“词的位置”，而我们要构建的就是一种适用于空间点的“空间向量模型”。

3. 方法

为了实现空间点特征的分布式表示（distributed representation of point-features in space），Space2Vec 采用了一个 编码器-解码器（encoder-decoder） 的框架。整个过程可以分为两个阶段：编码（Encoding）与解码（Decoding）。

首先，对于任意一个点 $p_i = (\mathbf{x}_i, \mathbf{v}_i)$ ，其中 $\mathbf{x}_i$ 是该点的空间位置（如经纬度）， $\mathbf{v}_i$ 是其属性（例如 POI 类型、名称、容量等），将其分别进行编码：

位置编码器 $Enc^{(x)}()$ 将位置 $\mathbf{x}_i$ 映射为一个向量 $\mathbf{e}[\mathbf{x}_i] \in \mathbb{R}^{d^{(x)}}$ ；
特征编码器 $Enc^{(v)}()$ 将属性 $\mathbf{v}_i$ 编码为向量 $\mathbf{e}[\mathbf{v}_i] \in \mathbb{R}^{d^{(v)}}$ 。

最终，将两个向量拼接起来，形成该点的完整表示：

$\mathbf{e}_i = [\mathbf{e}[\mathbf{x}_i]; \mathbf{e}[\mathbf{v}_i]] \in \mathbb{R}^{d}, \quad \text{其中 } d = d^{(x)} + d^{(v)}$

这里的 [ ; ] 表示向量拼接操作。如果某些点的属性信息未知（例如某些预测区域），我们也可以只使用位置编码 $\mathbf{e}[\mathbf{x}_j]$ 进行表示。

接下来，作者设计了两种解码器，用于从上述编码向量中“解读”出点的语义信息：

位置解码器（Location Decoder）：记作 $Dec_s()$ ，该解码器尝试仅通过位置向量 $\mathbf{e}[\mathbf{x}_i]$ 来重建或预测该点的特征向量 $\mathbf{e}[\mathbf{v}_i]$ 。这相当于“仅凭地理位置猜测它是什么”。
空间上下文解码器（Spatial Context Decoder）：记作 $Dec_c()$ ，该解码器使用目标点周围 $n$ 个邻居点的空间表示和特征信息 ${\mathbf{e}_{i_1}, \dots, \mathbf{e}_{i_n}}$ 来预测中心点的特征 $\mathbf{e}[\mathbf{v}_i]$ 。这更像是人类的推理方式：从“周围是什么”来判断“你可能是什么”。

通过这种编码-解码机制，Space2Vec 实现了对空间中任意点的多尺度建模，既可以独立理解位置本身，也能结合空间邻居构建更丰富的语义表达。

3.1 Encoder

3.1.1 Point Feature Encoder

Point Feature Encoder 的核心目标是：将空间中每个点所携带的属性信息（如 POI 类型、名称、功能等）编码为一个语义特征向量，记为 $\mathbf{e}[\mathbf{v}_i] \in \mathbb{R}^{d^{(v)}}$ 。这种向量可以作为模型输入的一部分，帮助模型理解不同点的“是什么”。

在实际实现中，如果一个地理点 $p_i$ 包含多个 POI 类型（这在现实中很常见，如“书店+咖啡厅”），我们会将这些类型各自的嵌入向量（embedding）取平均来获得该点的整体特征向量。具体公式如下：

$\mathbf{e}[\mathbf{v}_i] = \frac{1}{H} \sum_{h=1}^{H} \mathbf{t}^{(\gamma)}_h$

其中， $H$ 是该点拥有的 POI 类型数量， $\mathbf{t}^{(\gamma)}_h$ 表示第 $h$ 个 POI 类型的嵌入向量。为了保持数值稳定性，最终会对生成的特征向量进行 $L_2$ 归一化，使其具有统一的尺度。

但是作者没写某个POI类型的embedding是怎么来的。

3.1.2 Point Space Encoder（重点）

在 Space2Vec 中，为了对空间位置（例如二维坐标）进行有效编码，作者提出了一种基于傅里叶变换原理的多尺度位置编码器 —— Point Space Encoder。我们可以将它看作是从大脑中“网格细胞”的周期性空间表示受到启发，结合傅里叶分析构建的一种编码方式。其目标是将任意二维位置向量 $\mathbf{x} \in \mathbb{R}^2$ 映射为一个高维的、方向敏感的、尺度可变的空间嵌入向量，用于表示空间中“某处”的语义特征。

傅里叶变换是一种经典的数学工具，它能将一个函数或信号表示为一组正弦函数和余弦函数的加权组合。在空间表示中，这种变换的一个显著优势是：能够通过不同频率的三角波对局部和全局结构进行编码。举个例子，我们可以用如下方式将一个标量坐标位置 $x$ 编码为周期性向量：

$[\sin(f_1 \cdot x), \cos(f_1 \cdot x), \sin(f_2 \cdot x), \cos(f_2 \cdot x), \dots]$

其中每个频率 $f_i$ 对应不同的尺度，能够捕捉位置 $x$ 所在的环境在不同“分辨率”下的结构变化。这种编码方式不仅保留了位置之间的相对距离信息，还天然具有周期性，非常适合处理空间数据中重复结构的表达。事实上，Transformer 模型中的位置编码也是这一思想的变体。

在 Space2Vec 中，作者不仅使用多频率的正余弦函数，还引入了多个空间方向进行编码，以模拟生物神经系统中的网格细胞行为。具体来说，作者选择了三个互相夹角为 $120^\circ$ 的方向向量：

$\mathbf{a}_1 = \begin{bmatrix} 1 \ 0 \end{bmatrix},\quad \mathbf{a}_2 = \begin{bmatrix} -\frac{1}{2} \ \frac{\sqrt{3}}{2} \end{bmatrix},\quad \mathbf{a}_3 = \begin{bmatrix} -\frac{1}{2} \ -\frac{\sqrt{3}}{2} \end{bmatrix}$

对于一个二维空间位置 $\mathbf{x}$ ，在尺度 $s$ 和方向 $j$ 上的位置编码被定义为：

$PE^{(t)}_{s,j}(\mathbf{x}) = \left[ \cos\left(\frac{\langle \mathbf{x}, \mathbf{a}_j \rangle}{\lambda_{\text{min}} \cdot g^{s/(S-1)}}\right), \sin\left(\frac{\langle \mathbf{x}, \mathbf{a}_j \rangle}{\lambda_{\text{min}} \cdot g^{s/(S-1)}}\right) \right] \quad \forall j = 1, 2, 3$

其中：

$\langle \mathbf{x}, \mathbf{a}_j \rangle$ 表示 $\mathbf{x}$ 在第 $j$ 个方向上的投影；
$\lambda_{\text{min}}$ 是最小尺度（最高频率）；
$\lambda_{\text{max}}$ 是最大尺度（最低频率）；
$\frac{\lambda_{\text{max}}}{\lambda_{\text{min}}}$ 是频率缩放比例；
$s$ 是当前尺度索引，总共有 $S$ 个尺度。

这意味着，在每个尺度下，作者使用三个方向和两种波形（cos 和 sin），共生成 $6$ 个数值，最终在 $S$ 个尺度上拼接得到一个 $6 S$ 维的向量作为位置的嵌入表示。

这种编码方式的优势在于它能实现“多尺度空间感知”。换言之，模型不仅能捕捉到空间中局部的微小变化（高频部分），还能同时理解更大范围的结构趋势（低频部分）。此外，相比于传统位置编码（例如 Transformer 中那种分别编码 $x$ 和 $y$ 维度的做法）：

$PE^{(g)}_{s,l}(\mathbf{x}) = \left[ \cos\left( \frac{x^{[l]}}{\lambda_{\text{min}} \cdot g^{s/(S-1)}} \right), \sin\left( \frac{x^{[l]}}{\lambda_{\text{min}} \cdot g^{s/(S-1)}} \right) \right] \quad \forall l = 1, 2$

Space2Vec 这种六边形方向周期编码方法具有更强的方向敏感性和空间结构表达能力，能模拟出类似于“网格状放电”的神经反应模式，显著提升对空间分布特征的建模能力。

3.2 Decoder

Space2Vec 提出了解码器结构用于空间向量的反向建模，旨在解决两类典型的 GIS 问题：位置建模（Location Modeling）和空间上下文建模（Spatial Context Modeling）。

3.2.1 Location Decoder

其中，Location Decoder 的核心目标是：仅通过一个点的位置向量，就能还原出这个点的语义特征信息。

在实际任务中，这种解码能力非常有用。例如，我们希望模型能仅根据一个地点的经纬度，预测出它的功能类型（如商店、公园、学校等），哪怕该地点没有明确标注标签。因此，Location Decoder 的任务可以理解为：位置 → 语义的学习过程。

具体来说，Location Decoder 被定义为一个前馈神经网络（Feed-forward Neural Network），记作 $Dec_s$ ，它的输入是空间编码器输出的位置向量 $\mathbf{e}[\mathbf{x}_i]$ ，输出是重构出的语义特征向量 $\mathbf{e}[\mathbf{v}_i]’$ 。整个过程可以形式化为：

$\mathbf{e}[\mathbf{v}_i]’ = Dec_s(\mathbf{x}_i; \theta_{dec_s}) = NN_{dec}(\mathbf{e}[\mathbf{x}_i])$

这里：

$\mathbf{x}_i$ 表示第 $i$ 个点的空间坐标；
$\mathbf{e}[\mathbf{x}_i]$ 是该点的位置编码结果，通常是由前面介绍的 Point Space Encoder 生成；
$NN_{dec}$ 是解码器神经网络，参数为 $\theta_{dec_s}$ ；
输出向量 $\mathbf{e}[\mathbf{v}_i]’$ 是对该点真实语义嵌入 $\mathbf{e}[\mathbf{v}_i]$ 的预测重构。

在训练过程中，作者采用了向量内积（dot product）作为相似性度量方式，通过比较预测向量 $\mathbf{e}[\mathbf{v}_i]’$ 与真实语义嵌入 $\mathbf{e}[\mathbf{v}_i]$ 的相似度，来优化模型参数。换句话说，目标是最大化它们之间的匹配程度，同时引入其他负样本（即来自其他位置的点的特征向量）作为对比，以增强判别能力。

这种从位置向语义的映射能力，是 Space2Vec 架构中最直接的地理推理方式，体现了“空间结构本身就蕴含语义”的基本假设。

3.2.2 Spatial Context Decoder

除了基于位置的 Location Decoder，Space2Vec 还设计了一个更强大的模块：Spatial Context Decoder，它不仅使用中心点的位置，还结合了其邻近点的空间和语义信息，以更全面地预测该点的语义嵌入向量。这个设计非常适合处理地理信息系统（GIS）中常见的“空间上下文建模”任务，例如：一个位置的功能可能并不只是由自身决定，而是受其邻域环境影响（比如周围都是学校，那中间的点也可能是教育类设施）。

在具体实现中，对于一个中心点 $p_i = (\mathbf{x}_i, \mathbf{v}_i)$ ，我们考虑它周围的 $n$ 个邻居点 ${p_{i1}, p_{i2}, \dots, p_{in}}$ ，每个邻居点都有自己的空间编码和语义向量。Spatial Context Decoder 的目标是使用这些邻居点的嵌入信息来重构中心点的语义向量 $\mathbf{e}[\mathbf{v}_i]$ 。

这个过程的整体形式如下：

$\mathbf{e}[\mathbf{v}_i]’ = Dec_c(\mathbf{x}_i, {\mathbf{e}_{i1}, …, \mathbf{e}_{in}}; \theta_{dec}) = g\left(\frac{1}{K} \sum_{k=1}^K \sum_{j=1}^n \alpha_{ijk} \mathbf{e}[\mathbf{v}_{ij}]\right)$

这里的含义如下：

$g(\cdot)$ 是激活函数（如 Sigmoid）；
$K$ 是注意力头（multi-head attention）的数量；
$\alpha_{ijk}$ 是第 $k$ 个注意力头中，中心点 $p_i$ 对第 $j$ 个邻居点的注意力权重；
$\mathbf{e}[\mathbf{v}_{ij}]$ 是第 $j$ 个邻居点的语义嵌入。

这个结构类似于图注意力网络（Graph Attention Network, GAT），它将多个邻居点的特征通过加权平均聚合，以形成中心点的表示。每个注意力头都学习不同的关注模式，然后平均后作为最终输出。

注意力权重 $\alpha_{ijk}$ 的计算方式：

注意力机制的关键是计算每个邻居的重要性，即注意力得分 $\alpha_{ijk}$ 。Space2Vec 中的注意力权重是通过 LeakyReLU 激活函数计算的“相似度评分”，公式如下：

$\sigma_{ijk} = LeakyReLU\left( \mathbf{a}_k^T \left[ \mathbf{e}[\mathbf{v}i]_{init}; \mathbf{e}[\mathbf{v}_{ij}]; \mathbf{e}[\mathbf{x}_i - \mathbf{x}_{ij}] \right] \right)$

解释如下：

$\mathbf{e}[\mathbf{v}_i]_{init}$ 是当前中心点的特征初始估计值（我们下面会讲它从哪来）；
$\mathbf{e}[\mathbf{v}_{ij}]$ 是邻居点的语义向量；
$\mathbf{e}[\mathbf{x}_i - \mathbf{x}_{ij}]$ 是中心点与邻居点之间的位移编码（表示方向和距离）；
$\mathbf{a}_k$ 是第 $k$ 个注意力头的参数向量；
LeakyReLU 是一种非线性激活函数。

然后再将这些打分通过 softmax 标准化为权重：

$\alpha_{ijk} = \frac{\exp(\sigma_{ijk})}{\sum_{o=1}^n \exp(\sigma_{iok})}$

这样，模型就能自动学习：哪个邻居点在当前任务中最“相关”，而不是平均处理所有邻居。

关于初始语义估计 $\mathbf{e}[\mathbf{v}_i]_{init}$ ：

由于目标是预测 $\mathbf{e}[\mathbf{v}_i]$ ，而注意力打分又用到了它，所以作者引入了一个初始估计值 $\mathbf{e}[\mathbf{v}_i]_{init}$ ，它是通过另一层类似的注意力机制得到的，但不包含 $\mathbf{e}[\mathbf{v}_i]$ 本身，只用邻居信息：

$\sigma’_{ijk} = LeakyReLU\left( \mathbf{a}_k^T \left[ \mathbf{e}[\mathbf{v}_{ij}]; \mathbf{e}[\mathbf{x}_i - \mathbf{x}_{ij}] \right] \right)$

和前面类似，但此时不使用 $\mathbf{e}[\mathbf{v}_i]_{init}$ 作为输入，从而避免信息泄露。最终形成初始估计 $\mathbf{e}[\mathbf{v}_i]_{init}$ 后，才会用于 $\sigma_{ijk} = LeakyReLU\left( \mathbf{a}_k^T \left[ \mathbf{e}[\mathbf{v}i]_{init}; \mathbf{e}[\mathbf{v}_{ij}]; \mathbf{e}[\mathbf{x}_i - \mathbf{x}_{ij}] \right] \right)$ 的注意力打分。

3.3 无监督学习

Space2Vec 的训练是以无监督方式进行的，也就是说，它并不依赖人工标注的类别标签，而是利用地理点本身的位置与空间邻居信息，通过构造预测任务来学习语义表示。模型的核心任务是：让每个点能够“预测出自己是谁”，即仅通过自身的位置和邻域，重构出自己的语义表示。

整个训练过程以最大化自信息一致性为目标，模型结构由两部分组成：

Encoder（编码器）：将空间位置和属性嵌入为向量
Decoder（解码器）：从编码向量重构语义嵌入

1. 编码器：将位置与类型信息转换为向量表示

1.1 空间编码器（Point Space Encoder）

输入为一个点的位置坐标 $\mathbf{x}_i \in \mathbb{R}^2$ ，编码器 $Enc^{(x)}$ 使用傅里叶编码思想，对多个尺度下的位置投影应用正弦/余弦变换，输出一个高维位置嵌入向量 $\mathbf{e}[\mathbf{x}_i] \in \mathbb{R}^{d^{(x)}}$ 。该模块的参数包括：

多尺度位置频率控制参数（隐含于编码函数中）
若使用神经网络结构包裹（如文中 $NN(\cdot)$ ），则包含网络权重 $\theta_{enc}^{(x)}$

1.2 语义编码器（Point Feature Encoder）

每个点 $p_i$ 还携带一个 POI 类型集合 ${\gamma_1, \dots, \gamma_H}$ ，每个类型对应一个可训练的向量 $\mathbf{t}_h^{(\gamma)} \in \mathbb{R}^{d^{(v)}}$ 。这些类型向量通过平均得到语义向量：

$\mathbf{e}[\mathbf{v}_i] = \frac{1}{H} \sum_{h=1}^{H} \mathbf{t}_h^{(\gamma)}$

这些类型向量 $\mathbf{t}_h^{(\gamma)}$ 是模型参数的一部分，会在训练过程中更新。这一部分参数集合记作 $\theta_{enc}^{(v)}$ 。

2. 解码器：从编码中重建语义表示

模型的目标是根据编码向量 $\mathbf{e}[\mathbf{x}_i]$ 或其邻域特征，预测出该点的语义向量 $\mathbf{e}[\mathbf{v}_i]’$ 。

2.1 Location Decoder

Location Decoder 是一个前馈神经网络，用于根据位置编码预测语义向量：

$\mathbf{e}[\mathbf{v}_i]’ = Dec_s(\mathbf{x}_i; \theta{dec_s}) = NN_{dec}(\mathbf{e}[\mathbf{x}_i])$

参数 $\theta_{dec_s}$ 是该网络的权重，会被训练更新。

2.2 Spatial Context Decoder

该模块融合了邻域中多个点的位置 + 语义信息，通过注意力机制加权聚合邻居的语义向量，最终预测中心点 $p_i$ 的语义嵌入 $\mathbf{e}[\mathbf{v}_i]’$ 。整个过程涉及两个阶段：

先估计初始值 $\mathbf{e}[\mathbf{v}_i]_{init}$
然后通过多头注意力机制，聚合邻居的表示得到最终预测

该模块包含多组注意力头参数 $\mathbf{a}_k$ ，以及聚合网络参数 $\theta_{dec_c}$ ，也会在训练中被更新。

3. 损失函数设计：让预测语义尽量接近真实语义

训练的核心是一个匹配任务。我们希望预测出的语义向量 $\mathbf{e}[\mathbf{v}_i]’$ 与真实语义 $\mathbf{e}[\mathbf{v}_i]$ 尽可能一致。

这可以通过最大化 log-likelihood 实现：

$\mathcal{L}_{\mathcal{P}}(\theta) = - \sum_{p_i \in \mathcal{P}} \log \frac{ \exp\left( \mathbf{e}[\mathbf{v}_i]^T \mathbf{e}[\mathbf{v}_i]’ \right)} { \sum_{p_o \in \mathcal{P}} \exp\left( \mathbf{e}[\mathbf{v}_o]^T \mathbf{e}[\mathbf{v}_i]’ \right) }$

解释如下：

分子是预测语义和真实语义的匹配度（通过内积衡量）；
分母是所有可能候选点中与预测向量的匹配度；
最终目标是让正确点的相似度最大，其他点的最小。

4. 负采样优化：提升训练效率

由于分母计算代价太大，作者采用了负采样（Negative Sampling）方法，改写损失为：

$\mathcal{L}’_{\mathcal{P}}(\theta) = \sum_{p_i \in \mathcal{P}} \left( \log \sigma\left(\mathbf{e}[\mathbf{v}_i]^T \mathbf{e}[\mathbf{v}_i]’\right) + \frac{1}{|\mathcal{N}_i|} \sum_{p_o \in \mathcal{N}_i} \log \sigma\left(-\mathbf{e}[\mathbf{v}_o]^T \mathbf{e}[\mathbf{v}_i]’\right) \right)$

其中：

$\mathcal{N}_i$ 是为 $p_i$ 随机采样的一组负样本；
$\sigma(x)$ 是 Sigmoid 函数；
第一项是“正匹配得分”，第二项是“负样本惩罚”。

这样，大大减少了每轮训练的计算量。

5. 训练过程：端到端参数更新

模型参数包括：

位置编码器参数 $\theta_{enc}^{(x)}$ ；
类型嵌入矩阵（每个 $\mathbf{t}_h^{(\gamma)}$ ）；
解码器参数（ $NN_{dec}$ 或注意力网络） $\theta_{dec}$ ；

所有这些参数都在损失函数的反向传播过程中被更新。这构成了一个完整的端到端无监督学习框架。

最终，模型能够学会：

编码器：如何将位置和类型嵌入为结构化语义向量；
解码器：如何从编码中预测出地点的真实语义；
语义 embedding 表达：如何让同一类型的点聚在一起，不同类型的点远离彼此。

Neo4j 图数据库安装教程（2024最新版）—— Windows / Linux / macOS 全平台指南 2501_91537435 图数据库 neo4j 数据库 windows
Neo4j图数据库安装教程（2024最新版）——Windows/Linux/macOS全平台指南Neo4j是目前最流行的图数据库（GraphDatabase），广泛应用于社交网络、推荐系统、知识图谱等领域。本文将详细介绍Windows、Linux和macOS三大平台的Neo4j安装方法，并包含配置优化、基础使用示例和常见问题解决。一、Neo4j简介1.什么是Neo4j？Neo4j是一个高性能的No
2025 AI编程工具全景图：七强横评与实战落地实战指南杜哥无敌 AI应用人工智能
—深度拆解最新技术趋势，赋能开发者效率革命一、市场现状与演进趋势：从辅助工具到开发核心引擎2025年，AI编程工具已从“代码补全插件”进化为覆盖需求分析、编码、测试、部署的全流程智能伙伴。据Gartner数据，全球75%开发者依赖AI生成代码，头部企业25%的新代码由AI生成后人工审核。技术演进呈现三大特征：多模型协同：主流工具集成GPT-4o、Claude3.7、Gemini2.0等模型，动态切
flutter结合ai工具（其他语言通用）程一个大前端 flutter 人工智能
一、为什么Flutter开发者需要免费AI工具？1.减少重复性编码Flutter开发中，UI组件、网络请求、状态管理等代码高度重复，AI可自动生成这些代码。示例：输入"创建一个MaterialDesign风格的登录页面"，AI工具能生成完整代码，减少手动编写时间2。2.加速调试与错误修复AI可分析运行时错误，提供修复建议，甚至自动修复常见问题。案例：当Dart代码出现NullPointerExce
Cortex-A9解码H265遇到的程序崩溃问题 melonbo FFMPEG ffmpeg
1、应用背景处理器采用Cortex-A9，从网络摄像机拉取RTSP视频流，编码格式为H265，在打开rtsp视频流时有小概率出现程序崩溃的问题。2、分析根据coredump文件显示，问题出现在hevcdsp_sao_neon.s文件，它的作用是优化HEVC视频编码器的性能，特别是在处理视频帧时，通过NEON指令集实现的并行处理能力，可以显著提高视频编码的速度。ARMNEON指令集是ARM平台上的S
物流数据行业分析（包含完整代码和流程）------python数据分析师项目Anaconda 欲梦yhd 数据分析项目大数据 conda python
一、引言数据分析流程为明确目的、获取数据、数据探索和预处理、分析数据、得出结论、验证结论、结果展现。物流业务中对数据进行深入挖掘和分析的过程，旨在提高运输效率、降低运输成本、提高客户满意度，以及提高公司的竞争力。本案例物流数据分析目的：a、配送服务是否存在问题b、是否存在尚有潜力的销售区域c、商品是否存在质量问题二、详细流程1、数据预处理（数据清洗）（1）数据导入使用panda库读取数据，编码方式
Python 数据分析与可视化 Day 11 - 特征工程基础蓝婷儿 python python 数据分析人工智能
✅今日目标理解特征工程在数据分析和机器学习中的意义掌握常见特征类型的处理方式：数值型、类别型、时间型学习特征提取、转换、标准化、独热编码（One-HotEncoding）等核心操作为后续建模任务做好特征准备工作一、什么是特征工程？特征工程是将原始数据转换为模型可学习的“特征向量”的过程，是机器学习效果好坏的核心因素之一。常见任务包括：缺失值处理（已学）异常值处理（已学）数值归一化、标准化类别变量编
瀑布式开发与敏捷开发的区别是什么易成技术团队 pingcode 研发管理工具 IT 项目管理企业管理智能化研发管理工具
摘要：瀑布模型式是最典型的预见性的方法，严格遵循预先计划的需求、分析、设计、编码、测试的步骤顺序进行。敏捷开发以用户的需求进化为核心，采用迭代、循序渐进的方法进行软件开发。我们将在文章中详细说明两者各自的适合场景。详细解答：瀑布和敏捷都不是什么新概念，关于敏捷开发与瀑布开发的优势与缺点都已经比较明确，这里根据全网的资料给大家做一些整理和总结。一、瀑布开发瀑布模型式是最典型的预见性的方法，严格遵循预
BLDC风扇方案介绍-开发中遇到的问题
开发过程中的问题本文主要介绍在实际开发过程中遇到的问题，以及如何解决的。在板子上调节档位导致重启在开发完成后进行测试的情况下，发现在板子上快速转动旋转编码器会导致系统不受控制，然后重启，后来发现是因为旋转编码器使用的外部中断的方式导致的。由于一直转动编码器，导致系统一直处于外部中断中，其他任务无法正常执行，从而系统重启。解决办法：将编码器触发判断设置成任务的形式，定期去判断电平处理。这样处理完后，
Python隐式反馈数据集库之implicit使用详解 Rocky006 python 开发语言
概要Implicit是一个专注于隐式反馈数据集的协同过滤推荐系统Python库，由BenFrederickson开发。与显式反馈（如用户明确给予的评分）不同，隐式反馈是指用户通过行为间接表达偏好的数据，如点击次数、浏览时长或购买历史。这类数据在实际应用中更为普遍，但也更难以处理。传统推荐系统如Surprise或LightFM虽然功能全面，但在处理大规模稀疏矩阵时性能不佳。Implicit库通过优化
我用这10个工具，开发效率提升了3倍！ ZoeXu-Arch 人工智能 ai python 数据库自动化
大家好，我是Zoe，今天来和大家聊聊开发效率这件事。前言：选对工具，开发效率直接起飞在这个卷出银河系的时代，写得快、测得稳、部署无感，才是开发者的核心竞争力。真正拉开人与人差距的，不只是编码能力，而是你有没有一整套趁手的“开发武器库”。最近我测试并整理了10款亲测有效、提升开发效率的神器，涵盖：AI编程助手、本地开发环境、数据处理、DevOps流水线……一句话总结：这10个工具，顶得上一个团队。希
js代码开发
当然可以！为你说明在VSCode中进行JavaScript开发的环境配置，这是一个非常普遍且高效的组合。别担心，配置过程非常直接。JS开发环境的核心主要包括两大部分：运行时(Runtime)：即能够执行JavaScript代码的环境。开发工具(Tooling)：即让编码过程更高效、更不容易出错的工具，这部分主要通过VSCode扩展来实现。下面我为你分解成清晰的步骤，跟着做就行。第一步：安装Node
php amp 字符串处理,php字符串处理之全角半角转换布博士 php amp 字符串处理
半角全角的处理是字符串处理的常见问题，本文尝试为大家提供一个思路。一、概念全角字符unicode编码从65281~65374(十六进制0xFF01~0xFF5E)半角字符unicode编码从33~126(十六进制0x21~0x7E)空格比较特殊,全角为12288(0x3000),半角为32(0x20)而且除空格外,全角/半角按unicode编码排序在顺序上是对应的所以可以直接通过用+-法来处理非空
后端开发工程师（.Net方向） Flora051 求职招聘
5年以上，23-30k职位描述：工作内容：1、负责相应产品模块的需求分析、框架设计和编码工作；2、分析项目需求，能给出良好的解决方案，并协助其他人员完成开发及调试工作；3、Codereview，编写单元测试，高质量完成功能；4、持续关注新的技术，选择适合的技术持续迭代改进产品。任职资格：1.计算机相关专业，必须本科及以上学历，5年以上.net研发经验(core3年以上)；2.有医疗健康开发经验者优
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
Java AI 新纪元：Spring AI 与 Spring AI Alibaba 的崛起小沛9 Spring AI Alibaba Spring AI java 人工智能 spring spring ai SAA
此章节没什么营养，只是一个描述，同时也能看到AI的能力（文章基本都是AI进行生成的），小沛觉得开始不写点引言好像差了点什么东西，好像鱼离开了自行车。引言：AI时代对Java开发者的机遇与挑战，Java在AI领域的现状在当今技术飞速发展的时代，人工智能（AI）已不再是遥不可及的未来概念，而是深刻地融入到我们生活的方方面面，从智能推荐系统到自动驾驶，从自然语言处理到计算机视觉，AI正以前所未有的速度改
基于Python的京东商品信息采集实战：用Playwright+Pandas打造高效数据抓取工具 Python爬虫项目 2025年爬虫实战项目 python pandas 开发语言爬虫游戏笔记
一、项目背景与目标在当今电商生态中，价格、销量、评论等商品信息对用户和商家来说至关重要。无论是做数据分析、电商监控，还是构建商品推荐系统，第一步都是：获取真实的商品数据。本项目以京东商城搜索结果页为目标，通过构建一个高效、可复用的商品信息采集爬虫系统，实现对商品名称、价格、店铺、评论数、链接等核心信息的提取。二、技术路线概述我们采用如下技术架构：模块技术选型浏览器自动化Playwright（现代、
SerDes和GMSL介绍槿盛网络
SerDes（Serializer/Deserializer）SerDes，即串行器和解串器的缩写，是一种用于将并行数据转换为串行数据，以及将串行数据还原为并行数据的技术。这种技术广泛应用于各种高频率通信系统中，特别是在数据中心、汽车电子和消费电子设备中。SerDes的工作原理包括数据编码、调制和解调等多个步骤，这些步骤对于提高数据传输的效率和完整性至关重要。数据编码：在传输前，数据需要经过编码以
Python网安-zip文件暴力破解（仅供学习） Whoisshutiao python网安 python 开发语言网络安全
目录源码在这里需要的模块准备一个密码本和需要破解的ZIP文件一行一行地从密码文件中读取每个密码。核心部分注意，需要修改上段代码注释里的这段具有编码问题的代码：源码在这里https://github.com/Wist-fully/Attack/tree/cracker需要的模块fromtqdmimporttqdmimportzipfileimportpyzipper准备一个密码本和需要破解的ZIP文
一周搞定Redis面试题|第一天认识Redis以及Redis数据类型天天开心(∩_∩) redis 数据库面试缓存
目录认识Redis1.介绍一下Redis2.使用Redis的好处在哪里Redis的数据类型3.Redis的数据类型有哪些String三种编码方式常见面试题4.在Redis中String数据类型的编码方式有几种，区别是什么？5.浮点型在String使用什么编码方式6.为什么EMBSTR的阈值是44字节7.String可以有多大？8.SDS有什么作用？List常见面试题9.List对象底层存储的编码实
重排利器：行列式点过程（DPP）在推荐系统中的应用 Jay Kay 推荐算法数学建模推荐算法
在推荐系统的重排阶段，我们常面临结果同质化问题——精排结果相似物料扎堆，导致用户体验单调。行列式点过程（DeterminantalPointProcesses,DPP）通过数学建模相关性与多样性的平衡，成为解决该问题的经典方案。一、DPP的核心思想DPP将推荐列表视为一个点过程，其核心是计算子集出现的概率。给定候选集(Z)（精排输出的Top-N物料），DPP定义子集(Y\subseteqZ)出现的
推荐算法特征工程实战：用户与物料动态画像构建指南 Jay Kay 推荐算法推荐算法算法机器学习
在推荐系统的特征工程中，动态画像是提升推荐精准性的核心武器。通过捕捉用户行为偏好和物料热度变化，算法能实现千人千面的精准推荐。本文结合两张关键图表，深入解析动态画像的构建方法与工程实践。一、用户动态画像：六大维度精准刻画兴趣偏好用户动态画像基于六个关键维度构建（如表2-1所示），形成"6W"行为模型：用户粒度物料属性时间粒度动作类型统计对象统计方法1.核心维度解析（附典型场景）维度可选值应用场景用
JSON数据格式及其在WEB开发中的应用 m0_70273331 Web前端经验分享前端前端框架
json与xml互相转换JSON的格式必须是数组或者对象，其属性支持一下类型：boolean:true,falsenumber:0,1,2,3string:“abc”object:null,{},{“a”:“b”}array:[],[1,2]严格的语法约束不能有ascii之外的字符，汉字应使用”\u6c49”格式；然而在utf-8流行的时代，汉字不编码已不是啥大问题了；不能有注释，行注释与块注释都
信息检索简介——文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介2005年8月17日至9月3日在美国加利福尼亚州伯克莱纳举行了SIGIR国际会议（中文全称“计算机信息retrieval国际会议”），这是信息检索领域的顶级会议之一。该会议由ACM主办，主题涵盖了包括文本处理、搜索引擎、数据挖掘、机器学习、推荐系统等多个热门方向。此次会议是第一次将信息检索作为一个学科，并取得重大突破。本文试图对SIGIR进行一个完整的介绍，阐述
路由器对数据包的处理过程分析笔记月生言己笔记智能路由器网络
虽然TCP-IP协议中传输数据会在各个路由器再次经过物理层、链路层、网络层的解封装、加工、封装、转发，但是对于两个主机间的运输层，在逻辑上，应用进程是直接通信的。路由器主要工作在网络层，但它也涉及到物理层和链路层的一些功能。以下是路由器在这三个层面上对数据进行的处理：物理层：在物理层，路由器负责接收和发送比特流（即电信号、光信号等）。这包括编码和解码信号，以及处理接口上的物理连接。路由器的每个端口
SpringMVC 中的 RESTful 编码风格案例详解 dawn191228 Java Web restful pandas 后端 java mvc spring
文章目录一、RESTful简介二、SpringMVC中实现RESTful的方法三、HiddenHttpMethodFilter四、RESTful代码实现案例在现代Web开发中，RESTful架构风格越来越受到开发者的青睐。SpringMVC作为一个强大的JavaWeb开发框架，对RESTful风格的支持非常出色。本文将详细介绍SpringMVC中RESTful编码风格的简介、实现方法、Hidden
GO 语言学习之函数唯独不开心 golang 学习 go 开发语言
函数我们一直都在使用，但是还是有很多细节的内容需要深入了解一下，方便后续的编码实践。函数定义：func函数名([参数列表])[返回值]{函数体}funcadd(aint,bint)int{returna+b}基本概念：函数签名（FunctionSignature）：包含函数名、参数列表（参数的类型和顺序）以及返回值类型。在示例中add(aint,bint)int就是函数签名。它定义了函数的外部接口
测试第六讲-开发&测试阶段划分为你奋斗！软件测试测试用例经验分享笔记
一、软件开发的阶段划分1、需求分析阶段有需求分析人员完成，产出物：《需求规格说明书》2、概要设计阶段3、详细设计阶段一般由系统架构师（分析师）完成，产出物：《概要设计说明书》、《详细设计说明书》4、编码阶段由开发人员完成产出物：程序面试题：哪个阶段引入的bug最多？哪个阶段最少？需求分析阶段引入的bug最多，其次是设计阶段，最少的是编码阶段。结论：1）测试不能只测试程序，文档也必须要测2）测试工作
SBC编解码器库：蓝牙音频传输的核心草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：SBC编解码器库是一个软件工具集，提供在蓝牙技术中核心使用的音频编解码功能。该库以C语言实现，包含编码、解码以及相关设置控制功能，使得开发者可以在应用中集成SBC编解码能力，如蓝牙音频播放器或耳机。SBC编解码工作原理基于子带编码理论，通过量化和编码音频信号的各个子带，实现高效的数据传输。SBC支持多种比特率、采样率和声道配置，并包含错误检测与恢复机制，控制接
告别配置地狱：用Kustomize实现多环境一键切换 Star_Sea_77 云原生与DevOps工程实践云原生
告别配置地狱：用Kustomize实现多环境一键切换摘要本文针对软件开发中多环境配置管理的痛点，详细阐述如何利用Kustomize实现不同环境配置的高效管理与一键切换。通过对比Kustomize与Helm的适用场景，为中小团队提供选型指南；揭示ConfigMap热更新失效、Secret硬编码泄露等常见问题并提供解决方案；展示如何通过Kustomize构建高效的配置管理流程，实现80%配置共享、20
庙算兵棋推演AI开发初探（7-神经网络训练与评估概述）超自然祈祷智能决策人工智能神经网络深度学习
前面我们提取了特征做了数据集、设计并实现了处理数据集的神经网络，接下来我们需要训练神经网络了，就是把数据对接好灌进去，训练后查看预测的和实际的结果是否一致——也就是训练与评估。数据解析提取数据编码为数据集设计神经网络-->>神经网络训练与评估神经网络一个重要指标是收敛，就是用可以逼近任意函数的神经网络是否可以逼近你数据集中隐含的模式。再重复一遍【特征工程】与【神经网络】的区别：前者就像人发现了牛顿
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S