ericdiii

【论文翻译】年龄估计 CORAL

原文：Rank consistent ordinal regression for neural networks with application to age estimation

链接：https://arxiv.org/pdf/1901.07884.pdf

摘要

在许多现实世界的预测任务中，类的标签包括关于标签之间相对排序的信息，这些信息是常用的损失函数（如多类别交叉熵 cross-entropy）所没有的。最近，深度学习社区采用序数回归框架来考虑此类排序信息。通过将序数目标转换为二元分类子任务，使神经网络配备了序数回归功能。然而，这种方法受到不同二元分类器之间不一致的影响。为了解决这些不一致问题，作者提出了COnsistent RANk Logits (CORAL) 框架，该框架对 rank-monotonicity 和 consistent confidence scores 具有强大的理论保证。此外，所提出的方法为 architecture-agnostic，并且可以扩展任意最先进的深度神经网络分类器，用于有序回归任务。对用于年龄预测的一系列人脸图像数据集所提出的 rank-consistent 方法的经验评估表明，与参考有序回归网络相比，预测误差显着减少。

1. 介绍

序数回归（也称为序数分类）描述了在序数尺度上预测标签的任务。这里，排序规则或分类器 h 将每个对象 $\mathbf{x}_i$ ∈ X 映射到有序集合 h : X → Y，其中 Y = { $\mathbf{r}_1$ ≺ ... ≺ $\mathbf{r}_K$ }。与分类相反，标签提供了足够的信息来对对象进行排序。然而，与 metric regression 相反，标签值之间的差异是任意的。

虽然机器学习领域开发了许多用于预测建模的强大算法，但大多数算法都是为分类任务而设计的。 Li 和 Lin 提出的扩展二元分类方法构成了许多有序回归实现的基础。然而，这种方法的基于神经网络的实现通常会受到二元排名之间的分类器不一致的影响。单个二元分类器预测之间的这种不一致问题如图 1 所示。作者提出了一种新的方法和定理来保证分类器的一致性，可以很容易地在各种神经网络架构中实现。

此外，除了理论上的 rank-monotonicity 保证外，本文还对我们挑战现实世界数据集的方法进行了实证分析，这些数据集使用提出的卷积神经网络 (CNN) 方法来预测人脸图像中的个人年龄。衰老可以被视为一个非平稳的过程，因为年龄增长效应会因人的年龄而异。在童年时期，面部衰老主要与面部形状的变化有关，而成年时期的衰老主要由皮肤纹理的变化来定义。基于这一假设，可以使用基于序数回归的方法对年龄预测进行建模。

本文的主要贡献如下：

1. 序数回归的 consistent rank logits (CORAL) 框架，具有分类器一致性的理论保证；

2. 实现 CORAL 以适应常见的 CNN 架构，例如 ResNet，用于序数回归；

3. 不同年龄估计数据集的实验表明，与序数回归的参考框架相比，CORAL 保证的二元分类器一致性提高了预测性能。

请注意，这项工作侧重于年龄估计，研究提出的方法对有序回归的有效性。然而，所提出的技术可用于其他有序回归问题，例如人群计数、深度估计、生物细胞计数、客户满意度等。

2. 相关工作

2.1. 有序回归和排序

过去已经为序数回归开发了几种广义线性模型的多元扩展，包括流行的比例优势和比例风险模型。此外，机器学习领域基于经过充分研究的分类算法的扩展开发了序数回归模型，通过重新制定问题以利用多个二元分类任务。这方面的早期工作包括使用感知器和支持向量机。Li 和 Lin 提出了一个通用的归约框架，统一了许多现有算法的观点。

2.2. 有序回归CNN

虽然早期使用 CNN 处理有序目标的工作采用了传统的分类方法，但 Li 和 Lin 提出的从序数回归到二元分类的一般归约框架最近被 Niu 等人作为序数回归 CNN (OR-CNN)。在 OR-CNN 方法中，将具有 K 个等级的序数回归问题转化为 K-1 个二元分类问题，其中第 k 个任务预测人脸图像的年龄标签是否超过等级 , k = 1, ... , K − 1. 所有 K−1 任务共享相同的中间层，但在输出层中分配了不同的权重参数。

虽然 OR-CNN 能够在基准数据集上实现最先进的性能，但它不能保证一致的预测，因此对单个二元任务的预测可能会不一致。例如，在年龄估计设置中，如果第 k 个二元任务预测一个人的年龄超过 30 岁，而前一个任务预测这个人的年龄小于 20 岁，这将是矛盾的。当 K-1 个任务预测组合起来获得估计年龄时，这种不一致可能是次优的。

Niu 等人承认分类器不一致并不理想，并指出确保 K-1 二元分类器一致将大大增加训练复杂性。本文中提出的 CORAL 方法解决了这两个问题，为分类器的一致性提供了理论保证，并且不会增加训练复杂度。

2.3. 用于年龄估计的其他 CNN 架构

Chen 等人提出了对 ORCNN 的修改，称为 Ranking-CNN，它使用一组 CNN 进行二元分类并聚合预测以估计给定人脸图像的年龄标签。研究人员表明，与具有多个二进制输出的单个 CNN 相比，训练一组 CNN 提高了预测性能，这与众所周知的事实一致，即一个集成模型可以实现比每个模型更好的泛化性能集成中的个体分类器。

最近的研究还表明，与单任务相比，训练一个共享低层参数的多任务 CNN 可以用于各种人脸分析任务（人脸检测、性别预测、年龄估计等）可以提高不同任务的整体性能CNN。

使用二元分类器进行序数回归的另一种方法是 Polania 等人提出的 siamese CNN 架构。它通过输入图像和多个精心选择的锚图像之间的成对比较来计算排名。

3. 提出的方法

本节描述了我们提出的 CORAL 框架，该框架解决了 Niu 等人的 ORCNN 中分类器不一致的问题，它基于多个二元分类任务进行排名。

3.1. 预备

令 $D = \begin{Bmatrix} \mathbf{x}_i,y_i \end{Bmatrix}^N_{i=1}$ 为由 N 个训练示例组成的训练数据集。这里， ∈ X 表示第 i 个训练示例，表示相应的秩，其中 $y_i\in \mathbf{y}=\begin{Bmatrix} r_1,r_2,...r_k \end{Bmatrix}$ 具有有序秩 ≻ $r_{K-1}$ ≻... ≻ 。序数回归任务是找到一个排序规则 h : X → Y 使得损失函数 L(h) 最小化。

令 C 为 K×K cost 矩阵，其中是将示例 ( $\mathbf{x}$ , y) 预测为秩的成本。通常，对于 y ≠ r k ， $C_{y,y} = 0$ 且 $C_{y,r_k} > 0$ 。在序数回归中，我们一般更喜欢成本矩阵的每一行都是 V-shaped 的，即如果 $r_k \leqslant y$ ， $C_{y,r_{k-1}} \geqslant C_{y,rk}$ ，如果 $r_k \geqslant y$ ， $C_{y,rk} \geqslant C_{y,r_{k+1}}$ 。分类成本矩阵的条目 $C_{y,r_k} = 1\begin{Bmatrix} y\neq r_k \end{Bmatrix}$ 不考虑排序信息。在有序回归中，秩被视为数值，绝对成本矩阵通常由 $C_{y,r_k} = \begin{vmatrix} y-r_k \end{vmatrix}$ 定义。

Li 和 Lin 提出了一个通用的归约框架，用于将有序回归问题扩展为几个二元分类问题。该框架需要一个在每一行中都是凸的成本矩阵 $C_{y,r_{k+1}}-C_{y,r_{k}} \geqslant C_{y,r_{k}}-C_{y,r_{k-1}}$ 获得秩单调阈值模型。由于每个二元任务的成本相关权重对于每个训练示例都是特定的，且因为其高训练复杂性，这种方法在实践中被认为是不可行的。

作者提出的 CORAL 框架既不需要具有凸行条件的成本矩阵，也不需要依赖于每个训练示例的显式加权项来获得秩单调阈值模型并为每个二元任务生成一致的预测。

3.2. 具有一致秩对数模型的序数回归

在本节中，作者将描述提出的用于序数回归的一致秩对数 (CORAL) 框架。 3.2.1 小节描述了用于等级预测的二元任务的标签扩展。 CORAL 框架的损失函数在 3.2.2 小节中描述。在 3.2.3 小节中，作者证明了二元分类任务之间的等级一致性定理，该定理保证二元任务产生一致的排名预测。

3.2.1. 标签扩展和排名预测

给定一个训练数据集 $D = \begin{Bmatrix} \mathbf{x}_i,y_i \end{Bmatrix}^N_{i=1}$ ，首先将秩扩展为 K − 1 个二元标签 $y^{(1) }_i , ...,y^{(K-1) }_i$ ， $y^{(k)}_i\in \begin{Bmatrix}0,1 \end{Bmatrix}$ 表示是否超过秩，例如 $y^{(k)}_i=1\begin{Bmatrix} y_i>r_k \end{Bmatrix}$ 。如果内部条件为真，则指示函数 1{·} 为 1，否则为 0。在模型训练期间使用扩展的二元标签，作者在输出层训练了一个带有 K-1 个二元分类器的单个 CNN，如图 2 所示。

基于二元任务响应，输入的预测等级标签是通过 $h(\mathbf{x}_i ) = r_q$ 获得的。秩索引 q 由下式给出

$q=1+\sum_{k=1}^{K-1}f_k(\mathbf{x}_i),(1)$

其中 $f_k(\mathbf{x}_i)\in \begin{Bmatrix}0,1 \end{Bmatrix}$ 是输出层中第 k 个二元分类器的预测。我们要求 $\begin{Bmatrix} f_k \end{Bmatrix}_{k=1}^{K-1}$ 反映序数信息并且 rank-monotonic， $f_1(\mathbf{x}_i)\geqslant f_2(\mathbf{x}_i)\geqslant ...\geqslant f_{K-1}(\mathbf{x}_i)$ ，这保证了一致的预测。为了实现秩单调性并保证二元分类器的一致性（定理 1），K − 1 个二元任务共享相同的权重参数但具有独立的偏置单元（图 2）。

3.2.2.损失函数

让 $\mathbf{W}$ 表示神经网络的权重参数，不包括最后一层的偏置单元。倒数第二层，其输出表示为 $g(\mathbf{x}_i , \mathbf{W})$ ，与最终输出层中的所有节点共享一个权重；然后将 K − 1 个独立偏置单元添加到 $g(\mathbf{x}_i , \mathbf{W})$ 使得 $\begin{Bmatrix} g(\mathbf{x}_i , \mathbf{W})+b_k \end{Bmatrix}_{k=1}^{K-1}$ 是最后一层中相应二元分类器的输入。让

$\sigma(z)=1/(1+exp(-z))\, \, (2)$

是逻辑 sigmoid 函数。任务 k 的预测经验概率定义为

$\hat{P}(y^{(k)}_i=1)=\sigma (g(\mathbf{x}_i,\mathbf{W})+b_k).\, (3)$

对于模型训练，作者最小化损失函数

$L(\mathbf{W},\mathbf{b})=-\sum_{i=1}^{N}\sum_{k=1}^{K-1}\lambda ^(k)[log(\sigma (g(\mathbf{x}_i,\mathbf{W})+b_k))y^{(k)}_i \newline +log(1-\sigma (g(\mathbf{x}_i,\mathbf{W})+b_k))(1-y^{(k)}_i)],\, \, \, \, (4)$

这是 K-1 个二元分类器的加权交叉熵。对于秩预测（等式 1），二进制标签是通过

$f_k(\mathbf{x}_i)=1\begin{Bmatrix} \hat{P}(y^{(k)}_i=1)>0.5 \end{Bmatrix}.\, \, \, (5)$

在方程式 4 中， $\lambda ^{(k)}$ 表示与第 k 个分类器相关的损失的权重（假设 $\lambda ^{(k)}>0$ ）。在本文的其余部分，作者将 $\lambda ^{(k)}$ 称为任务 k 的重要性参数。有些任务可能不太健壮或更难优化，可以通过选择非均匀任务加权方案来考虑。为简单起见，作者使用统一任务加权进行了所有实验，即 $\forall k:\lambda ^{(k)}=1$ 。在下一节中，作者为统一和非统一任务重要性加权下的分类器一致性提供理论保证，因为任务重要性权重为正数。

3.2.3.分类器一致性的理论保证

以下定理表明，通过最小化损失 L（等式 4），输出层的学习偏置单元不增加，使得

$b_1 \geqslant b_2 \geqslant...\geqslant b_{K-1}.\, \, \, (6)$

因此，K-1 个任务的预测置信度或概率估计值正在下降，例如，

$\widehat{P}(y^{(1)}_i=1)\geqslant \widehat{P}(y^{(2)}_i=1) \geqslant ... \geqslant \widehat{P}(y^{(K-1)}_i=1)\, \, \, (7)$

对于所有 i，确保分类器的一致性。因此， $\begin{Bmatrix} f_k \end{Bmatrix}_{k=1}^{K-1}$ （方程 5）也是秩单调的。

定理 1（有序偏置单位）。通过最小化方程 4 中定义的损失函数，最优解 $(\mathbf{W}^*,\mathbf{b}^*)$ 满足 $b^*_1 \geqslant b^*_2 \geqslant b^*_K-1$ 。

证明：假设 $(\mathbf{W}, b)$ 是最优解，并且对于某些 k， $b_k < b_{k+1}$ 。声明：用代替 $b_{k+1}$ ，或用代替 $b_{k+1}$ ，降低目标值 L。令

由排序关系，我们有

$A_1 \cup A_2 \cup A_3 = \begin{Bmatrix} 1,2,...,N \end{Bmatrix}.$

表示 $p_n(b_k)=\sigma (g(\mathbf{x}_n,\mathbf{W})+b_k)$ 和

$\\ \delta _n=log(p_n(b_{k+1}))-log(p_n(b_k)),\\ \delta^{'} _n=log(1-p_n(b_k))-log(1-p_n(b_{k+1})).$

由于在中增加，因此有 $\delta _n>0$ 和 $\delta^{'}_n>0$ 。

如果我们用 $b_{k+1}$ 替换，则更新与第 k 个任务相关的损失项。损失 L（方程 4）的变化为

$\Delta _1L=\lambda ^{(k)}[-\sum_{n\in A_1}\delta _n+\sum_{n\in A_2}\delta^{'}_n-\sum_{n\in A_3}\delta_n].$

因此，如果我们用 b k 替换 b k+1 ，则 L 的变化为

$\Delta _2L=\lambda ^{(k+1)}[\sum_{n\in A_1}\delta _n-\sum_{n\in A_2}\delta^{'}_n-\sum_{n\in A_3}\delta^{'}_n].$

通过将 $\frac{1}{\lambda ^{(k)}}\Delta _1L$ 和 $\frac{1}{\lambda ^{(k+1)}}\Delta _2L$ 相加，我们有

$\frac{1}{\lambda ^{(k)}}\Delta _1L+ \frac{1}{\lambda ^{(k+1)}}\Delta _2L= -\sum_{n\in A_3}(\delta _n+\delta ^{'}_n)<0,$

并且知道 $\Delta _1L<0$ 或 $\Delta _2L<0$ 。因此，我们的主张是有道理的。我们得出结论，任何最小化 L 的最优解 $(\mathbf{W}^{*} , b^{*} )$ 满足

$b^{*}_1\geqslant b^{*}_2\geqslant ...\geqslant b^{*}_{K-1}.$

请注意，与定理 1 相比，Li 和 Lin 提出的秩单调性定理需要一个成本矩阵 C，其中每一行都是凸的。在这种凸性条件下，令 $\lambda^{ (k) }_{y_n}= |C_{y_n,r_k}-C_{y_n,r_{k+1}}|$ 为与第 n 个训练示例上的第 k 个任务相关的损失的权重，这取决于标签 y n 。 Li 和 Lin 证明，通过使用特定于训练示例的任务权重 $\lambda ^{(k)}_{y_n}$ ，对最优阈值进行了排序 —— Niu 等人指出，特定于示例的任务权重在实践中是不可行的。此外，该假设要求 $\lambda ^{(k)}_{y_n}\geqslant \lambda ^{(k+1)}_{y_n}$ 当 $r_{k+1} < y_n$ 和 $\lambda ^{(k)}_{y_n}\leqslant \lambda ^{(k+1)}_{y_n}$ 当 $r_{k+1} > y_n$ 。定理 1 没有这个要求，允许我们为每个任务选择一个固定的权重，不依赖于单个训练示例，这大大降低了训练复杂度。此外，定理 1 允许在不降低的预测概率和一致的任务预测的保证下选择简单的统一任务加权或考虑数据集不平衡。根据定理 1，保证秩单调性的唯一要求是任务权重为非负。

4. 实验

4.1. 数据集和预处理

MORPH-2 数据集，包含 55,608 张人脸图像，通过使用面部标志检测定位各个数据集中的平均眼睛位置进行预处理，然后使用 MLxtend v0.14 中的 EyepadAlign 函数将数据集中的每个图像与平均眼睛位置对齐。然后重新对齐面部，使鼻尖位于每个图像的中心。本研究中使用的年龄标签在 16-70 岁之间。

CACD 数据集从进行类似于 MORPH-2 的预处理，使得面部跨越整个图像，鼻尖位于中心。图像总数为 159,449 个，年龄范围为 14-62 岁。

本研究中使用的亚洲人脸数据库 AFAD 数据库包含 15-40 岁范围内的 165,501 张面孔。由于面已经居中，因此不需要进一步的预处理。

按照 Niu 等人所述的程序进行操作，每个图像数据库被随机分为 80% 的训练数据和 20% 的测试数据。所有图像都被调整为 128×128×3 像素，然后随机裁剪为 120×120×3 像素以增强模型训练。在模型评估期间，将 128×128×3 RGB 人脸图像中心裁剪为 120×120×3 的模型输入尺寸。

代码库（第 4.4 节）中共享了所有数据集的训练和测试分区，以及本文中使用的所有预处理代码。

4.2.神经网络架构

为了评估 CORAL 从人脸图像中估计年龄的性能，作者选择了 ResNet-34 架构，这是一种现代 CNN 架构，在各种图像分类任务上都取得了良好的性能。对于本文的其余部分，作者将具有标准交叉熵损失的原始 ResNet34 CNN 称为 CE-CNN。为了使用所提出的 CORAL 方法为序数回归实现 ResNet-34 CNN，作者将最后一个输出层替换为相应的二元任务（图 2），并将此实现称为 CORAL-CNN。与 CORAL-CNN 类似，作者修改了 ResNet-34 的输出层以实现中描述的序数回归参考方法，并将这种架构称为 OR-CNN。

4.3. 培训和评估

对于模型评估和比较，作者计算了最后一个训练时期后测试集的平均绝对误差 (MAE) 和均方根误差 (RMSE)：

其中是第 i 个测试示例的真实等级， $h(\boldsymbol{\mathbf{x}}_i )$ 是预测等级。

使用不同的随机 seeds（0、1 和 2）重复模型训练 3 次以进行模型权重初始化，而不同方法之间的随机 seeds 是一致的，以进行公平比较。由于这项研究侧重于研究秩一致性，而优化算法之间的广泛比较超出了本文的范围，因此，所有 CNN 都通过使用指数衰减率 $\beta _0=0.90$ 和 $\beta _2=0.99$ （默认设置）和批量大小为 256 的自适应矩估计进行了 200 次随机梯度下降训练。

为了通过设计提出的 CNN 架构来比较序数回归方法来避免引入经验偏差，作者采用了标准架构（ResNet-34；第 4.2 节）进行此比较。此外，作者为 CORAL-CNN 中 K-1 个二元分类器的交叉熵选择了统一的任务权重，例如，在等式 4 中设置 $\forall k:\lambda ^{(k)}=1$ 。

学习率由验证集上的超参数调整决定。对于各种损失（交叉熵、有序回归 CNN 和提议的 CORAL 方法），作者发现 $\alpha =5\times 10^{-5}$ 的学习率在所有模型中表现最佳，即可能是因为使用了相同的基础架构 (ResNet-34)。所有模型都训练了 200 个 epoch。从这 200 个 epoch 中，通过验证集上的 MAE 性能选择最佳模型。然后在独立测试集上评估所选模型，从中获得报告的 MAE 和 RMSE 性能值。对于所有的模型性能，作者报告了 200 个训练时期内的最佳测试集性能。

4.4.硬件和软件

所有损失函数和神经网络模型都在 PyTorch 1.5 中实现，并在 NVIDIA GeForce RTX 2080Ti 和 Titan V 显卡上进行训练。源代码：https://github.com/Raschka-research-group/coral-cnn

5. 结果与讨论

作者对用于年龄估计的三个独立人脸图像数据集（第 4.1 节）进行了一系列实验，以对所提出的 CORAL 方法（CORAL-CNN）与 Niu 等人提出的序数回归方法 (OR-CNN) 进行比较。所有实现都基于 ResNet-34 架构，如第 4.2 节所述，作者将具有交叉熵损失（CE-CNN）的标准 ResNet-34 分类网络作为性能基线。

5.1. 从人脸图像估计表观年龄

在所有有序回归数据集（表 1）中，作者发现 OR-CNN 和 CORAL-CNN 都优于标准的交叉熵分类损失（CE-CNN），后者不利用排名信息。类似地，如表 1 所述，所提出的等级一致 CORAL 方法比 OR-CNN 有显着的性能改进，但不能保证分类器的一致性。

此外，作者使用不同的随机种子进行模型权重初始化和数据集调整，将每个实验重复三次，以确保观察到的 CORAL-CNN 相对于 OR-CNN 的性能改进是可重复的而不是巧合的。作者可以得出结论，通过 CORAL 保证分类器一致性对序数回归 CNN 的预测性能有显着的积极影响（第 5.2 节提供了对 OR-CNN 秩不一致的更详细分析）。

对于所有方法（CE-CNN、CORAL-CNN 和 OR-CNN），在不同数据集上的整体性能按以下顺序出现：MORPH-2 > AFAD > CACD（表 1）。一种可能的解释是，MORPH-2 的整体图像质量最好，并且照片是在相对一致的光照条件和视角下拍摄的。例如，作者发现 AFAD 包含分辨率非常低（例如，20x20）的图像。 CACD 还包含一些质量较低的图像。由于 CACD 的大小与 AFAD 大致相同，因此在该数据集上实现的总体性能较低也可能是由于需要考虑的年龄范围更广（CACD：14-62 岁，AFAD：15-40 岁）。

5.2. 经验秩不一致分析

通过设计，作者提出的 CORAL 保证了等级一致性（定理 1）。此外，作者对 CORAL-CNN 和 OR-CNN 的秩不一致进行了实证分析（秩不一致的示例如图 3 所示）。表 2 总结了 OR-CNN 和 CORAL-CNN 模型在每个测试数据集上的平均秩不一致数。正如预期的那样，CORAL-CNN 的排名不一致为 0。当仅考虑 OR-CNN 正确预测年龄和错误预测年龄的情况下比较排名不一致的平均数量时，当 OR-CNN 做出错误预测时，不一致的平均数量更高。这一观察结果可以被视为等级不一致损害预测性能的证据。因此，这一发现表明通过 CORAL 解决秩不一致对于序数回归 CNN 的预测性能是有益的。

6. 结论

在本文中，作者通过扩展的二元分类开发了序数回归的 CORAL 框架，并具有分类器一致性的理论保证。此外，作者证明了分类器的一致性，而不需要依赖于等级或训练标签的加权方案，这允许直接的实现和有效的模型训练。 CORAL 可以很容易地实现，以扩展用于有序回归任务的常见 CNN 架构。实验结果表明，CORAL 框架显着提高了 CNN 对三个独立年龄估计数据集的年龄估计的预测性能。作者的方法可以很容易地推广到其他有序回归问题和不同类型的神经网络架构，包括多层感知器和循环神经网络。

计算机木马详细编写思路小熊同学哦 php 开发语言木马木马思路
导语：计算机木马（ComputerTrojan）是一种恶意软件，通过欺骗用户从而获取系统控制权限，给黑客打开系统后门的一种手段。虽然木马的存在给用户和系统带来严重的安全风险，但是了解它的工作原理与编写思路，对于我们提高防范意识、构建更健壮的网络安全体系具有重要意义。本篇博客将深入剖析计算机木马的详细编写思路，以及如何复杂化挑战，以期提高读者对计算机木马的认识和对抗能力。计算机木马的基本原理计算机木
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
【安装环境】配置MMTracking环境 xuanyu22 安装环境机器学习神经网络深度学习 python
版本v0.14.0安装torchnumpy的版本不能太高，否则后面安装时会发生冲突。先安装numpy，因为pytorch的安装会自动配置高版本numpy。condainstallnumpy=1.21.5mmtracking支持的torch版本有限，需要找到合适的condainstallpytorch==1.11.0torchvision==0.12.0cudatoolkit=10.2-cpytor
Orange Pi编译脚本的分析点点吃得太多了 linux linux bash
脚本的运行流程/scripts/main.sh变量设置DEST=“${SRC}”/outputREVISION=“2.2.2”DOWNLOAD_MIRROR==“china”NTP_SERVER=“cn.pool.ntp.org”通过网络校准您计算机上的时钟BUILD_ALLCOLUMNS,LINESTTY_X,TTY_YLANGUAGE=“en_US:en”CONSOLE_CHAR=“UTF-8
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
EcmaScript和JavaScript的区别每天吃八顿前端 ecmascript
ECMAScript和JavaScript是经常被混淆的两个术语，但实际上它们之间存在一些区别：ECMAScript：ECMAScript（通常缩写为ES，并且有版本号如ES5,ES6和ES7等）是由ECMA国际（EuropeanComputerManufacturersAssociation）制定的一种脚本语言的规范。这个规范定义了语法、命令、数据类型等基本元素。ECMAScript是一种规范，
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
安装torch报错 raise ReadTimeoutError(self._pool, None, “Read timed out.“) pip._vendor.urllib3.exceptions 待磨的钝刨 pip pytorch 人工智能
文章目录1.配置cuda的torch环境时报错1.配置命令2.报错bug2.解决方法1.增加下载超时时间：2.尝试使用镜像源：3.检查网络连接：4.分次安装：5.重试安装：6.手动下载.whl文件安装1.配置cuda的torch环境时报错1.配置命令pipinstalltorch==2.0.1torchvision==0.15.2torchaudio==2.0.2--index-urlhttps:
transformer架构(Transformer Architecture)原理与代码实战案例讲解 AI架构设计之禅大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来自然语言处理（NLP）领域的发展经历了从规则驱动到统计驱动再到深度学习驱动的三个阶段。
多模态大模型微调Qwen-VL微调及日志 Messi^ 人工智能-大模型应用 python 人工智能深度学习
%pipinstallmodelscope-U%pipinstalltransformersacceleratetiktoken-U%pipinstalleinopstransformers_stream_generator-U%pipinstallpillow-U%pipinstalltorchvision%pipinstallmatplotlib-Ufrommodelscopeimport(s
2024年CSP-J初赛备考建议再临TSC c++杂谈 c++学习
针对2024年CSP-J（ComputerSciencePrinciplesJunior，即计算机科学原理初级认证）的备考，首先，先来看考试可能考的东西：动规（包括背包问题），主要在程序阅读还有程序补全题考，这方面，了解动规的原理就可以轻松拿分高精，也是在阅读和补全题，了解原理即可，Z2~Z3应该就学高精了深搜广搜，基础题可能会给你一个片段，然后问你这是什么算法，或者，问你下列选项中哪个正确，给你
单片机在医疗设备中的应用实例教程 kkchenjj 单片机单片机嵌入式硬件
单片机在医疗设备中的应用实例教程单片机基础单片机概述单片机，全称为单片微型计算机（Single-ChipMicrocomputer），是一种将中央处理器（CPU）、存储器、输入输出接口等主要计算机部件集成在一块芯片上的微型计算机系统。它具有体积小、功耗低、成本低廉、控制功能强大等特点，广泛应用于工业控制、家用电器、汽车电子、医疗设备等多个领域。特点集成度高：单片机将计算机的主要部件集成在一块芯片上
单片机与传感器接口技术应用实例教程 kkchenjj 单片机单片机 nosql 嵌入式硬件
单片机与传感器接口技术应用实例教程单片机基础单片机概述单片机，全称为单片微型计算机（Single-ChipMicrocomputer），是一种将中央处理器（CPU）、存储器、输入输出接口等主要计算机部件集成在一块芯片上的微型计算机系统。它具有体积小、功耗低、成本低廉、控制功能强大等特点，广泛应用于工业控制、家用电器、汽车电子、通信设备、医疗器械等领域。特点集成度高：单片机将计算机的主要部件集成在一
物联网之ESP32配网方式、蓝牙、WiFi 智码帮MJ682517 Web前端嵌入式硬件物联网嵌入式硬件物联网 web前端
MENU前言SmartConfig(智能配网)AP模式(AccessPoint模式)蓝牙配网WebServer模式WPS配网(Wi-FiProtectedSetup)Provisioning(配网服务)静态配置(硬编码)总结前言ESP32配网(Wi-Fi配置)的方式有多种，每种方式都有各自的优缺点。根据具体项目需求，可以选择适合的配网方式。SmartConfig(智能配网)原理ESP32通过监听周
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
什么是DSL和GPL 牧竹子通识 DSL GPL
DSL的全称是domain-specificlanguage，它在wiki上的定义如下：Adomain-specificlanguage(DSL)isacomputerlanguagespecializedtoaparticularapplicationdomain.与之相对的是GPL(general-purposelanguage)。DSL指的是针对特定应用领域而设计使用的计算机语言，而GPL指
什么是DSL yimi1995 程序员的日常
转载：http://blog.csdn.net/dslztx/article/details/46682889DSL的全称是domain-specificlanguage，它在wiki上的定义如下：Adomain-specificlanguage(DSL)isacomputerlanguagespecializedtoaparticularapplicationdomain.与之相对的是GPL(g
ecmascript和javascript的区别？ 2301_79698214 ecmascript javascript
ECMAScript是JavaScript的标准规范，而JavaScript是基于ECMAScript规范开发的一种编程语言。简单来说，ECMAScript是一套定义了JavaScript语法和语义的规范，而JavaScript是实际的编程语言。具体来说，ECMAScript是由ECMA（EuropeanComputerManufacturersAssociation，欧洲计算机制造商协会）定义和
2018-12-09 一只猴子变成了钢笔
ThevisionthingByChrisGilesPublished:November25200820:24|Lastupdated:November25200820:24http://www.ft.com/cms/s/0/1c1d5a9e-bb29-11dd-bc6c-0000779fd18c.htmlIthasbeenabadyearforeconomicforecasters.Sobadt
[Kaiming]Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification MTandHJ neural networks
文章目录概主要内容PReLUKaiming初始化ForwardcaseBackwardcaseHeK,ZhangX,RenS,etal.DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformanceonImageNetClassification[C].internationalconferenceoncomputervision,2015:1
大语言模型应用指南：长期记忆 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：长期记忆作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能领域的快速发展，大语言模型因其强大的语言生成和理解能力而受到广泛关注。然而，现有的大语言模型通常具有短期记忆特性，即在生成文本时，仅依赖于输入序列的上下文信息，缺乏对过去输入或历史对话上下文的记忆能力。这限制了模型在需要考虑长期历史信息
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
zobovision随谈H.265/HEVC编码FPGA实现（一） zobovision 视频图像编解码FPGA IP fpga开发视频编解码
zobovision随谈H.265/HEVC编码FPGA实现（一）H.265/HEVC出来已有10年，但市场应用难言巅峰，正如古董级的H.264现在仍然大行其道，H.265的全面应用仍有待市场发酵，至少在硬件产品端应用，值得期待。一来H.265相对H.264而言，压缩技术确实要先进不少，不管是理论上还是实际效果方面；二是H.265相对后来者H.266/VVC等而言，实用性更强，性价比更高，产品端的
力扣LeetCode-栈和队列流忆，留宜 LeetCode leetcode c++算法
栈与队列基本知识C++标准库有很多版本，三个最为普遍的STL版本HPSTL其他版本的C++STL，一般是以HPSTL为蓝本实现出来的，HPSTL是C++STL的第一个实现版本，而且开放源代码。P.J.PlaugerSTL由P.J.Plauger参照HPSTL实现出来的，被VisualC++编译器所采用，不是开源的。SGISTL由SiliconGraphicsComputerSystems公司参照H
cs寄存器 x86 特权模式_我们一起学RISC-V——01-了解处理器和寄存器黎贝卡 cs寄存器 x86 特权模式
本期内容如下：形象认识处理器RISC-V处理器面貌处理器都能做什么RISC-V核对外接口一、形象认识处理器1.1指令集分类处理器指令集分为两类，CISC(ComplexInstructionSetComputers，复杂指令集计算机)和RISC(ReducedInstructionSetComputers，精简指令集计算机)。CISC处理器，当以为美国Intel，AMD的X86处理器为代表，当然中
Vision Pro的增强视觉：企业级Unity插件包实现主摄像头访问花生糖@ 苹果眼镜（Vision apple vision pro AI unity
在AR和VR技术的快速发展中，Unity作为跨平台游戏和应用开发的首选引擎，其插件生态的丰富性一直是开发者们关注的焦点。最近，一个专为VisionPro设计的Unity插件包——EnterpriseCameraAccessPlugin，因其能够通过企业API访问主摄像头的功能，引起了广泛关注。一、插件背景与需求VisionPro是一款面向企业级市场的AR设备，它通过企业API提供了对设备功能的高级
Unity Apple Vision Pro 开发（七）：UI 交互 + 虚拟键盘 YY-nb #Unity Apple Vision Pro 开发 apple vision pro ui unity
XR开发者社区链接：SpatialXR社区：完整课程、项目下载、项目孵化宣发、答疑、投融资、专属圈子课程试看：https://www.bilibili.com/video/BV1fS421X7fn完整版课程，答疑仅社区成员可见，可以通过文章开头的链接加入社区。课程内容：使用Unity内置的UGUI搭建UI面板在远距离和近距离与UI进行交互UI按钮点击事件的使用调用VisionPro的系统键盘
csapp-chapter1 SFARL 博客 c++
title:csapp_chapter1date:2020-06-1319:24:20tags:[网课,CSAPP,第一章]CSAPP和CMUIntroductiontocomputersystem(CS15-2132015fall)的笔记。相关资料Textbook在vscode上使用C1.COURSE-OVERVIEW从编程者的角度来讲述计算机系统。这也是为什么我第一门课选择这个的原因，因为自己
轨道交通系统详解，以及地铁如何精准停靠站台炸膛坦客自动驾驶人工智能自动驾驶
ATC系统全称“自动列车控制系统”，AutomaticTrainControl，ATCATC是地铁运行的核心系统，它包括列车自动防护（ATP）、列车自动运行（ATO）和列车自动监控（ATS）三个子系统。ATS系统全称“自动列车监控系统”，AutomaticTrainSupervision，ATS主要负责列车运行状态的监控和管理。ATS系统通常由控制中心、车站设备和车辆设备组成，它们通过通信网络相互
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少