葫芦娃啊啊啊啊

ERNIE: Enhanced Language Representation with Informative Entities中文

文章目录

ERNIE
- 摘要
- 1 引言
- 2 相关工作
- 3 方法论
- - 3.1 符号
  - 3.2 模型架构
  - 3.3 K-Encoder
  - 3.4 知识注入预训练
  - 3.5 针对特定任务的微调
- 4 实验
- - 4.1 预训练数据集
  - 4.2 参数设置和训练细节
  - 4.5 GLUE
  - 4.6 消融研究
- 5 结论

ERNIE

注：本文为清华和华为的ERNIE模型，百度也有个同名的ERNIE
清华ERNIE原论文
百度ERNIE原论文

摘要

在大规模语料库上预训练的 BERT 等神经语言表示模型可以很好地从纯文本中捕获丰富的语义信息，通过微调以持续提高各种 NLP 任务的性能。然而，现有的预训练语言模型很少考虑融合知识图谱，知识图谱可以提供丰富的结构化知识事实以更好地理解语言。KG 中的信息实体可以增强语言表示。在本文中，我们利用大规模文本语料库和 KG 来训练增强的语言表示模型(ERNIE)，该模型可以同时充分利用词汇、句法和知识信息。实验结果表明，ERNIE 在各种知识驱动任务上取得了显着的进步，同时在其他常见的 NLP 任务上与最先进的模型 BERT 相当。

1 引言

预训练的语言表示模型，包括基于特征的和微调方法，可以从文本中捕获丰富的语义信息，然后使许多 NLP 任务受益。 BERT通过简单的微调在各种 NLP 任务上获得了SOTA ,包括命名实体识别、问答、自然语言推理和文本分类等。尽管预训练的语言表示模型已经取得了可喜的结果，并且在许多 NLP 任务中作为常规组件发挥了作用，但它们忽略了将知识信息纳入语言理解。如图 1 所示，在不知道 Blowin’ in the Wind 和 Chronicles: Volume 1 分别是歌曲和书籍的情况下，很难识别 Bob Dylan 在实体输入任务中的两个职业，即词曲作者和作家。 此外，几乎不可能在关系分类任务中提取细粒度的关系，例如作曲家和作者。对于现有的预训练语言表示模型，这两个句子在句法上是模棱两可的，例如“UNK 在 UNK 中写了 UNK”。因此，考虑丰富的知识信息可以促成更好的语言理解，有利于各种知识驱动的任务，例如实体识别和关系分类。

图 1：为语言理解加入额外知识信息的示例。实线表示现有的知识事实。红色虚线表示从红色句子中提取的事实。绿色点划线表示从绿色句子中提取的事实。

为了将外部知识整合到语言表示模型中，有两个主要挑战。

(1) 结构化知识编码：对于给定的文本，对于语言表示模型来说如何有效地提取和编码KG 中相关的信息事实是一个重要问题；

(2)异构信息融合：语言表示的预训练过程与知识表示过程有很大不同，导致两个独立的向量空间。如何设计一个特殊的预训练目标来融合词法、句法和知识信息是另一个挑战。

为了克服上述挑战，我们提出了具有信息实体的增强语言表示(ERNIE)，它在大规模文本语料库和 KG 上预训练了语言表示模型：

（1）为了提取和编码知识信息，我们首先识别文本中提及的命名实体，然后将这些提及到的实体与它们在 KG 中的相应实体对齐。我们没有直接在 KG 中使用基于图的事实，而是使用诸如 TransE（Bordes 等人，2013）之类的知识嵌入算法对 KG 的图结构进行编码，然后将信息实体嵌入作为 ERNIE 的输入。基于文本和 KG 之间的对齐，ERNIE 将知识模块中的实体表示集成到语义模块的底层。

(2) 与BERT类似，采用掩码语言模型和下一句预测作为预训练目标。此外，为了更好地融合文本和知识特征，我们设计了一个新的预训练目标，通过随机mask输入文本中的一些命名实体对齐并要求模型从 KG 中选择合适的实体来完成对齐。与现有的仅利用局部上下文来预测标记的预训练语言表示模型不同，我们的目标是要求模型聚合上下文和知识事实以预测token和实体，并形成知识增强的语言表示模型。

作者在两个知识驱动的 NLP 任务进行了实验，即实体类型和关系分类。实验结果表明，通过充分利用词汇、句法和知识信息，ERNIE 在这些知识驱动的任务上显著优于 BERT。

2 相关工作

预训练语言表示模型致力于从文本中捕获语言信息，然后将这些信息用于特定的 NLP 任务。这些预训练方法可以分为两类，即基于特征的方法和微调方法。

早期的工作（Collobert 和 Weston，2008 年；Mikolov 等人，2013 年；Pennington 等人，2014 年）侧重于采用基于特征的方法将词转换为分布式表示。这些预训练的词表示捕获了文本语料库中的句法和语义信息，因此它们通常用作各种 NLP 模型的输入嵌入和初始化参数，相比于随机初始化参数有着显着改进（Turian et al. , 2010)。由于这些词级模型经常受到词多义的影响，（Peters 等人，2018) 进一步采用序列级模型 (ELMo) 来捕获跨不同语言上下文的复杂词特征，并使用 ELMo 生成上下文感知词嵌入。

与仅使用预训练语言表示作为输入特征的基于特征语言模型不同，Dai 和 Le (2015年) 在未标记的文本上训练自编码器，然后使用预训练的模型架构和参数作为其他特定 NLP 模型的起点。受 Dai 和 Le (2015) 的启发，人们提出了更多用于微调的预训练语言表示模型。 Howard 和 Ruder (2018) 提出了 AWD-LSTM (Merity et al., 2018) 来构建通用语言模型 (ULMFiT)。拉德福德等人， (2018) 提出了一种生成式预训练 Transformer (Vaswani et al., 2017) (GPT) 来学习语言表示。德夫林等人。 (2019) 提出了一个具有多层变换器 (BERT) 的深度双向模型，该模型在各种 NLP 任务中取得了SOTA。

尽管基于特征和微调的语言表示模型都取得了巨大的成功，但它们忽略了知识信息的结合。正如最近的工作所证明的那样，注入额外的知识信息可以显着增强原始模型，例如阅读理解（Mihaylov 和 Frank，2018 年；Zhong 等人，2018 年）、机器翻译（Zaremoodi 等人，2018 年）、自然语言推理（Chen 等，2018）、知识获取（Han 等，2018a）和对话系统（Madotto 等，2018）。因此，我们认为额外的知识信息可以有效地使现有的预训练模型受益。事实上，一些工作试图联合词和实体的表征学习以有效利用外部 KG 并取得了可喜的结果（Wang 等人，2014 年；Toutanova 等人，2015 年；Han 等人， 2016；山田等，2016；曹等，2017、2018）。孙等人 (2019) 提出了masked语言模型的知识屏蔽策略，以通过知识来增强语言表示。在本文中，我们进一步利用语料库和 KG 来训练基于 BERT 的增强语言表示模型。

3 方法论

在本节中，我们将介绍 ERNIE 的整体框架及其详细实现，包括第 3.2 节中的模型架构、第 3.4 节中设计用于编码信息实体和融合异构信息的新型预训练任务，以及详细信息 3.5 节中的微调程序。

3.1 符号

我们将标记序列表示为 ${w_1,...,w_n\}$ ,其中 $n$ 是token序列的长度。同时，我们将与给定token对齐的实体序列表示为 ${e_1,...,e_m\}$ ，其中 $m$ 是实体序列的长度。 注意,在大多数情况下 $m$ 不等于 $n$ ，因为并非每个token都可以与 KG 中的实体对齐。此外，我们将包含所有标记的整个词汇表表示为 $V$ ，将包含 KG 中所有实体的实体列表表示为 $E$ 。如果标记 $w \in V$ 有相应的实体 $e \in E$ ，则它们的对齐定义为 $f (w) = e$ 。在本文中，我们将实体与其命名实体短语中的第一个标记对齐，如图 2 所示。

图2 左边是ERNIE的架构。右边是 token 和 entity 的输入相互集成的聚合器。信息融合层有两种输入：一种是 $token\ embedding$ ，另一种是 $token\ embedding$ 和 $entity\ embedding$ 的串联。信息融合后，它为下一层输出新的 $token\ embedding$ 和 $entity\ embedding$ 。

3.2 模型架构

如图 2 所示，ERNIE 的整个模型架构由两个堆叠模块组成：

（1）底层文本编码器（T-Encoder）负责从输入标记中捕获基本的词汇和句法信息;

（2）上层知识编码器 (K-Encoder) 负责将额外的面向 token 的知识信息整合到来自底层的文本信息中，以便我们可以将 token 和实体的异构信息表示到一个统一的特征空间中。此外，我们将 T-Encoder 层数表示为 $N$ ，将 K-Encoder 层数表示为 $M$ 。(后面会介绍，在实验中作者其实是让 $M = N$ )

具体来说，给定一个token序列 ${w_1,...,w_n\}$ ,及其对应的实体序列 ${e_1 , . . . , e_m \}$ ，文本编码器首先对每个token的 $token\ embedding,segment\ embedding, positional\ embedding$ 求和以计算其 $input\ embedding$ ，然后计算 $\{\pmb{w}_1,...,\pmb{w}_n\}$ (加粗表示向量或者矩阵)如下，
$\{\pmb{w}_1,...,\pmb{w}_n\}=T-Encoder(\{w_1,...,w_n\})(1)$ 其中， $T - E n c o d e r (\cdot)$ 是一个多层双向Transformer，这里的 $T - E n c o d e r (\cdot)$ 与 BERT 中的实现相同。

在计算 $\{\pmb{w}_1,...,\pmb{w}_n\}$ , ERNIE 采用知识编码器 $K - E n c o d e r$ 将知识信息注入语言表示。具体而言，我们用实体嵌入 $\{\pmb{e}_1 , . . . , \pmb{e}_m\}$ 表示实体 ${e_1 , . . . , e_m \}$ , 本文通过高效的知识嵌入模型 TransE (Bordes 等人，2013 年）进行预训练得到实体embedding。然后，将和 $\{\pmb{w}_1,...,\pmb{w}_n\}$ $\{\pmb{e}_1 , . . . , \pmb{e}_m\}$ 喂给K-Encoder，目的是融合异构信息和计算最终的 $\ embedding$ ，
$\{\pmb{w}_1^o,...,\pmb{w}_n^o\},\{\pmb{e}_1^o,...,\pmb{e}_n^o\}= K-Encoder(\{\pmb{w}_1,...,\pmb{w}_n\} ,\{\pmb{e}_1 , . . . , \pmb{e}_m\})(2)$ $\{\pmb{w}_1^o,...,\pmb{w}_n^o\}和\{\pmb{e}_1^o,...,\pmb{e}_n^o\}$ 将作为特征用于特定的任务，详细部分在3.3。

3.3 K-Encoder

如图2所示，K-Encoder 由多个堆叠的聚合器组成，旨在编码tokens 和实体以及融合他们的异构信息。在第 $i$ 个聚合器中，将来自前面的聚合器的 $input\ token\ embedding\ \{\pmb{w}_1^{(i-1)},...,\pmb{w}_n^{(i-1)}\}$ 和 $entity\ embedding$ $\{\pmb{e}_1^{(i-1)},...,\pmb{e}_m^{(i-1)}\}$ 分别输入两个多头自注意力（MH-ATTs）（Vaswani 等人，2017），

${\tilde{\pmb{w}} _1^{()},⋯,\tilde{\pmb{w}} _^{()} }=−({\pmb{w}_1^{(−1)},⋯,\pmb{w}_^{(−1)} })\\ {\tilde{\pmb{e}} _1^{()},⋯,\tilde{\pmb{e}} _^{()} }=−({\pmb{e}_1^{()},⋯,\pmb{e}_^{()} })(3)$ 第 $i$ 个聚合器采用信息融合层对token和实体序列进行相互集成，并计算每个token和实体的 $\ embedding$ 。对于一个token $w_j$ 及其对齐的实体 $e_k = f (w_j )$ ，信息融合过程如下，
$ℎ_=\sigma(\tilde{\pmb{W}}_^{()} \tilde{\pmb{w}}_^{()}+\tilde{\pmb{W}}_^{()} \tilde{\pmb{e}}_^{()}+\tilde{\pmb{b}}^{()} )\\ _^{()}={\sigma}(\pmb{W}_^{()} \pmb{h}_+\pmb{b}_^{()})\\ _^{()}={\sigma}(\pmb{W}_^{()} \pmb{h}_+\pmb{b}_^{()})(4)$ 其中, 中间隐藏状态 $\pmb{h}_j$ 集成了token和实体信息。 $\sigma(·)$ 是非线性激活函数，通常是 GELU 函数 (Hendrycks and Gimpel, 2016)。

对于句子中的某些token，它在KG中没有对应实体，信息融合层计算 $\ embedding$ 如下，
$ℎ_=\sigma(\tilde{\pmb{W}}_^{()} \tilde{\pmb{w}}_^{()}+\tilde{\pmb{b}}^{()} )\\ _^{()}={\sigma}(\pmb{W}_^{()} \pmb{h}_+\pmb{b}_^{()})(5)$
综上，第 $i$ 个聚合器可简单表示为，
$\{\pmb{w}_1^{()},⋯,\pmb{w}_n^{()} \},\{\pmb{e}_1^{()},⋯,\pmb{e}_m^{()} \}=Aggregator(\{\pmb{w}_1^{(-1)},⋯,\pmb{w}_n^{(-1)} \},\{\pmb{e}_1^{(-1)},⋯,\pmb{e}_m^{(-1)} \})(6)$
由顶层聚合器计算的token和实体的 $\ embedding$ 将用作 $K - E n c o d e r$ 的最终 $\ embedding$ 。

3.4 知识注入预训练

为了将实体知识注入到语言表示模型中，我们提出了一个新的预训练任务，随机mask一些 $t o k e n - e n t i t y$ 对齐，然后要求模型基于对齐的token来预测所有相应的实体。由于我们的任务类似于训练去噪自编码器，我们将此过程称为去噪实体自编码器 (dEA)。 考虑到 $s o f t m a x$ 层的 $\epsilon$ 非常大，因此只需要根据给定的实体序列而不是 KG 中的所有实体来预测实体。给定token序列 ${w_1, . . . , w_n\}$ 及其对应的实体序列 ${e_1, . . . , e_m\}$ ，我们定义token $w_i$ 的对齐实体分布如下，
$(e_j│w_i )={exp⁡((\pmb{w}_^ )·\pmb{e}_j)}/(∑_{=1}^{exp⁡((\pmb{w}_^ )·\pmb{e}_k})(7)$ 其中 $l i n e a r (\cdot)$ 是一个线性层。计算 dEA 的交叉熵损失函数会用到公式7。

考虑到 token-entity 对齐存在一些错误，对 dEA 执行以下操作：

(1) 对于给定的 token-entity 对齐，以 $5\%$ 的概率用另一个随机实体替换该实体，旨在训练模型能够纠正token与错误实体对齐这个错误；

(2)以 $15\%$ 的概率mask掉token-entity 对齐，旨在训练模型以纠正实体对齐系统未提取所有现有对齐的错误；

(3)以 $80\%$ 的概率保持 token-entity 对齐不变，旨在鼓励模型将实体信息整合到 token 表示中，以获得更好的语言理解。

与 BERT 类似，ERNIE 也采用掩码语言模型 (MLM) 和下一句预测 (NSP) 作为预训练任务，使 ERNIE 能够从文本中的标记中捕获词汇和句法信息，整体预训练损失是 dEA、MLM 和 NSP 损失的总和。

3.5 针对特定任务的微调

如图 3 所示，对于各种常见的 NLP 任务，ERNIE 可以采用类似于 BERT 的微调过程。我们可以将第一个token的最终输出嵌入，它对应于特殊的 [CLS] 标记，作为特定任务的输入序列的表示。对于一些知识驱动的任务（例如，关系分类和实体类型），我们设计了特殊的微调程序：

对于关系分类，该任务需要系统根据上下文对给定实体对的关系标签进行分类。针对关系分类最直接的方法微调ERNIE 是将池化层应用于给定实体提及的最终输出嵌入，并用它们的提及嵌入的串联来表示给定实体对以进行分类。在本文中，我们设计了另一种方法，通过添加两个标记标记来突出实体提及来修改输入标记序列。这些额外的标记标记在传统的关系分类模型（Zeng et al., 2015）中扮演着类似于位置嵌入的角色。然后，我们还采用 [CLS] 标记嵌入进行分类。请注意，我们分别为头部实体和尾部实体设计了不同的令牌 [HD] 和 [TL]。

实体类型的特定微调过程是关系分类的简化版本。由于以前的识别模型充分利用了上下文嵌入和实体提及嵌入（Shimaoka 等人，2016 年；Yaghoobzadeh 和 Schu ̈tze，2017 年；Xin 等人，2018 年），我们认为修改后的输入序列与提及mark token [ENT] 可以引导 ERNIE 将上下文信息和实体提及信息仔细结合起来。

图 3：修改特定任务的输入序列。为了在不同类型的输入之间对齐token，我们使用虚线矩形作为占位符。彩色矩形表示特定的标记token。

4 实验

在本节中，我们将介绍预训练 ERNIE 的细节以及在五个 NLP 数据集上的微调结果，其中包含知识驱动的任务和常见的 NLP 任务。

4.1 预训练数据集

鉴于从头训练 ERNIE 的巨大成本，采用 Google发布的 BERT 参数来初始化用于编码token的Transformer 块。由于预训练是一个由 NSP、MLM 和 dEA 组成的多任务过程，我们使用英文维基百科作为我们的预训练语料库并将文本与 Wiki 数据对齐。将语料库转换为格式化数据进行预训练后，标注输入有近 $4, 500 M$ 子词和 $140 M$ 实体，丢弃少于3个实体的句子。

在预训练 ERNIE 之前，我们采用 TransE 在 Wikidata 上训练的知识嵌入作为实体的输入嵌入。具体来说，我们对包含 $5, 040, 986$ 个实体和 $24, 267, 796$ 个事实三元组的 Wikidata 部分进行采样。训练时实体嵌入是固定的，实体编码模块的参数都是随机初始化的.

4.2 参数设置和训练细节

定 $token\ embedding$ 和 $entity\ embedding$ 的隐藏维度分别表示为 $H_w$ 、 $H_e$ ，自注意力头的数量分别表示为 $A_w$ 、 $A_e$ 。模型大小： $N = 6 ， M = 6$ ， $H_w = 768$ ， $H_e = 100，A_w = 12，A_e = 4$ 。总参数约 $114 M$ 。

$BERT_{BASE}$ 的参数总量约为 $110 M$ ，这意味着 ERNIE 的知识模块比语言模块小得多，对运行时性能影响很小。并且，我们在带注释的语料库上仅预训练 ERNIE一个epoch。由于自注意力的计算是长度的二次函数，为了加速训练过程，我们将最大序列长度从 512 减少到 256。为了使batch中的token数量与 BERT 相同，我们将batch大小加倍到 512。除了将学习率设置为 $5e^{−5}$ 之外，我们主要遵循 BERT 中使用的预训练超参数。对于微调，大多数超参数与预训练相同，除了batch size，学习率和训练周期数。我们发现以下可能值范围在带有黄金注释的训练数据集上效果很好，即batch size：32，学习率（Adam）： $5e^{−5}$ 、 $3e^{−5}$ 、 $2e^{−5}$ ，epoch数量：3 到 10.

我们还在远程监督的数据集上评估 ERNIE，即FIGER（Ling et al., 2015）。由于深度堆叠的 Transformer 块的强大表达能力，我们发现小批量会导致模型过拟合。因此，我们使用更大的批次大小和更少的训练时期来避免过度拟合，并保持学习率的范围不变，即batch size：2048，epoch：2、3。

由于大多数数据集没有实体注释，我们使用 TAGME（Ferragina 和 Scaiella，2010）来提取句子中的实体提及并将它们链接到 KG 中的相应实体。

4.5 GLUE

通用语言理解评估 (GLUE) 基准（Wang 等人，2018 年）是各种自然语言理解任务的集合（Warstadt 等人，2018 年；Socher 等人，2013 年；Dolan 和 Brockett，2005 年；Agirre等人，2007；Williams 等人，2018 年；Rajpurkar 等人，2016 年；Dagan 等人，2006 年；Levesque 等人，2011 年），这是 Devlin 等人使用的主要基准 (2019)。为了探索我们知识编码器模块是否会降低常见 NLP 任务的性能，我们在 8 个 GLUE 数据集上评估 ERNIE，并将其与 BERT 进行比较。

在表 6 中，我们报告了我们的评估提交结果和排行榜中 BERT 的结果。我们注意到 ERNIE 在 MNLI、QQP、QNLI 和 SST-2 等大数据集上与 BERTBASE 一致。结果在小数据集上变得更加不稳定，即 ERNIE 在 CoLA 和 RTE 上更好，但在 STS-B 和 MRPC 上更差。

简而言之，ERNIE 在 GLUE 上取得了与 BERTBASE 相当的结果。一方面，这意味着 GLUE 不需要外部知识来进行语言表示。另一方面，它说明了 ERNIE 在异构信息融合后不会丢失文本信息。

4.6 消融研究

在本小节中，我们使用FewRel 数据集探索信息实体和知识性预训练任务（dEA）对ERNIE 的影响。 w/o entity 和 w/o dEA 分别指微调 ERNIE没有实体序列输入和没有预训练任务 dEA。如表 7 所示，我们有以下观察结果：(1)在没有实体序列输入的情况下，dEA 在预训练期间仍然将知识信息注入语言表示中，这使 BERT 的 F1 分数提高了 0.9%。 (2)虽然信息实体带来了很多知识信息，直观地有利于关系分类，但没有 dEA 的 ERNIE 几乎没有利用这一点，导致 F1 增加了 0.7%。

5 结论

在本文中，我们提出了将知识信息整合到语言表示模型中的ERNIE模型。我们提出了知识丰富的聚合器和预训练任务 dEA，以更好地融合来自文本和 KG 的异构信息。实验结果表明，ERNIE 在去噪远程监督数据和对有限数据进行微调方面都比 BERT 更好。未来的研究还有三个重要方向：（1）将知识注入基于特征的预训练模型，如 ELMo（Peters 等，2018）；(2) 将多样化的结构化知识引入到不同于世界知识数据库 Wikidata 的 ConceptNet (Speer and Havasi, 2012) 等语言表示模型中； (3) 启发式地注释更多真实世界的语料库以构建更大的预训练数据。这些方向可能会导致更一般和更有效的语言理解。

本文图片和表格均来自Zhang Z, Han X, Liu Z, et al. ERNIE: Enhanced Language Representation with Informative Entities[C]//Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. 2019: 1441-1451.

yolov8实战第七天——pyqt5-yolov8实现车牌识别系统（参考论文（约7000字）+环境配置+完整部署代码+代码使用说明+训练好的模型）学术菜鸟小晨 yolov8实战100天 python YOLO pyqt5 车牌识别毕业设计论文
基于pyqt5-yolov8实现车牌识别系统，包括图片车牌识别，视频车牌识别，视频流车牌识别。效果展示（图片检测，检测到的内容添加到历史记录）：效果展示（视频检测，视频车辆只会添加一条记录，下文更多实际应用中的优化策略）：新增功能：批量图片检测（2024/5/7更新代码）
AI进化论：从图灵测试到智能革命的临界点 A达峰绮人工智能数据处理经验分享 AIGC AI人工智能
智能觉醒的起源密码（1943-2010）在曼彻斯特维多利亚大学的实验室里，1948年"Baby"计算机完成人类首个存储程序运行实验时，艾伦·图灵正在构思《计算机器与智能》。这篇划时代论文提出的"模仿游戏"测试，为人工智能奠定了哲学基础。1956年达特茅斯会议上，麦卡锡正式提出"人工智能"概念，当时学界乐观预测"二十年内机器将完成人类所有工作"。神经网络的发展轨迹充满戏剧性：1958年罗森布拉特发明
AI时代个人财富增长实战指南：从零基础到精通变现的完整路径 A达峰绮人工智能
（本文基于人工智能技术发展规律，结合互联网经济底层逻辑，为普通从业者构建系统性AI应用框架）一、建立AI认知基础：技术理解与工具掌握技术分类认知人工智能工具分为四大功能模块：自然语言处理（文本生成、对话交互）、计算机视觉（图像视频处理）、数据分析（预测建模）、自动化控制（流程优化）。建议新手首先掌握语言类工具的基础操作，逐步扩展到其他领域。工具操作逻辑通用AI工具通常包含三大核心功能模块：输入界面
大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
软考系统架构设计师考试学习和考试的知识点大纲，覆盖所有考试考点 DKPT #系统架构设计师系统架构学习
以下是软考系统架构设计师考试的知识点大纲，覆盖所有官方考点，分为基础知识、核心技术、系统设计、案例分析、论文写作五大模块，帮助系统性学习和备考：一、基础知识模块计算机组成与体系结构计算机硬件组成（CPU、内存、I/O设备）存储系统（Cache、RAID、虚拟内存）指令系统与流水线技术操作系统进程与线程管理（调度算法、死锁）内存管理（分页、分段、虚拟内存）文件系统与磁盘管理数据库系统关系数据库（SQ
量子位招聘 | DeepSeek帮我们改的招聘启事量子位
关注前沿科技量子位未来同事，你好~这是一则招聘帖。如果你与我们志同道合，对AI大模型、具身智能、终端硬件、AI新媒体编辑感兴趣，我们正在招聘这些领域的原创作者。以下岗位均为全职，工作地点：北京中关村。岗位面向：社招、应届毕业生，所有岗位均可实习——表现出色均可转正加分项：乐于探索AI新工具，善用AI新工具；拥有解读论文的能力，能深入浅出讲解原理；有写代码能力；量子位长期读者。加入我们，你可以获得：
景联文科技入选中国信通院发布的“人工智能数据标注产业图谱” 景联文科技科技人工智能
近日，由中国信息通信研究院、中国人工智能产业发展联盟牵头，联合中国电信集团、沈阳市数据局、保定高新区等70多家单位编制完成并发布《人工智能数据标注产业图谱》。景联文科技作为人工智能产业关键环节的代表企业，入选图谱中技术服务板块。图谱按照国家数据局技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等六个方面任务展开，由上游资源提供方、中游数据标注核心服务方、下游配套支撑方三部分组成。其中上游
AI工具如何改变编程学习？Trae IDE与Claude 3.5的实践案例黑金IT AI智能 AI编程 fasttify 人工智能学习 ide
在现在这个到处都是电脑和手机的时代，AI工具正在变成编程学习和开发的好帮手。今天，咱们就来好好聊聊AI工具，特别是TraeIDE和Claude3.5这两个工具，在学习FastAPI和构建知识图谱的时候有多厉害，还有它们对编程行业会有什么影响。一、AI工具：编程学习与开发的好帮手AI工具在编程学习和开发里，作用可太大了。就像TraeIDE和Claude3.5，它们能像好朋友一样，在写代码的时候帮忙检
不搞花里胡哨！CMU最新开源：极简风格的LiDAR全景分割+跟踪！ 3Ｄ视觉工坊 3D视觉从入门到精通 3D视觉
来源：3D视觉工坊在公众号「3D视觉工坊」后台，回复「原论文」可获取论文pdf、代码链接添加微信：dddvisiona，备注：三维点云，拉你入群。文末附行业细分群1.笔者个人体会激光雷达全景分割（LPS）一般遵循自下而上的以分割为中心的范式，利用聚类获得对象实例来建立语义分割网络。但是最近CMU&Meta等大佬们重新思考了这种方法，并提出了一个简单而有效的检测中心网络，用于LPS和跟踪。这项工作也
【论文解读】DSVP：通过动态扩展实现快速探索的双阶段视点规划器 Travis.X 论文解读自动驾驶动态规划人工智能
标题：DSVP:Dual-StageViewpointPlannerforRapidExplorationbyDynamicExpansion作者：HongbiaoZhu,ChaoCao,YukunXia,SebastianScherer,JiZhang,andWeidongWang来源：https://frc.ri.cmu.edu/~zhangji/publications/IROS_2021.
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
今日行情明日机会——20250321 人大博士的交易之路人工智能区块链数学建模数据挖掘分类涨停回马枪大数据
后续投资机会分析结合2025年3月21日盘面数据（涨停56家，跌停31家），市场呈现结构性分化行情，海洋经济成为绝对主线，机器人概念局部活跃，人工智能表现较弱。以下是具体方向与策略建议：1.海洋经济（核心主线，政策+事件驱动）核心逻辑：板块23家涨停，梯队完整（七板至一板），神开股份（七板）打开高度，叠加海洋资源开发、碳中和政策（如海上风电、深海装备）催化，资金深度介入。大连重工（三板，海洋工程装
人工智能革命：技术演进图谱与人类文明重构路径 A达峰绮人工智能重构经验分享图形绘制数据处理 AI
当GPT-4在2023年3月通过注册会计师考试时，其财务分析模块展现的推理能力已超越85%的人类考生。这个标志性事件背后，折射出人工智能正在突破认知型工作的最后防线。我们正在见证的，不仅是技术迭代，更是人类文明范式的根本性转变。一、算力奇点降临：AI基础设施的指数级进化量子计算与神经形态芯片的融合正在重塑算力边界。IBM最新数据显示，其量子体积（QuantumVolume）从2020年的64跃升至
探索Astra DB与LangChain的集成：从向量存储到对话历史 eahba 数据库 langchain python
技术背景介绍AstraDB是DataStax推出的一款无服务器的向量数据库，基于ApacheCassandra®构建，并通过易于使用的JSONAPI提供服务。AstraDB的独特之处在于其强大的向量存储能力，这在处理自然语言处理任务时尤为突出。LangChain与AstraDB的集成为开发者提供了强大的工具链，从数据存储到语义缓存，再到自查询检索，帮助简化复杂的数据操作。核心原理解析LangCha
如何评估一个RAG系统（RAGas评测框架）-下篇写程序的小火箭大语言模型人工智能语言模型 chatgpt langchain gpt
RAGas是一个用于评测RAG系统的评测框架，它支持与不同大语言模型的集成，并与langchain生态打通，能够很方便的构建评测系统。下面是RAGas的一些链接论文：https://arxiv.org/pdf/2309.15217官方文档：Ragashttps://github.com/explodinggradients/ragas官方文档及github对框架的使用介绍的比较详细，本文不会就该方
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT s1ckrain 计算机视觉论文阅读计算机视觉人工智能
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题：SAM是一个基于大规模数据预训练的强大提示框架，推动了分割领域的发展。尽管SAM具有通用性，但在无需人工提示的情况下，针对特定视觉概念（如自动分割用户宠物狗）的定制化研究尚不充分。方法提出：提出了一种无需训练的SAM个性化方法，称为PerSAM。仅需单次数据（一张带参考掩码的图像），即可在新
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
比较分析：Windsurf、Cody、Cline、Roo Cline、Copilot 和通义灵码张3蜂开源编程语言与开发技术选型与架构设计 copilot c#AI编程
随着人工智能技术的快速发展，开发者工具变得越来越智能化，特别是在代码生成、辅助编程等领域，市面上涌现了多种AI驱动的工具。本文将从开源性、集成能力、功能覆盖范围、支持的编程语言、生态兼容性、成本、学习曲线、响应速度、离线支持以及与.NETCore的适配性等十个维度对以下几种产品进行比较：Windsurf、Cody、Cline、RooCline、Copilot和通义灵码。1.开源性Windsurf:
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
使用Aim追踪LangChain执行 bavDHAUO langchain python
在现代人工智能应用中，调试和可视化自动化工作流变得越来越重要，Aim正是为此而生。通过Aim，你可以轻松地追踪LangChain中语言模型(LLM)和工具的输入输出，以及代理的动作，从而在执行过程中快速定位和解决问题。此外，Aim还支持并排比较多个执行流程，使之成为调试中的得力助手。Aim是一个完全开源的项目，你可以在GitHub上找到更多关于Aim的信息。在本文中，我们将展示如何启用和配置Aim
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
DeepSeek 模型未来怎么走？技术创新、行业落地全解析！网罗开发 AI 大模型人工智能人工智能职场和发展
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
AI学习教程DeepSeek使用教程合集免费下载 oneboxai 学习
1.DeepSeek本地部署2.Deepseek搭建个人知识库3.DeepSeek提示词详解4.Deepseek使用技巧大全5.DeepSeek提示词大全6.DeepSeek保姆级新手教程7.DeepSeek各类应用8.Deepseek写小说9.DeepSeekV3部署教程10.DeepseekwordExcel11.Deepseek科研论文12.Deepseek开发游戏13.大模型通用一-A1指
分享12个国内AI对话聊天的免费网站（含DeepSeek大模型）码上飞扬人工智能语言模型 DeepSeek
在人工智能领域，基于对话的语言模型已成为当前研究的热点，其中以ChatGPT为代表的模型凭借其卓越的语言理解与交互能力备受瞩目。为帮助用户更好地选择和使用这类AI工具，本文将介绍12个国内可直接体验对话聊天功能的平台，为用户提供实用参考。1、腾讯元宝地址：https://hunyuan.tencent.com/bot/chat腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预
2025年美赛数学建模 ICM 问题 E：为农业腾出空间深度学习&目标检测实战项目数学建模 2025美赛 2025年数学建模美赛思路代码问题 E：为农业腾出空间 2025美赛E题
全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto1
《今日AI-人工智能-编程日报》-源自2025年3月21日小亦编辑部人工智能
一、AI编程领域最新动态AI编程工具崛起，程序员职业面临挑战Anthropic首席执行官DarioAmodei预言，未来一年内，90%的代码将由AI生成，传统程序员的工作可能被大幅替代。最新发布的AI编程模型（如Claude3.7、Sonnet3.7）在初级开发评估中表现优异，得分率超过60%，部分模型甚至在全球程序员排名中位列前0.1%。字节跳动的Trae海外版接入Claude3.7和GPT-4
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite