BUFANG_XF

【论文阅读】Get To The Point: Summarization with Pointer-Generator Networks

2017 ACL 指针生成网络

文章目录

- Abstract
- 1 Introduction
- 2 Our Models
- - 2.1 Sequence-to-sequence attentional model
  - 2.2 Pointer-generator network
  - 2.3 Coverage mechanism
- 3 Related Work
- 4 Dataset
- 5 Experiments
- 6 Results
- - 6.1 Preliminaries(准备工作)
  - 6.2 Observations
- 7 Discussion
- - 7.1 Comparison with extractive systems
  - 7.2 How abstractive is our model?
- 8 Conclusion

Abstract

神经序列到序列模型为抽象文本摘要提供了一种可行的新方法(这意味着它们不局限于简单地从原始文本中选择和重新安排段落)。然而，这些模型有两个缺点:它们容易不准确地再现事实细节，而且它们倾向于重复自己。在这项工作中，我们提出了一个新的结构，以两种正交的方式增加标准的序列到序列的注意模型。首先，我们使用了一个混合的指针生成网络，它可以通过pointing从源文本中复制单词，这有助于准确地复制信息，同时保留了通过generator生成新单词的能力。其次，我们使用coverage来跟踪已经总结的内容，这就不鼓励重复。我们将我们的模型应用到CNN /每日邮报的总结任务中，比目前的抽象技术至少高出2个ROUGE点。

1 Introduction

摘要是将一段文本浓缩为包含原始文本主要信息的较短版本的任务。摘要有两种广泛的方法：抽取式和抽象式。抽取法只从直接从源文本中摘取的段落（通常是整句）中收集摘要，而抽象法可能会生成源文本中没有的新词和短语–就像人类编写的摘要通常所做的那样。提取方法更容易，因为从源文档复制大块文本可以确保语法和准确性的基线水平。另一方面，对于高质量摘要至关重要的复杂能力，如释义、概括或现实世界知识的结合，只有在抽象框架中才有可能（参见图5）。

由于抽象总结的困难，过去的绝大多数工作都抽取性的。然而，最近序列到序列模型的成功使得抽象摘要变得可行。尽管这些系统很有前途，但它们也表现出一些不良行为，如不准确地再现事实细节、无法处理词汇表外(OOV)单词以及重复（参见图1）。

在本文中，我们提出了一个在多句摘要的上下文中解决这三个问题的体系结构。虽然最近的抽象工作集中在标题生成任务（将一两个句子简化为一个标题）上，但我们认为长文摘要更具挑战性（需要更高的抽象级别，同时避免重复），而且最终更有用。因此，我们将我们的模型应用于最近引入的CNN/Daily Mail数据集，该数据集包含新闻文章（平均39句）和多句摘要，并表明我们比最先进的抽象系统的性能高出至少2个ROUGE点。

我们的混合指针-生成器网络通过指向方便了从源文本复制单词，这提高了OOV单词的准确性和处理，同时保留了生成新词的能力。该网络可以被看作是抽取和抽象方法之间的平衡，类似于Gu et al.（2016）的CopyNet和Miao and Blunsom(2016)的强制注意句子压缩，它们被应用于短文本摘要。我们从神经机器翻译中提出了一种coverage vector的新变体（Tu et al.，2016)，我们使用它来跟踪和控制源文档的覆盖。我们证明coverage 对消除重复是非常有效的。

2 Our Models

在本节中，我们将描述（1）我们的基线序列到序列模型，(2)我们的PointerGenerator模型，以及（3）我们的覆盖机制，可以添加到前两个模型中的任何一个。我们模型的代码可以在线获得。www.github.com/abisee/pointer-generator

2.1 Sequence-to-sequence attentional model

我们的基线模型与Nallapati等人的相似。 (2016)，如图2所示。文章中的令牌Wi被一个接一个地送入编码器（单层双向LSTM)，产生编码器隐层状态hi序列。在每个步骤t上，解码器（单层单向LSTM）接收前一个单词的单词嵌入（在训练时，这是参考摘要的前一个单词；在测试时，这是解码器发出的前一个单词），并具有解码器状态st。注意力分布at计算方法与Bahdanau等人相同。（2015年）：

其中V、WH、WS和Battn是可学习参数。注意力分布可以看作是源词的概率分布，它告诉解码器在哪里寻找产生下一个词。接下来，使用注意力分布来产生编码器隐藏状态的加权和，称为上下文向量h*t:

上下文向量可以看作是这一步从源读取的内容的FixedSize表示，它与解码器状态ST级联，并通过两个线性层馈送，以产生词汇分布PVOCAB：

PVOCAB是词汇表中所有单词的概率分布，它为我们提供了预测单词w的最终分布：

2.2 Pointer-generator network

我们的指针生成器网络是我们的基线和指针网络（Vinyals et al.，2015)之间的混合体，因为它既允许通过指向复制单词，也允许从固定词汇表生成单词。在指针生成器模型（如图3所示）中，注意力分布AT和上下文向量HT如2.1节所示计算。另外，时间步长T的生成概率Pgen∈[0,1]，由上下文向量HT、解码器状态ST和解码器输入XT计算：

接着，PGEN被用作软开关，以选择是通过从PVOCAB中采样从词汇表中生成单词。还是通过从AT的关注分布中采样从输入序列中复制单词。对于每个文档，让扩展词汇表表示这些词汇表和源文档中出现的所有单词的联合。我们在扩展词汇表上得到以下概率分布：

注意，如果w是词汇表外(OOV)词，那么pvocab(w)为零；类似地，如果w没有出现在源文档中，那么∑i:wi=wati为零。产生OOV词的能力是指针生成器模型的主要优点之一；相比之下，像我们的基线这样的模型被限制在它们预先设置的词汇表中。

损失函数如方程（6）和（7）所述，我们在方程（9）中给出的修正概率分布p(w)。

2.3 Coverage mechanism

重复是Sequenceto-Sequence模型的一个常见问题，在生成多句文本时尤其明显（见图1）。我们改写了Tu等人的覆盖模型。（2016年）解决问题。在我们的覆盖模型中，我们维护一个覆盖向量CT，它是所有先前时间步骤解码器上的注意力分布的总和：

直观地说，CT是源文档单词上的一个（非规范化）分布，它代表了这些单词到目前为止从注意力机制中获得的覆盖程度。请注意，C0是一个零向量，因为在第一个timestep中，没有一个源文档被覆盖。

覆盖向量被用作注意力机制的额外输入，将等式（1）改为：

这确保了注意机制当前的决定（选择下一次关注的点）被它以前的决定的提醒通知（summarized in ct ）。这将使注意力机制更容易避免重复关注相同的位置，从而避免产生重复的文本。

我们发现有必要（见第5节）另外定义coverage loss，以惩罚重复处理同一地点：

等式（12）不同于机器翻译中使用的覆盖损失。在机器翻译中，我们假设应该有一个大致一对一的翻译比；因此，如果最终覆盖向量大于或小于1，则对其进行惩罚。

我们的损失函数更加灵活：因为摘要不应该要求统一的覆盖，我们只惩罚每个注意力分布与迄今为止覆盖之间的重叠–防止重复注意。最后，由一些超参数λ重新加权的复盖损失，被添加到主损失函数，以产生一个新的混合损失函数：

3 Related Work

Neural abstractive summarization..拉什等人。（2015）是第一个将现代神经网络应用于抽象文本摘要的人，在DUC-2004和GigaWord这两个句子级摘要数据集上实现了最先进的性能。他们的方法以注意力机制为中心，通过循环解码器（Chopra et al.，2016)、抽象意义表示（Takase et al.，2016)、分层网络（Nallapati et al.，2016)、变分自动编码器（Miao and Blunsom，2016)和直接优化性能度量（Ranzato et al.，2016)，进一步提高了这些数据集的性能。

然而，用于较长文本摘要的大规模数据集很少。纳拉帕蒂等人。（2016）改编了DeepMind问答数据集（Hermann et al.，2015)进行总结，产生了CNN/Daily Mail数据集，并提供了第一个抽象基线。同样的作者随后发表了一种神经提取方法（Nallapati et al.，2017)，该方法使用分层RNN来选择句子，并发现相对于Rouge度量，它显著优于他们的抽象结果。据我们所知，这是完整数据集上仅有的两个公布的结果。

在现代神经方法之前，抽象文摘比抽取文摘受到的关注少，但Jing(2000)探索切割句子中不重要的部分来创建文摘，Cheung和Penn(2014)探索使用依赖树进行句子融合。

Pointer-generator networks. 指针网络（Vinyals et al.，2015)是一个使用Bahdanau等人的软注意力分布的序列对序列模型。（2015）产生由输入序列中的元素组成的输出序列。指针网络已被用于为NMT（Gulcehre et al.，2016)、语言建模（Merity et al.，2016)和摘要创建混合方法。

我们的方法接近Miao和Blunsom（2016）的强迫注意句子压缩模型和Gu et al.（2016）的CopyNet模型，但有一些小的差异：（i）我们计算了明确的切换概率pgen，而Gu et al.通过共享的softmax函数诱导竞争。（ii）我们回收注意力分布作为拷贝分布，但Gu等人使用两个单独的分布。（iii）当一个单词在源文本中多次出现时，我们将注意力分布的所有相应部分的概率质量相加，而Miao和Blunsom没有。我们的推理是：（i）计算一个明确的pgen有效地使我们能够同时提高或降低所有生成单词或所有复制单词的概率，而不是单独提高或降低概率，（ii）这两种分布具有类似的目的，我们发现我们更简单的方法就足够了，以及（iii）我们观察到，指针机制通常会复制一个单词，同时关注它在源文本中的多次出现。

我们的方法与Gulcehre等人的方法大不相同。（2016）和Nallapati等人（2016年）。这些工作训练它们的指针组件只为词汇表外的单词或命名实体激活（而我们允许我们的模型自由地学习何时使用指针），它们不会混合来自副本分布和词汇表分布的概率。我们认为这里描述的混合方法更适合于抽象文摘–在第6节中，我们表明复制机制对于准确复制稀有但在词汇表中的单词至关重要，在第7.2节中，我们观察到混合模型使语言模型和复制机制能够协同工作来执行抽象文摘。

Coverage. 覆盖源于统计机器翻译(Koehn，2009)，由Tu等人修改为NMT。（2016）和米等人。 (2016)，他们都使用一个GRU来更新每一步的覆盖向量。我们发现一种更简单的方法–对注意力分布求和以获得覆盖向量–就足够了。在这方面，我们的方法类似于Xu等人。 (2015)，他们将一种类似覆盖的方法应用于图像帽配比，以及Chen等人。 (2016)，他们还将方程（11）中描述的覆盖机制（他们称之为“分心”）纳入对较长文本的神经摘要。

Temporal attention是一种相关技术，已应用于NMT（Sankaran et al.，2016)和摘要（Nallapati et al.，2016)。在这种方法中，每一个注意力分配被前一个注意力分配的总和除以，有效地抑制了重复的注意力。我们尝试了这种方法，但发现它的破坏性太大，扭曲了来自注意力机制的信号，降低了性能。我们假设，像覆盖这样的早期干预方法比像时间注意这样的事后干预方法更好–通知注意机制以帮助它做出更好的决定比完全推翻它的决定更好。这一理论得到了覆盖给我们的胭脂评分带来的巨大提升（见表1)，而相同任务的时间关注给我们的提升较小（Nallapati et al.，2016)。

4 Dataset

我们使用CNN/Daily Mail数据集（Hermann et al.，2015；Nallapati et al.，2016)，其中包含在线新闻文章（平均781个令牌）与多句摘要（平均3.75句或56个令牌）配对。我们使用了Nallapati等人提供的脚本。（2016）获得了相同版本的数据，其中有287,226个训练对、13,368个验证对和11,490个测试对。这两个DataSet已发布的结果（Nallapati et al.，2016，2017)都使用了数据的匿名版本，该版本已经过预处理，以将每个命名实体（如联合国）替换为示例对的唯一标识符（如@Entity5）。相比之下，我们直接对原始文本（或非匿名版本的数据）进行操作，2我们认为这是一个很好的解决问题，因为它不需要预处理。

5 Experiments

对于所有实验，我们的模型有256维的隐藏状态和128维的词嵌入。对于指针生成器模型，我们对源和目标都使用50K单词的词汇表–注意，由于指针网络处理OOV单词的能力，我们可以使用比Nallapati et al.(2016)150K源词汇表和60K目标词汇表更小的词汇表。对于基线模型，我们还尝试了150K的更大词汇量。

请注意，指针和覆盖机制为网络引入的额外参数很少：对于词汇表大小为50K的模型，基线模型有21,499,600个参数，指针生成器添加了1153个额外参数（公式8中的WH*、WS、WX和BPTR)，覆盖机制添加了512个额外参数（公式11中的WC）。

不像Nallapati等人。 (2016)，我们不预先训练单词嵌入–它们是在训练中从头学来的(白手起家不用预训练参数)。我们使用Adagrad（Duchi et al.，2011)进行训练，学习率为0.15，初始累加器值为0.1。（这被发现是最有效的随机梯度下降，Adadelta，动量，Adam和RMSprop）。我们使用最大梯度范数为2的梯度裁剪，但不使用任何形式的正则化。我们在验证集上使用损失来实现早期停止。

在训练和测试时，我们将文章截断为400个令牌，并将摘要的长度限制为100个令牌用于训练，120个令牌用于测试。这样做是为了加快训练和测试，但我们也发现截断文章可以提高模型的性能（更多细节请参见7.1节）。对于训练，我们发现从高度截断的序列开始，然后在收敛后提高最大长度是有效的。我们在单个特斯拉K40M GPU上进行训练，批量大小为16个。在测试时，我们的总结是使用波束大小为4的波束搜索产生的。

我们对我们的两个基线模型进行了大约60万次迭代（33个epochs)）的训练–这与Nallapati等人（2016）的Best Model所要求的35个epochs)相似。 50K词汇量模型的训练时间为4天14小时，150K词汇量模型的训练时间为8天21小时。我们发现指针生成器模型训练速度更快，需要不到23万次训练迭代（12.8个Epochs）；总共3天4小时。特别是，指针生成器模型在训练的早期阶段取得了更快的进展。为了获得最终的覆盖模型，我们添加了覆盖损失加权为λ=1的覆盖机制（如公式13所述），并训练了3000次迭代（约2小时）。在这段时间里，覆盖损失收敛到约0.2，从约0.5的初始值下降。我们还尝试了一个更积极的值λ=2；这减少了覆盖损失，但增加了主损失函数，因此我们没有使用它。

我们尝试在没有损失函数的情况下训练覆盖模型，希望注意力机制可以自己学习不要重复注意同一位置，但我们发现这是无效的，重复没有明显的减少。我们也尝试从第一次迭代开始进行覆盖训练，而不是作为一个单独的训练阶段，但发现在训练的早期阶段，覆盖目标干扰了主要目标，降低了整体性能。

6 Results

6.1 Preliminaries(准备工作)

我们的结果在表1中给出。我们用标准的Rouge度量（Lin,2004b)评估我们的模型，报告Rouge1、Rouge-2和Rouge-L的F1分数（它们分别测量参考摘要和待评估摘要之间的单词重叠、Bigram-重叠和最长公共序列）。 4我们还使用Meteor度量（Denkowski and Lavie,2014）在精确匹配模式（只奖励单词之间的精确匹配）和完整模式（额外奖励匹配的词干、同义词和释义）下进行评估。5

除了我们自己的模型，我们还报告了Lead-3基线（它使用文章的前三句话作为总结），并在完整的数据集上与仅有的抽象化（Nallapati et al.，2016)和抽象化（Nallapati et al.，2017)模型进行了比较。我们的模型的输出可以在线获得。6

鉴于t我们生成纯文本摘要，但是Nallapati等人。（2016；2017）生成匿名摘要（见第4节），我们的ROUGE评分没有严格的可比性。有证据表明，原始文本数据集可能会比匿名数据集导致更高的Rouge分数–前者的Lead-3基线高于后者。一种可能的解释是，多词命名实体导致更高的n元重叠率。不幸的是，ROUGE是唯一可用的手段与Nallapati等人的工作进行比较。然而，鉴于Lead-3评分的差异分别为(+1.1Rouge-1、+2.0Rouge-2、+1.1Rougel)点，我们的最佳模型评分超过了Nallapati等人。（2016）通过(+4.07Rouge1,+3.98Rouge-2,+3.73Rouge-L)点，我们可以估计我们至少比以前唯一的抽象系统的性能高出至少2个Rouge点。

6.2 Observations

我们发现我们的两个基线模型在Rouge和Meteor方面的表现都很差，事实上更大的词汇量(150K)似乎没有帮助。即使是性能较好的基线（有50K词汇表）也会产生包含几个常见问题的摘要。事实细节经常被错误地复制，经常用一个更常见的替代词代替一个不常见的（但在词汇表中）词。例如，在图1中，基线模型似乎与罕见的单词thewart进行了斗争，产生了disabilize，这导致了捏造的disabilize尼日利亚经济。更糟糕的是，总结有时会变成重复的废话，如图1中基线模型产生的第三句话。此外，基线模型无法再现词汇表外的单词（如图1中的Muhammadu Buhari）。补充材料中提供了所有这些问题的进一步例子。

我们的指针生成器模型实现了比基线更好的ROUGE和METEOR得分，尽管训练时间少得多。摘要中的区别也很明显：词汇表外的词处理得很容易，事实细节几乎总是正确地复制，没有捏造（见图1）。然而，重复现象仍然很普遍。

我们的带覆盖的指针生成器模型进一步提高了Rouge和Meteor的得分，令人信服地超过了Nallapati等人的最佳抽象模型。（2016）被几个ROUGE点。尽管覆盖训练阶段很短（约占总训练时间的1%)，但重复问题几乎完全消除，这既可以定性地看到（图1），也可以定量地看到（图4）。然而，我们的最佳模型并没有完全超过Lead-3基线的Rouge分数，也没有超过当前的最佳提取模型（Nallapati et al.，2017)。我们在第7.1节讨论这个问题。

7 Discussion

7.1 Comparison with extractive systems

从表1可以清楚地看出，抽取系统往往比抽象系统获得更高的ROUGE分数，并且抽取式lead-3基线非常强（即使是最好的萃取系统也只比它略胜一筹）。我们对这些观察提供了两种可能的解释。

首先，新闻文章往往以最重要的信息开头；这部分解释了Lead-3基线的强度。事实上，我们发现，只使用文章的前400个标记（大约20句话）比使用前800个标记产生的Rouge分数要高得多。

其次，任务的性质和Rouge度量使得提取方法和Lead3基线很难被击败。参考摘要内容的选择是相当主观的–有时句子形成了一个自成一体的摘要；其他时候，它们只是展示文章中一些有趣的细节。鉴于文章平均包含39个句子，有许多同样有效的方法来选择这种风格的3或4个亮点。抽象引入了更多的选项（措辞的选择），进一步降低了与参考摘要匹配的可能性。例如，对于图5中的第一个示例，走私者从绝望的移民中获利是一个有效的替代抽象摘要，但它相对于参考摘要的得分为0胭脂。 Rouge的这种不灵活性因只有一个参考摘要而加剧，与多个参考摘要相比，这表明Rouge的可靠性较低(Lin，2004a)。

由于任务的主观性和有效摘要的多样性，Rouge似乎奖励安全的策略，如选择首次出现的内容，或保留原始的措辞。虽然参考摘要有时确实偏离了这些技术，但这些偏差是不可预测的，以至于更安全的策略平均获得更高的Rouge分数。这可能解释了为什么萃取系统往往比抽提系统获得更高的ROUGE分数，甚至萃取系统也不会显著超过LEAD-3基线。

为了进一步探讨这个问题，我们使用Meteor度量来评估我们的系统，它不仅奖励精确的单词匹配，还奖励匹配词干、同义词和释义（来自预定义列表）。我们观察到，所有模型都通过包含词干、同义词和释义匹配获得了超过1个流星点的提升，这表明它们可能正在执行一些抽象。然而，我们再次观察到，我们的模型没有超过Lead-3基线。可能是新闻文章风格使得Lead3基线在任何指标方面都非常强。我们认为，进一步调查这一问题是今后工作的一个重要方向。

7.2 How abstractive is our model?

我们已经表明，我们的指针机制使我们的抽象系统更加可靠，更经常地正确复制事实细节。但是复制的方便性是否使我们的系统变得不那么抽象了呢？

图6显示，我们最终模型的摘要包含的新n-grams（即那些没有出现在文章中的）的比率比参考摘要低得多，这表明抽象程度较低。请注意，基线模型更频繁地产生新的n-grams–然而，这个统计数据包括所有错误复制的单词、UNK tokens和捏造，以及良好的抽象实例。

特别是，图6显示我们的最终模型在35%的时间内复制了整个文章句子；相比之下，参考摘要只有1.3%的时间是这样做的。这是一个主要的改进领域，因为我们希望我们的模型超越简单的句子提取。然而，我们观察到其他65%包含了一系列抽象技术。文章句子被截断，形成语法正确的短版本，新句子是通过拼接片段组成的。不必要的感叹词、从句和带括号的短语有时会从抄写的段落中省略。图1展示了其中的一些能力，补充材料包含了更多的例子。

图7显示了两个更令人印象深刻的抽象示例–它们都具有相似的结构。该数据集包含许多体育故事，这些故事的摘要遵循的是X beat Y score on day的模板，这可能解释了为什么我们的模型在这些例子上最有信心地抽象出来。然而，一般说来，我们的模型并不像图7中那样常规地生成摘要，也不像图5中那样接近于生成摘要。

生成概率pgen的值也给出了模型抽象性的度量。在训练期间，pgen的值从大约0.30开始，然后增加，在训练结束时收敛到大约0.53。这表明模型首先学习大部分的复制，然后学习大约一半的时间生成。然而，在测试时，pgen严重偏向于复制，平均值为0.17。这种差异可能是由于在培训期间，模型以参考摘要的形式接受逐字监督，但在测试时却没有。尽管如此，即使模型正在复制，生成器模块也很有用。我们发现，在不确定的情况下，例如句子的开头、缝合在一起的片段之间的连接以及产生截断复制句子的句点时，pgen最高。我们的混合模型允许网络在同时参考语言模型的同时进行复制，从而使拼接和截断等操作具有语法性。无论如何，鼓励指针生成器模型更抽象地编写，同时保留指针模块的准确性优势，是未来工作的一个令人兴奋的方向。

8 Conclusion

在这项工作中，我们提出了一个带覆盖的混合PointerGenerator体系结构，并表明它减少了不准确和重复。我们将我们的模型应用于一个新的、具有挑战性的LongText数据集，并显著优于抽象的最新结果。我们的模型展示了许多抽象能力，但是获得更高的抽象级别仍然是一个开放的研究问题。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文