经典论文阅读（9）——XLNET

由于具有双向上下文建模的能力，BERT等基于自编码的预训练方法比基于自回归语言建模的预训练方法具有更好的性能然而。但由于依赖于用mask破坏输入，BERT忽略了mask位置之间的依赖关系，并遭受了训练前微调的差异。本文提出了一种广义的自回归预训练方法XLNet，该方法(1)通过最大化所有分解顺序排列的期望似然来实现双向上下文学习，(2)由于其自回归公式，克服了BERT的局限性。此外，XLNet集成了Transformer-XL的思想，这是最先进的自回归模型。

AR自回归语言模型寻求用自回归模型估计文本语料库的概率分布，具体的，给定一个文本序列，自回归模型将可能性分解为正向的 $p(x)=\prod_{t=1}^Tp(x_t|x_{<t})$ 或反向的 $p(x)=\prod_{t=T}^1p(x_t|x_{>t})$ 。由于AR语言模型只被训练成对单向上下文进行编码，它无法对深层上下文建模，而下游的语言理解任务往往需要双向的上下文信息，这导致了AR模型和有效的预训练之间的差距。

AE自编码模型是从损坏的输入数据中重建原始数据。给定输入的标记序列，特定部分的标记被一个特殊的符号[MASK]代替，然后训练模型从被破坏的数据中恢复原始token。这消除了前面提到的AR语言建模中的双向信息差距，从而提高了性能。然而，BERT在预训练时使用的[MASK]等人工符号在微调时的真实数据中是缺失的，导致了预训练和微调时的差异。此外，BERT假设预测的标记与未被隐藏的标记是相互独立的。

本文提出了XLNet，它是一种广义的自回归方法，利用增强现实语言建模和AE的优点，同时避免它们的局限性。

与传统AR模型中使用固定的正向或向后分解顺序不同，XLNet将序列的期望对数似然最大化。
其次，作为一种通用的AR语言模型，XLNet不依赖于数据损坏。因此XLNet没有BERT预训练和微调间的差异。
受AR语言建模的最新进展的启发，XLNet将片段递归机制和Transformer-XL的相对编码方案集成到预训练中，这从经验上提高了性能，特别是涉及较长的文本序列的任务。
重新参数化Transformer(-XL)网络。

提出的方法

背景

给定一个文本序列，AR语言模型通过前向自回归分解下的最大似然来进行预训练：

$\underset{\theta}{max}~logp_\theta(x)=\sum_{t=1}^Tp_\theta(x_t|x_{<t})=\sum_{t=1}^Tlog\frac{exp(h_\theta(x_{1:t-1})^Te(x_t))}{\sum_{x'}exp(h_\theta(x_{1:t-1})^Te(x'))}$

其中 $h_\theta(x_{1:t-1})$ 是由神经模型（如RNN、Trasformer等）产生的上下文表示，e(x)为x的embedding表示。相比而言，BERT是去躁自编码的。具体来说，对于一个文本序列x, BERT首先通过随机设置x中的一部分符号(例如15%)为一个特殊符号[MASK]来构造一个已损坏的版本 $\hat{x}$ 。将被屏蔽的符号设为 $\overline{x}$ 。训练目标是从 $\hat{x}$ 恢复 $\overline{x}$ ：

$\underset{\theta}{max}~logp_\theta(\overline{x}|\hat{x})\approx\sum_{t=1}^Tm_tlog_\theta(x_t|\hat{x})=\sum_{t=1}^Tm_tlog\frac{exp(H_\theta(\hat{x})_t^Te(x_t))}{\sum_{x'}exp(H_\theta(\hat{x})_t^Te(x'))}$

其中表示被屏蔽，而 $H_\theta$ 是一个将长度为T的文本序列x映射为一个。从以下几个方面可以比较这两种方法的优劣：

独立性假设：BERT在联合条件概率 $p(\overline{x}|\hat{x})$ 分解时基于独立假设，即所有被屏蔽的符号 $\overline{x}$ 都分别被重建。作为对比，AR语言模型在分解时使用乘积法则，没有这样的独立性假设。
输入噪声：BERT的输入包含了像[MASK]这样的人工符号，这些符号在下游任务中从未出现过，这就造成了预训练和微调的差异。将[MASK]替换为原始符号并不能解决问题，因为原始符号仅以很小的概率被使用，因此上述公式的优化非常小。相比之下，AR语言建模不依赖任何输入损坏，也没有这个问题。
上下文依赖：AR表征 $h_\theta(x_{1:t-1})$ 仅依赖于位置t之前的token，但BERT表征 $H_\theta(x)_t$ 能够捕获双向上下文。

目标:排列语言建模

我们提出了排列语言建模目标，该目标不仅保留了AR模型的优点，而且允许模型捕获双向上下文。具体来说，对于长度为T的序列x，有T!不同的顺序来执行有效的自回归分解。

令表示T长度的index序列[1,...,T]的所有排列可能，用和 $z_{<t}$ 表示第t个元素和一个排列z的前t-1个元素。我们提出的排列语言建模目标可以表示为：

$\underset{\theta}{max}~E_{z}[\sum_{t=1}^Tlog~p_{\theta}(x_{z_t}|x_{z_{<t}})]$

对于一个文字序列x，我们每次采样一个z并将似然 $p_{\theta}(x)$ 按分解顺序分解。由于模型参数 $\theta$ 在训练过程中在所有分解顺序中被共享，可以看到每个序列中可能的元素 $x_i \ne x_t$ ，因此能够捕获双向上下文。由于这个目标符合AR结构，它自然地避免了独立性假设和预训练-微调的差异。

所提出的目标只排列因子分解顺序，而不排列序列顺序。也就是说，我们保持原序列顺序，使用原序列对应的位置编码，并在transformer中通过适当的注意掩模实现分解顺序的排列。

框架：目标感知表示的两流自注意

虽然置换语言建模目标具有期望的属性，经典的Transformer参数化可能不起作用。假设我们用Softmax参数化下一个token的分布 $p_{\theta}(X_{z_t}|x_{z_{<t}})$ ，即， $p_{\theta}(X_{z_t}|x_{z_{<t}})=\frac{exp(e(x)^Th_{\theta}(x_{z_{<t}}))}{\sum_{x'}exp(e(x')^Th_{\theta}(x_{z_{<t}}))}$ ，其中 $h_{\theta}(x_{z_{<t}})$ 表示由共享Transformer在合适的屏蔽之后产生的 $x_{z_{<t}}$ 的隐藏表征。表征 $h_{\theta}(x_{z_{<t}})$ 不取决于它的位置，即 $z_{<t}$ 的值。因此，无论目标位置如何，预测的分布都是相同的，这就无法学习有用的表征。为了避免这个问题，我们建议重新参数化下一个token分布，使其能够感知目标位置，其中 $g_{\theta}(x_{z_{<t}},z_t)$ 表示一种新的表征，:

$p_{\theta}(X_{z_t}=x|x_{z_{<t}})=\frac{exp(e(x)^Tg_{\theta}(x_{z_{<t}},z_t))}{\sum_{x'}exp(e(x')^Tg_{\theta}(x_{z_{<t}},z_t))}$

两流自注意力：我们提出“站在”目标位置 $z_{t}$ 依赖于位置 $z_{t}$ 以通过注意力从上下文 $x_{<t}$ 中聚集信息。要使这个参数化起作用，在Transformer架构中有两个矛盾的需求：（1）为了预测token $x_{z_{t}}$ ， $g_\theta(x_{z_{<t}},z_t)$ 需要仅使用位置 $z_{t}$ 而不是内容 $x_{z_t}$ ，否则目标会变得微不足道；（2）为了预测其他token $x_{z_j}$ ，有j>t， $g_{\theta}(x_{z_{<t}},z_t)$ 还需要将内容 $x_{z_t}$ 进行编码以提供完整的上下文信息。为了解决该矛盾，我们提出两组而不是一组隐藏表征：
- 内容表征 $h_{\theta}(x_{z_{<t}})$ ，或简写为 $h_{z_t}$ ，其作用类似于Transformer中的标准隐藏状态。该表征将上下文和 $x_{z_{t}}$ 自身均进行编码。
- 查询表征 $g_{\theta}(x_{z_{<t}},z_{t})$ ，或简写为 $g_{z_t}$ ，仅包含上下文信息x_{z_{

第一层查询流被初始化为可训练的向量， $g_i^{(0)}=w$ ，内容流设置为相应的单词嵌入， $h_i^{(0)}=e(x_i)$ 。对每个自注意力层，有：

$g_{zt}^{(m)}\leftarrow Attention(Q=g_{zt}^{(m-1)},KV=h_{z_{<t}}^{(m-1)};\theta)\\ h_{zt}^{(m)}\leftarrow Attention(Q=h_{zt}^{(m-1)},KV=h_{z_{\leqslant t}}^{(m-1)};\theta)$

更新规则与标准的自注意力机制完全相同，因此在精调时，我们可以简单得将查询流去掉，并将内容流作为一个简单的Transformer-XL。最后，我们用最后一层查询表征 $g_{zt}^{(M)}$ 计算上面的公式。

局部预测

虽然排列语言建模目标有几个优点，但由于排列，它是一个更具挑战性的优化问题，并且在初步实验中收敛缓慢。为了降低优化难度，我们选择只按照分解顺序预测最后一个token。我们将z分割为非目标子序列 $h_i^{(0)}=e(x_i)$ 以及目标子序列z>c，c是一个分割点。目标是最大化非目标子序列条件下的目标子序列的对数似然，即:

$\underset{\theta}{max}~E_{z \sim Z_T}[log~p_{\theta}(x_{z>c}|x_{z \leqslant c})]=E_{z \sim Z_T}[\sum_{t=c+1}^{|z|}log~p_{\theta}(x_{z_t}|x_{z_{<t}})]$

注意到、 $z_{>c}$ 被选择作为目标，因为在给定当前分解阶z的情况下，它拥有序列中最长的上下文。另外使用超参数K，从而选择约1/K的token进行预测。

整合Transformer-XL的理念

由于我们的目标函数符合AR框架，我们将最先进的AR语言模型，Transformer-XL，加入到我们的预训练框架中。我们整合了Transformer-XL中两个重要的技术，即相对位置编码方案和段递推机制。

假设我们从一个长序列s中取出两个片段，即，令 $\widetilde{z}$ 和z分别为[1,...,T]和[T+1,...,2T]的排列。接着，基于排列 $\widetilde{z}$ ，我们处理第一个片段，接着将获得的层m的内容表征 $\widetilde{h}^{(m)}$ 进行缓存，然后对于下一段x，使用内存的注意里更新为

$h_{zt}^{(m)} \leftarrow Attention(Q=h_{zt}^{(m-1)},KV=[\widetilde{h}^{(m-1)},h_{z\leqslant t}^{(m-1)}];\theta)$

位置编码只依赖于原始序列中的实际位置，因此，一旦获得表征 $\widetilde{h}^{(m)}$ ，上面的注意力更新与 $\widetilde{z}$ 独立。这允许缓存和重用内存，而不需要知道前一段的分解顺序。查询流可以以同样的方式计算。

多段建模

在预训练截断，跟随BERT，我们随机采样两个片段(无论是来自相同的上下文还是不来自相同的上下文)，并将两个片段的拼接作为一个序列来进行置换语言建模。我们只重用属于同一上下文的内存。具体来说，我们的模型的输入与BERT相同:[CLS, A, SEP, B, SEP]。我们遵循两段数据格式，XLNet-Large没有使用下一句预测的目标，因为它在我们的消融研究中没有显示出持续的改善。

相对段落编码：在结构上，不同于BERT在每个位置的词嵌入上添加一个绝对段嵌入，我们将Transformer-XL中相对编码的思想进行延伸，也可以对片段进行编码。给定序列中的位置i和j，如果i和j来自同一段，我们使用段编码 $s_{ij}=s_{+}$ ，否则 $s_{ij}=s_{-}$ ， $s_{+}$ 和 $s_{-}$ 是每个注意力头的可学习参数。换句话说，我们只考虑这两个位置是否在同一段中，而不考虑它们来自哪个特定段。这与相对编码的核心思想是一致的，即只对位置之间的关系进行建模。段落编码 $s_{ij}$ 用来计算注意力权重 $a_{ij}=(q_i+b)^Ts_{ij}$ ，其中q_i为查询向量，b为一个可学习的头部偏倚向量。最后， $a_{ij}$ 被添加到注意力分数。使用相对段落编码的好处有：首先，相对编码的归纳偏差提高了泛化能力；其次，它提供了对具有两个以上输入段的任务进行微调的可能性，而使用绝对段编码是不可能做到这一点的。

讨论

我们观察到BERT和XLNet都执行局部预测，即只预测序列中标记的一个子集。这对于BERT来说是一个必要的选择，因为如果所有的token都被屏蔽，那么就不可能做出任何有意义的预测。此外，对于BERT和XLNet，局部预测通过仅足够的上下文预测token来降低优化难度。然而，独立性假设禁止BERT对目标之间的依赖关系进行建模。以[New, York, is, a, city]为例，假设BERT和XLNet都选择两个token[New, York]作为预测目标，并以最大化。有：

$J_{BERT}=log~p(New |is~a~city)+log~p(York |is~a~city) \\J_{XLNET}=log~p(New |is~a~city)+log~p(York |New,is~a~city)$

XLNet能够捕获这对(New, York)之间的依赖关系，而BERT忽略了这一点。XLNet总是在给定相同目标的情况下学习更多的依赖项对，并包含“更密集”的有效训练信号。

实验

使用的数据集有BooksCorpus和英文维基用于预训练数据，使用512的全序列长度。经过比较排列语言建模目标、Transformer-XL等，发现Transformer-XL和排列LM都明显为XLNet贡献了优于BERT的性能。

语音识别技术有哪些应用场景？不想秃头的程序语音识别人工智能
语音识别技术，作为人工智能领域的重要分支，已经深入到我们日常生活的方方面面。以下是一些常见的应用场景：智能助理智能助理如Siri、GoogleAssistant以及Alexa等，都基于语音识别技术来实现用户交互。用户可以通过语音命令来拨打电话、查询信息、设置提醒等。这些助理软件能够理解多种语言和方言，并能够在复杂的环境噪声中准确识别用户的指令。智能家居在智能家居领域，语音识别被用于控制各种智能设备
Keras深度学习框架入门及实战指南司莹嫣Maude
Keras深度学习框架入门及实战指南keraskeras-team/keras:是一个基于Python的深度学习库，它没有使用数据库。适合用于深度学习任务的开发和实现，特别是对于需要使用Python深度学习库的场景。特点是深度学习库、Python、无数据库。项目地址:https://gitcode.com/gh_mirrors/ke/keras一、项目介绍Keras简介Keras是一款高级神经网络
深度学习驱动的车牌识别：技术演进与未来挑战逼子歌深度学习车牌识别神经网络字符识别 YOLO 卷积神经网络
一、引言1.1研究背景在当今社会，智能交通系统的发展日益重要，而车牌识别作为其关键组成部分，发挥着至关重要的作用。车牌识别技术广泛应用于交通管理、停车场管理、安防监控等领域。在交通管理中，它可以用于车辆识别、交通违法监控和车流统计等，提高交通管理的效率和准确性。在停车场管理中，实现车辆的自动识别和收费，提升管理和服务水平。在安防监控领域，可用于追踪嫌疑人及犯罪行为。深度学习的出现为车牌识别带来了重
专业成长||听李哲老师讲《追求理解的教学设计》蒲公英_0477
文/梁树丽芹菜读书社分享这是我第一次听李哲老师讲书，当然我并没有做到在第一时间听而是这两天看的回放，因为讲书那天我身体不舒服，所以错过了现场的精彩。彩琴导师的“芹菜园读书社”分享的书都是专业性很强的经典书，而且是全英文的书，对于我这个初中老师来说，啃读这样的书是有难度的，比如这本《追求理解的教学设计》，如果不是李哲老师来领读，我想我肯定读不下来，或者说我会很轻易放弃这样让我头疼的书。李佩仪同学的主
前端性能优化 EdmundChen
要做性能优化，首先我们得知道用户从开始访问站点到看结果的这一段时间到底后花在了哪些地方。这就设计到一个经典问题。在游览器输入地址按下回车键之后到用户看到结果经历了哪些过程，这里简单说一下大的几个过程。（假设是输入的一个域名而非IP）1.通过DNS解析获得网址的对应IP地址2.浏览器拿到IP地址与远程web服务器通过TCP三次握手协商来建立一个TCP/IP连接3.浏览器通过HTTP接发送请求4.服务
【笔记】扩散模型（七）：Latent Diffusion Models（Stable Diffusion）论文解读与代码实现 LittleNyima Diffusion Models 笔记 stable diffusion AIGC 人工智能
论文链接：High-ResolutionImageSynthesiswithLatentDiffusionModels官方实现：CompVis/latent-diffusion、CompVis/stable-diffusion这一篇文章的内容是LatentDiffusionModels（LDM），也就是大名鼎鼎的StableDiffusion。先前的扩散模型一直面临的比较大的问题是采样空间太大，学
读经感恩日志361 香儿虫草醋蛋归元液
2019-03.12农历二月初六日星期二天气：晴读经人：妈妈、姐姐钰婷、妹妹钰殷读经方式:用137累积法系统读经第50周，第2天1.黄蒂内经（阴阳应象大论篇第五）《成语接龙下，4》《孟子》腾文公章句（上，2）弟弟听经典宝贝出生第42天177累积法听经典第3周，听经典第2天系统听经第16天《易经》屯卦3.蒙卦4.需卦5.《黄蒂内经》素问-四气调神大论篇第二《诗经》诗经邶风1《孟子》梁惠王章句上-3《
shell 笔记_s1=abc,s2=def,[-z‘‘‘]&；&；echo‘$s1‘ echo‘$s2‘的输出是什么 2024云技术运维 linux 面试
最全的Linux教程，Linux从入门到精通======================linux从入门到精通(第2版)Linux系统移植Linux驱动开发入门与实战LINUX系统移植第2版Linux开源网络全栈详解从DPDK到OpenFlow第一份《Linux从入门到精通》466页====================内容简介====本书是获得了很多读者好评的Linux经典畅销书**《Linu
数字化（电子化）招标采购平台系统核心功能详细介绍 xinyuan_123456 oracle
数智化招标采购平台覆盖全业务类型、全采购流程、全采购方式，是郑州信源公司运用“互联网+”、大数据、人工智能、区块链、物联网等新兴技术，结合供应链管理理念，以招标采购为核心，提供交易、管理、数据、服务、监管为一体的高标准采购管理平台，赋能政企用户实现采购业务全流程的电子化、数字化、智慧化。根据产品功能及应用领域，产品包括：企业数智化招采供应链平台、金融数智化招采平台、政府数智化采购平台、公共资源数智
深入链表的遍历——快慢指针算法（LeetCode——876题）欺霜链表算法 java
今天我们一起来学习一下一个快速遍历链表的方法我们先来看看一道经典的需要遍历链表的题目（题目来自LeetCode）876.链表的中间结点https://leetcode.cn/problems/middle-of-the-linked-list/给你单链表的头结点head，请你找出并返回链表的中间结点。如果有两个中间结点，则返回第二个中间结点。普通方法publicListNodemiddleNode
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
论文分享系列（三）——论软件架构风格马斯洛金字塔下的小灵猴儿 #软考高项架构师论软件架构风格论文
论软件架构风格摘要2023年5月，我司启动了精彩购电商系统的开发工作，该项目组中我担任系统架构师岗位，主要负责整体架构设计与中间件选型。本文以该电商平台为例，主要讨论了软件架构风格在该项目中的具体应用。整个系统采用具有三层的层次式软件架构的设计思想，分别是应用层，服务层，数据层。在应用层中的业务逻辑层的设计中，将整个业务系统划分为十余个子系统。服务层以springcloud服务框架为核心，数据采用
论文分享系列（二）——论微服务架构及其应用马斯洛金字塔下的小灵猴儿 #软考高项架构师论微服务架构及其应用论文
论微服务架构及其应用摘要2023年5月，我司启动了精彩购电商系统的开发工作，该项目组中我担任系统架构师岗位，主要负责整体架构设计与中间件选型。本文以该电商平台为例，将介绍微服务架构的特点、应用场景以及实现方法。系统以SpringCloud微服务框架开发，分为前端Web服务、平台保障服务、业务服务三部分。前端Web服务由负载均衡与服务器集群结合，实现高并发的前台界面；平台保障服务以Eureka为中心
《心理治疗师的刻意练习》读后记海涛心理咨询
读后记：这本书主要是写一位心理咨询师从小白到合格咨询师的刻意练习。开篇写了自己初做心理咨询师的美好体验与尴尬——50%的来访者没有变好（而这居然是行业平均水平）；希望自己的咨询水平能够提高而查阅了相关论文，请教了相关专家，开始了刻意练习之路；刻意练习如何降低了自己的焦虑，最终提高了自己的咨询表现，并且要和读者分享自己的成功之路。书中也提供了一些科学研究和统计调查：资深咨询师的来访者反馈与新手咨询师
基于springboot+vue的“考研资讯平台”程序设计实现【毕业论文，源码】一枚务实的码农毕业设计毕设考研 spring boot 毕业论文系统源码
摘要随着现在网络的快速发展，网络的应用在各行各业当中它很快融入到了许多学校的眼球之中，他们利用网络来做这个电商的服务，随之就产生了“考研资讯平台”，这样就让学生考研资讯平台更加方便简单。对于本考研资讯平台的设计来说，它主要是采用java技术。在整个系统的设计当中它是应用mysql数据库来完成的，具体根据网上考研资讯平台的现状来进行开发的，具体根据学生需求实现网上考研资讯平台网络化的管理，各类信息有
HBase介绍 mingyu1016 数据库
概述HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是GoogleBigtable的开源实现，它利用HadoopHDFS作为其文件存储系统，利用HadoopMapReduce来处理HBase中的海量数据，利用Zookeeper作为协同服务。HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为
朱松纯委员：科研条件越来越好，为何颠覆性科学发现却越来越少？晨起动铮铎
原文链接：https://mp.weixin.qq.com/s/2hzjWGcqjzhV0Yob7RmCsg原文转载自科学网文｜《中国科学报》记者赵广立“为什么近年来世界各国科研人员成倍增长、经费越来越多、科研条件越来越好，却产生不了根本性的科学发现？”近日，全国政协委员，北京通用人工智能研究院院长，北京大学、清华大学讲席教授朱松纯在一次发言中发出上述疑问。在他看来，重大基础性原创性科学成果“难产
好书推荐 ▏《了不起的中华文明》：给孩子的中华文明百科全书，有趣又好读！书本家读书会
《了不起的中华文明》作者：蒙曼图片：源于网络推荐理由让孩子读学习历史，不仅可以让孩子通晓古今，更能提高他的大语文素养。更重要的是，孩子从历史中，可以培养“宠辱不惊”的胸怀和气魄，做到“不以物喜、不以己悲”，受益一生。《了不起的中华文明》全书共20册，拥有海量知识条目。诗词名句、名著名篇、成语含义、经典故事、名人思想、冷门知识…是一套由蒙曼主编的传统文化绘本，已入选国家新闻出版署“2020年全国有声
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
Python——俄罗斯方块星和月 python pygame 开发语言
俄罗斯方块游戏是一款经典的益智游戏，通常使用编程语言Python来实现。下面是一个简单的俄罗斯方块游戏的示例代码：importpygameimportrandom#定义颜色BLACK=(0,0,0)WHITE=(255,255,255)RED=(255,0,0)GREEN=(0,255,0)BLUE=(0,0,255)CYAN=(0,255,255)MAGENTA=(255,0,255)YELLO
ky厂浪琴名匠售价多少钱，ky厂的浪琴名匠价格一览表美表之家
ky厂作为知名的高仿表生产厂家之一，一直致力于打造高品质的复刻手表。而浪琴名匠系列手表则是浪琴品牌的经典系列之一，是代表浪琴品质和工艺的一份完美结晶。那么，ky厂浪琴名匠到底如何，和正品相比有何不同呢？微信:339661555(下单赠送精美礼品)ky厂浪琴名匠售价多少钱ky厂浪琴名匠复刻表一般并不是很贵的，价格1700元到2000元左右的。价格主要看生产厂家，还有就是要看质量，厂家不同价格不同的，
【人工智能】多模态AI：如何通过融合文本、图像与音频重塑智能系统未来 2的n次方_ 小水文人工智能图像处理
我的主页：2的n次方_随着人工智能技术的飞速发展，多模态AI逐渐成为构建智能系统的重要方向。传统的AI系统通常依赖于单一模态的数据，如文本、图像或音频。而多模态AI通过结合多种数据类型，能够在更复杂的场景下提供更智能的解决方案。本文将深入探讨多模态AI的原理、应用场景及其未来发展，并通过代码示例展示如何构建一个多模态AI系统。1.多模态AI的基本原理多模态AI的核心在于融合来自不同模态（如文本、图
新一代网络研发利器——开物™，让用户每一行代码都贡献在核心创新中科驭数网络云计算大数据人工智能
随着云计算、人工智能、大数据的快速发展，现有的IT系统越来越复杂，传统网络技术难以满足新的业务需求，DPU技术开始崭露头角，越来越多的企业与研究机构认识到高性能网络处理技术带来的巨大价值，并积极开展创新与实践，从而实现更匹配的功能和更高的系统性能。但是，从零开始进行网络系统的搭建，开发人员需要掌握各类创新技术无关的、最底层的技术架构原理，如硬件设计逻辑、API接口、底层IP、硬件驱动等一系列复杂的
如何通过学习经典，写出一篇优质的情感爆款文【续集】小夭读书
昨天文章中说到的都是如何通过阅读经典后，再对比自我写作中总结出的盲点，今天就要详细说说爆款文的干货内容了。首先是爆款文的选题：如果你大量去阅读一些类似的文章，你就会发现所有的文章都有套路，只要你能用心去归类总结，就一定能找到你想要写的主题。
什么是AIGC？有哪些免费工具？ chent_某位 AIGC
AIGC（AIGeneratedContent），即“人工智能生成内容”，是指通过人工智能技术自动生成各种类型的数字内容。AIGC让机器能够根据输入的信息或数据生成符合人类需求的文本、图像、音频、视频等内容，极大提高了内容创作的效率。AIGC的背景与起源随着深度学习和自然语言处理技术的快速发展，人工智能已经不再局限于简单的任务，如分类、预测和数据分析，而是具备了生成内容的能力。生成式AI模型，如O
经典sql题（一）求连续登录不少于三天用户 Data 317 SQL题练习 sql 数据库数据仓库大数据 hive
示例数据假设我们的test表有以下数据：iddate12023-10-0108:00:0012023-10-0109:00:0012023-10-0210:00:0012023-10-0311:00:0022023-10-0110:00:0022023-10-0212:00:0022023-10-0314:00:0022023-10-0415:00:0032023-10-0116:00:00第一步
基于nodejs+vue的美妆彩妆网站的设计与实现(源码+LW+调试文档+讲解等) 程序员gelei nodejs毕业设计项目 vue.js 前端 javascript
目录：博主介绍：完整视频演示：系统技术介绍：后端Java介绍前端框架Vue介绍具体功能截图：部分代码参考：Mysql表设计参考：项目测试：项目论文：为什么选择我：源码获取：博主介绍：博主：程序员gelei：全网拥有20W+粉丝、CSDN作者、博客专家、全栈领域优质创作者、平台优质Java创作者、专注于Java、小程序、python、安卓技术领域和毕业项目实战✌Java精品实战案例《1000套》20
新质农业-再生农业的应用橙蜂智农人工智能制造创业创新
橙蜂智能公司致力于提供先进的人工智能和物联网解决方案，帮助企业优化运营并实现技术潜能。公司主要服务包括AI数字人、AI翻译、埃域知识库、大模型服务等。其核心价值观为创新、客户至上、质量、合作和可持续发展。橙蜂智农的智慧农业产品涵盖了多方面的功能，如智能化推荐、数据分析、远程监控和决策支持系统。用户可以通过应用获得个性化的作物种植建议、实时的生长状态监控以及精确的灌溉和施肥指导，提升农业生产效率。文
2021-01-05良安时空群分享石竹
一群李晓玉老师的分享主题：进良安时空听课数月有感：良安时空门敞开，有福有缘自进来。古圣先贤经典传，心学丶气学注里边。传统文化来弘扬。听师分享心亮堂。心灵修炼不可丢，精神匮乏太危险。明理懂法心窍开，修心养性体康健。行有不正需内求，做人真谛记心间。自我完善为最乐，正念丶正气得正果。淡淡喜悦气血通，行善积德病不生。爱的理念太神奇，诚心接受必受益。大道至简又无言，一切都在心念间。师传文化力有限，星星之火可
基于django+vue代驾管理系统【开题报告+程序+论文】-计算机毕设 zhjie102 django vue.js 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着城市化进程的加速和人们生活水平的提高，私家车数量急剧增加，但随之而来的酒驾问题也日益严峻，严重威胁着道路交通安全与公众生命财产安全。为了有效遏制酒驾行为，代驾服务应运而生并迅速普及。然而，当前市场上的代驾服务大多依赖于电话预约、人工调度等传统方式，存在效率低下
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul

经典论文阅读（9）——XLNET

你可能感兴趣的:(经典论文,xlnet,人工智能,深度学习)