vitaminYZZ

如何生成文本: 通过 Transformers 用不同的解码方法生成文本

假设 $p=0.92$，Top-p 采样对单词概率进行降序排列并累加，然后选择概率和首次超过 $p=92%$ 的单词集作为采样池，定义为 $V_{\text{top-p}}$。在 $t=1$ 时 $V_{\text{top-p}}$ 有 9 个词，而在 $t=2$ 时它只需要选择前 3 个词就超过了 92%。其实很简单吧！可以看出，在单词比较不可预测时，它保留了更多的候选词，如 $P(w | \text{“The”})$，而当单词似乎更容易预测时，只保留了几个候选词，如 $P(w | \text{“The”}, \text{“car”})$。近年来，随着以 OpenAI GPT2 模型为代表的基于数百万网页数据训练的大型 Transformer 语言模型的兴起，开放域语言生成领域吸引了越来越多的关注。开放域中的条件语言生成效果令人印象深刻，典型的例子有: GPT2 在独角兽话题上的精彩续写，XLNet 以及使用 CTRL 模型生成受控文本等。促成这些进展的除了 transformer 架构的改进和大规模无监督训练数据外，更好的解码方法 也发挥了不可或缺的作用。

本文简述了不同的解码策略，同时向读者展示了如何使用流行的 transformers 库轻松实现这些解码策略！

下文中的所有功能均可用于 自回归 语言生成任务 (点击此处回顾)。简单复习一下， 自回归 语言生成是基于如下假设: 一个文本序列的概率分布可以分解为每个词基于其上文的条件概率的乘积。

$P(w_{1:T} | W_0 ) = \prod_{t=1}^T P(w_{t} | w_{1: t-1}, W_0) \text{ , 其中 } w_{1: 0} = \emptyset,$

本文绍目前最常用的解码方法，主要有 贪心搜索 (Greedy search) 、波束搜索 (Beam search) 、Top-K 采样 (Top-K sampling) 以及 Top-p 采样 (Top-p sampling) 。

贪心搜索

贪心搜索在每个时间步 $t$ 都简单地选择概率最高的词作为当前输出词: $w_t = argmax_{w}P(w | w_{1:t-1})$ ，如下图所示。

从单词 $\text{“The”}$ 开始，算法在第一步贪心地选择条件概率最高的词 $\text{“nice”}$ 作为输出，依此往后。最终生成的单词序列为 $(\text{“The”}, \text{“nice”}, \text{“woman”})$，其联合概率为 $0.5 \times 0.4 = 0.2$。贪心搜索的主要缺点是它错过了隐藏在低概率词后面的高概率词，如上图所示:

条件概率为 $0.9$ 的单词 $\text{“has”}$ 隐藏在单词 $\text{“dog”}$ 后面，而 $\text{“dog”}$ 因为在 `t=1` 时条件概率值只排第二所以未被选择，因此贪心搜索会错过序列 $\text{“The”}, \text {“dog”}, \text{“has”}$ 。

波束搜索

波束搜索通过在每个时间步保留最可能的 num_beams 个词，并从中最终选择出概率最高的序列来降低丢失潜在的高概率序列的风险。以 num_beams=2 为例:

在时间步 1，除了最有可能的假设 $(\text{“The”}, \text{“nice”})$，波束搜索还跟踪第二可能的假设 $(\text{“The”}, \text{“dog”})$。在时间步 2，波束搜索发现序列 $(\text{“The”}, \text{“dog”}, \text{“has”})$ 概率为$0.36$，比 $(\text{“The”}, \text{“nice”}, \text{“woman”})$ 的 $0.2$ 更高。太棒了，在我们的例子中它已经找到了最有可能的序列！波束搜索一般都会找到比贪心搜索概率更高的输出序列，但仍不保证找到全局最优解。

让我们看看如何在 transformers 中使用波束搜索。我们设置 num_beams > 1 和 early_stopping=True 以便在所有波束达到 EOS 时直接结束生成。

# activate beam search and early_stopping
beam_output = model.generate(
    input_ids, 
    max_length=50, 
    num_beams=5, 
    early_stopping=True
)

print("Output:\n" + 100 * '-')
print(tokenizer.decode(beam_output[0], skip_special_tokens=True))

Output:
----------------------------------------------------------------------------------------------------
I enjoy walking with my cute dog, but I'm not sure if I'll ever be able to walk with him again.

I'm not sure if I'll ever be able to walk with him again. I'm not sure if I'll

虽然结果比贪心搜索更流畅，但输出中仍然包含重复。一个简单的补救措施是引入 n-grams (即连续 n 个词的词序列) 惩罚，该方法是由 Paulus 等人 (2017) 和 Klein 等人 (2017) 引入的。最常见的 n-grams 惩罚是确保每个 n-gram 都只出现一次，方法是如果看到当前候选词与其上文所组成的 n-gram 已经出现过了，就将该候选词的概率设置为 0。但是，n-gram 惩罚使用时必须谨慎，如一篇关于纽约这个城市的文章就不应使用 2-gram 惩罚，否则，城市名称在整个文本中将只出现一次！

波束搜索的另一个重要特性是我们能够比较概率最高的几个波束，并选择最符合我们要求的波束作为最终生成文本。

开放域文本生成的研究人员最近提出了几个理由来说明对该领域而言波束搜索可能不是最佳方案:

在机器翻译或摘要等任务中，因为所需生成的长度或多或少都是可预测的，所以波束搜索效果比较好 - 参见 Murray 等人 (2018) 和 Yang 等人 (2018) 的工作。但开放域文本生成情况有所不同，其输出文本长度可能会有很大差异，如对话和故事生成的输出文本长度就有很大不同。

我们已经看到波束搜索已被证明存在重复生成的问题。在故事生成这样的场景中，很难用 n-gram 或其他惩罚来控制，因为在“不重复”和最大可重复 n-grams 之间找到一个好的折衷需要大量的微调。

正如 Ari Holtzman 等人 (2019) 所论证的那样，高质量的人类语言并不遵循最大概率法则。换句话说，作为人类，我们希望生成的文本能让我们感到惊喜，而可预测的文本使人感觉无聊。论文作者画了一个概率图，很好地展示了这一点，从图中可以看出人类文本带来的惊喜度比波束搜索好不少。

因此，让我们开始玩点刺激的，引入一些随机性。

采样

在其最基本的形式中，采样意味着根据当前条件概率分布随机选择输出词 $w_t$: $w_t \sim P(w|w_{1:t-1})$

继续使用上文中的例子，下图可视化了使用采样生成文本的过程。

很明显，使用采样方法时文本生成本身不再是 确定性的。单词 $\text{“car”}$ 从条件概率分布 $P(w | \text{“The”})$ 中采样而得，而 $\text{“drives”}$ 则采样自 $P(w | \text{“The”}, \text{“car”})$。在 transformers 中，我们设置 do_sample=True 并通过设置 top_k=0 停用 Top-K 采样 (稍后详细介绍)。在下文中，为便于复现，我们会固定 random_seed=0，但你可以在自己的模型中随意更改 random_seed。

# set seed to reproduce results. Feel free to change the seed though to get different results
tf.random.set_seed(0)

# activate sampling and deactivate top_k by setting top_k sampling to 0
sample_output = model.generate(
    input_ids, 
    do_sample=True, 
    max_length=50, 
    top_k=0
)

print("Output:\n" + 100 * '-')
print(tokenizer.decode(sample_output[0], skip_special_tokens=True))

Output:
----------------------------------------------------------------------------------------------------
I enjoy walking with my cute dog. He just gave me a whole new hand sense."

But it seems that the dogs have learned a lot from teasing at the local batte harness once they take on the outside.

"I take

生成的文本看起来不错 - 但仔细观察会发现它不是很连贯。3-gramsnew hand sense 和 local batte harness 非常奇怪，看起来不像是人写的。这就是对单词序列进行采样时的大问题: 模型通常会产生不连贯的乱码，参见Ari Holtzman 等人 (2019) 的论文。

缓解这一问题的一个技巧是通过降低所谓的 softmax 的“温度”使分布 $P(w|w_{1:t-1})$ 更陡峭。而降低“温度”，本质上是增加高概率单词的似然并降低低概率单词的似然。将温度应用到于我们的例子中后，结果如下图所示。

$t=1$ 时刻单词的条件分布变得更加陡峭，几乎没有机会选择单词 $\text{“car”}$ 了。

# set seed to reproduce results. Feel free to change the seed though to get different results
tf.random.set_seed(0)

# use temperature to decrease the sensitivity to low probability candidates
sample_output = model.generate(
    input_ids, 
    do_sample=True, 
    max_length=50, 
    top_k=0, 
    temperature=0.7
)

print("Output:\n" + 100 * '-')
print(tokenizer.decode(sample_output[0], skip_special_tokens=True))

Output:
----------------------------------------------------------------------------------------------------
I enjoy walking with my cute dog, but I don't like to be at home too much. I also find it a bit weird when I'm out shopping. I am always away from my house a lot, but I do have a few friends

奇怪的 n-gram 变少了，现在输出更连贯了！虽然温度可以使分布的随机性降低，但极限条件下，当“温度”设置为 $0$ 时，温度缩放采样就退化成贪心解码了，因此会遇到与贪心解码相同的问题。

Top-K 采样

Fan 等人 (2018) 的论文介绍了一种简单但非常强大的采样方案，称为 Top-K 采样。在 Top-K 采样中，概率最大的 K 个词会被选出，然后这 K 个词的概率会被重新归一化，最后就在这重新被归一化概率后的 K 个词中采样。 GPT2 采用了这种采样方案，这也是它在故事生成这样的任务上取得成功的原因之一。

我们将上文例子中的候选单词数从 3 个单词扩展到 10 个单词，以更好地说明 Top-K 采样。

设 $K = 6$，即我们将在两个采样步的采样池大小限制为 6 个单词。我们定义 6 个最有可能的词的集合为 $V_{\text{top-K}}$。在第一步中，$V_{\text{top-K}}$ 仅占总概率的大约三分之二，但在第二步，它几乎占了全部的概率。同时，我们可以看到在第二步该方法成功地消除了那些奇怪的候选词 $(\text{“not”}, \text{“the”}, \text{“small”}, \text{“told”})$。现在还有一个问题，Top-K 采样不会动态调整从需要概率分布 $P(w|w_{1:t-1})$ 中选出的单词数。这可能会有问题，因为某些分布可能是非常尖锐 (上图中右侧的分布)，而另一些可能更平坦 (上图中左侧的分布)，所以对不同的分布使用同一个绝对数 K 可能并不普适。在 $t=1$ 时，Top-K 将 $(\text{“people”}, \text{“big”}, \text{“house”}, \text{“cat”})$ 排出了采样池，而这些词似乎是合理的候选词。另一方面，在$t=2$ 时，该方法却又把不太合适的 $(\text{“down”}, \text{“a”})$ 纳入了采样池。因此，将采样池限制为固定大小 K 可能会在分布比较尖锐的时候产生胡言乱语，而在分布比较平坦的时候限制模型的创造力。这一发现促使 Ari Holtzman 等人 (2019) 发明了 Top-p- 或核- 采样。

Top-p (核) 采样

在 Top-p 中，采样不只是在最有可能的 K 个单词中进行，而是在累积概率超过概率 p 的最小单词集中进行。然后在这组词中重新分配概率质量。这样，词集的大小 (又名集合中的词数) 可以根据下一个词的概率分布动态增加和减少。好吧，说的很啰嗦，一图胜千言。

假设 $p=0.92$，Top-p 采样对单词概率进行降序排列并累加，然后选择概率和首次超过 $p=0.92$ 的单词集作为采样池，定义为 $V_{\text{top-p}}$。在 $t=1$ 时 $V_{\text{top-p}}$ 有 9 个词，而在 $t=2$ 时它只需要选择前 3 个词就超过了 92%。其实很简单吧！可以看出，在单词比较不可预测时，它保留了更多的候选词，如 $P(w | \text{“The”})$，而当单词似乎更容易预测时，只保留了几个候选词，如 $P(w | \text{“The”}, \text{“car”})$。

‍

修改虚拟机的yum配置别惊鹊 linux
1.配置源，命令是：sudocurl-o/etc/yum.repos.d/CentOS-Base.repohttps://mirrors.aliyun.com/repo/Centos-7.repo2.再清空缓存，让配置生效，命令是：sudoyumcleanallsudoyummakecache3.测试是否配置成功。下载一个常见工具试一试，如果能下载成功，就证明这个操作完成了yuminstalltr
网关边缘计算：让数据处理更贴近一线北京天拓四方边缘计算人工智能
在工业4.0与智慧城市的浪潮中，数据如同新时代的石油，驱动着各行各业的变革。然而，传统云计算模式下，数据需长途跋涉至云端处理，这不仅带来了延迟问题，更在带宽成本、隐私安全等方面遭遇瓶颈。此时，网关边缘计算作为“边缘智能”的核心技术，正悄然改变着数据处理的规则——它将计算能力下沉到网络边缘，让数据在“家门口”就能完成分析与决策。一、技术亮点：边缘智能的三大突破1.低延迟响应，实时决策无忧在智能制造车
云原生边缘计算：重塑分布式智能的时空边界桂月二二云原生边缘计算分布式
引言：算力向数据源头迁移的革命特斯拉自动驾驶系统每小时产生20TB边缘数据，时延要求低于50ms。中国移动5G边缘云实现ARPU值提升38%，华为云IEF平台将工业质检响应速度提升至15ms以内。ABIResearch预测2026年边缘AI芯片市场规模达520亿美元，KubeEdge管理边缘节点数突破千万级，单节点资源开销仅为K8s的1/8。一、边缘计算架构范式演进1.1技术架构对比矩阵特征维度中
在Blender中给SP分纹理组 CG星空 Substance Painter SP 材质
在Blender中怎么分SP的纹理组/纹理集其实纹理组就是材质把同一组的材质分给同一组的模型导入到sp里面自然就是同一个纹理组把模型导入SP之后就自动分好了
04. 滑动冲突处理花启莫你是不是傻面试 android java
文章目录00.思维树01.什么是滑动冲突1.1**什么是滑动冲突？**1.2**一个简单的例子**02.外部拦截法03.内部拦截法04.滑动冲突实例05.外部拦截法解决滑动冲突06.内部拦截法解决滑动冲突其他介绍01.关于我的博客00.思维树什么是滑动冲突处理？怎样解决？什么是外部拦截法？什么是内部拦截法？01.什么是滑动冲突1.1什么是滑动冲突？滑动冲突指的是：当父容器和子View都可以响应滑动
2025年渗透测试面试题总结-字某某动-安全研究实习生（二面）（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全网络安全红蓝攻防护网
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录字某某动-安全研究实习生（二面）1.护网行动中的核心工作2.防护层级选择（WAF/IDS）3.误报治理方案4.内网误报分布场景5.MySQL执行PowerShell防护6.资产收集经验7.漏洞攻击案例8.SQL注入攻防详解原理防御方案OrderBy防御特殊字符处理9.
2025年二级建造师备考经验技巧分享 100分题库小栗子笔记
备考二级建造师，掌握有效的方法至关重要。下面从学习规划、科目复习要点以及练习巩固等方面分享经验。制定科学学习规划依据考试时间与自身日常安排，制定详细学习计划。例如，若距离考试还有三个月，可将第一个月用于全面学习各科基础知识点，每天保证2-3小时学习时间。第二个月进行知识点强化，梳理重点、难点，可利用周末时间进行章节总结。最后一个月集中刷题、模拟考试，熟悉考试节奏。同时，规划时要预留弹性时间，应对突
Blender常用快捷键的汇总金米kk blender
一、基础操作全选/取消全选：A（全选）、AA（连续按两次A取消全选）复制物体：Shift+D（复制后需点击确认位置）移动物体：G（按X/Y/Z可约束轴向移动）旋转物体：R（按X/Y/Z可约束轴向旋转）缩放物体：S（按X/Y/Z可约束轴向缩放）撤销：Ctrl+Z重做：Ctrl+Shift+Z二、视图与导航切换三视图：Shift+``（FPS自由视角模式）前/后视图：Ctrl+1（小键盘）/Ctrl+
双目立体视觉（6.1）测距 2501_90596733 双目立体视觉计算机视觉人工智能 opencv
在计算机视觉领域，双目相机测距是一项关键技术，它通过模拟人类双眼的视觉机制，利用两个相机从不同角度拍摄同一场景，进而计算出物体的深度信息。一、双目测距的基本原理1.1视差图（DisparityMap）视差图是一种存储了单视图所有像素的视差值的二维图像。视差值是同一物体在左右两幅图像中的列坐标差，即通过比较左右两幅图像的对应像素差异来计算物体的深度信息。视差图是以图像对中任一幅图像为基准生成的，其大
blender看不到导入的模型 AllBlue blender blender
参考：blender快捷键常见问题_blender材质预览快捷键-CSDN博客方法一：视图-裁剪起点，设置一个很大的值方法二：选中所有对象，对齐视图-视图对齐活动项-选择一个视图
【微服务】SpringBoot 整合Redis Stack 构建本地向量数据库相似性查询小码农叔叔 AI大模型实战与应用 springboot 入门到精通向量数据库 redis stack java使用向量数据库
目录一、前言二、向量数据库介绍2.1什么是向量数据库2.2向量数据库特点2.3向量数据库使用场景三、常用的向量数据库解决方案3.1Milvus3.1.1Milvus是什么3.1.2Milvus主要特点3.2Faiss3.2.1Faiss是什么3.2.2Faiss主要特点3.3Pinecone3.3.1Pinecone是什么3.3.2Pinecone主要特点3.4Weaviate3.4.1Weavi
WPF框架---MvvmLight介绍白白白白纸呀 WPF知识总结 c#开发语言 wpf
目录1.MvvmLight框架准备2.MvvmLight中的相关基类3.MvvmLight中的数据绑定与通知a.核心功能b.关键方法与属性c.完整示例d.高级用法4.MvvmLight中的命令对象a.命令对象的作用b.核心接口：ICommandc.MvvmLight中的RelayCommandd.动态更新命令的可执行状态e.高级用法5.Messenger对象使用a.Messenger的核心作用b.
链表的插入排序 Linked List Insertion Sort 清风无情446 链表 list 数据结构
一、插入排序Insertionsort插入排序很像玩扑克牌中整理手牌的过程，从第二个数开始依次比较其与前面所用数据的大小，直到找到其需要在的位置。当从第二个数据遍历到最后一个数据之后就完成了整个数组的排序。voidInsertionSort(intarr[],intn){for(inti=0;i=0;j--){//将比temp大的数依次向后移动一位arr[j+1]=arr[j];}//将temp插
CMD命令大全非德77 windows
引言在Windows系统的广袤世界里，图形化界面（GUI）无疑是大家日常操作的得力助手，凭借直观的图标、便捷的鼠标点击，我们轻松实现各类任务。但你是否知晓，在这繁华的图形背后，还隐藏着一位强大而低调的“幕后英雄”——命令提示符（CMD）。它就像Windows系统的神秘“源代码”，虽然外表朴实无华，却蕴含着无穷的能量。CMD，作为Windows系统内置的命令行工具，为我们开启了一扇直接与系统内核对话
MVC模式全解析非德77 mvc
MVC模式：概念与架构基石在软件开发的广袤宇宙中，MVC模式宛如一颗璀璨的恒星，照亮了无数开发者前行的道路。它是一种经典的软件架构模式，全称为Model-View-Controller，即模型-视图-控制器，将应用程序清晰地划分为三个核心部分：模型（Model）、视图（View）和控制器（Controller）。这种架构方式犹如为程序搭建了一个稳固的骨架，使得代码的组织和管理更加高效，也为团队协作
C++ 重载运算符非德77 c++java 开发语言
一、运算符重载是什么在C++编程中，运算符重载是一项极为强大的特性，它允许我们为自定义的数据类型（比如类和结构体）定义运算符的具体行为。你可以把它想象成给运算符赋予了新的“超能力”，让它们能够适用于我们自己创建的数据类型，就如同它们对int、double这样的内置类型操作一样自然流畅。举个简单的例子，在数学中，我们常常进行复数的运算，复数有实部和虚部。如果我们定义了一个复数类Complex，想要实
素数筛介绍，C++实现非德77 c++算法开发语言密码学
一、素数在数学的奇妙世界里，素数是一个独特而又基础的概念。素数，也被称为质数，是指在大于1的自然数中，除了1和它自身外，不能被其他自然数整除的数。例如，2、3、5、7、11等都是素数，而4（能被2整除）、6（能被2和3整除）等则不是。素数在数学领域中具有举足轻重的地位，是数论等众多数学分支的核心研究对象。在计算机科学领域，素数也有着广泛的应用，比如在密码学中，RSA加密算法就依赖于大素数的性质来保
LeetCode 538.把二叉搜索树转换为累加树南巷逸清风 LeetCode leetcode c++python 算法
题目描述给出二叉搜索树的根节点，该树的节点值各不相同，请你将其转换为累加树（GreaterSumTree），使每个节点node的新值等于原树中大于或等于node.val的值之和。提醒一下，二叉搜索树满足下列约束条件：节点的左子树仅包含键小于节点键的节点。节点的右子树仅包含键大于节点键的节点。左右子树也必须是二叉搜索树。示例1：输入：[4,1,6,0,2,5,7,null,null,null,3,n
leetcode700-二叉搜索树中的搜索记得早睡~ 算法小课堂 leetcode 数据结构算法 javascript
leetcode700思路我们需要先了解一下二叉搜索树的特性：左子树的所有节点值当前节点的值。这个特性适用于树中的每个节点那么根据这个特性，我们可以通过根节点的值和目标值的大小来判断后序的走向，如果根节点值>目标val，那么就只需向左遍历，如果根节点值val){root=root.left}elseif(root.val
工作中常用的linux命令,Linux日常工作中比较实用的一些命令合集。 Wu Jerry 工作中常用的linux命令
系统uname-a查看内核/操作系统/CPU信息head-n1/etc/issue查看操作系统版本cat/proc/cpuinfo查看CPU信息hostname查看计算机名lsmod列出加载的内核模块env查看环境变量资源free-m查看内存使用量和交换区使用量df-h查看各分区使用情况du-sh查看指定目录的大小grepMemTotal/proc/meminfo查看内存总量grepMemFree
完美适配！绿色纯净，可以尽情享受全部功能 Mbblovey 电脑 windows 需求分析软件需求开源软件
大家好，今天给大家带来一款堪称“电脑管家”的神器——AshampooWinOptimizer。电脑越用越卡，垃圾文件堆积如山？它能一键深度清理，让电脑轻松减负。想让系统性能飞起来，游戏、办公都流畅无阻？它可以精准优化，释放电脑的全部潜能。担心个人隐私在网络世界“裸奔”？它为你严密守护，筑起隐私的坚固堡垒。甚至还能按照你的心意，定制专属于你的个性化Windows系统。有了AshampooWinOpt
ShardingSphere 和 Spring 的动态数据源切换机制的对比以及原理龙大. 系统设计 Spring Mysql spring java 数据库
ShardingSphere与Spring动态数据源切换机制的对比及原理一、核心定位对比维度ShardingSphereSpring动态数据源（如AbstractRoutingDataSource）定位分布式数据库中间件轻量级多数据源路由工具核心目标分库分表、读写分离、分布式事务多数据源动态切换适用场景大数据量、高并发、复杂分片需求简单多数据源隔离（如多租户、环境隔离）实现层级JDBC驱动层（拦截
向量数据库（二）：Qdrant J_D_Chi 数据库数据库
写在前面我们借助Qdrant来了解向量数据库的一些内容内容什么是Qdrant？Qdrant是一个开源的针对向量相似性搜索的引擎，它提供了一系列的API用于对向量数据进行存储、搜索和管理等功能。下面是来自Qdrant官网的一个架构图：初步了解Qdrant里的一些概念以Qdrant的架构图为背景，我们需要初步了解下里面涉及到的一些概念名词，后面我们再对这些概念做进一步的了解。
C++学习(十三)(构建系统,CMAKE) solomonzw 大数据数据库
构建系统是一组工具和实用程序，用于自动执行项目中的源代码文件的编译、链接和执行过程。构建系统的主要目标是管理编译过程的复杂性，并最终生成构建（可执行文件或二进制文件）。在C++（cpp）中，一些常见的构建系统包括：GNUMake：这是一个流行的构建系统，用于定义构建过程。它检查源文件的依赖关系和时间戳，以确定需要编译和链接哪些文件。Makefile代码示例：#MakefileCXX=g++CPPF
Qt动态属性激昂～逐流 Qt qt 开发语言
一.定义Qt动态属性是一种在运行时为对象添加属性的方法，这些属性并不在对象的类定义中声明，而是在需要的时候动态添加。动态属性可以让开发者在不修改类定义的情况下为对象添加额外的数据或功能，从而实现更灵活的编程。在Qt中，可以使用setProperty()和property()方法来设置和获取动态属性。通过调用setProperty()方法可以为对象设置一个动态属性，该方法接受两个参数，第一个参数是属
LeetCode-04：实现链表的插入排序 qq_46993700 LeetCode 插入排序链表 leetcode
题目使用插入排序对链表进行排序。Sortalinkedlistusinginsertionsort.输入{3,2,4}输出{2,3,4}思路1、若要实现插入排序，则需要先明白插入排序的原理。通俗讲便是将一个无序的数组（链表）插入有序的数组（链表）中，详细做法为：将无序数组的第一个元素切割出来作为有序数组的第一个元素，再将无序数组的第二个元素切割出来插入有序数组的相应位置，再将…，直至切割完整个无序
物联网服务器搭建及部署详细说明：掌握 Node.js、MongoDB、Socket.IO 和 JWT 的实用指南极客小张物联网服务器 node.js mongodb 数据库 json 运维开发
关键知识点目录1.环境准备1.1硬件要求1.2软件要求2.搭建步骤3.数据处理与存储3.1数据存储3.2数据实时处理3.2.1安装Socket.IO3.2.2修改服务器代码4.安全性4.1身份验证与授权4.2加密通信4.2.1生成自签名证书（开发环境）4.2.2修改服务器以支持HTTPS5.数据分析和可视化5.1集成Grafana5.2.2图表数据更新6.事件处理与报警6.1事件检测7.接口与集成
深入理解 JavaScript 执行上下文 www.www JavaScript 相关 javascript 开发语言 ecmascript
深入理解JavaScript执行上下文什么是JavaScript执行上下文JavaScript执行上下文的分类全局执行上下文函数执行上下文eval执行上下文JavaScript管理执行上下文的方式：执行上下文栈什么是JavaScript执行上下文概念：JavaScript中，在执行任何代码之前，JavaScript引擎会先创建一个执行上下文（globalexecutioncontext）。它包含有
Ceph实战（一）-分布式存储介绍与原理架构概述深度视觉机器 Centos7 Ceph 分布式存储介绍与原理架构概述
最近工作中有涉及到CEPH相关的内容，所以打算开一个CEPH专栏来进行总结，学习CEPH还有一个重要原因就是我同时要补充kubernetes、rancher专栏必定会涉及到有状态的存储资源抽象（StatefulSet、PV、PVC、StorageClass等），首先绕不开的就是高可用的分布式存储系统，虽然有很多人反对将持久化数据以容器的方式来部署，说容器化部署不是银弹，但未来发展方向就是容器化，并
Django 模型的逆向工程 jay丿 django 数据库 sqlite
模型的逆向工程：通过inspectdb命令从数据库表创建Django模型在Django开发中，模型（Model）是定义数据库结构的关键组件。通常，我们根据业务需求先设计模型，然后通过Django的迁移系统创建相应的数据库表。然而，在某些情况下，我们可能需要从已经存在的数据库表中生成Django模型，这个过程称为逆向工程。Django提供了一个非常有用的工具——inspectdb命令，它允许我们直接
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY NODEXY@2014.8.12 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

如何生成文本: 通过 Transformers 用不同的解码方法生成文本