zenRRan

教会羊驼说话：Instruction Tuning的最新进展

深度学习自然语言处理分享
整理：Winnie

本文翻译自以下高天宇博士的博客，感谢作者的分享。

Title: Teach Llamas to Talk: Recent Progress in Instruction Tuning
Link: https://gaotianyu.xyz/blog/2023/11/30/instruction-tuning/

前言

大型语言模型（LLM），凭借其数十亿的参数和数万亿token的庞大训练数据，展现了强大的功能。为了成为一种全能的任务解决工具，LLM必须学会根据用户指令作出连贯且有益的回应，而不仅仅是重复网络上的语言模式。基于此，开放式指令调整open-ended instruction tuning^[1]应运而生。这种方法对LLM进行微调，使其能够按照用户的指令作出有用、诚实和无害的回应。随着ChatGPT取得巨大成功，人们对这种方法的兴趣日益浓厚。开放式指令调整通常包括两个阶段：

对模型进行监督式微调SFT，这一过程涉及使用收集到的用户指令和高质量响应。
通过人类反馈进行的强化学习RLHF，这一过程使模型与人类偏好相一致。

收集监督式微调或偏好数据的成本极高，因此最近，研究人员找到了构建这类数据的更经济的方法，本文将从四个方面介绍这些最近的进展：SFT数据、RLHF数据、算法和评估。

SFT数据

SFT主要有两个目标，分别对应于两种不同的数据类型。

旨在提升LLM的一般语言理解能力，这种提升在传统的NLP基准测试中得到体现，比如HellaSwag和MMLU等。其次，它也被用于训练LLM遵从指令，培养对话能力，并确保其回应既有用又无害。
开放式指令调整数据，使用这些数据进行训练不会提升LLM的知识水平（通常通过传统基准测试得分反映），而是主要指导它们遵循指令或对话格式，从而使其拥有更吸引人的语调、更礼貌的表达等。

针对第一个目标，主要采用多任务指令调整数据。这种数据在2020-2022年间得到了广泛的研究。这些数据集把NLP任务汇集在一起，为每个任务配备了自然语言的指令，然后可以采用多任务方式来训练模型。代表性的数据集包括Natural Instruction、T0和Flan。不同于开放式指令调整，这些数据集更多地聚焦于传统的NLP任务，例如问题解答和自然语言推理等，其指令和回应往往更短、更简单、样式单一。因此，基于这些数据集训练的模型通常不会被部署为当前的指令调整模型或聊天机器人，尽管它们在NLP基准测试中表现出色。

针对第二个目标，收集这类SFT数据的成本很高，因为需要同时收集用户指令和相应的示范回应。目前的开源模型主要采用从专有LLM中提取数据的方法。例如，早期的开源指令模型Alpaca使用self-instruct方法提示text-davinci-003生成伪SFT数据，然后在LLaMA-7B上进行SFT处理；Baize项目则通过提示ChatGPT进行自聊来获取多轮对话数据；WizardLM通过不断用ChatGPT改写Alpaca数据来提高数据多样性；UltraChat则首先采用不同策略自动构建问题，然后再用ChatGPT模拟问题的对话过程。尽管这是一种相对经济的数据获取方式，但仅仅模仿专有LLM被发现只能模仿ChatGPT的风格而非其事实性，因此依靠这类SFT数据能走多远仍有待商榷。

另一种收集SFT数据的方法是手动注释少量数据。Open Assistant发起了一项众包项目，让志愿者撰写指令和回应；Dolly包含了大约15,000条由Databricks员工生成的数据。LIMA是由作者策划的大约1,000条SFT数据的集合。然而，是否只需要1,000个示例，或者是否可以利用互联网众包数据，与使用专门收集的大规模数据相比，这仍是一个问题，因为尚未进行直接对比分析。

虽然这些基于模仿和人类SFT数据训练的开源模型仍不及ChatGPT、GPT-4或Claude等专有模型，但我们看到了两个有希望的研究方向：

LLaMA-2-70B-chat，这是一个在闭源数据上调整过的LLaMA-2-70B开源模型，被人类评估显示为比ChatGPT更有帮助。这表明LLaMA-2是一个潜力巨大的基础模型，在事实知识、常识、推理能力等方面与ChatGPT的基础模型相媲美。
目前的研究已经在toy或laboratory数据上进行了一些令人兴奋的研究，比如探索了更好的对齐算法，我们将在下文进行介绍。

RLHF数据

要使模型成为更优秀的语言助手，仅仅依靠SFT还远远不够，它们必须与人类的偏好数据保持一致。一个简单的例子就是考虑如何使模型保持诚实。例如，SFT倾向于总是让模型给出某种回答，而不太教会模型在不了解时说“我不知道”。

研究证明对齐算法能够提升人类满意度。然而，大多数开源模型未经过对齐阶段(RLHF)，主要原因包括：(1) 运行RL的高成本；(2) 调整PPO(OpenAI使用的RL算法)超参数的复杂性；(3)缺乏高质量偏好数据。这种数据的缺乏进一步限制了开发比RL更有效/高效的算法。

目前最常用于发展对齐算法的两个偏好数据集是OpenAI的TL;DR偏好数据（摘要类）和Anthropic的HH-RLHF数据集（人类与模型的开放式对话）。尽管这些数据集质量不错，但其指令的多样性和复杂性与当今的SFT数据相比并无优势。

2023年出现了多个新的偏好数据，但它们是否足够优质以用于对齐算法尚有待观察。有众包项目致力于从普通人那里收集偏好数据：Open Assistant和Chatbot Arena在网络上发起了偏好数据收集活动，并从志愿者那里获取了偏好标签。其他数据集采取了模拟或启发式的方法：SHP利用Reddit上的点赞数构建合成偏好数据集；AlpacaFarm和UltraFeedback使用GPT-4作为注释者；Kim等人，这些方法中的大多数能够帮助RL或其他对齐算法，但目前尚未进行直接对比分析。Huggingface最近发布了Zephyr模型，采用了UltraChat(SFT)和UltraFeedback(基于DPO的对齐)进行训练，其性能与在闭源数据上训练的LLaMA-2-Chat-70B相当。

与依赖人类偏好不同，另一种尝试是使用AI反馈——即使用LLMs指导LLMs，无需人类参与。这与使用GPT-4作为注释者的方法不同，后者仍然基于人类偏好数据训练，而前者的目标是让模型在没有人类偏好数据的情况下自我提升。最快的研究表明，从一个SFT模型出发，RLAIF能够在摘要任务上实现与RLHF相当的性能，而且无需涉及任何人类偏好标签。RLAIF的方向引起了极大的兴趣。然而，这些方法究竟有多好仍然不清楚，因为使用简单的启发式构建数据(也没有人类参与)可以胜过它们。

RL是唯一的对齐办法吗？

使用PPO进行RLHF已经成为一种主流的对齐方法。它被应用于InstructGPT，并据信也用于ChatGPT和GPT-4以及LLaMA-2-Chat。这一方法的核心是首先在偏好数据上训练一个奖励模型，然后使用这个模型提供的反馈，通过强化学习来微调模型。

尽管RLHF被证明是有效的，但它实现起来相对复杂，且容易因优化不稳定和对超参数敏感而出现问题。目前，已经有一些新方法被提出，这些方法在模型与偏好数据对齐方面可能比RLHF更为有效。

Best-of-N方法：一个直观的思路是，在SFT之后，模型已经能够生成高质量的输出，我们只需从中挑选出最好的。在WebGPT和基于人类反馈的摘要RLAIF中，作者探索了best-of-n采样方法——生成n个输出并使用奖励模型挑选最佳输出。研究表明，这通常可以达到与RLHF相似的性能。然而，正如OpenAI的博客文章所指出的，如果最优策略与原始SFT模型差异很大，best-of-n方法就会变得低效，因为n的数量需要随着最终策略和SFT模型之间的KL散度指数级增长。

专家迭代方法：另一个方法是在训练中使用best-of-n——我们可以在训练期间进行大量采样，挑选出最佳输出，并对其进行SFT。例如，OpenAI的text-davinci-002就是采用这种方法，训练模型使用自己生成的输出。更进一步，这种方法可以与在线采样的best-of-n结合使用（生成n个输出，用奖励模型挑选最佳输出，然后在最佳输出上进行训练，重复此过程），这本质上是专家迭代。此外，best-of-n采样也可以与自然语言反馈结合使用。

条件token方法：还有一种方法是使用“条件token”（Lu等人，2022年；Korbak等人，2023年；Liu等人，2023年）。这种方法是在良好和不良示例上对语言模型进行SFT，并在良好的示例前加上“好”的提示，在不良的示例前加上“坏”的提示。在推理时，可以用“好”的前缀条件化模型，期望模型能生成高质量的输出。

基于对比的方法：最近提出的几种方法借鉴了对比学习的概念。这些方法通过评估模型生成的好的和坏的示例的概率，从而能够提升好的示例，同时抑制坏的示例。在处理偏好数据时，SLiC和RRHF都是优化对比排名损失和正则化损失的方法。这些方法的一个挑战是，它们要么是从SFT模型中直接对输出进行采样，要么是从现有数据集中获取这些样本，这可能导致分布不匹配。为了解决这一问题，最近提出的RSO方法通过使用奖励模型进行拒绝采样，从而能够从最优策略π*中进行采样。他们展示了将这种采样策略应用于SLiC或DPO可以提高最终模型的性能。

这些方法最近受到广泛关注，并已在多个领域证明其有效性。例如HuggingFace的Zephyr模型也采用了DPO训练，其在MT-Bench上的表现强劲，甚至可以与Llama-2-chat和GPT-3.5相比肩。另一方面，我们也需要更好地理解使用对齐算法训练的模型的特性，以及它们是否真正有助于学习有用的特征。最近的一项研究表明，在几个流行的数据集上，学习到的奖励模型通常与文本长度高度相关，而带有长度的RLHF可以恢复大部分性能提升。

评估

评估挑战

开发开放式指令调整模型（如ChatGPT、GPT-4等）或任何开放式生成方法时，一个主要的挑战是如何进行有效的评估。尽管人类评估被视为评估开放式对话模型能力的黄金标准，但它存在诸多局限。特别是在使用低成本众包平台时，人类评估的可靠性往往受到质疑。此外，人类评估成本较高，且难以确保各项评估之间的一致性和可比性。

近年来，研究开始尝试使用更强大的LLM，如ChatGPT或GPT-4，来评估较弱的LLM，例如基于开源LLaMA的模型。这种方法被称为LLM评估器，已证明是一种经济高效的替代方案。使用模型评估模型初看似乎有些荒谬，但像GPT-4这样的专有模型通常是基于更强大的基础模型训练而来的，并在更高质量和数量的数据上进行训练，因此在能力上往往超过开源或研究型模型。只要这种能力差距存在，GPT-4之类的模型就足以作为评估器使用。

LLM作为评估器的一些先驱性工作已经展示了令人鼓舞的结果：LLM评估器的评估通常与人类评估具有很强的一致性。然而，也有研究指出，LLM评估器可能对某些偏见特别敏感。例如，发现如果交换两个待比较输出的位置，LLM评估器的偏好通常会发生变化。它们还倾向于偏好更长的输出和由类似模型生成的输出。

因此，已经提出了几个元评估基准来评估LLM评估器的优劣，通常以人类偏好数据的准确率形式衡量。这些基准是宝贵的资源，帮助我们了解LLM评估器的可靠性。但在这些基准上不同评估器的得分通常相近。此外，这些基准的人类注释往往存在噪声和主观性，内在的人类一致性率相对较低。因此，目前尚不清楚我们是否可以完全信赖这些元评估基准，以及LLM评估器的评估结果。

LLMbar

在最近的研究Evaluating Large Language Models at Evaluating Instruction Following^[2]中，作者重新思考了元评估的问题。

以往的研究忽略了一个重要因素——人类偏好的内在主观性。以某数据集的一个例子为例，尽管两种输出之间的质量差异是可以辨别的，但人类评注员更倾向于选择较长的输出，从而将这种偏见加入到偏好数据集中。当我们基于这种主观和嘈杂的元基准来评估大型语言模型的评估器时，我们无法保证得分高的评估器能够可靠地评估诸如指令遵循或事实正确性等客观属性，而非诸如输出长度这样的主观偏好。

基于这种思路，作者创建了一个新的元评估基准——LLMBar，专注于一个客观标准：指令遵循。LLMBar中的一个例子如下：

尽管很明显右边的输出遵循了指令，但由于其更引人入胜的语气，人类和大型语言模型的评估器通常更倾向于左边的输出。如果我们不严格分析评估器区分真正的指令遵循能力和表面线索的能力，就有可能推进那些更擅长模仿对话助手而非执行所需任务的模型。

在LLMBar中，作者手工策划了419个实例，每个实例包含一条指令和两个输出：一个忠实地遵循了指令，另一个则偏离，且总是存在一个客观的偏好。由于客观标准和手工策划，LLMBar的人类一致性率达到了94%。作者对评估器进行了测试，比较它们的偏好与黄金标准。作者还策划了一组对抗性集，其中差输出通常具有一些表面上的吸引力（长度、引人入胜的语气、由更好的语言模型生成等），这可能会误导评估器。LLMBar展示了令人惊讶的结果：

尽管ChatGPT、LLaMA2-70B-Chat、PaLM2-bison和GPT-4在其他元评估基准上表现相似，但在LLMBar（对抗性）上它们展现出了非常不同的性能。在这一基准上，ChatGPT和LLaMA2甚至比随机猜测的得分还低，而GPT-4的准确度远超其他所有评估器。

此外，用于评估的不同提示对评估结果影响很大。作者提出了一种方法组合：度量+参考+规则。如下图所示，首先提示大型语言模型生成三个针对特定指令的度量或标准；还提示大型语言模型生成一个参考输出。然后，我们将度量和参考输入给大型语言模型，明确列出规则，并要求模型给出判断。与AlpacaFarm中使用的普通提示相比，所采用的提示在LLMBar上显著提高了评估器的性能（在对抗性集上为GPT-4提升了10%）。

结语

2023年，开源的指令调整数据、算法和模型为LLM领域带来了令人兴奋的进展。这一变化为研究者提供了一个全新的机遇：他们可以完全掌控从参数到数据的各个方面，去训练、评估、互动和分析指令模型。这在以前是不可能的，那时这些模型对我们来说还像是一个黑箱。不过，过去几个月对这个领域来说也稍显混乱，因为有数百篇论文发布了各种各样的研究结果，这些研究使用了不同的数据、算法、基础模型，甚至是评估方法，这让跨文献的比较变得复杂。相信不久的将来，我们的社区将会逐渐形成一些标准的数据和评估方法，从而以更科学、可重复的方式开发出更优秀的指令调整模型。

参考资料

[1]

open-ended instruction tuning: https://arxiv.org/abs/2203.02155

[2]

Evaluating Large Language Models at Evaluating Instruction Following: https://arxiv.org/abs/2310.07641

公众号后台回复aaai、acl、naacl直接进投稿群~

回复LLM进入技术交流群~

2023-05-26 谭大哥
当我第一次写作的时候，不知如何动笔，漫漫长夜久久无法入睡，想想白天发生的事情时时浮现脑海当中，心情久久不能平静，来深圳创业二十多年发生过种种事情，从失败到成功，遇各种挫折都一一克服。每遇到一件微机感，老婆都我加油打气甚至鼓励我，让我把每次都能一一化解度过难关，今天不知道什么勇气让我把二十年的心里话全部都说出来全部释放。心情久久不能平静无法入睡，好想努力创造一帆事业闯出一个新的天地，让家人过上更好的
微信小程序如何获取当前页面栈中有几个页面玄学大师
//获取当前页面栈的数量letarr=getCurrentPages();console.log('页面',arr.length);
抖音申诉失败还可能解封吗？抖音怎么申诉才能通过？优惠券高省
抖音怎么申诉才能成功？在使用抖音的过程中，有时候可能会遇到一些意外情况，导致账号被封禁或者限制。为了解决这样的问题，抖音提供了申诉功能，用户可以通过申诉来恢复被封禁的账号或解除限制。先给大家分享一个小编在做的网络项目，不用投资一分钱，只要淘宝、京东、拼多多等电商不倒，这个项目永久可做，而且收入稳定！抖音怎么申诉才能成功？申诉失败还可能解封吗？先给大家分享一个网购省钱又赚钱的方法，不用投资一分钱，只
为什么许多人坐月子都选择去月子中心？屁孩王木木
为什么许多人坐月子都选择去月子中心？整个月子坐下来，我觉得这些选择去月子中心的人太明智了！为啥会发出这样的感叹全来源于我不快乐的月子生活。因为我愚蠢的选择了让自己的妈妈来照顾我的月子，本来从孕期到生产一直很顺的，没想到所有的不快乐出现在了月子里，怪就怪我心疼去月子中心的花费。但其实算下来，我这个月子坐下来也没少花钱，爸妈来回飞机，其实就1万了。这里真心奉劝大家千万不要学我，即使是离的很近也不要，否
Web安全之CSP weixin_30649641 web安全开发工具网络
内容安全策略(Content-Security-Policy,简称CSP)概念：内容安全策略(CSP)是一种web应用技术用于帮助缓解大部分类型的内容注入攻击，包括XSS攻击和数据注入等，这些攻击可实现数据窃取、网站破坏和作为恶意软件分发版本等行为。该策略可让网站管理员指定客户端允许加载的各类可信任资源。浏览器支持：统计来源：caniuse.com/contentsecuritypolicy&Mo
从面试到晋升：美团技术专家的职业发展全记录 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶面试职场和发展 ai
从面试到晋升：美团技术专家的职业发展全记录关键词：美团技术专家、技术职级体系、面试准备、晋升路径、能力模型、技术管理、职业发展摘要：本文深度解析美团技术专家的职业发展路径，从面试准备阶段的简历优化、技术笔试、多轮面试策略，到晋升过程中的能力模型构建、项目实战经验、跨团队协作技巧，结合具体案例和实战经验，完整呈现从初级工程师到资深技术专家的成长轨迹。通过剖析美团独特的T序列职级体系、能力评估标准和考
java 求1_java 求1 2i 新智元 java 求1
1-2求斐波拉契数求斐波拉契数斐波拉契数为，Fib(N)=Fib(N-1)+Fib(N-2)F(0)=F(1)=1用Java编写能求Fib(N)的程序输入为N,须输出Fib(N)如输入3输出：3importjava.util.Scanner;publicclassMai...文章uiiuiiu2018-07-12903浏览量求字符串的len组合数(java程序)importjava.util.Li
第七节课后感想 3e35f508017b
这节课很有意思，老师让我们给别人和给自己画自画像。自画像:纸片拼贴还看了阿基里斯与龟的电影，讲述了命运坎坷的真知寿坚持不懈地走着艺术之路，最终得到最珍贵的宝物的故事。
转发【同频共振】木子阿娟
有人为了合群，总是逼自己参与到其他人的聊天中，连笑都要把握时机和节奏。有人曾为了融入一个圈子，努力模仿别人的穿着打扮、言行举止，最后把自己弄得既不像别人，也不像自己；还有人为了不被孤立，一直强迫自己参加一些并不喜欢的饭局，还假装很开心的样子。现实生活里，很多人都是如此，费尽心思讨好别人，委屈求全。但是，一味地讨好和迎合，换不来对应的尊重。人与人之间相处，比合群更重要的，是先找到能够同频共振的人。愚
2023-09-15 如鱼饮水2020
中原焦点团队坚持分享第1319天（20230915）昨晚就有些小兴奋，想象三个月不见的宝宝，会有哪些惊喜的变化。为迎接周岁生日回家的宝贝大扫除。早晨起来再次重新擦地板除尘，忽然听到微信里的消息是孩子发烧了，一瞬间脑子僵住了，怎么办？先上医院吧。除了牵挂之外，这边定好的宾馆、酒店、宴席、蛋糕等庆生活动以及旅游安排，如何更改？可能这些都无法成行。完全能理解孩子突发状况，内心还是有失落的，准备了这么多，
2022-08-30 君惕若
20220830星期二早。早哈。哈哈，心情不错呀。对。说说昨天的开心事。目标的完成，我很满意。确实。完成了整体的调整、背景更换和第一部分的逐字稿。虽然昨天真正开始执行目标已经比较晚了，但是效率很高。是的。昨天还把8月份的账对清楚了。真是吃不穷穿不穷，算计不到才受穷。这么些年，认认真真算账太少了，而且昨天想明白了一点。支出要每天思考的，不仅是钱，时间、能量都需要仔细计算，这样才能更有效利用资源。嗯。
练太极拳的不能有刀兵气玄同说太极
看倌：太极拳的形，干什么用的？玄同：就是为更好的理解气。例如金刚捣碓，其实捣的不是碓，是碓舀里的物件；太极拳的震脚，其实震的不是脚，是身体里的气。我们对气的下行不清晰，所以借一下：震脚。看倌：太极拳怎么看待呼吸？玄同：无论打拳还是不打拳，每一个呼吸都要走小肚子，这是太极拳的核心。慢慢的，懂了丹田的开合之后，再炼弹抖。太极拳的弹抖不是手抖，都是丹田的弹抖。丹田的弹抖，不能空，要逐渐增加负重。看倌：开
2018-05-19 史响庆
5.19日周六小雨庆妈妈263篇今天周末，我受生物钟影响，还是老时间就睡醒了，我蹑手蹑脚的走出卧室。洗刷结束去厨房开始做饭。心想：让孩子睡个懒觉吧，今天不上学！看到孩子的房门关着，以为她还在睡觉！昨天晚上睡觉前我和庆庆聊天：庆庆，见过美人鱼吗？妈妈，你说美人鱼是人还是鱼？我也不知道，你觉得呢？我也不知道！那你想看看吗？想看呀！你知道去哪能看到美人鱼？嗯，周末这两天都可以看，但是得……放心吧，妈妈，
教育者与教书匠啊大甘
教育者与教书匠教育是教师终身奉行的事业，也是必须负责的工作。因为我们面对的是人，是具有生命张力的个体。所以在教育中我一直也在区分教育家与教书匠的区别。一名教师有超高的教学能力，我认为不是叫教育家，而没有教学实践的积累的教师空有一套教学理论也走不到教育家的行列。纵观历史每一位教育专家是一步到位的。没有听说谁从师范院校出来就去了教育管理的岗位，教育容不得差错，教育也不是随便试试。教育需要付出实际行动，
博古通今的林总幸福的味道伊利酸奶
项红萍—学习打卡10.2【成长日记—成长是解决一切问题的根本答案】日期：2022年10月2日第126天/总180天静心3总1385经典:1总103大拜108总4*108+3觉悟人生奉献人生圆满人生恪守初心/勤学明辨/博学慎思/习礼化人/反求诸己/家族兴旺/国富民安觉：接受结果，种下善因，从因上发力发愿：愿天下父母皆得欢心、愿天下儿女皆成栋梁。【今日金句】1.什么人能认识心？明心见性，心光明的时候见
《左轮手枪》韩国电影资源【1080p超清中文字幕】免费在线观看未删减完整版夸克网盘高清迅雷网盘百度云下载步骤全网优惠分享君
《左轮手枪》是一部充满悬疑与犯罪元素的韩国电影，由吴胜旭执导，汇集了全度妍、池昌旭、林智妍等实力派演员，于2024年8月7日在韩国上映。影片以其紧凑的剧情、深刻的角色塑造和紧张的氛围，吸引了众多观众的关注。提示：文章排版原因，观影资源链接地址放在文章结尾，往下翻就行故事围绕着背负所有罪责、被诬陷入狱的前警察河秀英（全度妍饰）展开。河秀英本是一位正直勇敢的警察，却因某种原因被栽赃陷害，失去了职业生涯
最新麦当劳优惠券折扣，怎么吃麦当劳最便宜，麦当劳优惠折扣技巧高省_飞智666600
麦当劳优惠券怎么获得？作为全球规模最大的快餐集团，麦当劳食品对人们具有十分强大的诱惑力，很多人都喜欢麦当劳食品，而麦当劳优惠券的使用自然受人们所关注。但是，麦当劳优惠券怎么获得呢？至于我为何用高省APP领取淘宝商城优惠卷返佣金呢，当然是高省佣金更高，模式更好。【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码666888，注册送2皇冠会员。麦当劳优惠券怎
疯狂小杨哥推荐的产品如何购买更便宜？三只羊产品省钱秘籍！浮沉导师
在这个数字化浪潮汹涌澎湃的时代，经济的发展日新月异，平台化和数字化已然成为驱动经济增长的核心引擎。内容电商正如一颗璀璨的星辰，与各行各业深度交融，为解决社会民生问题释放出巨大的能量。疯狂小杨哥和三只羊，作为行业内的佼佼者，始终秉持着“有家的地方有工作”的神圣使命砥砺前行。众小二-微易购小程序的诞生，是这一使命的有力践行，它立志在五年内让四万人的年收入显著提升，为众多渴望改变生活的人带来了希望的曙光
？？？实现高可用的故障转移策略的工具——Keepalived（含数据库的主从复制、MHA高可用简单配置） Lotus 沈棋 Linux运维_架构运维架构 keepalived
文章目录一、高可用与keepalived介绍1、什么是高可用2、实现高可用的技术1).负载均衡器2).故障转移工具3).数据库高可用性4).存储高可用性5).监控与报警工具6).云服务高可用性3、Keepalived介绍0-1）Keepalived是什么、功能介绍：Keepalived的功能*注：Nginx和LVS在负载均衡上使用的区别：实际应用场景*注：具体如何使用Keepalived和LVS进
grafana10.x报错 Failed to upgrade legacy queries Datasource x was not found 每天靠近一点点 grafana
问题grafana从6.x升级到10.x后，导入json文件后报错，数据源x查询不到，grafana不显示数据；TemplatingFailedtoupgradelegacyqueriesDatasourcexwasnotfound解决方法可能grafana升级后数据源找不到，在面板上重新选择数据源保存后，点击Inspect中的PanelJSON文件，查看更新后数据源的uid，在导入的json文件
《局外人》罗小聪聪聪罗
世界是伪善的，表象的。大家都虚伪的追求形而上，你又凭什么如此真实坦诚？但是，因为不屈服故而存在才有价值。异己的世界里，你我皆为局外人。世界规则在默尔索之外运行，给你我带来一股浓浓的被遗弃感。荒诞、悲凉、孤独和排异来的如此简单而迅速，在沟通无果后，我们更加孤独，他人变为了我们的地狱。问题的关键在于，我们不能丧失对这个世界的希望和信心，英雄在认清生活的真相之后仍热爱生活，坚持自我的真实，才是存在或活着
为什么你越害怕发生的事情，越容易发生猴得住
美国人爱德华·墨菲是一名工程师，他曾参加过美国空军于1949年进行的MX981实验。这个实验的目的是为了测定人类对加速度的承受极限。其中有一个实验项目是将16个火箭加速度计悬空装置在受试者上方，当时有两种方法可以将加速度计固定在支架上，而不可思议的是，竟然有人有条不紊地将16个加速度计全部装在错误的位置。于是墨菲作出了“事情如果有变坏的可能，不管这种可能性有多小，它总会发生，并引起最大可能的损失”
【原创文集】最美逆行者教科院预文2班
分院:教育科学学院班级：预文2班姓名：潘奥樱2020年一场突如其来的疫情在武汉爆发，马上正值我国的春节，人员流动最大，每个工作者在这期间都想回家，因为这疫情非常严重，于2020年1月23日10时发布通告，城市、公交、地铁、轮渡、长途客运暂停运营，机场、火车站离汉通道暂时关闭，武汉迅速变成一座空城。在这国家危难的时候，出现了许多最美逆行者。他们不顾自己的安慰，冲在最前线抗击疫情，拯救武汉，拯救中国。
Lua的_G表里有啥？东北砍王 Lua lua
今天看xlua源码的时候发现了一个表_G，如图所示：那它到底啥呢？应该是保存了lua所有用到的全局变量和局部变量比如：这三种用法是一样的_G.print("测试")_G["print"]("测试")print("测试")那里面到底有啥呢？全部输出为：function:00007FFFFB9ECA60setfenvfunction:000001718A717510rawsetfunction:000
2022-11-13 c习题10-4 递归求简单交错幂级数的部分和远山熊一
#includedoublefn(doublex,intn);intmain(){doublex;intn;scanf("%lf%d",&x,&n);printf("%.2f\n",fn(x,n));return0;}doublecalc_pow(doublea,intb);//自定义一个pow函数求指数幂doublecalc_pow(doublea,intb)//定义pow利用了递归函数{if(
乏味与兴趣杨柳絮如雪
每到星期一的早餐，整个人都不好了。不想起床，不想上班。是啊，重点是不想上班。回头算来，将近二十年的职场历程，是怎样走过来的呢？人又有几个二十年啊？对于这份工作，说不上讨厌但着实不喜欢。在工作中我的要求不高，只希望得到应有的尊重和与劳动相匹配的报酬。然而，为了生存，作为微小尘埃的我什么都说了不算。因为不热爱而缺乏动力，即使有动力也没有舞台，即使有舞台，上台表演的路被人堵死，那台上的人永远都不会是你。
Prometheus搭建和 Node_Exporter搭建强_子 prometheus
1.Prometheus和Node_Exporter的关系●Prometheus:是一个开源的监控和告警工具，能够从各种数据源（如NodeExporter）拉取指标，并存储这些指标。它提供了一个强大的查询语言（PromQL），可以用来分析和可视化监控数据。●Node_Exporter:是Prometheus的一个官方插件，用于收集主机系统的硬件和操作系统级别的指标（如CPU使用率、内存使用情况、磁
我的脚印不孤单静夜语思
转眼又是新的一年14年来，一路上跌跌撞撞，深一脚浅一脚，虽然留下的脚印，智能儿14年来，一路上我乖乖坐在椅子上，认真的做着功课，爸爸在我身边踱着步，是大吼一声，错了，那你算错了，这么简单的还会，我乖乖坐在椅子上认真的做着功课，爸爸在我身边儿踱着步，时而大吼一声，错了，那里算错了，这么简单的还会错。时而慈眉善目，却又不刻意流露在脸上，然后继续在我身边走来走去走来走去，这是我儿时爸爸在我身后留下的一个
【Redis篇】数据库架构演进中Redis缓存的技术必然性—高并发场景下穿透、击穿、雪崩的体系化解决方案奈斯DB Redis专栏缓存 redis 数据库架构运维
《博主主页》：CSDN主页__奈斯DBIFClub社区主页__奈斯、《擅长领域》：擅长阿里云AnalyticDBforMySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(Redis)有了解如果觉得文章对你有所帮助，欢迎点赞收藏加关注作为DBA或运维在日常与Redis打交道时，往往更关注部署安装、Key清理、内存回收、备份
Lua _G表和 _ENV表
定义在所有函数外部的变量我们可以称之为全局变量(GlobalVariable)，它的作用域默认是整个程序。但Lua作为一种嵌入式语言，代码段(chunk)都是由宿主应用调用的，它自身都不知道会被嵌入到哪个应用程序中。为了解决这个问题，它并没有使用全局变量，而是通过table对全局变量进行模拟。我们可以认为Lua语言把所有的全局变量保存在一个称为全局环境(GlobalEnvironment)的普通表
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include