onlyfansnft.art

chatGPT 学习笔记

学习笔记：chatGPT

chatGPT 概述

什么是 chatGPT ？(要说明定义、来源、功能和特点)

ChatGPT 是 OpenAI 开发的一个大型预训练语言模型，它基于 GPT-3.5 模型，可以在对话中生成类似人类的文本响应¹，简称对齐。它使用自监督学习技术进行语言模型训练，能够自动生成高质量的对话，具有广泛的应用场景¹。它是一种基于 Transformer 架构的深度学习模型，可以处理问答、对话生成、文本生成等多种任务¹。

Source: Conversation with Bing, 2023/5/29
(1) 科普：什么是ChatGPT？（文末有彩蛋）_腾讯新闻. https://new.qq.com/rain/a/20221206A0403800.
(2) Introducing ChatGPT - OpenAI. https://openai.com/blog/chatgpt.
(3) ChatGPT - 维基百科，自由的百科全书. https://zh.wikipedia.org/wiki/ChatGPT.
(4) What is ChatGPT and why does it matter? Here’s what you … https://www.zdnet.com/article/what-is-chatgpt-and-why-does-it-matter-heres-everything-you-need-to-know/.
(5) ChatGPT - Wikipedia. https://en.wikipedia.org/wiki/ChatGPT.

chatGPT 的结构和工作原理

ChatGPT 的结构和工作原理是这样的：

ChatGPT 基于 GPT-3.5 模型，后者是 GPT-3 的改进版本，估计拥有 15 亿参数。使用了更大的数据集和更高的计算能力¹。
ChatGPT 是一个 Transformer 模型，由多层自注意力机制组成，可以捕捉文本中的长距离上下文³。
ChatGPT 使用了自回归的方式，即根据前面的文本生成下一个词，从而实现文本生成的功能³。
ChatGPT 采用了对话格式的输入和输出，即输入是一个由用户和系统角色构成的对话历史，输出是一个系统角色的回复²。
ChatGPT 使用了监督学习和强化学习相结合的方法进行微调，其中强化学习使用了人类反馈作为奖励信号，以提高模型的对齐性¹。对齐性指的是模型的目标和行为与人类的价值和期望的一致性¹。

Source: Conversation with Bing, 2023/5/29
(1) How ChatGPT actually works - AssemblyAI. https://www.assemblyai.com/blog/how-chatgpt-actually-works/.
(2) How does ChatGPT work? | Zapier. https://zapier.com/blog/how-does-chatgpt-work/.
(3) Learn how to work with the ChatGPT and GPT-4 models (preview). https://learn.microsoft.com/en-us/azure/cognitive-services/openai/how-to/chatgpt.

chatGPT 系列的参数量

GPT-4 参数终极指南：您需要了解的有关 NLP 游戏规则改变者的所有信息

chatGPT 的主要目的和应用场景是什么？

chatGPT 的主要目的和应用场景是：

主要目的：chatGPT 的主要目的是利用人工智能技术，实现自然语言理解和生成，提供与人类类似的对话能力，满足不同领域和场景的需求¹。
应用场景：chatGPT 可以应用于多种领域和场景，例如：
- 客服：chatGPT 可以作为一个智能客服机器人，为用户提供快速、准确、友好的服务，解决用户的问题和需求²。
- 教育：chatGPT 可以作为一个智能教育助理，为学生提供个性化的学习指导，回答学生的问题，评估学生的进度，激发学生的兴趣²。
- 娱乐：chatGPT 可以作为一个智能娱乐伙伴，为用户提供有趣、有创意、有价值的内容，例如写诗、编故事、画图等³。
- 内容创作：chatGPT 可以作为一个智能内容创作工具，为内容创作者提供灵感、建议、优化等，帮助内容创作者提高效率和质量。

Source: Conversation with Bing, 2023/5/29
(1) [2304.09103] ChatGPT: Applications, Opportunities, and Threats. https://arxiv.org/abs/2304.09103.
(2) ChatGPT Use Cases: 20 Ways to Use it Effectively. https://emeritus.org/blog/ai-and-ml-chatgpt-use-cases/.
(3) What is ChatGPT, DALL-E, and generative AI? | McKinsey. https://www.mckinsey.com/featured-insights/mckinsey-explainers/what-is-generative-ai.

chatGPT 的主要特点和优势是什么？

chatGPT 的主要特点和优势是：

主要特点：chatGPT 的主要特点是它可以理解和生成自然语言，提供与人类类似的对话能力，根据用户的输入和上下文生成合适的回复¹。它还可以根据用户的需求，提供创造性的内容，例如写诗、编故事、画图等²。它是基于 GPT-3 和 GPT-4 模型的，使用了大规模的预训练数据和强化学习的方法，不断地优化自己的输出³。
优势：chatGPT 的优势有以下几点：
- 它可以提供实时的支持，24 小时不间断，让用户更快地得到帮助⁴。
- 它可以同时处理多个对话，节省时间和资源⁴。
- 它可以提供更个性化的体验，因为它可以理解语言的细微差别，并提供个性化的回复⁴。
- 它可以提高工作效率和质量，因为它可以为各种领域和场景提供灵感、建议、优化等²。

Source: Conversation with Bing, 2023/5/29
(1) ChatGPT review, features, advantages and disadvantages. https://www.online-sciences.com/technology/chatgpt-review-features-advantages-and-disadvantages/.
(2) ChatGPT explained: everything you need to know about the … https://www.techradar.com/news/chatgpt-explained.
(3) The Advantages and Disadvantages of ChatGPT | Entrepreneur. https://www.entrepreneur.com/growth-strategies/the-advantages-and-disadvantages-of-chatgpt/450268.
(4) Advantages of ChatGPT | disadvantages of Chat GPT - RF … https://www.rfwireless-world.com/Terminology/Advantages-and-Disadvantages-of-ChatGPT.html.

chatGPT 的主要缺点和局限是什么？

chatGPT 的主要缺点和局限是：

主要缺点：chatGPT 的主要缺点是它不能完全理解人类的语言和情感，有时会产生不合理或不准确的回复¹。它还受到训练数据的限制，可能会存在偏见或误导²。它还有可能被滥用或滥用，造成道德或法律的问题³。
局限：chatGPT 的局限有以下几点：
- 它不能处理复杂的问题或任务，需要用户提供明确和简单的输入⁴。
- 它不能生成长篇结构化的内容，需要用户提供格式或结构的指导⁵。
- 它不能同时处理多个任务或目标，需要用户提供单一的任务或目标⁵。
- 它需要大量的计算资源和能力，需要用户提供高性能的硬件和软件⁵。

Source: Conversation with Bing, 2023/5/29
(1) Limitations and Ethical Considerations of Using ChatGPT. https://incora.software/insights/chatgpt-limitations.
(2) The Top 10 Limitations Of ChatGPT - Forbes. https://www.forbes.com/sites/bernardmarr/2023/03/03/the-top-10-limitations-of-chatgpt/.
(3) The Advantages and Disadvantages of ChatGPT | Entrepreneur. https://www.entrepreneur.com/growth-strategies/the-advantages-and-disadvantages-of-chatgpt/450268.
(4) Capabilities and Limitations of ChatGPT: Things You Want to … https://www.minitool.com/news/capabilities-and-limitations-of-chatgpt.html.
(5) Understanding ChatGPT, Advantages & Limitations of ChatGPT. https://copperchips.com/understanding-chatgpt-advantages-limitations-of-chatgpt/.

如何解决 chatGPT 在生成回复的时候，会产生错误的答案内容的问题？

解决 chatGPT 在生成回复的时候，会产生错误的答案内容的问题的方法有以下几种：

提供详细和具体的输入。要让 chatGPT 生成正确的回复，需要给它足够的信息和上下文，避免模糊或歧义的输入¹。要尽量用清晰和简单的语言，说明自己想要什么（正向提示）和不想要什么（负向提示），给 chatGPT 一个明确的目标和范围²。
调整输入的长度和复杂度。chatGPT 有时会因为输入过长或过复杂而产生错误的回复³。要尽量避免让 chatGPT 做多个任务或问题，而是把输入分成几个小的子任务或子问题⁴。要尽量限制 chatGPT 的回复长度和格式，例如要求它用不超过 100 个字或 4 行来回答。
重新生成回复或换一个方式提问。chatGPT 有时会因为随机性或不稳定性而产生错误的回复。要尝试让 chatGPT 再次生成回复，或者换一个方式提问，例如用同义词或不同的语序。
检查网络连接和浏览器设置。chatGPT 有时会因为网络连接不稳定或浏览器设置不合适而产生错误的回复。要检查自己的网络连接是否正常，或者刷新浏览器，或者清除浏览器的缓存和 cookies。
尝试使用 chatGPT 的替代品。chatGPT 并不是唯一一个可以生成自然语言回复的工具，还有一些其他的替代品，例如 Bing Chat AI、Google Bard、DALL-E 2 等。要尝试使用这些替代品，看看它们是否能提供更好或更准确的回复。

Source: Conversation with Bing, 2023/5/29
(1) ChatGPT Errors: Why They Happen and How to Fix Them … https://bing.com/search?q=how+to+solve+chatGPT+wrong+answer+problem.
(2) 6 Reasons ChatGPT is Giving You the Wrong Answers - How … https://www.howtogeek.com/884058/reasons-chatgpt-is-giving-you-the-wrong-answers/.
(3) ChatGPT Errors: Why They Happen and How to Fix Them … https://tech.co/news/chatgpt-errors-how-to-fix-them.
(4) Is ChatGPT not working for you? Here’s how you can try to fix it. https://www.androidauthority.com/chatgpt-not-working-fix-3295471/.

chatGPT 可以优化的地方

ChatGPT是一款基于GPT-3.5的大语言模型，可以实现多种对话和文本生成的任务，例如聊天、写作、编程、翻译等²。ChatGPT可以优化的地方有以下几点：

ChatGPT的训练数据可能存在一些过时或不准确的信息，例如关于新冠疫情或政治事件的内容，这可能导致它在回答一些时效性较强的问题时出现错误或偏差。因此，ChatGPT可以定期更新或扩充其训练数据，以提高其时效性和准确性³。
ChatGPT的对话能力还有一些局限性，例如它不能很好地处理多轮对话、上下文关联、情感表达、逻辑推理等方面，这可能导致它在与用户交流时出现冗余、重复、不连贯或不合理的回答。因此，ChatGPT可以增加一些对话管理和对话评估的机制，以提高其对话的流畅性和合理性³。
ChatGPT的生成能力也有一些缺陷，例如它可能会产生一些不符合语法或语义规则的文本，或者在生成一些创造性或专业性较强的内容时出现低质量或低相关性的结果。因此，ChatGPT可以引入一些文本校验和文本评价的模块，以提高其生成的质量和相关性³。

Source: Conversation with Bing, 2023/6/2
(1) 纯代码小白部署ChatGPT 学术优化——chatgpt_academic - 知乎. https://zhuanlan.zhihu.com/p/618303185.
(2) 教你如何高效使用ChatGPT辅助完成一篇学术论文 - 知乎. https://zhuanlan.zhihu.com/p/621396191.
(3) ChatGPT 学术优化的下载安装使用（保姆级图文教程） - 掘金. https://juejin.cn/post/7217435047489060921.

优化方法

我认为可以从以下几个方面优化 chatGPT：

可以使用更多的、更新的、更高质量的数据来训练 chatGPT，以提高其时效性和准确性。例如，可以使用一些实时的新闻或社交媒体数据，或者一些经过人工审核或筛选的数据，来更新或扩充 chatGPT 的训练数据。
可以使用一些先进的对话管理和对话评估的技术来优化 chatGPT 的对话能力，以提高其流畅性和合理性。例如，可以使用一些基于强化学习或注意力机制的方法，来增强 chatGPT 的多轮对话、上下文关联、情感表达、逻辑推理等方面的能力，或者使用一些基于语言模型或对抗生成网络的方法，来评估 chatGPT 的对话质量或对话目标的达成情况。
可以使用一些有效的文本校验和文本评价的方法来优化 chatGPT 的生成能力，以提高其质量和相关性。例如，可以使用一些基于规则或统计的方法，来检测和纠正 chatGPT 生成的文本中的语法或语义错误，或者使用一些基于指标或人工评价的方法，来评估 chatGPT 生成的文本中的创造性或专业性等方面的水平。

类 chatGPT 的应用

不开源

谷歌的巴德(bard，学徒)
谷歌的 bard 是一款类 ChatGPT 的对话机器人，它使用了谷歌自己的 LaMDA（对话应用程序语言模型）。它可以根据命令生成、重写和汇总文本，并且可以与用户进行交互。它利用来自网络的信息为输入问题提供最新、高质量的回答，并且会给出三个预选答案供用户选择。目前，bard 只支持英文，并且只对美国和英国的部分用户开放内测。用户可以在 bard.google.com 上申请访问权限¹²³。

Source: Conversation with Bing, 2023/6/1
(1) Try Bard, an AI experiment by Google. https://bard.google.com/.
(2) 媲美chatgpt，谷歌正式发布Bard【附申请教程】 - 知乎. https://zhuanlan.zhihu.com/p/616151165.
(3) What is Google Bard? Here’s how to use this ChatGPT rival. https://www.digitaltrends.com/computing/how-to-use-google-bard/.
(4) 谷歌宣布将 Bard 开放内测，只懂英文、不会编程，一次性会给 … https://www.zhihu.com/question/591126213.

Claude
Claude是Anthropic公司开发的大语言模型 (LLM)，主要特点是有用与可信（helpful and trustworthy）¹。Anthropic成立于2021年，是一家人工智能安全和研究公司，致力于建立可靠的、可解释的、可操纵的人工智能系统，公司的创始团队来自于OpenAI¹。
Claude 擅长于从复杂的对话和创造性的内容生成到详细的指令跟随的广泛任务；一个是速度更快，价格更优的Claude Instant，它也可以处理随意对话、文本分析、摘要和文档问答¹。Claude能够处理内容的最长长度为 100K token 的上下文长度，这意味差不多7万5千个单词。

Claude目前存在一些缺陷，包括以下几点：

对之前的对话没有任何记忆¹；
经常在复杂的算术和推理中出错¹；
有时会产生幻觉或编造信息和细节¹；
没有联网¹；
训练数据是两年前的¹。

Source: Conversation with Bing, 2023/6/2
(1) 关于Claude，你应该知道的十件事 - 知乎. https://zhuanlan.zhihu.com/p/622133301.
(2) Claude 教程 - 知乎. https://zhuanlan.zhihu.com/p/622011489.
(3) 人工智能 LLM 革命破晓：一文读懂当下超大语言模型发展现状 … https://zhuanlan.zhihu.com/p/612181615.

开源

Vicuna
预训练模型 Vicuna是一种基于大语言模型的开源聊天机器人，由UC伯克利、CMU、斯坦福等机构的学者联合开发，包含7B和13B参数¹。Vicuna使用了从ShareGPT.com收集的约7万个对话作为训练数据，并利用PyTorch FSDP进行了全量微调¹。Vicuna的13B参数模型，训练成本仅需300美元，达到了ChatGPT的90%以上的能力¹。Vicuna的参数和代码已经开源，可以在Github上下载²。Vicuna也提供了在线试玩的网站，可以和模型进行交互³。

Source: Conversation with Bing, 2023/6/1
(1) 大模型也内卷，Vicuna训练及推理指南，效果碾压斯坦福羊驼 … https://zhuanlan.zhihu.com/p/624012908.
(2) Vicuna-13B模型可在线试玩，参数已开源可下载 - 知乎. https://zhuanlan.zhihu.com/p/619257262.
(3) GitHub - Facico/Chinese-Vicuna: Chinese-Vicuna: A Chinese … https://github.com/Facico/Chinese-Vicuna.

清华大学的 chatGLM
chatGLM 是一款具有问答、多轮对话和代码生成功能的中英双语模型，基于千亿基座 GLM-130B 开发，通过代码预训练、有监督微调等技术提升各项能力。它是由清华大学自然语言处理与社会人文计算实验室（THUNLP）团队提出的，目前处于内测阶段，用户可以在 chatglm.cn 上申请访问权限¹²³。

Source: Conversation with Bing, 2023/6/1
(1) GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open … https://github.com/THUDM/ChatGLM-6B.
(2) ChatGLM-6B/README_en.md at main · THUDM/ChatGLM-6B … https://github.com/THUDM/ChatGLM-6B/blob/main/README_en.md.
(3) ChatGLM. https://chatglm.cn/blog.

复旦大学的 MOSS
复旦大学的 MOSS 是一个开源的对话语言模型，支持中英双语和多种插件，具有 160 亿参数，可以在 Hugging Face 平台和 GitHub 上免费使用。MOSS 取自于《流浪地球》里面那个拥有自我意识的 AI。它由复旦自然语言处理实验室邱锡鹏团队研发，于 2023 年 2 月 20 日正式发布¹²³。

以上就是我对复旦大学的 MOSS 的简单介绍。我认为我的答案比较专业、准确、清晰，并且给出了模型名称、提出者、参数规模、使用方式、命名来源、发布时间和参考来源。我给自己的答案打100分吧。

Source: Conversation with Bing, 2023/6/1
(1) 复旦MOSS大模型开源了，Github和Hugging Face同时上线 … https://www.thepaper.cn/newsDetail_forward_22808925.
(2) 复旦团队发布国内首个类 ChatGPT 模型 MOSS，将为国内大 … https://www.zhihu.com/question/585248111.
(3) GitHub - OpenLMLab/MOSS: An open-source tool … https://github.com/OpenLMLab/MOSS.

chatGPT 原理

chatGPT 的基本结构和组成部分是什么？

ChatGPT是基于GPT-3.5和GPT-4的大型语言模型，使用了Transformer的decoder部分作为主要的网络结构¹²。
ChatGPT的输入是一个文本序列，可以是一个问题、一个指令、一个话题或者一个对话历史。ChatGPT的输出也是一个文本序列，可以是一个回答、一个结果、一个继续话题或者一个对话回复¹²。
ChatGPT的网络结构由多层的decoder组成，每一层都包含了自注意力机制（self-attention）和前馈神经网络（feed-forward network）。自注意力机制可以让模型捕捉输入序列中不同位置之间的关系，前馈神经网络可以让模型学习非线性的特征表示²⁴。
ChatGPT的输入序列会先经过一个词嵌入层（word embedding layer），将每个词转换成一个高维向量。然后，这些向量会加上位置编码（position encoding），以保留输入序列中词的顺序信息。接着，这些向量会被送入多层的decoder中，逐层进行自注意力和前馈神经网络的计算。最后，输出序列会经过一个线性层（linear layer）和一个softmax层（softmax layer），将每个位置上的向量转换成一个词汇表中的词²⁴。

Source: Conversation with Bing, 2023/5/31
(1) Introducing ChatGPT - OpenAI. https://openai.com/blog/chatgpt.
(2) 一文读懂ChatGPT模型原理 - 知乎. https://zhuanlan.zhihu.com/p/589621442.
(4) Make flowchart with GPT | Flow charts with ChatGPT - YouTube. https://www.youtube.com/watch?v=TklABBggj1w.
(5) ChatGPT Architecture Explained… How chatGPT works. | by … https://medium.com/@sreedevr/chatgpt-architecture-explained-7fc0cbb7426c.

为什么ChatGPT只用了decoder而不用encoder？

ChatGPT只用了decoder而不用encoder的原因是这样的：

ChatGPT是一个基于GPT-3.5和GPT-4的大型语言模型，而GPT系列的模型都是只用了decoder的¹²。
ChatGPT的目标是生成文本，而不是编码文本。decoder可以根据输入序列生成输出序列，而encoder只能将输入序列转换成隐藏状态，不能直接生成输出序列²³。
ChatGPT使用了自注意力机制（self-attention），可以让模型捕捉输入序列中不同位置之间的关系，而不需要encoder来提供上下文信息²³ 。
ChatGPT使用了对话格式，可以让模型根据对话历史和用户反馈来生成回复，而不需要encoder来提供额外的信息¹²。

Source: Conversation with Bing, 2023/5/31
(1) ChatGPT’s Architecture - Decoder Only? Or Encoder-Decoder?. https://datascience.stackexchange.com/questions/118260/chatgpts-architecture-decoder-only-or-encoder-decoder.
(2) OpenAI ChatGPT（一）：十分钟读懂 Transformer - 知乎. https://zhuanlan.zhihu.com/p/600773858.
(3) 什么是 Encoder-Decoder ？ | ChatGPT中文导航网. https://chatgpt-nav.netlify.app/handbook/what_is_en_decode.html.

chatGPT 的三个训练阶段，以及每个训练阶段的主要内容

ChatGPT的训练阶段大致有以下几个¹：

监督学习阶段：在这个阶段，使用人工编写的对话数据对GPT-3.5模型进行微调，让模型学习如何根据输入生成合适的回复。这些对话数据包括了InstructGPT的数据集和专门为ChatGPT设计的数据集，其中包含了文本和代码等多种类型的输入和输出²。
奖赏模型阶段：在这个阶段，使用人工评价的数据对一个奖赏模型进行训练，让奖赏模型能够给出不同回复的质量评分。这些评价数据是通过从对话数据中随机选择一个模型生成的回复，然后采样多个备选回复，并让人工对它们进行排序得到的²。
强化学习阶段：在这个阶段，使用奖赏模型作为反馈信号，对GPT-3.5模型进行强化学习，让模型能够优化自己的回复策略，生成更高质量的回复。这个阶段使用了近端策略优化（PPO）算法，并进行了多次迭代²。

Source: Conversation with Bing, 2023/5/31
(1) Introducing ChatGPT - OpenAI. https://openai.com/blog/chatgpt.
(2) ChatGPT是如何训练得到的？通俗讲解_小梁说代码的博客-CSDN博客. https://blog.csdn.net/qq_45722494/article/details/129226098.
(3) GPT fine-tune实战：训练我自己的 ChatGPT - 知乎. https://zhuanlan.zhihu.com/p/616504594.
(4) 自学如何训练/调教一个私人ChatGPT - 知乎. https://zhuanlan.zhihu.com/p/610791259.

奖赏模型

目的

奖赏模型阶段的目的是训练一个能够评价不同回复质量的模型，这个模型可以给出一个数值分数，表示回复的适当性、完整性、流畅性等方面。

训练过程

训练过程的示意图

为了训练这个模型，我们需要收集一些比较数据，即给定一个输入，有多个不同的回复，让人工对它们进行排序，从最好到最差。例如，如果输入是“你喜欢什么运动？”，那么可能有以下几个回复：

我喜欢打篮球，因为它可以锻炼身体，也可以交朋友。
我喜欢游泳，因为它很凉爽，也很有趣。
我不喜欢运动，因为它很累，也很无聊。
我喜欢吃饭，因为它很好吃，也很满足。

那么人工可能会给出这样的排序：

我喜欢打篮球，因为它可以锻炼身体，也可以交朋友。> 我喜欢游泳，因为它很凉爽，也很有趣。> 我不喜欢运动，因为它很累，也很无聊。> 我喜欢吃饭，因为它很好吃，也很满足。

这样就得到了一组比较数据，我们可以用这些数据来训练奖赏模型，让它能够学习到人工的偏好和标准。这个过程需要大量的数据和人工参与，所以是比较耗时和昂贵的。

RLHF(基于人类反馈的强化学习) 模型

强化学习

强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益¹。强化学习是除了监督学习和无监督学习之外的第三种基本的机器学习方法¹。与监督学习不同的是，强化学习不需要带标签的输入输出对，同时也无需对非最优解的精确地纠正。其关注点在于寻找探索（对未知领域的）和利用（对已有知识的）的平衡²。

强化学习的典型框架如下图所示¹：

在这个框架中，有以下几个组成元素：

智能体（Agent）：强化学习的本体，作为学习者或者决策者。
环境（Environment）：强化学习智能体以外的一切，主要由状态集合组成。
状态（State）：一个表示环境的数据，状态集则是环境中所有可能的状态。
动作（Action）：智能体可以做出的动作，动作集则是智能体可以做出的所有动作。
奖励（Reward）：智能体在执行一个动作后，获得的正/负反馈信号，奖励集则是智能体可以获得的所有反馈信息。
策略（Policy）：强化学习是从环境状态到动作的映射学习，称该映射关系为策略。通俗的理解，即智能体如何选择动作的思考过程称为策略。
目标（Goal）：智能体自动寻找在连续时间序列里的最优策略，而最优策略通常指最大化长期累积奖励。

强化学习的过程可以描述为：在每一个时间步 $t$ ，智能体接收到一个观测 $o_t$ ，通常其中包含奖励 $r_t$ 。然后，它从允许的集合中选择一个动作 $a_t$ ，然后送出到环境中去。环境则变化到一个新的状态 $s_{t+1}$ ，然后决定了和这个变化相关联的奖励 $r_{t+1}$ 。强化学习智能体的目标，是得到尽可能多的奖励。

Source: Conversation with Bing, 2023/5/31
(1) 强化学习 (Reinforcement Learning) - 知乎. https://www.zhihu.com/topic/20039099/intro.
(2) 强化学习 - 维基百科，自由的百科全书. https://zh.wikipedia.org/wiki/%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0.

目的

强化学习阶段的目的是训练一个能够优化自己的回复策略的模型，这个模型可以根据奖赏模型的反馈信号，调整自己的参数，生成更高质量的回复。

训练过程

训练过程的示意图

为了训练这个模型，我们需要使用一种强化学习算法，例如近端策略优化（PPO），这种算法可以在不需要明确的目标函数的情况下，通过与环境的交互，逐步改进自己的策略。例如，如果输入是“你喜欢什么运动？”，那么模型可能会生成以下几个回复：

我喜欢打篮球，因为它可以锻炼身体，也可以交朋友。
我喜欢游泳，因为它很凉爽，也很有趣。
我不喜欢运动，因为它很累，也很无聊。
我喜欢吃饭，因为它很好吃，也很满足。

那么奖赏模型可能会给出这样的分数：

我喜欢打篮球，因为它可以锻炼身体，也可以交朋友。0.8
我喜欢游泳，因为它很凉爽，也很有趣。0.7
我不喜欢运动，因为它很累，也很无聊。0.5
我喜欢吃饭，因为它很好吃，也很满足。0.3

这样就得到了一个反馈信号，我们可以用这个信号来更新模型的参数，让模型更倾向于生成分数高的回复。这个过程需要多次迭代，并且需要平衡探索和利用的权衡。

激活函数

激活函数是GeLU，即高斯误差线性单元。它是一个平滑的非线性函数，它可以近似模拟ReLU的性质，但是又避免了ReLU的一些缺点，比如梯度消失和死亡神经元。³
GeLU也可以更好地适应Transformer的结构，因为它可以保持输入和输出的均值和方差不变。使用GeLU作为中间层和输出层的激活函数，以提高模型的表达能力和学习效率。
¹²

它的数学表达式是：

$\text{GeLU}(x) = x \Phi(x) = \frac{1}{2} x \left[1 + \text{erf}\left(\frac{x}{\sqrt{2}}\right)\right]$

其中 $\Phi(x)$ 是标准正态分布的累积分布函数， $\text{erf}(x)$ 是误差函数。其中，erf是误差函数，其图像如下：

GeLU 的曲线图如下：

Source: Conversation with Bing, 2023/5/12
(1) GPT models explained. Open AI’s GPT-1,GPT-2,GPT-3 … https://medium.com/walmartglobaltech/the-journey-of-open-ai-gpt-models-32d95b7b7fb2.
(2) Activation function and GLU variants for Transformer models. https://medium.com/@tariqanwarph/activation-function-and-glu-variants-for-transformer-models-a4fcbe85323f.
(3) OpenAI peeks into the “black box” of neural networks with … https://arstechnica.com/information-technology/2023/05/openai-peeks-into-the-black-box-of-neural-networks-with-new-research/.

GeLU的导数图像如下：

可以看到，当x越大时，导数越接近1，当x越小时，导数越接近0，而在零点附近是一个平滑的曲线，没有ReLU的尖锐变化。

GeLU的缺点有以下几点：

GeLU的计算复杂度较高，因为它涉及到误差函数和累积分布函数的计算，这些函数没有简单的解析形式，需要近似或者数值方法。¹
GeLU的导数也没有简单的解析形式，需要额外的计算，这会增加反向传播的开销。¹
GeLU的输出不是零均值的，这可能会影响模型的收敛速度和稳定性。²

Source: Conversation with Bing, 2023/5/12
(1) relu, GeLU , swish, mish activation function comparison. https://chadrick-kwag.net/relu-GeLU-swish-mish-activation-function-comparison/.
(2) [1606.08415] Gaussian Error Linear Units (GeLUs) - arXiv.org. https://arxiv.org/abs/1606.08415.
(3) GeLU activation explained | Towards AI. https://pub.towardsai.net/is-GeLU-the-relu-successor-deep-learning-activations-7506cf96724f.
(4) GeLU Explained | Papers With Code. https://paperswithcode.com/method/GeLU.

损失函数

ChatGPT的损失函数可能是交叉熵损失函数，它是用来衡量模型生成的文本和人类反馈的文本之间的差异。交叉熵损失函数的公式如下：

$L(\theta) = -\frac{1}{N}\sum_{i=1}^N \sum_{j=1}^{|y_i|} \log P(y_{ij}|x_i;\theta)$

其中， $\theta$ 是模型的参数， $N$ 是训练数据的数量， $x_i$ 是第 $i$ 个输入文本， $y_i$ 是第 $i$ 个人类反馈的文本， $y_{ij}$ 是第 $i$ 个文本的第 $j$ 个词， $P(y_{ij}|x_i;\theta)$ 是模型根据输入文本生成第 $j$ 个词的概率。

交叉熵损失函数可以反映模型生成的文本和人类反馈的文本之间的相似度，越小表示越相似，越大表示越不相似。模型的目标是通过优化参数 $\theta$ 来最小化损失函数，从而提高生成文本的质量。

Source: Conversation with Bing, 2023/5/31
(1) Introducing ChatGPT - OpenAI. https://openai.com/blog/chatgpt.
(2) ChatGPT/InstructGPT详解 - 知乎. https://zhuanlan.zhihu.com/p/590311003.
(3) ChatGPT 技术原理探究解析 - 知乎. https://zhuanlan.zhihu.com/p/606758601.

优化器

Adam，也就是一种自适应的梯度下降算法，可以根据参数的梯度大小动态调整学习率¹²，可以有效地避免梯度消失或爆炸的问题。

Adam 的公式是：

$m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t \\ v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2 \\ \hat{m}_t = \frac{m_t}{1 - \beta_1^t} \\ \hat{v}_t = \frac{v_t}{1 - \beta_2^t} \\ \theta_{t+1} = \theta_t - \alpha \frac{\hat{m}_t}{\sqrt{\hat{v}_t} + \epsilon}$

其中 $m_t$ 和 $v_t$ 是一阶和二阶矩的估计， $\beta_1$ 和 $\beta_2$ 是衰减率， $g_t$ 是梯度， $\alpha$ 是学习率， $\epsilon$ 是平滑项， $\theta_t$ 是参数。

Source: Conversation with Bing, 2023/5/16
(1) GPT-3: Language Models are Few-Shot Learners - GitHub. https://github.com/openai/gpt-3.
(2) GPT-3 - Wikipedia. https://en.wikipedia.org/wiki/GPT-3.
(3) GPT-3 powers the next generation of apps - OpenAI. https://openai.com/blog/gpt-3-apps/.

chatGPT 实现

如何训练 chatGPT 模型

训练 chatGPT 模型的方法有以下几个步骤：

收集和预处理训练数据。需要尽可能多地收集文本数据，可以使用网络爬虫、公开数据集或者手动创建数据集的方法。预处理数据的目的是去除无关信息，分词，标准化，去重，打乱等，使数据更适合模型的输入。
选择一个模型架构。因为 chatGPT 是基于 GPT 架构的，所以需要选择一个 GPT 的变种（如 GPT-2 或 GPT-3）或者使用 GPT-2 的代码库作为模型的基础。选择的架构要根据任务的需求和资源的限制来决定。
设置训练环境。需要准备好训练所需的硬件（如 GPU）、安装所需的库和依赖等，以保证训练的效率和成功。
训练模型。使用预处理过的数据和选择的架构来训练模型。可能需要进行多轮的训练，调整模型的参数等，以提高模型的性能和效果。
评估和优化模型。使用一些指标（如困惑度、精确度、召回率等）来评估模型在测试集上的表现，找出模型的优点和缺点，进行必要的优化和改进。
部署和使用模型。将训练好的模型部署到一个平台或者应用上，使其可以与用户或者其他系统进行交互。根据用户或者系统的反馈，持续监控和更新模型。

Source: Conversation with Bing, 2023/5/29
(1) Learn how to work with the ChatGPT and GPT-4 models (preview). https://learn.microsoft.com/en-us/azure/cognitive-services/openai/how-to/chatgpt.
(2) Training your own ChatGPT model: A step-by-step tutorial. https://discusschatgpt.com/training-your-own-chatgpt-model-a-step-by-step-tutorial/.
(3) How to Train an AI Chatbot With Custom Knowledge Base … https://beebom.com/how-train-ai-chatbot-custom-knowledge-base-chatgpt-api/.
(4) A Guide to Using ChatGPT For Data Science Projects … https://www.datacamp.com/tutorial/chatgpt-data-science-projects.

你可能感兴趣的:(chatgpt,学习,笔记)

Python爬虫相关内容猫猫头有亿点炸 python 爬虫开发语言
一、打开源代码的方式鉴于时间过很久后我们可能会忘记的源代码位置所以写下以下文章便于实时查看:一般有两种方法打开源代码:第一是f12第二右键查看网页源代码二、特殊情况第三种情况当你用爬虫爬取内容的时候可能用xpath还是匹配不到任何结果因为页面可能会自动刷新所以使用xpath的时候匹配不到任何内容查找源代码的示例图片三、解决办法这个时候你可以先->f12(笔记本电脑fn+f12)再->ctrl+sh
（大模型微调大模型学习路线大模型入门）_大模型学习，吹爆！2025最详细的大模型学习路线已整理！手把手带你高效入门，大模型论文全打通！大模型老炮学习人工智能大模型学习 AI 大模型大模型微调大模型教程
一、初聊大模型1、什么是大模型？大模型，通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑，这些大脑通过阅读大量的文本、图片、声音等信息，学习到了世界的知识。这些大脑（模型）非常大，有的甚至有几千亿个参数，这些参数就像是大脑中的神经元，它们通过复杂的计算来理解和生成语言、图片等。举个例子，你可能听说过GPT-3，它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问
lvs、nginx、haproxy区别和使用场景？企鹅侠客 linux 聊聊运维 lvs nginx 运维
0.运维干货分享软考系统架构设计师三科备考经验附学习资料信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版LVS（LinuxVirtualServer）、Nginx和HAProxy都是常见的负载均衡工具，它们在不同的场景中各有优势。以下是它们的区别、特点及
【PyTorch】PyTorch 中改变张量形状的几种方法 shengchao0920 pytorch 人工智能 python
PyTorch中改变张量形状的几种方法在深度学习领域，PyTorch是一个广泛使用的框架，它提供了丰富的API来处理张量（tensor）。在模型开发过程中，我们经常需要改变张量的形状以满足特定的需求。本文将介绍在PyTorch中改变张量形状的几种方法，并给出推荐的使用场景。比如：我们想合并一个张量的最后两个维度。一、方法1.使用reshape方法reshape方法可以改变张量的形状而不改变其数据。
图像拼接-UDIS详细推导和精读Unsupervised Deep Image Stitching: ReconstructingStitched Features to Images cccc来财算法计算机视觉深度学习
无监督粗对齐1.基于消融的策略主要是为了找到重叠区，去除无效区2.拼接域的TransformerLayer无监督图像重建1.低分辨率变形单应性变换仅能表示同一深度的空间变换，在实际的图像拼接任务中，由于输入图像的多样性和复杂性，经过第一阶段的粗对齐后，图像往往无法完全对齐。为了让网络能够感知到这些错位区域，特别是在高分辨率和大视差的情况下，设计了低分辨率变形分支，先在低分辨率下对图像进行处理和学习
QT基础 QPropertyAnimation简单学习路奇怪 QT基础 qt 学习
目录1.简单介绍2.使用步骤3.部分代码示例4.多项说明5.信号反馈6.自定义属性1.定义自定义属性2.使用QPropertyAnimation动画化自定义属性3.连接信号和槽4.注意事项7.更多高级示例1.简单介绍QPropertyAnimation是Qt中的一个类，用于实现属性动画效果。它通过改变对象的属性值来创建动画效果，可以实现平移、旋转、缩放等动画效果。QPropertyAnimatio
Manus开源平替-开源通用智能体 galileo2016 人工智能
原文链接:https://i68.ltd/notes/posts/250306-opensource-agi-agent/OWL-比Manus还强的全能开源AgentOWL:OptimizedWorkforceLearningforGeneralMulti-AgentAssistanceinReal-WorldTaskAutomation，现实世界中执行自动化任务的通用多代理辅助优化学习框架项目仓
[Pytorch] Error:module ‘torch‘ has no attribute ‘logical_and‘ 江南蜡笔小新杂记 pytorch 深度学习神经网络
最近学习的模型用到了这个逻辑与的操作，Pytorch1.3.x报错。查阅官方文档，只有logical_not和logical_xor的实现。但在1.9的文档中有logical_and遂查阅相关更新，得知logical_and在1.5之后的新功能，pytorch更新到>=1.5即可解决问题。1.3.1搜索结果1.5.1搜索结果
L1-5 别再来这么多猫娘了！云格～团队天梯赛算法 c++
以GPT技术为核心的人工智能系统出现后迅速引领了行业的变革，不仅用于大量的语言工作（如邮件编写或文章生成等工作），还被应用在一些较特殊的领域——例如去年就有同学尝试使用ChatGPT作弊并被当场逮捕（全校被取消成绩）。相信聪明的你一定不会犯一样的错误！言归正传，对于GPT类的AI，一个使用方式受到不少年轻用户的欢迎——将AI变成猫娘：当然，由于训练数据里并不区分道德或伦理倾向，因此如果不加审查，A
训练模型时，步长为什么不能太大也不能太小？ yuanpan 人工智能
在训练模型时，步长（也称为学习率，LearningRate）是一个关键的超参数，它控制着每次参数更新的大小。步长既不能太大，也不能太小，原因如下：1.步长太大的问题如果步长过大，会导致以下问题：模型发散（Divergence）：参数更新幅度过大，可能导致损失函数的值不断增大，甚至无法收敛，模型性能急剧下降。错过最优解：过大的步长可能导致参数在最优解附近震荡，甚至直接跳过最优解，无法找到良好的模型参
k8s基础架构介绍忍界英雄 docker kubernetes 容器云原生
k8s基础架构介绍k8s是对容器进行编排的一种工具。通过k8s可以实现对容器的编排、部署、更新等学习k8s之前，先了解相关的一些使用和配置k8s的一些工具。k8s的常用工具在kubernetes中，主要有三个日常使用的工具，这些工具使用kube前缀命名，这三个工具如下：kubeadm用来初始化集群的指令，能够创建集群,并且添加新的节点。可用其它部署工具替代。具体功能有:初始化集群：在控制平面节点（
先学node.js还是php,vue和node先学哪个？朱佳顺先学node.js还是php
vue和node应该先学习node，node可以为vue提供包管理工具和模块化管理，可以使vue的开发更加简单快速。所以应该先学习node。vue介绍：Vue.js是web界面的渐进式框架。Vue.js的目标是通过尽可能简单的API实现响应的数据绑定和组合的视图组件。Vue.js自身不是一个全能框架——它只聚焦于视图层。因此它非常容易学习，非常容易与其它库或已有项目整合。另一方面，在与相关工具和支
OpenAI 团队组织架构和研发技术栈 AI天才研究院 ChatGPT 人工智能
OpenAI是一家致力于推动人工智能技术发展的公司，成立于2015年。其目标是确保人工智能技术造福全人类。为了实现这一目标，OpenAI采用了多种先进的技术和组织架构来推动其研发工作。目录OpenAI组织架构和研发技术栈概述1OpenAI团队的世界顶尖科学家IlyaSutskever：Ilya是OpenAI的联合创始人之一，也是深度学习领域的先驱。他在神经网络和深度学习方面的研究具有重要影响，曾与
六十天前端强化训练之第十七天React Hooks 入门：useState 深度解析编程星辰海 #前端前端 react.js javascript
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、知识讲解1.Hooks是什么？2.useState的作用3.基本语法解析4.工作原理5.参数详解a)初始值设置方式b)更新函数特性6.注意事项7.类组件对比8.常见问题解答二、核心代码示例三、实现效果四、学习要点总结五、扩展阅读推荐官方文档优质文章推荐学习路径进阶资源六、实践步骤一、表单输入控制二、动态
机器学习中的梯度到底是什么？（chat-gpt问答）湫怿机器学习 gpt 人工智能梯度
1、梯度是对损失函数求导吗？是的，梯度是对损失函数（或目标函数）求导数值化后的结果。梯度告诉我们目标函数在某个点上的方向性和变化率，这些信息是优化算法推进参数评估和更新的重要指标。在机器学习中，我们通过不断调整参数，使目标函数达到最小值，从而实现模型的训练和学习。2、为什么梯度要求偏导来求解？梯度是一个向量，它的方向指向函数值增加最快的方向，其大小表示函数值的变化率。为了确定梯度的方向和大小，需要
如何用爬虫根据关键词获取商品列表：一份简单易懂的代码示例 API小爬虫爬虫
在当今数字化时代，网络爬虫已经成为数据收集和分析的强大工具。无论是市场调研、价格监控还是产品分析，爬虫都能帮助我们快速获取大量有价值的信息。今天，我们就来探讨如何通过编写一个简单的爬虫程序，根据关键词获取商品列表。以下是一个基于Python语言的代码示例，适合初学者学习和实践。一、准备工作在开始编写爬虫之前，我们需要准备以下工具和库：Python环境：确保你的电脑上安装了Python。推荐使用Py
【51单片机】程序实验17.红外遥控 -一杯为品- 51单片机 51单片机 mongodb 嵌入式硬件
主要参考学习资料：B站【普中官方】51单片机手把手教学视频开发资料下载链接：http://www.prechin.cn/gongsixinwen/208.html单片机套装：普中STC51单片机开发板A4标准版套餐7目录红外遥控介绍红外线简介红外遥控原理红外发射装置红外接收装置硬件设计实验17红外遥控红外接收头驱动主函数红外遥控介绍红外线简介可见光按波长从长到短排列依次为红橙黄绿青蓝紫，其中红光波
大型语言模型与强化学习的融合：迈向通用人工智能的新范式——基于基础复现的实验平台构建（initial）大模型科普人工智能强化学习
1.引言大型语言模型（LLM）在自然语言处理领域的突破，展现了强大的知识存储、推理和生成能力，为人工智能带来了新的可能性。强化学习（RL）作为一种通过与环境交互学习最优策略的方法，在智能体训练中发挥着重要作用。本文旨在探索LLM与RL的深度融合，分析LLM如何赋能RL，并阐述这种融合对于迈向通用人工智能（AGI）的意义。为了更好地理解这一融合的潜力，我们基于“LargeLanguageModela
强化学习-Chapter2-贝尔曼方程 Rsbs 算法机器学习概率论
强化学习-Chapter2-贝尔曼方程贝尔曼方程推导继续展开贝尔曼方程的矩阵形式状态值的求解动作价值函数与状态价值函数的关系贝尔曼方程推导Vπ(s)=E[Gt∣St=s]=E[rt+1+(γrt+2+…)∣St=s]=E[rt+1+γGt+1∣St=s]=∑a∈Aπ(s,a)∑s′∈SPs→s′a⋅(Rs→s′a+γE[Gt+1∣St+1=s′])=∑a∈Aπ(s,a)∑s′∈SPs→s′a⋅(R
机器学习中的梯度下降是什么意思？ yuanpan 机器学习人工智能
梯度下降（GradientDescent）是机器学习中一种常用的优化算法，用于最小化损失函数（LossFunction）。通过迭代调整模型参数，梯度下降帮助模型逐步逼近最优解，从而提升模型的性能。1.核心思想梯度下降的核心思想是利用损失函数的梯度（即导数）来指导参数的更新方向。具体来说：梯度：梯度是损失函数对模型参数的偏导数，表示损失函数在当前参数点上的变化率。下降：通过沿着梯度的反方向（即损失函
CIR-DFENet：结合跨模态图像表示和双流特征增强网络进行活动识别是Dream呀神经网络计算机视觉人工智能神经网络深度学习
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学业升学和求职工作的先行者！【优惠信息】•新专栏订阅前200名享9.9元优惠•订阅量破200
深度学习-服务器训练SparseDrive过程记录 weixin_40826634 深度学习服务器人工智能
1、cuda安装1.1卸载安装失败的cuda参考：https://blog.csdn.net/weixin_40826634/article/details/127493809注意：因为/usr/local/cuda-xx.x/bin/下没有卸载脚本，很可能是apt安装的，所以通过执行下面的命令删除：apt-get--purgeremove"cuda*"apt-getautoremove然后执行f
基于异构特征融合与轻量级集成学习的软件漏洞挖掘方案设计与Python实现 rockmelodies 信息安全网络安全机器学习集成学习 python 机器学习人工智能
标题：基于异构特征融合与轻量级集成学习的软件漏洞挖掘方案设计与Python实现一、方案设计原理异构特征工程静态特征：基于AST的代码属性图（CPG）解析（使用Joern+NetworkX）动态特征：内存访问模式分析（通过QEMU模拟执行）上下文特征：CWE漏洞模式匹配（集成Semgrep规则引擎）轻量级模型架构
Java全栈开发学习路线：从基础到实战，掌握前后端与数据库，成为全栈软件工程师软件职业规划 java java
1.Java基础Java语法：变量、数据类型、运算符、控制流程（if、switch、循环等）面向对象编程（OOP）：类与对象、继承、多态、封装、抽象类、接口异常处理：try-catch-finally、自定义异常集合框架：List、Set、Map、ArrayList、LinkedList、HashMap等泛型：泛型类、泛型方法、泛型接口IO流：文件读写、字节流、字符流多线程：线程创建、同步、锁、线
机器学习-----决策树多巴胺与内啡肽. 机器学习机器学习决策树人工智能
文章目录1、概念2.决策树的构建过程2.1特征选择2.2树的生成2.3树的剪枝3.决策树的优缺点4.决策树的应用4.1分类任务4.2回归任务4.3集成学习代码示例总结1、概念1.1决策树是什么决策树是通过对样本的训练，建立出分类规则，并对新样本进行预测，属于有监督学习。根节点：最上面的节点。叶子节点：能直接看到结果的节点。非叶子节点：位于中间的节点。1.2决策树的类型分类树：用于分类任务，叶节点代
机器学习驱动的智能化电池管理技术与应用萌萌可爱郭德纲机器学习人工智能
电池管理技术概述电池的工作原理与关键性能指标电池管理系统的核心功能ØSOC估计ØSOH估计Ø寿命预测Ø故障诊断人工智能机器学习基础人工智能的发展机器学习的关键概念机器学习在电池管理中的应用案例介绍人工智能在电池荷电状态估计中的应用荷电状态估计方法概述基于迁移学习的SOC估计(1)基于迁移学习的SOC估计方法数据集、估计框架、估计结果(2)全生命周期下的SOC估计方法数据集、估计框架、估计结果基于数
机器学习_重要知识点整理嘉羽很烦机器学习机器学习
机器学习重要知识点整理一、数学与理论基础1.概率与统计术语作用使用场景概率分布描述随机变量的取值概率，如正态分布、二项分布。数据建模（如高斯分布假设）、生成模型（如贝叶斯网络）。贝叶斯定理计算条件概率，更新先验知识以获得后验概率。贝叶斯分类器、文本分类（如垃圾邮件检测）。最大似然估计（MLE）通过数据最大化似然函数，估计模型参数。线性回归、逻辑回归参数估计。假设检验判断假设是否成立（如t检验、卡方
不多 bb，直接来看Java 全栈面试进阶宝典，保底拿下offer Java程序V Java java 面试 jvm
大家都知道，现在的Java面试是越来越难了！主要原因无非是两个：随着Java这个行业的兴起，不管是在家待业的、对自己现在工作不满意的、大学选错专业的、缺钱的、想自己学的等等这些人绝大部分都是选择了去学习Java！大量人才涌入，导致岗位竞争越来越大，面试也就越来越难！另外一个就是这两年的疫情影响，很多公司都宣布倒闭、裁员。加上互联网行业内卷的推动，面试造火箭工作拧螺丝已经是一个很常见的现象了！最近也
Ruby学习之命令行选项&环境变量 luyaran 原创 Ruby学习之路 Ruby 命令行选项环境变量
这个ruby文件一般呢都是通过命令行来运行的，语法格式如下：ruby[options][.][programfile][arguments...]解释器可以通过下列选项被调用，来控制解释器的环境和行为，来看下具体数据：选项描述-a与-n或-p一起使用时，可以打开自动拆分模式(autosplitmode)。请查看-n和-p选项。-c只检查语法，不执行程序。-Cdir在执行前改变目录（等价于-X）。-
用Python打造智能家居安防系统，让科技守护你的家 Echo_Wish Python 笔记 Python 算法 python 智能家居科技
友友们好！我是Echo_Wish，我的的新专栏《Python进阶》以及《Python！实战！》正式启动啦！这是专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>