笑口常锴

万字综述梳理ChatGPT----一文搞懂弄潮儿ChatGPT技术原理、行业现状、投资前景

本文是笔者自学ChatGPT的总结与思考，类型为综述文章，适合想全面了解ChatGPT或对人工智能感兴趣的小伙伴~~
目录先行，自行找需，全文三万六千余字。分为三大模块，追求效率可跳转感兴趣部分直接开卷。

感谢大佬们以前的写的文章给我提供了素材和思路，欢迎大家转发交流，您的点赞关注收藏是对我最大的鼓励噢，本文为博主原创文章，转载请附上原文出处链接和声明。

文章目录

前言
发展历程
- 行业概况
- 研究现状
技术路径
- 初学者必读10篇论文
- 技术架构详解
- ChatGPT的训练
行业未来和投资机会
- ChatGPT的产业未来
- AIGC商业方向
- 常见问题解答
个人总结
参考资料

前言

随着计算机技术的飞速发展，人工智能已经成为当前最热门的研究领域之一。在人工智能领域中，自然语言处理是一个重要的分支。它研究如何使计算机和人类能够以自然语言的方式进行交流。
新年伊始，你可能会想，人工智能领域最热门的技术是什么？那应该是 ChatGPT。它就像一个六角战士，可以聊天、编写代码、修复错误、创建表单、发表论文、做作业、翻译，甚至是谷歌搜索引擎的有力竞争者。
2022年12月1日，OpenAI推出人工智能聊天原型ChatGPT，ChatGPT是一种由OpenAI开发的预训练语言模型。它能够根据用户的文本输入，产生相应的智能回答。这个回答可以是简短的词语，也可以是长篇大论。其中GPT是Generative Pre-trained Transformer（生成型预训练变换模型）的缩写。它是基于Transformer架构，并使用了大量的文本数据进行训练，以实现对自然语言的理解和生成。ChatGPT具有出色的语法理解能力和语义理解能力，并且能够生成高质量的文本。因此，它被广泛应用于聊天机器人、问答系统、机器翻译等多领域。
近期ChatGPT突然爆火，在2个月内达到1亿活跃用户，是历史上增长最快的消费者应用程序。甚至有懂技术和懂赚钱的商业鬼才利用ChatGPT国内注册和使用的壁垒来赚钱，几天怒赚几百W（慕！），可见ChatGPT对当今风靡的程度。
接下来让我们揭开ChatGPT神秘的面纱吧！

以下是本篇文章正文内容

发展历程

行业概况

ChatGPT是由OpenAI团队研发创造，OpenAI是由创业家埃隆·马斯克、美国创业孵化器Y Combinator总裁阿尔特曼、全球在线支付平台PayPal联合创始人彼得·蒂尔等人于2015年在旧金山创立的一家非盈利的AI研究公司，其总部位于美国加利福尼亚州，并拥有多位硅谷重量级人物的资金支持，启动资金高达10亿美金。OpenAI的使命是使人工智能技术对人类产生积极影响，并帮助人类应对其带来的挑战。
OpenAI的研究方向包括人工智能、机器学习、自然语言处理、强化学习等多领域。该机构拥有一支顶尖的研究团队，并与世界各地的研究机构和企业合作，以推动人工智能技术的发展。
OpenAI 的ChatGPT是生成式人工智能技术（AIGC）。 AI模型可大致分为决策式/分析式AI（Discriminant/Analytical AI）和生成式AI （Generative AI）两类。决策式AI：学习数据中的条件概率分布，根据已有数据进行分析、判断、预测，主要应用模型有用于推荐系统和风控系统的辅助决策、用于自动驾驶和机器人的决策智能体。生成式AI：学习数据中的联合概率分布，并非简单分析已有数据而是学习归纳已有数据后进行演技创造，基于历史进行模仿式、缝合式创作，生成了全新的内容，也能解决判别问题。

ChatGPT爆火的背后是人工智能算法的迭代升级。神经网络的爆发使人工智能广泛应用:2015年左右开始繁荣爆发，神经网络是实现AI深度学习的一种重要算法，是通过对人脑的基本单
元神经元的建模和链接，探索模拟人脑系统功能的模型，并研发出的一种具有学习、联想、记忆和模式识别等具有智慧信息处理功能的
人工系统。典型的应用场景为自然语言处理（NLP）和机器视觉(CV)，其中具有代表的两个模型分别是循环神经网络(RNN)和卷积神经网络(CNN)。
国内外科技巨头都非常重视ChatGPT引发的科技浪潮，积极布局生成式AI，部分公司已有成型产品。

谷歌:面对ChatGPT构成的威胁,谷歌的CEO在公司内部发布“红色警报”。注资3亿美元投资竞品Anthropic公司，同时批准谷歌搜索引擎中加入AI聊天机器人。
微软: OpenAl的最大投资方,开始利用ChatGPT提高产品竞争力，将ChatGPT整合进Bing搜索引擎、Office全家桶、Azure云服务等产品中。
亚马逊：ChatGPT受到重点关注，已广泛运用在各种工作职能中，包括回答面试问题、编写软件代码和创建培训文档。
美国新媒体巨头Buzzfeed宣布计划采用ChatGPT协助内容创作，股价一夜暴涨近120%，两天时间市值飙升3倍。
百度：1月10日，百度宣布将升级百度搜索的“生成式搜索”能力，智能解答用户的搜索提问；2月7日，百度宣布将在3月份完成其ChatGPT产品的内测，面向公众开放，该项目名字为文心一言（ERNIEBot）。
腾讯：2月3日，腾讯公布一项人机对话专利，能够实现机器与用户之间自然且顺畅的沟通。该项专利与这段时间爆火的人工智能聊天机器人 ChatGPT 的原理十分相似。
科大讯飞：科大讯飞在回答投资者提问时表示，科大讯飞有坚实的相关技术积累，多年来始终保持关键核心技术处于世界前沿水平（如科大讯飞于 2022 年获得 CommonsenseQA 2.0、OpenBookQA 等多个认知智能领域权威评测的第一）。且在认知智能领域重点技术和以教育、医疗为代表的专业领域，应用落地效果整体处于业界领先水平。

研究现状

最近大火的ChatGPT的计算逻辑来自于一个算法名字叫Transformer。它来源于2017年的一篇科研论文《Attention is all your need》。Transformer算法在神经网络中具备跨时代的意义。Transformer具备跨时代的意义的原因是算法上添加了注意力机制，这种机制具备突破性的原因在于
1、突破了RNN 模型不能并行计算的限制；
2、相比CNN模型，关联所需的操作次数不随距离增长；
3、模型解释力度明显加强。从结果上看，
根据CDSN数据，Transformer的综合特征提取能力、远距离特征捕获能力、语义特征提取能力，全部明显增强，因此此算法正逐步取代RNN算法，也是ChatGPT算法的底座。

从Transformer提出到GPT的诞生，再到GPT2的迭代标志Open AI成为营利性公司，以及GPT3和ChatGPT的“出圈”；再看产业界，第四范式涉及到多个重要领域比如生物医疗，智能制造纷纷有以Transformer落地的技术产生。

ChatGPT 是基于GPT-3.5（Generative Pre-trained Transformer 3.5）架构开发的对话AI模型，是InstructGPT 的兄弟模型。ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练，或用于收集大量对话数据。
GPT是OpenAI开发的一种预训练语言模型。它采用了Transformer网络结构，并在语言任务领域中具有很高的表现。GPT的主要优势在于它可以通过预训练大量语料数据来获得对语言任务的预测能力，而不需要大量的人工标注数据。它具有良好的语言生成能力，可以生成文本、回答问题、进行对话等多项语言任务。

第一代：从有监督到无监督GPT-1。2018年，OpenAI推出了第一代生成式预训练模型GPT-1，此前，NLP任务需要通过大规模数据集来进行有监督的学习，需要成本高昂的数据标注工作，GPT-1的关键特征是：半监督学习。先用无监督学习的预训练，在8个GPU上花费了1 个月的时间，从大量未标注数据中增强AI系统的语言能力，获得大量知识，然后进行有监督的微调，与大型数据集集成来提高系统在NLP任务中的性能。只需要极少的微调，就可以增强NLP模型的能力，减少对资源和数据的需求。同时，GPT-1也存在明显的问题，一是数据局限性，GPT-1是在互联网上的书籍和文本上训练的，对世界的认识不够完整和准确；二是泛化性依然不足，在一些任务上性能表现就会下降。
第二代：更大更高更强的GPT-2。2019年推出的GPT-2，与GPT-1并没有本质上的不同（注意这一点），架构相同，使用了更大的数据集WebText，大约有40 GB的文本数据、800万个文档，并为模型添加了更多参数（达到惊人的 15 亿个参数），来提高模型的准确性，可以说是加强版或臃肿版的GPT-1。进一步证明了无监督学习的价值，以及预训练模型在下游NLP任务中的广泛成功，已经开始达到图灵测试的要求。
第三代：跨越式进步的GPT-3。2020年，GPT-3的这次迭代，出现了重大的飞跃，成为与GPT-2迥然不同的物种。首先，GPT-3的体量空前庞大，拥有超过 1750 亿个参数，是GPT-2的 117 倍；其次，GPT-3不需要微调，它可以识别到数据中隐藏的含义，并运用此前训练获得的知识，来执行下游任务。这意味着，哪怕从来没有接触过的示例，GPT-3就能理解并提供不错的表现。因此，GPT-3也在商业应用上表现出了极高的稳定性和实用性，通过云上的 API访问来实现商业化。这种入得了实验室、下得了车间的能力，使得GPT-3成为2020年AI领域最惊艳的模型之一。
第四代：基于理解而生成的GPT-3.5 (InstructGPT)。出现了颠覆式的迭代，产生了技术路线上的又一次方向性变化：基于人工标注数据+强化学习的推理和生成。GPT-3虽然很强，但无法理解人类指令的含义（比如写一段博文、改一段代码），无法判断输入，自然也就很难给出高质量的输出答案。所以OpenAI通过专业的标注人员（听说40个博士标注人员）标注了12.7K的样本，给出相应指令/问题的高质量答案，在基于这些数据来调整GPT-3.5的参数，从而让GPT -3.5具备了理解人类指令的能力。在人工标注训练数据的基础上，再使用强化学习来增强预训练模型的能力。强化学习，简单理解就是做对了奖励、做错了惩罚，不断根据系统的打分来更新参数，从而产生越来越高质量的回答，使得模型具备从人类的反馈中强化学习并重新思考的能力，这是一条通向通用人工智能AGI的路径。

学习资料：
ChatGPT怎么变得这么强？华人博士万字长文拆解GPT-3.5
ChatGPT背后的超神模型：GPT-1到GPT-3.5是如何演化的？
一文讲清chatGPT的发展历程、能力来源和复现它的关键之处

技术路径

作为一个大型语言模型，ChatGPT是通过大量的数据和算法训练得到的。下面是大致的技术路径：

数据收集：OpenAI使用大量的网络文章和书籍等数据作为ChatGPT的训练数据，这些数据经过精心筛选和清洗，以确保其质量和可靠性。
自然语言处理技术：对原始数据进行预处理和标记化，使用技术如分词、词性标注、句法分析、实体识别等技术。
机器学习技术：OpenAI使用大量的机器学习算法对数据进行训练，包括深度学习技术如神经网络，递归神经网络等，还包括传统的机器学习算法如支持向量机、决策树等。
算法优化：通过对算法进行改进和优化，以提高模型的性能和准确性。例如，使用更复杂的模型、改进梯度下降算法等。
模型评估：OpenAI使用大量的评估指标来评估我的性能和准确性，以确保ChatGPT可以为用户提供高质量的服务。
持续更新：ChatGPT会不断地进行更新和优化，以提高准确性和性能，同时也会随着时间推移而适应新的数据和技术趋势。

初学者必读10篇论文

我让ChatGPT帮我推荐论文，竟然没有InstructGPT，感觉不是很满意结果，之后我又运用多种方式来提问他，最后选出我认为入门必读的10篇论文。

Transformer

ChatGPT 使用的预训练模型 GPT，而Transformer是GPT的核心组成部分。

Title：Attention Is All You Need
英文摘要

The dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a new simple network architecture, the Transformer, based solely on attention mechanisms, dispensing with recurrence and convolutions entirely. Experiments on two machine translation tasks show these models to be superior in quality while being more parallelizable and requiring significantly less time to train. Our model achieves 28.4 BLEU on the WMT 2014 English-to-German translation task, improving over the existing best results, including ensembles by over 2 BLEU. On the WMT 2014 English-to-French translation task, our model establishes a new single-model state-of-the-art BLEU score of 41.8 after training for 3.5 days on eight GPUs, a small fraction of the training costs of the best models from the literature. We show that the Transformer generalizes well to other tasks by applying it successfully to English constituency parsing both with large and limited training data.

简介

该文章是一篇由Google Brain的研究人员于2017年发表在NIPS会议上的论文。该论文介绍了一种新的神经机器翻译模型Transformer，并且该模型在机器翻译任务上表现出了非常好的性能。Transformer模型使用了self-attention机制来计算输入序列中各个位置之间的依赖关系，避免了传统的循环神经网络模型中需要进行逐步迭代的计算，大大加快了模型的训练速度。在传统的机器翻译模型中，通常使用编码器-解码器（Encoder-Decoder）结构来进行翻译。编码器将输入序列（例如英文句子）转换为一系列隐藏状态，然后解码器使用这些隐藏状态来生成输出序列。在这个过程中，编码器和解码器之间通常使用循环神经网络进行连接。但是，这种结构在长序列的情况下容易产生梯度消失和梯度爆炸等问题，导致模型性能下降。Transformer模型通过引入self-attention机制，避免了循环神经网络的限制。Self-attention机制可以将输入序列中各个位置之间的依赖关系进行并行计算，使得每个位置都可以直接参考输入序列中所有其他位置的信息。这样可以更好地捕捉序列中的长程依赖关系，从而提高模型的性能。
Transformer的主要优点在于它不依赖于传统的循环神经网络，因此具有更高的并行计算能力和更好的处理长序列数据的能力。回到ChatGPT，它是在Transformer架构的基础上进行改进和扩展，并在大量的文本数据上进行预训练，以提高对自然语言的理解能力。ChatGPT使用了两个模型组成：一个用于语言理解，一个用于文本生成。它可以通过输入文本来预测输出文本，并且能够生成高质量的文本。

Transfomer优秀学习资料：
Transformer的细节到底是怎么样的？ - 月来客栈
Transformer模型详解（图解最完整版）

GPT
这是GPT的原始论文，介绍了使用无监督的方式进行预训练的思想，该思想在各种自然语言处理任务上都获得了很好的效果，为ChatGPT的开发提供了基础。 GPT-1的训练分为无监督的预训练和有监督的模型微调，下面进行详细介绍。

Title：Improving Language Understanding by Generative Pre-Training
英文摘要
Natural language understanding comprises a wide range of diverse tasks such as textual entailment, question answering, semantic similarity assessment, and document classiﬁcation. Although large unlabeled text corpora are abundant, labeled data for learning these speciﬁc tasks is scarce, making it challenging for discriminatively trained models to perform adequately. We demonstrate that large gains on these tasks can be realized by generative pre-training of a language model on a diverse corpus of unlabeled text, followed by discriminative ﬁne-tuning on each speciﬁc task. In contrast to previous approaches, we make use of task-aware input transformations during ﬁne-tuning to achieve effective transfer while requiring minimal changes to the model architecture. We demonstrate the effectiveness of our approach on a wide range of benchmarks for natural language understanding. Our general task-agnostic model outperforms discriminatively trained models that use architectures speciﬁcally crafted for each task, signiﬁcantly improving upon the state of the art in 9 out of the 12 tasks studied. For instance, we achieve absolute improvements of 8.9% on commonsense reasoning (Stories Cloze Test), 5.7% on question answering (RACE), and 1.5% on textual entailment (MultiNLI).
简介
该论文提出了一种名为Generative Pre-Training的预训练方法，旨在提高自然语言处理任务中的语言理解能力。这种方法利用了大量的未标记数据来训练模型，这种训练方式被称为预训练。
具体来说，Generative Pre-Training的思路是，利用Transformer等深度神经网络模型，在大规模未标记语料上进行预训练。在预训练中，模型学习使用无监督任务来学习语言表示，例如利用掩码语言模型和下一句预测任务等。在这个过程中，模型可以学习语言中的各种语言知识和语言规则，包括语义、语法、词义等等。这些学习到的知识可以用于后续监督训练的微调，从而提高模型在这些任务上的性能。
Generative Pre-Training方法的优点是，它可以在大规模未标记语料上进行训练，从而可以提高模型的泛化能力。此外，通过预训练，模型可以学习到更为通用的语言表示，可以用于多个自然语言处理任务。

GPT-2
GPT-2的目标旨在训练一个泛化能力更强的词向量模型，它并没有对GPT-1的网络进行过多的结构的创新与设计，只是使用了更多的网络参数和更大的数据集。下面我们对GPT-2展开详细的介绍。

Title：Language Models are Unsupervised Multitask Learners
英文摘要
Natural language processing tasks, such as question answering, machine translation, reading comprehension, and summarization, are typically approached with supervised learning on taskspecific datasets. We demonstrate that language models begin to learn these tasks without any explicit supervision when trained on a new dataset of millions of webpages called WebText. When conditioned on a document plus questions, the answers generated by the language model reach 55 F1 on the CoQA dataset matching or exceeding the performance of 3 out of 4 baseline systems without using the 127,000+ training examples. The capacity of the language model is essential to the success of zero-shot task transfer and increasing it improves performance in a log-linear fashion across tasks. Our largest model, GPT-2, is a 1.5B parameter Transformer that achieves state of the art results on 7 out of 8 tested language modeling datasets in a zero-shot setting but still underfits WebText. Samples from the model reflect these improvements and contain coherent paragraphs of text. These findings suggest a promising path towards building language processing systems which learn to perform tasks from their naturally occurring demonstrations.
简介
GPT-2的学习目标是使用无监督的预训练模型做有监督的任务。该论文使用了无监督学习的方法，通过预先训练来完成多种自然语言处理任务，从而为各种应用场景提供服务。GPT-2的核心思想概括为：任何有监督任务都是语言模型的一个子集，当模型的容量非常大且数据量足够丰富时，仅仅靠训练语言模型的学习便可以完成其他有监督学习的任务。
主要贡献是验证了通过海量数据和大量参数训练出来的词向量模型有迁移到其它类别任务中而不需要额外的训练。但是很多实验也表明，GPT-2的无监督学习的能力还有很大的提升空间，甚至在有些任务上的表现不比随机的好。尽管在有些zero-shot的任务上的表现不错，但是我们仍不清楚GPT-2的这种策略究竟能做成什么样子。GPT-2表明随着模型容量和数据量的增大，其潜能还有进一步开发的空间，基于这个思想，诞生了我们下面要介绍的GPT-3。

GPT1和GPT2对比：
1.GPT1使用了双向Transformer，而GPT2使用了单向Transformer。
2.GPT1通过了两个阶段的微调来适应不同的自然语言处理任务，而GPT2使用了多任务学习来进行微调。
3.GPT1是在BERT模型之前提出的，而GPT2是在BERT模型之后提出的，它使用的是基于Transformer的架构和更多的未标记数据，因此表现更优秀。

学习资料：
GPT-2技术学习（论文+原理+代码）

GPT-3
GPT-3的论文，介绍了使用更大规模的数据和更大规模的模型进行预训练的思想。这些强大能力的能力则依赖于GPT-3疯狂的1750亿的参数量，45TB的Web文本数据以及高达1200万美元的训练费用（行业壁垒这不就来了吗小公司就只能调调API）。

Title：Language Models are Few-Shot Learners
英文摘要
Recent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fine-tuning datasets of thousands or tens of thousands of examples. By contrast, humans can generally perform a new language task from only a few examples or from simple instructions - something which current NLP systems still largely struggle to do. Here we show that scaling up language models greatly improves task-agnostic, few-shot performance, sometimes even reaching competitiveness with prior state-of-the-art fine-tuning approaches. Specifically, we train GPT-3, an autoregressive language model with 175 billion parameters, 10x more than any previous non-sparse language model, and test its performance in the few-shot setting. For all tasks, GPT-3 is applied without any gradient updates or fine-tuning, with tasks and few-shot demonstrations specified purely via text interaction with the model. GPT-3 achieves strong performance on many NLP datasets, including translation, question-answering, and cloze tasks, as well as several tasks that require on-the-fly reasoning or domain adaptation, such as unscrambling words, using a novel word in a sentence, or performing 3-digit arithmetic. At the same time, we also identify some datasets where GPT-3’s few-shot learning still struggles, as well as some datasets where GPT-3 faces methodological issues related to training on large web corpora. Finally, we find that GPT-3 can generate samples of news articles which human evaluators have difficulty distinguishing from articles written by humans. We discuss broader societal impacts of this finding and of GPT-3 in general.
简介
这篇论文探讨了GPT-3在零样本学习（Zero-shot Learning）和少样本学习（Few-shot Learning）任务上的表现，并且对其内部机制进行了分析。在这篇论文中，作者提出了一种新的任务描述方式，称为“Prompt”，它可以指示模型在执行特定任务时应该执行的操作。GPT-3使用这种Prompt描述来解决各种不同的任务，包括文本生成、翻译、问答和代码生成等等。论文还展示了GPT-3在执行零样本学习和少样本学习任务时的惊人表现，它可以通过非常少量的样本数据来完成各种任务，甚至可以完成从未见过的任务。
作者还对GPT-3的内部机制进行了分析，包括了一些基于控制信号的机制，这些机制可以被用于控制模型生成的输出。这些控制信号可以是文本描述，也可以是一些特殊的Token，可以用来控制模型的生成过程，使其生成更加精准、准确的输出。
仅仅用惊艳很难描述GPT-3的优秀表现。首先，在大量的语言模型数据集中，GPT-3超过了绝大多数的zero-shot或者few-shot的state-of-the-art方法。另外GPT-3在很多复杂的NLP任务中也超过了fine-tune之后的state-of-the-art方法，例如闭卷问答，模式解析，机器翻译等。除了这些传统的NLP任务，GPT-3在一些其他的领域也取得了非常震惊的效果，例如进行数学加法，文章生成，编写代码等。
学习资料：
预训练语言模型之GPT-1，GPT-2和GPT-3

5. InstructGPT
虽然现在ChatGPT没有论文发布，但是ChatGPT与Open AI此前发布的InstructGPT具有非常接近的姊妹关系，两个模型的算法原理也非常接近，因此InstructGPT有较为可靠的参考价值。

Title：Training language models to follow instructions with human feedback
英文摘要
Making language models bigger does not inherently make them better at following a user’s intent. For example, large language models can generate outputs that are untruthful, toxic, or simply not helpful to the user. In other words, these models are not aligned with their users. In this paper, we show an avenue for aligning language models with user intent on a wide range of tasks by fine-tuning with human feedback. Starting with a set of labeler-written prompts and prompts submitted through the OpenAI API, we collect a dataset of labeler demonstrations of the desired model behavior, which we use to fine-tune GPT-3 using supervised learning. We then collect a dataset of rankings of model outputs, which we use to further fine-tune this supervised model using reinforcement learning from human feedback. We call the resulting models InstructGPT. In human evaluations on our prompt distribution, outputs from the 1.3B parameter InstructGPT model are preferred to outputs from the 175B GPT-3, despite having 100x fewer parameters. Moreover, InstructGPT models show improvements in truthfulness and reductions in toxic output generation while having minimal performance regressions on public NLP datasets. Even though InstructGPT still makes simple mistakes, our results show that fine-tuning with human feedback is a promising direction for aligning language models with human intent.
简介
该论文介绍了一种新方法，该方法使用人类反馈指导语言模型执行特定任务。在传统的机器学习方法中，通常需要手动为模型标记数据并进行训练。而这篇论文提出的方法则通过与人类合作，让模型通过互动学习任务的执行。
具体来说，该论文提出的方法包括以下几个步骤：
提供指令：系统向模型提供一组指令，要求模型执行某个任务。这些指令可能是自然语言文本，也可能是一系列操作。
模型执行任务：模型根据指令尝试执行任务。
人类提供反馈：人类根据模型执行的结果提供反馈，反馈可以是正面的或负面的。如果模型执行得好，反馈就是正面的，如果模型执行得不好，反馈就是负面的。
模型更新：模型根据人类提供的反馈进行更新，尝试更好地执行任务。
重复以上步骤：系统通过反复执行上述步骤来不断改进模型的性能。
通过以上步骤，该论文提出的方法能够帮助模型更好地理解自然语言指令，从而更好地执行任务。同时，该方法还可以减少人工标注数据的需求，从而提高了训练效率。可以说该论文提出了一种基于互动学习的方法，能够让语言模型更好地执行任务。这一方法在实际应用中具有很大的潜力，可以为语言理解、智能对话等领域带来新的突破。
学习资料：
OpenAI是如何“魔鬼调教” GPT的？——InstructGPT论文解读

BERT
这篇论文提出了一种新的预训练方法——Bidirectional Encoder Representations from Transformers（BERT），是另一个非常流行的自然语言处理模型，也是使用Transformer模型进行预训练的。它为ChatGPT的开发提供了一些启示。

Title：BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
英文摘要
We introduce a new language representation model called BERT, which stands for Bidirectional Encoder Representations from Transformers. Unlike recent language representation models, BERT is designed to pre-train deep bidirectional representations from unlabeled text by jointly conditioning on both left and right context in all layers. As a result, the pre-trained BERT model can be fine-tuned with just one additional output layer to create state-of-the-art models for a wide range of tasks, such as question answering and language inference, without substantial task-specific architecture modifications.
BERT is conceptually simple and empirically powerful. It obtains new state-of-the-art results on eleven natural language processing tasks, including pushing the GLUE score to 80.5% (7.7% point absolute improvement), MultiNLI accuracy to 86.7% (4.6% absolute improvement), SQuAD v1.1 question answering Test F1 to 93.2 (1.5 point absolute improvement) and SQuAD v2.0 Test F1 to 83.1 (5.1 point absolute improvement).
简介
该论文介绍了一种新的自然语言处理模型BERT，旨在改进自然语言处理(NLP)任务中的语言理解能力。BERT采用了双向Transformer编码器，允许模型同时访问输入序列的左右两侧上下文信息，以更好地理解自然语言的含义。为了提高模型的泛化能力，BERT使用了两种预训练方式：Masked Language Model (MLM)和Next Sentence Prediction (NSP)。MLM随机屏蔽输入序列的某些单词，使模型尝试预测被屏蔽的单词。NSP要求模型预测两个句子是否是连续的。BERT在多项NLP任务中取得了最新的最佳结果，如问答、文本分类、自然语言推理等任务。
该论文的贡献在于，提出了一种预训练方法和双向Transformer编码器，以更好地处理自然语言的上下文和语义。BERT成为当时最新的自然语言处理领域的最佳模型之一，其思路和方法也被广泛应用于自然语言处理领域，成为了自然语言处理领域的重要里程碑之一。

RLHF
ChatGPT与 GPT-3 的主要区别在于新加入了被称为 RLHF（Reinforcement Learning from Human Feedback，人类反馈强化学习）的方法，该技术在训练循环中使用人类反馈来最大限度地减少有害、不真实和/或有偏见的输出。基本思想是训练一个额外的奖励模型，从人类的角度评估模型的反应有多好，以指导模型的学习过程。然后使用这个奖励模型使用强化学习对原始语言模型进行微调。

Title：Augmenting Reinforcement Learning with Human Feedback
英文摘要
As computational agents are increasingly used beyond research labs, their success will depend on their ability to learn new skills and adapt to their dynamic, complex environments. If human users — without programming skills — can transfer their task knowledge to agents, learning can accelerate dramatically, reducing costly trials. The TAMER framework guides the design of agents whose behavior can be shaped through signals of approval and disapproval, a natural form of human feedback. More recently, TAMER+RL was introduced to enable human feedback to augment a traditional reinforcement learning (RL) agent that learns from a Markov decision process’s (MDP) reward signal. Using a reimplementation of TAMER and TAMER+RL, we address limitations of prior work, contributing in two critical directions. First, the four successful techniques for combining a human reinforcement with RL from prior TAMER+RL work are tested on a second task, and these techniques’ sensitivities to parameter changes are analyzed. Together, these examinations yield more general and prescriptive conclusions to guide others who wish to incorporate human knowledge into an RL algorithm. Second, TAMER+RL has thus far been limited to a sequential setting, in which training occurs before learning from MDP reward. We modify the sequential algorithms to learn simultaneously from both sources, enabling the human feedback to come at any time during the reinforcement learning process. To enable simultaneous learning, we introduce a new technique that appropriately determines the magnitude of the human model’s influence on the RL algorithm throughout time and state-action space.
简介
我使用ChatGPT的时候其中最令人印象深刻的就是它的保护机制，比如它不会为暴力行动提供建议、也不会为世界杯结果进行预测等等。虽然我用Prompt Injection 攻击撬开过 ChatGPT 的保护方式，但ChatGPT 的开发者也在想方设法提升保护机制。OpenAI 投入了大量的精力让 ChatGPT 更安全，其主要的训练策略采用 RLHF，简单来说，开发人员会给模型提出各种可能的问题，并对反馈的错误答案进行惩罚，对正确的答案进行奖励，从而实现控制 ChatGPT 的回答。
在强化学习中，智能体在与环境交互的过程中，通常需要通过与环境的交互来学习到最优策略。然而，在某些情况下，由于环境太过复杂或任务不够明确，智能体可能无法获得足够的奖励信号来推导出最优策略。因此，该论文提出了一种基于人类反馈的增强学习方法——人类反馈强化学习（Human Feedback Reinforcement Learning，HFRL）。该方法通过人类提供反馈信息，指导智能体学习到更优的策略。同时，为了防止人类反馈过于频繁地干扰学习，该方法还引入了一种基于学习的策略选择（Learning-Based Policy Selection，LBPS）方法，动态平衡人类反馈和自主学习的权衡。实验结果表明，HFRL方法比传统的强化学习方法和其他基于人类反馈的方法在各种任务上都有更好的表现。该论文的研究成果为利用人类反馈指导强化学习提供了一种新的思路和方法，也为将强化学习方法应用于实际应用场景提供了新的可能性。
学习资料：
抱抱脸：ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文
RLHF：基于人类反馈（Human Feedback）对语言模型进行强化学习【Reinforcement Learning from Human Feedback】
How ChatGPT actually works
Why is ChatGPT so good?

Prompt
ChatGPT 训练时的输入使用的是 Prompt（“提示”），Prompt已经被广泛应用于各种自然语言处理任务的模型预训练和微调中。使用Prompt可以有效地指导模型学习特定的语言规则和模式，提高模型的泛化能力，以及提高模型在不同任务上的性能。

Title：Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing
英文摘要
This paper surveys and organizes research works in a new paradigm in natural language processing, which we dub “prompt-based learning”. Unlike traditional supervised learning, which trains a model to take in an input x and predict an output y as P(y|x), prompt-based learning is based on language models that model the probability of text directly. To use these models to perform prediction tasks, the original input x is modified using a template into a textual string prompt x’ that has some unfilled slots, and then the language model is used to probabilistically fill the unfilled information to obtain a final string x, from which the final output y can be derived. This framework is powerful and attractive for a number of reasons: it allows the language model to be pre-trained on massive amounts of raw text, and by defining a new prompting function the model is able to perform few-shot or even zero-shot learning, adapting to new scenarios with few or no labeled data. In this paper we introduce the basics of this promising paradigm, describe a unified set of mathematical notations that can cover a wide variety of existing work, and organize existing work along several dimensions, e.g.the choice of pre-trained models, prompts, and tuning strategies. To make the field more accessible to interested beginners, we not only make a systematic review of existing works and a highly structured typology of prompt-based concepts, but also release other resources, e.g., a website this http URL including constantly-updated survey, and paperlist.
简介
这篇论文是对自然语言处理中预训练模型中提示方法的一次系统调查。自然语言处理中的预训练模型需要在大量的未标记数据上进行训练，以便在特定的任务上进行微调，获得更好的性能。提示方法是一种提高预训练模型性能的技术，它是在输入序列中添加特殊的提示（prompt）或指示语言，以帮助模型更好地理解任务或上下文。论文系统地总结了自然语言处理中使用的各种提示方法，包括单一提示和多提示方法、基于语言模型的提示方法、基于模板的提示方法和基于知识库的提示方法等。此外，论文还讨论了如何选择最佳的提示方法，并分析了提示方法在各种自然语言处理任务中的性能表现。
论文的主要贡献在于系统总结了自然语言处理中提示方法的现状和进展，帮助人们更好地了解提示方法的特点和应用情况。此外，论文还提供了一个框架来比较不同的提示方法，并为未来研究提供了指导。

9.Adam收敛 --On the Convergence of Adam and Beyond–ICLR 2018最佳论文

该论文主要探讨了常用的优化器Adam在训练深度神经网络时可能出现的问题，以及提出了一种新的优化器RAdam（Rectified Adam）来解决这些问题，为ChatGPT中的优化器设计提供了参考。

Title：On the Convergence of Adam and Beyond
英文摘要
Several recently proposed stochastic optimization methods that have been successfully used in training deep networks such as RMSProp, Adam, Adadelta, Nadam are based on using gradient updates scaled by square roots of exponential moving averages of squared past gradients. In many applications, e.g. learning with large output spaces, it has been empirically observed that these algorithms fail to converge to an optimal solution (or a critical point in nonconvex settings). We show that one cause for such failures is the exponential moving average used in the algorithms. We provide an explicit example of a simple convex optimization setting where Adam does not converge to the optimal solution, and describe the precise problems with the previous analysis of Adam algorithm. Our analysis suggests that the convergence issues can be fixed by endowing such algorithms with `long-term memory’ of past gradients, and propose new variants of the Adam algorithm which not only fix the convergence issues but often also lead to improved empirical performance.
简介
这篇论文是由李宏毅等人于2019年提出的一篇论文。该论文主要探讨了常用的优化器Adam在训练深度神经网络时可能出现的问题，以及提出了一种新的优化器RAdam（Rectified Adam）来解决这些问题。Adam优化器是目前深度学习中应用最广泛的一种优化器之一，但在某些情况下会出现性能下降的问题，尤其是对于较大的批次大小（batch size）和高维度的参数空间。RAdam通过引入一个修正项，对Adam进行改进，可以在更广的范围内获得更稳定的性能。该论文的研究结论和RAdam优化器已被广泛应用于各种深度学习任务中。

The Curious Case of Neural Text Degeneration
在神经网络生成文本时，模型通常会在每一步输出一个概率分布，用来表示下一个可能的单词或字符。然而，研究人员发现，有些模型会倾向于在生成过程中不断重复相同的单词或短语，或者输出无意义的字符序列。这种现象被称为“文本退化”，因为生成的文本质量在生成过程中不断降低，最终可能完全无意义。
这篇论文探讨了神经文本生成中的退化问题，并提出了一些解决方案，对于ChatGPT的改进也具有一定的参考意义。

Title：The Curious Case of Neural Text Degeneration
英文摘要
Despite considerable advancements with deep neural language models, the enigma of neural text degeneration persists when these models are tested as text generators. The counter-intuitive empirical observation is that even though the use of likelihood as training objective leads to high quality models for a broad range of language understanding tasks, using likelihood as a decoding objective leads to text that is bland and strangely repetitive.
In this paper, we reveal surprising distributional differences between human text and machine text. In addition, we find that decoding strategies alone can dramatically effect the quality of machine text, even when generated from exactly the same neural language model. Our findings motivate Nucleus Sampling, a simple but effective method to draw the best out of neural generation. By sampling text from the dynamic nucleus of the probability distribution, which allows for diversity while effectively truncating the less reliable tail of the distribution, the resulting text better demonstrates the quality of human text, yielding enhanced diversity without sacrificing fluency and coherence.
简介
在这篇论文中，作者首先介绍了文本生成任务中的一些基本概念和技术，包括循环神经网络（RNN）和变换器（Transformer）等模型。然后，作者详细说明了文本退化问题的出现原因和特点，并提出了一种名为“Top-k采样”的技术，用于缓解文本退化问题。该方法可以在每一步中只考虑前k个可能的单词或字符，从而避免模型倾向于生成重复或无意义文本的问题。作者在多个数据集和任务上验证了这种技术的有效性，证明了它可以显著提高生成文本的质量和多样性。此外，论文还讨论了一些与文本退化问题相关的实际应用，包括机器翻译、对话生成和摘要生成等任务。通过这些应用案例的分析，作者展示了文本退化问题对这些任务的影响，并说明了Top-k采样技术对于解决这些问题的重要性。

补充资料：
关于 ChatGPT 必看的 10 篇论文

技术架构详解

ChatGPT 是一类被称为大型语言模型 (LLM) 的机器学习自然语言处理模型的外推。LLM 消化大量文本数据并推断文本中单词之间的关系。随着我们看到计算能力的进步，这些模型在过去几年中得到了发展。随着输入数据集和参数空间大小的增加，LLM 的能力也会增加。与其他 LLM 一样，ChatGPT 接受过大量不同数据源的培训，例如新闻文章、书籍、网站和社交媒体帖子，以学习语言的模式和结构。
GPT系列它们都是基于 Google 发起的革命性 Transformer 架构，那我们先从 Transformer 架构及其工作原理漫漫讲到RLHF吧。

Transformer
在提出transformer之前，我们使用基于RNN的Encoder-Decoder架构。由于使用了梯度下降，RNN 存在梯度消失的问题，科学家们很难绕过。
Transformer 通过仅使用 Attention 替代 Encoder-Decoder 架构中的 RNN 来避免这个问题。Transformer 的结构与 Encoder-Decoder 类似（见下图）。左侧块是编码组件，由N个编码器堆栈组成，右侧块是解码组件，包含相同数量的解码器堆栈。

Encoder
每个编码器由两个主要层组成：多头自注意力层和前馈层。多头自注意力层使用所有输入向量来生成具有相同维度的中间向量。这个过程混合了所有输入向量的信息。前馈层是完全连接的神经网络，它独立于多头自注意层产生的每个中间向量。通过前馈层后，新向量被向上发送到下一个编码器。

Decoder
每个解码器由三个主要层组成：屏蔽多头自注意层、编码器-解码器自注意层和前馈层。顶层编码器的输出将被转换成一组注意力向量，并馈送到编码器-解码器自注意力层，以帮助解码器关注输入的适当位置。
我们在每个解码器块上重复这个过程。中间向量通过解码器中的前馈层并向上发送到下一个解码器。顶部解码器的输出通过线性层和 softmax 层来产生字典中单词的概率。我们选择概率（分数）最高的词，然后将输出反馈给底部解码器并重复该过程以预测下一个词。

Self-Attention
Self-Attention 给出输入序列的每个元素的权重，表示在序列处理中的重要性。给定权重，我们可以得到我们应该对每个元素给予多少关注的信息。

多头自注意力意味着我们计算多个中间向量并将它们组合在一起以获得与输入向量具有相同维度的新中间向量。Multi-head self-attention 可以让我们从不同的角度得到输入向量之间的关系。

masked multi-head self-attention layer 是指我们在该层中添加一个mask，使模型只能看到序列的受限窗口大小。具体来说，在解码器中，我们只让模型看到之前输出序列的窗口大小，而不是未来输出序列的位置。

GPT-3 架构
GPT-3 仅使用 transformer 的解码组件。每个解码器由两个主要层组成：屏蔽多头自注意力层和前馈层。在最大的 GPT-3 模型中，我们使用了 1750 亿个参数、96 个自注意层、2048 个令牌窗口大小的掩码以及每个多头自注意层的 96 个自注意头。与转换器一样，GPT-3 基于输入和先前生成的标记，一次生成一个标记的输出文本。

GPT-3.5（聊天GPT）
GPT-3.5是GPT-3的微调版本，在GPT-3模型的微调阶段加入了RLHF。

RLHF（人类反馈强化学习）
RLHF 涉及三个主要步骤：预训练语言模型 (LM)、收集数据和训练奖励模型 (RM)，以及使用强化学习微调语言模型。
在 ChatGPT 中，我们使用 GPT-3 的监督微调 (SFT) 版本作为语言模型。
RLHF 中 RM 的目标是给定一个文本序列，RM 可以返回一个应该代表人类偏好的标量奖励。用于训练 RM 的数据通过以下步骤收集。首先，我们从预定义数据集向 LM 提供一组提示，并从 LM 获得多个输出。其次，人工注释者将同一提示的输出从最佳到最差进行排序。第三，RM 使用带注释的提示数据集和 LM 生成的输出来训练模型。
对于强化学习部分，我们首先使用策略梯度 RL PPO（近端策略优化）从第一步复制原始 LM。对于从数据集中采样的给定提示，我们从原始 LM 和 PPO 模型中得到两个生成的文本。然后我们计算两个输出分布之间的 KL 散度。为了计算可用于更新策略的奖励，我们使用 PPO 模型的奖励（即 RM 的输出）减去 λ 乘以 KL 散度。

ChatGPT的训练

ChatGPT 取得惊人成绩的一个重要特点是在训练过程中引入了人类反馈强化学习（RLHF），以更好地捕捉人类的偏好。OpenAI团队从GPT-3.5系列中的一个模型进行微调，使用与 InstructGPT相同的方法，用人类反馈强化学习（RLHF）训练该模型，并对数据收集设置相对做了优化。
ChatGPT模型的训练过程主要分为三个主要阶段：

来源：https://www.hpc-ai.tech/blog/colossal-ai-chatgpt

第一阶段：从 Prompt 库中抽样，收集其人类反应，并使用这些数据微调预训练的大型语言模型。（训练监督策略模型）
GPT 3.5本身很难理解人类不同类型指令中蕴含的不同意图，也很难判断生成内容是否是高质量的结果。
为了让GPT 3.5初步具备理解指令的意图，首先会在数据集中随机抽取问题，由人类标注人员，给出高质量答案，然后用这些人工标注好的数据来微调 GPT-3.5模型（获得SFT模型, Supervised Fine-Tuning）。
此时的SFT模型在遵循指令/对话方面已经优于 GPT-3，但不一定符合人类偏好。

第二阶段：从 Prompt 库中采样，使用大型语言模型生成多个响应，手动对这些响应进行排序，并训练奖励模型 (RM) 以适应人类偏好。（训练奖励模型（Reward Mode，RM））
这个阶段的主要是通过人工标注训练数据（约33K个数据），来训练回报模型。
在数据集中随机抽取问题，使用第一阶段生成的模型，对于每个问题，生成多个不同的回答。人类标注者对这些结果综合考虑给出排名顺序。这一过程类似于教练或老师辅导。
接下来，使用这个排序结果数据来训练奖励模型。对多个排序结果，两两组合，形成多个训练数据对。
RM模型接受一个输入，给出评价回答质量的分数。这样，对于一对训练数据，调节参数使得高质量回答的打分比低质量的打分要高。

第三阶段：基于第一阶段的监督微调模型和第二阶段的奖励模型，使用强化学习算法进一步训练大型语言模型。（采用PPO（Proximal Policy Optimization，近端策略优化）强化学习来优化策略。）

PPO的核心思路在于将Policy Gradient中On-policy的训练过程转化为Off-policy，即将在线学习转化为离线学习，这个转化过程被称之为Importance Sampling。这一阶段利用第二阶段训练好的奖励模型，靠奖励打分来更新预训练模型参数。在数据集中随机抽取问题，使用PPO模型生成回答，并用上一阶段训练好的RM模型给出质量分数。
把回报分数依次传递，由此产生策略梯度，通过强化学习的方式以更新PPO模型参数。
如果我们不断重复第二和第三阶段，通过迭代，会训练出更高质量的ChatGPT模型。

如果想自己等效且低成本复制ChatGPT训练过程，可参考该解决方案Colossal-AI

开源解决方案复制了 ChatGPT 培训过程！只需 1.6GB GPU 内存即可使用，训练速度提高 7.73 倍！

行业未来和投资机会

ChatGPT的产业未来

ChatGPT作为一种聊天机器人模型，具有广泛的应用前景。它可以帮助企业和个人提高工作效率，实现客户服务自动化，并且在保证服务质量的同时节省大量人力成本。同时，ChatGPT可以用于语音识别、智能客服、智能对话系统等多种场景。随着人工智能技术的不断发展，ChatGPT将有望进一步拓展其应用范围，从而为企业和个人带来更多价值。总体来说，ChatGPT有着巨大的产业潜力，是一种有前途的人工智能技术。它将在未来不断发挥重要作用，推动人工智能产业的发展。

2023年2月2日，ChatGPT订阅计划—-ChatGPT Plus发布，目前每月20美元，说明商业化序幕已经拉开。ChatGPT Plus订阅者可获得比免费版本更稳定、更快的响应速度和更高的优先体验权。

ChatGPT+传媒：实现智能新闻写作,提升新闻的时效性。
它可以作为一种智能内容生成工具，帮助制作和编辑人员更快地创建高质量的内容。此外，它还可以作为一种智能客服工具，帮助公司更好地处理客户询问和建议，提高客户满意度。例如，新闻编辑人员可以使用 ChatGPT 来生成新闻摘要和标题，广告公司可以使用它来生成广告文案，在线客服可以使用它来快速回答客户询问。
ChatGPT+营销：打造虚拟客服,赋能产品销售。
它可以作为一种智能内容生成工具，帮助营销人员更快地创建高质量的营销内容。此外，它还可以作为一种智能客服工具，帮助公司更好地处理客户询问和建议，提高客户满意度。例如，营销人员可以使用 ChatGPT 来生成营销电子邮件、社交媒体帖子和广告文案，销售人员可以使用它来快速回答客户询问，从而提高客户对产品和服务的信心。
ChatGPT+娱乐：人机互动加强，激发用户参与热情。
ChatGPT 在娱乐领域具有很多潜在的应用。例如，开发人员可以利用它创建聊天机器人应用程序，以便与用户进行互动，制作更具娱乐性的内容。此外，它还可以作为一种问答智能系统，通过回答用户关于游戏、电影、音乐等方面的问题，来提高用户体验。ChatGPT 可以帮助娱乐公司制作出更具互动性和娱乐性的内容，同时可以帮助他们提高用户体验，增加用户满意度。在未来，随着人工智能技术的发展，ChatGPT 在娱乐领域的应用前景也将非常广阔。
ChatGPT+教育：赋予教育教材新活力，让教育方式更个性化、更智能。
它可以作为一种智能助手，帮助学生更快地获得信息，解决学习中的问题，并且还可以作为一种教学工具，帮助教师更好地控制课堂气氛，提高教学效率。例如，学生可以使用 ChatGPT 获得关于课程内容的实时回答，教师可以使用它来评估学生的学习进度并且提供相应的支持。此外，ChatGPT 还可以通过语音识别和语音合成技术帮助辅助语音处理障碍的学生。
ChatGPT+其他：促进数实共生，助力产业升级。
医疗保健：通过让 ChatGPT 对患者的健康问题进行快速诊断，以帮助医生制定更准确的诊疗计划。
金融：通过让 ChatGPT 回答客户的财务问题，以帮助银行和金融机构提高客户服务质量。
商业：通过让 ChatGPT 回答销售代表的问题，以帮助他们更快地解决客户问题，并提高销售业绩。
制造业：通过让 ChatGPT 回答工程师的问题，以帮助他们更快地解决生产问题。

这些仅仅是 ChatGPT 应用的一些例子，实际上它还可以在其他许多行业得到应用。随着人工智能技术的不断发展，ChatGPT 在不同行业的应用前景也将越来越广阔。

AIGC商业方向

AIGC (Artificial Intelligence for General Computation) 商业方向主要围绕人工智能的应用，具体来说可以有以下几点：

AIGC赋能–搜索引擎
AIGC 技术可以帮助搜索引擎更加智能地理解用户的查询，并返回更准确、更相关的搜索结果。这是因为它可以根据用户的查询历史和语言模式来判断用户的需求，并为其生成相应的回答。例如，如果用户查询“最近有什么好电影”，搜索引擎可以使用 AIGC 技术来识别用户对电影类型、上映日期等的具体要求，并返回相应的搜索结果。此外，AIGC 技术还可以帮助搜索引擎提高其自然语言处理能力，使其能够更好地理解和回答用户的询问。
Microsoft Bing在2009年5月28日由微软推出，截至2013年5月已成为北美地区第二大搜索引擎，加上为雅虎提供的搜索技术支持，必应已占据29.3%的市场份额。Bing同时集成了网页、图片、视频、词典、翻译、资讯、地图等全球信息搜索服务。新版Microsoft Edge功能于2月8日发布，将加入AI聊天和相关写作功能。根据TechCrunch报道，除聊天功能外，这些写作功能可以有效帮助用户对长文章归纳总结提炼重点、对比筛选文章内容以及创造新内容。此外新版BING可以协助用户生成内容，包括电子邮件、规划旅行等。
AIGC赋能–新闻媒体
AIGC 技术也可以应用于新闻媒体。AIGC 技术可以帮助新闻媒体快速生成大量高质量的新闻报道，从而提高新闻媒体的生产效率。此外，AIGC 技术还可以帮助新闻媒体生成个性化的新闻报道，以满足不同读者的需求。例如，如果新闻媒体想要生成关于某地区经济发展情况的新闻报道，它可以使用 AIGC 技术来快速生成大量相关的新闻报道。这些新闻报道可以囊括该地区的经济数据、投资情况、就业情况等方面的信息，以满足读者对该地区经济情况的关注。AIGC 技术的应用于新闻媒体，可以提高新闻媒体的生产效率，同时也可以提供更多、更准确、更个性化的新闻信息，从而更好地满足读者的需求。
AIGC渗透传媒行业各个领域。随着人工智能技术的不断提高，未来它们在传媒行业的应用将更加广泛。
新闻采写：可以帮助新闻媒体快速生成新闻报道，并缩短新闻生成的时间。

编辑：可以帮助编辑快速生成各种类型的文本，如简报、评论等。

广告：可以帮助广告公司快速生成各种类型的广告文本，如广告语、广告标语等。

节目制作：可以帮助电视台和节目制作公司生成节目剧本、对话等内容。

数字内容：可以帮助数字内容公司生成各种类型的数字内容，如微信文章、微博等。
AIGC促进各行业升级转型
AIGC技术不仅仅可以帮助传媒行业，它还有可能帮助其他行业实现升级转型。AIGC在各个行业的优势在于它能够处理和分析大量的数据，做出明智的决策，提高效率，并提供个性化的体验。

常见问题解答

问：如何训练我自己的 ChatGPT 或 GPT-3？如何才能做到这一点吗？

答：当然！这实际上很容易做到。要达到 GPT-3 175B davinci 模型标准（及以上），您需要具备以下条件：
1.培训硬件：使用拥有约 10,000 个 GPU 和约 285,000 个 CPU 内核的超级计算机。如果你买不到它，你可以像 OpenAI 对微软所做的那样，花费他们10 亿美元(USD) 来租用它。
2.人员配备：对于培训，您需要接触世界上最聪明的博士级数据科学家。2016 年， OpenAI 每年向首席科学家 Ilya Sutskever 支付190 万美元(USD)，他们拥有一支 120 人的团队。第一年的人员配置预算可能超过 2 亿美元。
3.时间（数据收集）： EleutherAI 花了整整 12-18 个月的时间来同意、收集、清理和准备 The Pile的数据。请注意，如果 The Pile 只有 ~400B 代币，你需要以某种方式至少四次找到 The Pile 质量的数据才能做出类似于新效率标准的东西，即 DeepMind 的 Chinchilla 70B（1400B 代币），你可能想要瞄准现在几个 TB 就可以胜过 GPT-3。
4.时间（训练）：预计模型需要 9-12 个月的训练，如果一切顺利的话。您可能需要多次运行它，并且可能需要并行训练多个模型。事情确实出错了，它们可能会完全弄乱结果（参见GPT-3 论文、中国的 GLM-130B和Meta AI 的 OPT-175B 日志）。

问：ChatGPT 是否在向我们学习？它有感觉吗？

答：不，2022 年没有语言模型是有感知力/意识的。ChatGPT 和 GPT-3 都不会被视为有感知力/意识。这些模型应该被视为非常非常好的文本预测器（就像你的 iPhone 或 Android 文本预测）。为了响应提示（问题或查询），AI 模型经过训练以预测下一个单词或符号，仅此而已。另请注意，当不响应提示时，AI 模型是完全静态的，没有思想或意识。

问：ChatGPT出来之后，对我们国内相关产业的影响？国内相关的厂商，阿里、百度未来一段时间落地情况？

专家答：关于从国家层面，GPT这个产品推出以后，网信办已经发出了一些政策相关的东西。从国家层面的角度来说，短期内我们很难看到ChatGPT这些产品直接跟国内的应用，或者做比较深度的结合，因为这块不管是基于信息安全，还是国内的一些产业保护的角度来说，国内可能都得需要有这样一个窗口期，得需要有逐步缓冲的时间。所以，国家后续会出台相关的政策，给国内的玩家们提供追赶的时机。从我们之前对百度文心类似产品的使用体验来看，内容的质量上百度文心和ChatGPT差距不是特别大，只是在内容的多样性上有差距。咱们国内研究相关的大模型的，目前主要靠工程人员和研发人员，大概几百号人或者上千号人这么研发，在这个过程中没有引入像OpenAI这种用户反馈机制，没有大量的用户在技术模型的迭代过程中参与进来。所以在内容的多样性上会有所欠缺。第三，可能跟目前实际没有放开政策有关系，就是比如像ChatGPT响应能力，一个Q过去，A回来大概是1-3秒，响应能力比较快。目前百度文心这边我们能够体验到的，大概短的在20秒左右，长的甚至在80秒以上。当然这个不是技术瓶颈问题，需要在模型研发完成以后，我需要在服务器做部署，部署完之后支持数以百万计，甚至数以千万计高并发访问的需求，这块属于常态的部分。
未来3-6个月左右的时间，像百度文心、阿里推出类似于ChatGPT的产品应该可以达到目前ChatGPT60%-70%左右的水平。

参考链接：GPT-3.5 + ChatGPT: An illustrated overview

个人总结

从优缺点的角度简单评价一下ChatGPT吧。
ChatGPT的优点在于其能够生成高质量的文本，并具有出色的语法理解能力和语义理解能力。这使得它能够适用于多种应用场景，例如聊天机器人、问答系统、机器翻译等。
然而，ChatGPT也存在一些缺点。由于它是基于大量文本数据进行训练的，因此它可能会受到数据偏见的影响，导致生成的文本具有偏见性。此外，ChatGPT也不能很好地处理诸如情感分析、推理等复杂任务。还有潜在威胁，如黑客可以利用 ChatGPT的回答教学轻松入侵网络、存在prompt injection问题可泄露信息和可能侵犯知识产权等等问题。
尽管存在一些缺点，ChatGPT仍然是一种非常有前途的技术。它的出色表现和广泛应用场景使其成为人工智能领域内值得关注的一个重要领域。未来，我们可以期待ChatGPT在更多领域得到广泛应用，并在提高生成文本质量、减少数据偏见等方面取得更多进展。直接转NLP了，CV玩不转（doge）

ChatGPT  一个划时代的产品，AI平民化的里程碑

呼~~，终于写完了，接下来要专心备考我的研究生啦，二战路漫漫，小锴常叹叹，祝自己上岸成功，也希望大家各自努力顶峰相见！

笔者水平有限，必定存在问题，欢迎大家交流讨论感谢感谢;

参考资料

1.ChatGPT: https://chat.openai.com
2.国泰君安证券研究。ChatGPT研究框架（2023）
3.华西证券研究所。ChatGPT: 重新定义搜索“入口”AIGC行业深度报告
4.ChatGPT and the Model Behind
5.Illustrating Reinforcement Learning from Human Feedback (RLHF)
6.How ChatGPT Works: The Model Behind The Bot
7.ChatGPT、LLM 和 Foundation 模型——仔细研究炒作和对初创公司的影响
8.ChatGPT发展历程、原理、技术架构详解和产业未来
9.精选的 ChatGPT 演示、工具、文章
10.ChatGPT内核：InstructGPT，基于反馈指令的PPO强化学习
11.万字长文教你如何做出 ChatGPT
+文章中所有提及的链接

欢迎大家交流，您的点赞关注收藏是对我最大的鼓励噢，本文为博主原创文章，转载请附上原文出处链接和声明。

Peace&Love

你可能感兴趣的:(chatgpt,人工智能,深度学习,自然语言处理)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象