无一郎的技术圈

LLM大模型工程入门级知识初探

文章目录

前言
一、Prompt工程
二、模型微调finetune(如multi lora)
三、代码执行Code Interpreter
四、函数支持Function Call
五、外部集成LangChain
六、Embedding与向量数据库VectorDB
- - Embedding Search
  - 向量数据库VectorDB
八、SFT、RLHF、RAG、MultiAgent
- - SFT与RLHF
  - RAG
  - MultiAgent
九、插件(plugin)模式/代理(agent)模式
十、其他
总结

前言

源自脉脉上面刷到的大模型业务工程落地可以做的方向。其实如果不是接触相关工作，有的人可能不会想了解这方面，自己实习做的方向与之相关，因此想调研总结一下行业热点方向与基础入门知识，还有一些的专业词汇的解释。包括但不限于Prompt工程、模型微调finetune(如multi lora)、Code Interpreter、LangChain、VectorDB、SFT、RAG、MultiAgent、Embedding Search、RLHF、DPO、PPO、数据飞轮、推理加速、LLMOps等，感兴趣就都可以了解一下。

一、Prompt工程

之前理解是给大模型加魔法的入口，提示工程（Prompt Engineering，简称 PE），是通过一些技巧和手段，让模型可以输出更准确、更相关、且更容易被下游代码处理的内容的过程。GPT 是 Generative Pre-trained Transformer 的缩写，是 OpenAI 开发的大语言模型。它将文本视为一个 token 序列，预测序列下一个可能出现的token 。因为模型不能理解知识，只是在尝试输出序列，所以一个好的引导词，能够在不需要调节模型参数的基础上，产生更接近理想的输出，并且可以节省token占用(更省钱)。常见的一些技巧：如CoT（Chain of Thought）/ Few or Zero-Shot CoT / In-Context Learning（ICL）/ PAL（Program-aided Language models）/ Self-Consistency等, 此外还要注意模型幻觉、数学运算差和注入安全问题以及对应的解决方案。
一套适用于工程场景的框架be like：背景、角色、指令、输出。
另外openAi关于prompt的有专门的介绍，参考官方的cooking book以及问答实践专区
https://platform.openai.com/docs/introduction
https://help.openai.com/en/collections/3675942-prompt-engineering

二、模型微调finetune(如multi lora)

可以思考一下大模型和传统机器学习或者深度学习解决nlp问题的区别，为什么有的场景就推荐用LLM来解决。个人觉得openAi家的数据与资源是强大的，普适性强，涉及范围广，有些场景不需要我们从头训练，用人家的预训练模型，在我们的工程业务场景上面进行finetune(微调)，能够降低成本更快速并且输出更接近理想的结果。
并且传统的nlp也存在一些问题：（1）这些任务都需要大量的标注数据进行训练才有不错的模型效果，但针对特定任务的高质量标注数据难以获取，通常都需要花费大量的人力物力才能得到数量不多的有效数据；（2）而且某一个任务训练的模型很难泛化到其它任务中；（3）更重要的是在目前的互联网上有海量的文本，只是这些文本是没有针对特定任务做标注的，被称为无标注文本，很难将这些文本应用到特定任务的训练，这未免有些遗憾和浪费。
大模型的出现弥补了传统nlp的这些不足，它可以通过生成方式进行零样本自监督学习。
大模型微调有一些相关的策略，比如有名的低秩自适应（LoRA）方法、量化(Quantization）QLoRA、Adapter、prompt-tuning等。
参考下面的链接，里面有详细描述
https://zhuanlan.zhihu.com/p/644122818?utm_id=0
https://zhuanlan.zhihu.com/p/650287173
https://zhuanlan.zhihu.com/p/627642632?utm_id=0
https://zhuanlan.zhihu.com/p/669865795

三、代码执行Code Interpreter

代码解释器（Code interpreter），模型内置一个代码解释器，赋予其执行代码的能力。代码解释器（Code Interpreter）可以让普通用户（非程序员）用自然语言完成以前需要写代码来完成的复杂工作。比如使用 Python 进行编程，chatGPT模型内置一个沙箱解释器，可以运行Python代码。我们也可以给自研模型平台定制化开发Code Interpreter，方便业务侧使用来执行代码并分析。这就意味着不需要程序员对象，你也能随时随地拥有自动化编程助手。通过代码解释器，用户可以解决定量和定性的数学问题、进行数据分析和可视化，在不同文件格式之间进行转换。它功能强大有便捷之处，但是同时也有一些限制需要注意。
参考官方API https://platform.openai.com/docs/assistants/tools/code-interpreter
https://zhuanlan.zhihu.com/p/643192667
https://zhuanlan.zhihu.com/p/643024084
https://baijiahao.baidu.com/s?id=1771907200390315425&wfr=spider&for=pc

四、函数支持Function Call

这个功能是在23年6月份推出的，Chat Completions API新增了函数调用功能，让 GPT 模型拥有调用外部接口的能力。从人机交互上来说， Function Call 本质上实现了准确识别用户的语义，将其转为结构化的指令输出，以便与工程代码更好衔接。其他意义理解：
OpenAI的function call功能，相当于开放了自定义插件的接口。
通过接入外部工具极大的改善了模型幻觉(一本正经的胡说八道)问题。
一定程度上缓解了数据安全问题，私有数据可以尽量自行处理。
参考https://sspai.com/post/81986
https://zhuanlan.zhihu.com/p/656786574
https://zhuanlan.zhihu.com/p/638089428?utm_id=0
http://www.ai2news.com/blog/3058639/
GPT4新特性：Assistant + FunctionAll + Retrieval

博文参考地址 https://zhuanlan.zhihu.com/p/666198140
https://www.zhihu.com/question/629324504/answer/3283601731?utm_id=0
https://baijiahao.baidu.com/s?id=1781875118264816313&wfr=spider&for=pc

其实后续Chat Completion接口的API里面这个Function Call标识为Deprecated废弃了，取而代之的是tools和toolChoice，也就是支持更广义上调用外部的工具接口，只不过目前这个工具局限于function.参考https://platform.openai.com/docs/api-reference/chat/create

补充介绍：
LLM支持多种模型接口，比如 OpenAI、Hugging Face、AzureOpenAI等，FunctionCall在不同API里面的格式可能也不一样。之前在研究接入GPT-4V模型的时候，其API接口也有openAi官方和微软Azure的不同实现，之前它们传输请求body格式是有差别的，不过目前看来是对齐了。个人理解微软自从收购OpenAi以后两者产品侧应该都会趋于统一吧：

1.openAi的4V模型API
参考https://platform.openai.com/docs/guides/vision
请求body如下（示例）：

from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
  model="gpt-4-vision-preview",
  messages=[
    {
      "role": "user",
      "content": [
        {"type": "text", "text": "What’s in this image?"},
        {
          "type": "image_url",
          "image_url": {
            "url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg",
          },
        },
      ],
    }
  ],
  max_tokens=300,
)

print(response.choices[0])

2.Azure的4V模型API
参考https://learn.microsoft.com/en-us/azure/ai-services/openai/how-to/gpt-with-vision
https://techcommunity.microsoft.com/t5/ai-azure-ai-services-blog/gpt-4-turbo-with-vision-is-now-available-on-azure-openai-service/ba-p/4008456
请求body如下（示例）：

{
    "messages": [ 
        {
            "role": "system", 
            "content": "You are a helpful assistant." 
        },
        {
            "role": "user", 
            "content": [
	            {
	                "type": "text",
	                "text": "Describe this picture:"
	            },
	            {
	                "type": "image_url",
	                "image_url": {
                        "url": ""
                    }
                } 
           ] 
        }
    ],
    "max_tokens": 100, 
    "stream": false 
}

五、外部集成LangChain

LangChain是一个基于大语言模型（LLM）用于构建端到端语言模型应用的框架，它可以让开发者使用语言模型来实现各种复杂的任务，例如文本到图像的生成、文档问答、聊天机器人等。
相当于java里面的Spring框架， LangChain能够极大方便LLM相关的开发，结合了对接多种场景的工具，并且可以外部数据源进行连接，实现了开箱即用。
LangChain是一个让你的LLM变得更强大的开源框架。LangChain 就是一个 LLM 编程框架，你想开发一个基于 LLM 应用，需要什么组件它都有，直接使用就行；甚至针对常规的应用流程，它利用链(LangChain中Chain的由来)这个概念已经内置标准化方案了。
一个鹦鹉的图标，很贴合其大语言模型层面上的强大能力支持，gitHub上很火，star很多。
LangChain+LLM实战—LangChain中的6大核心模块

目前围绕 LangChain 框架核心模块主要有六个，包括模型输入输出（Model I/O）、数据连接（Data Connection）、链（Chains）、记忆（Memory）、代理（Agents）和回调（Callbacks）。下面是它们各自的作用：
（1）模型输入输出模块提供了语言模型和大语言模型的接口，可以将文本格式化为模型输入。
（2）数据连接模块提供了文档加载器和文档转换器等工具，用于将非结构化文本转换为可处理的数据。（3）链模块提供了各种类型的链，如基础链、路由链和顺序链等，用于组合和连接不同的功能。（4）记忆模块用于在链之间存储和传递信息，实现对话的上下文感知能力。（5）代理模块通过使用 LLM 来自动决策和执行动作，完成任务。（6）回调模块提供了连接到 LLM 申请的各个阶段的功能，用于日志记录、监控和流传输等任务。
这些模块的组合可以构建复杂的链式模型，实现各种自然语言处理任务。扩展参考下面链接：
https://it.sohu.com/a/712738865_100093134
http://www.bryh.cn/a/605001.html
https://sg-info.cn/article/show/20104
https://cloud.tencent.com/developer/article/2324297
LangChain六大主要领域：
（1）管理和优化prompt。不同的任务使用不同prompt，如何去管理和优化这些prompt是langchain的主要功能之一。
（2）链，初步理解为一个具体任务中不同子任务之间的一个调用。
（3）数据增强的生成，数据增强生成涉及特定类型的链，它首先与外部数据源交互以获取数据用于生成步骤。这方面的例子包括对长篇文字的总结和对特定数据源的提问/回答。
（4）代理，根据不同的指令采取不同的行动，直到整个流程完成为止。
（5）评估，生成式模型是出了名的难以用传统的指标来评估。评估它们的一个新方法是使用语言模型本身来进行评估。LangChain提供了一些提示/链来协助这个工作。
（6）内存：在整个流程中帮我们管理一些中间状态。
总的来说LongChain可以理解为：在一个流程的整个生命周期中，管理和优化prompt，根据prompt使用不同的代理进行不同的动作，在这期间使用内存管理中间的一些状态，然后使用链将不同代理之间进行连接起来，最终形成一个闭环。

官网https://www.langchain.com
github https://github.com/langchain-ai
参考https://zhuanlan.zhihu.com/p/640936557
https://www.langchain.com.cn
https://blog.csdn.net/qq_41893274/article/details/131753839
https://blog.csdn.net/weiwosuoai/article/details/131746043
https://www.bilibili.com/read/cv25833410/

六、Embedding与向量数据库VectorDB

Embedding Search

注意它不同于ElasticSerach构建倒排全文索引的方式，Embedding搜索也不能代替文本搜索，很多时候可以构建二者结合的混合检索，提升召回率。
https://www.zhihu.com/question/623402588/answer/3299162698
嵌入（Embedding）是一种将离散的符号（如词语、字符或文档）映射到连续向量空间的表示方法。它将离散的符号转换为实数向量，从而使得计算机可以更好地处理和理解文本数据。
OPENAI提供内置的Embedding api，可以直接使用。
回顾一下Vector，其实它也就是我们在高中数学或者大学数学里学到的向量，只不过维度比当时的直角坐标系里的二维多一点而已（或许多到了 512 维）。在许多学术论文中，你可能更熟悉它的另一个名字 —— 嵌入（Embedding）。为了实现我们前面提到的超级大脑，我们首先需要让这个大脑理解各种信息，而这就是嵌入的作用。
比如你正在看一部电影，你的大脑会自动将电影中的人物、情节、对话等信息转化为你可以理解的形式。这就是一种嵌入的过程。同样，我们也可以让计算机做类似的事情，将各种类型的数据转化为它可以理解的形式，而计算机接受的也就是数字，也就是向量。回顾一下高中数学就好了，二维向量可以表征一个直角坐标系里的每个点，也就表征了这个直角坐标系里的所有信息了。那如果我们把维度无限拉大，他就可以表征无限多的信息。你可能在一些科幻电影中看到过，说高等生物可能不会像我们一样以三维的肉体存在，他们可能存在于更高的维度。比如时间就是第四维，跳脱之后就变成了四维生物。这其实就说明了为什么嵌入可以更好的理解这个世界，一串数字可以帮助计算机理解世界之后。那么如何将数据转换为向量呢？这就要靠我们在 AI 界做出的进步了，我们研究出了很多模型，可以将任意类型的数据映射到一个高维空间中，也就是变成01编码表示，生成一个向量，这个向量就是数据的嵌入表示。
嵌入方法有很多种，例如文本嵌入（text embedding），可以将文字转换为向量；图像嵌入（image embedding），可以将图片转换为向量；音频嵌入（audio embedding），可以将声音转换为向量；视频嵌入（video embedding），可以将视频转换为向量；甚至还有多模态嵌入（multimodal embedding），可以将不同类型的数据转换为同一个空间中的向量，比如一个电影包含声音和画面，那如果要更全面的表征这个电影，我们就需要结合音频嵌入和视频嵌入，也就是多模态嵌入了。

向量数据库VectorDB

它是一种新型的数据库，它新在它存的是 Embeddings（嵌入）。这个新并不是为了新而新，从传统的直接存储内容转到存储向量，让它变得更聪明，更强大。LLM 有的一些挑战，例如缺乏领域知识，缺乏长期记忆，缺乏事实一致性等。Vector DB 就像是给 LLM 提供了一本百科全书，让 LLM 可以根据用户的查询，在 Vector DB 中检索相关的数据，并根据数据的内容和语义来更新上下文，从而生成更相关和准确的文本。这样，LLM 就可以拥有一个长期记忆，可以随时获取最新和最全面的信息，也可以保持事实一致性和逻辑连贯性。
向量数据库是一种专门用于存储和处理向量的数据库。向量数据库使用专门的算法和数据结构来支持相似性搜索，通常用于机器学习或数据挖掘，侧重于性能、可扩展性和灵活性。向量数据库可以帮助 AI 模型理解和储存长期记忆等问题，以完成复杂的任务，加速应用场景落地。
传统的Mysql或者Redis存储结构化数据，当下非结构化数据呈爆炸式增长，而我们可以通过机器学习模型，将非结构化数据转化为 embedding 向量，随后处理分析这些数据。在此过程中，向量数据库应运而生。向量数据库是一种为了高效存储和索引 AI 模型产生的向量嵌入（embedding）数据而专门设计的数据库。
之前接触到有些关联的数据构建社交网络与知识图谱等，可以利用图数据库进行存储更详细的信息，查询的时候也是通过构建高维（比如1048维）向量去查询的。
VectorDB也是一个比较火的研究方向，有些业务场景也需要定制化构建自己的向量数据库，向量数据库可以为模型提供依赖的基础知识(knowledge)库，有些向量数据库是开源的，方便我们进行直接接入，足够丰富的知识数据库也可以减少模型幻觉的产生。
之前接入业务的搜索召回场景的时候，排查时先查Embdedding是否存在于Embdedding数据库里面，这样查询的速度会很快，如果存在则继续查询图数据库以获取更详细的关系网络数据。
参考https://zhuanlan.zhihu.com/p/660355752
https://zhuanlan.zhihu.com/p/664747312
https://zhuanlan.zhihu.com/p/667534584
https://developer.aliyun.com/article/1298800
https://blog.csdn.net/woohooli/article/details/130742180

八、SFT、RLHF、RAG、MultiAgent

SFT与RLHF

监督微调（SFT）& 强化学习（RLHF）它们都属于大模型的微调部分的概念，可以了解一下Pre-trained,Post-training,finetune的区别 https://zhuanlan.zhihu.com/p/596556459?utm_id=0
从参数规模的角度，大模型的微调分成两条技术路线：
一条是对全量的参数，进行全量的训练，这条路径叫全量微调FFT(Full Fine Tuning)。
一条是只对部分的参数进行训练，这条路径叫PEFT(Parameter-Efficient Fine Tuning)。
FFT的原理，就是用特定的数据，对大模型进行训练，将W变成W，W相比W ，最大的优点就是上述特定数据领域的表现会好很多。
但FFT也会带来一些问题，影响比较大的问题，主要有以下两个：
一个是训练的成本会比较高，因为微调的参数量跟预训练的是一样的多的；
一个是叫灾难性遗忘(Catastrophic Forgetting)，用特定训练数据去微调可能会把这个领域的表现变好，但也可能会把原来表现好的别的领域的能力变差。
PEFT主要想解决的问题，就是FFT存在的上述两个问题，PEFT也是目前比较主流的微调方案。
从训练数据的来源、以及训练的方法的角度，大模型的微调有以下几条技术路线：
一个是监督式微调SFT(Supervised Fine Tuning)，这个方案主要是用人工标注的数据，用传统机器学习中监督学习的方法，对大模型进行微调；
一个是基于人类反馈的强化学习微调RLHF(Reinforcement Learning with Human Feedback)，这个方案的主要特点是把人类的反馈，通过强化学习的方式，引入到对大模型的微调中去，让大模型生成的结果，更加符合人类的一些期望；
还有一个是基于AI反馈的强化学习微调RLAIF(Reinforcement Learning with AI Feedback)，这个原理大致跟RLHF类似，但是反馈的来源是AI。这里是想解决反馈系统的效率问题，因为收集人类反馈，相对来说成本会比较高、效率比较低。
不同的分类角度，只是侧重点不一样，对同一个大模型的微调，也不局限于某一个方案，可以多个方案一起。微调的最终目的，是能够在可控成本的前提下，尽可能地提升大模型在特定领域的能力。大模型训练需要 “广”、“齐”、“专”的数据。大模型所需要的数据根据训练的阶段有所不同。以ChatGPT为代表的自然语言大模型为例，其训练过程分为预训练、监督微调（SFT）、基于人类反馈的强化学习（RLHF）三个阶段。
第一阶段预训练所需的语料是各种类型的世界知识，包括网页、书籍、新闻、论文期刊、对话文本、代码等形式，通过大量学习世界知识，构建模型的基础能力，使得模型能够“漂亮地说话”。该阶段的语料特征可以概括为“广“。
第二阶段SFT，通过标注人员设计问答，编写正确答案，将例题投喂给模型，并希望模型在没有见过的任务中"举一反三"，提升泛化能力。
第三阶段RLHF，训练目标是让模型的价值观与人类对齐，需要人类对模型的回答进行打分、排序，让模型知道"怎么说更好"。第二和第三阶段的数据质量要求较高，需要来自人类的高质量反馈，语料特征可以概括为“齐“。
如果将模型微调后部署应用于特定的场景形成行业大模型（如工业、金融、医疗等），则需要满足该场景专业需求的特定领域知识做预训练和SFT，需要具备一定专业深度，如行业数据库、专业文档、专业网站等，这部分的语料特征是“专”。
https://baijiahao.baidu.com/s?id=1771636050471546897&wfr=spider&for=pc
https://www.163.com/dy/article/IMJHGR8M0511DDOK.html
https://zhuanlan.zhihu.com/p/650287173?utm_id=0

RAG

检索增强生成（RAG）算是大模型时代的hello world项目了，开源方案基本都是文章切块+向量召回+llm生成，是近期几个大模型应用方向上最难下笔的一个，一方面是因为技术方案仍在快速迭代；另一方面是市场对它的认知还存在一定偏差。目前市场认为：chatBI（让大模型做数据查询和分析）很有用但是有难度；Agent（让大模型自助规划任务实现用户复杂的需求）虽然很酷炫，但是落地的应用少，不够成熟。而对于RAG，企业都很明确它的价值，并且技术实现上，一顿组合拳疯狂输出（文本切割+向量数据库+大模型）就能解决问题，是企业落地的不二之选。并且博主说RAG到最后也会是走向Agent。
RAG最直接的优势就是能够让大模型利用自身的逻辑推导能力，去理解企业私有数据，实现问答能力的拓展。但是如果给大模型喂企业私有数据，做模型微调，也能实现同样的效果，为什么还要用RAG呢，还要看场景：第一：私有数据存在一定频率的动态更新的；第二：需要给出引用原文的；第三：硬件资源（GPU）不是太充足的（即使用RAG也需要微调，但一次微调处处可用，远比每个企业私有库微调一个模型成本低的多）；这些场景下，用RAG更合适一些。
大模型存在知识的局限性、幻觉、安全性的问题，RAG是一个很好的解决方案。简单来讲，RAG就是通过检索获取相关的知识并将其融入Prompt，让大模型能够参考相应的知识从而给出合理回答。因此，可以将RAG的核心理解为“检索+生成”，前者主要是利用向量数据库的高效存储和检索能力，召回目标知识；后者则是利用大模型和Prompt工程，将召回的知识合理利用，生成目标答案。所以完整的RAG应用流程主要包含两个阶段：
数据准备阶段：数据提取——>文本分割——>向量化（embedding）——>数据入库
应用阶段：用户提问——>数据检索（召回）——>注入Prompt——>LLM生成答案

大模型优化选择RAG还是微调。RAG训练成本低于微调，但是对特定需求可能不是很准确。
如果我们需要倾向于获取外部知识并重视透明度，RAG 是我们的首选。另一方面，如果我们使用稳定的标记数据并旨在使模型更接近特定需求，那么微调是更好的选择。
https://blog.csdn.net/qq_41929396/article/details/132689632

参考下面这些博主的链接：https://www.zhihu.com/question/625481187/answer/3279041129
https://baijiahao.baidu.com/s?id=1777552477953877304&wfr=spider&for=pc
https://mp.weixin.qq.com/s?__biz=MzkxNjYxMjUwMA==&mid=2247484519&idx=1&sn=55a9fa5107d3b69a019db36703b86538&chksm=c14c709cf63bf98a615255cb55041338eaaa024066f721c9c81456c99eaf8f423ae27a56fa8a&token=1160261652&lang=zh_CN#rd

MultiAgent

从Function Calling到Agent
2023年6月13号，openAI宣布除了降价、扩展Prompt长度之外，另一个更新就是：增加Function Calling能力。只需要将待调用的函数描述（功能、参数等描述）传给ChatGPT，它就可以自动实现函数的选择、参数的解析。问题内容命中了哪个函数会影响最终输出。
随着函数的爆炸式增长、随着一个请求的复杂度提升、随着对话轮次的增多，我们需要解决的问题也许不属于Function Calling，而是Agent 。
大模型除了对话，还有一个应用场景就是Agent，并且OpenAI、微软押注，大模型应用的尽头是AI Agent。Agent = 大型模型 + 记忆 + 主动规划 + 工具使用
Agent 由于更加强调自主的发现问题、确定目标、构想方案、选择方案、执行方案、检查更新的特性，因此可以被认为是一类拥有“自主智能的实体”，而被广泛称之为智能体。
基于 Prompt 的与大模型互动的方式更像是静态的“输入-输出”，而 AI Agent 为大模型提供了一个进行“动态决策”的框架，使得大模型开始有能力处理任务更加复杂化，情境更加多样化的决策，为大模型从“语言”迈向“真实世界”提供了一个坚实的基础。
以AutoGPT为代表，Agent能根据用户的语言请求进行任务拆解规划，从而多轮次调用不同的工具，来实现最终的目标。
大模型充当一个“核心协调器”的作用，向上对接人类的以 Prompt 为形式的输入，向下则以网络搜索，Python 脚本等为媒介沟通互联网或自动化实验仪器等工具，从而可以自主完成从实验设计、实验规划到执行复杂的科学实验等的一整套流程。基于大模型的 AI Agent 是一套面向 LLMs 的“新的管理方法”，类似“思维链”等技术，大模型 Agent 通过一整套流程化，机制化的方式促使大模型模拟人类智能的决策过程，以代替人类完成一些具体的任务。
参考地址 https://baijiahao.baidu.com/s?id=1781584417814332210&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1776841141621211217&wfr=spider&for=pc
Multi-Agent系统(MAS)是多个Agent组成的集合，其多个Agent成员之间相互协调，相互服务，共同完成一个任务。它的目标是将大而复杂的系统建设成小的、彼此互相通信和协调的，易于管理的系统。各Agent成员之间的活动是自治独立的，其自身的目标和行为不受其它Agent成员的限制，它们通过竞争和磋商等手段协商和解决相互之间的矛盾和冲突。MAS主要研究目的是通过多个Agent所组成的交互式团体来求解超出Agent个体能力的大规模复杂问题。
Multi-Agent(多智能体系统) 是指由多个自主个体组成的群体系统，其目标是通过个体间的相互信息通信和交互作用。这个概念从其他地方引入LLM领域，一般地，Multi-Agent由一系列相互作用的Agent及其相应的组织规则和信息交互协议构成，内部的各个Agent之间通过相互通信、合作、竞争等方式，完成单个Agent不能完成的，大量而又复杂的工作，是“系统的系统”。
随着LLM的涌现，以LLM为中枢构建的Agent系统在近期受到了广泛的关注。Agent系统旨在利用LLM的归纳推理能力，通过为不同的Agent分配角色与任务信息，并配备相应的工具插件，从而完成复杂的任务。“Tool Learning”的概念，将之前的各种垂直领域的智能体放置于一个统一的框架之下，其中大模型作为“控制器”，用于完成针对人类的“意图识别”，针对可选工具的“组织规划”，并且引入了“感知器”向大模型报告“执行结果”，当出现错误时指导大模型完成“自主纠错”。
目前更常见的框架大多聚焦于single-agent的场景。single-agent的核心在于LLM与工具的配合。LLM通过理解用户的任务，推理出需要调用的工具，并基于调用结果给用户反馈。在完成任务的过程中，Agent可能与用户有多轮交互。下图即展示了一个主流的Agent执行流程。
与此同时，也有越来越多的Agent框架开始聚焦于multi-agent场景。为了完成任务，multi-agent会为不同的Agent赋予不同的角色定位，通过Agent之间的协同合作来完成复杂的任务。而在完成任务的过程中，相比于single-agent来说，与用户的交互会更少一些。

参考魔搭社区 https://zhuanlan.zhihu.com/p/660045220
参考 https://blog.csdn.net/wireless_com/article/details/133849992
参考这位博主链接：https://zhuanlan.zhihu.com/p/665379116

九、插件(plugin)模式/代理(agent)模式

记得之前在面试通义大模型团队的时候，达摩院的三面面试官老哥问了一个问题，你觉得工程上插件(plugin)模式/代理(agent)模式有什么区别以及它们各自的适用场景是什么。我当时其实是不理解这两个概念的。现在想着顺带着反思学习一下。有时候确实会在面试的时候了解到很多新东西，当然真正的大佬是感受不到春招和秋招难度的，也不需要很多面试，只有水平不上不下的那种躺不平+不甘心的菜鸡才会发小作文回味一下(很嫌弃)。
软件架构的10个常见模式：https://zhuanlan.zhihu.com/p/62602256
架构模式是针对特定软件架构场景常见问题的通用、可重用解决方案。架构模式类似于软件设计模式，但范围更广。 GPT对于工程上的插件(plugin)模式/代理(agent)模式解释是这样的：

其他资料参考 https://blog.csdn.net/amuseme_lu/article/details/134819096

十、其他

大模型的演化过程，发展史：https://zhuanlan.zhihu.com/p/653169604
不同的GPT版本都经历了什么变化：https://www.zhihu.com/question/618248545?utm_id=0
https://cloud.tencent.com/developer/article/2244774
https://baijiahao.baidu.com/s?id=1777087208998184071&wfr=spider&for=pc

2023年北京时间11月7日，OpenAI首届开发者大会(春晚)上奥特曼提出的GPT-4 Turbo模型里面包括了Assistant，顺便分析一下Function Call和Assistant的区别，Assistant像一个机器人做代理，FunctionCall更偏向通用函数工具调用接口。

DPO、PPO
近端策略优化(PPO)与直接偏好优化(DPO) ，两者都属于强化学习算法，RLHF阶段可以用到，具体参考下面链接
https://zhuanlan.zhihu.com/p/614115887?utm_id=0
https://zhuanlan.zhihu.com/p/655421669
https://www.163.com/dy/article/IK65NK0M0511831M.html
https://zhuanlan.zhihu.com/p/662753985

数据飞轮：
数据飞轮，是今年大模型带火的一个典型词汇，通过客户在应用程序中输入的提示词这样的数据反馈，使大模型快速迭代。今年初，数据飞轮也曾一度被视为 OpenAI 最重要的先发优势。
https://baijiahao.baidu.com/s?id=1777565035295068044&wfr=spider&for=pc
https://baijiahao.baidu.com/s?id=1777470507609172599&wfr=spider&for=pc

推理加速：
模型优化技术的相关知识，如量化、剪枝、知识蒸馏等并行化&分布式也可以
硬件上模型推理依靠算力，经常听到 X机X卡60B(B应该是参数量数据量的意思）这样的概念
参考https://www.zhihu.com/question/591646269/answer/3313928970

Pipeline & Workflow
Pipeline往往具有明确的输入输出,关注的是数据的流通;而Workflow则相对边界模糊,关注的是人的协作。Workflow 意味着有多个阶段, 通常部分阶段需要人工去进行一些处理, 可能是分支状或者网格状的一个迭代过程.Pipeline 是一个一条路走到黑的自动执行过程, 线状的流程.
https://www.163.com/dy/article/FE727GCP0516BJGJ.html
https://www.jianshu.com/p/71a0efa741e6

LLMOps
术语 LLMOps 代表大型语言模型运维。它的简短定义是 LLMOps 是 LLM 的 MLOps。这意味着 LLMOps 是一组工具和最佳实践，用于管理 LLM 支持的应用程序的生命周期，包括开发、部署和维护。
当我们说“LLMOps 是 LLM 的 MLOps”时，我们需要先定义术语 LLM 和 MLOps：
LLM（大型语言模型）是可以生成人类语言输出的深度学习模型（因此称为语言模型）。这些模型有数十亿个参数，并接受了数十亿个单词的训练（因此被称为大型语言模型）。
MLOps（机器学习运维）是一组工具和最佳实践，用于管理 ML 驱动的应用程序的生命周期。
因此，LLMOps 是一组工具和最佳实践，用于管理 LLM 支持的应用程序的生命周期。它可以被视为 MLOps 的子类别，因为 LLM 也是 ML 模型。
参考https://zhuanlan.zhihu.com/p/632026876
https://zhuanlan.zhihu.com/p/631717651

总结

机缘巧合下自己的接触了大模型相关的研发工作，顺便调研总结一下大模型工程方向可能涉及到的行业热点方向与基础入门知识，还有一些的专业词汇的解释，有时候自己主动探索某个方向是一种乐趣，感兴趣就都可以了解一下。

你可能感兴趣的:(oneapi,gpt)

大模型的MoE架构解析：从理论到应用的系统探讨不秃头de程序猿开发语言转行人工智能 ai 大模型程序员学习
MixtureofExperts（专家混合）架构正在重新定义大语言模型的发展轨迹。这种革命性的架构通过条件计算实现了万亿参数规模的模型，同时保持与千亿参数密集模型相当的计算成本。从GPT-4的1.8万亿参数到DeepSeek-V3的671亿参数，MoE架构已成为当前AI领域最重要的技术突破之一。MoE的核心洞察在于"不是所有的模型容量都需要同时激活"——通过让不同的专家网络处理不同类型的输入，实现
2024大模型秋招LLM相关面试题整理 AGI大模型资料分享官人工智能深度学习机器学习自然语言处理语言模型 easyui
0一些基础术语大模型：一般指1亿以上参数的模型，但是这个标准一直在升级，目前万亿参数以上的模型也有了。大语言模型（LargeLanguageModel，LLM）是针对语言的大模型。175B、60B、540B等：这些一般指参数的个数，B是Billion/十亿的意思，175B是1750亿参数，这是ChatGPT大约的参数规模。强化学习：（ReinforcementLearning）一种机器学习的方法，
GPT在AI原生应用领域的无限潜力
GPT在AI原生应用领域的无限潜力关键词：GPT、AI原生应用、自然语言处理、无限潜力、应用场景摘要：本文深入探讨了GPT在AI原生应用领域所展现出的无限潜力。首先介绍了相关背景知识，包括GPT的基本概念和AI原生应用的定义。接着详细解释了GPT的核心概念，以及它与AI原生应用的紧密联系。通过数学模型和公式对GPT的工作原理进行了阐述，并给出了实际的代码案例。还探讨了GPT在多个实际应用场景中的表
ChatGPT + GitHub Copilot + Cursor 实战提升编程效率
本文将详细分享我如何组合使用ChatGPT、GitHubCopilot、Cursor等AI工具，从需求分析到代码实现，从调试优化到部署上线的完整实战经验。AI工具选择与配置核心工具栈ChatGPT-4：需求分析、架构设计、代码审查GitHubCopilot：实时代码补全、函数生成Cursor：AI驱动的代码编辑器Claude：复杂逻辑分析、文档生成Midjourney：UI设计原型生成环境配置#G
破解风电运维“百模大战”困局，机械版ChatGPT诞生？我不是哆啦A梦故障诊断机器学习信号处理人工智能运维 chatgpt 算法 python
面对风机87%的非计划停机，30多个专用模型为何束手无策？一套通用大模型如何实现轴承、齿轮、转子“一站式”健康管理？一、行业痛点：风机运维深陷“碎片化泥潭”1.187%停机故障由多部件引发齿轮断裂、轴承磨损、电机短路……风电故障如同“并发症”，而传统模型却是“专科医生”——仅能诊断单一部件。1.2华电电科院的运维困局华电电科院为206个风场、超1万台机组开发30多个专用模型，却因设备型号、工况差异
如何成为一名合格的 Prompt 工程师？ csdn_tom_168 AI 人工智能 ai prompt
以下为基于行业实践与最新趋势的Prompt工程师成长体系，结合技术能力、实战经验与职业发展三个维度构建的完整路径：一、核心能力模型构建1.基础认知能力领域知识融合掌握垂直领域知识图谱（如医疗术语、法律条文），通过RAG技术实现专业语料注入案例：设计医疗诊断Prompt时需理解ICD-11疾病分类标准模型原理理解熟悉主流模型特性（如GPT-4长文本处理优势、Claude3的逻辑推理强项），针对性设计
chatgpt-vs-deepseek的用户调研 paceboy 人工智能
想做个用户调研，麻烦各位大佬评论区回复下：对于下面这样的chatAI试用地址：https://chatgpt-vs-deepseek.com，有多少用户需要？我办公时经常会用到，因为有时候需要多个模型的最优结果。需要用到的评论区扣1，不需要用到的评论区扣2，不关注的评论区扣3。多谢。
CodeStral Mamba：Mistral 的终极轻量级编码助手知识大胖 NVIDIA GPU和大语言模型开发教程 ai llm mistral
简介如果你是一名开发人员，你会同意我们一天中最困难的部分是调试，我从2018年开始从事Python和Flutter开发人员，我明白这一点。在所有这些AI和编码助手出现之前，去StackOverflow尝试解决错误是另一回事，我一点也不怀念它。最近几个月，我一直在使用其他一些编码助手，如Codellama、Codegemma、QwenCode和Deepseek-Ai。那是在ChatGPT发布之后我们
提炼总结—ROS2机器人开发（第9章）（下）
写在最前面的话为什么做该博客？该博客的特点是什么？随着DeepSeek、ChatGPT等AI技术的崛起，促使机器人技术发展到了新的高度，诞生了宇树科技、特斯拉为代表的人形机器人，四足机器人等等，越来越多的科技巨头涌入机器人赛道，行业对于相关人才的需求也随之达到了顶峰。本博客的内容是替你阅读所有关于机器人的经典书籍，采用书籍瘦身计划，帮你提炼出核心内容，采用最通俗易懂的语言来解释原理，将书读薄。大大
FastAPI MCP 简介及使用教程清尘沐歌 fastapi MCP
原文详细链接：FastAPIMCP是什么？怎么使用？一文介绍简单来说，FastAPIMCP是一个零配置工具，它能够自动把你的FastAPI接口转换成符合模型上下文协议（ModelContextProtocol，简称MCP）的工具。这样，AI模型就能够直接调用你的API了。说白了，它就是一个桥梁，连接你的API和各种AI模型，让AI能够"看懂"并使用你的API。这么理解，你可以让Claude或GPT
Prompt 精通之路（一）- AI 时代的新语言：到底什么是 Prompt？为什么它如此重要？程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt Prompt新手指南提示词入门 AI指令 ChatGPT deepseek
AI时代的新语言：到底什么是Prompt？为什么它如此重要？标签：#Prompt新手指南#提示词入门#AI指令#人工智能#ChatGPTPrompt精通之路：系列文章导航第一篇：AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：
深度解析生成式 AI：从技术原理到实战应用 LNL13 人工智能
一、生成式AI：重构数字内容生产范式（一）技术定义与核心价值生成式人工智能（GenerativeAI）是通过深度学习模型自动创造文本、图像、代码、视频等内容的技术体系，其核心在于从数据中学习概率分布并生成符合人类认知的输出。与传统判别式AI（如图像分类）不同，生成式AI实现了从"识别"到"创造"的跨越，典型应用包括：文本领域：ChatGPT对话系统、小说自动生成图像领域：MidJourney艺术创
基于Google Gemini 探索大语言模型在医学领域应用评估和前景知来者逆 LLM 语言模型搜索引擎人工智能 Gemini 大语言模型医疗健康医疗
概述近年来，大规模语言模型（LLM）在理解和生成人类语言方面取得了显著的飞跃，这些进步不仅推动了语言学和计算机编程的发展，还为多个领域带来了创新的突破。特别是模型如GPT-3和PaLM，它们通过吸收海量文本数据，已经能够掌握复杂的语言模式。人工智能技术的迅猛发展不断推动着LLM的进化，并加速了这一领域的专业创新。这些进步是随着模型规模的扩大、数据量的增加以及计算能力的提升而逐步实现的，其中许多尖端
Chatbox使用指南想知道哇大语言模型人工智能语言模型
Chatbox使用与API配置指南目录Chatbox简介安装与设置基本使用API配置使用进阶功能常见问题与解决方案最佳实践与技巧1.Chatbox简介Chatbox是一款开源的ChatGPT/API桌面应用程序，支持Windows、Mac和Linux。它允许用户通过友好的界面与各种大型语言模型进行交互，包括：OpenAI的ChatGPT、GPT-4等模型Anthropic的Claude系列模型Go
Python环境搭建：从零开始配置开发环境码农垦荒笔记 Python python 开发语言经验分享
一、为什么你需要学会搭建Python环境？1.Python是什么？它能做什么？想象Python就像一把“万能工具刀”——无论是想做个网站、分析数据、写个小游戏，还是研究人工智能，它都能帮你搞定。比如：豆瓣、Instagram的后台用了Python科学家用Python分析实验数据连ChatGPT的开发者也会用到Python库2.为什么环境配置这么重要？举个生活例子就像做菜前要先准备好锅和调料，写Py
AI大模型定义与应用概述水云桐程序员人工智能 ai 大模型
AI大模型，也成为基础模型或大规模预训练模型，指的是在海量数据上通过深度学习技术进行预训练的超大型人工智能模型。常见类型大型语言模型：这是目前最主流和成熟的大模型类型。擅长文本生成、文本理解、机器翻译、对话系统、代码生成与解释等。代表案例：GPT系列、通义千问、文心一言、KimiChat等。多模态大模型：擅长同时处理和生成多种模态的信息，如文生图、图生文、图文问答、视频理解、音频生成等。代表案例：
Day44
1.预训练概念：在大规模数据上训练模型学习通用知识，再迁移到下游任务微调2.常见模型：图像有AlexNet、ResNet、ViT；NLP有BERT、GPT3.图像模型发展：从手工特征到深度学习，从CNN到Transformer、多模态4.预训练策略：数据增强、自监督/监督训练、模型微调、多模态学习作业1.importtorchimporttorch.nnasnnimporttorch.optima
重构企业智能服务：大模型部署背后的战略与落地实践慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：从“能用”到“可用”的时代跃迁过去一年中，大语言模型（LLMs）实现了从实验室“黑科技”到企业场景“生产力”的巨大跃迁。无论是通用问答、客户支持、文本生成、知识库问询，还是代码辅助、财报分析，大模型的边界已快速渗透到各行各业。然而，许多企业在试图将ChatGPT或DeepSeek等模型引入自己的业务系统时却发现：在线服务存在数据泄露风险；响
【大模型面试】大模型Prompt Engineer面试题及参考答案大模型知识 prompt 人工智能开发语言 python chatgpt 深度学习大模型
一、基础概念类1.什么是大模型？大模型通常指具有庞大参数规模的机器学习模型，尤其是在自然语言处理（NLP）和计算机视觉等领域。这些模型能够学习到大量数据中的复杂模式和特征，具备强大的泛化能力，可在多种任务上表现出色，如GPT系列、BERT等。2.大模型与传统机器学习模型的区别是什么？传统机器学习模型参数规模相对较小，往往针对特定任务进行设计和训练，需要较多人工特征工程。而大模型参数数量庞大，通过在
Prompt Engineering Guide — 提示工程全方位指南司南锤 GitHub prompt
项目概述PromptEngineeringGuide是一个由DAIRAILab维护的开源项目，致力于系统性地总结和分享提示工程（PromptEngineering）的理论与实践方法。随着大语言模型（如GPT系列、Claude、Gemini等）的广泛应用，如何设计有效提示以发挥模型最大能力，成为当前人工智能领域的重要研究和应用方向。该项目以教程、案例和最佳实践为核心，帮助开发者和研究者快速掌握提示设
AutoMedPrompt的技术，自动优化提示词 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python mvc
AutoMedPrompt的技术，自动优化提示词让大语言模型在医学答题方面的表现大幅提升，甚至能让开源模型在某些医学数据集上超过GPT-4等商业模型。AutoMedPrompt原理深度解析与实例说明一、核心原理：文本梯度驱动的提示词优化1.传统提示工程的痛点手动设计提示词依赖专家经验，难以覆盖医学领域的复杂性（如不同专科考点、病例变异）。固定提示词（如CoT思维链）无法动态适应具体问题，可能引入无
破译AI黑箱：如何用20行Python理解ChatGPT？ Ven% 简单入门pytorch 人工智能 python chatgpt
文章目录一、核心概念：大模型本质二、代码逐行解析（以线性回归为例）三、关键概念详解四、与大模型的本质联系五、大模型训练核心思想六、如何扩展成真实大模型七、总结：AI训练的本质一、核心概念：大模型本质大模型=复杂数学函数+数据驱动训练现实任务（如图像识别、语言翻译）过于复杂，人类无法直接编写数学函数解决。解决方案：构建参数化的数学模型（如神经网络）用大量数据训练，自动寻找最优参数得到能解决特定任务的
大模型私有化部署的系统性挑战与解决方案：企业视角的深度解析慌ZHANG 人工智能人工智能
个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：企业为何需要私有部署大模型？随着ChatGPT、Claude、DeepSeek、通义千问等大语言模型（LLMs）能力爆发，企业纷纷探索“AI+业务”的融合创新。然而，由于数据隐私、定制需求、合规政策等多重因素，私有化部署成为多数企业采用LLM的首选路径。企业选择私有部署大模型，通常基于以下几个原因：数据安全需求：业务数据敏感，禁止外发；可控
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD（Python/JS/C/C++）
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、深度优先搜索dfs第6天、广度优先搜索bfs第7天、动态规划六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605、
CentOS系统高效部署fastGPT全攻略挑战者666888 linux 常用工具软件 centos python linux
文章目录一、引言二、环境准备系统要求;基础依赖安装Python环境配置三、fastGPT部署流程源码获取与验证依赖库安装模型文件部署四、系统配置优化服务端口配置;安全加固措施;资源限制调整五、服务启动与管理直接启动方式系统服务化部署;日志监控方案六、验证与测试健康检查端点测试API功能测试用例压力测试方案一、引言fastGPT是一款高效、灵活的大语言模型应用框架，凭借其出色的推理速度和良好的扩展性
Llama改进之——均方根层归一化RMSNorm 愤怒的可乐 NLP项目实战 #llama
引言在学习完GPT2之后，从本文开始进入Llama模型系列。本文介绍Llama模型的改进之RMSNorm(均方根层归一化)。它是由RootMeanSquareLayerNormalization论文提出来的，可以参阅其论文笔记1。LayerNorm层归一化(LayerNorm)对Transformer等模型来说非常重要，它可以帮助稳定训练并提升模型收敛性。LayerNorm针对一个样本所有特征计算
手把手从零打造 Llama3：解锁下一代预训练模型会飞的Anthony 信息系统人工智能 AIGC 自然语言处理人工智能 llama3 AIGC
引言Llama3相较于Llama2，不仅在模型架构上做了显著优化，尤其是全局查询注意力机制（GQA）的引入，使得模型在大规模数据处理上表现更加出色。同时，Llama3采用了与GPT一致的tiktoken分词器，大幅提升了分词效率。本篇文章将带你从头构建Llama3预训练流程，深入了解其关键细节和实现方式，让你掌握这一下一代模型的核心技术。1.启动训练脚本在这一步中，我们将实现Llama3的预训练框
【Agent实战】用“前置编码器+LLM”复刻ChatGPT附件功能 kakaZhui 大模型Agent入门与代码实战 chatgpt 人工智能 LLM Agent AIGC DeepSeek
1.引言：多模态LLM解耦原生多模态LLM将多种模态的处理能力“内化”于一个庞大的模型中，是技术的前沿。而我们这里讨论的“前置编码器+LLM”方案，则是一种解耦的设计哲学：LLM专注于语言：让强大的文本LLM继续做它最擅长的事情——理解和生成高质量的文本、进行逻辑推理和遵循复杂指令。前置编码器专注于转换：为每种文件类型构建或调用专门的、最优的工具（模型或库）来将其转换为高质量的文本表示。这种方案的
解密GPT工作原理：Transformer架构详解与自注意力机制剖析 AI智能应用 gpt transformer 架构 ai
解密GPT工作原理：Transformer架构详解与自注意力机制剖析关键词：GPT、Transformer、自注意力机制、神经网络、语言模型、深度学习、人工智能摘要：本文将深入浅出地解析GPT模型的核心架构——Transformer，重点剖析其革命性的自注意力机制。我们将从基本概念出发，通过生活化的比喻解释复杂的技术原理，并用Python代码示例展示实现细节，最后探讨这一技术的应用场景和未来发展方
ChatGPT、DeepSeek等大语言模型技术教程
随着人工智能技术的快速发展，大语言模型如ChatGPT和DeepSeek在科研领域的应用正在为科研人员提供强大的支持。这些模型通过深度学习和大规模语料库训练，能够帮助科研人员高效地筛选文献、生成论文内容、进行数据分析和优化机器学习模型。ChatGPT和DeepSeek能够快速理解和生成复杂的语言，帮助研究人员在撰写论文时提高效率，不仅生成高质量的文章内容，还能优化论文结构和语言表达。在数据分析方面
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {