微学AI

解密：GPT-4框架与训练过程，数据集组成，并行性的策略，专家权衡，推理权衡等细节内容

大家好，我是微学AI，今天给大家解密一下GPT-4框架与训练过程，数据集组成，并行性的策略，专家权衡，推理权衡等细节内容。2023年3月14日，OpenAI发布GPT-4，然而GPT-4的框架没有公开，OpenAI之所以不公开GPT-4的架构，并不是因为存在对人类的潜在威胁，而是因为他们所建立的模型是可以被复制的。事实上，我们预计Google、Meta、Anthropic、Inflection、Character、腾讯、阿里、百度等公司在短期内都会拥有与GPT-4同样甚至更强大的模型。当然，OpenAI具有令人惊叹的工程能力，他们所构建的东西也是令人难以置信的，但是他们所采用的解决方案并非神奇。这是一个实用的方案，其中包含许多复杂的权衡。OpenAI最大优势在于他们拥有最多的真实世界使用情况、领先的工程人才，并且可以通过未来的模型继续领先其他公司。

GPT-4现状

我们从多个信息源收集到了关于GPT-4的大量信息，今天我们想要分享一些。这包括模型架构、训练基础设施、推理基础设施、参数数量、训练数据集组成、标记数量、层次数量、并行策略、多模态视觉适应性、不同工程权衡背后的思考过程、已实施的独特技术，以及他们如何缓解与庞大模型推理相关的一些最大瓶颈。

GPT-4最有趣的方面在于理解他们为什么做出了某些架构决策。此外，我们还将概述GPT-4在A100上进行训练和推理的成本，并介绍与下一代模型架构使用H100相比的规模。

首先，让我们来看一下问题陈述。从GPT-3到GPT-4，OpenAI希望将规模扩大100倍，但问题的关键在于成本。稠密的Transformer模型无法进一步扩展。稠密的Transformer是OpenAI GPT-3、Google PaLM、Meta LLAMA、TII Falcon、MosaicML MPT等模型所使用的模型架构。我们可以轻松地列举出50家使用相同架构进行LLM训练的公司。这是一个好的架构，但在扩展性方面存在缺陷。

GPT-4框架

GPT-4的规模是GPT-3的10倍以上。据我们了解，它有大约1.8万亿个参数，分布在120个层，而GPT-3只有大约1750亿个参数。

OpenAI通过使用混合专家（MoE）模型，成功地将成本控制在合理范围内。

此外，OpenAI的模型中有16位专家，每位专家的多层感知机（MLP）参数约为1110亿个。每次前向传递（forward pass）有两位专家进行路由。

尽管文献中谈到了选择将每个tokens路由到哪个专家的高级路由算法，但据说OpenAI当前的GPT-4模型相对简单。

此外，注意力机制中大约有550亿个共享参数。

每次前向推导（生成一个标记）时，仅使用大约2800亿个参数和560 TFLOPS。这与完全密集模型每个前向传递所需的大约1.8万亿个参数和3700 TFLOPs形成鲜明对比。

数据集组成

OpenAI在大约13万亿个tokens上对GPT-4进行了训练。考虑到CommonCrawl的RefinedWeb中包含大约5万亿个高质量tokens，这是有道理的。作为参考，Deepmind的Chinchilla模型和Google的PaLM模型分别使用了大约1.4万亿个和0.78万亿个tokens进行训练。甚至据称PaLM 2也是基于大约5万亿个tokens进行训练的。

这个数据集并不包含13万亿个独特的tokens。相反，由于缺乏高质量的tokens，该数据集包含多个时期。文本数据经历了2个时期，而代码数据则经历了4个时期。有趣的是，这远远少于Chinchilla的最佳状态，这表明需要以两倍的tokens数量对模型进行训练。这表明在网络上很难找到易获取的tokens。存在着比之前提到的高质量文本tokens多1000倍的数量，甚至还有更多的音频和视觉tokens，但是获取它们并不像简单的网页抓取那么容易。

还有来自ScaleAI以及内部的数百万行指导微调数据。不幸的是，我们找不到关于他们的强化学习高分辨率函数（RLHF）数据的详细信息。

预训练阶段的上下文长度（seqlen）为8,000。 GPT-4的32,000个seqlen版本是在预训练后对8,000个seqlen进行微调得到的。

批处理大小逐渐在集群上的若干天内逐渐增加，但最后，OpenAI使用了批处理大小为60百万！当然，由于并非每个专家都看到所有tokens，这实际上是每个专家仅处理了7.5百万个tokens。

并行性的策略

在跨所有A100 GPU进行并行化的策略非常重要。他们利用了8路张量并行性，因为这是NVLink的限制。除此之外，他们还使用了15路管道并行。从理论上讲，在考虑到数据通信和计算时间之比时，这样的管道数量太多了，但如果他们受到内存容量限制，那么这样做是有道理的。

每个GPU纯粹通过管道+张量并行化时，仅参数的FP16占用约30GB的内存。一旦加上KV缓存和开销，如果OpenAI的大部分GPU是40GB的A100，那么从理论上讲这是有道理的。他们可能使用了ZeRo阶段1。他们可能还使用了块级FSDP或者混合共享数据并行化。

至于为什么他们没有使用完整模型的FSDP，可能是因为更高的通信开销。虽然OpenAI的大多数节点之间具有高速网络连接，但并不是所有节点之间的带宽都很高。我们相信至少有一些集群之间的连接带宽比其他集群低得多。

训练费用

OpenAI训练GPT-4所使用的浮点操作数（FLOPS）约为2.15x10^25，使用了大约25,000块A100 GPU，在90至100天的时间内运行，利用率在32%至36%之间。其中，非常低的利用率部分是由于大量的失败导致需要重启检查点。上述提到的中断非常昂贵。

另一个原因是在这么多GPU之间进行全局归约操作是非常昂贵的，尤其是如果我们怀疑集群实际上是一组具有较弱网络连接的小集群，每个集群内部的非阻塞带宽为800G/1.6T，但这些集群之间的连接只有200G/400G。

如果在云端的A100 GPU每小时成本约为1美元，仅考虑这次训练的成本将达到约6300万美元。这还不包括所有的试验、失败的训练运行和其他诸如数据收集、强化学习超参数优化、人员等费用。考虑到这些因素，实际成本要高得多。此外，这还假设你有某个机构购买芯片、网络设备和数据中心，承担资本支出，并将其租给你使用。

目前，使用大约8,192块H100 GPU可以在约55天内完成预训练，成本为2150万美元，每小时成本为2美元。需要注意的是，我们相信到今年年底将有9家公司拥有更多的H100 GPU。虽然不是所有公司都会将它们全部用于单个训练运行，但那些这样做的公司将能够训练出更大规模的模型。Meta公司到今年年底将拥有超过100,000块H100 GPU，但其中很大一部分将分布在他们的数据中心进行推理。他们最大的单个集群仍将拥有超过25,000块H100 GPU。到今年年底，许多公司将拥有足够的计算资源来训练一个与GPT-4规模相当的模型。

专家权衡机制

MoE是一种在推理过程中减少参数数量的好方法，同时仍然增加参数数量，这对于每个训练标记来编码更多信息是必要的，因为获取足够高质量的标记非常困难。如果OpenAI真的试图达到最佳性能，他们实际上需要训练两倍数量的标记。

话虽如此，OpenAI做出了多种权衡。例如，在推理过程中，与MoE的处理非常困难，因为模型的每个部分并不在每个标记生成时都被使用。这意味着某些部分可能处于休眠状态，而其他部分正在使用。对于服务用户来说，这会严重影响利用率。

研究人员表明，使用64到128个专家比使用16个专家可以获得更好的损失结果，但那只是纯粹的研究。选择较少的专家有多种原因。OpenAI选择使用16个专家的原因之一是更多的专家在许多任务上很难进行泛化。更多的专家也更难实现收敛。在如此大规模的训练过程中，OpenAI选择在专家数量上更为保守。

此外，使用较少的专家还有助于他们的推理基础设施。在转向专家混合推理架构时，存在各种困难的权衡。让我们先从普通语言模型（LLM）的推理中的基本权衡开始，然后再讨论OpenAI面临的挑战和他们所做的选择。

推理的权衡

在开始之前，我们想提一下，我们与所有的LLM（Large Language Model）公司交流过后得出的结论是，Nvidia的FasterTransformer推理库相当糟糕，而TensorRT更是更差劲。由于无法根据Nvidia的模板进行修改，人们只能从头开始创建自己的解决方案。如果Nvidia团队正在阅读这篇文章，你们需要尽快改进LLM推理功能，否则标准工具将变成一个开放的工具，可以更轻松地添加第三方硬件支持。大规模模型的潮流即将到来。如果在推理中没有软件优势，并且仍然需要手动编写核心代码，那么AMD的MI300和其他硬件市场将会更大。

在LLM推理中，有三个主要的权衡要考虑，即批处理大小（并发用户数量）和使用的芯片数量。

1.延迟 - 模型必须在合理的延迟内响应。在聊天应用程序中，人们不希望等待几秒钟才能开始获取输出。预填充（输入标记）和解码（输出标记）需要不同的时间来处理。

2.吞吐量 - 模型必须每秒输出一定数量的标记。对于人类使用，大约需要每秒30个标记。对于其他用途，较低和较高的吞吐量也是可以接受的。

3.利用率 - 运行模型的硬件必须实现高利用率，否则将成本过高。虽然可以通过更高的延迟和较低的吞吐量将更多的用户请求分组在一起，从而实现更高的利用率，但这会增加一定的困难。

LLM推理主要涉及平衡两个关键点，即内存带宽和计算能力。简单来说，每个参数都需要被读取，并且与之相关联的是2个浮点运算。因此，大多数芯片（如H100 SXM）在批处理大小为1时，内存带宽（3TB/s）与FP8的计算能力（2,000 TFLOP/s）之比完全不平衡。如果只有一个用户进行服务，即批处理大小为1，那么推理时间主要由传输每个标记生成所需的参数所占用的内存带宽决定，而计算时间几乎可以忽略不计。

为了将大型语言模型高效地扩展到许多用户，批处理大小必须超过1。多个用户可以分摊参数读取成本。例如，在批处理大小为256或512时，每个读入的字节内存对应512个或1024个浮点运算。这种比例更接近H100的内存带宽与FLOPS之间的关系。这有助于实现更高的利用率，但代价是延迟增加。

许多人认为，LLM推理的主要瓶颈是内存容量，因为模型的大小决定了可以放入多少个芯片中，但这是不正确的。尽管大型模型需要多个芯片进行推理，并且较高的内存容量意味着它们能够适应更少的芯片，但实际上使用比所需容量更多的芯片更好，这样可以降低延迟，提高吞吐量，并使用更大的批处理大小以实现越来越高的利用率。

GPT-4推理权衡和基础设施

使用GPT-4的混合专家（MoE）模型架构会引入一系列新的困难，这使得以上所有问题都变得困难起来。每个标记生成的前向传递可以被路由到不同的专家组。这给在吞吐量、延迟和批处理大小之间取得平衡带来了麻烦。

OpenAI的GPT-4有16个专家，每次前向传递分配其中2个。这意味着如果批处理大小为8，则每个专家的参数读取只能是批处理大小1。更糟糕的是，某个专家可能具有批处理大小为8，而其他专家可能是4、1或0。每次生成标记时，路由算法将使前向传递以不同的方向进行，导致标记与标记之间的延迟和专家批处理大小变化显著。

推理基础设施是OpenAI选择较少数量的专家的主要原因之一。如果他们选择更多的专家，内存带宽将更加瓶颈推理过程。OpenAI的推理集群通常达到4k+的批处理大小，这意味着即使在专家之间进行了最佳负载平衡，专家的批处理大小也只有大约500左右。这需要非常大规模的使用才能实现。

据我们了解，OpenAI在一个由128个GPU组成的集群上进行推理。他们在多个数据中心和地理位置上都有多个这样的集群。推理过程采用8路张量并行和16路管道并行。每个由8个GPU组成的节点只有大约130亿个参数，即FP16精度下不到30GB，FP8/int8精度下不到15GB。这使得推理可以在40GB A100的GPU上运行，只要所有批次之间的KV缓存大小不会变得太大。

包含各种专家的各个层不能在不同节点之间分开，因为这样会使网络流量变得不规则，并且在每个标记生成之间重新计算KV缓存的代价太大。对于任何未来的MoE模型扩展和条件路由，最大的困难是如何在KV缓存周围进行路由。

模型的层数为120层，因此将其分配给15个不同的节点是很简单的，但由于第一个节点需要进行数据加载和嵌入，所以在推理集群的首节点上放置较少的层是有意义的。此外，关于有些人提出的猜测解码的传闻，我们稍后会讨论，但我们不确定是否相信这些传闻。这也解释了为什么首节点需要包含较少的层。

GPT-4推理成本

尽管GPT-4的前馈参数仅为175B参数的Davinchi模型的1.6倍，但其成本却是Davinchi模型的3倍。这主要是因为GPT-4需要更大规模的集群，并且利用率较低。

我们认为，对于128个A100 GPU来推理GPT-4的8k序列长度，每1,000个标记的成本为0.0049美分；而对于128个H100 GPU来推理GPT-4的8k序列长度，每1,000个标记的成本为0.0021美分。值得注意的是，我们假设高利用率，并保持批处理大小较大。

然而，OpenAI有时明显存在利用率非常低的情况，这可能是我们的一个错误假设。我们假设OpenAI在低峰时段会关闭集群，并利用那些节点从检查点中恢复训练，用于较小的测试模型，试验各种新技术。这有助于降低推理成本。如果OpenAI不这样做，他们的利用率将更低，我们的成本估计将翻倍以上。

多头查询注意力

MQA是其他人正在做的事情，但我们想指出OpenAI也在采用这种方法。简而言之，只需要一个头部，并且KV缓存的内存容量可以大大减少。即便如此，32k序列长度的GPT-4绝对无法在40GB的A100 GPU上运行，而8k序列长度在最大批处理大小上也有限制。如果没有这个限制，8k序列长度将在最大批处理大小上受到显著限制，甚至达到经济不划算的程度。

连续批处理

OpenAI实施了可变批量大小和连续批处理。这样做可以允许一定水平的最大延迟，并且优化推理成本。如果您对连续批处理的概念不熟悉，可以阅读AnyScale的此页面，它值得一读。

推测性解码

OpenAI在GPT-4推理中使用了推测解码（speculative decoding）。我们不确定是否完全相信这个说法。从tokens到tokens的延迟波动以及在简单检索任务和复杂任务之间的差异似乎表明这是可能的，但是有太多的变量无法确定。为了防止误解，我们将在此处使用《加速LLM推理的分阶段推测解码》中的部分文本，并进行一些修改和添加一些色彩。

使用LLMs通常分为两个阶段。首先是预填充（prefill）阶段，将提示语通过模型运行以生成KV缓存和第一个输出Logits（可能的tokens输出概率分布）。这通常很快，因为整个提示可以并行处理。

第二阶段是解码阶段。从输出的Logits中选择一个tokens，并将其馈送回模型，生成下一个tokens的Logits。重复此过程直到生成所需数量的tokens。由于解码必须按顺序进行，每次都需要将权重流传输到计算单元，以生成单个tokens，因此当以小批量方式运行时，此第二阶段的算术强度（即计算的FLOP / 内存带宽的字节）极低。因此，解码通常是自回归生成中最耗费资源的部分。

这就是为什么在OpenAI的API调用中，输入tokens比输出tokens便宜得多的原因。

推测解码的基本思想是使用一个较小且更快的草稿模型来提前解码多个tokens，然后将其作为单个批次馈送给正式模型（oracle model）。如果草稿模型的预测是正确的（即较大模型也同意），那么可以通过单个批次解码多个tokens，从而节省了相当多的内存带宽和时间。

然而，如果较大模型拒绝草稿模型预测的tokens，则剩余的批次将被丢弃，算法自然而然地回退到标准的逐tokens解码方式。推测解码还可以与拒绝采样方案结合使用，以从原始分布中进行采样。请注意，这仅在带宽是瓶颈的小批量环境中有用。

推测解码以计算代价换取带宽。为什么推测解码成为一个有吸引力的性能优化目标有两个关键原因。首先，它不会降低模型的质量。其次，它提供的性能改进通常与其他方法无关，因为其性能来自于将顺序执行转换为并行执行。

目前的推测方法为批次预测一个单一序列。然而，这对于大批量大小或低草稿模型对齐性来说并不具备良好的可扩展性。直观来说，两个模型在长连续tokens序列上达成一致的概率是指数级低的，这意味着随着算术强度的增加，推测解码的收益会迅速变小。

我们认为如果OpenAI使用推测解码，它们可能仅将其应用于约4个tokens的序列。另外有人还猜测Bard使用了推测解码，因为谷歌在将整个序列发送给用户之前会等待，但我们不认为这种猜测是真实的。

视觉多模态

目前还没有将多模态LLM的研究商业化的例子。它使用了一个独立的视觉编码器和文本编码器，但二者之间存在交叉注意力。据说它的架构与Flamingo类似，并在GPT-4的基础上增加了更多参数，总参数量达到了1.8T。在仅有文本的预训练之后，它还进行了约2万亿次微调。

关于视觉模型，OpenAI本来希望从头开始训练，但由于技术尚不成熟，所以选择了从文本开始以降低风险。下一个模型，即GPT-5，据说将完全从头开始训练，具备生成图像的能力，并且还能处理音频。

这种视觉能力的一个主要应用是用于自主代理，能够阅读网页并转录其中的图像和视频内容。他们训练的数据中包括联合数据（渲染的LaTeX/文本）、网页截图、YouTube视频帧采样，并运行Whisper技术获取转录内容。

在所有针对LLMs的过度优化中，一个有趣的事实是视觉模型的输入输出成本与文本模型不同。正如我们在“亚马逊云危机”一文中所描述的，文本模型的数据加载成本极低。而视觉模型的IO成本则高出大约150倍，每个标记的数据量为600字节，而不是文本模型的4字节。现在人们正在对图像压缩进行大量研究。

这对于那些为未来2-3年优化硬件以适应LLMs使用情况和比例的硬件供应商来说非常重要。他们可能会发现自己处于一个几乎每个模型都具备强大视觉和音频能力的世界中。他们的架构可能无法很好地适应这种情况。总之，LLMs的架构肯定会进一步发展，超越目前简化的以文本为基础的密集模型和MoE模型。

吴恩达《提示词工程》（Prompt Engineering for Developers）课程详细笔记拾工人工智能 prompt 笔记人工智能
课程简介目标：帮助开发者理解如何有效地使用大语言模型（LLMs），提升通过提示词解决问题的能力。适用对象：开发者、AI从业者、产品经理等，希望通过提示词优化生成模型性能的人。第1章：提示词工程基础1.什么是提示词工程提示词工程是一种优化与大语言模型（如GPT）交互的技术，旨在通过设计有效的提示词（prompts）引导模型生成所需的输出。主要思想：用正确的方式提问以得到最佳答案。2.提示词的组成指令
基于 React hooks + Typescript + Cesium 实现通视分析 jiegiser# webgis cesium通视分析 webgis 三维可视化 typescript react hooks
文章目录效果截图功能介绍实现思路实现步骤核心代码插值计算绘制分析线效果截图先上截图：功能介绍通视分析是指以某一点为观察点，研究某一区域通视情况的地形分析。用户在模型上选取任意两点之间是否可以互相可见的技术方法，主要用于判断任意两点之间能否通视；图层管理（√）dom点扩散（√）轨迹回放（√）测量（√）坐标拾取（√）加载模型数据，拾取三维模型（√）geoserver结合实现属性查询（√）geoserv
Three.js实战项目01：vue3+three.js实现圣诞动画贺卡项目叁拾舞 ThreeJs Vue3 three.js
文章目录创建项目加载模型设置天空与水设置天空设置水纹添加点光源相机位置和文字切屏添加星星完整代码下载创建项目创建vue3项目【christmas-app】：npminitvite@latest安装两个库：[email protected]加载模型//导入three库import*
2025美赛C题完整代码+建模过程摆烂大大王 2025美赛思路+代码参考机器学习 python 数学建模
问题一第一个问题是开发国家奖牌总数模型，包括以下几个具体要求：开发一个预测各国奖牌数（至少包括金牌和总奖牌数）的模型，并包括模型预测结果的不确定性/精度估计及模型性能的衡量指标。根据模型，预测2028年洛杉矶夏季奥运会的奖牌榜，包括所有结果的预测区间，并分析哪些国家可能在奖牌榜上有所提升，哪些国家表现可能不如2024年。模型应包括尚未获得奖牌的国家，预测下届奥运会中有多少国家可能赢得他们的首枚奖牌
AI Agent的工具调用体系：打造可扩展的能力框架技术出海录人工智能 AI ai agent
在上一篇文章中，我们讨论了AIAgent的记忆系统。今天，我想分享一下如何设计和实现一个灵活的工具调用体系。说实话，这个模块我重构了好几次，每次都有新的感悟。从简单到复杂最开始实现工具调用时，我用的是最简单的方式：defrun_tool(name:str,args:dict)->str:ifname=="search":returnsearch_function(**args)elifname==
使用 AI 助手提升前端代码质量：自动代码审查实战技术出海录远洋录·技术篇人工智能前端
最近在带团队的时候，发现代码审查（CodeReview）总是成为项目进度的一个瓶颈。一方面，高级工程师的时间很宝贵，不可能审查每一行代码；另一方面，初级工程师又急需及时的反馈来提升。于是我就在想：能不能用AI来解决这个问题？经过一番研究和实践，我搭建了一个AI代码审查助手，效果出乎意料的好！今天就来分享下这个小工具是怎么做的。为什么需要AI代码审查？说实话，最开始团队里有不少质疑的声音：“AI能审
AI Agent的记忆系统实现：从短期对话到长期知识技术出海录人工智能 AI ai agent
在上一篇文章中，我们搭建了AIAgent的基础框架。今天，我想深入讲讲AIAgent最核心的部分之一：记忆系统。说实话，我在实现记忆系统时走了不少弯路，希望通过这篇文章，能帮大家少走一些弯路。从一个bug说起还记得在开发知识助手的过程中，我遇到了一个很有意思的问题。一天我正在测试多轮对话功能：我：Python的装饰器是什么？助手：装饰器是Python中用于修改函数或类行为的一种设计模式...（省略
spss因子分析过程中，旋转载荷平方和累积有点低咋办怎么调整 xiamu_CDA python
SPSS因子分析过程中，旋转载荷平方和累积有点低咋办？怎么调整？在数据分析领域，因子分析是一项重要的统计技术，尤其在心理学、社会学、市场营销等领域中应用广泛。它通过将多个变量简化为少数几个潜在因子，帮助研究者理解变量之间的内在结构。然而，在实际操作过程中，我们常常会遇到一些棘手的问题，比如旋转载荷平方和累积值偏低。这不仅会影响模型的解释力，还可能导致研究结果的可靠性大打折扣。那么，当我们在使用SP
深度剖析 Java 的线程池：高效管理线程资源潜意识Java Java知识 java 开发语言
目录一、线程池是什么二、线程池的工作原理三、线程池的创建和使用四、线程池的拒绝策略五、线程池的优势家人们，今天咱们来聊聊Java并发编程里的关键组件——线程池。在开发多线程应用时，频繁地创建和销毁线程会消耗大量资源，影响程序性能，而线程池就能很好地解决这个问题。我也是在实际项目中不断摸索，才把线程池的用法和原理摸透，现在就把这些经验分享给大伙。一、线程池是什么简单来说，线程池就是一个管理线程的容器
transformer编码器解码器图解 Ai玩家hly 人工智能 transformer nlp
这张图展示了Transformer模型的架构，包含编码器（左边）和解码器（右边）两部分。以下是对图中每个步骤的详细解释，结合生活场景来说明每一步的意义和推理过程。编码器部分（左边）输入嵌入（InputEmbedding）：步骤：将输入序列中的每个单词转换为固定维度的向量表示。生活场景：想象你在学习一种新的语言，每个单词都有一个独特的代号或符号。这一步就像是给每个单词分配一个独特的代码，以便计算机能
JAVA动态代理日落前的我 java 代理模式开发语言
简介：Java动态代理是一种在运行时创建代理类的机制，动态代理可以在不修改源代码的情况下，在运行时为某个接口动态生成实现类，并且可以拦截接口中的方法调用，从而实现一些特殊的功能。动态代理在Java中有着广泛的应用，比如SpringAOP、Hibernate数据查询、测试框架的后端mock、RPC远程调用、Java注解对象获取、日志、用户鉴权、全局性异常处理、性能监控，甚至事务处理等。分类：java
66道软件工程面试八股文（答案、分析和深入提问）整理 ocean2103 面试题软件工程面试职场和发展
1.软件测试的策略是什么?回答软件测试的策略是确保软件产品的质量和稳定性，以便满足用户需求和期望。下面是一些常见的软件测试策略：手动测试与自动化测试：手动测试：测试人员手动执行测试用例，以发现软件缺陷。自动化测试：使用自动化工具执行测试，提高效率和可重复性，尤其适用于回归测试。黑盒测试与白盒测试：黑盒测试：关注于软件的功能和输出，不考虑内部实现细节。白盒测试：关注软件内部的逻辑结构，测试代码的每个
C# 关于进程回收管理的一款工具设计与分享初九之潜龙勿用 c#开发语言
目录设计初衷开发运行环境CraneofficeProcessGC运行主界面管理任务与策略其它设置移动存储设备管理核心代码-计时器监控小结设计初衷在使用COM模式操作OFFICE组件的开发过程中，当操作完相关文档后，在某些情况下仍然无法释放掉Word或EXCEL等应用进程，因此根据进程活动情况或时间点范围开发了一个强制杀掉指定进程名称的WinForm程序，做为一种辅助工具运行在云服务器上，命名为Cr
高校物品捐赠管理系统（11291） codercode2022 java 后端 spring boot typescript spring javascript actionscript
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发
天津大学、浪潮信息、龙蜥社区等技术专家讲开源，龙蜥大讲堂12月精彩预告提前解锁操作系统开源
「龙蜥大讲堂」12月精彩直播预告来啦，点击下方海报抢先了解，本次活动由开放原子校源行与龙蜥社区联合举办。欢迎扫描海报二维码提前进群，坐等精彩分享开始。
六个步骤学会CNAS软件检测机构的不确定度评定 daopuyun CNAS\CMA专栏不确定度 CNAS检测机构
测量不确定度是CNAS软件检测机构过程要求中非常重要的一个部分。测量不确定度作为测量结果的一部分，合理表征了被测量量值的分散性，对测量结果的可信性、可比性和可接受性都有重要影响，是评价测量活动质量的重要指标。CNAS软件检测机构在软件检测过程中应识别测量不确定度的贡献，评定测量不确定度。当软件检测项目中有测量不确定度要求时，应建立相应的数学模型，给出相应的测评不确定度案例。当软件检测出现临界值、内
Metasploit Pro 4.22.5-2024102801 发布下载，新增功能简介 metasploit
MetasploitPro4.22.5-2024102801(Linux,Windows)-专业渗透测试框架2024年10月28日，版本4.22.5-2024102801请访问原文链接：MetasploitPro4.22.5-2024102801(Linux,Windows)-专业渗透测试框架查看最新版。原创作品，转载请保留出处。作者主页：sysin.org世界上最广泛使用的渗透测试框架知识就是力
c++中grpc简单使用---函数介绍及其代码演示叙白大人 c++中间件 c++开发语言
前言C++gRPC（GoogleRemoteProcedureCall）是一种高性能、开源的远程过程调用框架，用于在不同服务之间进行通信。配置gRPC可以访问该网站：grpc配置一.函数介绍下面是一些常见的C++gRPC函数及其功能：grpc::Channel：表示一个gRPC通道，客户端通过这个通道与服务端进行通信。grpc::CreateChannel(conststd::string&tar
【neo4j】neo4j和Cypher 查询语言相关知识点杰九 neo4j
【neo4j】neo4j和Cypher查询语言相关知识点1.什么是neo4jNeo4j是一个广泛使用的图形数据库管理系统（GraphDatabaseManagementSystem）。它是一种NoSQL数据库，专为存储和查询图形数据而设计。Neo4j支持图形数据模型，允许用户以节点（Nodes）和关系（Relationships）的形式存储数据，并通过属性（Properties）来丰富这些节点和关
树莓派pico搭建开发环境的报错及解决 2401_86161528 raspberrypi pico linux c语言 bash
1.更新cmake报错：--Usingthesingle-headercodefrompico/picotool/picotool-src/lib/nlohmann_json/single_include/CMakeDeprecationWarningatpico/pico-sdk/lib/mbedtls/CMakeLists.txt:23(cmake_minimum_required):Comp
百万架构师第二十八课：RMI ：分布式通讯框架RMI的原理｜JavaGuide 后端
20180602-分布式通讯框架RMI的原理.mdTOC[TOC]什么是RPCRPC框架原理了解JavaRMI基于RMI时间RMI通讯原理分析实现自己的RPC框架什么是RPCRemoteprocedurecall远程过程调用集中式到分布式RMI(JRMP)/soap(webservice/axis/cxf)thrift/grpc/dubboRPC框架的不断演进，基于TCP/IP协议之上封装了特定的
第84期 | GPTSecurity周报 aigc
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用数据流路径对大
从文字到思维：呆马GPT在人工智能领域的创新之旅呆码科技 gpt 人工智能
引言生成式预训练变换器（GenerativePre-trainedTransformer，简称GPT）领域是人工智能技术中的一大革新。自OpenAI推出第一代GPT以来，该技术经历了多代发展，不断提升模型的规模、复杂度和智能化程度。GPT模型通过在大规模数据集上进行预训练，学习语言的统计规律和世界知识，然后在特定任务上进行微调，以适应不同的应用需求。GPT领域的发展推动了自然语言处理（NLP）技术
BERT模型在情感分析中的应用：探寻文本情感的智能之路 Echo_Wish 前沿技术人工智能 bert 人工智能深度学习
随着互联网的普及和社交媒体的兴起，情感分析（SentimentAnalysis）已成为自然语言处理（NLP）领域的重要研究方向。情感分析通过对文本数据的分析，识别其中所表达的情感倾向（如正面、负面或中性）。近年来，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型凭借其强大的上下文理解能力，在情感分析中展现出了卓越的性能。本文将深
数字孪生技术：虚拟与现实的完美融合 Echo_Wish Python进阶 python 人工智能深度学习虚拟现实
在现代技术飞速发展的时代，数字孪生技术（DigitalTwin）逐渐成为工业、医疗、城市规划等领域的重要工具。通过数字孪生技术，我们可以创建一个与现实世界对象高度一致的虚拟模型，从而实现对现实对象的监测、分析和优化。本文将深入探讨数字孪生技术的原理、应用场景，并结合Python代码示例，展示如何实现一个简单的数字孪生应用。一、数字孪生技术的基本概念数字孪生技术是指利用传感器、物联网（IoT）、大数
ESP-IDF使用LED组件实现各种LED效果控制荻夜 ESP32 esp32 led_indicator
ESP32使用LED组件实现各种LED控制ESP-IDF组件管理LED组件简介测试LED组件写在最后ESP-IDF组件管理IDF组件管理器工具用于下载ESP-IDFCMake项目的依赖项，该下载在CMake运行期间自动完成。IDF组件管理器可以从自动从组件注册表或Git仓库获取组件，具体的使用和介绍，请查看官方文档，需要注意的是ESP-IDF管理器是IDF4.4以后引入的特性，使用IDF框架时，建
DeepSeek 公开新的模型权重数据分析能量站机器学习人工智能
DeepSeek-V3是一款开源大语言模型，在关键基准测试中超越了Llama3.1405B和GPT-4o，尤其在编码和数学任务中成绩优异。除特定受限应用（军事、伤害未成年人、生成虚假信息等）外，模型权重开源，可在线下载。工作原理混合专家架构（MoE）：DeepSeek-V3是MoE型Transformer模型，有6710亿个参数，运行时370亿参数激活。相比Llama3.1405B，训练时间大幅缩
FPGA在空间领域应用的权衡之道 forgeda EDA硬件辅助验证 fpga开发硬件架构嵌入式硬件 EDA硬件辅助验证故障注入测试 SEU Emulation 商业航天
新官上任，干货较多。去年10月30日，紫光国微在投资者关系活动中表示，对FPGA产品的国产化率以及未来价格压力趋势的答复是，除了个别品类外，FPGA领域已基本完成国产化替代。价格竞争激烈，现有存量市场需求不足，导致产品价格成为重要竞争手段等。价格是市场新进入者的唯一机会，FPGA行业自然也不例外。当下火热的“智算概念”，如果说GPU在数据中心堆算力的方式有多风光，那么在追求性能之外，必须权衡SWa
XXPermissions：Android权限请求框架高喻尤King
XXPermissions：Android权限请求框架XXPermissionsAndroid权限请求框架，已适配Android14项目地址:https://gitcode.com/gh_mirrors/xx/XXPermissions项目基础介绍XXPermissions是一个由CSDN公司开发的Android权限请求框架，主要使用Java编程语言进行开发。该框架旨在简化Android应用中权限
计算机毕业设计springboot框架的个人健康管理系统的设计与实现ct1l59【附源码】苏苏酱゛计算机毕设源码程序课程设计 spring boot 后端
本项目包含程序+源码+数据库+LW+调试部署环境，文末可获取一份本项目的java源码和数据库参考。系统的选题背景和意义选题背景和意义：近年来，随着人们生活水平的提高和健康意识的增强，个人健康管理成为了越来越多人关注的话题。然而，传统的健康管理方式存在一些问题，如信息不全面、数据不准确、操作繁琐等。因此，设计和实现一个基于SpringBoot框架的个人健康管理系统具有重要的意义。首先，该系统能够帮助
异常的核心类Throwable 无量 java 源码异常处理 exception
java异常的核心是Throwable，其他的如Error和Exception都是继承的这个类里面有个核心参数是detailMessage，记录异常信息，getMessage核心方法，获取这个参数的值，我们可以自己定义自己的异常类，去继承这个Exception就可以了，方法基本上，用父类的构造方法就OK，所以这么看异常是不是很easy package com.natsu;
mongoDB 游标（cursor）实现分页迭代开窍的石头 mongodb
上篇中我们讲了mongoDB 中的查询函数，现在我们讲mongo中如何做分页查询如何声明一个游标 var mycursor = db.user.find({_id:{$lte:5}}); 迭代显示游标数
MySQL数据库INNODB 表损坏修复处理过程 0624chenhong tomcat mysql
最近mysql数据库经常死掉，用命令net stop mysql命令也无法停掉，关闭Tomcat的时候，出现Waiting for N instance(s) to be deallocated 信息。查了下，大概就是程序没有对数据库连接释放，导致Connection泄露了。因为用的是开元集成的平台，内部程序也不可能一下子给改掉的，就验证一下咯。启动Tomcat,用户登录系统，用netstat -
剖析如何与设计人员沟通不懂事的小屁孩工作
最近做图烦死了，不停的改图，改图……。烦，倒不是因为改，而是反反复复的改，人都会死。很多需求人员不知该如何与设计人员沟通，不明白如何使设计人员知道他所要的效果，结果只能是沟通变成了扯淡，改图变成了应付。那应该如何与设计人员沟通呢？我认为设计人员与需求人员先天就存在语言障碍。对一个合格的设计人员来说，整天玩的都是点、线、面、配色，哪种构图看起来协调；哪种配色看起来合理心里跟明镜似的，
qq空间刷评论工具换个号韩国红果果 JavaScript
var a=document.getElementsByClassName('textinput'); var b=[]; for(var m=0;m<a.length;m++){ if(a[m].getAttribute('placeholder')!=null) b.push(a[m]) } var l
S2SH整合之session 灵静志远 spring AOP struts session
错误信息： Caused by: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'cartService': Scope 'session' is not active for the current thread; consider defining a scoped
xmp标签 a-john 标签
今天在处理数据的显示上遇到一个问题： var html = '<li><div class="pl-nr"><span class="user-name">' + user + '</span>' + text + '</div></li>'; ulComme
Ajax的常用技巧（2）---实现Web页面中的级联菜单 aijuans Ajax
在网络上显示数据，往往只显示数据中的一部分信息，如文章标题，产品名称等。如果浏览器要查看所有信息，只需点击相关链接即可。在web技术中，可以采用级联菜单完成上述操作。根据用户的选择，动态展开，并显示出对应选项子菜单的内容。在传统的web实现方式中，一般是在页面初始化时动态获取到服务端数据库中对应的所有子菜单中的信息，放置到页面中对应的位置，然后再结合CSS层叠样式表动态控制对应子菜单的显示或者隐
天-安-门，好高 atongyeye 情感
我是85后，北漂一族，之前房租1100，因为租房合同到期，再续，房租就要涨150。最近网上新闻，地铁也要涨价。算了一下，涨价之后，每次坐地铁由原来2块变成6块。仅坐地铁费用，一个月就要涨200。内心苦痛。晚上躺在床上一个人想了很久，很久。我生在农
android 动画百合不是茶 android 透明度平移缩放旋转
android的动画有两种 tween动画和Frame动画 tween动画;,透明度,缩放,旋转,平移效果 Animation 动画 AlphaAnimation 渐变透明度 RotateAnimation 画面旋转 ScaleAnimation 渐变尺寸缩放 TranslateAnimation 位置移动 Animation
查看本机网络信息的cmd脚本 bijian1013 cmd
@echo 您的用户名是：%USERDOMAIN%\%username%>"%userprofile%\网络参数.txt" @echo 您的机器名是：%COMPUTERNAME%>>"%userprofile%\网络参数.txt" @echo ___________________>>"%userprofile%\
plsql 清除登录过的用户征客丶 plsql
tools---preferences----logon history---history 把你想要删除的删除 -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一起进步。 email ： binary_spac
【Pig一】Pig入门 bit1129 pig
Pig安装 1.下载pig wget http://mirror.bit.edu.cn/apache/pig/pig-0.14.0/pig-0.14.0.tar.gz 2. 解压配置环境变量如果Pig使用Map/Reduce模式，那么需要在环境变量中，配置HADOOP_HOME环境变量 expor
Java 线程同步几种方式 BlueSkator volatile synchronized ThredLocal ReenTranLock Concurrent
为何要使用同步？ java允许多线程并发控制，当多个线程同时操作一个可共享的资源变量时（如数据的增删改查），将会导致数据不准确，相互之间产生冲突，因此加入同步锁以避免在该线程没有完成操作之前，被其他线程的调用，从而保证了该变量的唯一性和准确性。 1.同步方法&
StringUtils判断字符串是否为空的方法（转帖） BreakingBad null StringUtils “”
转帖地址：http://www.cnblogs.com/shangxiaofei/p/4313111.html public static boolean isEmpty(String str) 　　判断某字符串是否为空，为空的标准是 str== null 或 str.length()== 0
编程之美-分层遍历二叉树 bylijinnan java 数据结构算法编程之美
import java.util.ArrayList; import java.util.LinkedList; import java.util.List; public class LevelTraverseBinaryTree { /** * 编程之美分层遍历二叉树 * 之前已经用队列实现过二叉树的层次遍历，但这次要求输出换行，因此要
jquery取值和ajax提交复习记录 chengxuyuancsdn jquery取值 ajax提交
// 取值 // alert($("input[name='username']").val()); // alert($("input[name='password']").val()); // alert($("input[name='sex']:checked").val()); // alert($("
推荐国产工作流引擎嵌入式公式语法解析器-IK Expression comsci java 应用服务器工作 Excel 嵌入式
这个开源软件包是国内的一位高手自行研制开发的，正如他所说的一样，我觉得它可以使一个工作流引擎上一个台阶。。。。。。欢迎大家使用，并提出意见和建议。。。 ----------转帖--------------------------------------------------- IK Expression是一个开源的（OpenSource），可扩展的（Extensible），基于java语言
关于系统中使用多个PropertyPlaceholderConfigurer的配置及PropertyOverrideConfigurer daizj spring
1、PropertyPlaceholderConfigurer Spring中PropertyPlaceholderConfigurer这个类，它是用来解析Java Properties属性文件值，并提供在spring配置期间替换使用属性值。接下来让我们逐渐的深入其配置。基本的使用方法是：(1) <bean id="propertyConfigurerForWZ&q
二叉树:二叉搜索树 dieslrae 二叉树
所谓二叉树,就是一个节点最多只能有两个子节点,而二叉搜索树就是一个经典并简单的二叉树.规则是一个节点的左子节点一定比自己小,右子节点一定大于等于自己(当然也可以反过来).在树基本平衡的时候插入,搜索和删除速度都很快,时间复杂度为O(logN).但是,如果插入的是有序的数据,那效率就会变成O(N),在这个时候,树其实变成了一个链表. tree代码:
C语言字符串函数大全 dcj3sjt126com c function
C语言字符串函数大全函数名: stpcpy 功能: 拷贝一个字符串到另一个用法: char *stpcpy(char *destin, char *source); 程序例: #include <stdio.h> #include <string.h> int main
友盟统计页面技巧 dcj3sjt126com 技巧
在基类调用就可以了, 基类ViewController示例代码 -(void)viewWillAppear:(BOOL)animated { [super viewWillAppear:animated]; [MobClick beginLogPageView:[NSString stringWithFormat:@"%@",self.class]];
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法 flyvszhb java jdk
window下在同一台机器上安装多个版本jdk，修改环境变量不生效问题处理办法本机已经安装了jdk1.7，而比较早期的项目需要依赖jdk1.6，于是同时在本机安装了jdk1.6和jdk1.7. 安装jdk1.6前，执行java -version得到 C:\Users\liuxiang2>java -version java version "1.7.0_21&quo
Java在创建子类对象的同时会不会创建父类对象 happyqing java 创建子类对象父类对象
1.在thingking in java 的第四版第六章中明确的说了，子类对象中封装了父类对象， 2."When you create an object of the derived class, it contains within it a subobject of the base class. This subobject is the sam
跟我学spring3 目录贴及电子书下载 jinnianshilongnian spring
一、《跟我学spring3》电子书下载地址：《跟我学spring3》（1-7 和 8-13） http://jinnianshilongnian.iteye.com/blog/pdf 跟我学spring3系列 word原版下载二、源代码下载最新依
第12章 Ajax（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BI and EIM 4.0 at a glance blueoxygen BO
http://www.sap.com/corporate-en/press.epx?PressID=14787 有机会研究下EIM家族的两个新产品~~~~ New features of the 4.0 releases of BI and EIM solutions include: Real-time in-memory computing –
Java线程中yield与join方法的区别 tomcat_oracle java
长期以来，多线程问题颇为受到面试官的青睐。虽然我个人认为我们当中很少有人能真正获得机会开发复杂的多线程应用(在过去的七年中，我得到了一个机会)，但是理解多线程对增加你的信心很有用。之前，我讨论了一个wait()和sleep()方法区别的问题，这一次，我将会讨论join()和yield()方法的区别。坦白的说，实际上我并没有用过其中任何一个方法，所以，如果你感觉有不恰当的地方，请提出讨论。 &nb
android Manifest.xml选项阿尔萨斯 Manifest
结构继承关系 public final class Manifest extends Objectjava.lang.Objectandroid.Manifest 内部类 class Manifest.permission权限 class Manifest.permission_group权限组构造函数 public Manifest () 详细 androi
Oracle实现类split函数的方 zhaoshijie oracle
关键字：Oracle实现类split函数的方项目里需要保存结构数据，批量传到后他进行保存，为了减小数据量，子集拼装的格式，使用存储过程进行保存。保存的过程中需要对数据解析。但是oracle没有Java中split类似的函数。从网上找了一个，也补全了一下。 CREATE OR REPLACE TYPE t_split_100 IS TABLE OF VARCHAR2(100); cr