sam5198

GPT-4最新细节曝光：从架构、基础设施、训练数据集、成本、视觉到MoE

OpenAI保持GPT-4架构封闭，不是因为对人类的某种存在风险，而是因为他们所构建的内容是可复制的。实际上，我们预计Google、Meta、Anthropic、Inflection、Character、Tencent、ByteDance、Baidu等公司在短期内将拥有与GPT-4一样甚至更强大的模型能力。

请不要误解，OpenAI具有令人惊叹的工程能力，他们所构建的东西令人难以置信，但他们所找到的解决方案并非魔法。这是一个优雅的解决方案，其中包含许多复杂的权衡。规模扩大只是战斗的一部分。OpenAI最持久的竞争优势在于他们拥有最多的实际应用、领先的工程人才，并且可以通过未来的模型继续超越其他公司。

我们从多个来源收集了关于GPT-4的大量信息，今天我们想分享一下。这包括模型架构、训练基础设施、推理基础设施、参数数量、训练数据集组成、令牌数量、层数量、并行策略、多模态视觉适应、不同工程权衡背后的思考过程、实施的独特技术以及他们如何减轻与庞大模型推理相关的一些最大瓶颈。

GPT-4最有趣的方面是理解他们为什么做出某些架构决策。

此外，我们将概述在A100上训练和推理GPT-4的成本，以及在下一代模型架构中如何与H100进行扩展。

首先，让我们来看看问题陈述。从GPT-3到4，OpenAI希望扩大100倍，但问题是成本。密集的Transformer模型将无法进一步扩展。密集的Transformer是OpenAI GPT-3、Google PaLM、Meta LLAMA、TII Falcon、MosaicML MPT等模型使用的模型架构。我们可以轻松地列举出使用这种相同架构训练LLM的50多家公司。这是一个不错的架构，但对于扩展来说有缺陷。

在GPT-4发布之前，我们曾讨论过训练成本与即将到来的AI砖墙之间的关系。在那里，我们揭示了OpenAI在GPT-4架构和各种现有模型的训练成本方面的高层次做法。

在过去的六个月中，我们意识到训练成本是无关紧要的。

当然，表面上看起来很疯狂，要花费数千万甚至数亿美元的计算时间来训练一个模型，但对于这些公司来说，这是微不足道的开支。这实际上是一项固定资本支出，在扩大规模方面始终能够取得更好的结果。唯一的限制因素是将计算规模扩展到人类可以获得反馈并修改架构的时间尺度上。

在未来的几年里，像Google、Meta和OpenAI/Microsoft这样的多家公司将在价值超过一千亿美元的超级计算机上训练模型。Meta每年在"Metaverse"上烧掉160亿美元，Google每年在各种项目上浪费100亿美元，Amazon在Alexa上损失超过500亿美元，加密货币在毫无价值的事物上浪费了1000亿美元以上。

这些公司和整个社会可以并且将会在创建可以训练单个巨大模型的超级计算机上花费超过一千亿美元。然后，这些巨大的模型可以以多种方式成为产品。这项工作将在多个国家和公司中复制。这是一场新的太空竞赛。与以前的浪费不同，现在的人工智能具有实实在在的价值，短期内将从人类助手和自主代理中获得。

扩展人工智能更重要的问题是推理。

目标是将训练计算与推理计算分离。这就是为什么有意义的训练超出Chinchilla最佳的范围，无论将要部署的模型如何。这就是为什么要使用稀疏模型架构；在推理过程中，并不需要激活每个参数。

真正的挑战是将这些模型扩展到用户和代理的成本太高。推理的成本比训练的成本高出多倍。这是OpenAI在模型架构和基础设施方面的创新目标。

大型模型的推理是一个多变量问题，对于密集模型来说，模型大小是致命的。我们在这里详细讨论了与边缘计算相关的问题，但数据中心的问题陈述非常相似。简单来说，设备永远无法拥有足够的内存带宽来实现大语言模型的特定吞吐量水平。即使带宽足够，边缘计算设备上硬件计算资源的利用率也将非常低。

在数据中心、云端，利用率是至关重要的。Nvidia之所以因其卓越的软件而受到赞赏，其中一半的原因是因为在GPU的整个生命周期中，Nvidia不断更新低级别软件，通过更智能地在芯片内部、芯片之间和内存之间移动数据，将FLOPS的利用率提高。

在大多数当前使用案例中，LLM推理的目标是作为实时助手运行，这意味着它必须达到足够高的吞吐量，使用户能够真正使用它。人类平均阅读速度约为每分钟250个词，但有些人甚至高达每分钟1000个词。这意味着您需要至少每秒输出8.33个令牌，但更接近每秒输出33.33个令牌以应对所有情况。

根据内存带宽的要求，一个兆参数的密集模型在最新的Nvidia H100 GPU服务器上数学上无法实现这种吞吐量。

每个生成的令牌都需要将每个参数从内存加载到芯片上。生成的令牌然后输入到提示中，并生成下一个令牌。此外，为注意力机制流式传输KV缓存还需要额外的带宽。

这个图表假设由于无法融合每个操作、注意机制所需的内存带宽以及硬件开销等原因，效率等同于参数读取。实际上，即使使用了像Nvidia的FasterTransformer库这样的"优化"库，总开销也更大。

上面的图表展示了推理一个LLM所需的内存带宽，以实现足够高的吞吐量为单个用户提供服务。它显示，即使使用8个H100，也无法以每秒33.33个令牌的速度为1兆参数的密集模型提供服务。

此外，以每秒20个令牌的速度使用8个H100的FLOPS利用率仍然不到5%，导致推理成本非常高。事实上，目前基于8路张量并行的H100系统对于约3000亿前向参数存在推理限制。

然而，OpenAI正在使用A100实现人类阅读速度，使用的模型参数超过1兆，并以每1,000个令牌仅售0.06美元的低价广泛提供。这是因为它是稀疏的，即并非每个参数都被使用。

关于GPT-4的模型架构、训练基础设施、推理基础设施、参数数量、训练数据集组成、令牌数量、层数量、并行策略、多模态视觉编码器、不同工程权衡背后的思考过程、实施的独特技术以及他们如何减轻与庞大模型推理相关的一些最大瓶颈。

#1 GPT-4模型架构

GPT-4的规模是GPT-3的10倍以上。据我们了解，它具有大约1.8兆参数，分布在120个层，而GPT-3具有大约1750亿参数。

OpenAI通过使用混合专家（MoE）模型，成功地控制了成本。如果您对MoE不熟悉，请阅读我们六个月前关于广义GPT-4架构和训练成本的文章。

此外，OpenAI在其模型中使用了16个专家，每个专家的MLP参数约为1110亿。其中有2个专家路由到每个前向传递。

虽然文献中谈论了选择将每个令牌路由到哪个专家的高级路由算法，但据称OpenAI目前的GPT-4模型的路由算法相当简单。

此外，注意力机制共享大约550亿参数。

每次前向传递推理（生成1个令牌）只使用约2800亿参数和560 TFLOPS。这与纯密集模型每次前向传递所需的约1.8兆参数和3700 TFLOPS形成了对比。

#2 数据集成

OpenAI在大约13兆令牌上对GPT-4进行了训练。考虑到RefinedWeb的CommonCrawl包含大约5兆高质量令牌，这是有道理的。供参考，Deepmind的Chinchilla模型和Google的PaLM模型分别使用了大约1.4兆令牌和0.78兆令牌进行训练。甚至据称PaLM 2是在大约5兆令牌上进行训练的。

该数据集不包含13兆个独特令牌。相反，由于缺乏高质量令牌，该数据集包含多个时期。文本数据有2个时期，代码数据有4个时期。有趣的是，这远远不及Chinchilla的最佳选择，表明需要以双倍的令牌数量对模型进行训练。这表明在网络上缺乏易于获取的令牌。高质量文本令牌的数量是其中的1000倍，而音频和视觉令牌的数量更多，但是获取它们并不像网页抓取那么简单。

他们拥有来自Scale Al和内部的数百万行指令微调数据，但可惜的是，我们找不到太多关于他们的强化学习数据。

预训练阶段的上下文长度为8k。32k的令牌长度版本是在预训练后的8k基础上进行微调的。

批量大小逐渐在几天内逐步增加，但到最后，OpenAI使用的批量大小为6000万！当然，由于不是每个专家都看到所有令牌，这实际上只是每个专家每批次处理750万个令牌。

#3 并行策略

在所有A100 GPU上进行并行化的策略非常重要。他们采用了8路张量并行，因为这是NVLink的极限。此外，我们听说他们正在使用15路管线并行。从计算时间和数据通信的角度来看，理论上管线并行的数量太多了，但如果他们受到内存容量限制，那么这是有道理的。

纯粹的管线+张量并行时，每个GPU仅参数就需要约30GB（FP16）。一旦加上KV缓存和开销，理论上如果OpenAI的大部分GPU都是40GB的A100，则这是有道理的。他们可能使用了ZeRo阶段1。可能他们使用了块级FSDP或混合共享数据并行。

至于为什么他们没有使用完整模型FSDP，可能是因为通信开销较高。尽管OpenAI的大多数节点之间有高速网络连接，但并非所有节点之间都是如此。我们相信至少有一些集群之间的带宽比其他集群低得多。

我们不理解他们如何在具有如此高的管线并行度时避免每批次出现巨大的气泡。很可能他们只是承担了这个开销。

#4 训练成本

OpenAI在GPT-4的训练中，使用了大约25,000个A100芯片，在90至100天的时间内进行了约32%至36%的MFU（平均功能利用率）。这种极低的利用率部分是由于大量的故障导致需要从检查点重新启动的原因，上述提到的气泡代价非常高。

另一个原因是在这么多GPU之间进行全局归约的代价非常高。如果我们的猜测是正确的，那么该集群实际上是由许多较小的集群组成的，它们之间的网络连接非常薄弱，即集群的不同部分之间的非阻塞连接为800G/1.6T，但这些部分只能以200G/400G的速度连接起来。

如果他们在云中的成本约为每小时1美元的A100芯片，仅这次训练的成本就约为6300万美元。这还没有考虑到所有的实验、失败的训练运行和其他成本，比如数据收集、强化学习和人员成本等。由于这些因素，实际成本要高得多。此外，这意味着您需要有人购买芯片/网络/数据中心、承担资本支出并将其租给您。

目前，使用约8,192个H100芯片，以每小时2美元的价格，在约55天内可以完成预训练，成本约为2150万美元。需要注意的是，我们相信到今年年底将有9家公司将拥有更多的H100芯片。并非所有这些公司都会将它们全部用于单次训练运行，但那些这样做的公司将会拥有更大规模的模型。Meta将在今年年底拥有超过10万个H100芯片，但其中相当多的芯片将分布在他们的数据中心用于推理。他们最大的单个集群仍然将超过25,000个H100芯片。

到今年年底，很多公司将拥有足够的计算资源来训练与GPT-4规模相当的模型。

#5 MoE 的权衡

在推理过程中，MoE是一种很好的方式，可以在推理时减少参数数量，同时增加参数数量，这对于编码更多的信息每个训练令牌是必需的，因为获取足够的高质量令牌非常困难。如果OpenAI真的试图实现Chinchilla最佳化，他们将不得不在训练中使用两倍于目前的令牌数量。

尽管如此，OpenAI做出了多个权衡。例如，在推理过程中，MoE非常难处理，因为模型的每个部分在每个令牌生成时都不会被使用。这意味着在为用户提供服务时，某些部分可能处于闲置状态，而其他部分则正在使用。这对利用率产生了很大的负面影响。

研究人员已经表明，使用64到128个专家比使用16个专家的损失更小，但那只是纯粹的研究结果。减少专家的数量有多个原因。OpenAI选择16个专家的原因之一是因为更多的专家在许多任务上很难进行泛化。使用更多的专家也可能更难实现收敛。在如此大规模的训练运行中，OpenAI选择在专家数量上更保守一些。

此外，减少专家的数量还有助于他们的推理基础设施。在采用专家混合推理架构时，存在各种困难的权衡。在探讨OpenAI面临的权衡和他们所做的选择之前，我们先从LLM的推理基本权衡开始。

#6 推理的权衡

顺便说一下，在开始之前，我们想指出，我们与所有LLM公司交谈过的人都认为Nvidia的FasterTransformer推理库相当糟糕，TensorRT则更糟。无法使用Nvidia的模板并进行修改的缺点意味着人们需要从零开始创建自己的解决方案。如果你是Nvidia的工作人员，阅读这篇文章后，你需要尽快解决这个问题，否则默认的选择将变为开放工具，这样第三方硬件支持可以更容易地添加进来。一波巨大的模型即将到来。如果在推理方面没有软件优势，并且仍然需要手工编写内核，那么AMD的MI300和其他硬件将有更大的市场。

在大型语言模型的推理中，有3个主要的权衡，它们发生在批量大小（服务的并发用户数）和使用的芯片数量之间。

延迟 - 模型必须以合理的延迟做出响应。人们不想在等待输出开始流入聊天应用程序之前等待几秒钟。预加载（输入令牌）和解码（输出令牌）需要不同的时间来处理。
吞吐量 - 模型必须以每秒输出一定数量的令牌。大约每秒30个令牌是人类使用所需的。对于其他各种用途，较低和较高的吞吐量都可以接受。
利用率 - 运行模型的硬件必须实现高利用率，否则成本将过高。虽然可以使用更高的延迟和较低的吞吐量将更多用户请求进行分组，从而实现更高的利用率，但这会增加难度。

LLM的推理完全是关于平衡两个主要因素：内存带宽和计算。在最过度简化的术语中，每个参数都必须读取，并且与之相关联的是2个FLOP。因此，大多数芯片的比例（例如H100 SXM芯片只有3TB/s的内存带宽，但有2,000 TFLOP/s的FP8）在批量大小为1的推理中完全不平衡。如果只为一个用户提供服务，批量大小为1，那么为了每个令牌生成，所需的内存带宽主导推理时间。计算时间几乎为零。为了有效地将大型语言模型扩展到多个用户，批量大小必须超过4。多个用户会分摊参数读取的成本。例如，对于批量大小为256或512，每个字节的内存读取有512个FLOP/s或1024个FLOP/s。

这个比例更接近于H100的内存带宽与FLOPS之间的比例。这有助于实现更高的利用率，但代价是更高的延迟。

许多人将内存容量视为LLM推理的一个主要瓶颈，原因是大型模型需要多个芯片进行推理，而较大的内存容量会使其适应的芯片数量减少，但实际上，最好使用超过所需容量的芯片，以便将延迟降低，提高吞吐量，并且可以使用更大的批量大小来实现越来越高的利用率。

谷歌在他们的PaLM推理论文中展示了这些权衡。然而，值得注意的是，这是针对像PaLM这样的稠密模型，而不是像GPT-4这样的稀疏模型。

如果一个应用程序要求最低的延迟，我们需要应用更多的芯片，并将模型划分为尽可能多的部分。较小的批量大小通常可以实现较低的延迟，但较小的批量大小也会导致更差的利用率，从而导致每个令牌的总成本（以芯片秒或美元计）更高。如果一个应用程序需要离线推理，并且延迟不是问题，主要目标是最大化每个芯片的吞吐量（即尽量减少每个令牌的总成本）。

增加批量大小是最高效的，因为较大的批量通常可以实现更好的利用率，但某些对于小批量大小来说不高效的划分策略在批量大小增大时变得高效起来。更多的芯片和更高的批量大小是最便宜的，因为它们可以增加利用率，但这也引入了一个第三个变量，即网络时间。某些将模型分割到不同芯片上的方法对于延迟更高效，但与利用率相互制衡。

内存时间和非注意计算时间都与模型大小成正比，与芯片数量成反比。然而，对于给定的分区布局，芯片间通信所需的时间下降得较慢（或根本不下降），因此随着芯片数量的增加，它变得越来越重要，成为一个越来越重要的瓶颈。虽然我们今天只是简单地讨论一下，但应该注意到，随着批量大小和序列长度的增长，KV缓存的内存需求会急剧增加。如果一个应用程序需要生成具有较长注意力上下文的文本，则推理时间会显著增加。

对于一个具有多头注意力的500B+模型，注意力KV缓存会变得很大：对于批量大小为512和上下文长度为2048，KV缓存总共达到3TB，这是模型参数大小的3倍。芯片上的内存需要将此KV缓存从芯片外存加载到内存中，而此期间芯片的计算核心基本上处于闲置状态。较长的序列长度对内存带宽和内存容量特别不利。OpenAI的16k序列长度GPT 3.5 turbo和32k序列长度GPT 4的成本要高得多，因为由于内存限制，它们无法使用更大的批量大小。

较低的批量大小导致较低的硬件利用率。此外，随着序列长度的增加，KV缓存也会变得更大。KV缓存无法在用户之间共享，因此需要单独的内存读取，进一步成为内存带宽的瓶颈。

#7 GPT-4的推理权衡和基础设施

以上所有内容在GPT-4推理中都很困难，但是模型架构采用了专家混合模型（MoE），这引入了一整套新的困难。每个令牌生成的前向传递可以路由到不同的专家集合中。这对于在批量大小较大时在吞吐量、延迟和利用率之间实现的权衡造成了困扰。

OpenAI的GPT-4有16个专家，每个前向传递中有2个专家。这意味着如果批量大小为8，每个专家的参数读取可能只是批量大小为1。更糟糕的是，可能一个专家的批量大小为8，而其他的专家可能是4、1或0。每次令牌生成，路由算法都会将前向传递发送到不同的方向，导致令牌到令牌的延迟以及专家批量大小的显著变化。推理基础设施是OpenAI选择较少的专家数量的主要原因之一。如果他们选择了更多的专家，内存带宽将更加成为推理的瓶颈。

OpenAI在推理集群上经常达到4k+的批量大小，这意味着即使在专家之间进行了最佳的负载均衡，专家的批量大小也只有约500个。这需要非常大量的使用才能实现。我们了解到，OpenAI在一个由128个GPU组成的集群上运行推理。他们在多个数据中心和地理位置上都有多个这样的集群。推理是在8路张量并行和16路流水线并行上进行的。每个由8个GPU组成的节点只有大约130B的参数，即每个GPU在FP16模式下不到30GB，在FP8/int8模式下不到15GB。这使得推理可以在40GB的A100芯片上运行，前提是所有批次的KV缓存大小不会过大。

包含各种专家的单个层不会分割到不同的节点上，因为这会使网络流量过于不规则，并且在每个令牌生成之间重新计算KV缓存的代价太高。对于任何未来的MoE模型扩展和条件路由，如何处理KV缓存的路由是一个最大的困难。

模型有120个层，所以将其平均分配到15个不同的节点上是很简单的，但由于第一个节点需要进行数据加载和嵌入，所以在推理集群的主节点上放置较少的层是有意义的。此外，我们听到了一些关于推理的猜测解码的传言，我们稍后会讨论，但我们不确定是否相信这些传言。这也可以解释为什么主节点需要包含较少的层。

#8 GPT-4的推理成本

与175B参数的Davinchi模型相比，GPT-4的成本是其3倍，尽管其前馈参数只增加了1.6倍。这主要是因为GPT-4需要更大的集群并实现了更低的利用率。

我们认为，对于128个A100来推理GPT-4 8k序列长度，每1k令牌的成本是0.0049美分，而对于128个H100来推理GPT-4 8k序列长度，每1k令牌的成本是0.0021美分。

值得注意的是，我们假设有较高的利用率，并保持较高的批量大小。这可能是一个错误的假设，因为很明显OpenAI有时的利用率非常低。我们假设OpenAI在低谷时段关闭集群，并重新调整这些节点以从检查点恢复对较小测试模型的训练，尝试各种新技术。这有助于降低推理成本。如果OpenAI不这样做，他们的利用率将更低，我们的成本估计将增加一倍以上。

#9 多查询注意力

MQA是其他公司正在使用的技术，但我们想指出OpenAI也在使用。长话短说，只需要一个头部，KV缓存的内存容量可以大大减少。即使如此，32k序列长度的GPT-4肯定无法在40GB的A100芯片上运行，而8k序列长度的GPT-4在最大批量大小上受到限制。如果没有MQA，8k序列长度的GPT-4的最大批量大小将受到极大的限制，以至于经济上不可行。

#10 连续批处理

OpenAI实现了可变的批量大小和连续批处理。这样可以在一定程度上允许最大延迟，并优化推理成本。如果您对这个概念不熟悉，那么这篇由AnyScale撰写的文章值得一读。

#11 关于猜测解

我们从一些可靠的人士那里听说OpenAI在GPT-4推理中使用了猜测解码。我们不确定是否完全相信这一点。令牌到令牌的延迟的普遍变化以及在进行简单的检索任务与更复杂的任务时的差异似乎表明这是可能的，但是变量太多，无法确定。以防万一，我们将在这里使用一些“使用分段猜测解码加速LLM推理”的文本并稍作修改/添加一些说明。

使用LLM通常分为两个阶段。首先是预填充阶段，将提示文本通过模型生成KV缓存和第一个输出的logits（可能的令牌输出概率分布）。通常，这个阶段很快，因为整个提示文本可以并行处理。

第二阶段是解码。从输出的logits中选择一个令牌，并将其反馈到模型中，生成下一个令牌的logits。重复这个过程，直到生成所需数量的令牌。因为解码必须按顺序进行，每次都要将权重流通过计算单元以生成单个令牌，所以当以小批量运行时，第二阶段的算术强度（即计算的FLOP / 内存带宽的字节数）非常低。

因此，解码通常是自回归生成中最昂贵的部分。这就是为什么在OpenAI的API调用中，输入令牌比输出令牌便宜得多的原因。

猜测解码的基本思想是使用一个更小、更快的草稿模型预先解码多个令牌，然后将它们作为一个批次馈送给神谕模型。如果草稿模型对其预测的令牌是正确的，即较大模型也同意，那么可以通过一个批次解码多个令牌，这样可以节省相当多的内存带宽和时间，每个令牌都能节省。

然而，如果较大模型拒绝了草稿模型预测的令牌，那么剩下的批次将被丢弃，算法自然会恢复到标准的逐令牌解码。猜测解码可能还伴随着拒绝采样方案，以从原始分布中进行采样。请注意，这仅在带宽是瓶颈的小批量设置中有用。

猜测解码通过交换计算和带宽来进行权衡。猜测解码作为性能优化目标具有两个关键原因。首先，它完全不会降低模型质量。其次，它提供的优势通常与其他方法无关，因为其性能来自将顺序执行转换为并行执行。

目前的猜测方法为批次预测一个单独的序列。然而，这在大批量大小或低草稿模型对齐度的情况下无法很好地扩展。直观地说，两个模型在连续的长序列中达成一致的概率指数级地降低，这意味着随着算术强度的扩大，猜测解码的回报迅速减少。

我们认为如果OpenAI使用猜测解码，他们可能只在大约4个令牌的序列上使用它。顺便提一下，GPT-4降低质量的整个阴谋可能只是因为他们让神谕模型接受来自猜测解码模型的较低概率序列。另一个注意的是，有人猜测Bard使用了猜测解码，因为谷歌在将整个序列发送给用户之前等待序列的生成完成，但我们不相信这种猜测是真实的。

#12 关于视觉多模态

视觉多模态能力是GPT-4中最不令人印象深刻的部分，至少与领先的研究相比。当然，还没有任何公司将多模态LLM的研究商业化。

它是一个独立的视觉编码器，与文本编码器分开，但存在交叉注意力。我们听说它的架构类似于Flamingo。这在GPT-4的1.8T参数之上增加了更多的参数。在仅文本预训练之后，它还进行了另外约2万亿个令牌的微调。

对于视觉模型，OpenAI原本希望从头开始训练，但这种方法还不够成熟，因此他们决定先从文本开始以减轻风险。

据称，下一个模型GPT-5将从头开始进行视觉训练，并且能够自己生成图像。此外，它还将能够处理音频。

这种视觉能力的主要目的之一是让自主代理能够阅读网页并转录图像和视频中的内容。他们训练的数据中有一部分是联合数据（渲染的LaTeX/文本）、网页的屏幕截图、YouTube视频：采样帧，并运行Whisper来获取转录。

关于所有这些针对LLM的过度优化的有趣之处在于，视觉模型的成本与文本模型的成本不同。正如我们在“亚马逊云危机”文章中所描述的那样，在文本模型中，成本非常低。而在视觉模型中，数据加载的IO要高出约150倍。每个令牌的字节数为600，而不是文本的4。有很多关于图像压缩的研究正在进行中。

这对于那些正在根据未来2-3年内LLM的用例和比率来优化硬件的硬件供应商来说非常重要。他们可能会发现自己处于一个每个模型都具有强大的视觉和音频能力的世界中。他们可能会发现他们的架构适应不良。总的来说，架构肯定会发展到超越当前简化的基于文本的密集和/或MoE模型的阶段。

你可能感兴趣的:(AI人工智能,chatgpt,架构,人工智能,chatgpt,gpt)

AI新贵崛起：Perplexity的估值为何两月飙升至180亿美元？在美的苦命程序员人工智能
在AI搜索领域的激烈竞争中，Perplexity的崛起令人瞩目。这家AI搜索初创公司在短短两个月内，估值从140亿美元激增至180亿美元，成为挑战谷歌的“潜力股”。这背后究竟有哪些驱动力？从商业化路径到未来市场布局，Perplexity的成功揭示了AI创业领域的新机遇和挑战。一、从5亿美元到180亿美元，Perplexity的惊人估值飙升Perplexity的估值在18个月内完成了五轮融资，尤其在
谷歌搜索的 AI 防守战，透露了什么新趋势？在美的苦命程序员人工智能
在AI搜索这一轮激烈竞逐中，谷歌这位“搜索一哥”正面临新旧对手的夹击：ChatGPT、Perplexity、Claude、Gemini……每一个看上去都野心勃勃、来势汹汹。但即便如此，数据显示，谷歌在全球搜索领域依然维持了89.5%的市场份额，网络访问量环比小幅增长1%。Gemini的月度用户增长更是达到了27%。这不仅是一场份额保卫战，更是谷歌对“搜索形态重塑”的深度试验。透过这场战役，我们也可
中国AI应用“三分天下”：国企成主力、中小企偏订阅、C端仍在观望在美的苦命程序员人工智能
AI在中国的落地路径，正在迅速分化：国企不再只是“建底座”，而是明确聚焦于AI应用的实际部署，特别是在制造、能源、装备等领域。订单量和投入强度明显提升。中小企业开始普遍接受“订阅制+垂直应用”的组合模型，以年费万元级的方式引入AI能力，用于财税、HR、客服等关键业务流程。C端市场则相对承压。虽有WPSAI等大模型产品突破，但整体变现节奏较慢，巨头产品仍处于免费体验或早期内测阶段。国企推动AI从“可
TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
ThinkSound：阿里开源首个“会思考”的音频生成模型——从“看图配音”到“听懂画面”的技术跃迁从零开始学习人工智能音视频
1.为什么「看懂」还不够，AI必须「听懂」画面？过去两年，视频生成模型把画面做到了4K60fps，音频却仍是“罐头音效”：狗叫永远是同一段WAV，飞机轰鸣与镜头距离无关，雨点落在铁皮和草地声音毫无区别。根本原因在于——模型并不理解“为什么这个物体在这个场景会发出这样的声音”，只能做粗糙的“像素→波形”映射。阿里巴巴通义实验室在2025-07-20开源的ThinkSound，第一次把CoT（Chai
系统设计时平衡超时时间与多因素认证（MFA）带来的用户体验下降 Alex艾力的IT数字空间 ux 架构中间件微服务测试用例功能测试产品经理
金融系统中，平衡超时时间与多因素认证（MFA）带来的用户体验下降，需通过动态策略、技术优化和用户感知增强实现安全与便捷的协同一、动态调整认证强度基于风险的分级认证低风险场景（如常规查询）：缩短超时时间（如5分钟），但减少MFA层级（仅密码+设备指纹）。高风险场景（如转账、密码修改）：延长超时时间（如10分钟），但强制启用MFA（密码+短信验证码+生物识别）。异常行为触发：通过AI分析登录地点、设备
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
摩根士丹利：到2028年，AI投资将推动科技巨头新增1.5万亿美元债务——信贷市场如何填补这一缺口？在美的苦命程序员人工智能科技
在AI技术快速发展与全球数字化转型的推动下，AI基础设施建设正成为一项巨大的资本需求。摩根士丹利最新的报告指出，到2028年，全球数据中心建设的投资将需要接近2.9万亿美元，其中大部分资金将集中在AI计算与云基础设施的建设上。而最引人注目的是，尽管超大规模云服务商（如亚马逊AWS、微软Azure等）已将大部分资金投入到AI技术基础设施中，但依然存在1.5万亿美元的融资缺口。1️⃣全球AI基础设施的
从宿主机到虚拟机，云环境下主机端IO路径的变化数据存储张存储技术从入门到精通 php 开发语言
前文我们对云计算的整体架构进行了介绍，并且了解到云计算的核心是虚拟化技术。这里的虚拟化技术包括计算虚拟化、网络虚拟化和存储虚拟化等技术。以基于Linux操作系统的虚拟化为例，通常在物理机上安装Linux操作系统和虚拟化软件，然后基于虚拟化软件创建虚拟机，并在虚拟机中按照操作系统。简而言之，虚拟化可以认为是通过软件虚拟出CPU、内存和硬盘等硬件，并在其上运行操作系统，具体如下图所示。添加图片注释，不
linux install RDMA IB netcard richer_live c++linux 服务器运维
安装RDMAIB网卡驱动指令sudoapt-getinstallbuild-essentiallibelf-devcmakesudoapt-getinstalllibibverbs1libibverbs-devlibrdmacm1librdmacm-devrdmacm-utilsibverbs-utilssudomodprobeib_coresudomodproberdma_ucm无IB网卡的机器
兜兜转转，我又开始研究 Windows 系统
刚毕业那会，软件开发几乎只有Windows这一条路。那时，DOS已被Windows完全取代，苹果公司深陷低谷、摇摇欲坠；Linux还在襁褓之中，只是极客们手中的玩物。至于Android和iOS，那更是遥不可及——那是诺基亚称王的时代，手机还在拼铃声、换外壳。随着移动互联网浪潮到来，谷歌、苹果、Facebook等崛起，微软渐渐淡出媒体焦点。进入AI时代后，人们的视线更多投向OpenAI这样的“新锐明
基于Spring Boot的超市管理系统详细设计方案漫逗科技 spring boot 后端 java 毕业设计课程设计毕设
基于SpringBoot的超市管理系统详细设计方案1.系统总体设计1.1系统架构图┌─────────────────────────────────────────────────┐│客户端层││┌───────────┐┌───────────┐┌───────────┐│││Web端││移动端App││POS终端│││└───────────┘└───────────┘└──────────
iOS 26 公测版定了，预计下周发布！ lzhdim ios cocoa macos objective-c
iOS26公测版定了——7月23日正式开放下载！这是彭博社记者MarkGurman等多方消息源确认的时间，苹果将同步推送iOS26、iPadOS26、macOS26等全家桶系统的公测版本，但VisionPro的visionOS26暂不开放。除iOS26外，同步发布的公测版系统还包括：iPadOS26、macOS26、watchOS26、tvOS26、HomePodSoftware26，AirPod
C++ 编译链接机制的演化路径我家大宝最可爱 c++java 算法
以完全问题驱动的方式推导C++编译链接机制的演化路径。每一步都基于前一阶段无法解决的问题，提出新的设计方案，不依赖当前GCC或MSVC的实现细节，而是像一个架构师一样，从零开始设计一个现代C++系统。第一版（V1）：一切都在main.cpp中✅初始方案：所有函数、变量、代码都写在main.cpp中。//main.cppintadd(inta,intb){returna+b;}intmultiply
首席数据官CDO：企业数据资产的“首席架构师
一、CDO岗位的重要性解读：从数据爆炸到企业战略核心总的来说，CDO的诞生是技术、商业与监管三重驱动的结果。技术方面：21世纪初，随着互联网、移动设备和物联网（IoT）的普及，企业数据呈现爆炸式增长。传统IT部门难以兼顾基础设施运维与数据价值挖掘，企业开始意识到需要专职角色统筹数据管理，确保数据从“成本负担”变为“战略资产”。商业方面：2010年代，企业加速数字化转型，但数据孤岛、低质量数据等问题
一文看懂NTP协议 Neolock 网络协议网络协议 ntp 网络
最近碰到一个NTP协议相关的题，卡了很久，才发现一直在用的NTP协议完全不了解他的原理，遂学习并总结一下1.NTP概述NTP（NetworkTimeProtocol）是一种用于同步计算机系统时钟的网络协议，旨在通过分层架构和精密算法，将设备时间同步至全球协调时间（UTC），精度可达毫秒甚至微秒级。其核心目标是通过减少时钟偏差和网络延迟影响，确保分布式系统的时间一致性2.NTP分层架构（Stratu
自媒体资料收集某人在
https://baike.baidu.com/tashuo/browse/content?id=90920d34ef91b6d8f0531701&fr=qingtian&lemmaId=829414
每日面试题08:wait()和sleep()的区别
Java多线程核心：wait()与sleep()的区别与应用场景详解在Java多线程编程中，wait()和sleep()是两个控制线程执行流程的重要方法，但它们的设计定位和使用场景截然不同。本文将从底层机制、调用条件、锁行为、异常处理等维度深入解析两者的差异，并结合实际场景说明如何选择使用。一、前置知识：线程的状态与同步机制在理解wait()和sleep()前，需要明确两个基础概念：线程状态：Ja
【iOS】锁[特殊字符]
文章目录前言1️⃣什么是锁？1.1基本概念1.2锁的分类2️⃣OC中的常用锁2.1OSSpinLock（已弃用）：“自旋锁”的经典代表为什么尽量在开发中不使用自旋锁自旋锁的本质缺陷：忙等待（BusyWaiting）os_unfair_lock的局限性：不适用于复杂场景苹果的官方建议：优先使用更高效的锁2.2dispatch_semaphore_t（GCD信号量）：“高性能通用锁”2.3pthrea
宗毅说 | 乌卡瑟时代的生存思考裂变学院
今天，互联网经济、人工智能、全球化发展对我们的影响，要比我们想象得大得多。在多股合力的相互作用下，这个时代的社会特征、商业特征与之前相比显著不同，我称之为乌卡瑟“VUCASE”。备注：乌卡瑟（VUCASE）这个术语是我自创的，来自于乌卡(VUKA）。VUCA是Volatility(易变性)，Uncertainty(不确定性)，Complexity(复杂性)、Ambiguity（模糊性）这四个英文单
疑华为Mate30曝光:五摄/麒麟990/液冷或地表最强 f5098972f08d
自从华为MateX折叠屏5G手机惊艳登场之后，关于华为下一代新手机的传闻也不绝于耳。近日，就有不少关于疑似华为Mate30新5G手机曝光的消息，如采用后置五摄+麒麟990+液冷散热+5200mAh电池的强悍配置，堪称最强5G拍照手机。图片发自App疑华为Mate30曝光（图片：author.baidu）从不少曝光的资料和渲染图猜测，华为这款新机正面配备了6.4英寸1080X2340像素的AMOLE
泽平的ScalersTalk第七轮新概念朗读持续力训练Day 256 20211203 郑泽平
练习材料：Lesson50TakenforarideIlovetravelinginthecountry,butIdon'tlikelosingmyway.Iwentonanexcursionrecently,butmytriptookmelongerthanIexpected.'I'mgoingtoWoodfordGreen,'IsaidtotheconductorasIgotonthebus,
《亿级流量系统架构设计与实战》通用高并发架构设计读场景 Momentary_SixthSense 系统架构 mysql redis 架构
高并发架构设计的要点场景分类读多写少、写多读少，读多写多高并发读场景方案1：数据库读/写分离数据库承受的高并发请求压力，主要来自读请求。我们可以把数据库按照读/写请求分成专门负责处理写请求的数据库（写库）和专门负责处理读请求的数据库（读库），让所有的写请求都落到写库，写库将写请求处理后的最新数据同步到读库，所有的读请求都从读库中读取数据。这就是数据库读/写分离的思路。数据库读/写分离使大量的读请求
Go基础学习 Momentary_SixthSense golang 学习开发语言
很久之前做的笔记…整理了一下语法注意点函数的{一定和函数名在同一行，否则编译错误分号加与不加都可以，一般不加main函数一定在main包里导多个包：import("fmt""time")常见的四种变量声明方式与多变量声明方式//声明全局变量，方法一、二、三是可以的vargAintvargBint=10varc=10//不能用方法四来声明全局变量//gD:=100//:=只能够用在函数体中来声明fu
《亿级流量系统架构设计与实战》MySQL高可用架构 Momentary_SixthSense 系统架构 mysql 架构
主从模式一台MySQL服务器作为Master（主节点）,若干MySQL服务器作为Slave（从节点）。在正常情况下，只有Master处理写数据请求，同时Master与Slave通过主从复制技术保持数据一致。当Master发生故障宕机时，某个Slave会被提升为Master继续对外提供服务。主从复制技术：当Master数据发生变更(包括新增、删除、修改等操作)时，Master将数据的变更日志写入二进
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
小程序常用api xkxnq 小程序
1.wx.request-发起网络请求用于向服务器发送HTTP请求，获取数据或提交表单。//示例：GET请求获取数据wx.request({url:'https://api.example.com/data',//替换为实际API地址method:'GET',success:(res)=>{console.log('请求成功',res.data);},fail:(err)=>{console.er
Prompts
提示是引导AI模型生成特定输出的输入。这些提示的设计和措辞会显著影响模型的反应。在SpringAI中与AI模型交互的最低级别，处理SpringAI中的提示与管理SpringMVC中的“视图”有些相似。这涉及为动态内容创建带有占位符的广泛文本。然后根据用户请求或应用程序中的其他代码替换这些占位符。另一个类比是包含某些表达式占位符的SQL语句。随着SpringAI的发展，它将为与AI模型的交互引入更高
echars世界地图，显示指定的国家散点图 xkxnq vue vue.js javascript
效果如下1.下载:npminstallecharts--save2，引入世界地图在main.js文件里引入(这里是Vue3.0的模板)importechartsfrom'echarts'Vue.prototype.$echarts=echartsimport'../node_modules/echarts/map/js/world.js'//引入世界地图3.使用import{mapoption,p
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla