OneFlow深度学习框架

GPT总设计师：大型语言模型的未来

来源 | Stanford eCorner

OneFlow编译

翻译 | 杨婷、宛子琳、贾川

回头来看，ChatGPT的横空出世验证了Ilya Sutskever此前预想的AI发展方向。

在OpenAI成立早期，强化学习大牛Pieter Abbeel曾与Ilya共事，在他看来，Ilya对AI的思考总是走在他人的前面，而为了验证自己的想法，他总是在恰当的时间更换自己的工作处境，并做出了领域内最具开创性的工作。

Ilya出生于俄罗斯，五岁随家人搬到以色列读书、生活，本科时转学至多伦多大学，攻读数学学士学位，并在此取得了计算机科学博士学位，师从深度学习“教父”Geoffrey Hinton。2012年，在Hinton的指导下，他与Alex krizhevsky提出了AlexNet网络，开启了新一轮深度学习革命。随后，Ilya加入Hinton的三人组公司DNN-research，并在2013年被Google收购，Ilya也随即入职。2015年，Ilya离开Google，与马斯克、Sam Altman、Greg Brockman等人创立了OpenAI，至今，他一直担任公司首席科学家。

从AlexNet开始，AlphaGo、GPT、CLIP、DALL-E和Codex这些业内开山之作都有他的身影。不过，将这位科学家推到世界舞台中央的是2022年11月发布的ChatGPT，而他正是GPT系列模型背后的奠基人和总设计师。

以ChatGPT为代表的大型语言模型在全世界范围内产生了巨大影响，被视为科技领域的革命性进展。

不过，面向未来，当前的大型语言模型发展不会是AI进步的全部。Ilya对此有一个比喻：如果把AI看作是身体，那还需要肌肉、骨骼和神经系统，你只拥有其中一个部件也不错，但那不会是真正的进展，你需要集齐所有的部件。

AI的发展还将继续。近期，在与斯坦福大学客座讲师Ravi Belani的线上对话中，Ilya分享了关于大型语言模型、深度学习以及OpenAI的未来发展的思考。

他预计，深度学习和大型语言模型会继续发展：这个领域的未来可能会有一小部分重大突破，加之许多细微改进，所有这些都将融入到一个庞大而复杂的工程体系。他还给出了一些有趣、可执行的思想实验。

（以下内容由OneFlow编译，转载请联系OneFlow获得授权。来源：https://www.youtube.com/watch?v=Wmo2vR7U9ck）

1 大型语言模型与人类智能

Ravi Belani：大型语言模型是生成式AI的关键技术，OpenAI目前正处于这一技术的最前沿，对这一技术有什么是你未曾预料到的？

Ilya Sutskever：大型语言模型的工作原理简单且迷人。众所周知，人脑由大量神经元组成，是世界上智能程度最高的东西。几十年来，神经科学家们一直在研究神经元，试图弄清它的工作原理，虽然生物神经元的工作之谜仍待揭开，但在上世纪四十年代早期，通过仔细观察，深度学习研究人员们做了一个大胆设想：人工神经网络中的人工神经元其实和生物神经元有点相似。我们可以在这一设想的基础上进行研究。

相比生物神经元，人工神经元要简单得多，并且我们可以对其进行数学研究。在这一领域被命名为深度学习之前，早期，深度学习先驱们取得了一个非常重要的突破——反向传播算法。这个算法是关于人工神经网络如何学习的数学方程，提供了一种在计算机中实现这个神经网络并编写代码的方法，并告诉我们神经网络应该如何根据经验来调整连接。

对学习过程以及学习过程运行条件的了解关系到我们所能取得的进一步进展。虽然我们用的是计算机去操作学习过程，但这却更像是实验科学或生物实验。大多数深度学习进展都可以归结为：在大型计算机中建构神经网络，然后用数据对其进行训练，让这些神经网络完成训练数据要求它们完成的任务。

大型语言模型的理念是：如果有一个大型神经网络，我们可以对其进行训练，让它根据前面的文本内容预测下一个单词。再看最初的猜想：也许生物神经元和人工神经元极为类似，没有太大区别。那么，如果有一个可以准确预测下一个单词的大型神经网络，它的运转方式也许类似于人们谈话时生物神经元的运转方式。如果我们和这样的神经网络对话，因为它能够准确预测下一个单词，所以可以在理解对话的基础上，准确地缩小生成对话的可能性范围。

精确猜测下一个单词需要进行预测，这也是理解的方式。我们很难清楚定义神经网络的“理解“，但我们可以轻易测量和优化网络对下一个单词的预测误差。

我们想要神经网络拥有“理解”能力，但能做的是优化预测，而这也正是我们目前在做的事。通过优化预测得到了目前的大型语言模型，它们都是用强大的反向传播算法训练的神经网络，由此可以想象，人工神经元和生物神经元并没有太大区别，如果留心观察，我们会发现人脑很擅长猜测下一个单词。

Ravi Belani：此前，我们认为机器是无法进行学习的，但现在发现机器可以学习，对即将发生的结果进行预测。如果人类处于1X学习阶段，那么与人类相比，ChatGPT等模型处于何种阶段？

Ilya Sutskever：我们很难在人工神经网络和人类之间做直接对比，因为人类可以从较少的数据中学习很多知识，但大型语言模型却无法做到这点，所以ChatGPT等模型才需要用更多的数据进行训练，以弥补它们在学习方面的先天不足。随着不断进行训练，这些神经网络会变得越来越优秀，学习速度也越来越快。

总体上看，神经网络和人脑还是有很大差异，学习方式大有不同。神经网络十分擅长数学和编程，为了掌握数学或编程等能力，它们需要学习吸收大量数学书籍，但对人类而言，做同样的事情，可能只需要看一两本数学书，再做一两百道练习题就够了。

Ravi Belani：如果不考虑数据方面的限制，让模型吸收尽可能多的数据，那它现在的学习能力是否达到了人类的十分之一？

Ilya Sutskever：这个问题给任何回答都具有误导性。显然，目前神经网络所储备的知识量以及所掌握的技术都远超人类水平，比如这些模型十分擅长诗歌创作，它们可以就任何话题发表长篇大论，还可以谈论历史等等。但从另一角度，人类可以对这些问题进行更深层次的探讨，比如人类专家可以在只读了少量文献的基础上，对某个话题发表深入见解。

Ravi Belani：机器的学习和适应速度是否会超过人类？这样的奇点是否存在？

Ilya Sutskever：会的。在这方面我们还会取得进展，但距离奇点的发生还要很久，我不能给出一个确切时间。

Ravi Belani：现在，有人对AI的发展表示担忧，特别是苹果的联合创始人Steve Wozniak和埃隆·马斯克，两人曾公开签署过一份请愿书，声称人类已经接近甚至可能越过了技术发展红线，如果现在不中止AI的发展，将无法控制其带来的后果。不过，Sam Altman（OpenAI CEO）对此基本持反对意见，在你看来，AI发展是否应该受到一些监管或监督的限制？

Ilya Sutskever：人工智能将变得非常强大，并具备真正的变革力量，我们确实需要朝着一个制定政府监管的世界前进，其中有以下几个方面需要考虑。

首先，我们希望生活在一个制定明确规则的世界，例如对训练更强大的神经网络制定规范。其次，我们需要对神经网络的训练进行谨慎评估，预测其当前和未来能够实现的能力，比如在一年之后或者训练完成时达到的能力。这些措施必不可少，以确保人工智能的发展合理并可靠。

我们追求的是一个每一步都经过充分准备、验证和认证的世界。我相信，这是我们应该致力于发展的正确方向。

机器“意识”的思想实验

Ravi Belani：你小时候曾困惑于“意识”这个概念，你是否认为“意识”、“感觉”或“自我意识”等是学习的延伸？“意识”是否无可避免，注定会产生？

Ilya Sutskever：小时候，看着自己的双手，我会好奇为什么眼前这个东西是我的手呢？“意识”仿佛是自然而然产生的，我不知道该如何更好地对“意识”进行解释。

众所周知，“意识”是很棘手的问题，它没有明确的定义，并且我们也没有“意识”检测系统。有时对于完美运行的系统，我们会猜测它也许具有“意识”，但出于某些原因，这个系统其实并没有“意识”。

将来，当AI系统能够快速从少量数据中学习时，我们也许可以用一种简单的方式在AI系统上做实验：在实验中，我们要非常谨慎地整理数据，确保数据未包含任何与“意识”有关的内容。这些训练数据只陈述客观事实，比如这里有一个球，那里有一座城堡，另一边有一个玩具等等，这类数据具有高度可控性。接下来几年，我们就用这类数据对模型进行训练。

或者，我们还可以让模型与许多不同的老师进行互动，让老师帮助它们学习，但在整个训练过程中，我们要十分小心，不能提及任何与“意识”相关的内容，只告诉模型最表层的概念。当训练达到一定程度时，我们再告诉AI与“意识”相关的内容。

试想一下，AI会有何种反应，它们会不会早就感受到了“意识”，然后说“天啦，我早就有这种感觉了，只是不知道该如何形容”，AI的这种反应是可以接受和预料的。

如果AI只有一些非常单调狭窄的训练数据，那么它可能永远不会有意识，但如果AI能以人类可理解的方式，正确且头头是道地谈论“意识”，那么它可能真的有“意识”了。

Ravi Belani：“意识”是程度问题还是二元问题？

Ilya Sutskever：“意识”是分程度的。比如当一个人非常累或者喝醉了，他的“意识”可能会在某种程度降低。在我看来，不同的动物拥有不同的“意识”程度，比如从狗到猫到老鼠再到昆虫的“意识”程度应该呈连续的下降趋势。

开源与闭源，营利与非营利

Ravi Belani：众所周知，OpenAI的使命是确保通用人工智能造福全人类。最初，马斯克招募你加入OpenAI，并捐赠了1亿美元，当时OpenAI还是一个非营利性的开源机构。马斯克表示，创办OpenAI最初的愿景是创建一股与谷歌和业界相抗衡的研究力量，考虑到AI对人类可能存在的潜在威胁，他不希望AI行业完全由企业和营利性组织掌控。如今，OpenAI却成为营利性的闭源组织，与微软关系密切，似乎正朝着微软和谷歌两家独大的垄断方向发展。

作为OpenAI的首席科学家，你如何看待这一转变？在做出这一决策时，你是否考虑了道德因素？还是说道德准则是其他人的责任，你的主要任务是推动技术发展？

Ilya Sutskever：我对OpenAI的一切事务都负有直接责任，即便我的角色主要是推动技术进步，但作为公司创始人之一，我十分关心OpenAI的整体影响。在这一背景下，再来讨论开源与闭源、非营利与营利。

AI的挑战在于它能够包罗万象，因而面临众多不同的挑战和利益冲突。开源与闭源之争就是一个很好的例子，为什么提倡AI开源？首先，开源AI能够防止权力过度集中于构建AI的人手中，如果只有少数几家公司掌控这项强大的技术，显然是不合理的，AI应当是开源的，任何人都可以使用。以上是支持AI开源的论点。

但显然，短期来看，出于商业利益，有人会反对AI开源。同时，长远来看，若有人相信最终AI将变得十分强大，如果未来某天你仅仅是告诉AI：“嘿！你能自主创建一个生物研究实验室吗？”它就能够自行处理所有的文书工作，找到合适的场所，雇佣技术人员，整合实验等，一切就开始变得难以置信。在这种情况下，AI是否也应该开源？

因此，关于开源问题，可能存在一种层级，来根据神经网络的能力、智能程度和可执行任务的范围来衡量其能力。当AI能力处于较低水平时，开源是一件好事，但在某一时刻（关于何时达到这一时刻可能会引发争论），AI的能力将变得无比强大，这时公开源代码显然是不负责任的行为。

我认为，目前AI的能力水平还不够高，不足以成为推动闭源模式的安全考虑因素。换句话说，这个问题可以分阶段来看。当前，我们正处于竞争阶段，但随着模型能力的不断增强，总有一天安全会成为一个显著而紧迫的因素，促使我们不再开源这些模型。

Ravi Belani：这是否是OpenAI后来选择闭源的决策动机，还是出于某种契约或商业上的考量，以获得来自微软或其他公司的资金支持，来支撑业务的发展，或是另有原因？

Ilya Sutskever：在某种意义上，如果OpenAI能够成为一个非营利组织，并一直保持这种状态直到完成使命，这种方式十分可取。然而，值得强调的是，这些数据中心成本十分昂贵，其中绝大部分都流向了云服务提供商。

为什么会出现这种局面？之所以需要这么多资金，是因为大型神经网络的性质决定了它们需要大量的计算资源，再无其他。

可以发现，学术界和人工智能公司之间正发生分化。几十年来，人工智能的前沿研究一直由大学的学术部门推进。直到2010年代中期，这种情况一直存在。但在某个时刻，当一个项目的复杂性提升，成本增加时，大学就失去了竞争力，如今，大学进行人工智能方面的研究需要寻求其他的方式，与过去和当前企业进行的方式截然不同。

基于以上原因，非营利组织的运转会出现问题，因为组织资助者难以从中获取回报，这就成了一场彻头彻尾的捐赠，而且很难说服人们为非营利组织筹集资金。

那么，有没有解决办法或行动方针？我们想到了一个方法，据我所知，OpenAI的这种开放式企业架构在世界上独一无二。

OpenAI不是营利性公司，而是一家有限营利公司，这意味着，OpenAI的股权更像是债券，而不是普通公司的股份。债券的主要特点是一旦支付完毕，整个流程就结束了。换句话说，与普通公司相比，OpenAI对投资者负有限责任。

Ravi Belani：创始人是否持有OpenAI的股份？

Ilya Sutskever：除了Sam Altman（OpenAI首席执行官）没有股份，其他创始人持有有限股份。

Ravi Belani：股份是如何设定上限的（capped）？我推测创始人不会购买OpenAI的股份，除非股份上限设定为名义股价（nominal share value）。

Ilya Sutskever：OpenAI这一机制与普通的初创公司股份制确实不同，但也存在一些相似之处，即加入公司的时间越早，股份上限就越高，因为需要更高的上限来吸引最初投资者。随着公司业务持续取得成功，上限会逐渐降低。这一点十分重要，这意味着，一旦向投资者和员工了却全部义务，OpenAI将再次成为一个非营利组织。

你可能会觉得这一机制不知所云，好像并没有改变什么，但还需要考虑人工智能未来的发展预期。我认为，OpenAI完全有可能在履行对投资者和员工的义务之后，成为一个非营利组织。当计算机变得十分强大，带来的经济破坏十分严重时，这一转变将大有裨益。

Ravi Belani：怎么看待OpenAI与微软的关系？

Ilya Sutskever：幸运的是，微软对这些问题的考虑方式十分正确，他们真正理解了人工智能的潜力及其重要性。

举个例子，微软是OpenAI的投资者，和谷歌与DeepMind之间的关系截然不同。所有投资OpenAI的人都签署了一份投资文件，在这个文件的顶部有一个紫色的方框，里面写着OpenAI的首要责任是履行自身的使命。

这意味着，如果出现该使命与其他利益发生冲突的情况，投资者有可能损失所有的投资。由此证明，微软和其他投资者都同意将OpenAI的使命置于首位。

专业化训练 vs 通用训练

Ravi Belani：在特定领域，比如法律或医学，使用专业的数据集进行训练能够获得更好性能，还是使用所有可用数据进行通用训练更加有益？

Ilya Sutskever：在某些情况下，专业化训练肯定能发挥巨大作用。我们进行通用化训练的原因仅仅是为了让神经网络能够理解我们所提出的问题。只有当它具有非常强大的理解能力时，我们才能进行专业化训练，并真正从中受益。所以，这两种训练方向都有前景。

Ravi Belani：什么时候会达到需要重点进行专业化训练的阶段？

Ilya Sutskever：在开源领域，人们已经开始进行专业化训练，因为他们使用的模型性能较弱，所以要尽可能地提升模型的性能。所以，需要专业化训练的阶段已经到来，不过这种趋势是循序渐进的，而不是绝对的选择。

我们可以将AI看成是由多个元素组成的集合，每个元素都能对其性能作出贡献。在特定任务中，专业数据集可以使AI表现得更好；从所有任务角度出发，性能更强的基础模型无疑也更有用。所以答案就是：我们不必非要二选一，也可以将两者结合起来。

OpenAI与深度学习的未来

Ravi Belani：OpenAI的重要发展指标是什么？衡量公司发展状况的KPI（关键绩效指标）有哪些？

Ilya Sutskever：对于KPI，这也是一个见仁见智的问题，每人衡量OpenAI是否成功的标准可能都有所不同，不过技术进步无疑是指标之一。但简单来说，针对重要问题，我们主要有以下KPI：

我们的研究做得如何？能否很好地了解自己的系统？有没有能力将其训练得更好？能否很好对其进行控制？研究计划执行得怎样？安全计划施行得好吗？我们对此的满意程度如何？这些问题都是衡量技术发展的重要KPI。虽然我们的产品本身也很酷，但核心技术和对技术的控制与引导才是OpenAI的重心所在。

Ravi Belani：即使在科研界，人们也很想获取OpenAI在技术方面的资料，包括模型的性能、规格及其训练方式的详细信息，同时希望能不受限制地与模型互动、访问训练参数。你们是否准备将其开放给研究人员或其他初创企业，以鼓励竞争和创新？

Ilya Sutskever：我认为，可以采取一些折中的方法。神经网络的行为空间非常广阔且复杂，所以模型访问（model access）及其各种组合可能非常有生产力。如果研究者在学术方面遇到问题，我们可以提供各种形式的模型访问，这也是许多学术研究实验室采用的方法。

Ravi Belani：有没有不为他人所知但你个人非常喜欢的ChatGPT功能或用例吗？

Ilya Sutskever：我个人非常喜欢它的作诗能力，但不能确定别人是否知道这个功能。它可以作诗、唱rap，非常有意思。

Ravi Belani：你们团队工作也会使用ChatGPT吗？当AI深度融合到人类团队中时，你们的工作动态会发生怎样的变化？这种融合会不会带来什么外界不知道但将会出现的情况？

Ilya Sutskever：ChatGPT提升了每个人的工作效率。我不能说对团队的工作动态有翻天覆地的影响，但确实有所变化。

Ravi Belani：Sam Altman曾表示，我们可能无法继续通过扩大语言模型规模获得进一步发展。你是否同意该观点？如果赞同，你们关注的下一个创新点是什么？

Ilya Sutskever：我不太清楚他具体谈了些什么，可能他的意思类似于“易于扩展的时代已经结束”。神经网络当然是越大越好，但构建神经网络需要很大精力和成本。

我认为，深度学习中有很多不同的前沿领域可供探索，而识别出这样的前沿领域也是为深度学习做贡献的一种方式。也许，在某个被他人所忽视的前沿领域中就会产出非常重要的成果。

Ravi Belani：你如何看待深度学习在未来五到十年的发展？

Ilya Sutskever：我预计，深度学习将得到进一步发展。在过去的一段时间里，大规模扩展带来了巨大进步，这在GPT-1到GPT-3的迭代中表现得尤为明显，但将来这种情况会有所改变。

规模化之所以能取得如此迅猛的进展，是因为此前有许多闲置的数据中心资源，可以通过重新分配这些资源实现快速进展。但今后的情况将会有所不同，一方面，建设数据中心需要时间，另一方面，模型训练所需的计算规模和资源变得非常庞大，通过规模化来取得成果不会像以前那么快。

如果非要预测的话，我认为，可能会发现一些目前尚未知晓的深度学习新属性，并加以利用。我坚信，五到十年后，我们将拥有比目前更先进的系统，具体形态将如何演变还未可知，因为未来可能会有一小部分重大突破，加之许多细微改进，所有这些都将融入到一个庞大而复杂的工程体系中。

Ravi Belani：在此期间，OpenAI的定位是成为像谷歌那样人们主动寻求的平台或服务提供商？还是会作为后端基础架构的一部分，为其他应用程序提供技术支持？

Ilya Sutskever：事物发展变换得太快了，现在这些技术还很新，或许你说的这两种形态都有可能，具体还有待观察。

给学生的建议

Ravi Belani：假如你是一位对AI感兴趣的斯坦福大学学生，目标是成为像你一样的人，那么你会把时间和精力放在什么事情上？如果你同时也对创业感兴趣，又会做些什么？

Ilya Sutskever：首先，通常情况下，无论你选择哪个方向，结合自己的个人独特倾向、技能或天赋总是个好主意。

其次，在AI研究方面，要探索自己的灵感。问问自己有没有什么对你来说显而易见，但其他人没有意识到的东西。如果有，则继续在这个方向追寻，看看你的直觉是否准确。虽然有时可能会有误，但我的导师Geoffrey Hinton曾说过：你应该相信自己的直觉，因为如果直觉准确，你就会取得巨大成功；即使不准确，你也无能为力。

最后是创业。相比于研究领域，个人的独特观点在创业时更具价值，因为你需要从自己独特的生活经历中汲取灵感。你可能会发现很多可能性，但需要在广阔的选择里聚焦一个方向，并采取行动为之努力。

其他人都在看

“开挂”的OpenAI革新者
关于大型语言模型的争论和局限
Geoffrey Hinton：智能进化的下一个阶段
为什么ChatGPT用强化学习而非监督学习
AI算力反碎片化：世界上最快的统一矩阵乘法
OneEmbedding:单卡训练TB级推荐模型不是梦
GLM训练加速：性能最高提升3倍，显存节省1/3

试用OneFlow: github.com/Oneflow-Inc/oneflow/

LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何部分格式化提示模板:LangChain中的高级技巧 nseejrukjhad langchain java 服务器 python
标题:如何部分格式化提示模板:LangChain中的高级技巧内容:如何部分格式化提示模板:LangChain中的高级技巧引言在使用大型语言模型(LLM)时,提示工程是一个关键环节。LangChain提供了强大的提示模板功能,让我们能更灵活地构建和管理提示。本文将介绍LangChain中一个高级特性-部分格式化提示模板,这个技巧可以让你的提示管理更加高效和灵活。什么是部分格式化提示模板?部分格式化提
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
绝招曝光！3小时高效利用ChatGPT写出精彩论文 kkai人工智能 chatgpt 人工智能 ai 学习媒体
在这份指南中，我将深入解析如何利用ChatGPT4.0的高级功能，指导整个学术研究和写作过程。从初步探索研究主题，到撰写结构严谨的学术论文，我将一步步展示如何在每个环节中有效运用ChatGPT。如果您还未使用PLUS版本，可以参考相关教程。**初步探索与主题的确定**起初，我处于庞大的知识领域中，寻找一个可深入研究的领域。ChatGPT如同灯塔，通过深入分析最新研究趋势和领域热点，帮助我在广阔的学
ChatGPT 高效学习套路揭秘：让知识获取事半功倍的秘诀 kkai人工智能 chatgpt 人工智能学习媒体 ai
最近这段时间，AI热潮因ChatGPT的火爆再次掀起。如今，网上大部分内容都在调侃AI，但很少有人探讨如何正经使用ChatGPT做事情。作为一名靠搜索引擎和GitHub自学编程的开发者，第一次和ChatGPT深度交流后，我就确信：ChatGPT能够极大提高程序员学习新技术的效率。使用ChatGPT一个月后，我越发感受到它的颠覆性。因此，我想从工作和学习的角度，分享它的优势及我的一些使用技巧，而非娱
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
效率神器来了：AI工具手把手教你快速提升工作效能 kkai人工智能人工智能学习媒体 ai chatgpt
随着科技的进步，AI工具已经成为提升工作效率的关键手段。本文将介绍一些实用的AI工具和方法，帮助你自动化繁琐的重复性任务、优化数据管理、促进团队协作与沟通，并提升决策质量。背景：OOPAI-免费问答学习交流-GPT自动化重复性任务Zapier：Zapier可以自动化多个应用程序之间的工作流程。例如，它能自动将Gmail中的附件保存至GoogleDrive，或在你发布新文章时，自动分享至社交媒体平台
程序员如何在AI时代保持核心竞争力 nfgo chatgpt 人工智能
程序员如何在AI时代保持核心竞争力随着AIGC（如ChatGPT、MidJourney、Claude等）大语言模型的相继涌现，AI辅助编程工具逐渐普及，程序员的工作方式正在发生深刻的变革。AI不仅能够自动生成代码，还能优化、调试、甚至提出解决方案。这一趋势让许多人担心：AI会不会最终取代部分编程工作？然而，也有人认为AI是提升效率的得力助手。那么，程序员在这个AI崛起的时代该如何应对？是专注某个领
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
腾讯发表多模态综述，一文详解多模态大模型存内计算开发者社区多模态大模型人工智能 chatgpt AIGC 量子计算 AI-native gpt agi
多模态大语言模型（MLLM）是近年来兴起的一个新的研究热点，它利用强大的大语言模型作为大脑来执行多模态任务。MLLM令人惊讶的新兴能力，如基于图像写故事和无OCR的数学推理，在传统方法中是罕见的，这表明了一条通往人工通用智能的潜在道路。在本文中，追踪多模态大模型最新热点，讨论多模态关键技术以及现有在情绪识别上的应用。腾讯AILab发表了一篇关于多模态大模型的最新综述《MM-LLMs:RecentA
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla

GPT总设计师：大型语言模型的未来

1

大型语言模型与人类智能

开源与闭源，营利与非营利

专业化训练 vs 通用训练

OpenAI与深度学习的未来

给学生的建议

你可能感兴趣的:(gpt,语言模型,人工智能,自然语言处理)