新加坡内哥谈技术

持续创新：AWS块存储的简史

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/

作者的大部分职业生涯都在构建系统软件，加入AWS之前，他主要专注于网络和安全领域。大约13年前，他踏入AWS，进入了一个全新的领域——存储。即使在那个时候，AWS的规模已经远远超过了他之前所做的任何工作，但他过去掌握的许多技术依然适用——将问题分解为基本原理，并通过逐步迭代来解决问题、提高性能。

如果现在看看AWS的服务，会发现已经有了一套成熟的核心构建模块，但事情并非总是如此。EBS（弹性块存储）在2008年8月20日推出，比EC2的测试版发布晚了近两年，当时的想法很简单，就是为EC2实例提供网络附加块存储。团队中只有一两个存储专家和一些分布式系统人员，主要依赖于扎实的计算机系统和网络知识。回头来看，如果当时知道自己还缺少多少知识，可能连这个项目都不会启动！

自从他加入EBS团队以来，有幸见证了EBS从使用共享硬盘驱动器（HDD）的产品，演变成如今能够为单个EC2实例提供数十万IOPS的服务。这个变化令人惊叹，因为现在单个实例能获得的IOPS甚至比早期HDD时代的整个可用区（AZ）的IOPS还多。更惊人的是，今天的EBS每天在分布式SSD集群上执行超过140万亿次操作。不过，这一切并不是一夜之间完成的，也不是通过某个重大改变实现的，甚至也不可能完美无缺。他刚加入EBS团队时，最初负责EBS客户端软件，这个软件负责将实例的IO请求转换为EBS存储操作。从那时起，他几乎参与了EBS的每个组件的工作，并为能够如此直接地参与EBS的发展感到欣喜。

EBS作为一个存储系统有其独特之处，主要因为它的主要工作负载是作为EC2实例的系统磁盘，这来源于过去数据中心服务器中的硬盘。许多存储服务将数据的持久性作为其主要设计目标，并愿意为此牺牲性能或可用性。但EBS的客户不仅关心持久性，还非常在意EBS卷的性能和可用性。EBS与EC2紧密相连，因此EBS卷的性能和可用性几乎直接影响到EC2的整体体验，进而影响使用EC2构建的应用程序和服务的运行体验。EBS的故事就是一个理解并改进大型分布式系统性能的故事，这个系统从顶部的客户操作系统一直延伸到底层的定制SSD设计。在接下来的分享中，他将讲述团队的这一旅程，其中包含的一些宝贵教训或许对其他系统也有启发。毕竟，系统性能优化是一个复杂且极具挑战性的领域，涉及多个领域的专业知识。

排队理论简述

在深入探讨之前，先回顾一下计算机系统与存储设备之间的交互方式。多年过去，存储设备连接到总线，总线再连接到CPU的高层原理并没有改变。CPU排队处理的请求会通过总线传输到存储设备，而存储设备要么从CPU内存中检索数据并最终将其放到持久存储介质上，要么从持久存储介质上检索数据并将其传输到CPU的内存中。

可以把这类操作类比成去银行办理业务。你走进银行存钱，但首先必须排队，等待办理业务的银行柜员。在理想情况下，客户到达银行的速度刚好和处理请求的速度一致，这样你就无需排队。但现实世界并不完美，它是异步的。更有可能的是，一批客户同时到达银行，比如他们可能乘坐同一辆电车或火车。这样一来，一部分客户就需要等待前面的人完成交易。

队列的存在不可避免地会影响客户的体验，虽然平均等待时间（延迟）可能看起来尚可，但队列中的第一个人体验最好，而最后一个人则要承受更长的等待时间。银行可以采取多种方式改善客户体验，比如增加柜员以并行处理更多请求，或是重新安排柜员的工作流程，以减少每个交易所需的时间，从而降低总等待时间和平均等待时间。也可以为不同需求的客户创建不同的队列，以降低整体排队时间。不过，这些改善措施都意味着额外的成本，例如为应对可能永远不会发生的高峰时段而雇佣更多的柜员，或者为了创建额外的队列而增加更多的营业面积。尽管如此，除非有无限的资源，否则队列依然是吸收高峰负载的必要手段。

在网络存储系统中，系统中有多个队列，涉及从操作系统内核到存储适配器的队列、主机存储适配器到存储网络的队列、目标存储适配器到存储介质的队列。在传统的网络存储系统中，不同组件可能来自不同供应商，它们对队列的处理方式各有不同。你可能使用的是专用的无损网络（如光纤通道），也可能是通过TCP传输的iSCSI或NFS协议，无论是使用操作系统的网络堆栈，还是定制驱动程序。调整存储网络往往需要专业知识，这与优化应用程序或存储介质的技能不同。

EBS在2008年首次构建时，市场上大部分存储介质还是硬盘，服务的延迟主要受到硬盘介质的限制。硬盘的IOPS性能几十年来一直相对稳定，约为120-150次每秒，而平均IO延迟为6-8毫秒。最大的问题是，由于排队和命令重新排序，硬盘的尾部延迟很容易飙升到几百毫秒。

早期团队意识到，要获得合理的性能，必须将客户工作负载分散到多个磁盘上。虽然这种做法有助于降低高峰延迟，但也导致了性能的不一致性，从而影响了更多客户。AWS意识到要提供高质量的客户体验，必须彻底解决这个问题，专注于避免“噪音邻居”效应。

随着AWS的发展，团队意识到，必须无情地专注于提供高质量的客户体验，这意味着要实现强大的性能隔离，以避免“噪音邻居”干扰其他客户的工作负载。AWS的规模带来了许多复杂的挑战，然而，令人惊讶的是，一旦深入理解系统，解决方案往往非常简单，并且由于系统规模的巨大，这些解决方案会产生巨大的影响。团队通过更改驱动程序的调度算法并将客户工作负载均衡到更多的磁盘上，取得了一些小的增量改进，但这些改进还不足以彻底消除“噪音邻居”问题。客户的工作负载太过不可预测，团队需要探索全新的解决方案。

设定长期目标，但不要害怕逐步改进

2011年作者加入AWS时，固态硬盘（SSD）开始进入主流，并且它们的容量已经开始让团队觉得有吸引力。SSD不再需要像HDD那样依赖机械臂来读取数据——随机请求几乎和顺序请求一样快，而且控制器和NAND芯片之间有多个通道可以快速获取数据。换个比喻，使用SSD代替HDD就像是把银行变成了一个足球场大小的建筑，并配备了能以极快速度处理交易的超级员工。一年后，团队开始使用SSD，并从此再也没有回头。

团队从一个小但意义重大的里程碑开始：构建了一种基于SSD的新存储服务器类型，并推出了一种新的EBS卷类型，称为Provisioned IOPS。推出新卷类型并不容易，而且这也限制了能够利用这种新技术的工作负载。但对于EBS来说，这意味着性能的显著提升，不过并没有完全达到团队的预期。

起初，团队以为只要用SSD替换HDD，几乎所有的问题都能解决，确实，SSD解决了很多由硬盘机械特性带来的问题。然而，出乎意料的是，系统的性能并没有如预期般大幅提升，“噪音邻居”问题也并没有自动消失。团队必须将注意力转向系统的其他部分——网络和软件堆栈——这是SSD提升后突显出来的新瓶颈。

即便如此，团队仍在2012年8月发布了Provisioned IOPS卷，性能提升显著，最大IOPS达到了1000，比现有的EBS标准卷高出10倍，平均延迟为2-3毫秒，提升了5-10倍，并且极大地改善了尾部延迟控制。客户对这个新卷感到非常兴奋，开始基于它构建关键业务应用程序。但团队并未因此满足，他们意识到，性能工程才刚刚开始，而要做到这一点，首先需要测量系统性能。

无法测量的，就无法管理

到2012年，EBS的历史已经积累了一些基础的遥测数据，但还远远不够。要知道修复哪些问题，首先需要知道系统的瓶颈在哪里，并根据修复的难度和收益来进行优先级排序。团队的第一步是为每个子系统中的每一个IO操作进行仪表化，包括客户端发起器、网络堆栈、存储持久性引擎以及操作系统。在监控客户工作负载的同时，团队还建立了一套连续运行的基准测试，以便监控更改的影响——无论是正面还是负面——并在已知的工作负载下进行监测。

通过新的遥测系统，团队确定了几个需要初步投资的主要领域。首先，需要减少整个系统中的队列数量。此外，Xen hypervisor在EC2中表现良好，但作为一个通用的hypervisor，它的设计目标和EC2的需求有所不同，功能过于复杂。团队认为通过投入资源，可以简化hypervisor中的IO路径，从而提高性能。再者，需要优化网络软件，核心持久性引擎则需要进行大量组织和代码优化，包括磁盘上的数据布局、缓存行优化以及全面采用异步编程模型。

在AWS的一个非常一致的经验教训是，系统性能问题几乎总是跨越了硬件和软件堆栈的多个层面。尽管“全栈工程师”这一理想值得推崇，但在深度和复杂的系统中，通常更有价值的是创建由各领域专家组成的协作团队，这些专家能够跨越整个堆栈并在他们各自的深度领域中展开创造性工作。

此时，团队已经有了专门负责存储服务器和客户端的团队，因此可以并行专注于这两个领域。此外，还得到了EC2 hypervisor工程师的帮助，成立了跨AWS的网络性能协作小组。团队开始构建一份既有短期战术修复又有长期架构变更的蓝图。

分而治之

在设计组织结构时，团队采用了“分而治之”的方法，将开发团队拆分为小团队，分别专注于数据复制、持久性和快照加载等特定领域。

团队通过“分而治之”的方法，将原本单一的开发团队拆分为小团队，分别专注于特定领域，如数据复制、持久性和快照加载等。每个团队都集中解决他们所面临的独特挑战，将性能优化任务分解为更小的部分。这些团队能够独立进行迭代并提交更改，这得益于团队建立的严格测试流程。为了让客户不断受益，团队制定了蓝图，并开始逐步拆分组件，同时部署增量更新。

增量交付的最大好处是可以在进行下一次更改前观察其影响。如果某项更改没有达到预期，团队可以轻松撤销并尝试其他方向。例如，2013年时，团队根本无法预见到亚马逊有一天会自己制造SSD，并且建立一个为EBS量身定制的技术栈。

质疑假设，永不停步！

质疑现有假设是推动每一层系统改进的关键。

团队从软件虚拟化开始。在2017年底之前，所有的EC2实例都运行在Xen hypervisor上。在Xen架构中，虚拟设备使用一个环形队列来让客户实例与驱动程序域（dom0）共享信息，以进行IO操作等设备模拟。EBS客户端作为一个内核块设备运行在dom0中。如果跟踪一个IO请求从实例发出直至离开EC2主机的路径，团队发现沿途有多个队列：实例的块设备队列、Xen环形队列、dom0内核块设备队列以及EBS客户端的网络队列。在大多数系统中，性能问题是多方面积累的，因此将组件单独处理通常是一个有效的做法。

团队编写了几个“回环”设备，以便隔离每个队列，评估Xen环形队列、dom0块设备栈和网络的影响。令人惊讶的是，即使在dom0设备驱动程序中几乎没有延迟，当多个实例尝试执行IO操作时，它们之间的交互会导致整个系统的有效吞吐量下降。团队发现了另一个“噪音邻居”问题！更糟糕的是，EC2的块设备队列和队列条目的默认设置实际上是基于很多年前Xen开发团队针对当时有限的存储硬件所设定的。这个设置每个主机只有64个IO请求并发，远远不能满足最苛刻的工作负载需求。

虽然团队修复了软件虚拟化中的主要问题，但这还远远不够。在2013年，团队已经开始开发第一个Nitro卸载卡，专门用于网络处理。这款卡片把VPC（虚拟私有云）的数据包处理从Xen dom0内核转移到了专用的硬件管道中，不再需要占用客户实例的CPU资源来处理网络流量。相反，Xen通过虚拟PCI设备直接传递给实例。这一举措大幅降低了延迟并提高了效率，因此团队决定对EBS存储也采取类似措施。

通过将更多处理工作转移到硬件上，团队消除了hypervisor中的多个操作系统队列，即使当时还没有准备好将设备直接传递给实例。不过，即便没有完全直通，利用硬件的中断处理能力，hypervisor所需的中断服务时间也大大减少。这第二张Nitro卡还具备处理EBS加密卷的硬件能力，几乎没有影响EBS卷的性能。此外，利用硬件进行加密意味着密钥材料可以与hypervisor分离，从而进一步保护客户数据。

将EBS迁移到Nitro平台是一项巨大的胜利，但几乎立刻又将压力转移到了网络本身。表面上看，问题似乎很简单，团队只需要使用最新的数据中心TCP优化参数调整线路协议，并选择最佳的拥塞控制算法。然而，一些变化正在悄悄影响团队的计划：AWS正在试验不同的数据中心布线拓扑，此外，原本作为单一数据中心的可用区（AZ）规模正在扩大，跨越了最初的物理边界。团队的调优工作确实带来了一些好处，比如在存储请求中添加少量随机延迟，反而减少了平均延迟和尾部延迟，这是由于网络上的平滑效应造成的。然而，随着系统性能和规模的不断提高，这些改动最终都成为了临时措施，团队必须持续进行测量和监控，确保性能不会退化。

团队认识到，需要一种比TCP更好的解决方案，于是从2014年开始为可扩展可靠数据报（SRD）协议奠定基础。这项协议旨在为存储提供更强的容错能力，能够绕过故障并轻松进行硬件卸载。通过专注于数据中心网络设计而非互联网的通用性，团队成功开发了一种允许IO请求乱序执行的协议，从而不再需要TCP那种严格的有序交付机制。SRD不仅提升了存储的性能，还被用于网络中。例如，在Elastic Network Adapter (ENA) Express中，SRD通过利用多个网络路径并减少网络设备中的队列溢出，提升了TCP栈的性能。

性能提升从来不是单一焦点的问题，而是通过持续质疑假设、测量和理解系统，并将精力转移到最具潜力的机会上的学科。

约束带来创新

团队并不满足于仅仅让少数卷和客户享受更好的性能，他们希望让所有客户都能从SSD的优势中受益。然而，规模的挑战让事情变得困难。EBS有数千台存储服务器，运行着数百万个非预置IOPS的客户卷。这些卷中的一些甚至至今仍然存在。完全淘汰所有硬件并进行替换，成本将非常高昂。

团队面临的挑战是如何在不干扰服务器冷却气流的情况下，找到放置SSD的位置。幸运的是，SSD通常较小且轻便，但不能让它们在机箱中随意摆放。经过几次试验和错误之后，在材料科学家的帮助下，团队找到了耐热的工业级魔术贴，并用它将这些SSD固定在服务器上，同时还能便于在服务器剩余生命周期内对SSD进行维护。

最终，团队在2013年内手动为每台服务器安装了一块SSD，并做了一个小改动：将新的写操作暂存在SSD上，这样可以立即返回完成信号给客户应用程序，然后再将数据异步地写入较慢的硬盘。这一切都是在不打扰客户的情况下完成的，团队就像是在空中将螺旋桨飞机改造成喷气式飞机。这一切的关键在于，团队从一开始就设计了能够无中断维护的系统，能够将EBS卷迁移到新的存储服务器，更新软件或重建空服务器。

这种迁移客户卷到新存储服务器的能力在EBS的历史上多次派上用场，无论是为了引入新的、更高效的磁盘数据结构，还是为了用新硬件替换旧硬件。有些EBS卷自2008年推出的头几个月起就一直在使用。这些卷在更新和重建过程中，可能已经经历了数百台不同的服务器和多代硬件的更替，但这一切都没有影响这些卷上的工作负载。

反思性能的扩展

最后，再分享一个在这个过程中发生的个人故事。在加入亚马逊之前，作者的大部分职业生涯都在早期初创公司或类似的小公司文化中度过。他曾经构建托管服务，甚至出于必要构建分布式系统，但从未参与过像EBS这样庞大的项目，无论是在技术上还是组织规模上。过去，他习惯于自己独立解决问题，或者与一两位同样积极的工程师合作。

作者非常喜欢深入挖掘问题，直到彻底解决为止。但有一个关键时刻，一位他信任的同事指出，他正在成为组织的性能瓶颈。作为一个对系统了如指掌的工程师，他对EBS的方方面面都非常关心，结果他卷入了每个升级事件，并且想要审查每一个提交和每一个设计更改。为了成功，他意识到必须学会“扩展自己”，而不仅仅依靠责任心和行动偏好。

这促使他开始在代码之外进行更多的实验。他知道自己在与其他聪明的工程师合作，但也意识到需要退后一步，思考如何让他们更高效运作。他最喜欢的一种工具是“同行调试”。他记得有一次和几位工程师在休息室里，投影出代码和几个终端。突然间，一位工程师喊道：“呃，这绝对不对！”就这样，团队发现了一个困扰已久的问题。设计上的疏漏虽然通常不会引发问题，但偶尔会导致请求响应变慢，修复这个问题后，消除了一个造成系统抖动

的根源。团队并非总是使用这种技术，但巧妙的是，在遇到棘手问题时，能够结合大家的系统知识来解决问题。

通过这一切，作者意识到，赋予他人权力，允许他们安全地进行实验，往往会带来比预期更好的结果。从那时起，他将很大一部分精力投入到如何消除阻碍，但同时保留必要的护栏，并推动工程师们走出他们的舒适区。工程领导力中蕴含着心理学，这是他之前未曾领悟的。他从未想到，职业生涯中最有成就感的部分之一竟然是鼓励和培养他人，看着他们独立解决问题，并最重要的是，与他们一起庆祝胜利！

结论

回顾团队的起点，他们知道自己可以做得更好，但并不确定能做得多好。团队选择了逐步改进的方法，而不是一刀切的变革。这种方法使团队能够更快地为客户提供价值，并随着对客户需求的不断了解进行调整。团队成功地将EBS延迟体验从最初每次IO操作平均超过10毫秒改善到如今最高性能的io2 Block Express卷，能够实现一致的亚毫秒级IO操作。所有这些改进都没有让服务下线，也没有重构整个架构。

当然，团队知道这还不是终点。客户的需求永无止境，而这种挑战正是激励团队不断创新和迭代的动力。

AI光速发展的时代，普通人怎么才能上车？头脑旋风 AI变现之路人工智能
文章开始之前希望大家支持一下我独立开发的微信小程序“头脑旋风”，或微信扫描我的头像进入，谢谢支持~在人工智能快速发展的今天，普通人上车并非易事，但通过系统化的策略和持续的努力，是可以实现个人成长和职业转型的。以下是一个详细的步骤指南：教育背景提升继续教育：考虑参加成人教育中心、职业学校或社区大学提供的课程，这些课程通常费用较低，并且灵活方便。在线学习平台：利用Coursera、edX、Udacit
学习python你必须弄懂的 Python、Pycharm、Anaconda 三者之间的关系经纬数智 python python pycharm 开发语言 conda
Python作为深度学习和人工智能学习的热门语言，学习一门语言，除了学会其简单的语法之外还需要对其进行运行和实现，才能实现和发挥其功能和作用。下面来介绍运行Python代码常用到的工具总结。一.Python、Pycharm、Anaconda关系介绍1.PythonPython是一种跨平台的计算机程序语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(
[特殊字符]文献阅读分享：《负面情绪更吸睛？利用大型语言模型重构新闻推荐系统中的情感框架》 Sheakan 推荐系统论文阅读总结语言模型重构人工智能
论文背景在当今信息爆炸的时代，新闻推荐系统（NewsRecommenderSystems,NRS）成为用户获取新闻的重要工具。然而，新闻内容的呈现方式（即新闻框架）对用户的参与度和付费意愿有着深远的影响。随着人工智能技术的发展，大型语言模型（LLMs）逐渐被引入新闻生产过程，为新闻框架的重构提供了新的可能性。本文通过实验研究，探讨了基于LLM的情感框架重构对用户情感、参与度和付费意愿的影响。相关工
AI 大模型创业：如何利用商业优势？ AI天才研究院大数据AI人工智能 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
第1章：AI大模型概述1.1AI大模型的概念与演进AI大模型（Large-scaleArtificialIntelligenceModels）是指通过大规模数据训练得到的复杂神经网络模型。这些模型通常具有数十亿甚至千亿个参数，能够实现从自然语言处理到计算机视觉、语音识别等广泛领域的任务。AI大模型的概念起源于20世纪80年代，当时研究人员提出了深度学习（DeepLearning）这一概念。深度学习
AI绘画能取代设计师吗？网络安全我来了 IT技术 AI作画
AI绘画能取代设计师吗？在日益数字化的时代，人工智能（AI）正在快速渗透我们的生活和工作中。特别是在设计领域，AI绘画这一新兴技术引发了热烈讨论。你是否也曾好奇，AI绘画是否有可能取代设计师的工作？让我们一同探讨这个引人深思的话题。1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后，离不开图像风格迁移、图文预训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家，利用不同
AI会对你的行业产生什么影响网络安全我来了 IT技术人工智能
AI对行业的影响：全面解析与展望在当今这个瞬息万变的时代，人工智能（AI）正如同一个强大的引擎，驱动着各个行业的迅猛发展。这不仅仅是一种技术的崛起，更是全球经济和社会结构的深刻变革。今天，让我们深入解析AI，尤其是生成式AI，如何影响我们的工作与生活，以及我们可以期待的未来。生成式AI的迅猛崛起生成式AI的定义与特点生成式AI，简单来说，就是机器学习的一个分支，通过学习大量数据，生成新的内容。这就
语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
Cursor AI Anjgst 人工智能
CursorAI完整指南：AI驱动的新一代编程工具目录简介主要特性安装与设置核心功能详解使用技巧价格方案常见问题简介CursorAI是一个基于VSCode的革命性AI驱动代码编辑器，它将人工智能与传统编程环境完美结合，为开发者提供更智能、更高效的编程体验。主要特性1.AI智能补全Tab智能补全：通过AI预测并补全多行代码上下文感知：理解整个项目结构和编码风格多语言支持：支持所有主流编程语言2.代码
cursor软件的chat和composer分别是什么 hunter206206 人工智能 python
Cursor是一款基于人工智能的代码编辑器，集成了类似ChatGPT的功能，旨在帮助开发者更高效地编写代码。以下是Cursor中Chat和Composer的具体功能：1.ChatCursor中的Chat是一个基于AI的聊天功能，类似于ChatGPT，但专门为编程场景优化。它的主要用途包括：代码解释：帮助你理解代码的功能或逻辑。代码生成：根据自然语言描述生成代码片段。代码优化：提供代码优化建议或重构
【AI中数学-数理统计-综合实例-包括python实现】揭开数据的面纱：真实样本数据的探索与可视化云博士的AI课堂 AI中的数学人工智能 python 数理统计数据预处理数据探索数据可视化机器学习
第五章：数理统计-综合实例1.揭开数据的面纱：真实样本数据的探索与可视化在人工智能（AI）应用中，数据是构建算法和模型的基石，而数理统计则为我们提供了理解和处理这些数据的工具。数据探索和可视化是数理统计中至关重要的步骤，它们不仅能帮助我们理解数据的分布、关系和趋势，还能够为后续的建模工作提供依据。本节将通过五个实际案例，展示如何使用数理统计和可视化技术对真实样本数据进行探索。每个案例都包括具体的描
AI人工智能代理工作流AI Agent WorkFlow：面向服务计算中的代理工作流管理 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：面向服务计算中的代理工作流管理关键词：人工智能，代理工作流，服务计算，自动执行，智能调度，协同处理，流程管理1.背景介绍1.1问题的由来随着互联网和云计算的快速发展，服务计算作为一种分布式计算模式，已经成为企业信息化建设的重要方向。在服务计算中，工作流技术被广泛应用于业务流程的建模、执行和管理。然而，传统的基于BPM（业务流程管理）的工作流管理
vLLM源码之分离式架构 Bj陈默架构
一、vLLM分离式架构概述1.基本概念vLLM是一个用于高效地服务大语言模型（LLM）推理的库。其分离式架构是一种创新的设计理念，旨在优化LLM的运行效率。这种架构将模型执行的不同阶段进行分离处理，主要包括请求处理、模型执行和结果输出等关键环节。2.设计目的提升吞吐量。通过分离式架构，可以并行处理多个请求，避免不同请求在处理过程中的相互干扰，充分利用硬件资源，特别是在处理高并发请求时能显著提高系统
OpenAI 函数调用功能入门 AI火箭 chatgpt openai
Javascript版Langchain入门作者：AI小火箭的HB我是AI小火箭的HB，我探索和写作人工智能和语言交叉点的所有事物，范围从LLM，聊天机器人，语音机器人，开发框架，以数据为中心的潜在空间等。介绍LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件）连接起来，允许开发人员将多个命令链接在
Python 库的记录 weixin_40895135 python
GitHub-jobbole/awesome-python-cn:Python资源大全中文版，内容包括：Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。vir
CVPR‘24开源 | ADA-Track：端到端3D多目标跟踪最新SOTA！计算机视觉工坊 3D视觉从入门到精通 3d 目标跟踪人工智能
编辑：计算机视觉工坊添加小助理：dddvision，备注：方向+学校/公司+昵称，拉你入群。文末附行业细分群扫描下方二维码，加入3D视觉知识星球，星球内凝聚了众多3D视觉实战问题，以及各个模块的学习资料：近20门视频课程（星球成员免费学习）、最新顶会论文、3DGS系列、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研，欢迎扫码加入！
词表设计：特殊Token区域与共享去区域的深入探讨东方佑开发语言
在自然语言处理（NLP）中，Tokenizer的设计对于模型性能有着至关重要的影响。Tokenizer不仅决定了文本如何被分割成更小的单位（即token），还决定了这些token如何被映射到模型可以理解的形式。本文将详细探讨一种特殊的Tokenizer设计方法——特殊Token区域与共享去区域的设计理念，并介绍其应用场景和实现方式。特殊Token区域概述特殊Token区域通常包括一些特定的标识符，
Python语言的安全开发慕璃嫣包罗万象 golang 开发语言后端
Python语言的安全开发引言在信息技术迅速发展的今天，网络安全问题愈发凸显。随着Python语言的广泛应用，尤其是在数据分析、人工智能、Web开发等领域，其安全问题越来越受到重视。Python作为一门高效且易于学习的编程语言，虽然在开发过程中为我们提供了很多便利，但如果忽视了安全性，将可能导致严重的安全漏洞和数据泄露等问题。因此，本文将围绕Python语言的安全开发展开讨论，重点分析常见的安全问
知识图谱与大语言模型：构建智能问答系统 AGI大模型与大数据研究院大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
1.背景介绍在当今的信息时代，数据的获取和处理已经成为了我们生活中不可或缺的一部分。然而，随着数据量的爆炸性增长，如何从海量的数据中提取有用的信息，进而为用户提供精准的服务，已经成为了一个重要的研究课题。在这个背景下，知识图谱和大语言模型应运而生，它们通过对数据的深度挖掘和智能处理，为构建智能问答系统提供了可能。2.核心概念与联系2.1知识图谱知识图谱是一种新型的数据结构，它以图的形式表示实体之间
Deepseek技术浅析（一）爱研究的小牛 AIGC—概述大模型 AIGC 人工智能深度学习自然语言处理
DeepSeek是北京深度求索人工智能基础技术研究有限公司推出的人工智能技术品牌，专注于大语言模型（LLM）的研发与应用。其技术涵盖了从模型架构、训练方法到应用部署的多个层面，展现出强大的创新能力和应用潜力。以下将详细介绍DeepSeek的核心技术、工作原理以及具体实现方式。一、核心技术1.大语言模型（LLM）DeepSeek的核心产品是自研的大语言模型，其主要特点包括：(1)基于Transfor
Synthesia技术浅析（四）：自然语言处理爱研究的小牛 AIGC—视频 AIGC—虚拟现实 AIGC—自然语言处理自然语言处理人工智能 AIGC
Synthesia的自然语言处理（NLP）模块是其核心技术之一，涵盖了文本转语音（TTS）、情感分析以及多语言支持等多个方面。一、文本转语音（TTS）1.关键组件Synthesia的TTS系统主要依赖于Tacotron2和WaveGlow模型。这些模型共同作用，将文本转换为高质量的语音。2.过程模型详解2.1文本预处理文本预处理是TTS的第一步，包括分词、标点符号处理、数字和日期格式转换等。分词（
启元世界（Inspir.ai）技术浅析（一）爱研究的小牛 AIGC—游戏制作人工智能机器学习 AIGC 深度学习
启元世界（Inspir.ai）作为全球领先的通用人工智能平台公司，自2017年成立以来，一直致力于通过人工智能技术提升产业效能和生活体验。公司汇聚了来自全球顶尖公司和高等学府的技术专家，专注于深度强化学习、推荐算法以及机器学习系统平台等前沿领域，并成功将人工智能技术应用于数字娱乐、智能决策和机器人等多个领域。一、核心技术启元世界在人工智能领域取得了多项突破性进展，其核心技术涵盖了以下几个方面：1.
Lumen5——AI视频制作，提取关键信息生成带有视觉效果的视频爱研究的小牛 AIGC—视频人工智能 AIGC 深度学习
一、Lumen5介绍Lumen5是一款基于人工智能的自动化视频制作平台，专为非专业用户设计，帮助其将博客、文章、新闻等文字内容快速转换为视频。Lumen5的目标是简化视频制作流程，让内容创作者、市场营销人员、社交媒体团队等无需视频制作经验即可轻松制作吸引观众的高质量视频。二、Lumen5的主要功能文字转视频Lumen5最具特色的功能是通过AI自动将文本转化为视频。用户可以输入一段文字或直接粘贴文章
python神经网络框架有哪些,python调用神经网络模型小明技术分享 python 神经网络深度学习
人工智能Python深度学习库有哪些由于Python的易用性和可扩展性，众多深度学习框架提供了Python接口，其中较为流行的深度学习库如下：第一：CaffeCaffe是一个以表达式、速度和模块化为核心的深度学习框架，具备清晰、可读性高和快速的特性，在视频、图像处理方面应用较多。Caffe中的网络结构与优化都以配置文件形式定义，容易上手，无须通过代码构建网络;网络训练速度快，能够训练大型数据集与S
OpenCV中的图像处理函数详解 Luzem0319 opencv 图像处理人工智能
在OpenCV中，图像处理函数是实现图像处理和计算机视觉任务的基础。下面将详细介绍六个重要的图像处理函数：二值化函数、自适应二值化函数、腐蚀函数、膨胀函数、仿射变换函数和透视变换函数。一、二值化函数功能二值化函数（cv2.threshold()）用于将灰度图像转换为二值图像。二值图像中，每个像素只有两种可能的值（通常是0和255），分别代表黑色和白色。参数src：输入图像，应为灰度图像。thres
OpenCV中的边缘检测和轮廓处理 Luzem0319 opencv 人工智能计算机视觉
在图像处理和计算机视觉任务中，边缘检测和轮廓处理是非常重要的步骤。OpenCV库提供了多种函数来实现这些功能，包括Sobel算子、Laplacian算子、Canny算子、findContours函数、drawContours函数以及透视变换函数等。本文将详细介绍这些函数的功能、参数、返回值和应用。1.Sobel算子函数功能：Sobel算子用于计算图像灰度的近似梯度，梯度越大越有可能是边缘。参数：s
人工智能的前景与未来就业市场：机遇、挑战与社会影响苹果酱0567 面试题汇总与解析 java 开发语言中间件 spring boot 后端
随着科技的飞速发展，人工智能（AI）已经逐渐渗透到我们生活的方方面面，它不仅引领着技术革新的浪潮，更在无声中重塑着我们的就业市场和社会结构。站在这个时代的交汇点上，我们不禁要问：人工智能将如何影响我们的未来就业市场？它带来的究竟是机遇还是挑战？回望过去，每一次科技革命都伴随着就业市场的剧烈震荡。而今，人工智能作为第四次工业革命的核心驱动力，正以前所未有的速度改变着劳动力市场的格局。从自动化生产线上
探索SakuraLLM：轻小说与Galgame翻译的新纪元蒋素萍Marilyn
探索SakuraLLM：轻小说与Galgame翻译的新纪元SakuraLLM适配轻小说/Galgame的日中翻译大模型项目地址:https://gitcode.com/gh_mirrors/sa/SakuraLLM在人工智能的浪潮中，SakuraLLM以其独特的魅力和强大的功能，成为了日中翻译领域的一颗璀璨明星。本文将深入介绍SakuraLLM项目，分析其技术特点，探讨其应用场景，并揭示其与众不同
大模型问答机器人的智能化程度 AI大模型应用之禅 AI大模型与大数据 java python javascript kotlin golang 架构人工智能
大模型、问答机器人、智能化程度、自然语言处理、深度学习、Transformer模型、知识图谱、推理能力、对话系统1.背景介绍近年来，人工智能技术取得了飞速发展，特别是深度学习的兴起，为自然语言处理（NLP）领域带来了革命性的变革。其中，大模型问答机器人作为一种新型的智能交互系统，凭借其强大的语言理解和生成能力，在客服、教育、娱乐等领域展现出广阔的应用前景。问答机器人是指能够理解用户自然语言问题并给
AI学习指南Ollama篇-Ollama的多模态应用探索俞兆鹏 AI学习指南 ai
AI学习指南应用篇-Ollama的多模态应用探索一、引言（一）背景介绍随着大语言模型（LLM）的发展，多模态应用（结合文本、图像、语音等）成为新的趋势。多模态模型能够处理多种类型的数据，如文本、图像和语音，从而提供更丰富、更智能的交互体验。Ollama作为本地部署工具，支持多模态模型的运行，为开发者提供了强大的功能。（二）文章目标本文将探讨Ollama在多模态应用中的可能性，并通过实际案例展示如何
SpringBoot中运行Yolov5程序 eqa11 spring boot YOLO 后端
文章目录SpringBoot中运行Yolov5程序一、引言二、环境搭建1、SpringBoot项目创建2、YOLOv5环境配置三、SpringBoot与YOLOv5集成1、创建Python服务2、SpringBoot调用Python服务四、使用示例1、创建控制器五、总结SpringBoot中运行Yolov5程序一、引言在人工智能领域，目标检测是一个热门且实用的技术。YOLOv5作为目标检测算法中的
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe