NetEaseResearch

网易数帆如何用 Kubernetes“原语”实现云原生中间件升级

在近日的 ArchSummit 全球架构师峰会 2021 上海站上，继网易副总裁、杭研院执行院长、互联网技术委员会主席、网易数帆总经理汪源发表主题演讲《打造开放的云原生操作系统和系统软件架构》之后，网易技术委员会委员、网易数帆基础架构总监张晓龙向与会者进一步讲述了网易数帆在云原生中间件上的思考、实现与经验。本文为演讲内容实录。

今天给大家分享我们面向生产环境的中间件容器化实践，主要包括四个部分的内容：

第一部分从基础中间件面临的运维挑战出发，介绍网易解决这些挑战的技术演进路径，以及为什么要去做中间件容器化。

第二部分介绍中间件容器化的需求以及网易数帆整体平台架构。

第三部分针对中间件容器化过程中的一些共性问题，给出我们的思考，以及最佳实践。

最后是中间件容器化工作的总结和未来的计划。

基础中间件的挑战

在容器技术出来之前，基础中间件技术如 MySQL、Redis、Kafka 等早已开源，并成为服务端架构设计的标准组件，一个典型的互联网应用，数据库、缓存、消息队列三大中间件是必不可少的。

架构师应用这些中间件去架构一个个应用平台非常简单，但运维人员遇到了较大的问题，包括如下 5 个方面：

中间件本身是比较复杂的分布式系统，运维需要理解这些分布式系统的工作原理，编写出适合它们的运维脚本，复杂性非常高；
运维效率比较低下，50 个以下 MySQL 实例用手工运维可能没有问题，但 500、1000 个数据库实例，或者如网易云音乐的数千个 Redis 实例，如果还用手工脚本来运维，效率必然很低；
稳定性不足，这是由于运维人员总是用手工脚本来运维，在线上抄命令，不小心抄错命令可能中间件就宕了；
传统的中间件是部署在物理机上面的，而物理机制没办法提供很强的资源弹性；
所有比较资深的中间件运维都基本上在互联网上大厂，因为这些运维非常复杂，一般企业很难招到一个非常专业的运维，我们认为解决这个挑战的最佳实践，是将中间件运维能力云服务化。

将这些中间件做成云服务有几个优势。第一是运维简单易上手，第二能够高效地实现大批量实例的自动化运维，第三有很强的 SLA 保障，因为不需要敲太多手工的一个命令。第四是能借助 IaaS 弹性资源能力快速扩容。最后因为整个运维变得简单，不再需要大量的专业人员就可以帮业务运维好中间件。

其实公有云厂商也看到了这个趋势，国内三大主流公有云都把开源的基础中间件做成了云服务。我想这主要有两个原因：首先，IaaS 资源层面竞争趋于同质化，把 PaaS 中间件做成云服务可以消耗更多的资源，把用户绑定得更深；其次，中间件作为云上的增值服务，毛利率远高于云主机、云硬盘，所以很多公有云用户不喜欢 RDS，自己买云主机搭 MySQL。

为了解决中间件运维复杂性的挑战，网易在六七年前就研发了一个云基础中间件平台。这个平台有一些技术特点，首先是基于 IaaS 提供资源弹性，也就是说中间件运行的计算资源是云主机，存储资源是云盘，网络资源可能就是在租户的 VPC 里面。

第二它采用了 IaaS 的租户隔离策略，如果一个租户想要中间件实例，平台就用他的云主机、云硬盘自动化地帮他搭起来，可以做到不同租户之间很好的隔离。

我们当时研发了 6 款基础中间件云服务，业务团队研发产品需要中间件，它只需要接入这些云服务就可以了，不需要重新做一遍。我们主要做的是左边的控制管理部分，比如实例高可用、部署安装、实例管理等。当时我们也取得了一些成效，大大提升了运维团队对中间件的运维能力。

随着时间的推移，第一代基础中间件暴露出了三大缺陷，难以解决。第一大缺陷是极限性能不足。因为它使用 KVM 虚拟机作为计算资源，比在物理上运行有非常大的性能折损，没办法满足业务高负载/高压力下对中间件性能和稳定性的苛刻要求。

第二是实现资源成本太高，因为它是基于 OpenStack 来提供资源编排能力，另外 KVM 虚拟化技术强隔离的特性使得内存资源没办法在多个中间件实例之间共享，这两个因素使得跑在虚拟机上的中间件实例部署密度非常低，哪怕有租户的中间件负载不高，他也不可能把内存释放，因为 KVM 是强隔离的。

第三点它的交付非常不灵活，它就跟网易的 IaaS 绑定，没办法支持我们未来把它商业化，输出到网易以外的企业，这个企业的基础设施可能是在公有云上，也可能是在自己的 IDC 机房。

中间件容器化的思考

近几年，Docker、Kubernetes 等容器技术诞生并飞快发展，无状态应用的容器化已经成熟，我们认为容器作为一个新的已经广泛落地的基础设施的技术，完美地对应了第一代基础中间件的缺陷能力—弱隔离有有助于资源共享；轻量化的虚拟化能够消除性能损耗，满足业务在高负载场景；基于镜像进行标准化的封装，有利于高效交付；还有强大灵活的调度能力；最关键的一点，它是整个云原生技术栈的一个基石。

Kubernetes 编排技术，最关键的是它跟基础设施是松耦合的，使得我们能够将应用搬到任何一个地方，因为它就是面向混合云设计的。另外它是面向大规模生产环境的设计，继承了 Google 的大规模生产环境的经验，所以用容器技术解决中间件服务化的问题是有希望的。

网易内部基于 Kubernetes 构建了一套云原生操作系统，它向下能够适配各类的基础设施资源，向上能够作为各种应用负载的统一提供商--这也是 Kubernetes 的目标之一。中间件正是整个云原生操作系统所要支撑的一类业务。从这个角度来看，中间件容器化也是顺理成章的。

中间件容器化要解决它的运维问题，尤其下面几个需求必须要考虑的。

第一，生命周期的管理，我们需要容器化中间件平台能够帮助运维完成对于中间件实例级别的各种运维操作，网易数帆会基于 Kubernetes Operator 这一套框架来实现。

第二点是高可用的部署，中间件，特别是在追求更高的可用性的情况下，往往要做多机房的部署，一个中间件集群里面的所有实例，要按照什么样的比例分布在不同的机房，标准的 Kubernetes 调度器没办法做到，我们需要扩展 Kubernetes 的调度器来实现这样的编排。

同时，还要完善监控告警的指标，这个指标就对应云原生的 Prometheus 的可观测性体系。

性能是第一代中间件的一个痛点，我们要确保容器化中间件基本达到物理机部署的性能才能支撑核心应用，这需要有针对性地优化各类中间件实例的性能。

还有一点是产品化，因为我们希望中间件容器化不仅能够在网易使用，还能够商业化输出，所以我们参考公有云上 RDS、Redis 的产品形态，需要有同等的产品能力，能够在任意的基础设施上低成本、灵活交付，我们必须采用松耦合和高复用的架构设计。

网易数帆选择了 Kubernetes Operator 的机制。从深层次理解，Kubernetes 构建了一个分布式系统部署运维所需的“原语”，它内置的对象如 Pod、Node、Deployment、StatefulSet 等，都是为了实现一个典型的无状态分布式系统提出来的。这些内置的对象相互配合，使得无状态应用的部署和运维非常高效。

但是 Kubernetes 内置的这些对象没办法直接解决中间部署运营的问题。第一点，中间件是有状态的，它的状态是存储，可能网络 IP。第二，中间件实例与无状态应用的实例不同，后者的副本相互之间没有关系，而中间件实例和实例之间、副本和副本之间是有关系的，是要相互访问的，中间件之间形成一个复杂的拓扑关系，比如在做故障恢复时，Redis 两个副本之间是有主从关系的。

社区在两年多之前也开始实现中间件或者说有状态的应用，提出了一套 Operator 开发框架。如果我们把 Kubernetes 理解成为一个操作系统，那么 Operator 就是在这个操作系统上开发原生应用的一套开发框架，支持更高效、更自动化、更可扩展的开发方式。

Operator 有 4 个特点，第一它是需要开发出来，是遵循的声明式的编程理念，有对象的定义，还有控制器部署。Operator 其实是一个控制器，遵循着观察、分析、行动的决策链闭环。如果用户定义了 4 个资源，Operator 就分析这 4 个资源当前的状态和目标状态有哪些不一致。

图中可以看到当前的状态有 1 个 Pod，他现在是 0.0.1 的版本，我们定义的状态要求 0.02，还少了一个 Pod，如果发现了不一致，它会有一些 Action，再扩一个 Pod，把它升级到 0.0.2。我们实现 Operator，其实就是去写这些 Action 应该怎么做。这实际上是封装了特定领域的运维知识跟经验，能够被设计用来管理复杂的状态应用。

Operator 开发框架的主体包括三部分，第一部分 operator-sdk，研发的一个脚手架；第二部分是 operator-lifecycle-manager，一个生命周期管理的组件；第三部分是 operatorhub.io，既然任何人都可以为开发一个应用，一个它可以部署安装运维的应用，他就应该可以把这个应用放到一个应用市场，operatorhub.io 就是这样的一个应用市场。

不同的机构去开发 Operator，在运维看来是有一定的成熟级别的，应用部署都能够自动化运维，这是对应运维最希望的一个级别。最基本的第一个级别就是基本安装 Operator，该怎么去做到把原来安装部署脚本，用 Operator 这种工程模式实现。

这是网易数帆实现的一个基于 Kubernetes Operator 的中间件平台架构，包括控制面和数据面。左边控制面面向运维管理的能力，包括一些跟中间件业务无关的但是大家都需要的通用组件，如审计、认证权限、控制台等。

中间就是中间件 Operator，在这里我们用 Operator 的机制研发了 Redis、Kafka、MySQL 等中间件。

我们实现了中间件的生命周期管理，这些 Operator 本身也是运行在 Kubernetes 的上面，而且它是一种无状态应用，以 Deployment 方式可以运行在上面，因为它的状态都是存在 etcd 里面的。

再下面是 Kubernetes 的管控面，Master 节点需要的一些组件。

最下面是日志、监控、报警的组件，我们自研的一个日志管理平台实现从采集信息去动态更新它的配置，以及把日志收集上来。

右边是中间件的数据面，我画了三个 Node，我们把一个中间件的集群用 StatefulSet 来实现，每一个实例跑在一个 Pod 上，每个 Pod 可能会声明它的对持久卷的用途，Pod 跟 Node 之间是有拓扑关系的，它需要相互进行数据和拓扑同步，用于状态变更以及故障恢复。每个节点上都会运行 Kubernetes 的两个组件，Kublet，kube-proxy，还有一个采集器，用于日志监控。

我们还实现了 Pod 的挂盘功能，不管是本地盘还是远程盘，通过 StorageClass 的方式去实现，这也是 Kubernetes 的标准。

中间件容器化的共性问题与解决之道

接下来探讨中间件容器化过程中的一些共性问题的解决办法。中间件最大的特点在于它是有状态的，Kubernetes 只负责计算的编排，中间件的状态存储有两种可能，一种是远程存储，一种是本地存储。

我们认为远程存储是最佳实践。如果你在私有云环境上有一套类似于开源 Ceph 的远程分布式存储，应该毫不犹豫地使用它来存。如果说 Ceph 性能不足，你可以找其他更好的分布式存储来去直接用。如果你在公有云上，那你应该毫不犹豫地用云盘来作为中间件的存储。

很多情况下，本地存储是不得已而为之的一个选择，因为没有太靠谱的分布式存储，有可能这个分布式存储性能不行，和用本地盘跑起来相差很远，也有可能分布式系统后端可靠性不行，会丢数据。

为此，我们实现了本地存储的接入。我们做本地存储需求有两个，一是要求当 Pod 去申请 PVC 的时候做好动态管理配置，本地盘在创建、删除时，要去做对应的操作。同时在 Pod 调度时，要实现它与本地盘强绑定，既然 Pod 开始创建的时候，有本地盘在某一个 Node 上，你必须保证 Pod 经过故障恢复或者重调度之后还是跑在那个 Node 上，以确保中间件数据不丢失。

在技术实现上，我们对于节点上的本地磁盘引入了一个 LVM 去动态的管理，也采用了 Kubernetes Local PV，后者的不足在于需要运维提前在节点上创建 PV，这个是不可取的。所以我们做了两件事，一是调度器扩展，实现本地存储的资源准备，在创建 Pod 时声明所需本地盘的大小，它就能够动态给创建挂载到这个 Pod 里面去，不需要运维提前手动准备。

如图中一个 Pod 的调度过程，用户创建了一个 Pod，它声明了一个 PVC，我们加了一个本地存储调度器扩展，先做一个预调度，算一下每个节点上的本地盘的存储容量够不够，如果够就把 Node 的信息也放到 PVC 里面，接下来通知这个 Node 上一个本地存储资源准备器，让资源准备器收到请求的时候去调用 LVM 把存储资源给创建出来，并把对应的 PV 创建出来。在资源准备器上把 PV 和 PVC 绑定，然后通知调度器可以把 Pod 调度到这个节点上，因为声明的本地存储已经准备好。接下来用 Kubernetes 把那个节点所在的本地盘挂载到 Pod 里面去，完成一个整体的调度。

关于中间件容器化的网络，有两个场景的实现。第一个场景，我们设计的中间件运行在不同的基础设施上，对应不同的网络配置，如果是物理网络，可以用 Calico、Flannel 这样的网络方案，直接用它的 CNI；如果是公有云，就对接公有云上的 VPC 网络，好处是每一家公有云都为 Kubernetes 提供了一个标准 CNI，使得运行在云主机上的 Kubernetes 可以去接入他们的网络。

第二个场景，我们需要优化网络性能。我们引入了一个容器的 SR-IOV 方案，好处是能够做到优于物理机的低时延。它采用的是网卡直通技术实现，能够降低 50%的时延，可以满足一些对时延要求很高的超高性能任务需求，但 PPS 提升不了。直通少了网络传输的虚拟化开销，但是缺点也比较明显，这个方案只能用在物理网络，因为它完全依赖于硬件网卡，无法用在公有云上实现网络加速。

在物理网络环境上要去处理网卡异构问题，包括说是我们可能用英特尔网卡，可能有 Mellanox 的网卡，需要对 VF（SR-IOV 的一个概念）进行精细管理。我们把 VF 当成一个扩展的调度资源，通过标准的 Kubernetes Device Plugin 来发现和注册节点的 VF 资源，结合 label 和 taint 标记，原生的调度器就可以进行资源管理和分配。

轻舟中间件的集群是用 StatefulSet 抽象的，每个实例都是 StatefulSet 的一个 Pod，StatefulSet 只能做到 Pod 的名字不变，它发生不同更新的时候，或者挂了再恢复的时候，都保持 Pod 的名字不变，但是它没办法保持 Pod 的 IP 不变。然而，在传统的中间件运维眼里，基于物理机部署的 IP 是不变的，机器重启之后也还是原来的 IP，所以他们的一些运维习惯，都是喜欢用 IP 而不是域名。

为了让容器化中间件能够更快地推广落地，以及兼顾已有的应用，我们做了保持 StatefulSet 的 IP 不变的功能，通过引入一个全局的容器地址池组件接管对 Pod IP 的分配来实现。创建 StatefulSet 的时候，把分配给它的 IP 记录好，哪怕 Pod 更新的时候被删掉，IP 还给保持住不释放，等它重新建起来之后，如果名字跟原来那个是一样的，就把这个 IP 重新分配给他。

工程化，我们研发容器化中间件，相对于第一代基于虚拟化的中间件，因为重用了 Kubernetes 内置的一些概念以及它在运维、控制上的一些机制，使得我们去研发相同的基础中间件，研发代价能够大幅度减少，这个体现在代码比第一代基础中间件要减少很多，当然这个代码减少也是有代价的——开发人员必须非常了解 Kubernetes Operator 这套开发框架，必须得深刻地理解 Kubernetes 声明式编程的概念，他才能写出来。

在质量保障方面，我们做了两个事情，第一个就是混沌测试，就是故障测试，基于开源的 ChaosBlade 去模拟 Kubernetes 资源故障对中间件服务的影响，另外我们也借助 Kubernetes e2e 测试框架来确保运维人员能够模拟各种中间件实例的生命周期操作是否正常。

还有一点，要做中间件实例生命周期管理，需要做监控、告警，很多情况下它的 UI 都是有共同之处，UI 的使用模式都是一样的，这是我们设计的一个前端页面渲染，渲染引擎使得用动态表单机制能够很快地开发控制台，后端通过配置一下就可以实现控制台业务的开发能力，这样使得研发代价更小。

性能优化，我们采取了一些策略，使得容器化中间件的性能基本接近于它运行在物理机上的水平。我们在 CPU 开了性能模式，降低唤醒延迟。在内存方面，我们关闭 SWAP 及透明大页，调优同步内存脏页回写阈值，这些都是参数级的调优。

I/O 方面使能内核 blk-mq，增大预读缓存。还有一个比较重要的就是网卡中断，我们将物理方法中断跟容器的 veth 虚拟网卡中断处理跟 CPU 给隔离了，确保系统性能不发生抖动。

NUMA 也是我们优化的一点，这在高负载上面体现得比较明显。我们使得容器部署感知 NUMA 拓扑，将 Pod 尽量的分配在本地的 NUMA，尽量不要让一个 Pod 跨 NUMA，以免带来比较大的 CPU 缓存的开销。

第一代中间件的一个缺陷是不能够去往外交付。去年我们做了容器化中间件这个产品，名字叫轻舟中间件，具备基础中间件的标准能力。在接入层我们也增加了一些能力，因为我们基于 Kubernetes 来做的，运维人员甚至可以通过 Kubectl、YAML 文件就可以运维中间件。中间件服务层，我们实现了 7 个基础中间件服务，这些中间件基本上具备了前面提到的核心运维能力。

整体上中间件基于 Operator，能够跑在任意 Kubernetes 集群之上，底层的资源无所谓，公有云的虚拟机可以作为 Kubernetes 的 Node，云盘可以作为 Kubernetes 的存储。另外，我们也允许社区基于 Operator 开发的一些中间件在我们的平台上跑。

未来展望

技术是为业务服务的，中间件最大的痛点是运维，要把它做到托管的云服务去解决，而容器技术的优势使得中间件容器化成为实现中间件云服务的最佳实践。在实现上需要 Operator，需要有更加云原生的模式来把容器化中间件给研发出来，当然对开发人员的要求也很高的。

未来的计划有两点，第一，我们现在的容器化中间件平台可以跑在任意 Kubernetes 上面，但是我们还是要做到跑在 Kubernetes 发行版上，如 OpenShift、Rancher 等，希望容器化中间件这些 Operator 也能跑在上面，但是需要做一些兼容。第二，我们整体是想建设云原生操作系统，中间件是其中的一个负载，我为什么不把中间件的负载和无状态应用负载实现混部？这样可以给公司带来更高的一个资源利用率，可以降低成本。

谢谢大家！

k8s:安装 Helm 私有仓库ChartMuseum、helm-push插件并上传、安装Zookeeper 云游 docker helm helm-push
ChartMuseum是Kubernetes生态中用于存储、管理和发布HelmCharts的开源系统，主要用于扩展Helm包管理器的功能核心功能‌集中存储‌：提供中央化仓库存储Charts，支持版本管理和权限控制。‌‌跨集群部署‌：支持多集群环境下共享Charts，简化部署流程。‌‌离线部署‌：适配无网络环境，可将Charts存储在本地或局域网内。‌‌HTTP接口‌：通过HTTP协议提供服务，用户
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
EasyCwmp源码分析与接口实现详解：深入理解源码架构，掌握核心接口
EasyCwmp源码分析与接口实现详解：深入理解源码架构，掌握核心接口去发现同类优质开源项目:https://gitcode.com/在开源项目中，寻找一款能够提升开发效率、简化流程的工具是每个开发者的追求。今天，我们要介绍的这款开源项目EasyCwmp，正是为了帮助开发者深入了解源码架构，掌握核心接口实现，从而加速项目开发进程。以下是关于EasyCwmp源码分析与接口实现详解的项目推荐文章。项目
消息中间件巡检搬砖小常消息中间件运维笔记 RocketMQ kafka 中间件巡检运维
除资源使用情况外，消息中间件RocketMQ、kafka还可以巡检哪些？一、RocketMQ巡检1、检查broker写入耗时是否有压力2、检查brokerbusy的数量与频率3、主题发送TPS、发送错误率巡检4、从节点消费情况检查5、集群各broker消息流转情况巡检二、Kafka巡检1、检查是否有分区发生ISR频繁扩张收缩2、检查分区leader选举值是否处于正常水平3、检查controller
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
零信任落地难题：安全性与用户体验如何两全？粤海科技君安全零信任终端安全网络安全 iOA
在零信任架构的实施过程中，平衡安全性与用户体验是企业数字化转型的核心命题。这一挑战的本质在于：既要通过「永不信任，持续验证」的安全机制抵御新型攻击，又要避免过度验证导致的效率损耗。一、矛盾根源：安全与体验的天然张力零信任的“永不信任”原则，本质上要求对每一次访问都进行动态评估，但这与用户对“便捷、流畅”的诉求存在天然冲突。例如：频繁的身份验证（如每次登录都需短信验证码）会打断工作节奏，某制造企业统
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
AIGC工具与软件开发流程的深度集成方案 Irene-HQ 软件开发测试 AIGC 测试工具 github AIGC 程序人生面试
一、代码开发环节集成路径‌环境配置标准化‌安装AIGC工具包并配置环境变量（如设置AIGC_TOOL_PATH），确保团队开发环境一致‌。在IDE插件市场安装Copilot等工具，实现编码时实时建议调用‌。‌人机协作新模式‌‌需求解析‌：上传PRD文档，AI自动提取业务规则生成类结构（如支付模块的PaymentService雏形）‌。‌代码补全‌：输入注释//JWT验证中间件，生成OAuth2.0
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
Kubernetes自动扩缩容方案对比与实践指南浅沫云归后端技术栈小结 kubernetes autoscaling devops
Kubernetes自动扩缩容方案对比与实践指南随着微服务架构和容器化的广泛采用，Kubernetes自动扩缩容（Autoscaling）成为保障生产环境性能稳定与资源高效利用的关键技术。面对水平Pod扩缩容、垂直资源调整、集群节点扩缩容以及事件驱动扩缩容等多种需求，社区提供了HPA、VPA、ClusterAutoscaler、KEDA等多种方案。本篇文章将从业务背景、方案对比、优缺点分析、选型建
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
【运维实战】解决 K8s 节点无法拉取 pause:3.6 镜像导致 API Server 启动失败的问题 gs80140 各种问题运维 kubernetes 容器
目录【运维实战】解决K8s节点无法拉取pause:3.6镜像导致APIServer启动失败的问题问题分析✅解决方案：替代拉取方式导入pause镜像Step1.从私有仓库拉取pause镜像Step2.重新打tag为Kubernetes默认命名Step3.导出镜像为tar包Step4.拷贝镜像到目标节点Step5.在目标节点导入镜像到containerd的k8s.io命名空间Step6.验证镜像是否导
ZooKeeper架构及应用场景详解走过冬季学习笔记 zookeeper 架构分布式
ZooKeeper是一个开源的分布式协调服务，由Apache软件基金会维护。它旨在为分布式应用提供高性能、高可用、强一致性的基础服务，解决分布式系统中常见的协调难题（如配置管理、命名服务、分布式锁、服务发现、领导者选举等）。核心软件架构ZooKeeper的架构设计围绕其核心目标（协调）而优化，主要包含以下关键组件：集群模式(Ensemble):ZooKeeper通常部署为集群（称为ensemble
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
设计可靠 LoRaWAN 设备时需要考虑的关键能力门思科技技术分享网络服务器物联网运维嵌入式硬件
引言LoRaWAN已经成为低功耗广域网（LPWAN）中的重要标准，在智慧农业、能源管理、城市基础设施监测等领域得到大规模应用。然而，设计一款真正能够在各种复杂环境中稳定运行、可远程管理、可持续升级的设备，需要从底层架构就进行深度思考，而不仅仅是简单集成一个无线模块。如果缺乏系统性的设计，设备在面对实际部署时会遇到连接不稳、电池过快耗尽、远程控制受限等问题，导致后期维护成本大幅上升。下面，我们将从工
Qualcomm Hexagon DSP 与 AI Engine 架构深度分析：从微架构原理到 Android 部署实战观熵国产 NPU ×Android 推理优化人工智能架构 android
QualcommHexagonDSP与AIEngine架构深度分析：从微架构原理到Android部署实战关键词QualcommHexagon、AIEngine、HTA、HVX、HMX、Snapdragon、DSP推理加速、AIC、QNNSDK、Tensor编排、AndroidNNAPI、异构调度摘要HexagonDSP架构是QualcommSnapdragonSoC平台中长期演进的异构计算核心之一
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
在 Linux（openEuler 24.03 LTS-SP1）上安装 Kubernetes + KubeSphere 的防火墙放行全攻略
目录在Linux（openEuler24.03LTS-SP1）上安装Kubernetes+KubeSphere的防火墙放行全攻略一、为什么要先搞定防火墙？二、目标环境三、需放行的端口和协议列表四、核心工具说明1.修正后的exec.sh脚本（支持管道/重定向）2.批量放行脚本：open_firewall.sh五、使用示例1.批量放行端口2.查看当前防火墙规则3.仅开放单一端口（临时需求）4.检查特定
信创海光x86服务器，定义、特点及应用详解
信创海光x86服务器是中国近年来在信息技术领域努力实现自主可控的成果之一，旨在打破国外技术封锁和限制，这类服务器的核心特点基于x86架构，这是一种广泛应用于全球的微处理器架构，由英特尔公司最初设计，海光作为国产处理器的代表之一，其技术基础来源于AMDZen的授权，主要面向服务器市场。服务器核心：海光C863350处理器海光C863350处理器是一款基于x86架构的高性能CPU，具体参数包括8核心1
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

网易数帆如何用 Kubernetes“原语”实现云原生中间件升级

基础中间件的挑战

中间件容器化的思考

中间件容器化的共性问题与解决之道

未来展望

你可能感兴趣的:(云原生,云原生,中间件,Kubernetes,架构)