阿里云大数据AI技术

【2023云栖】刘一鸣：Data+AI时代大数据平台建设的思考与发布

简介： 本文根据2023云栖大会演讲实录整理而成，演讲信息如下：

演讲人：刘一鸣 | 阿里云自研大数据产品负责人

演讲主题：Data+AI时代大数据平台应该如何建设

今天分享的主题是Data+AI时代大数据平台应该如何建设，这个话题既是对我们过去一年工作的反思和总结，同时也是希望通过这个反思和总结，不管大家是否使用阿里云的平台和技术，在未来大数据平台的选型、运维、创新上都可以有一些启发，同时也会思考未来大数据人的角色、工作方式是否有一些新的变化。

阿里云大数据的核心是两款分布式计算引擎，在ODPS（Open Data Processing Platform）品牌之下，今天的分享也会更多围绕ODPS的两个核心引擎来讲（面向批量数据加工和海量存储的MaxCompute、面向实时数仓以及交互式分析场景的Hologres）。下面进入正题，希望跟大家分享我们过去做平台时候的反思，什么能力是关键能力，以及今年我们做了哪些能力的提升。

降本能力：灵活的付费模式驱动大数据成本的显著下降

降本能力是每个大数据平台的核心能力，特别是作为公共云上的服务方，我们不希望大家使用云上的大数据平台是一个成本的黑洞，越用越贵，每年老板说钱花哪里去还说不清楚，我们希望不仅给用户提供一个成本费用说得清楚用得明白的平台，也希望给用户提供一个通过正确使用产品可以不断降低单位拥有成本的平台。降本从不意味着要使用更便宜的规格，更少的资源，这会潜在牺牲平台的服务质量，不是正确的降本姿势，低价往往质量缺少保障，最后会收获更低质量的服务，更低质量的研发投入，最后导致平台无法维系。

合理的降本方式首先是选择合适的采购策略、付费策略，选择一个合适的技术。以MaxCompute为例，平台提供多种付费方式，从比较经典的预付费或者叫包年包月，到用得最多的后付费或者叫按量付费的模型。预付费对预算控制更精确，费用提前说清楚，但资源使用受限制，无法满足临时性需求，也会产生闲置资源的空闲浪费。按量付费模型根据实际业务规模产生费用，无需提前做容量规划，但实际费用容易超出预算控制。现在我们希望把两种模式做一些结合。

我们看到大部分数据加工作业都具备一定的时间规律，夜间往往高峰期，早上上班看到计算结果，白天相对水位是低峰期，这里可以利用MaxCompute的分时弹性能力，日常低水位运行，高峰期弹性出来额外资源。分时弹性去年上线的，今年通过对库存管理的优化，实现库存效率上的提升，在9月20日开始MaxCompute弹性部分的CU单价直接降低50% 。如果一天有8h作业跑不满的情况，采用分时作业的方式一定是降本的，希望每个用户可以根据大家实际使用场景去选择分时策略。

原理类似ECS上的Spot Instance，MaxCompute今年推出了闲时作业，也通常叫做SpotJob，定价直接是按量付费定价的三分之一，闲时作业是把大数据集群的闲置资源服务出来，不一定保障每天运行的时候都能得到一样的资源，执行一样快，在集群繁忙时会有更多的作业等待时间，但对于延时不敏感的作业，如历史数据的导入、日常开发调试作业的场景，通过使用闲时作业可以有效降本66%。

分时弹性既能满足弹性，也能满足预算的管理，那么该怎么设置是最优的？MaxCompute发布了成本优化器，帮助用户分析过去30天所有作业的资源分布特征，展示出高峰期和低谷期，给出弹性策略应该怎么设计的建议。在弹性的基础上，我们给作业增加了一个关键的约束条件叫基线，基线之前的作业需要足够的资源保障，让结果准时计算出来，基线之后的作业可以跑慢一些，更节省资源和费用，这样就区分了作业的优先级和重要性。绝大部分用户使用成本优化器之后，通常有20%以上成本降低，建议大家可以尽快采用起来。

接下来我们谈谈存储如何降本。数据在实际使用时会分特征，有些数据是高频访问，数据的重要性有可能更高，有些数据是低频访问数据，一个月就读取一两次，有的数据是审计要求，不可以删除，一年不一定访问一次。数据有价值分配，那么我们的数据成本是否也应该有分层设计呢？当然。MaxCompute为不同访问特征，不同价值数据提供不同的存储能力，分层存储提供了分层的单价。通过分层存储的方式可以看到一些低频访问的数据，长期访问的数据成本可以降到以前的三分之一。

计算和存储可以通过平台的使用策略来节省成本，其实还可以通过存储技术的创新实现进一步的降本。JSON是互联网上使用非常广泛的数据结构，半结构化，查询灵活，存储也方便，Schema可以随时调整，但过去JSON如果用字符串去存储的时候，哪怕仅仅访问一个字节，也需要把几兆字节全部解析出来，对计算和IO都是极大的浪费。另一种方案是JSON数据落库前，提前进行JSON结构的打宽，需要大量的加工作业，也是对计算资源的浪费。

如何有效提升JSON数据类型的存储和访问效率成为大数据平台的关键能力，今年包括MaxCompute和Hologres，都提供JSON原生化的管理能力，包括元数据支持和存储列式压缩，把半结构化作为一级处理类型来支持，在用户实践中，绝大部分用户的JSON存储成本会降到以前的五分之一，而且查询会变得更快。

轻运维能力：Serverless变革大数据运维模式

云上大数据平台，应该提供运维足够简单易用，把脏活累活帮助使用者运维掉，帮助大数据工程师实现角色升级，从过去相对被动每天考虑系统平台的稳定性、扩展性、资源如何分配、备份、容灾、升级、修bug这些脏活累活中解脱出来，转变成数据的分析师，变成AI专家，变成领域专家，而不是做重复的运维工作。

我们认为Serverless架构是解决运维问题的关键，那么如何做Serverless架构呢？从大数据架构上讲，通常我们分三种：1.Shared-Nothing架构，存算一体。通过节点之间的横向扩展，实现计算力和存储能力的提升。2.Shared-Everything，计算存储全部解耦开来，所有的资源都可以共享。3. Shared-Data，Data部分是共享，计算部分隔离开来，提供更好的隔离能力。每个技术会选择不同架构。

MaxCompute选择Shared-Everything，对平台侧的隔离技术实现要求很高，对运维侧、调度侧要求更高，所有计算资源、存储资源是共享在统一的公共集群里。Hologres选择Shared-Data架构，这个系统需要更多考虑在线服务场景下资源的隔离和稳定性，所以不同系统选择不同架构。

这个架构背后我们会把整个集群当做一个统一的计算资源来管理。对用户来说最大价值是，不仅是使用成本的降低，不需要提前做容量规划，更重要的是，不需要处理复杂的升级运维，让用户可以实现零停机的方式实现版本的迭代，这都是Serverless架构创造的价值，平台侧希望把脏活累活，包括升级、备份、灾备、弹性这些事情通过架构的方式把它解决，这也是Serverless背后核心的理念。

大家过去讲Serverless更多讲资源上省钱，只为使用的资源付费，而我相信Serverless更多是把运维方式转变，让工程师更聚焦到价值的创造上。

Hologres在Serverless架构上一直演进，今年提出了弹性计算组的概念，这个计算组概念背后是共享数据，共享接入层，但在计算节点上做了资源切分，当不同业务团队使用同一份数据的时候，每个团队可以为自己的使用场景去弹性分配资源，同时保障数据的一致性，支持实时写入，实时查询，这是在Hologres上做的创新。

开放能力：湖仓一体与开放性

在谈到大数据平台的开放性时，更多讲Open Storage + Open Format，今天阿里的大数据平台希望做到更多一层。云计算对技术的开放性要求会更高，一方面云厂商不希望自己变成绑架用户的角色，MaxCompute也不希望大家使用之后就被绑架在平台上，不可以切换。另一方面云平台上不同技术之间交互的强度、密度是远大于线下的，技术之间需要分钟级部署，分钟级打通，用户对技术的交互性要求很高，我们希望把开放性做得很彻底，我们不希望把创新只放在自己手里，我们希望把创新交还给用户。

首先，阿里云的大数据完全拥抱Open Storage + Open Format，提供了湖仓一体的解决方案，为用户提供接近原生的元数据管理和数据读写体验。对于什么是湖仓一体，行业内有两个思路，一个是在湖上长出一个仓，把湖变成仓。典型特点是把湖上的数据结构提供更好的更新能力，接近数据库的开发体验。另一个方式从仓的管理能力拓展外表能力，实现湖上半结构化、非结构化数据以元数据方式管理起来，相当于仓去管理湖，这也是湖仓一体的形态。MaxCompute是第二种形态，用仓去管湖，把存在OSS上的Hudi格式、Delta Lake等格式，包括今年阿里自己创新的Paimon格式，都可以在MaxCompute和Hologres中作为外表直接访问。同时也做了一些创新，把OSS上的非结构化文件定义为抽象的目录表，这样在数仓里可以用更加精细化的安全管控方式去做授权，哪些用户可以访问哪些文件，怎么访问，包括审计都可以记录下来。

湖仓一体最关键是元数据的管理，数据不管存在仓上、湖上，需要有一个统一的视图可以看到所有的元数据，数据被谁定义，数据怎么解析，这是湖仓一体核心的概念，而并不是一定是一个系统还是两个系统。

MaxCompute今年在开放性上有很大的变化。大家过去认为仓的理念是数据计算都在这儿，但我们今天希望把MaxCompute存储作为独立的产品形态对外提供服务，把Storage这一层提供产品化的能力，提供Storage API，支持高吞吐、高性能的原生IO接口。不管使用机器学习的PAI平台还是使用Spark、Presto，都可以像MaxCompute原生的SQL引擎一样去访问仓里的数据，我们希望把自研大数据平台的数据开放出去，支持用户使用第三方引擎持续创新。

智能优化能力：AI加持的智能数仓

过去做优化的时候很依赖于DBA同学对一个数仓技术原理的理解，在云的时代，用户把数据托管到云平台上，云平台就有很大责任帮助用户做好优化这件事。我们希望从过去基于经验的运维向智能化运维前进。

比如MaxCompute通过物化视图把公共的SQL计算子集推荐出来，实现资源的复用，这是一种空间换时间非常有效的方法。经过一年多时间的迭代，在推荐效率上已经做了很大的改进，绝大部分推荐出来的物化视图质量都是很高，可以做到成本的节省和效率上的提升。

大数据成为AI的基础设施

今年AI很热，很多了不起的创新，但其实AI的创新中，大数据也扮演了关键的基础设施角色。同时我们也希望用了云上大数据平台的用户，不需要再做那些低效繁重的运维工作，而是更多做一些AI上的场景和应用创新。我们也提出了大数据AI一体化，事实上大数据AI是各有分工，大数据为AI提供数据的支撑，这包括大数据平台要做好规模数据的处理，提供分布式计算框架，提供科学计算的一站式开发环境，其次机器学习平台也会为大数据平台提供优化的算法、优化的模型。

在过去SQL的基础上，我们认为Python也应该成为MaxCompute平台的一级开发语言。MaxCompute全新发布，One Env+One Data+One Code，这背后核心就是提供一个Python的运行环境，一个Notebook的交互式开发体验，让有SQL基础的同学，有Python经验的同学，需要利用Python Library进行数据处理的场景，可以在统一的开发环境下，实现高效率的开发和调试，实现Python和coMaxCompute数据的原生打通。

全面升级DataFrame能力，发布分布式计算框架MaxFrame，100%兼容Pandas等数据处理接口，通过一行代码即可将原生Pandas自动转为MaxFrame分布式计算，打通数据管理、大规模数据分析、处理到ML开发全流程，打破大数据及AI开发使用边界，大大提高开发效率。

最后讲下向量数据库，Hologres内置达摩院向量引擎Proxima，支持高性能、实时化的向量检索服务。使用SQL接口可以访问向量数据，在原有交互式分析场景下帮助大家更好使用AI场景。

AI大模型训练的云原生实践：如何用Kubernetes指挥千卡集群？
当你的团队还在手动拼装显卡集群时，聪明人早已教会Kubernetes自动调度千卡。就像交响乐团需要指挥家，万级GPU需要云原生调度艺术。深夜的机房，硬件工程师老张盯着监控屏上跳动的红色警报——手工组装的千卡集群再次因单点故障崩溃。而隔壁团队通过Kubernetes调度的百卡集群，训练效率竟高出他们47%。这不是魔法，而是云原生调度的降维打击。一、千卡训练：为什么传统方法行不通？想象指挥没有乐谱的千
云原生环境中Consul的动态服务发现实践 AI云原生与云计算技术学院 AI云原生与云计算云原生 consul 服务发现 ai
云原生环境中Consul的动态服务发现实践关键词：云原生,服务发现,Consul,微服务,动态注册,健康检查,Raft算法摘要：本文深入探讨云原生环境下Consul在动态服务发现中的核心原理与实践方法。通过剖析Consul的架构设计、核心算法和关键机制，结合具体代码案例演示服务注册、发现和健康检查的全流程。详细阐述在Kubernetes、Docker等云原生技术栈中的集成方案，分析实际应用场景中的
云原生环境里Nginx的故障排查思路 AI云原生与云计算技术学院 AI云原生与云计算云原生 nginx 运维 ai
云原生环境里Nginx的故障排查思路关键词：云原生、Nginx、故障排查、容器化、Kubernetes摘要：本文聚焦于云原生环境下Nginx的故障排查思路。随着云原生技术的广泛应用，Nginx作为常用的高性能Web服务器和反向代理服务器，在容器化和编排的环境中面临着新的故障场景和挑战。文章首先介绍云原生环境及Nginx的相关背景知识，接着阐述核心概念和联系，详细讲解故障排查的核心算法原理与操作步骤
三年打磨，一次飞跃！KubeSphere 企业版 4.2.0 引爆云原生变革
历经三年匠心打造，KubeSphere企业版4.2.0正式发布！今天，我们激动地宣布KubeSphere企业版4.2.0正式发布！这是一个承载着KubeSphere团队近三年心血的重磅版本，标志着KubeSphere在云原生领域的又一次跨越式发展。四大核心升级，全面重塑云原生体验1.全新UI设计，打造极致用户体验五大设计改动，让容器管理更高效KubeSphere企业版4.2.0带来全新的UI设计理
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
SmartX 用户建云实践｜明日控股：构建基于超融合架构的企业云平台，逐步推进数字化转型
作为全国塑化分销领域的领先企业，明日控股近年来在数字化转型上持续加码。面对业务扩张与产业协同的双重挑战，明日控股自2018年全面启动“数字化、金融化、国际化”三化战略，并将“数字化”置于最核心的位置。在IT基础架构层面，明日控股通过引入SmartX榫卯企业云平台*，完成了从传统ERP管理系统到云原生微服务架构平台的演进，推动单一平台向统一企业级私有云的基础设施转型。通过三期云平台建设，明日控股以榫
互联网大厂Java求职面试：基于Spring AI与云原生架构的RAG系统设计与实现在未来等你 Java场景面试宝典 Java SpringAi RAG系统云原生
互联网大厂Java求职面试：基于SpringAI与云原生架构的RAG系统设计与实现场景背景郑薪苦，一位自称“代码界的段子手”的程序员，正在参加某互联网大厂的技术总监面试。面试官是技术总监李总，拥有丰富的架构设计经验，尤其擅长AI与大模型技术、云原生架构等领域。今天的面试主题围绕企业知识库与AI大模型的深度融合架构展开，重点探讨如何设计一个高性能、可扩展的RAG（Retrieval-Augmente
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
SkyWalking实现微服务链路追踪的埋点方案 MenzilBiz 服务器运维微服务 skywalking
SkyWalking实现微服务链路追踪的埋点方案一、SkyWalking简介SkyWalking是一款开源的APM(应用性能监控)系统，特别为微服务、云原生架构和容器化(Docker/Kubernetes)应用而设计。它主要功能包括分布式追踪、服务网格遥测分析、指标聚合和可视化等。SkyWalking支持多种语言（Java、Go、Python等）和协议（HTTP、gRPC等），能够提供端到端的调用
揭秘华为欧拉：不只是操作系统，更是云时代的技能认证体系
揭秘华为欧拉：不只是操作系统，更是云时代的技能认证体系作为一名深耕IT培训领域的博主，今天带大家客观认识“华为欧拉”——这个在云计算领域频频出现的名词。一、华为欧拉究竟是什么？严格来说，“华为欧拉”核心包含两部分1.openEuler操作系统：一个由华为支持的企业级开源Linux操作系统发行版，专为云计算、云原生平台等场景设计优化。2.华为openEuler认证体系(HCIA/HCIP/HCIE-
Maven 构建性能优化深度剖析：原理、策略与实践越重天 Java Maven实战 maven 性能优化 java
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
探索 Golang 与 Docker 集成的无限可能 Golang编程笔记 golang docker 开发语言 ai
探索Golang与Docker集成的无限可能关键词：Golang、Docker、容器化、微服务、云原生、镜像优化、CI/CD摘要：本文将带你走进Golang与Docker集成的奇妙世界。我们会从“为什么需要这对组合”讲起，用生活故事类比核心概念，拆解Go静态编译与Docker容器化的“天作之合”，通过实战案例演示如何用Docker高效打包Go应用，并探讨它们在云原生时代的无限可能。无论你是Go开发
云原生技术与应用-Docker高级管理--Dockerfile镜像制作慕桉 ~ 云原生 docker 容器
目录一.Docker镜像管理1.Docker镜像结构2.Dockerfile介绍二.Dockerfile实施1.构建nginx容器2.构建Tomcat容器3.构建mysql容器三.Dockerfile语法注意事项1.指令书写范围2.基础镜像选择3.文件操作注意4.执行命令要点5.环境变量和参数设置6.缓存利用与清理一.Docker镜像管理Docker镜像除了是Docker的核心技术之外，也是应用发
国产开源高性能对象存储RustFS保姆级上手指南光爷不秃对象存储 rust 国产开源软件 rust 云计算开源软件 github 开源数据仓库 database
在云计算与大数据爆发的时代，企业和开发者对存储方案的要求愈发严苛——不仅要能扛住海量数据的读写压力，还得兼顾安全性、可扩展性和兼容性。今天给大家介绍一款基于Rust语言开发的开源分布式对象存储系统——RustFS，它不仅是MinIO的国产化优秀替代方案，更是AI、大数据和云原生场景的理想之选。本文将从基础介绍到实战操作，带大家快速上手这款"优雅的存储解决方案"。一、RustFS核心特性解析Rust
FasterRCNN源码解析（一）-——跑通代码_霹雳巴拉wz的代码看不懂 2401_84140023 2024年程序员学习运维 linux 面试
为了做好运维面试路上的助攻手，特整理了上百道【运维技术栈面试题集锦】，让你面试不慌心不跳，高薪offer怀里抱！这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。本份面试集锦涵盖了174道运维工程师面试题128道k8s面试题108道shell脚本面试题200道Linux面试题51道docker面试题35道Je
千亿级消息引擎 Apache Pulsar 深度剖析：架构原理、设计哲学与实战实践北漂老男人 Pulsar apache 架构学习方法运维
千亿级消息引擎ApachePulsar深度剖析：架构原理、设计哲学与实战实践Pulsar不止是消息队列，更是下一代云原生流平台。本文将深入剖析其底层架构、核心特性、关键差异、源码细节、调优技巧与企业级实践路径，力求做到“知其然，知其所以然”。一、架构哲学：分层解耦+IO隔离1.1三层架构模型（Broker+BookKeeper+ZooKeeper）Pulsar基于分布式系统经典设计范式：计算与存储
《凤凰架构》C13-持久化存储
目录一、存储设计二、存储生态三、容器&云原生领域常见缩写一、存储设计1）Docker存储挂载类型是否持久化管理方式参数关键字适用场景与特点Volume✅是Docker自动管理type=volume或-vvol:/path最推荐方式，支持跨平台、备份、驱动、持久化BindMount✅是用户手动管理type=bind或-v/host:/container灵活性高，直接使用宿主路径，开发调试常用Tmpf
云原生：数字化转型的核心引擎
在数字经济蓬勃发展的今天，云原生技术正成为企业数字化转型的核心驱动力。它不仅改变了传统IT架构的运行方式，更重塑了整个软件开发和交付的生命周期。本文将深入探讨云原生系统的核心价值、关键技术以及实施路径。一、云原生：数字化转型的必由之路云原生是一套充分利用云计算优势来构建和运行应用程序的方法论。根据CNCF最新调查，全球已有超过75%的企业在生产环境中使用云原生技术，这一数字还在持续增长。云原生的核
用XDR的思路保护API安全 Akamai中国云计算安全人工智能云计算分布式云原生架构 Akamai
云计算飞速发展的今天，越来越多应用程序已经转为选择云原生架构，这就少不了Serverless、微服务、API等技术的协助。但同时也有越来越多的企业认识到，一定程度的“API安全”在整体安全与合规态势中发挥着至关重要的作用。然而，对很多企业来说，可能并不太明确API安全技术投资在其更广泛安全栈中的位置。两个关键问题随着时间推移，许多安全孤岛已经逐步发展，开始包含更统一的扩展检测和响应（XDR，Ext
云原生周刊：Istio 1.24.0 正式发布
云原生周刊：Istio1.24.0正式发布开源项目推荐KopfKopf是一个简洁高效的Python框架，只需几行代码即可编写KubernetesOperator。Kubernetes（K8s）作为强大的容器编排系统，虽自带命令行工具（kubectl），但在应对复杂操作时往往力不从心。通过Kopf，您可以使用Python轻松实现Kubernetes的复杂操作，包括条件判断、事件触发等，让自定义操作变
云原生信息提取系统：容器化流程与CI_CD集成实践
一、问题引出：自动化信息获取为何难以工程化？在实际开发中，我们经常需要对互联网页面进行结构解析与内容提取，但这些任务常常陷入以下困境：本地测试没问题，一旦部署到线上环境便频繁出错；环境配置不一致导致执行失败；内容接口更新频繁，人工维护成本高；无法做到自动更新与持续运行；对接口访问策略缺乏灵活适配手段。这说明，仅靠“能运行的脚本”远远不够，信息提取任务也需要标准化的开发、测试与交付机制。二、真实挑战
深度解析：SUSE Harvester私有云平台建设指南
关键词:SUSEHarvester,私有云,HCI,超融合,Kubernetes,KubeVirt,Longhorn,云原生,虚拟化,容器目录导航一、初识SUSEHarvester-私有云的新选择二、核心架构解析-揭开HCI的神秘面纱三、部署实战-从零到一搭建你的私有云四、存储与网络配置-数据的安全港湾五、虚拟机管理-让资源调度更智能六、监控与运维-保驾护航的守护者七、最佳实践-踩坑经验分享八、总
Spring Boot：将应用部署到Kubernetes的完整指南小马不敲代码 SpringBoot spring boot kubernetes 后端
详细介绍如何将一个SpringBoot应用程序部署到Kubernetes集群。从一个基础的SpringBoot应用开始，通过Docker容器化，最后完成Kubernetes集群的部署配置。这个过程将帮助你理解现代云原生应用部署的完整流程。示例项目SpringBoot2.6.13Java8Maven构建工具RESTfulAPI接口标准的项目结构项目结构如下：├──src/│├──main/││├──
Spring 进阶-第三十篇：Spring 框架的未来发展与前沿技术融合程序员勇哥 Java全套教程 spring java 后端 SpringBoot spring cloud
Spring进阶-第三十篇：Spring框架的未来发展与前沿技术融合一、云原生技术与Spring1.1Spring对云原生的支持演进Spring与云原生技术的融合经历了从适配到深度整合的过程：早期探索（2015-2018）：通过spring-boot-starter-container等模块初步支持容器化部署，简化Docker镜像构建；推出SpringCloud生态，提供服务注册与发现（Eurek
Go内存压力测试：模拟与应对高负载 Go高并发架构_王工 golang 压力测试后端
一、引言在当今微服务架构和云原生应用盛行的时代，Go语言凭借其出色的并发处理能力和较低的资源消耗，成为构建高性能后端服务的首选语言之一。然而，随着业务规模的扩大和用户量的增长，我们的服务经常会面临突如其来的流量高峰和持续的高负载挑战。就像一辆汽车需要在极端条件下测试其性能极限一样，我们的Go应用也需要在上线前经受住内存压力测试的洗礼。这不仅能帮助我们发现潜在的内存泄漏和性能瓶颈，还能确保系统在高负
【人工智能】Spring AI Alibaba，一个面向 Java 开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。本本本添哥 A -AIGC 人工智能大模型人工智能 java spring
一、SpringAIAlibaba介绍SpringAIAlibaba是一个面向Java开发者的开源框架，它旨在简化将人工智能（AI）功能集成到应用程序中的过程。该项目基于SpringAI构建，并且是阿里云通义系列模型及服务在JavaAI应用开发领域的最佳实践。SpringAIAlibaba的目标是为开发者提供一套高层次的AIAPI抽象以及与云原生基础设施的深度集成方案，从而帮助他们快速构建智能应用
从点子到原型只需10分钟：用 Copilot 快速验证产品功能网罗开发 AI 大模型 Python 技术汇总人工智能 copilot
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Docker免费时代终结？2025最新开源政策与替代方案全解析 109702008 编程 docker 开源人工智能
标签:#Docker#容器技术#云原生#开源治理引言：从全民免费到分层收费，Docker经历了什么？“曾经的开源先锋，如今因商业策略频遭争议。”2023年起，DockerHub取消免费组织账户，2024年拉取限流升级，2025年服务账户开始按量收费——这一系列动作让开发者不得不重新思考：Docker还是当初那个‘开源宠儿’吗？本文将结合技术演进与商业逻辑，为你揭开真相。一、Docker的核心：开源
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l