CSDN

ODPS技术架构及应用实践

　　初识ODPS

　　ODPS是分布式的海量数据处理平台，提供了丰富的数据处理功能和灵活的编程框架，主要的功能组件有如下几个。

Tunnel服务：数据进出ODPS的唯一通道，提供高并发、高吞吐量的数据上传和下载服务。
SQL：基于SQL92并进行了本地化扩展，可用于构建大规模数据仓库和企业BI系统，是应用最为广泛的一类服务。
DAG编程模型：类似Hadoop MapReduce，相对SQL更加灵活，但需要一定的开发工作量，适用于特定的业务场景或者自主开发新算法等。
Graph编程模型：用于大数据量的图计算功能开发，如计算PageRank。
XLIB：提供诸如SVD分解、逻辑回归、随机森林等分布式算法，可用于机器学习、数据挖掘等场景。
安全：管控ODPS中的所有数据对象，所有的访问都必须经过鉴权，提供了ACL、Policy等灵活强大的管理方式。

　　ODPS采用抽象的作业处理框架将不同场景的各种计算任务统一在同一个平台之上，共享安全、存储、数据管理和资源调度，为来自不同用户需求的各种数据处理任务提供统一的编程接口和界面。

　　和阿里云的其他云计算服务一样，ODPS也是采用HTTP RESTful服务，并提供Java SDK、命令行工具（Command Line Tool，CLT）和上传下载工具dship，以及阿里云官网提供统一的管理控制台界面。在阿里内部，有多个团队基于ODPS构建交互界面的Web集成开发环境，提供数据采集、加工、处理分析、运营和维护的一条龙服务。基于ODPS进行应用开发，最直接的是使用CLT以及dship等工具。如果不能满足需要，也可以进一步考虑使用ODPS SDK或RESTful API等进行定制开发，如图1所示。

图1 ODPS应用开发模式

　　如果你的业务发展需要一个足够强大、能开箱即用的大数据处理平台，并且不想花费太多精力去关注这一切如何实现与运维，那么ODPS是一个非常理想的选择。

　　规模的挑战

　　在DT时代，数据是宝贵的生产资料，但不断扩大的数据规模给ODPS带来了极大的挑战。在阿里内部就曾直面这种情况：在可以预见的时间内，单个集群的规模无法再容纳所有的数据。

　　解决方案是扩大单集群的规模，同时让应用系统可以管理多个集群。在这个背景下，ODPS作为一个海量数据的处理平台，结合5K项目开发了多集群管理的功能，使得数据处理的规模跨上了一个新的台阶。当单个计算集群的存储或计算容量不足时，将数据重新分布到新的集群上。更重要的一点是，这种跨多个集群的能力，对上层应用是透明的，用户在运行SQL或者Graph模型时，不必了解数据是分布在哪个物理集群上，如图2所示。

图2 ODPS的跨集群能力

　　网站日志分析

　　这里，我们将基于最常见的网站日志分析这一应用场景，实践如何通过ODPS来构建企业数据仓库，包括数据的导入导出以及清洗转换。其ETL过程与基于传统数据库的解决方法并不完全一致，在数据传输环节并没有太多的清洗转换，这项工作是在数据加载到ODPS后，用SQL来完成的。在数据加载到ODPS后，可以充分利用平台的水平扩展能力，处理的数据量可以轻松地扩展到PB级别，而且作为一个统一的平台，除构建数据仓库外，在ODPS中利用内置的功能即可进行数据挖掘和建模等工作。在实际工作中，数据采集、数仓构建和数据挖掘等都是由不同的团队来完成的，针对这一情况，ODPS中提供了完善的安全管理功能，可以精确地控制每个人可以访问到的数据内容（下例中为突出主要的过程，忽略了用户的授权管理）。

　　数据来源于网站酷壳（CoolShell.cn）上的HTTP访问日志数据（access.log），格式如下：

　　一个典型的企业数据仓库通常包含数据采集、数据加工和存储、数据展现等几个过程，如图3所示。

图3 数据仓库主要过程

　　数据采集

　　真实的网站日志数据中不可避免地会存在很多脏数据，可以先通过脚本对源数据做简单的处理解析，去掉无意义的信息，例如第二个字段“-”。在数据量比较大的情况下，单机处理可能成为瓶颈。这时可以将原始的数据先上传到ODPS，充分利用分布式处理的优势，通过ODPS SQL对数据进行转换。

　　在ODPS中，大部分的数据都是以结构化的表形式存在的，因此第一步要创建ODS层源数据表。由于数据是每天导入ODPS中，所以采取分区表，以日期字符串作为分区，在ODPS CLT中执行SQL如下：

　　假设当前数据是20140301这一天的，添加分区如下：

　　解析后的数据文件在/home/admin/data/20140301/output.log下，通过dship命令导入ODPS中，如下：

　　数据加工和存储

　　在ods_log_tracker表中，request字段包含三个信息：HTTP方法、请求路径和HTTP协议版本，如“GET /articles/4914.html HTTP/1.1”。在后续处理中，会统计方法为GET的请求总数，并对请求路径进行分析，因而可以把原始表的request字段拆解成三个字段method、url和protocol。这里使用的是ODPS SQL内置的正则函数解析的字符串并生成表dw_log_parser：

　　与传统的RDBMS相比，ODPS SQL面向大数据OLAP应用，没有事务，也没有提供update和delete功能。在写结果表时，尽量采用INSERT OVERWRITE到某个分区来保证数据一致性（如果用户写错数据，只需要重写该分区，不会污染整张表）。如果采用INSERT INTO某张表的方式，那么在作业因各种原因出现中断时，不方便确定断点并重新调度运行。

　　ODPS SQL提供了丰富的内置函数，极大方便了应用开发者。对于某些功能，如果SQL无法完成的话，那么可以通过实现UDF（用户自定义函数）来解决。例如希望将ip字段转化成数字形式，从而和另一张表关联查询，可以实现UDF，如下：

　　编译生成JAR包udf_ip2num.jar，将它作为资源上传到ODPS，然后创建函数并测试，如下：

　　表dual（需要用户自己创建）类似于Oracle中的dual表，包含一列和一行，经常用于查询一些伪列值（pseudo column），是SQL开发调试的利器。

　　对于较复杂的数据分析需求，还可以通过ODPS DAG（类似MapReduce）编程模型来实现。篇幅限制，这里不一一介绍。

图4 PV/UV展示结果

　　数据展现

　　应用数据集市往往是面向业务需求对数据仓库表进行查询分析，例如统计基于终端设备信息的PV和UV，生成结果表adm_user_measures。R是一款开源的、功能强大的数据分析工具。通过R来绘图，展示结果报表可以有两种方式：一是通过dship命令将数据导出到本地，再通过R展现结果；二是在R环境中安装RODPS Package，直接在R中读取表中的数据并展现。在RStudio中，基于小样本数据统计的展现结果如图4所示。

　　迁移到ODPS

　　Hadoop作为开源的大数据处理平台，已得到了广泛应用。在使用Hadoop集群的用户，可以比较轻松地迁移到ODPS中，因为ODPS SQL与Hive SQL语法基本一致，而MapReduce作业可以迁移到更加灵活的DAG的执行模型。对于数据的迁移，可以通过ODPS Tunnel来完成。

　　数据通道服务ODPS Tunnel是ODPS与外部交互的统一数据通道，能提供高吞吐量的服务并且能够水平进行服务能力的扩展。Tunnel服务的SDK集成于ODPS SDK中。实际上，dship也是调用SDK实现的客户端工具，支持本地文件的导入导出。我们鼓励用户根据自己的场景需求，开发自己的工具，例如基于SDK开发对接其他数据源（如RDBMS）的工具。

　　把海量数据从Hadoop集群迁移到ODPS的基本思路是：实现一个Map Only程序，在Hadoop的Mapper中读取Hadoop源数据，调用ODPS SDK写到ODPS中。执行逻辑大致如图5所示。

　　Hadoop MapReduce程序的执行逻辑主要包含两阶段：一是在客户端本地执行，如参数解析和设置、预处理等，这在main函数完成；二是在集群上执行Mapper，多台Worker分布式执行map代码。在Mapper执行完成后，客户端有时还会做一些收尾工作，如执行状态汇总。

图5 Hadoop到ODPS的数据迁移

　　这里，我们在客户端本地的main函数中解析参数，创建UploadSession，把SessionID传给Mapper，Mapper通过SessionID获取UploadSession，实现写数据到ODPS。当Mapper执行完成后，客户端判断执行结果状态，执行Session的commit操作，把成功上传的数据Move到结果表中。

　　默认情况下，Hadoop会自动根据文件数划分Mapper个数。在文件大小比较均匀时，这种方式没什么问题。然而存在大文件时，整个大文件只在一个Mapper中执行可能会很慢，造成性能瓶颈。这种情况下，应用程序可自己对文件进行切分。

　　下面实现一个类Hdfs2ODPS来完成这个功能。其中run函数完成了前面提到的主要逻辑，主要代码如下（其中包括了对ODPS Tunnel的使用）：

　　在这个函数中，首先调用函数parseArguments对参数进行解析（后面会给出），然后初始化DataTunnel和UploadSession。创建UploadSession后，获取SessionID，并设置到conf中，在集群上运行的Mapper类会通过该conf获取各个参数。然后，调用runJob函数，其代码如下：

　　runJob函数设置Hadoop conf，然后通过JobClient.runJob(conf);启动Mapper类在集群上运行，最后调用conf.getNumMapTasks() 获取Task数，Task数即上传到ODPS的并发数。在Mapper中，可以通过conf.getLong("mapred.task.partition")获取Task编号，其值范围为[0, NumMapTasks)。因此，在Mapper中可以把Task编号作为上传的blockid。客户端在Mapper成功返回时，就完成commit所有的Session。

　　应用实践注意点

　　与单机环境相比，在ODPS这样的分布式环境中进行开发，思维模式上需要有很大转变。下面分享一些实践中的注意点。

　　在分布式环境下，数据传输需要涉及不同机器的通信协作，可以说它是使用ODPS整个过程中最不稳定的环节，因为它是一个开放性问题，由于数据源的不确定，如文件格式、数据类型、中文字符编码格式、分隔符、不同系统（如Windows和Linux）下换行符不同，double类型的精度损失等，存在各种未知的情况。脏数据也是不可避免的，在解析处理时，往往是把脏数据写到另一个文件中，便于后续人工介入查看，而不是直接丢弃。在上传数据时，Tunnel是Append模式写入数据，因而如果多次写入同一份数据，就会存在数据重复。为了保证数据上传的“幂等性”，可以先删除要导入的分区，再上传，这样重复上传也不会存在数据重复。收集数据是一切数据处理的开始，所以必须非常严谨可靠，保证数据的正确性，否则在该环节引入的正确性问题会导致后续处理全部出错，且很难发现。

　　对于数据处理流程设计，要特别注意以下几点。

数据模型：好的数据模型事半功倍。
数据表的分区管理：如数据每天流入，按日期加工处理，则可以采取时间作为分区，在后续处理时可以避免全表扫描，同时也避免由于误操作污染全表数据。
数据倾斜：这是作业运行慢的一个主要原因，数据倾斜导致某台机器成为瓶颈，无法利用分布式系统的优势，主要可以从业务角度解决。
数据的产出时间：在数据处理Pipeline中，数据源往往是依赖上游业务生成的，上游业务的数据产出延迟很可能会影响到整个Pipeline结果的产出。
数据质量和监控：要有适当的监控措施，如某天发生数据抖动，要找出原因，及时发现潜在问题。
作业性能优化：优化可以给整个Pipeline的基线留出更多时间，而且往往消耗资源更少，节约成本。
数据生命周期管理：设置表的生命周期，可以及时删除临时中间表，否则随着业务规模扩大，数据会膨胀很快。

　　此外，数据比对、A/B测试、开发测试和生产尽可能采用两个独立的Project。简言之，在应用开发实践中，要理解计费规则，尽可能优化存储计算开销。

　　ODPS现状和前景

　　阿里巴巴提出了“数据分享第一平台”的愿景，其多年来坚持投资开发ODPS平台的初心就是希望有一天能够以安全和市场的模式，让中小互联网企业能够使用阿里巴巴最宝贵的数据。阿里内部提出了所有数据“存、通和用”，将不同业务数据关联起来，发挥整体作用。ODPS目前正在发展中，它在规模上，支持淘宝核心数据仓库，每天有PB级的数据流入和加工；在正确性上，支持阿里金融的小额无担保贷款业务，其对数据计算的准确性要求非常苛刻；在安全上，支持支付宝数据全部运行在ODPS平台上，由于支付宝要符合银行监管需要，对安全性要求非常高，除了支持各种授权和鉴权审查，ODPS平台还支持“最小访问权限”原则：作业不但要检查是否有权限访问数据，而且在整个执行过程中，只允许访问自己的数据，不能访问其他数据。

　　前面的示例只是展现了ODPS的冰山一角。作为阿里巴巴云计算大数据平台，ODPS采用内聚式平台系统架构，各个组件紧凑内聚，除了结构化数据处理SQL、分布式编程模型MapReduce外，还包含图计算模型、实时流处理和机器学习平台，如图6所示。

图6 ODPS功能模块

　　随着ODPS对外开放的不断推进和第三方数据的流入，相信会有各种创新在ODPS上生根发芽、开花结果。

　　尽管如此，云计算和大数据是两个新兴的领域，技术和产品发展日新月异。作为一个平台，虽然ODPS已在阿里内部被广泛使用，但在产品和技术上还有很多方面需要进一步完善和加强，希望ODPS能够和云计算大数据应用共同成长，成为业界最安全、最可靠和最方便易用的平台。

云存储的应用场景都包含哪些？
云存储是一种网上在线存储的模式，可以将重要的数据信息存放在由第三方托管的虚拟服务器当中，云存储是在云计算概念上所延伸和衍生出的一个新的概念，保证企业中数据的安全性，同时还帮助企业节省了一定的存储空间，让用户可以更加便捷的存取所需的数据资源，实现文件共享和协作功能。本文将来具有了解一下云存储的应用场景都有哪些吧！云存储所应用的场景也较为广泛，其高度的灵活性和可扩展性成为了各个企业的首要选择，尤其是对
技术支持工程师
OS与云桌面一、核心概念解析操作系统（OS）定义：管理硬件资源（CPU、内存、存储等）并为应用程序提供运行环境的系统软件，如Windows、Linux、UOS、银河麒麟等。作用：承担进程调度、文件管理、设备驱动等基础功能，是任何计算设备的“大脑”。云桌面定义：基于云计算技术的虚拟桌面服务，将传统PC的桌面环境（操作系统、应用、数据）集中部署在远端服务器，用户通过终端设备（如瘦客户机、PC、手机）远
【运维项目经历|005】：云端智慧运维服务升级上云项目小鹏linux 运维
博主简介：云计算领域优质创作者2022年CSDN新星计划python赛道第一名2022年CSDN原力计划优质作者阿里云ACE认证高级工程师阿里云开发者社区专家博主交流社区：CSDN云计算交流社区欢迎您的加入！目录项目名称项目背景项目目标项目成果我的角色与职责我主要完成的工作内容本次项目涉及的技术本次项目遇到的问题与解决方法本次项目中可能被面试官问到的问题及答案经验教训与自我提升
云计算服务架构与运维：CSDN精选实用技巧分享喜欢编程就关注我云计算架构运维云计算服务架构与运维 CSDN精选实用技巧分享代码
云计算服务架构与运维：CSDN精选实用技巧分享摘要在云计算服务架构与运维领域，合理的架构设计和有效的运维手段对于保障云平台的性能、可用性和安全性至关重要。本文从CSDN网站精选了一系列实用技巧，涵盖了架构设计原则、关键组件、运维工具及实践案例，旨在为读者提供一套系统化的云计算服务架构与运维解决方案。关键词：云计算服务架构；运维技巧；自动化部署；监控与告警；故障恢复一、引言随着云计算技术的飞速发展，
贪心算法应用：MEC任务卸载问题详解纪元A梦贪心算法贪心算法算法
Java中的贪心算法应用：MEC任务卸载问题详解1.问题背景与定义1.1移动边缘计算(MEC)概述移动边缘计算(MobileEdgeComputing,MEC)是一种将云计算能力下沉到网络边缘的技术架构。在MEC环境中，计算任务可以在终端设备、边缘服务器和云端之间进行卸载和分配，以实现更低的延迟、更高的效率和更好的用户体验。1.2任务卸载问题定义MEC任务卸载问题是指如何将移动设备上的计算任务合理
【人工智能】Maas（模型即服务）（Model as a Service）是一种基于云计算的商业模式，通过API将预训练的人工智能模型作为服务提供给用户，使其无需自行管理底层基础设施即可调用AI能力。本本本添哥 A -AIGC 人工智能大模型人工智能云计算
ModelasaService（模型即服务，MaaS）是一种基于云计算的商业模式，通过API将预训练的人工智能模型作为服务提供给用户，使其无需自行管理底层基础设施即可调用AI能力。MaaS通过云原生架构和标准化服务，正在重塑AI技术的开发和消费方式，推动人工智能从“技术专有”向“普惠工具”转变。以下是其核心要点：1.定义与核心理念MaaS将大模型（如GPT-3、多模态模型等）封装为标准化服务，用户
云计算技术基础第2章云计算的架构及国内外标准化情况（2）学习记录wanxiaowan 数据库云计算概论计算机网络
分布式管理任务组（DMTF）是一个国际标准组织，DMTF工作组致力于分布式IT系统的有效管理，通过聚合众多IT厂商一起来进行管理系统的开发、效用及改进等标准化工作…OGF(开放网格论坛)全球网络存储工业协会（StorageNetworkingIndustryAssociation，SNIA）是成立时间比较早的存储厂家中立的行业协会组织，宗旨是领导全世界范围的存储行业开发…加拿大标准协会（Canad
Elasticsearch：基本概念、索引结构与优缺点分析 Leaton Lee elasticsearch 大数据搜索引擎
一、Elasticsearch基本概念Elasticsearch是一个基于Lucene构建的开源、分布式、RESTful搜索引擎，专为云计算环境设计，能够实现近乎实时的数据搜索和分析功能。核心概念解析文档(Document)Elasticsearch中的基本数据单元，使用JSON格式表示每个文档有唯一ID和类型示例：一条产品信息、一篇博客文章或一个客户记录索引(Index)文档的集合，类似于关系数
VMware Fusion 虚拟机安装CentOS 7 Mac 2501_92680691 macos mac vmware 虚拟机 centos7
CentOS是CommunityEnterpriseOperatingSystem的缩写，也叫做社区企业操作系统。是企业Linux发行版领头羊RedHatEnterpriseLinux的再编译版本（是一个再发行版本），而且在RHEL的基础上修正了不少已知的Bug，相对于其他Linux发行版，其稳定性值得信赖,广泛用于服务器、云计算、虚拟化等领域。原文地址：VMwareFusion虚拟机安装Cent
容器革命：Docker 技术深度解析与未来趋势小红花大酒店 Docker 技术探秘 docker 容器运维
容器革命：Docker技术深度解析与未来趋势一、容器化技术的颠覆性价值在云计算与微服务架构蓬勃发展的今天，Docker作为容器化技术的代表，正深刻改变着软件交付的范式。传统虚拟机（VM）需要为每个应用实例配备完整的操作系统，导致资源浪费和启动延迟（分钟级）。而Docker通过操作系统级虚拟化，将应用及其依赖打包成轻量级容器，实现了秒级启动和MB级资源占用。这种技术突破使得开发团队能够以标准化方式构
【产品经理修炼之道】-电信运营商的生态棋局｜To B 生态逻辑 xiaoli8748_软件开发产品经理产品经理
2022年，阿里云、腾讯云的增长放缓，三大运营商强势进击，云业务的增长均超过了100%。相比大厂，运营商具备云网、渠道、服务、数据资源。但向前一步容易，如何走好接下来的路，运营商任重而道远。大厂后退，运营商向前。2022年，国内云计算生态迎来重大变局。一方面，是阿里云、腾讯云的增长放缓；另一方面，是三大运营商的强势进击。财报数据显示，2021财年、2022财年，阿里云收入增长分别为50%、23%，
OpenStack入门体验 ASDyushui openstack
目录一.云计算概述1.什么是云计算2.云计算的服务模型（1）.laaS（2）.PaaS（3）.Saas3.OpenStack概述（1）.OpenStack起源（2）.什么是OpenStack（3）.OpenStack优势二.部署Openstack1.系统描述2.设置在线安装3.系统基本环境设置4.设置KVM源5.设置openstack仓库6.安装部署工具7.一键安装一.云计算概述1.什么是云计算云
模块三：现代C++工程实践（4篇）第一篇《C++模块化开发：从Header-only到CMake模块化》 AI迅剑 c++开发语言 cmake
引言：现代C++工程化的核心挑战（终极扩展版）在云计算与物联网时代，C++项目规模呈指数级增长。传统Header-only开发模式暴露出编译效率低下、依赖管理混乱、版本冲突频发等致命问题。本文通过CMake3.22+Conan2.0工具链的深度集成，结合5个真实工业案例和200+行配置代码，系统阐述：Header-only库的模块化改造（含性能数据、内存分析）CMake高级配置技巧（目标属性、接口
触发器设计美国VPS：优化数据库性能的关键策略 cpsvps oracle 数据库
在当今数字化时代，美国VPS（虚拟专用服务器）因其高性能和稳定性成为众多企业和开发者的首选。本文将深入探讨触发器设计在美国VPS中的应用，分析其优势、实现方法以及最佳实践，帮助您充分利用VPS资源，提升系统效率和响应速度。触发器设计美国VPS：优化数据库性能的关键策略美国VPS与触发器设计的完美结合美国VPS作为云计算领域的重要基础设施，为触发器设计提供了理想的运行环境。触发器（数据库中的自动执行
我国在AI、元宇宙、生成式AI赛道的竞争带来的投资机会数据与人工智能律师大数据区块链人工智能网络数据库
首席数据官高鹏律师团队编著中国在AI、元宇宙、生成式AI赛道的竞争已进入技术深化与商业落地并行的关键阶段，未来投资机会可围绕以下五大方向展开：一、基础设施与算力支撑1.云计算与混合云服务生成式AI对算力和云服务需求激增，联想集团等布局混合云的企业受益于企业数字化转型需求。IDC预测，到2025年，50%的企业将与生成式AI云提供商建立战略联系，云服务商需优化数据治理和成本控制能力。2.AI芯片与算
网络拓扑结构对云计算性能的影响 hi error.cn c语言 java 数据库经验分享
网络拓扑结构对云计算性能的影响在现代信息技术环境中，网络拓扑结构扮演着至关重要的角色，它直接影响着云计算服务的性能和效率。网络拓扑结构不仅决定了数据在网络中的传输路径，还影响了系统的服务可用性、响应时间和安全性等方面。因此，在设计和优化云计算环境时，了解并合理选择合适的网络拓扑结构显得尤为重要。网络拓扑结构的基本概念网络拓扑结构是指网络中各个节点（如服务器、客户端等）之间的连接方式，它决定了数据在
Python pip：包的云计算部署
Pythonpip：包的云计算部署关键词：Pythonpip、云计算部署、包管理、虚拟环境、云平台摘要：本文围绕Pythonpip进行包的云计算部署展开深入探讨。首先介绍了Pythonpip在包管理中的重要性以及云计算部署的背景和意义。接着详细阐述了pip的核心概念和工作原理，包括其与Python生态系统的紧密联系。通过具体的Python代码示例，讲解了pip包管理的核心算法原理和操作步骤。同时，
python模拟内置函数reversed_Python内置函数reversed weixin_39594895
{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技术人对外发布原创技术内容的最大平台；社区覆盖了云计算、大数据、人工智能、IoT、云原生、数据库、微服务、安全、开发与运维9大技术领域。","link1":
红海云签约东莞科创金融集团，科创金融行业人力资源数字化红海云人工智能金融
东莞科技创新金融集团有限公司（以下简称“东莞科创金融集团”）是东莞市属一级重点国有企业，实施以股权投资为核心、以融资增信和园区运营为支撑的“一体两翼”发展战略，致力打造国内一流的“科技创新投资平台公司”。近日，东莞科创金融集团与广州红海云计算股份有限公司正式签署战略合作协议。红海云将依托其行业领先的数字化技术底座、全场景人力资源数字化管理经验及卓越的服务能力，为东莞科创金融集团构建全流程在线化、数
云计算和云服务有啥区别
云计算技术在近些年成为了很多人口中的口头禅，然而我们还注意到，在谈论云计算这种技术的过程当中，除了“云计算”这个词之外，往往还会提及“云服务”，对于这样两个词语来说，其在商业模式的运作以及平台管理等方面究竟有何区别呢？云计算和云服务区别是什么？提到云计算，不少人会想起三个词汇——IaaS、PaaS和SaaS，单从字面来讲，其中的S是Service（服务）的缩写，也是云计算最典型的三种服务模式。不太
容器技术分享倬宁 docker 容器 kubernetes
一、开篇词容器技术由来已久，却直到几十年后因dotCloud公司（后更名为Docker）于Docker项目中发明的“容器镜像”技术创造性的解决了应用打包的难题才焕发出新的生命力并以“应用容器”的面目风靡与世，也催生出或改变了一大批诸如容器编排、服务网络和云原生等技术，深刻的影响了云计算领域的技术方向。二、容器容器（container）：实际上是一种沙盒技术，能够像一个集装箱一样，把你的应用“装”起
Serverless 架构入门与实战：AWS Lambda、Azure Functions、Cloudflare Workers 对比 moppol serverless aws 云原生
一、引言：Serverless是未来，但你真的了解它吗？随着云计算的发展，“Serverless（无服务器）”这个词越来越多地出现在技术讨论中。很多人以为它是“不需要服务器”，其实不然——它意味着你不再需要关心底层服务器的配置、维护、扩容等繁琐操作。Serverless让开发者只需专注于代码本身，而将基础设施交给云服务商来管理。本文将带你从零开始了解Serverless的核心概念，并深入对比三大主
中国软件供应链安全厂商推荐︱悬镜安全聚焦全球数字经济大会·中国信通院最新成果发布 DevSecOps选型指南安全
2025年7月3日，由全球数字经济大会组委会主办，中国信息通信研究院、中国通信标准化协会承办的全球数字经济大会—云智算安全论坛暨第三届“SecGo论坛”在京召开。北京市经济和信息化局副局长顾瑾栩、中国通信标准化协会副理事长兼秘书长代晓慧、中国信通院党委副书记王晓丽、中国信通院云计算与大数据研究所副所长栗蔚出席会议。在成果发布环节，中国信通院对云智算安全行业发展、产业创新有突出贡献的个人予以表彰，悬
黑客 vs. 网安：谁才是数字世界的主宰？ 2024年信息安全人员应该重点学什么？网安导师小李程序员编程网络安全 linux 运维服务器 excel web安全 python java
在当今数字化飞速发展的时代，信息安全问题日益严峻。黑客攻击、数据泄露、网络病毒等威胁不断涌现，企业和个人的隐私安全岌岌可危。随着人工智能、物联网、云计算、区块链等新技术的兴起，信息安全行业正面临着新的挑战和机遇。2024年信息安全行业面临的挑战和机遇**1.人工智能（AI）：**AI技术的广泛应用使得攻击者能够利用机器学习和自动化技术进行更具针对性的攻击。例如，恶意软件可以通过AI算法不断自我进化
解锁阿里云日志服务SLS：云时代的日志管理利器云资源服务商阿里云云计算服务器
引言：开启日志管理新篇在云计算时代，数据如同企业的血液，源源不断地产生并流动。从用户的每一次点击，到系统后台的每一个操作，数据都在记录着企业运营的轨迹。而在这些海量的数据中，日志数据占据着至关重要的地位，它不仅记录了系统的运行状态、用户的行为信息，还为企业的运维、安全、业务分析等提供了宝贵的依据。如何高效地处理这些日志数据，成为了企业在数字化转型过程中面临的关键挑战之一。阿里云日志服务SLS（Si
linux下的分布式Minio部署实践
Linux下的分布式Minio部署实践分布式Minio部署可以将多块硬盘（位于相同机器或者不同机器）组成一个对象存储服务，避免单机环境下硬盘容量不足、单点故障等问题。1.简介在当前的云计算和大数据时代，IT系统通常的设计理念都是无中心和分布式。Minio分布式模式可以帮助搭建一个高可靠、高可用、弹性扩展的对象存储服务。分布式部署，minio拓扑为Multi-NodeMulti-Drive(MNMD
家用充电桩远程监控安全管理系统解决方案蓝蜂物联网物联网远程监控边缘计算物联网
家用充电桩远程监控安全管理系统解决方案在当今电动汽车日益普及的背景下，家用充电桩的安全管理成为了广大车主关注的重点问题。为了实现对充电桩的高效、精准、远程监控，一套完善的家用充电桩远程监控安全管理系统解决方案应运而生。本方案旨在通过先进的物联网技术、云计算、大数据分析以及人工智能等科技手段，构建一个集实时监测、异常预警、故障诊断、数据统计、远程控制于一体的智能化平台，确保充电桩的安全运行及用户充电
FaaS（功能即服务） KENYCHEN奉孝自动化测试
FaaS简介—一种云计算服务，使云应用程序开发人员可以更轻松地运行和管理微服务应用程序。什么是FaaS（功能即服务）？FaaS（功能即服务）是一种云计算服务，它允许您执行代码以响应事件，而无需通常与构建和启动微服务应用程序相关的复杂基础设施。在Internet上托管软件应用程序通常需要配置和管理虚拟或物理服务器以及管理操作系统和Web服务器托管进程。使用FaaS，物理硬件、虚拟机操作系统和Web服
AWS多账号管理终极指南：从安装配置到高效使用 ivwdcwso 运维与云原生 aws 云计算 iam 多账号 cli
引言：为什么需要多账号管理？在云计算时代，企业使用多个AWS账号已成为最佳实践。根据AWSWell-ArchitectedFramework，多账号架构可以：实现环境隔离（生产/测试/开发）满足不同业务单元的安全要求简化资源管理和成本分配符合合规性要求（如SOC2、ISO27001）本文将手把手带您完成从AWSCLI安装到多账号配置的全过程，特别针对中国区与全球区的混合使用场景。第一部分：AWSC
Docker 与 Serverless 架构：无服务器环境下的容器化部署 you的日常容器技术 Docker 性能优化实践 docker serverless 架构容器
Serverless（无服务器）架构作为云计算领域的革命性范式，以其无需管理服务器、按需付费、自动伸缩的特性，正在改变着应用开发和部署的方式。然而，传统的函数即服务（Function-as-a-Service,FaaS），如AWSLambda，在运行时环境、部署包大小和复杂依赖管理方面存在一定的局限性。幸运的是，Docker容器的出现为Serverless带来了新的活力。容器的强大可移植性和环境一
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {

ODPS技术架构及应用实践

你可能感兴趣的:(ODPS,云计算)