cuifudun4896

运营商大规模数据集群治理的实践指南

写在开头的话

Q: 军哥，你们运营商行业的大规模集群，都有啥特点啊？

A: 我们集群主要是承载B域、信令和互联网日志等去标识化数据，简单的说，有三个特点：

1）集群规模较大：数千节点规模，近百PB数据量，日新增处理数据百TB以上；

2）组织干系人多：数据平台开发运维过程涉及到数百人以上的不同团队组织协同；

3）数据合规要求高：数据租户服务涉及到数据安全、用户隐私保护的合规要求高。

Q: 好吧，听起来，要搞定这样的集群，有难度呀！那何时要关注集群的治理呢？

A: 好问题！一般来说，当数据质量问题、数据交付及时性、数据安全问题需要耗费极高的应对成本，或者说，当你经常会碰到以下类似的问题时，就该考虑做系统化的集群治理工作了。

Q: 看起来，集群治理好像需要做很多配套的工作，实际上会有多大的产出效果呢？

A: 说出来，你可能不太信，就拿针对某集群治理的效果为例：在处理数据量翻倍的情况下，集群资源负载降低30%以上，综合计算节省数百台节点，每年节省投入上千万元；减少垃圾数据、测试数据、中间数据、过程数据，占总存储15%以上；核心产品模型运行时长，缩短30%-80%。

一、集群治理的定位

Q: 我以前听说过数据治理，你这里说大规模数据集群的治理，有什么具体差异吗？

A: 好问题！不过要搞清楚这块，得先了解一下我们数据资产管理体系建设的实施路径——主要分三个子工程，同步开展实施推进：

工程一：搭建核心业务数据治理框架，包括基础平台的建设、治理规范的制定，元数据管理、数据血缘和数据质量工具开发和应用实践，构建上层数据产品体系和数据能力开放平台，让数据多用活用，形成符合公司业务和组织协作特点的治理文化。
工程二：实现全域数据计算集群的深度治理，完成全域数据治理元数据的自动化采集、存储和分析，构建数据能力开放平台多租户专项治理机制，沉淀数据治理中台能力，基于大数据集群底层核心组件（如YARN、HDFS）的深入洞察，孵化出数据集群治理的应用。
工程三：完善治理机制体制建设，构建数据资产管理体系，并利用该系统的运营逐步重塑优化业务流程，实现可支撑全业务流程的成本评估机制，让数据价值持续攀升。

回到你刚才的提问，数据治理基本上可以理解为工程一的核心目标；大规模集群的治理对应工程二，它需要长期支撑工程一的具体建设任务，并为数据资产管理体系的运营夯实基础。

二、集群治理的背景

Q: 你刚才说的好像很有道理，但是我还是不太明白，为何不是在数据治理工程中扩展一个子任务去做，而是要另起炉灶，搞一个新的大工程来做数据集群的专项治理？

A: 好问题！恭喜你！你快要触摸到数据集群治理问题的核心了。我们不妨再捋一下数据集群治理的背景，主要是遇到的历史部分集群无序建设的种种问题：

这些问题可进一步分为几类，简单分析完你就自然明白了：

1）管理类：集群接口机权限管控、数据表不合理创建和删除、垃圾数据表过多问题。这类问题，可以通过数据治理工程进行持续改进，但是解决时间周期以年为单位。

2）集群类：集群整体加工慢、稳定性欠佳、队列资源争抢、资源得不到合理分配的问题。这类问题，基本上要集群底层视角进行深入分析，在业务层做数据治理几乎无解。

3）洞察类：冗余计算浪费资源问题、智能实时预警、完整血缘和数据价值分析问题。这类问题只能通过大数据技术手段对Hadoop底层核心组件做深入洞察来解决。

三、集群治理的目标

Q: 听你这么说，针对大规模数据集群的治理工程还是很有必要的！

A：是的，“大规模”带来的问题，肯定不止上面这几类，实际上会远超你的想象，传统的数据治理工具（如元数据、数据质量、数据血缘分析）可能就不灵了，必须要根据集群规模、数据仓库新型技术方案选型以及业务流程进行重构，才可能得到预期的治理效果。再强调一句，大规模数据是长在集群之上，而集群里面的很多关键组件不是传统的商业关系型数据库，而是开源社区的通用版本，其可维护性、稳定性和功能局限性等方面都存在较大的挑战，性能这块也需要深入到源码层进行重构调优处理，你得做好准备。

所以，我们做大规模集群治理的核心目标聚焦在①确保集群稳定，充分保障集群资源算力；②以效果为导向，有效驱动平台数据治理：

充分保障集群资源算力

毫无疑问，在大规模集群计算环境，保障集群资源算力是首要任务。如果这一块稍有闪失，数据采集、数据存储、数据加工、数据建模分析、数据测试、数据稽核、数据迁移、数据同步、数据计算、数据作业重跑等流程可能都要崩溃，因为这些环节背后都涉及到大量的数据作业任务调度执行，其成功与否取决于分布式系统组件整体的通信、资源的申请、以及任务实例的执行结果，因此除了足够的物理资源池之外，还需要特别保障集群Master进程类服务的性能表现和稳定性。

有效驱动平台数据治理

开展集群治理的工作，最重要的目标就是有效支撑数据治理工程的建设。

数据治理是一个系统工程，通常是按照类似下面的框架做：

其关键是组织、流程、平台工具、评价考核机制的全面协同。

首先是从数据采集加工流程中梳理出数据治理体系最需关注的各环节建设内容和目标：

然后构建元数据管理、数据质量稽核、数据血缘分析、数据地图等工具集：

元数据管理：数据库表、模型脚本等元数据信息庞大复杂，可通过全文检索功能迅速查找和关键字匹配的权限范围内的元数据信息，为海量数据分析提供更快、更正确的查询处理、更好的数据质量、更易使用的操作接口等。
数据血缘分析：元数据管理重要应用之一，展示表、视图、过程之间的关系，表和指标间的关系。采用NET模式或FLOW模式进行信息呈现。血缘关系的数据来源支持通过解析数据加工SQL脚本、存储过程注释的方式；可支持通过ETL流程自动生成的方式，亦可支持通过配置表的方式。
数据地图：元数据信息的全景视图，描述所有元数据对象的血缘关系，所处层级覆盖范围由ODS->DWA->DWD->DM层，全面呈现了数据仓库中数据之间的关系。

如果你的数据集群规模不大，比如百节点以内，有非常完备的治理组织架构，按照传统的工具流程和方法论去做数据治理，一般问题不大。但是，如果是在运营商大规模集群环境，随着业务的发展，遇到新的问题时，光靠一些老套路是行不通的，或者说整体治理成本是极大的。

在这样的大规模集群环境下，数据治理的本质其实就是：解决人与人的对抗、人与机器的对抗、人与工具的对抗、人与数的对抗问题。实践经验发现，只是靠堆人的方式，或者只在数据治理文化层面强调人机数的全面协同，要做好大规模集群的数据治理是不太现实的。更务实的做法是基于公司业务和组织架构特点，不断驱动和协同优化，还要借助大数据技术手段，精益推动数据集群侧的持续治理，形成数据治理+集群治理+资产管理的整体协同效应。

简而言之，集群治理支撑数据治理，数据治理驱动数据资产管理。数据中心的资产包括数据、程序、流程、服务及资源5大类，通过集群治理和资产的有效管理，对于促进数据价值持续发现、数据能力持续开放、数据的持续变现有巨大的促进作用，从而逐步推动数据治理体系向资产管理体系演进。

四、集群治理的实施路径

Q: 军哥，说了半天，你好像还没有告诉我，到底如何开展集群的治理工作呀？

A: 不急，只要你明白了集群治理的定位、背景、目标，其实搞大规模数据集群的治理工作就没有那么难，按照以下8个步骤做就行：

第一步：理清大规模数据集群的现状和治理需求点

第二步：明确治理的组织架构、方法论、技术框架

第三步：构建针对大数据集群的智能运维技术平台

第四步：实现YARN作业&HDFS画像、小文件洞察

第五步：实现NN RPC画像、关键Master服务预警

第六步：实现冗余计算挖掘，以目录维度评估冗余度

第七步：重构数据血缘、元数据、数据资产管理应用

第八步：智能分析集群用户行为画像，检测预测异常

下文中将对以上八个步骤进行具体解读。

五、集群治理的案例实践 第一步：理清大规模数据集群的现状和治理需求点

现状：Hadoop集群的计算能力已达到数千节点，平台部分集群初期由外部厂商进行建设，为了支撑业务快速上线，并没有统一规划，无序建设引发的问题逐渐暴露出来，权限混乱、计算能力下降、资源冗余计算、资源浪费等问题频发，针对该部分集群的稳定性和资源利用优化治理工作挑战巨大。
需求点：数据治理项目实施的整体难点主要集中在运营商多源头数据质量持续改进、日万亿级大规模数据加工处理、数据平台资源弹性交付与产品化快速响应支撑能力、数据能力开放平台租户高效运营、数据平台智能运维体系建设、数据安全合规保障等六个方面。其中跟集群本身治理特别相关的是：集群智能运维平台搭建、Hadoop组件洞察应用、冗余计算挖掘、集群用户行为智能分析、数据血缘与元数据管理系统重构等五个方面。

第二步：明确治理的组织架构、方法论、技术框架 治理组织架构

集群治理组：负责集群治理平台应用和优化评测工具研发、治理方案的制定、组织治理周例会和专项优化虚拟小组联合讨论会、定期跟踪巡检治理效果，像牵引器一样驱动大家协同完成工作。
数据治理组：除了负责数据质量和常规治理工作以外，还要配合集群治理组的方案，评估涉及到业务数据域基础模型采集加工过程中的改进优化需求点，然后负责具体实施，当然还包括相关产品支撑模型的重构、融合模型的整合优化工作。
租户运营组：配合数据治理组、数据建模组和集群治理组完成租户场景集群治理专项方案的实施。
平台维护组：配合产品应用部、数据治理组、租户运营组、数据建模组、集群治理组完成集群治理专项优化方案的实施。
数据建模组：配合数据治理组、集群治理组完成集群治理平台AI类模型的开发。
产品应用部：配合数据治理组和集群治理组完成集群治理专项优化方案的实施。

治理方法论

这里的核心就是建立自下而上、自发协同、精益推进式的数据治理文化。

治理技术框架

Q: 这个技术框架理解起来太抽象了，要解决的问题可以再解释一下吗？

A: 其实没有那么难以理解，主要是公司业务高速发展过程中数据业务需求越来越复杂，所需算力也越来越大，进一步导致某些集群的规模越来越大，承载的产品也越来越多，部分集群面临资源负载过高、资源抢占严重、RPC请求负载过高等问题；存储系统也面临空文件、垃圾文件、小文件过多，平均文件大小过小、文件数持续增长等问题，存储系统稳定性面临很大隐患；作业又面临执行耗时过长、耗资源大、数据倾斜严重等问题，直接导致数据加工异常率过高、数据具备时间有延迟风险、产品交付面临风险。

基于以上面临的各种困境构建巡山大数据集群治理平台，以资源、存储、作业三大角度，从资源画像、作业画像、存储画像、冗余计算挖掘、数据血缘画像、RPC画像六大维度，几十个小维度进行集群交叉治理并协同各相关组织进行全域治理，使集群全面向良性健康方向发展。 第三步：构建针对大数据集群的智能运维技术平台

Q: 军哥，搞大规模数据集群的治理怎么扯到智能运维平台上面去了呢？必须要建这个平台吗？

A: 好问题！前面说过，集群治理的首要目标就是充分保证集群资源算力，实际上就是要保障集群关键服务运行和数据作业资源调度的稳定性，以及相对不错的性能表现。

这里的稳定性和性能就是IT运维领域的事情，从业界发展来看，主要经历了四个阶段：

1）运维1.0，主要关注网管软件和ITSM工单系统，讲究业务协同和运维流程化。

2）运维2.0，主要关注CMDB和SOP标准运维，一般都会强调自动化工具在运维场景的应用，重点解决一些靠堆人方式解不了的问题。

3）运维3.0，主要关注DevOps、微服务、容器化的融合，比如基于容器云的DevOps一体化平台，打通项目管理、需求、研发、测试、上线、变更处理全流程。

4）运维4.0，主要关注AIOps，实现智能化的健康可用性分析、资源占用预测统计、异常检测、故障预警、智能扩缩容、日志根因分析应用等，其实就是用大数据的技术手段来搞定AIOps模型数据的采集、存储和分析处理。

一般来说，企业IT建设的头几年，会逐步上线CMDB、ITSM、Job自动化作业、SOP等子系统，然后开始考虑DevOps、容器云、AIOps等方向的建设。对于大规模数据集群来说，我们必须先构建好这个基础的智能运维技术平台。

总体架构

ITSM：IT流程服务管理系统，支持跨部门业务工作协同；CMDB：配置管理平台，IT资产应用统一配置化动态管理；Job：自动化作业平台，运维场景的作业批量自动化调度执行；SOP：标准运维平台，可视化拖拽模板化的运维流程定义和调度执行；DevOps: 开发运维一体化平台，公司平台级开发运维一体化管理模式；大数据集群治理平台应用：基于Hadoop内核组件深度分析，实现各类运维数据综合采集和统一整合，基于运维业务场景构建智能调度模型，提升平台数据处理作业性能，有效节省集群资源占用，实现平台集群资源利用率最大化。Monitor统一监控：先支持基础设施和平台集群监控应用，然后完成数据治理及上层产品层对接，逐步形成更全面的端到端统一监控平台。

数据生产监测可视化大屏

具体实施过程中，前期需重点关注平台优化和跨部门业务协同子系统的运营成效。

第四步：实现YARN作业&HDFS画像、小文件洞察

以底层技术为核心，从资源、存储、计算三大维度进行联合治理，深度监控各业务资源队列使用状态、存储系统文件分布、作业运行事件和配置，建立可视化工具体系，驱动日常优化和运营。

从资源角度，对线上集群的资源队列状态进行秒级数据采集，包含队列最大容量、队列配置容量、队列已使用容量多维度的数据采集，实时监控不同业务线、不同周期资源使用状态，以达到动态调整资源规划、加工周期保障产线加工正常进行。

从计算角度，通过采集全域作业信息，解析出数十项核心指标和千个作业配置，计算出作业耗时TOP、耗内存TOP、耗CPU TOP、数据倾斜TOP、高IO TOP以及从不同业务、不同周期、不同账户洞察待优化作业，针对不同异常类型给出相应优化方案，降低作业资源负载、降低输出文件数、提升输出文件大小，从而减低整个集群资源负载和提升存储系统稳定性。

从存储角度，采集分布式存储系统的元数据镜像和元数据操作日志，洞察分布式存储系统文件数趋势、文件分布统计、平均文件大小趋势统计、空文件分布、垃圾文件分布。

技术实现方案

第五步：实现NN RPC画像、关键Master服务预警

大数据集群有很多关键服务，这些服务的健康异常状态，需要重点监控，且尽可能做到实时处理效果，这样在故障发生后可以组合多种监控和日志信息，从多个维度交叉定位问题，提升解决问题效率。

技术实现方案

第六步：实现冗余计算挖掘，以目录维度评估冗余度

冗余计算意味着同一份数据被多个加工流程加工，主要是由于前期为了支撑业务快速上线、没有统一规划、无序建设过程中所引发的问题，在运营商海量数据背景下，数据重复加工意味着对内存、CPU、存储容量、IO、文件数量、RPC负载有着全面且巨大的影响，在全域数十万加工作业中如何全面且精准定位冗余计算成为不小的挑战，基于此持续优化线上加工流程更是一个缓慢的过程，需要详细梳理业务需求，制定数据标准，明确数据口径。

洞察冗余计算主要思路是解析全域数十万个作业并从每个作业千个配置项中解析出输入目录，每个作业会有多个输入目录，最多的有上百个甚至上千个，且目录中含有省份、账期、基站等各种分区类型，我们需要对目录进行通用化处理，以目录为维度统计对应的加工流程以及每个加工流程对应的作业实例，从每个作业实例中计算内存消耗、CPU消耗、存储消耗、IO负载、文件数增长、RPC负载以评估冗余计算带来的成本、优化后达到的效果、执行周期内对其他数据加工产生的影响，以精细化数据为基础协调各组织进行持续治理。

技术实现方案

第七步：重构数据血缘、元数据、数据资产管理应用

面临挑战

在某集群长期的无序建设中，由于对数据缺少平台级的运营手段，比如缺少数据库、数据表以及数据列统一的信息维护平台和整体的物理视图，导致底层数据存在过多垃圾表，且缺少对底层数据的认知；

对元数据的变更无监控无跟踪，缺少全域加工数据血缘关系，不能追溯数据加工流向，导致故障发生后不能明确影响范围，数据成本与价值也难以衡量，在安全合规为第一红线的背景下，对敏感数据也没有效跟踪；

缺少数据资产管理，没有展示数据应有的支撑能力，造成组织架构内数据服务信息不对称。

基于以上痛点，着手重构了企业级全域元数据平台，提供全域物理视图、业务视图、元数据变更跟踪监控、全域数据血缘关系图等核心功能，物理视图提升对数据的认知，业务视图展示数据支撑能力，元数据变更跟踪实时了解产线环境异常修改，数据血缘可提供数据追溯、数据成本价值洞察、敏感数据流向。

元数据平台视图

元数据平台应用

全域数据血缘关系图

技术实现方案

第八步：智能分析集群用户行为画像，检测预测异常

产线环境难免存在数据被误删除的情况，故障发生后，一般要通过较复杂的综合定位过程才能发现根因，此时产线加工可能受阻、数据具备时间延迟，进一步影响到产品质量和用户体验；由于此类故障从根本上难以彻底消除，为尽可能的降低负面影响，可建立用户行为异常操作智能检测机制，对不正常的用户操作及时预警，在一定程度上提前发现问题、规避故障。

技术实现方案

根据产线环境千万级的作业信息，结合当下的资源状态进行特征抽取，建立实时的机器学习模型，对当前以及未来一段时间窗口的资源占用进行预测，将检测到的异常状态波动进行告警。

六、结语

在运营商大规模集群治理的实践过程中，有几点感悟：

1）领导的支持力度非常关键。公司领导对数据资产管理建设的价值认可，能够在核心数据质量持续优化过程中提供组织协调支持，有效推动集团和各省分公司配合改进，保障端到端质量优化效果。

2）数据治理文化建设是核心。建立专业的数据治理团队，优化数据资产管理组织架构，以自底向上的完整血缘分析、核心数据质量为入口，建立自下而上、自发协同、精益推进的数据治理文化。

3）数据资产管理架构和配套工具是基础。在业务发展过程中，逐步打造体系化的数据治理实施能力，安全合规标准规范先行，建立持续优化的治理体制。

4）数据能力开放平台是优势。通过面向外部租户自助建模平台的综合运营，可大幅提升内部数据治理工程跨组织的协同效率，数据用多了，自然会激发治理的原动力。

5）基础平台团队要拥抱并吃透开源技术。能够从大数据平台核心组件源码层进行重构与性能调优，充分保障集群的稳定性和算力要求，在大规模集群故障预测、异常检测、故障恢复、资源调度优化、跨集群协同计算等方向全面探索和应用AIOps技术解决难题。

来自 “ ITPUB博客 ” ，链接：http://blog.itpub.net/31562044/viewspace-2649111/，如需转载，请注明出处，否则将追究法律责任。

转载于:http://blog.itpub.net/31562044/viewspace-2649111/

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比

运营商大规模数据集群治理的实践指南

你可能感兴趣的:(运营商大规模数据集群治理的实践指南)