一文看懂“数据治理”和“可观测性”

这篇文章将带我们深入了解数据可观测性（Observability）和数据治理（Data Governance）的来龙去脉——这两个是企业建立数字化基础的关键。

在数字化赋能企业业务和效率的大背景下，数据治理和数据可观测性被越来越多的企业所采用，因为它们是构成复杂但易于操作的数据管道（Data Pipeline，是一种允许数据通过数据分析过程从一个位置高效流向另一个位置的技术）的基础。

这些年，企业在人工智能（AI）领域创建了足够多的概念，来向用户展现AI之于企业竞争的必要性。然而，AI 是一门严谨的科学，任何一个简单的功能或数据维度的差异都会造成巨大的差距，这些差距很容易使某一方在竞争中占据优势。

当下，基于 AI 的功能已成为热门话题，并已成为保持竞争的必要条件。这就是为什么今天的组织专注于建立坚实的数据基础，以便数据解决方案无缝且与常规软件的生产一样高效。

因此，让我们深入了解数据可观测性和数据治理的来龙去脉——这是建立更强大数据基础的关键因素。

什么是数据可观测性？

数据可观测性（Observability）是近几年来才从控制理论中借用的舶来概念，常讨论于计算机科学领域，指如何从外部输出推断及衡量系统内部状态，强调以更加“白盒”的方式替代现存于复杂信息系统的“黑盒”，解决不断增长的数据需求，帮助我们更好的观察系统的运行状况，快速定位和解决问题。

随着企业对数字化的不断探索和广泛采用，托管数据解决方案的技术堆栈变得越来越高效。与此同时，它们也变得更加复杂和精细，这使得它们难以维护。

组织面临的最常见问题是数据停机时间。除了数据中心的电源和散热问题、基础设施漏洞、事故、人为错误以外，硬件维护、服务器迁移和固件更新也都可能导致代价高昂的数据中心停机事件（eg. 硬件维护、服务器迁移和固件更新都需要将物理服务器停机）。更可怕的是，据艾默生网络能源（Emerson Network Power）委托 Ponemon 研究所于2010年9月发起的“数据中心停机“研究显示，数据中心停机会造成大约每分钟$5,600或每小时$336,000的损失，这些损失主要产生在包括但不限于数据丢失或损坏，生产力损失，设备损坏，根本原因检测和恢复措施，法律和法规影响，收入损失、声誉和信任的长期影响等因素。数据停机时间是数据不可靠的时间段。它可以是错误的数据、不完整的数据或不同来源的数据差异。没有可靠的数据，就不可能有最先进的解决方案。

这种不断增长的数据可靠性需求导致了可观测性工程的新兴领域，该领域具有三个高级组件。简单来说，这些组件是数据可观测性用来聚合数据的格式：

指标：指标是在给定时间范围内测量的数据的累积度量。
日志：日志是跨不同时间点发生的事件的记录。
跟踪：跟踪是分布在分布式环境中的相关事件的记录。

为什么需要数据可观测性？

数据可观测性提供了预测数据行为和异常的额外优势，这有助于开发人员设置资源并提前做好准备。数据可观测性的关键能力是找出导致记录数据性能的原因。例如，如果欺诈检测模型的敏感性得分较低，则数据可观测性将深入数据，分析得分较低的原因。

这种能力至关重要，因为与大多数结果都在代码控制之下的常规软件不同，在 ML（机器学习，是人工智能的应用程序，是计算机程序使用算法来查找数据中的模式）软件中，大部分结果都超出了解决方案的控制范围。这是因为数据是一个独立的因素，甚至可以通过一个异常事件使解决方案无效。这种数据中断的一个例子将是破坏就业率、股票趋势、投票行为等的大流行。

在给定数据组（例如，来自特定状态的数据）上始终运行良好的解决方案也很可能在另一个数据组上严重失败。

因此，在评估任何数据解决方案的输出时，了解性能背后的原因成为重中之重。

数据可观测性与数据监控有何不同？

可观测性通常被称为监控 2.0，但它是监控的一个更大的超集。可观测性更像是工程师的助手，通过考虑系统的深层底层状态来确定系统是否按照设计的方式工作。让我们回顾一下将可观测性与监控区分开来的几点：

语境

可观测性不仅仅跟踪/监控系统中的给定脉冲。它还考虑了影响功能的那些脉冲的背景。

深度

监控跟踪系统的表面水平脉冲以了解性能。相比之下，可观测性记录跟踪（或相关事件），建立必要的链接，并整体跟踪系统的深层内部状态。

行动

虽然监控的输出主要是反映系统性能或资源消耗的数字，但可观测性的输出是行动建议。例如，监控会指出系统已经消耗了 100 GB 的内存。相反，可观测性将说明内存消耗是否是次优的，以及是否需要开发人员的干预来进行优化。

ML 监控与 ML 可观测性

长期以来，可观测性一直是 DevOps 框架的一部分。然而，MLOps (Machine Learning Operations，用于数据科学家和运维人员之间协作和沟通的最佳实践)社区对它的需求也越来越明显。此外，随着数据变得越来越复杂，数据管道变得更加复杂且难以跟踪。因此，虽然我们将可观测性集成到机器学习世界中，但定义 ML 监控和 ML 可观测性之间的关键区别很重要。

可观测性的核心要素在 ML 可观测性中端到端体现。ML 监控仅收集有关解决方案的高级输出或成功指标（如灵敏度和准确性）的数据。之后，它会根据预编程的阈值发送警报。

另一方面，ML 可观测性更深入地研究并寻找记录性能背后的原因。最后，通过评估与验证、测试和传入数据之间的洞察力相关联的数据行为，深入研究根本原因。

数据可观测性的支柱

数据可观测性是并行运行以改善数据健康的几个关键特性或支柱的总和：

数据可观测性的支柱 | 作者创建的图像

数据新近度

众所周知，任何 ML 解决方案都与数据一样好。因此，确保数据是最新的至关重要，因为旧的和不相关的数据是组织资源、硬件和劳动力的负担。数据可观测性旨在提供更新数据表的最佳途径，并有助于确定最佳更新频率。

数据分布

数据分布是机器学习最基本的概念之一，因此被高度视为数据可观测性的支柱之一。数据分布是了解手头数据是否在所需范围内的方法。换句话说，这是一种检查数据采样是否正确的方法。

数据量

数据量只不过是对传入和传出数据事务的数据量的跟踪。因此，应跟踪数据量的突然上升或下降，并确保所有可用数据源的正常运行。

架构

模式是存储数据的框架。任何组织中的多个团队都可以访问每个数据模式，每个团队都具有不同的访问级别（编辑、查看等）。因此，对数据的更改是不可避免的，并且必须使用适当的数据版本控制工具进行跟踪。应该考虑诸如谁进行了更改、何时以及为什么进行更改等因素。如果架构不具备处理此类情况的能力，同时更改可能会导致数据差异。

数据沿袭

简单来说，数据沿袭就是数据的故事。它讲述了数据如何从 A 点到 B 点。是因为传入数据源的变化、模式中数据处理的差异，还是手动更改？强大的数据沿袭可以回答此类问题等等。跟踪数据沿袭的主要目标是准确知道数据中断时应该去哪里。由于机器学习管道由于涉及多个实验而变得复杂，因此实验跟踪工具和平台非常方便地了解跨多个实验、模型和数据版本的数据的使用和旅程。

数据隐私和安全

如前所述，数据访问通常因团队和个人而异。数据安全和隐私是确保数据健康的一些重要指标。数据更新中的一个新手错误或数据落入坏人之手可能会破坏整个数据沿袭，并可能成为组织的巨额成本。

元数据

元数据是关于数据的信息。数据可观测性是数据监控的超集，它不仅可以查看数据以追踪中断的根本原因，还可以观测元数据以发现数据变化的趋势。元数据存储确保每个关键 ML 阶段的元数据都以易于阅读和访问的方式进行跟踪和存储，以建立可靠和可重复的机器学习管道。

在构建和管理公司数据主干的基础时，数据可观测性的支柱至关重要。

一个好的数据可观测性解决方案如何帮助您的组织？

在选择数据可观测性解决方案时，必须牢记数据可观测性的支柱。一个好的解决方案可以显着改善组织数据生态系统的健康状况。一个好的解决方案可以帮助改变组织的动态的一些方法是：

主动避免数据问题

由于数据可观测性通过元数据和性能检查来跟踪数据行为的变化，因此它可以提前提醒 ML 工程师通过启动主动修复来防止出现关键数据情况。

映射协助

一个好的数据可观测性解决方案不需要被告知它需要监控哪些指标。事实上，在机器学习模型的帮助下，它有助于识别关键指标、依赖关系、变量、传入和传出资源。元数据存储和实验跟踪功能对于维护具有高清晰度的映射是必要的。

监控静态数据

不必为数据可观测性加载静态数据以对其进行监控。这通过节省内存、处理器，当然还有时间等资源来节省大量成本。这也允许数据解决方案在不影响性能的情况下变得可扩展。

语境

数据可观测性的关键功能之一是通过跟踪数据和结果之间的适当联系来找到根本原因。当您有一个 AI 助手指出特定行如何出现错误及其原因时，它会将上下文带入图片并快速修复数据问题。

安全

安全性是数据可观测性的支柱之一，自然是关键问题之一，因为它可能导致数据大规模中断。因此，数据可观测性确保了最佳的安全性和合规性。

自动配置

数据可观测性解决方案使用 ML 模型来评估数据、元数据和 ML 解决方案，以找出诸如环境、关键指标和可能的危机（如性能下降到特定阈值以下）等因素。因此，它消除了维护和找出几乎总是在变化的复杂规则的需要。

轻松合身

一个好的数据可观测性解决方案灵活且易于集成到预先存在的 ML 堆栈中。除非 ML 堆栈组织不良，否则团队无需进行任何更改或重新编写模块。这很好，因为它节省了很多资源。它还具有评估不同解决方案和快速找到合适方案的优势。

数据可观测性是一个广阔的领域，以上几点只是解决了共同关心的问题。所以，现在，让我们深入研究数据治理，看看它如何适合创建完美的数据管道。

什么是数据治理？

数据治理（Data Governance）是指为确保数据安全、私有、准确、可用和易用所执行的所有操作，它在提高企业数据的可用性、质量和安全性上扮演着重要角色。

数据治理是一组标准和规则，旨在维护整个数据管道的数据质量。由于 AI 和 ML 等新兴技术严重依赖于作为自变量的数据，因此验证数据的质量至关重要。

重要的是要注意，数据治理不是关于数据管理，而是关于围绕最佳执行和分配正确的角色和责任制定战略和政策。

数据治理的好处

在当今数据解决方案之间日益激烈的竞争中，数据治理是必不可少的。下面的好处将更好地说明为什么会这样：

数据治理的好处 | 作者创建的图像

端到端视图

数据治理在数据方面努力实现单一真理。但是，数据通常在新发展的组织中的各个团队和利益相关者之间共享，而没有任何跟踪。这导致多个数据版本导致数据差异和最终客户不满意。为所有团队提供 360 度视图的单一事实来源是解决上述问题的关键。

更好的数据质量

数据治理确保数据完整，数据来源可靠。它还负责数据的正确性。

资料图

多个团队经常出于其他目的访问用于特定解决方案的数据。例如，咨询团队可能会访问数据转储以解决升级问题。因此，为防止任何混淆，需要所有利益相关者或用户都可以引用的一致密钥。

更好的数据管理

数据治理通过引入最新技术和自动化来提高效率并减少错误，从而提升了现有的数据管理方法。

安全

数据治理负责处理数据安全问题并解决所有合规性要求。这导致端到端数据管道的中断最小化，因为安全问题是主要障碍并且需要很长时间才能得到解决。

数据治理挑战

数据治理是一门相对较新的学科，因此组织在初始设置阶段面临一些常见挑战。他们之中有一些是：

缺乏业务理解

数据通常被认为完全由 IT/开发团队拥有和管理。这有一个重大缺陷，因为 IT 团队没有端到端的业务视角，也无法拨打关键电话。因此，当客户提供必要的数据时，甚至在从其他来源收集数据时，数据收集过程中都会出现间隙。

由于缺少只有全面的业务团队才能识别的功能，因此数据不是最理想的。除非将业务理解整合起来，否则利益相关者在传达结果时也会存在相当大的差距。

无法识别痛点

数据治理的工作是解决数据管道中的问题。但是，如果参与者无法确定优先级和痛点，则由于反复试验循环，数据治理标准可能需要更长的时间。

缺乏灵活性

数据管理通常需要对各种操作进行多次批准。例如，在处理客户端请求时，可能会发现客户端的数据会占用相当大的空间，这超出了可用的硬件限制。这启动了整个层次结构的一系列批准。尽管这是一个简单的过程，但由于对时间的影响很大，因此效率低下。

预算限制

数据解决方案通常需要复杂的资源，例如内存负载和高处理能力。不幸的是，这些资源可能对团队来说是禁区，特别是在数据团队仍然是新的和不断发展的组织中。为了弥补预算和资源的不足，必须设计一个低于标准的解决方法，这会影响数据生态系统的健康。

如果我们深入研究，将会发现许多新的和不同的挑战。每个组织都有不同的个性，面临着各种各样的挑战。关键是要开始并解决问题。

数据治理工具

在考虑选择哪种数据治理工具时，最好从经济高效且快速的选项开始。因此，可靠的开源解决方案或基于云的平台可以进行繁重的工作，非常适合进行实地测试。繁重的工作包括轻松添加新功能、简单集成、即时可用的硬件或服务器功能等等。

让我们看看在缩小数据治理工具范围时应该考虑的一些要点：

提高数据质量：数据治理工具应该在没有干预的情况下清理、优化和验证数据。
无缝管理数据：该工具应集成高效的 ETL（提取转换负载）流程，以便轻松跟踪数据沿袭。
记录数据：文档是任何流程中最被低估的执行者，即使它为团队保留并传递了最大的价值。记录数据是必要的，这样可以提高可重复性、可搜索性、访问性、相关性和连接性。
具有高透明度：该工具应向管理或使用它的任何人提供高透明度。它应该像一个助手一样，通过清楚地指出任务、沟通点和不作为的影响来帮助用户执行任务。
审查数据：数据、数据趋势、访问点和数据健康状况不断变化，需要密切监控。因此，定期审查可以使数据保持最新，并且不会出现看似合理的故障。
捕获数据：数据治理工具应自动发现、识别和捕获关键数据点。
提供敏感的洞察力：数据治理工具应该理解数据并最终提供关键洞察力，帮助构建数据管道的后续步骤。

总体而言，在选择数据治理工具时，易用性也应该是主要关注点之一，因为用户和工具之间的高摩擦最终会减慢流程。

15 个数据治理最佳实践

尽管最佳实践是主观的并且取决于组织的当前状态，但以下是前 15 种常见的数据治理实践入门：

开始：迈出第一步，通过制定增量计划从小处着手。
定义目标：增量计划必须有明确的目标，不仅分配给数据治理的参与者，而且分配给每个流程和阶段。当然，目标必须是现实的、可实现的并朝着正确的方向启动。
通过所有权确保问责制：然而，仅分配目标是不够的，数据治理的每个参与者都需要拥有流程并保证他们的成功。证明所有权的最佳方式可能是将绩效 KPI 与流程联系起来。
强调团队成长：为了团队的进步和各个参与者在不同层次的绩效水平上保持一致，高级流程所有者应直接对低级流程所有者负责。这可以再次激发责任感、团队合作精神，从而提高效率。
让利益相关者参与进来：业务利益相关者的洞察力对于确保他们贡献自己的力量而没有任何含糊或混淆至关重要。因此，最好对他们进行有关数据治理架构的教育。
整合业务理解：理解业务目标和组织目标对于构建组织的数据主干至关重要。例如，公司的目标是短期成功还是长期坚持？对公司具有约束力的合规要求是什么？公司期望从其数据解决方案中获得的利润百分比是多少？在制定数据治理策略之前，必须收集此类数据。
融入框架：数据治理必须明智地集成到组织的预先存在的框架和基础设施中。除非组织是一家初创公司并且有能力改组流程，否则不建议进行重大中断。
优先级：在数据治理的实施过程中会出现大量问题。应该是领导的号召，找出需要尽早解决的问题和可以等待的问题。
标准化：标准化数据管道在初始阶段可能是一个代价高昂的过程，但从长远来看，它可以节省大量成本。标准化在各个方面都有帮助，包括消除数据差异、一次性数据载入、更少的来回通信、有效使用可用硬件等等。
定义指标：我们得到我们测量的东西，即使在数据治理的情况下也是如此。确定可以定义流程成功和失败的关键指标，并非常谨慎地选择阈值。确保指标与业务 KPI 和结果直接相关。这将有助于业务团队更好地理解指标。
业务提案：准备好业务提案，其中包含数据治理可以为组织带来的优势和好处。预算谈判、顶线和底线目标以及节省的时间应该估计并提交给当局。
无缝沟通：确保团队之间的无缝沟通，因为高效的沟通是运行每个流程的关键杠杆。通常，团队间的沟通很复杂，因为人们不确定为了特定目的应该联系谁。确保定义了流程所有者，并且分配高度透明，以便个人可以快速找出联系点。
确保合规性：遵守合规性规则的预先计划的策略非常适合顺利运行。但是，在流程中途出现意外的合规问题可能会很复杂，而且肯定会花费大量时间。
引进专家：由学习者和专家组成的团队是提高效率的最佳选择。来自外部的专家从行业中引入了额外的数据治理知识，内部参与者与他们合作，以 360 度全方位了解组织的动态。这两种类型的知识结合起来，可以激发出卓越的观点和洞察力。
制定 B 计划：考虑预算申请未获批准或重要资源失败的情况。记下针对此类情况的最快和高质量的解决方法。

总的来说，重要的是要记住一种尺寸并不适合所有人。因此，注意行业的最佳实践是很好的，但不建议回避实验以找到最适合您的组织和文化的实践！

最后的想法

由于无休止的数据量和越来越多的不可靠来源，数据可靠性日益受到关注。因此，数据作为机器学习解决方案性能的主角，需要具有强大的生命力。如果没有高质量的数据支持，即使是最先进的解决方案也可能失败。

在 AI 时代的最初几年，在数据解决方案中执行多个 POC 后，组织已经开始意识到这一点。不幸的是，结果是解决方案在给定的时间内对给定的数据集运行良好，但很快就会失败并且即使再训练也变得无关紧要。这就是为什么开发人员希望了解故障背后的原因，这可以通过主动监控和深入分析来证明。

在当今快节奏的竞争环境中，数据治理和数据可观测性都变得至关重要。尽管它们是相对较新的学科，但它们与一些成熟的领域交叉，例如云数据架构、虚拟框架、机器学习等。跨行业的采用率将很快将它们带到最前沿。在那之前，让我们为即将发生的事情打下基础！

原文链接：Data Governance and Observability, Explained

翻译&编辑：一路孙

Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
Redis 有哪些危险命令？如何防范？花小疯 redis 缓存数据库危险命令大数据
Redis有哪些危险命令？Redis的危险命令主要有以下几个：1.keys客户端可查询出所有存在的键。2.flushdb删除Redis中当前所在数据库中的所有记录，并且此命令从不会执行失败。3.flushall删除Redis中所有数据库中的所有记录，不止是当前所在数据库，并且此命令从不会执行失败。4.config客户端可修改Redis配置。怎么禁用和重命名危险命令？看下redis.conf默认配置
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
接口测试如何设计测试用例李蕴Ronnie
接口测试用例设计方式针对每个必填参数，都设计一条参数为空的测试用例必填参数不存在传的参数值在数据库中不存在添加数据接口，传入已有的数据重复添加编辑数据接口，各个字段分别编辑，合并编辑参数数据类型限制，针对每个参数设计一条参数值类型不符合的逆向用例参数自身取值范围，针对所有参数，设计一条每个参数值在取值范围内最大值的正向测试用例是否满足前提条件（token、headers），几个前提条件几条用例针对
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
六、全局锁和表锁：给表加个字段怎么有这么多阻碍 nieniemin
数据库锁设计的初衷是处理并发问题。作为多用户共享的资源，当出现并发访问的时候，数据库需要合理地控制资源的访问规则。而锁就是用来实现这些访问规则的重要数据结构。根据加锁的范围，MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类。6.1全局锁全局锁就是对整个数据库实例加锁。MySQL提供了一个加全局读锁的方法，命令是Flushtableswithreadlock(FTWRL)。当你需要让整个库处于
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p