剑客狼心

数据管理之数据存储

一、数据存储如何操作

1.1 数据存储与操作的目标： 1）在整个数据生命周期中管理数据的可用性：说白了就是数据保存了，别人需要用的时候能找到。 2）确保数据资产的完整性：录入的数据不能乱，比如年龄录成负数这种错误。数据被修改时必须有规则，不能随便乱改。 3）管理数据交易事务的性能：意思是当系统对数据进行操作（比如存、取、改、删）时，要保证这些操作能快速完成，不卡顿、不失败。

简单总结：

第一条是保证数据“随时能用”。
第二条是保证数据“真实准确”。
第三条是保证系统“操作数据时又快又稳”。

定义存储的需求:

在正常的业务运营中，数据存入存储介质，取决于是要永久性存放还是临时性存放。在真正提供存储空间之前，做好增加额外空间的规划是很重要的。紧急情况下的任何维护操作都是危险的。所有项目都应该作第一年运营的初始容量估算，以及未来几年内的空间增长预测。空间和增长的评估，不要只考虑数据自身所需空间，还要考虑索引、日志以及其他任何的冗余特征。

1.2 数据架构类型（就是数据库分类）

    数据库可以分为**集中式数据库**和**分布式数据库**。集中式系统管理单一数据库，而分布式系统管理多个系统上的多个数据库。分布式系统组件可以根据组件系统的自治性分为两类：**联邦的（自治的）或非联邦的（非自治的）**。

   联邦模式还分紧耦合和松耦合。

   区块链数据库属于一种联邦数据库，用于安全管理金融交易。它们也能用来进行合同管理或健康信息交换。

什么是组件系统的自治性？ 看一个组件在分布式系统里能不能“独立完成自己的事情”，而不是总要靠别人帮忙或者指挥。举例就是电商系统中的订单和库存服务，订单系统接到订单之后，如果不检查库存是否充足，而是先把订单创建好了、通过MQ发送消息，订单database和库存database都是独立，那他俩就是高自治的

1.3 分布式系统两个定理

CAP定理：

CAP 定理是分布式系统的核心理论之一，提出了在一个分布式系统中，不可能同时满足以下三个条件：

一致性 (Consistency)：每个读操作都能返回最新的写入数据，系统中的所有节点始终看到相同的数据。例如，你更新了一个账号的余额，所有人看到的余额都要立刻是最新的。
可用性 (Availability)：每个请求都会得到响应，无论请求是否成功（即使无法访问最新的数据，系统仍会返回响应）。系统随时可以使用，不管发生什么问题。例如，如果你想查看余额，系统一定会给你一个响应，哪怕这个余额不一定是最新的。
分区容忍性 (Partition Tolerance)：系统在网络分区的情况下仍能继续正常运行，系统中的部分节点间可能无法通信，但系统依然能处理请求。即使系统的某些部分因为网络问题无法通信，系统仍然能继续正常工作。例如，某两个服务器之间失去了联系，但系统仍然能接受你的请求。

BASE 定理：

BASE 定理可以看作是对 CAP 定理 的一种“折中”，它告诉我们，如果系统选择牺牲 一致性 来提高 可用性，可以使用一些技巧来处理数据的不一致性。简单来说，BASE 定理关注的是“最终一致性”，也就是说系统最终会确保所有数据是一致的，但并不是马上就能一致。BASE对强一致性是不要求的，只需要最终一致。

基本可用 (Basically Available)：大部分时候，系统能响应你的请求，就算可能会暂时不返回最新的数据。
软状态 (Soft State)：系统状态不固定，可能会有暂时的数据不一致，但这不影响系统运行。
最终一致性 (Eventually Consistent)：系统最终会变得一致，虽然在某个时刻可能不一致。

BASE 定理的意思是：你可以选择让系统在短时间内不一致（为了更高的可用性），但它会在一定时间后通过一些机制修复这些不一致，保证最终一致。

1.4 数据库管理过程

    以下的管理过程，是不区分数据库类型，不管是关系型数据库还是NoSQL数据库都适用。

（1）数据归档

      我理解的数据归档，是对那些历史数据适用的，当历史数据很大，已经影响到现有数据的查询使用的时候，就需要归档。
      归档（Archiving）是将数据从**可立即访问的存储介质**迁移到**查询性能较低的存储介质**上的过程。归档后的数据可以恢复到原系统，供短期使用。不需要活跃地支持应用程序处理的数据，应迁移到价格较低的磁盘、磁带或CD/DVD光盘中进行归档。从归档中恢复的过程简单来说是将归档文件中的数据复制回原系统。

    归档过程必须与分区策略保持一致，以确保最佳的可用性和数据保留度。稳妥的方法包括：

1）创建一个辅助存储区域，优先建在辅助数据库服务器上。大白话就是创建一个新的数据库，拷贝原有的数据，可以考虑多台服务器，区分主数据库和存档数据库，数据库支持分区、迁移就行。 2）将当前的数据库表分区成可以归档的单元。大白话：把大表切成小块，每个小块都可以单独存储和管理。这些小块可以按照不同的标准划分，比如按时间、类别等。这样，你就能轻松地把不常用的“块”迁移到辅助存储区。这里就要考虑分区策略，常见的分区策略就是范围分区，也就是北京地区的分表单独拎出来，这样查询北京地区的数据会很快，不用全表扫描再用where语句筛选。需要注意分区策略不涉及用户权限，北京地区的人还是可以查询所有地区数据。 3）将不经常使用的数据复制到单独的数据库。 4）创建磁带或磁盘备份。 5）创建数据库任务，定期清理不再使用的数据。

 有归档就有**恢复归档**：

方法一：直接从辅助数据库恢复

如果归档数据保存在一个辅助数据库中：

查询需要恢复的数据：例如通过 SQL 查询找到需要恢复的部分数据。
导入到主数据库：可以通过以下方式完成：
- SQL语句：使用 INSERT INTO 或 SELECT INTO 将辅助数据库的数据插入主数据库。
- ETL工具：使用数据迁移工具（如 Talend、DataX 等）进行数据迁移。

方法二：从文件恢复

如果归档数据存储在文件（如 .csv、.json 或 .sql）中：

加载文件：使用数据库的工具加载文件，例如：
- MySQL：LOAD DATA INFILE 或 mysqlimport

2.检查并插入数据：加载后需要确认数据正确性，然后插入主数据库。

（2）容量和增长预测

    数据库的容量受到存储硬件的限制，数据库的数据最终存储在磁盘中，**磁盘的大小**是数据库容量的硬性限制。**普通硬盘（HDD）**：容量大但速度较慢，适合归档数据。**固态硬盘（SSD）**：容量相对较小，但速度快，适合高性能需求的主数据库。
    **案例**：一个网站需要存储所有订单信息，预计每天会有 10,000 个订单，每秒有 100 个用户请求查看自己的订单，订单数量持续增加，每年会新增 365 万条记录。如果数据库容量固定（盒子不能扩展），需要采取措施：
    定期**归档历史订单**，比如将一年前的订单移到另一个数据库。定期**清理无用数据**，比如删除 5 年前的已完成订单。如果数据库容量可以扩展（比如分布式数据库），则需要**规划增长速度**。

（3）变动数据捕获

   变动数据捕获（Change Data Capture，CDC）是指**检测**到数据的变动并确保与变动相关的信息被**适当记录**的过程。在一个简化的CDC语境中，一台计算机系统的数据可能在前一个时间点发生了改变，在第二台计算机系统里需要反映这一变化。与通过网络复制整个数据库的数据来反映一些微小的变化不同，CDC只发送变化的内容（增量信息），接收系统就可以进行恰当的更新。

    **CDC** 就像是一个监控工具，它在数据发生变化时能立刻察觉到，并把这个变化告诉其他系统。CDC 只关注数据的变化部分，节省了大量的时间和存储空间。

如何捕捉数据变化？

一种方法是通过版本控制：给数据加个标记（比如更新时间戳、版本号等），系统通过这些标记来判断数据是否发生了变化。
另一种方法是通过读取日志：数据库记录所有的操作（比如插入、更新、删除），CDC 就可以通过读取这些操作日志来识别和捕捉数据变化。

MySQL 是一个数据库管理系统，而 CDC 是一种通过数据库日志或其他方式捕获数据变化的技术，CDC并不是工具，MySQL 可以实现 CDC 功能：

外部工具实现 CDC：

虽然 MySQL 自带一些日志功能，但在实际的生产环境中，许多工具或服务会帮助实现更完善的 CDC。
- Debezium：一个开源工具，可以实时捕获 MySQL 的数据变动并通过 Kafka 等消息队列同步到其他系统。（待开发）
- Maxwell：一个 MySQL 数据变动捕获工具，通过读取 MySQL binlog 将数据变动发布到 Kafka 或其他目标系统。（待开发）

（4）数据清除

   数据长期存储会占用空间并影响性能，因此需要定期存档或清除。清除（Purging）指永久删除不再有价值的数据。这样可以降低存储成本和数据被滥用的风险。过期数据从监管角度也被视为不必要的负担。

（5）数据复制

数据复制（Replication）指在多个存储设备上保存相同数据，用于提高系统可用性和负载均衡。主要分为两种模式：

1）主动复制：所有副本都可以创建和存储数据，无主副本之分。 2）被动复制：先在主副本创建数据，再同步到其他副本。

复制可以通过两种方式扩展： 1）水平扩展：增加副本数量 2）垂直扩展：将副本分布在不同地理位置

复制对用户是透明的，他们无法知道正在使用哪个副本。复制主要通过两种方式实现：

1）镜像：主库更新立即同步到辅助库 2）日志传送：辅助库定期接收并应用主库的事务日志

特性	数据复制（Replication）	数据归档（Archiving）
目的	保证数据一致性、提高系统可用性、负载均衡	保留历史数据，减轻活跃数据库的负担，降低成本
数据访问	数据副本是实时可用的，通常是在线的，支持高频次访问	归档的数据不常访问，通常是离线存储的，不频繁使用
数据更新	多个副本之间的数据保持同步，支持更新操作	一旦数据归档，通常不再更新
性能影响	复制增加网络带宽、存储需求和管理复杂度	归档减少主数据库存储和操作负担，提升性能

（6）韧性与恢复

  数据库韧性（Resiliency）是衡量系统对错误条件容忍度的指标。如果一个系统能够容忍高级别的处理错误，并且仍能像预期的那样工作，那么它就具有很强的韧性。如果应用程序一碰到意外条件就崩溃，那么系统就没有韧性。如果数据库可以检测异常，并提前终止或从通用的错误处理办法（如失控查询）中自动恢复，则认为它具有韧性。

3种恢复类型，如何快速恢复：

1）立即恢复（Immediate Recovery）。有些问题有时需要通过设计来解决的。例如，可以通过预判并自动解决问题，切换到备用系统

实现方式：

故障转移（Failover）：
- 配置主-从架构或多副本架构（如 MySQL 主从复制或 MongoDB 的 Replica Set）。
- 使用负载均衡器和自动故障检测工具（如 Keepalived、HAProxy），当主节点宕机时自动切换到备用节点。
自动化恢复机制：
- 部署监控系统（如 Prometheus、Zabbix）实时检测数据库健康状态。
- 检测到数据库异常后，触发脚本或预定义规则自动重启服务或清理失控任务。
冗余架构（Redundant Architecture）：
- 利用分布式数据库架构（如 Apache Cassandra、CockroachDB），确保数据多副本存储，即使一个节点发生故障，其他节点可以立即接管。
预判并自动解决：
- 查询优化：对可能导致失控的查询设置时间限制（如 MySQL 的 max_execution_time）。
- 连接池管理：配置连接池上限，防止数据库超载。

2）关键恢复（Critical Recovery）。它是指尽快恢复以尽量减少业务延迟或业务中断的恢复计划。尽快恢复核心业务，最小化业务中断时间。

实现方式：

备份与恢复策略：
- 定期备份：启用增量备份和全量备份（如 MySQL 的 mysqldump 或 Percona XtraBackup）。
- 使用工具如 AWS RDS 快速恢复到最近的备份点。
事务日志恢复：
- 启用事务日志（如 MySQL 的 binlog、PostgreSQL 的 WAL），在发生崩溃后通过重放日志恢复数据库到最近状态。
灾难恢复计划（DRP）：
- 设置异地容灾中心（如异地多活架构）。
- 利用云服务（如 AWS Aurora 或 Azure SQL Database）进行快速恢复，保证业务快速切换到云端。
缩短恢复时间目标（RTO）：
- 使用工具（如 Percona Cluster、Vitess）以秒级恢复数据库服务。
- 缩短备份文件的读取和恢复时间，如将备份存储在 SSD 上。

3）非关键恢复（Non-critical Recovery）。它是指该类业务可以延迟恢复，直到更关键的系统恢复完毕。在优先恢复核心系统后，逐步恢复非关键业务，减少恢复过程中资源的竞争。

实现方式：

分级恢复：
- 使用应用优先级分类系统（如核心交易系统为高优先级，统计报表系统为低优先级）。
- 利用分级计划，先恢复高优先级系统，延迟低优先级系统恢复。
冷备和归档恢复：
- 对非关键数据采用冷备方式存储在更经济的介质（如云归档服务、磁带存储）。
- 利用分阶段恢复策略，逐步加载数据回主系统。
弹性计算：
- 在非关键业务中使用容器化技术（如 Docker 和 Kubernetes）部署服务，按需扩展资源，减少业务恢复对关键资源的依赖。
监控和通知：
- 配置监控系统对非关键业务进行监控，一旦核心业务恢复完成，可以自动调度恢复非关键业务。

1.5 数据库存储的度量指标

1）数据库类型的数量。关系型数据库、非关系型数据库、时序数据库，类型的数量可以帮助理解系统的复杂性和多样性。 2）汇总交易统计。指事务的数量、成功率、失败率等。此指标有助于了解数据库系统的整体负载和活动水平。 3）容量指标。数据库总容量、表、索引和数据文件的大小。 4）已使用存储的数量。衡量当前数据库中已使用的存储空间的数量，与总存储容量进行对比，可以了解剩余的可用存储空间。 5）存储容器的数量。 6）数据对象中已提交和未提交块或页的数量。未提交的块通常属于事务的一部分，只有在事务提交后才会变成已提交的块。 7）数据队列。衡量数据库中排队的操作或任务数量。数据库系统在进行大量并发操作时，可能会有数据操作被排队等待处理。此指标反映了系统的并发处理能力。 8）存储服务使用情况。衡量数据库系统对存储服务的使用情况，可能包括磁盘、云存储等。此指标帮助了解数据库如何使用存储资源，以及是否达到了存储资源的瓶颈。 9）对存储服务提出的请求数量。例如，数据读写操作或对存储设备进行请求的次数。这个指标有助于了解存储服务的使用负载。 10）对使用服务的应用程序性能的改进。

性能度量评估指标，包括： 1）事务频率和数量。衡量单位时间内数据库系统处理的事务数量。事务频率高通常意味着数据库系统的负载较大，系统的并发处理能力较强。 2）查询性能。衡量数据库查询的执行效率，通常通过查询响应时间或查询执行的吞吐量来衡量。优化查询性能是提升数据库效率的重要方式。 3）API服务性能。衡量数据库提供的API服务的响应时间、吞吐量、可用性等指标。数据库系统通常通过API向应用程序提供数据访问，API性能直接影响应用程序的响应速度。

操作度量指标，包括： 1）有关数据检索时间的汇总统计。 2）备份的大小。 3）数据质量评估。 4）可用性。

服务度量指标，包括： 1）按类型的问题提交、解决和升级数量。 2）问题解决时间。

Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
windows安装pnpm后报错：pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 Ithao2 Vue npm 前端 node.js
使用npm方式安装pnpm,命令如下：npminstall-gpnpm安装完以后，执行pnpm-v查看版本号：pnpm-v执行完发现报错：pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。尝试配置环境变量，重启后均不生效。解决方案：使用PowerShell进行安装1.以管理员用户打开PowerShell，执行如下命令：iwrhttps://get.pnpm.io/
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
400多个免费在线编程与计算机科学课程 zhufafa 基础理论课程理论计算机基础免费
来源：medium作者：DhawalShah五年前，麻省理工学院和斯坦福大学等学校首先向公众开放免费的在线课程。如今，全球有700多所学校创造了数以千计的免费在线课程。从入门到精通系列，是作者通过ClassCentral的课程数据库整理的400多个免费在线课程的简介和链接（来源于ClassCentral，一个在线课程搜索引擎），根据课程难度分为入门、进阶和高阶三大类，每门课程还有星级评分（统计自C
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL 知识大胖 NVIDIA GPU和大语言模型开发教程 mysql postgresql 数据库 anythingllm ollama
简介一款全栈应用程序，可让您将任何文档、资源或内容转换为上下文，任何LLM都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库，并支持多用户管理和权限。本文将介绍如何在AnythingLLM上将Ollama与MySQL+PostgreSQL连接起来。系列文章如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI应用程序，可以执行RAG、A
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 anythingllm llm
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志，以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型（教程含安装步骤）知识大胖 NVIDIA GPU和大语言模型开发教程 llama3 ai anythinllm llama
什么是AnythingLLM?AnythingLLM是最易于使用的一体化AI应用程序，可以执行RAG、AI代理等操作，且无需任何代码或基础设施难题。您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序，该应用程序基本上是一个具有许可的完整ChatGPT，但具有任何LLM、嵌入模型或矢量数据库。如何安装《无需任何代码构建自己的大模型知识库：AnythingLLM最易于使用的一体化AI
Java实习模拟面试之安徽九德 —— 面向对象编程、Spring框架与数据库技术详解培风图南以星河揽胜 java面试 java 面试 spring
关键词：Java实习生、模拟面试、安徽九德、SpringBoot、MySQL、Redis、面向对象编程、团队协作一、前言作为一名计算机相关专业的学生，想要顺利进入一家互联网公司或软件开发企业实习，技术面试是必须面对的一道门槛。本文将带你走进一场真实的Java实习生模拟面试场景，以“安徽九德”公司为背景，围绕其发布的招聘岗位要求，进行一次全方位的技术面试演练。本次模拟面试涵盖以下核心知识点：Java
如何查看自己本地的公网IP地址？内网环境网络如何开通服务器公网ip提供互联网访问？搬码临时工网络 tcp/ip 服务器
查看公网IP和开启公网地址提供互联网服务是作为网络管理员的必修课。代替路由映射的端口映射应用使用最广泛的就是nat123。内网发布网站或其他应用到外网访问,且本地无公网IP，或80和443端口被屏蔽，对于这些环境，就需要利用端口映射应用网络辅助来实现。一、如何查看自己本地的公网IP?登录你的路由器，看拨号状态那的WAN口的IP地址；如果你是光纤猫拨号，就需要登录光纤猫，看拨号状态那WAN口的IP地
Spring Boot基础小李是个程序 spring boot 后端 java
5.SpringBoot配置解析5.1.基础服务端口：server.port=8080（应用启动后监听8080端口）应用名称：spring.application.name=Chat64（注册到服务发现等场景时的标识）5.2.数据库连接（MySQL）URL：jdbc:mysql://localhost:3306/ai-chat（连接本地3306端口的ai-chat数据库，含时区、编码等参数）驱动：
Docker初识：mysql8主从复制（单向）- 主从搭建扩展知识滴水可藏海 #mysql 数据库
主从服务（master-slave）新学习到的知识。1、全库同步与部分同步上回书说到Docker初识：mysql8主从复制（单向）的配置都是针对全库配置的。但是实际上并不需要针对全库做备份，只需要对一些特别重要的库或者表来进行同步。例如information_schema等。可以通过配置文件中的一些属性指定需要针对哪些库或者哪些表记录binlog。Master配置：#需要同步的二进制数据库名bin
Mysql字段没有索引，通过where x = 3 for update是使用什么级别的锁
没有索引时，FORUPDATE会锁住整个表现在，你正在一本一本地翻看所有书，寻找“维修中”的书，并且你对管理员说：“在我清点和修改完之前，别人不能动这些书，也不能往这个范围里加新书！”问题1：如何锁住你找到的“维修中”的书？你每找到一本“维修中”的书，就给它贴上一个“正在处理，请勿触碰”的标签（行级排他锁）。问题2：如何防止别人“往这个范围里加新书”？这是最关键的。因为你没有“状态”的目录卡片（没
在拉卡拉分账功能中实现实时更新，需结合异步回调通知和数据库事务来确保数据一致性。以下是具体实现方案肥仔全栈开发拉卡拉支付 php 拉卡拉支付三方支付
一、实时更新的核心逻辑依赖拉卡拉分账回调拉卡拉分账完成后会主动推送回调通知（类似支付回调），需监听该回调并更新订单分账状态。数据库事务保障分账金额更新、状态变更等操作需放在事务中，避免部分失败导致数据不一致。二、代码实现1.分账回调处理接口（监听拉卡拉分账结果推送，实时更新数据库）//文件：application/api/controller/Notify.phppublicfunctionlak
GPT实操——利用GPT创建一个应用狗木马深度学习 gpt-3 gpt
功能描述信息查询：用户可以询问各种问题，如天气、新闻、股票等，机器人会返回相关信息。任务执行：用户可以要求机器人执行一些简单的任务，如设置提醒、发送邮件等。情感支持：机器人可以与用户进行情感交流，提供安慰和支持。个性化设置：用户可以自定义机器人的回复风格和偏好。技术栈前端：React.js后端：Node.js+Express数据库：MongoDB自然语言处理：OpenAIGPT-3API其他工具：
Android开发中RxJava的使用与原理你过来啊你 android rxjava
RxJava是ReactiveExtensions在JVM上的实现，专为处理异步事件流和基于观察者模式的编程而设计。在Android开发中，它极大地简化了异步操作（如网络请求、数据库访问、UI事件处理）的管理、组合和线程调度，有效解决了回调地狱问题。一、RxJava核心概念Observable(可观察者)：数据源或事件源。它负责发出数据项(onNext)或事件（成功完成onComplete/发生错
MySQL数据库访问（C/C++）敲上瘾 MySQL数据库 mysql 数据库 c++c语言数据库开发数据库架构
访问数据库的方式：命令行：使用命令行输入SQL指令直接访问。需记忆命令和SQL语法，对新手不友好。正因如此推荐新手使用该方式访问，能倒逼学习者对SQL语法的记忆，并对MySQL更深入理解。图形化界面访问：使用图形化界面工具，如：DBeaver、DataGrip、Navicat、HeidiSQL（MySQL）、MySQLWorkbench。特点：有语法提示，可以直接对数据手动增删改。编程接口：在编写
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st

数据管理之数据存储

一、数据存储如何操作

1.3 分布式系统两个定理

1.4 数据库管理过程

（1）数据归档

（2）容量和增长预测

（3）变动数据捕获

（4）数据清除

（5）数据复制

（6）韧性与恢复

3种恢复类型，如何快速恢复：

2）关键恢复（Critical Recovery）。它是指尽快恢复以尽量减少业务延迟或业务中断的恢复计划。尽快恢复核心业务，最小化业务中断时间。

3）非关键恢复（Non-critical Recovery）。它是指该类业务可以延迟恢复，直到更关键的系统恢复完毕。在优先恢复核心系统后，逐步恢复非关键业务，减少恢复过程中资源的竞争。

1.5 数据库存储的度量指标

你可能感兴趣的:(数据库管理员,数据库,数据挖掘)