架构师小秘圈

彻底取代Redis+数据库架构，京东618稳了！

作者介绍

京东零售在线存储部，致力于分布式系统、开源数据库技术的研究，主要负责数据库性能调优、监控和架构设计。

过去十年，随着移动互联网指数级的增长，企业和用户对应用程序的响应性能要求越来越高，如何在完美应对海量用户规模和海量数据的同时保证优秀的产品体验，是数据库面临的挑战。无论是机械硬盘还是SSD存储介质，企业都需要缓存技术加速数据的访问、支撑高并发和大吞吐，通过引入分布式缓存方案，提升应用程序性能，消除数据库热点。

但是，缓存技术的引入增加了业务架构的复杂度，降低了开发效率，同时还面临着缓存一致性、击穿、雪崩等挑战。因此，我们基于线上运营多年的KV存储引擎JIMDB，重新打造了JIMKV分布式数据库，融合缓存与存储的统一架构，解决了缓存难题，帮助研发人员聚焦业务逻辑，降低硬件成本，提升生产效率。

一、早期架构及功能实现

早期，我们主要使用基于Redis客户端集群方案自研的JIMDB来加速业务的访问，主要解决了自动故障检测恢复、自动弹性调度等问题。架构图如下：

1、自动故障检测恢复

在故障检测和故障切换的方案中，比较容易想到的就是引入Zookeeper。通过Zookeeper的临时节点探测不存活的服务，但是由于服务端代码需要修改、跨机房部署不方便、watch数目和连接数过多存在性能问题等原因，这个方案最终没有被采用。

于是我们决定自己写探测程序，这个探测程序主要是检测JIMDB实例的存活状态，但是它需要尽可能地解决由于部分网络不通时导致的误判问题。采用的方案是，对探测程序部署多个，每个部署在机房的不同机架下。多个探测实例同时对同一个JIMDB实例进行探测，只要有一个探测实例检测到服务端实例是存活的，那么该实例就被认为是存活状态；当没有人反馈其为存活状态，且超过半数的探测实例认为该实例死亡时，则通知故障恢复程序进行主从切换，变更集群拓扑结构，并把新的拓扑结构通知给所有的客户端。由此，故障检测和恢复的问题基本算是解决了。

2、自动弹性调度

业务流量突然飙升，容量不足等问题都需要运维通过管理工具进行扩容增加实例数，另外也有一部分业务申请了集群空间。由于业务调整等原因，访问量变小了或者停用了，平台管理人员比较难发现。为了提高平台自动化的能力，减少运维人员的工作量，需要让平台动起来，所以弹性伸缩的需求摆在了开发人员的面前。

为了让平台弹性伸缩起来，需要对集群的各项指标进行监控，比如对OPS、内存使用率、网络流量等进行监控，统计这些指标一段时间内是否达到了设置的阈值，当超过扩容的阈值时自动触发扩容，当低于缩容的阈值时自动进行缩容释放资源。

缩容的过程和扩容的过程基本一致，扩容是把一个实例上的部分slot迁移到新的实例上，缩容是把一个shard实例上的所有slot迁移到另一个实例上进行合并。

扩容时由于需要增加实例，增加的实例应该部署在哪台机器上才合适呢？为了选择出最优的机器，有一个采集程序会定期进行信息收集，然后根据CPU繁忙情况、网络流量、OPS、内存剩余空间、机器上的实例数等进行综合打分，各项指标都比较空闲的得高分，如果有一项指标不符合部署要求则直接淘汰，然后再从得分高的机器中选择一台机器进行部署。

由于扩容在集群中是并发进行的，因此有可能多个处理线程会同时把实例部署到同一台物理机上，当大家部署完成后可能实例数等指标就不符合要求了。因此需要有一个预分配资源的计算，对未使用的资源进行预占并被计算在内，如果部署失败就需要把这些资源值做相应的扣除，避免并发部署出现使用资源超限的情况。对同一个集群还需要控制每台物理机上最大可部署的实例数，避免同一个物理机部署实例数过多，导致机器故障时对同一个集群影响过大。为了防止同一个机房路由器故障或者断电等情况的出现，同一个shard的主从实例应该跨机架，对有跨机房需求的应用，同一个shard的主从实例还应该部署在不同的机房。

二、大促挑战及行业发展趋势

随着近些年京东618、双11大促的火热，业务增长远超预期，资源紧缺成为一种常态。虽然JIMDB在性能方案满足了当前的业务需求，但是服务器内存成本压力与日俱增，所有业务数据全放内存太浪费，某些业务对数据持久化、一致性也提出了要求。

JIMDB在某些极端情况下容易引发全量复制进而影响请求，宕机风险越来越高，由于JIMDB架构上采用了单线程多进程架构，导致CPU成为瓶颈。同时服务器不断扩容带来运维的难度，数据量不断增加导致纯内存存储的成本加大，服务器投入边际效应显现。

另一面随着Google发布Spanner论文后，国内外像TiDB、CRDB相继推出相关数据库产品或服务来解决数据库的可扩展问题。2017年Google将Spanner商业化，也进一步验证了NewSQL作为未来数据库发展方向的正确性。

2014年，Gartner的一份报告中使用“混合事务分析处理（HTAP）”一词描述新型的应用程序架构，以打破OLTP和OLAP之间的隔阂，实现实时业务决策。这种架构具备显而易见的优势——不但避免了繁琐且昂贵的ETL操作，而且可以更快地对最新数据进行分析。这种快速分析数据的能力将成为未来企业的核心竞争力之一。

就当前的用户需求和软硬件技术发展状况来看，集成数据平台将能满足绝大数用户的场景，古人说“天下大势，分久必合、合久必分”，这句话用在数据处理领域也不为过。需求和技术是一对矛盾，当这对矛盾缓和时，数据处理领域将更趋向于整合；而当这对矛盾尖锐时，数据处理领域将趋于分散。

一方面是传统的OLTP数据库慢慢向NoSQL靠拢，一方面是像TiDB由KV向SQL靠拢，未来整合的趋势更为明显。我们详细调研了开源的TiDB与CRDB，发现并不适合我们的业务，TiDB用rust开发底层采用RocksDB磁盘存储，满足不了我们的高性能读写要求，电商大促的场景对性能延时有极致的要求；而CRDB上层SQL协议是采用PG，也不符合我们的业务，我们业务大量还是MySQL生态。所以我们决定自研，彻底取代Redis+数据库架构，解决数据强一致的问题，当然我们也不是从0开始，而是参考借鉴了Spanner的论文、TiDB、RocksDB、Redis、Raft论文等。

三、架构设计及应用场景

1、整体架构

Master：

集群部署，一般线上推荐至少部署3个节点，是整个集群的管理模块，其主要工作有三个：

存储集群的元信息（某个Key存储在哪个DS节点）；
对DS集群进行调度和负载均衡（如数据的迁移、Raft group leader的迁移等）；
分配全局唯一且递增的事务ID。

DS cluster：

存储层DS负责存储数据，从外部看DS是一个分布式的提供事务的Key-Value存储引擎。存储数据的基本单位是Range，每个Region负责存储一个Key Range （从StartKey到EndKey的左闭右开区间）的数据，每个DS节点会负责多个。DS使用Raft协议做复制，保持数据的一致性和容灾。副本以Range为单位进行管理，不同节点上的多个Range构成一个Raft Group，互为副本。数据在多个DS之间的负载均衡由Master调度，这里也是以Range为单位进行调度。

Proxy：

属于计算层，可以水平扩展，兼容标准的SQL与Redis协议，负责接收SQL请求，处理SQL相关的逻辑，并通过Master找到存储计算所需数据的DS地址，与DS交互获取数据，最终返回结果。Proxy是无状态的，其本身并不存储数据，只负责计算，可以无限水平扩展，可以通过负载均衡组件（如LVS、HAProxy或F5）对外提供统一的接入地址。

2、应用场景

JIMKV具备高吞吐、低延迟、高可用、强一致、可扩展、高可靠、多协议支持、可插拔存储引擎设计、智能分层存储、分布式事务等关键特性，因此适用于我们以下这些应用场景：

数据仓库：可以存储和处理海量数据，支持高并发的实时读写，比如订单数据库、交易数据库、存储数据库、信息采集数据库等等；
替换MySQL数据仓库：大数据量下，数据增长很快，接近单机处理大极限，不想分库分表或者使用数据库中间件等对业务侵入性较大、对业务有约束的Sharding方案，而JIMKV新一代业务层则支持MySQL协议，并提供迁移工具；
缓存加速数据仓库：JIMKV的多线程架构使得低延迟、点读性能媲美Redis，单实例支持更大的吞吐、在需要提供缓存进行系统加速的场景；
金融级OLTP业务：JIMKV具备金融级安全保证，支持金融级OLTP业务（交易、支付、账单、结算、金融等等）。

四、京东商品详情业务库应用实践

目前JIMKV作为京东下一代分布式数据库，内部许多原JIMDB客户开始陆续迁移业务到JIMKV上，在成本与性能方面取得了很好的效果。下面我们以商品详情业务库为例，介绍我们内部JIMKV实践的收益。

商品详情页在缓存数据中属于实时性要求不高的数据，但是流量特别大，单个KV比较大，促销某些爆款商品容易形成热点数据。冷热分层存储在保证性能的同时最大节省用户成本。所谓冷热数据分层存储，就是根据数据的使用频率、value大小、最后访问时间等特征将数据进行冷热分层后，再采用相应适配的物理存储介质进行存储，并通过不同存储介质之间优势互补，达到延长保存期限、降低存储成本、提高存储效率、增进安全可靠性的海量数据存储要求。

简单来说，经常被访问的数据称为热数据，而较少被访问的数据称为冷数据。其中热数据适合内存存储，实现高性能访问；而冷数据，则适合使用安全可靠性高、存储寿命长、单位存储成本低的磁盘存储介质。冷热数据之间随着访问是可以进行动态平衡的。JIMKV采用灵活的可插拔多存储引擎支持，比如磁盘我们支持RocksDB、LevelDB、WiscKeyDB等，而内存我们支持Bw-tree、masstree等，用户可根据自己的业务场景灵活配置。

1、解决读写放大

众所周知，传统的KV持久化存储一般都采用基于LSM-Tree的LevelDB或RocksDB，能将离散的随机写请求都转换成批量的顺序写请求，以此提高写性能。但是传统在的LSM-Tree很难避免读写放大的问题。

读放大（Read Amplification）。LSM-Tree的读操作需要从新到旧（从上到下）一层一层查找，直到找到想要的数据。这个过程可能需要不止一次I/O。特别是range query的情况，影响很明显；

空间放大（Space Amplification）。因为所有的写入都是顺序写（append-only）的，不是in-place update，所以过期数据不会马上被清理掉。RocksDB和LevelDB通过后台的compaction来减少读放大（减少SST文件数量）和空间放大（清理过期数据），但也因此带来了写放大（Write Amplification）的问题；

写放大。实际写入磁盘的数据大小和程序要求写入数据大小之比。正常情况下，HDD/SSD观察到的写入数据多于上层程序写入的数据。原因是在compact的过程中，我需要额外的进行写操作以便能够将数据从一个level写入到另一个level，所以这个过程就增加了写入量。

现在SSD逐渐成为主流存储，但compacion带来的写放大问题显得越来越严重：

SSD顺序读写性能比随机读写性能好一些，但是差距并没有HDD那么大。所以，顺序写相比随机写带来的好处，能不能抵消写放大带来的开销，这是个问题；
SSD的使用寿命和其写入量有关，写放大太严重会大大缩短SSD的使用寿命。因为SSD不支持覆盖写，必须先擦除（erase）再写入。而每个SSD block（block是SSD擦除操作的基本单位）的平均擦除次数是有限的。

写放大在两个level之间能够达到10以上。又因为这里有7个level，所以从level 1~level 6，可能会使写放大达到50。

WiscKeyDB通过以下四点解决读写放大的问题：

键值分开存储，Key仍然存在LSM-tree中，Value存在额外的日志文件（vLog）中；
对于无序的值数据，利用SSD并行随机读以加速读取速度；
使用独特的崩溃一致性和垃圾回收策略以高效的管理Value日志文件；
去除WAL并且不影响一致性，提升小数据流量的写入性能。

2、冷热调度

配置参数maxmemory，maxdisksize

Maxmemory > 0默认开启masstree引擎（内存数据库）。

maxmemory = 0默认开启RocksDB引擎（磁盘数据库）。

1）热→冷：使用内存>maxmemory

根据客户端命令（比如set sk svalue），来计算是否需要增加字节，判断内存使用量如果>maxmemory，就启动RocksDB引擎，按照配置的策略进行尾淘汰，淘汰任务加入异步IO任务队列，不影响主线程其他命令的执行，IO线程取出异步任务，将key value存储到RocksDB，通知主线程。主线程收到完成的通知后释放masstree中value的内存，在元数据中标记此value在冷存储中。

2）冷→热：使用内存

用户访问的key如果在RocksDB，且当前value大小+使用内存

3、总结

我们根据详情页的数据特点磁盘采用WiscKeyDB存储引擎，内存采用masstree存储引擎，masstree结合了trie与b+tree的特点，节省内存性能上由于RCU细粒度的锁机制比b+tree性能好很多，而WiscKeyDB是在RocksDB基础上大大减少了读写放大。针对热点数据我们sdk也是支持客户端缓存进行优化，采用新的混合存储以后我们在满足客户性能要求的同时，降低了75%左右的存储成本。

五、后续规划

1、智能运维

目前我们通过高可用架构的master来调度、balance、迁移、故障恢复等，能否结合机器学习让数据库能否拥有真正的智能，能够自我维护、自我修复以及自我性能调优等在未来是一个好的思路。

2、OLAP场景支持

目前我们针对MySQL兼容程度还不是很够，只能满足普通的增删改查以及ddl操作，针对聚合、join等分析功能还未完全实现，这是我们下一步的工作重点。

3、新硬件的支持

随着硬件性能的提升，内核中的网络栈和存储栈带来的性能瓶颈越来越明显，为缩短IO路径、解决NVMe SSD在传统IO栈上的性能问题，Linux内核从4.x开始引入了新的NVMe IO栈，新的IO子系统完全摈弃了传统的通用块层和SCSI子系统，而kernel bypass（绕过内核）是解决系统网络栈和存储栈性能瓶颈的另外一种方式，并辅以各种性能调优手段（CPU pin、无锁队列），从而达到更高的性能。

目前市场上也有多种类似的技术，如DPDK、NETMAP、SPDK、PF_RING、RDMA等，如何利用新的硬件（Nvme SSD、Persistent Memory、Kernel bypass GPU、FPGA）结合JIMKV来提高稳定性与性能也是我们未来的规划。

特别推荐一个分享架构+算法的优质内容，还没关注的小伙伴，可以长按关注一下：

长按订阅更多精彩▼

如有收获，点个在看，诚挚感谢

阿里云RDS到亚马逊云RDS的实时数据同步方案详解 ivwdcwso 运维阿里云云计算 aws kda 数据同步
1.需求背景在当今的多云环境中,企业经常需要在不同云平台之间同步数据。本文将详细介绍如何实现从阿里云RDSMySQL数据库到亚马逊云RDSMySQL数据库的实时数据同步。这种同步对于数据备份、跨区域数据访问、数据分析等场景都非常有用。2.方案概述我们将使用AWSKinesisDataAnalytics(KDA)作为核心组件来实现这个实时同步方案。KDA基于ApacheFlink,支持使用SQL或J
实战探析：云数据库 RDS SQL Server 版的优点与应用案例步入烟尘 python 数据库 oracle 性能优化
实战探析：云数据库RDSSQLServer版的优点与应用案例背景：随着云计算技术的不断发展，越来越多的企业开始将数据库迁移到云端，以降低成本、提高可用性和灵活性。而在云数据库的选择上，AmazonRDS（RelationalDatabaseService）SQLServer版本成为了众多企业的首选之一。本文将深入探讨在实际应用中，利用云数据库RDSSQLServer版所带来的优点及其实战应用。云数
MongoDB入门与实践风中凌乱的猿笔记 mongodb 数据库
MongoDB是一个NoSQL数据库，它采用文档模型来存储数据，具有高性能、易扩展、灵活的特点。以下是MongoDB的入门指南和一些基本的实践示例，帮助你开始使用MongoDB。1.安装和基本配置安装MongoDB具体安装方法取决于你的操作系统。以Ubuntu为例，可以通过以下命令安装MongoDB：sudoaptupdatesudoaptinstall-ymongodb启动MongoDB安装完成
基于 LLM 的智能运维 Agent 系统设计与实现 LLM教程人工智能 embedding LLM python 大模型 Agent 智能体
摘要本文详细介绍了一个基于大语言模型(LLM)的智能运维Agent系统的设计与实现。该系统采用多Agent协同的架构，通过事件驱动的方式实现了自动化运维流程。系统集成了先进的AI能力，能够实现故障自动诊断、预测性维护、知识沉淀等核心功能。一、运维Agent架构设计在设计智能运维Agent系统时，我们采用了模块化和事件驱动的架构思想，将复杂的运维场景分解为多个独立的能力域，并通过消息总线实现各组件的
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点) 管哥的运维私房菜大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址：prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
【python学习】深度解析 Python 的 .env配置与最佳实践：温格高的环境变量配置之道 NLP仙人 python python 学习开发语言人工智能
1.文章简介在开发和部署Python项目时，环境变量配置对于管理敏感信息如数据库连接字符串、API密钥至关重要。本文将以温格高（2023年环法冠军）的项目为例，详细介绍如何通过.env文件简化环境配置，并分享多环境管理、Docker集成等热门功能。我们还将覆盖一些小技巧和常见错误，帮助你避免开发中的踩坑。2.使用.env文件的好处温格高团队正在开发一个记录自行车赛事的应用，涉及多个开发环境和敏感信
网络安全入门信息收集与漏洞扫描（二）挣扎与觉醒中的技术人网络安全入门及实战 web安全网络安全 c++程序人生
主动信息收集1Nmap扫描端口与服务（1）Nmap是什么？定义：网络探测工具，用于扫描开放端口、识别服务及操作系统。典型用途：发现目标存活主机（ping扫描）。识别开放端口和运行的服务（如SSH、HTTP、数据库）。探测操作系统类型（Windows/Linux）。（2）基础扫描命令快速扫描常用端口：nmap-sV-T4192.168.1.100#-sV探测服务版本，-T4加速扫描示例输出：PORT
DeepSeek 如何获取数据库中的表信息（表名和字段名称） Python测试之道数据库 python
问题背景在测试或开发过程中，了解数据库的表结构（包括表名和字段名称）是非常重要的一环，尤其是当我们需要测试数据库相关的功能或验证数据时。然而，手动查看数据库结构可能耗时且容易出错。如果能够通过DeepSeek与数据库直接交互，自动获取表名和字段信息，将大大提升测试效率。本文将介绍如何利用DeepSeek模型结合数据库查询，自动生成表结构信息（包括表名和字段名称）。此外，还会展示如何通过自然语言描述
spring boot整合kettle调用数据库资源库中的job 机智的小小岳 kettle
前言上篇文章记录了springboot如何调用文件资源库下的job，这篇文章会记录如何调用数据库资源库的job1.导入jar包在调用文件路径下的job需要导入如下jar包而调用数据库资源库的job需要多导入2个jar包否则会报http错误，jar包如下2.运行代码代码如下：@TestpublicvoidexcuteDBTrans()throwsKettleException{//初始环境EnvUt
python创建sqlite3数据库_SQLite – Python | 菜鸟教程 weixin_39683144
SQLite-Python安装SQLite3可使用sqlite3模块与Python进行集成。sqlite3模块是由GerhardHaring编写的。它提供了一个与PEP249描述的DB-API2.0规范兼容的SQL接口。您不需要单独安装该模块，因为Python2.5.x以上版本默认自带了该模块。为了使用sqlite3模块，您首先必须创建一个表示数据库的连接对象，然后您可以有选择地创建光标对象，这将
linux下使用mysql(上) It塔塔开 linux mysql 运维
1、安装mysqlaptsearchmysql-server...#查询结果mysql-server-8.0/focal-security,focal-updates8.0.41-0ubuntu0.20.04.1amd64MySQLdatabaseserverbinariesandsystemdatabasesetup...aptinstallmysql-server-8.0...2、连接数据库m
使用Docker搭建Flink集群 O_1CxH Flink大数据 Kafka大数据 docker flink 容器
目录使用Docker搭建Flink集群docker-compose一键搭建步骤附录参考资料使用Docker搭建Flink集群在学习大数据框架的时候，需要一个真实的环境。我们知道，像spark、flink这些计算框架都有多种运行模式：在本地使用多线程模拟集群真正的分布式集群如果直接在IDE（Intellj）里面编译和运行写好的程序，实际上是用的前一种运行模式；如果想尝试真正的生产环境中任务的提交和管
python如何将数据生成excel_Python如何将数据导出excel的技巧分享 weixin_39528697
本篇文章主要介绍了python技能之导出excel的实例代码，小编觉得挺不错的，现在分享给大家，也给大家做个参考。一起跟随小编过来看看吧本文介绍了python技能之导出excel的实例代码，正好能用到，写出来分享给大家作为一个数据分析师，下面的需求是经常会遇到的。从数据库或者现有的文本文件中提取符合要求的数据，做一个二次处理，处理完成后的数据最终存储到excel表格中供其他部门的人继续二次分析。在
使用 MySQL 从 JSON 字符串提取数据 m0_66323401 面试学习路线阿里巴巴 mysql json oracle
使用MySQL从JSON字符串提取数据在现代数据库管理中，JSON格式因其灵活性而广泛使用。然而，当数据存储在JSON中时，我们经常需要将其转换为更易于处理的格式。本篇文章将通过一个具体的SQL查询示例，展示如何从存储在MySQL中的JSON字符串提取数据并重新格式化。1.背景知识JSON（JavaScriptObjectNotation）是一种轻量级的数据交换格式，易于阅读和编写，同时也易于机器
仿生机器人核心技术与大小脑天机️灵韵人工智能具身智能硬件设备机器人人工智能具身智能
以下是针对仿生机器人核心技术的结构化总结，涵盖通用核心技术与**“大脑-小脑”专用架构**两大方向：一、机器人通用核心技术这些技术是仿生机器人实现功能的基础，与生物体的“身体能力”对应：1.感知与交互技术多模态传感器融合视觉：3D视觉（如RGB-D相机）、动态目标跟踪（如光流算法）。触觉：柔性电子皮肤、分布式压力传感器（模仿人类皮肤）。听觉：声源定位、噪声抑制（如麦克风阵列）。环境感知：激光雷达（
Java中的并发状态共享实现兔子先生° java
文章目录前言一、代码解析二、关键点解释二、使用方式总结前言在多线程和分布式系统中，数据的一致性和同步性是至关重要的。为了处理这些需求，Java提供了多种工具和技术，其中之一就是CompletableFuture。本文将介绍一个使用CompletableFuture来实现简单状态共享机制的示例代码。一、代码解析下面是一个名为StateShare的类，它利用了ConcurrentHashMap与Com
Linux 磁盘扩容：常见问题及解决方案详解（附操作步骤与代码）梦想编码家 linux 5G 运维
前言在Linux运维过程中，磁盘空间不足是常见的运维问题之一，特别是在服务器长时间运行后，磁盘的分区可能无法满足新的业务需求。因此，合理地扩容磁盘显得尤为重要。本文将针对Linux系统中的磁盘扩容问题，提供一套完整的、详细的操作步骤，并附带相关代码，帮助您轻松应对这一运维难题。常见问题描述1.磁盘空间不足导致服务中断系统运行一段时间后，磁盘空间被消耗殆尽，导致无法再写入数据，从而影响服务的正常运行
国家网络安全宣传周 | 2024年网络安全领域重大政策法规一览网安加社区安全网络安全政策法规
随着我国网络安全政策法规不断健全，网络安全工作机制也日渐成熟，各项工作已稳步步入法治化的轨道，与此同时，网络安全标准体系逐步清晰，安全防线日益坚固，为国家的网络安全建设提供了坚实的基础。网安加社区特为大家整理了2024年国内发布的网络安全领域相关政策法规，希望能为广大从业者与关注者提供相关参考，共同促进网络安全生态的健康发展。2024年网络安全重大政策法规一览◉1.《旅游大数据安全与隐私保护要求（
实验报告一：IT项目与技术实践朱佳顺
本文还有配套的精品资源，点击获取简介：实验报告是记录科学和技术实验过程、结果与分析的重要文件。本报告"01-实验报告一.zip"为系列报告中的第一份，包含实验目的、方法、数据、观察和结论。它可能涉及文件压缩、实验设计、数据处理和可视化、以及科学报告撰写等关键技能。实验内容可能包括编程、网络、数据库和软件开发等领域，要求学生了解实验流程，掌握数据分析方法，以及学术写作规范。1.文件压缩与ZIP格式使
Java面试八股文：Memcached面试题专场（持续更新中......） Java凤梨 Java金三银四面试题 memcached java 面试
全套Java金三银四面试题持续更新可文末自取，建议关注收藏不然下次找不到哟~目录1、Memcached是什么，有什么作用？memcached服务在企业集群架构中有哪些应用场景？一、作为数据库的前端缓存应用二、作业集群的session会话共享存储。2、Memcached服务分布式集群如何实现？3、Memcached服务特点及工作原理是什么？4、简述Memcached内存管理机制原理？SlabAllo
【计算机毕设选题】2025计算机毕业设计选题推荐-高通过率选题指南（二）计算机YiDian 计算机毕设实战案例毕业设计选题/开题源码计算机毕业设计选题毕业设计选题计算机毕设选题计算机毕业设计
计算机毕业设计作为大学生涯的收官之作，承载着对学生专业技能、创新思维及实践能力的全面考验。随着信息技术的飞速发展，计算机毕业设计的形式也日益多样化，从传统的网站（Web）开发到新兴的小程序、APP构建，再到大数据分析与处理，每一种形式都代表着不同的技术挑战与实现路径。本文旨在探讨这些多样化的毕业设计形式及其背后的技术支撑，为即将踏上毕业设计征程的学子们提供一份详实的参考指南，对毕设开发需要帮助，以
redis 使用 m0_74825634 面试学习路线阿里巴巴 redis 数据库缓存
文章目录补充说明语法选项参数实例连接服务端添加数据查询数据删除数据补充说明yum安装的redis.conf在/etc/redis/redis.conf语法redis-cli(选项)(参数)选项-a输入密码-n选择数据库若无此参数默认选中0数据库参数set添加数据keys用于查询此参数后可输入正则查询|keys"*"del删除数据实例连接服务端无密码链接:redis-cli有密码链接:redis-c
Deepseek详细的自我介绍 welcome_123_ 人工智能
###**DeepSeek：中国自研AGI大模型的深度解析**---####**1.技术背景与研发理念**DeepSeek由国内顶尖AI科学家团队领衔，核心技术成员来自清华大学、北京大学及国际顶级AI实验室，团队在NLP、分布式训练、模型压缩等领域发表顶会论文超200篇。研发理念聚焦三个核心：-**高效性**：通过模型架构创新（如MoE）实现“小参数量，大性能”。-**可控性**：内置可解释性模块
（15-3）DeepSeek混合专家模型初探：模型微调码农三叔训练 RAG 多模态)人工智能 Deekseep 深度学习大模型 transformer
3.4模型微调在本项目中，微调脚本文件finetune.py提供了一套全面的工具，用于对DeepSeek-MoE预训练语言模型进行微调。支持加载特定任务的数据、对数据进行预处理和编码，以及通过多种配置选项（如LoRA量化、分布式训练等）对模型进行高效训练。用户可以根据自己的需求，通过命令行参数或配置文件调整微调策略，以优化模型在特定任务或数据集上的性能。3.4.1微调原理在DeepSeek-MoE
Redisson分布式锁和同步器完整篇高锰酸钾_ 分布式 java redis redisson
Redisson分布式锁和同步器完整篇在分布式系统中，如何确保多个服务实例之间的数据一致性和资源协调是一个关键挑战。Redisson作为基于Redis的Java客户端，提供了一套完整的分布式锁和同步器解决方案，帮助开发者轻松应对这些挑战。本文将深入探讨Redisson的核心组件，包括：分布式锁：可重入锁、公平锁、读写锁、红锁、联锁同步工具：信号量、可过期信号量、闭锁我们将从以下维度展开详细分析：✅
网络安全（黑客）——自学2024 白帽子黑客-宝哥 web安全安全嵌入式硬件网络单片机
一、什么是网络安全网络安全是一种综合性的概念，涵盖了保护计算机系统、网络基础设施和数据免受未经授权的访问、攻击、损害或盗窃的一系列措施和技术。经常听到的“红队”、“渗透测试”等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。作为一个合格的网络安全工程师，应该做到攻守兼备，毕竟知己知彼，才能百战百胜。二、网络安全怎么入门安全并非孤立存在，而是建立在其计算机基础之上的应用技术。
Python图形界面 Tkinter入门6 数据库sqlite3 mango大侠 Python python 数据库 sqlite3 tkinter
6.1数据库sqlite3基础fromtkinterimport*importsqlite3importosroot=Tk()root.title('数据库sqlite3操作')root.geometry('400x400')#sqlite3-------------------------------------------------##检查数据库文件是否存在，不存在就创建，user表：ifn
Mongodb主从模式最佳方案 Christian Bai mongodb 数据库
我整理的一些关于【Java】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/bLN8S1MongoDB主从模式最佳方案MongoDB是一款开源的文档型数据库，被广泛应用于许多现代应用中。其强大的性能和灵活的数据结构使得它特别适合处理大数据和高并发访问。本文将介绍MongoDB的主从模式，并提供最佳方案和示例代码，帮助你更好地理解这种模式的运作原理。什么
关于django __str__ 与 __unicode__ 问题 weixin_40105587 python
因为所有字符串都作为Unicode字符串从数据库返回，基于字符的模型字段(CharField、TextField、URLField等)在Django从数据库检索数据时将包含Unicode值。即使数据可以放入ASCII字节字符串，也总是如此。您可以在创建模型或填充字段时传入bytestring，并且Django会在需要时将其转换为Unicode。¶选择__str__()和__unicode__()请
go hive skynet_MMORPG游戏服务器技术选型参考-Go语言中文社区 weixin_39908948 go hive skynet
游戏服务器一般追求稳定和效率，所以偏向于保守，使用的技术手段也是以已经过验证、开发人员最熟悉、能HOLD为主要前提。1、典型按场景分服设计开发语言：c++数据库：mysql架构：多个网关：维持与玩家间的SOCKET连接，可处理广播、断线重连等逻辑。一个或多个账号登陆验证服务器：处理登陆、排队等逻辑。多个场景服务器：处理在本地图上能解决的逻辑，如：打怪、玩家间战斗、接任务、完成任务等各种不需要跨地图
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><

彻底取代Redis+数据库架构，京东618稳了！

你可能感兴趣的:(数据库,运维,大数据,分布式,hadoop)