TiDB_PingCAP

TiDB HTAP 助力小红书业务升级

作者介绍：张亿皓，小红书基础技术部资深开发工程师，负责数据库相关的研发和落地工作。

TiDB 在小红书业务场景的应用简介

2017 年，小红书已经开始在生产业务中使用 TiDB ，真正成体系的去做 TiDB 的落地是在 2018 年，为什么要选择使用 TiDB ？

当今很多公司的业务都是数据驱动，面对小红书 APP 每天数以亿计的数据，我们希望有一个数据库能够提供以下特性：

第一，数据使用的多样性，有时候需要在数据库做一个 TP 的短查询，做一些很高的写入，有时候又希望做一些聚合分析，能够展现汇总统计的结果， TiDB 的 HTAP 架构正好满足了多样性的需求。

第二，更高的时效性，我们知道有很多数据分析的引擎虽然计算很快，但是对于实时分析的支持能力比较弱，TiDB 可以提供更高的时效性。

第三，TiDB 基于 Raft 的扩展性，小红书 APP 每天的数据都是上亿级别，单点的集群总有一天会被打满，会被打爆，我们就期望能有一个扩展性极佳且扩容方便的数据库，TiDB 非常契合，所以我们选择了 TiDB。

TiDB 目前在小红书的应用涵盖报表分析、大促实时大屏、物流仓储、数仓应用、电商数据中台、内容安全审核等多个业务场景。6 月 6 日是小红书的周年庆大促，需要展现一些实时的销量、店家成交总额排名、总销量等信息，这个实时大屏的应用后面连接的就是 TiDB。

TiDB 在这些业务当中给我们解决了哪些问题？我从这些业务中挑选了三个非常典型的应用场景来跟大家分享。

数据报表：数据报表其实很好理解，分析师经常需要看一些数据，比如这周的走势，看一些销量情况，看一些用户增长情况，看同比与环比数据。
线上业务库的实时查询：比如 300 亿行的一个表，MySQL 肯定存不下，需要走分库分表的逻辑，而且希望在做查询或者分析的时候不能对在线业务产生影响，解决线上分库分表 MySQL 的查询问题。
反欺诈数据分析：所谓反欺诈举个例子像黄牛薅羊毛，小红书的电商平台定期会发一些优惠券，黄牛就最喜欢薅这些优惠券，我们能否在短时间内抓到这些黑产行为，将他们捕捉下来进行分析和阻拦。

传统 MySQL 与数仓方案的局限

在没有 TiDB 的时候，我们怎么做？如上图所示，从业务逻辑上来划分，从上到下是业务在线层、数仓离线层和数据服务层。

首先在数据报表场景，采用 Hadoop 数仓对数据做一些预聚合，然后把这些高维度的数据简单聚合一下放到 MySQL 里面再做查询。对于数据报表，会把 Hadoop 里面的数据通过 Hive 以 T+1 的形式每天做一些预聚合放到 MySQL 里面，再搭建一些 BI 系统进行图形展示化的报表查询，分析师就可以看到他们定制化的一些报表。但是随着业务的快速增长，报表的形式变得更加多种多样，MySQL 的扩展性也是一个比较头疼的问题，如果单纯地增加一些 MySQL 的节点，到最后就会变成我们如何管理那么多 MySQL 节点的问题，搞过运维的同学都知道，这是一件比较烦琐的事情。

再来看在线的 MySQL 分库分表场景，我们要在上面做数据查询，又不能影响线上库，所以只能去查从库，这个从库当然也是一个分库分表的场景。这里产生了一系列问题：首先还是运维的问题，分库分表 MySQL 那么多节点怎么管？怎么扩容？分片是不是要重新去做 Sharding？如何保证一致性？缩容怎么缩？元信息怎么管理？这是运维上面的复杂度。除此之外，我觉得有必要提的一点，比如说线上的一个分库分表 MySQL，我在上面想做一个事务，分库分表的中间件方便做吗？如果我还想做一个 JOIN，甚至我还想做一个 Group by 聚合查询，分库分表中间件方便做吗？可能可以做，但都不会很简单，所以我们需要有一个能够方便地做比较复杂分布式查询的方案。

第三在反欺诈数据分析场景，我们比较关注时效性。在 TiDB 之前对于后端的一些打点数据，我们这些数据写到数仓里面，等到 T+1 第二天的时候，业务方才能查到上面的数据，这样 T+1 的时效性就比较差了。黄牛薅羊毛是一个很快的事情，到第二天可能直接薅完了你也没办法，所以非常希望最好能在半分钟、十秒钟，甚至秒级别，就能看到发出优惠券的详细使用情况。

引入 TiDB HTAP 方案，提升全场景数据服务能力

基于以上场景的种种挑战，我们引入了 TiDB 3.0 HTAP 方案，来看看新的业务架构，如下图，我们看到数据服务层采用 TiDB 就可以提供业务所需的全部数据服务。

我们重新梳理一下引入 TiDB 之后的三个业务场景。

在数据报表场景，直接用 TiDB 直接替换 MySQL ，解决了随着业务增长 MySQL 扩容复杂的问题。我觉得能实现无缝切换最重要的原因是 TiDB 一开始就支持 MySQL 协议，这是我觉得 TiDB 设计上非常牛的一点，很聪明的一点。前端的 BI 工具不用再开发一个所谓的 TiDB 驱动，直接用 MySQL 驱动就可以。在扩容层面，这是 TiDB 最擅长的事情，可以直接加个节点，数据自动做好重新均衡，非常方便。

在分库分表的 MySQL 场景，分库分表怎么做查询？我们造了一条实时流，把 MySQL 的数据通过 Binlog 实时写到 TiDB 里面，同步的延迟在一秒钟以内。实时流不仅仅是一个简单的数据同步，还做了一个事情就是合库，什么叫合库？原来线上分了一万个表，分表是因为 MySQL 存不下，现在一个 TiDB 集群是能够存下的，就没有必要分表了。实时流写到 TiDB 里面的同时，还把这一万张分表合成了一张大表，合的过程中可能还要处理一些特殊问题，比如说原来的自增主键怎么搞？自增主键合起来的时候是不是有问题？可能要做一些数据转换，有一些数据要做格式或者映射之类的数据处理，总之在实时流里面都把这些事情处理好，最后我们看到一张大表，就没有分库分表这件事情。在 TiDB 上面再做一些查询，不影响主库，TiDB 实际上作为一个 MySQL 的大从库，如果想做一个事务，也没问题，TiDB 支持事务，想做一个 JOIN，想做一个聚合，TiDB 都能够支持这类操作，最后就是一张大表呈现在 TiDB 里面。

最后看看反欺诈数据分析场景，应用了 TiDB 之后我们把 T+1 的提交改成了由 Flink 的 SQL 实时来写入，打点数据产生的速率很高，峰值的 QPS 大概能达到三四万，单表一天大概写入 5 亿左右的数据，如果我们保存 10 天的数据大概会达到 50 亿单表的量级。写进来之后，怎么做查询呢？主要是一些 Ad - Hoc 查询，如果分析师想看这次优惠券发下去的使用情况是怎么样的，分发情况是怎么样的，希望能在分钟级别就能够看到，每次 SQL 都可能有变化，我们直接绕过 Hadoop 数仓，通过 TiDB 来提供更加实时的查询。

TiDB 4.0 HTAP 方案的应用效果

通过引入 TiDB，我们在以上三个典型业务场景上解决了遇到的各种问题。这个方案有没有不足？其实也是有的，如果 3.0 没有不足的话，可能就不会诞生今天的 4.0 。我们使用下来的感受主要是 TiDB 3.0 在 OLAP 分析这一块能力稍有些不足，TiKV 是一个基于行存的数据库，去跟一些专门做分析的列存引擎去比较，其实是没有可比性的。TiDB 如何解决这个问题？是不是 TiDB 引入一个列存引擎就可以？到了 4.0 的时候，TiDB 带着 TiFlash 这么一个列存引擎来到了我们面前。

TiFlash 的设计有几点我觉得非常棒：首先，作为一个列存引擎 TiFlash 能够与 TiKV 共存，不是说只能选列存，只能选行存，两个可以同时存在，既然能同时存在，中间这个行存到列存数据的复制和转换怎么做？是不是需要再搭一条复制流去做？不用，TiDB 都帮我们做好了，通过 Raft Learner 复制机制直接采用一个较低延迟的方式把数据全部同步到 TiFlash 里面。从查询端来看，是否需要做一些特殊的处理让 TiFlash 走列存引擎呢？答案是都不需要，TiDB 有一个 CBO 执行计划的自动路由，可以知道这条 SQL 是 TiFlash 扫全表比较好还是走 TiKV 的索引查询比较快，可以帮我规划好。引入 TiFlash 的运维成本是非常低的，我要做的事情就是申请机器把 TiFlash 部署上去，然后就结束了，数据自动同步过去，查询自动路由过去，什么事情都不用管。

我们也对 TiFlash 做了测试，拿物流场景作为例子，我们对其中的 393 条生产查询进行评估，上图的纵轴是 TiFlash 的性能提升，从聚合查询来看，类似于 Group by、SUM 这些聚合查询，大概有三到十倍的性能提升，平均时间减少 68% 左右。如果是非聚合查询，平均时间减少 4% 左右，非聚合查询基本上都命中了 TiKV 的索引，没有走 TiFlash 的列存。

TiDB 4.0 还给我们带来悲观锁，在物流场景很多表需要 JOIN ，JOIN 其实是代价比较高的一件事情。为了避免 JOIN，我们会把这些要 JOIN 的表提前给拼成一张大宽表。举个例子，我把三张表拼成一张大宽表，那就有三个流就会同时更新大宽表，更新同一行，原来的 TiDB 3.0 是乐观锁的机制，就会产生事务冲突，对于客户端的重试来说是不太友好。TiDB 4.0 有了悲观锁，很好地解决了这个问题。

我们平时和 PingCAP 的 TiFlash 团队也有比较多的交流，我们也会经常提出一些新的需求，例如最早的时候， TiFlash 是不支持 ditinct count 这一类场景的，效率很低，开发团队在了解我们的需求后很快做出了优化，支持了 ditinct count 场景。

TiFlash 与 ClickHouse 怎么选？

最后说一下 TiFlash 跟其他方案的对比，拿大家比较熟悉的 ClickHouse 列存引擎做个比较，ClickHouse 其实单从计算性能来说，确实是比 TiFlash 要快一点。为什么某一些场景我们还是选择 TiFlash 呢？因为 ClickHouse 有一些问题，比如说 ClickHouse 的集群模式运维起来比较复杂，对数据更新的支持也比较弱，因为很多业务是事务型的，有很多更新需求，而 ClickHouse 更新的性能比较差，如果要改成 Append、Insert 这个逻辑，业务侧就要做大量的改动，例如数据要做去重之类的事情，很多场景下为了支持高频率的更新我们就选择了 TiFlash。

本文整理自张亿皓在 TiDB DevCon 2020 上的演讲。

TiDB删除大量数据需要注意什么大0马浓 mysql 数据库 tidb
在TiDB中删除大量数据时，需谨慎处理以避免性能下降、事务冲突或存储空间未及时释放等问题。以下是关键注意事项和优化建议：---1.避免大事务-问题：直接执行`DELETEFROMtable`会导致超大事务，可能触发TiDB事务限制（默认单事务限制为`txn-total-size-limit=100MB`），导致失败或性能问题。-解决方案：-分批次删除：使用`LIMIT`和循环分批删除，控制每批数据
这给我干哪来了，MySQL都9.2了赵师的工作日 mysql 数据库
作者：赵师的工作日（赵明中）现役OracleACE、MySQL8.0ocp、TiDBPCTA\PCTP、ElasticsearchCertifiedEngineer微信号：mzzhao23微信公众号：赵师的工作日墨天轮社区：赵师的工作日CSND：赵师的工作日MySQL9.2都来了确实有时间没上MySQL官网（www.mysql.com）,MySQL都出9.2版本了。现在业内大头都是8.x版本，少部
MySQL-关于如何保存“大数据” 赵师的工作日 mysql 大数据数据库
作者：赵师的工作日（赵明中）现役OracleACE、MySQL8.0ocp、TiDBPCTA\PCTP、ElasticsearchCertifiedEngineer微信号：mzzhao23微信公众号：赵师的工作日墨天轮社区：赵师的工作日CSND：赵师的工作日数据库的种类有很多，各类数据库充分发挥各自的优势从而保证业务稳定运行，mysql轻量级、关键数据，redis缓存、快，ES搜索，Mongodb
面试基础--分布式一致性算法深度解析 WeiLai1112 后端面试分布式算法 java 后端架构 spring boot
分布式一致性算法深度解析：RaftvsPaxos原理、实践与源码实现引言在分布式系统设计中，一致性算法是确保多节点数据同步和系统高可用的核心技术。Raft和Paxos作为两种最经典的分布式一致性算法，支撑了Etcd、ZooKeeper、TiDB等众多核心基础设施。本文将从算法原理、工程实践、源码实现三个维度对比Raft与Paxos，结合大厂真实案例，为分布式系统设计提供选型与实现指南。1.分布式一
TiDB系列之：TiCDC使用Changefeed完成数据同步任务快乐骑行^_^ 大数据日常分享专栏 TiDB系列 TiCDC Changefeed 完成数据同步任务
TiDB系列之：TiCDC使用Changefeed完成数据同步任务一、Changefeed二、Changefeed状态流转三、操作Changefeed四、cdccli管理同步任务1.创建同步任务2.查询同步任务列表3.查询特定同步任务4.停止同步任务5.恢复同步任务6.删除同步任务7.更新同步任务配置8.管理同步子任务处理单元(processor)9.同步启用了TiDB新的Collation框架的
PingCAP 连续两年入选 Gartner 云数据库管理系统魔力象限“荣誉提及” TiDB_PingCAP 数据库 tidb 开源分布式
近日，全球IT市场研究和咨询公司Gartner®发布最新报告《MagicQuadrant™forCloudDatabaseManagementSystems》（云数据库管理系统魔力象限），PingCAP因其企业级开源分布式数据库TiDB在全球市场的表现，连续两年入选“荣誉提及”。报告深入分析了云数据库的发展趋势和市场需求，聚焦于“愿景完整性”和“执行能力”两大关键维度，通过15项核心指标对全球领先
海量数据融合互通丨TiDB 在安徽省住房公积金监管服务平台的应用实践 TiDB_PingCAP tidb htap 分布式
导读安徽省住房公积金监管服务平台通过整合全省17家公积金中心的数据，致力于实现数据共享、规范化管理与高效数据分析。为了应对海量数据处理需求，安徽省选择TiDB作为底层数据库，利用其分布式架构和HTAP能力，实现了快速的数据分析与治理。TiDB的高效性能提升了平台的数据处理能力和查询效率，为全省公积金数据的统一管理与共享提供了有力支持。本文将详细介绍TiDB在平台中的应用与实际效果，以及TiDB如何
什么是TiDB，什么是分布式数据库？它和 MySQL 比优缺点是什么？蒂法就是我数据库 tidb 分布式
TiDB简介与分布式数据库概念一、什么是分布式数据库？分布式数据库是一种将数据分散存储在多个物理节点上的数据库系统，通过分布式架构实现水平扩展、高可用性和容错能力。核心特点包括：数据分片（Sharding）：将数据划分为多个分片，分布到不同节点。多副本冗余：每个分片存储多个副本，确保数据安全与高可用。分布式事务：支持跨节点的ACID事务（如两阶段提交、Percolator协议）。透明访问：用户无需
TiDB系列之：使用Flink TiDB CDC Connector采集数据快乐骑行^_^ 日常分享专栏 TiDB系列使用Flink TiDB CDC Connector采集数据
TiDB系列之：使用FlinkTiDBCDCConnector采集数据一、依赖项二、Maven依赖三、SQLClientJAR四、如何创建TiDBCDC表五、连接器选项六、可用元数据七、特征一次性处理启动阅读位置多线程读取DataStreamSource八、数据类型映射TiDBCDC连接器允许从TiDB数据库读取快照数据和增量数据。本文档介绍如何设置TiDBCDC连接器以对TiDB数据库运行SQL
tidb和mysql性能优化有哪些区别大0马浓 tidb mysql
TiDB和MySQL在性能优化上的区别主要体现在架构设计、扩展方式、优化手段和适用场景等方面。以下是主要区别的总结：1.架构设计差异MySQL：单机架构（或主从复制架构），存储和计算耦合。-依赖本地磁盘或集中式存储（如SAN/NAS）。-优化集中在单机资源（CPU、内存、磁盘I/O）的合理利用。TiDB：-分布式架构，存储（TiKV）、计算（TiDBServer）、调度（PD）分离。-数据自动分片
或许我们都被分库分表约束了思维京东云开发者京东云
作者：张俊杰概述这篇文章没什么太多的干货，纯纯是一篇讨论和思考帖。从业数据库领域三年有余了，从分库分表中间件到数据库团队内核学到了很多东西。也接触了很多项目，包括TiDB、Vitess、Polardb、StarDB等等。国内的项目好像很多都聚焦于分库分表的概念，包括很多的数据库团队都在尝试这个概念的落地和沉溺于性能的跑分。最近我在预览MySQL官方，看到了Partitioning的概念，而且占据了
Sharding-Sphere vs Mycat vs TiDB 木一番分库分表 TiDB
强烈推荐TiDB，这是未来大中型公司的数据库，一定的NewSQL优点：传统数据库面向磁盘设计，基于内存的存储管理及并发控制，NewSQL数据库那般高效利用中间件模式SQL解析、执行计划优化等在中间件与数据库中重复工作，效率相比较低分布式事务相比于XA进行了优化，性能更高基于paxos（或Raft）协议的多副本，实现了真正的高可用、高可靠天生支持数据分片，数据的迁移、扩容都是自动化的，大大减轻了DB
Java连接TIDB数据库出现通讯失败的原因分析奕辰杰 java tidb 数据库
在实际项目使用中，java项目连接的是TIDB数据库，TIDB是使用了3个服务节点，生产环境时不时的出现如下错误：Thelastpacketsentsuccessfullytotheserverwas3600000millisecondsago.Thedriverhasnotreceivedanypacketsfromtheserver.com.mysql.jdbc.exceptions.jdbc
TIDB数据库的基本介绍奕辰杰 tidb 数据库
一、基础概念：1、TiDB是PingCAP公司自主设计、研发的国产开源分布式关系型数据库，具备水平扩容或者缩容、金融级高可用、实时HTAP、云原生的分布式数据库、兼容MySQL5.7协议和MySQL生态等重要特性。TiDB适合高可用、强一致要求较高、数据规模较大等各种应用场景。官方文档非常详细齐全。官方网站：https://cn.pingcap.com/官方文档：https://docs.ping
或许我们都被分库分表约束了思维程序员
作者：张俊杰##**概述**这篇文章没什么太多的干货，纯纯是一篇讨论和思考帖。从业数据库领域三年有余了，从分库分表中间件到数据库团队内核学到了很多东西。也接触了很多项目，包括TiDB、Vitess、Polardb、StarDB等等。国内的项目好像很多都聚焦于分库分表的概念，包括很多的数据库团队都在尝试这个概念的落地和沉溺于性能的跑分。最近我在预览MySQL官方，看到了Partitioning的概念
tidb实时同步到mysql 数据库
客户要求实时同步表的数据到mysql，但这个表在tidb。测试直接通过tidbcdc写入到mysql，有些字段是null，所以中间加了一个kafka实现客户库中创建表CREATETABLEtb_1(idbigintprimarykey,cidbigint,gidbigint,feeDECIMAL(10,2),created_attimestamp,typesmallint,remarkstring
分布式存储--大规模订单架构设计梦江河大数据分布式订单系统大数据
架构一：MySQL+HBase+ElasticsearchMySQL存储实时订单，HBase存储历史订单，Elasticsearch实现订单的多维度搜索。架构复杂，运维维护成本高架构二：MySQL+TablestoreTablestore其实是HBase+Elasticsearch，既能存储大量数据，也能全文搜索架构三：分布式数据库TiDB+全文搜索功能参考文章
记一次简单的Oracle离线数据迁移至TiDB过程 qq_43479892 python oracle 数据库 database 计算机
Python微信订餐小程序课程视频https://edu.csdn.net/course/detail/36074Python实战量化交易理财系统https://edu.csdn.net/course/detail/35475背景最近在支持一个从Oracle转TiDB的项目，为方便应用端兼容性测试需要把Oracle测试环境的库表结构和数据同步到TiDB中，由于数据量并不大，所以怎么方便怎么来，这里
XXL-MQ v1.3.0 ｜分布式消息队列消息队列消息中间件任务调度
ReleaseNotes1、【增强】消费者分组属性"group"支持为空，为空时自动赋值UUID，方便实现多分组广播消费；2、【增强】海量数据堆积：消息数据存储在DB中，原生兼容支持"MySQL、TIDB"两种存储方式，前者支持千万级消息堆积，后者支持百亿级别消息堆积（TIDB理论上无上限）；3、【优化】消费者批量注册发现，提高注册发现性能；4、【优化】消息流转日志格式优化，提升日志可读性；5、【
XXL-MQ v1.3.0 ｜分布式消息队列消息队列消息中间件任务调度
ReleaseNotes1、【增强】消费者分组属性"group"支持为空，为空时自动赋值UUID，方便实现多分组广播消费；2、【增强】海量数据堆积：消息数据存储在DB中，原生兼容支持"MySQL、TIDB"两种存储方式，前者支持千万级消息堆积，后者支持百亿级别消息堆积（TIDB理论上无上限）；3、【优化】消费者批量注册发现，提高注册发现性能；4、【优化】消息流转日志格式优化，提升日志可读性；5、【
【TiDB系列文章】PD（Placement Driver）学弟Craze TiDB tidb 数据库
引言在分布式数据库的生态系统中，PD扮演着至关重要的角色。作为TiDB的核心组件之一，PD负责数据的放置和调度，确保数据的高可用性和负载均衡。本文将详细介绍PD的功能、架构以及它在TiDB中的作用。PD概述PD是TiDB分布式数据库中的元信息管理组件，负责存储集群的元信息和调度数据。它相当于分布式数据库的“大脑”，负责整个集群的数据分布和负载均衡。PD通过合理的调度策略，确保数据均匀分布在集群中，
PingCAP TiDB数据库专员PCTA认证笔记 handsomestWei 数据库 tidb 数据库
tidb-pcta-notePingCAPTiDB数据库专员PCTA认证笔记相关链接官网认证中心TiDB社区体系架构数据库设计存算分离。三层架构：PD（PlacementDriver）负责集群元信息管理和调度，TiDB负责sql计算，TiKV负责存储存储引擎1、基于LSM-Tree的RocksDB引擎，比B-Tree写入更快，用空间置换写入延迟2、数据冗余副本：multiraft-group副本机
TiDB架构分析梦江河大数据 tidb 数据库
TiDB有三部分组成：存储层：TiKV计算层：TiDB调度层：PD（PlaceDriver）存储元数据存储层TiKV1）通过range分区算法将数据分成一个个region；2）每个region默认有3个副本，一个leader副本和两个follower副本，这些副本分布在不同节点上，通过raft协议保证数据一致性；3）如果副本数量发生了变化，pd会及时感知，做出应对措施；计算层TiDB将SQL请求映
TiDB架构分析以及总结微亻言数据库
1TiDB1.1产品简介TiDB是PingCAP公司的自主设计、研发开源的分布式开源数据库，是一款支持在线处理与在线分析处理的融合性分布式数据库产品，具备水平扩容，金融级高可用、实时HTAP、云原生的分布式数据库、兼容MySQL5.7协议和MySQL生态等重要特性。目标是为用户提供一站式OLTP(OnlineTransactionalProcessing)、OLAP(OnlineAnalytica
亿级表优化「TIDB 分区篇」，值得收藏彭亚川Allen 数据库 oracle
这是亿级别表优化的第二篇，对第一篇感兴趣的可以看看。亿级表优化思路之SQL篇-掘金写作背景距上次写亿级别优化已经有一个多月了，这段时间也没闲着，Q1对模型做了梳理，重构了这部分业务，主要做了下面这些优化数据模型优化（终于狠下心做了减法，去掉了2个模型）。做了分区表，数据日增量非常快，单表遇到读写瓶颈。复杂SQL优化，上次优化遗留的顽疾。数据清洗（流失数据、已删除数据备份归档）。所以，我还是总结这段
TiDB 6.0 新特性 m0_75231205 tidb
PlacementRulesinSQL：提供SQL接口，利用SQL接口，去精细化数据库表，表中的分区所在的位置，指定表放置在哪个区上，哪个节点上小表缓存：解决分布式数据库的热点问题，当表比较小不容易被打散，而访问又比较频繁，修改又比较少，用小表缓存这个功能，就能够提升小表的吞吐量内存悲观锁：在事务的性能上有很大提升TopSQL：提供了非常便利的手段，能够找到某个TiKV,某个TiDB，某个时段的T
TiDB Server m0_75231205 tidb
TiDBServer架构TiDB作为SQL层，对外暴露MySQL协议的连接，负责接受客户端的连接，执行SQL的解析和优化，生成执行计划，到TiKV中，将数据读取，到TiDBServer中的缓存中去，再返回给用户解析SQL，将实际的数据读取、请求，转化为TiKV节点TiDBServer作用处理客户端的连接ProtocolLayerSQL语句的解析与编译Parse、Compile关系型数据与KV的转化
TiDB架构特性 #TiDB TiDB
文章目录TiDB整体架构TiDBServerPDServerTiKVServerTiSparkTiDBOperatorTiDB核心特性水平扩展高可用TiDB存储和计算能力存储能力-TiKV-LSM计算能力-TiDBServer总结TiDB整体架构 TiDB集群主要包括三个核心组件：TiDBServer，PDServer和TiKVServer。此外，还有用于解决用户复杂OLAP需求的TiSpark
【TIDB】tidb 的架构戒掉贪嗔痴(薛双奇) 国产数据库-TIDB tidb 架构
1.tidb的架构TiDB的架构主要由几个关键组件构成，‌这些组件共同协作以提供一个分布式的关系型数据库解决方案。‌以下是TiDB架构的主要组成部分及其功能：‌TiDBServer：‌主要负责解析SQL查询并将数据读取请求转发给底层的存储节点。‌它本身并不存储数据，‌而是作为一个轻量级的SQL层存在，‌提供标准的SQL接口，‌兼容MySQL协议和语法。‌TiKV：‌作为底层的分布式键值对存储引擎，
TiDB分布式数据库架构与核心原理 AI天才研究院 Python实战深度学习实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介TiDB是PingCAP公司2017年开源的分布式HTAP（HybridTransactional/AnalyticalProcessing）数据库产品，其目标是在强一致性、高性能和易用性之间找到平衡点。TiDB的特点是融合了传统的RDBMS和NoSQL的最佳特性，具备水平扩展能力、高可用特性、强一致性和实时HTAP查询功能等优秀特性。本文从整体架构、集群设计、
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置