linuxheik

PingCAP 创始人刘奇：开源分布式数据库如何搞定 OLTP

7月28日，以“科技，洞见未来”为主题的 QingCloud Insight 2016 大会将在北京召开，连接云计算产业链上下游，展示 IT 领域最新研发成果。作为 NewSQL 技术的代表，PingCAP 联合创始人&CEO 刘奇将在本次大会上讲述开源数据库 TiDB 的设计与研发技术细节。在云和大数据时代，数据库领域发生了什么？新应用需要什么样的数据库？开发者需要哪些新技术？刘奇日前接受 CSDN 记者的专访，从 TiDB 的研发开始，就传统数据库面临的挑战，新型数据库的特性，开源模式的优势，TiDB 的研发进展，以及数据库与云计算资源更好配合的方式等问题进行深入解析。

PingCAP联合创始人兼CEO刘奇

刘奇，PingCAP 联合创始人兼 CEO，先后创建了 TiDB、Codis 等知名开源项目。曾任豌豆荚、京东资深系统架构师。同时也是知名的 Go 语言专家和 Redis 专家。现从事开源的分布式 NewSQL 数据库 TiDB（受 Google F1 启发）的开发。擅长高并发、大规模、分布式数据库系统架构设计。

数据库领域的变化

CSDN：首先谈谈您在 QingCloud Insight 2016 上的分享话题。

刘奇：我会讲怎么去构建一个分布式数据库，主要是介绍我们是怎么实现 TiDB 的。经过大约一年半的研发，TiDB 现在已经发布了 Beta 1版本，进入一个快速迭代的周期，预期在三个月内能迭代到一个 GA 的版本。作为一个数据库产品，我们对 TiDB 进行严格的测试，以保证数据不会出问题。

CSDN：哪些人应该了解这个内容？

刘奇：DBA、系统架构师、CTO 甚至 CIO，因为他们需要了解Database 对于企业真正的价值。不同数据的重要性是不一样的，核心价值的数据永远不能丢失。比如说银行，最核心的可能就是账号、存款这些金融相关的这些数据，其次就是和业务相关的，再次就是一些日志。

CSDN：金融等行业核心有传统关系型数据库，也在针对不同数据尝试 NoSQL，为什么还需要 TiDB 这样的 NewSQL 技术？

刘奇：银行其实也面临互联网转型的压力，传统数据库经过这么多年，已经不能适应现在转型期用户数据增长的速度，也不能很好地支持跨数据中心多活——热备都是比较过时的技术。当然银行在很大程度上还要考虑风险，即使有一个新的数据库，他们也很难在短时间内将其部署到最核心的业务，但是可以先从外围开始测试，体验分布式带来的好处，支持业务快速地往前发展。

CSDN：不仅 TiDB，很多分布式的数据库都采用开源的模式，为什么这个领域这么喜欢开源？

刘奇：首先，数据库可以分为 OLAP 和 OLTP 两大类，OLAP 对于数据的安全性重视程度没有 OLTP 那么高，丢失几条数据对于用户行为分析而言关系不大。目前开源领域以 OLAP 居多，因为实现难度和风险更小，但是真正往 OLTP 上走是非常困难的。实际上，在 Google Spanner 论文出来之前，就没有真正的大规模 OLTP 分布式数据库，OLAP 的系统可以轻松扩展到两百台机器，但 OLTP 数据库能上到两百台机器是非常罕见的，以前也没有什么特别好的技术。被 Apple 收购用于提供 Apple 内部服务的 FoundationDB，也就能 Scale 到一百台左右的规模。很多同行都走了很多的弯路，Spanner 一出，架构就得跟着重新去改。

而使用开源数据库，无论是从被绑架的风险，还是说灵活程度，可扩展性，甚至是和其他工具的整合，都有明显的优势。

首先是不会被某个数据库绑架。
其次，开源是大家协作的一个系统，通常你遇到问题很有可能被别人 Fix 掉了，而且你也有很多地方可以交流经验。
同时，很多人会参与贡献，哪怕是一点小需求，只要用的人足够多，官方一般都会接纳——就算官方不接纳，你也可以 Fork 一些分支完成自己的需求，这是商业数据库不可能做得到。
另外是和其他开源工具的整合，开源对开源一般都会很友好，比如整个阿帕奇社区几乎所有的东西都可以很好地整合，Hadoop、Spark、Flink 最终会形成一个相互依存、良性竞争的超级大的生态。

TiDB 的研发思路

CSDN：谈到 Google Spanner 的论文，TiDB 在哪些方面借鉴了它的设计，哪些方面是有独到的一些创意？

刘奇：TiDB 大量地借鉴了 Google 的论文，也做了很多自己的改进。比如说：

Google 使用的是 tech source，尽管有其他的实现，但没有一个真正受过大规模生产环境的考验。我们在协议上选择的 Raft，也是经过了非常严峻的生产环境的考验，比如 etcd 、Hashicorp 都在用 Raft，大家还有很多基于 Raft 专门造的各种轮子，同时 Raft 性能和 Paxos 差不多，但简洁性是后者所不具备的。
关于协议，还有 Google 内部使用了自己的 ORM，而我们兼容的是 MySQL 协议，在易用性上比 Spanner 或者说比 F1 要好很多，用户不需要重新学一套新的东西就可以直接用；我们接下来还会支持 MySQL 的 Documents store，用起来就更爽了。
另外在整个架构上，Google 依赖自己的 Colossus 分布式文件系统，而我们是不依赖的。如果依赖一个分布式文件系统，用户需要多部署一个新的组件，同时也会造成一定的 latency 上升，这是我们不希望看到的。
再一个比较重要的改进就是原子钟，这是 Spanner 最强的地方—— Google 内部有一个原子钟加 GPS 时钟，组成一套精确的时钟系统，这在外面是没有的。我们在事务模型上面使用了 Percolator，是 Google 之前发表的另一篇论文里提到的一个增量处理的事务模型，这也是外面没有原子钟的变通方案。

CSDN：能否解释具体是怎么实现的？

刘奇：按照原来的 Percolator，会有一个 Server 提供直接时钟服务，也就是单调递增的时间戳的分配，它本身是高可用的，通常会部署三到五个副本，大概每秒可以分配四百万到八百万个时间戳。从目前的需求来看，每秒四百万个时间戳是绰绰有余的，这是在没有原子钟的时候的一个替代方案。另外一个方案就是 HLC，但 HLC 如果要保证线性隔离级别，需要设置一个时钟适中的精度，但是没有云厂商明确说时钟精度一定保持在什么范围。这是一个比较大的问题，如果时钟精度超出这个范围，结果就是错的。我们不想因为时钟精度造成用户数据出错的可能，所以就选择一个更加稳定的一个方案。HLC 也是Kudu 和 CockroachDB 采用的几乎同时发表的技术极为相似的两篇论文。

CSDN：兼容 MySQL 的方式是业界通用的做法吗？

刘奇：不是，主流做法是我搞一套我自己的，让用户切进来，这对于新东西的推广的压力非常大。兼容它很重要一点是数据库的测试，我们现在测试用例都是用几百万级的，600 多万个 Tests，可以把 MySQL 的兼容，大量 Test 拿过来用来测试，如果靠人去构建这个 Test 基本上是不现实的事情。MySQL 已经是一个很好的平台，融入平台，可以让大量已有的生产力得到发挥。如果不能很好地兼容这个平台上所有的东西，反而自己去建立一个平台，周期是很吓人的。

CSDN：会追的最新版本的 MySQL 吗？

刘奇：我们现在追的是 5.6，因为 5.7 的官方也还在快速的更新，比如说5.7推出的 Documents store，现在还没有用户，我们这时候去支持它是没有太大的意义。我们做一个东西一定是满足用户需求，然后兼容协议，对用户来说迁移特别简单，就比如说现在直接测试。

CSDN：是否需要开发一些专用的工具来支持 MySQL 到 TiDB 的迁移？

刘奇：不需要其他所谓的第三方工具，直接使用任何已有的 MySQL备份、恢复工具就可以了。我们现在的测试都是直接把 MySQL 数据导出来，导入到 TiDB，再拿 TiDB 的数据导回 MySQL，完全不需要任何新的工具。绝大多数时候一行代码都不改，立刻可以获得所有的新特性和分布式的优势。

CSDN：传统的 DB2、Oracle 的迁移也是一样简单的吗？

刘奇：这个事情就比较麻烦了，因为我们并不兼容这个 Oracle，也不兼容 DB2，而且它们互相也不兼容。这时候用户如果要迁移，用户需要改它的 SQL，需要改掉存储过程，因为我们不支持存储过程、触发器这些前两代单机数据库的技术，对一个分布式系统来说，如果在这个地方写个存储过程，这个存储过程访问的数据，又跑在其他的机器上面，这个时候存储过程的理解，和用户对于前面两代的传统数据库技术的理解是不一样的，那按照它前面这个思路去写现在这个程序有可能会出现一个比较大的问题。所以传统像 DB2，Oracle 迁过来是稍微有点麻烦的，就是他们需要自己去改 SQL。

CSDN：对 NoSQL 端的兼容有什么样的计划？

刘奇：我们不考虑兼容 NoSQL（当然用户可以自己去修改兼容MongoDB 或者 HBase 的 API）。NoSQL 已经是上一代的技术，我们没有必要在上面再做太多的别的一些东西，直接跳到 NewSQL 这一代就可以了。国外有人在 PostgresSQL 上做一套 MongoDB 的兼容，我们认为没什么意义。而我们兼容 MySQL 协议，是给 MySQL 提供了很多原本不能够实现的东西，比如说异地多活，跨数据中心复制和容灾，水平伸缩。

CSDN：水平伸缩能够支持多大的规模？

刘奇：我们的设计，单个数据库支持千级别的机器，如果超过这个数量可以重新再布一个新的实例，又可以支持这种千级别的机器。但目前还没有找到这么大的业务。

CSDN：目前有如何商业化的考虑吗？

刘奇：TiDB 的核心技术是完全开源的，但我们将来会提供企业版。我们有一个 On-Premise 的版本，提供的一些监控和管理工具，这些工具就不需要开源了。这其实也是目前开源数据库的主流做法。比如 MongoDB，它的核心东西都是开源的，一般用户从来不用考虑付费问题，但是它会给企业用户提供一套收费的非常漂亮的管理界面，这是一个主流的收费模式。另外还可以给用户提供技术支持和维护的服务，以及咨询服务。开源不影响卖 License，我们仍然为企业提供 License 授权。

云计算环境的整合

CSDN：开源分布式数据库想要在云上做为一个服务提供给用户和开发者，最重要的工作是什么呢？

刘奇：对用户体验最好的，肯定是和云做深度整合，用户不需要关心新启一个机器这种细节，只要设定一个配额，容量不够的时候自动给我扩容就好了（同时发邮件通知），这样易用性是最友好的，这在国外也比较常见，可以保证业务完全不停，国内很多上第三方市场的方式，就没有和云做深度整合，易用性相对还是弱一点。

CSDN：要满足异地多活等特性，TiDB 对云资源的使用上遇到过一些问题呢？

刘奇：异地多活，起码异地之间的 latency 不能太大，否则用户一个正常请求，尽管 TiDB 是采用 Raft 这样的多数派复制的方案，复制到多个数据中心延迟就比较大了，像 Spanner 可能在百毫秒级别的，它最夸张业务会复制五到七个副本，分布在五个不同的地区。现在国内的普遍做法是同城异地，同城机房可以保持很好的同步，因为 latency 特别小，异地的机房之间仍然保证不中断业务，但 latency 会上来。

CSDN：异地同步可以交给云来自动做吗？

刘奇：这个显然要由数据库层来做，因为只有数据库层才知道这事该怎么做，否则底下的存储层很难做出最优雅的决定，比如说没有这个数据库之前，MySQL 在云上是没有办法 scale 的。但是云可以提供很好的支撑，比如说拉专线让 latency 变小，相当于从硬件层解决问题。简单来讲，数据库可能是造车的，机房的专线就相当于一条高速公路，因为它的 latency 很小，很适合数据库做异地多活。

CSDN：硬件层的故障对 CAP 的影响，要通过什么方式来解决呢？

刘奇：我们使用 Raft 的协议，容灾的能力就是二分之 N（N 为奇数），最多不超过二分之 N 的机器挂掉时候可以正常使用，所以在云上面，如果说一个机器挂掉，对于整个系统是没有影响的，或者一个机器网络出了问题，它被隔离掉也没有影响。机制上它并不依赖与云给它提供的稳定性和安全性，这个协议本身就负责保证它的稳定性和安全性。

CSDN：TiDB 要部署到云上，对于下层 IaaS 的需求就是一个高速公路吗？

刘奇：主要就是高速公路，另外对机器或者容器的弹性支持，因为数据库扩容的前提，是新加一个机器，必须要给我提供一个 API，或者提供API 让我马上加个 Container，无所谓是 Docker 还是 Rocket。

CSDN：开源分布式数据库未来一定要和 Container 结合吗？

刘奇：结合是肯定的事情。未来分布式数据库会往多租户的方向走，但是目前对多租户还没有很好的技术支持，这时候怎么去做隔离，容器化是个很好的思路。但是分布式数据库也不是简单的容器化的问题，因为它被隔离在很多机器上面，它的配额，或者说它的请求，时时刻刻都在变，你对它的约束必须是在整个系统级别的约束，而不是单机上的约束。未来的程序一定是跑在容器里面的，但是存储可能挂在容器外面。目前我们已经初步完成了跟 Kubernetes 的整合，还在做进一步的测试。目前我们希望很好地跟 Kubernetes 或者跟 OpenStack 整合。我们有 Dockerfile，可以直接通过 Container 部署，很多热爱开源的开发者希望自己去编译，也支持直接 apt-get、RPM 来安装。

开发工具与难点

CSDN：使用 Golang 开发的是因为您擅长Go吗？

刘奇：我擅长 Go，也擅长 Rust，但我之前写了六七年的 C++，再之前大概写了两年的 C、一年的汇编，中间还写过大概半年的 C#，C++ 是用得最久的。但 TiDB 其实是两层，包括 SQL 层的 TiDB 和 KV 层的 TiKV，分别对应着 Google 的 F1 和 Spanner。TiDB 之所以用 Go 开发是因为开发速度快——实现 MySQL 兼容需要非常大的工作量（目前为止还没有完全实现兼容），需要选好开发语言让我们很快地适应 MySQL 的变化。另外，TiKV 是用 Rust 写的，Rust 的性能非常好，可以满足 KV 操作的需求；同时它没有 GC，可以避免了 Go 语言里面本身存在的一些问题；此外 Rust 对错误检查又严格无比，这对一个非常重视质量的项目来说非常重要，可以很好地解决了这个多线程数据竞争等问题。

CSDN：Go的 GC 问题如何解决呢？

刘奇：在压力大时候，GC 就是个问题，这需要去不断地优化。我们整个系统的实现，减少内存的分配、重用对象等常规的优化 GC 的算法都用的上。

CSDN：到目前为止，开发过程中最耗费精力的是哪一项工作呢？

刘奇：应该是测试。分布式系统的测试本身就非常困难，对数据库的测试要求就更高了，必须要非常严谨地做所有的可能性的测试，我们需要有工具不断地去模拟机器挂掉、网络断开、磁盘损坏/变慢、程序被kill等所有的故障，我们现在有 Test 不间断地杀程序，杀完之后马上检查数据有没有丢，以保证无论出现什么极端的情况，数据都是正确的、完整的，这种测试是非常重要。然后我们还同时跑着几百万个 Test，目前也是分布式在跑。我们有很多关于分布式系统的论文，但是关于分布式系统的测试的论文其实很少，高质量的就更少，Google 也没有告诉大家说 Spanner、F1 到底怎么做的 Test，外面的经验跟 Google 还是有差距的。

TiDB 的适用场景

CSDN：测试如此重要，那不同行业的数据库应用场景千差万别，我们是要把所有的方向都测试，还是说目前有些侧重的场景？

刘奇：首先我们能够支持传统的 sysbench 之类的常规测试。至于各种行业的不同应用类型，我们不可能完全测试到。我们这边模拟的方案，和用户那边实际报过来的 case，以及用户提供的数据，我们都会进行统一的测试。但是开源带来的好处，是用户可以下载帮我们做测试。

CSDN：你认为哪些场景、哪些应用应该使用 TiDB ？

刘奇：在数据库上遇到瓶颈的地方都可以。数据库不应该是卡住业务的瓶颈，当业务在快速发展的时候，如果这数据库遇到了性能问题、扩展性、数据保护等问题，需要多数据中心的容灾能力，这个时候可以上 TiDB。不一定是场景驱动，只要数据库真的遇到问题，就可以上一个更好的数据库。

CSDN：采用 TiDB 之前，应该做哪些准备工作？

刘奇：如果是 MySQL，那比较简单，可以拿真实数据直接去测试，可以像互联网应用常规做法，先导一部分流量进来，可以很好做一个双写，去验证这个系统，并保持这种状态持续一定的时间。然后如果不是MySQL，可能就需要先转化到 MySQL 这种语句，最好是拿自己实际业务去测试，这样发现问题也比较聚焦，不建议只是简单地 bench 一下。

2020年10月国产数据库排行：GoldenDB跃升异军突起 PolarDB和GaussDB云化融合数据和云微软 informix 分布式存储 microsoft cloudera
墨墨导读：2020年10月国产数据库流行度的前三位由TiDB、达梦数据库、GBase（南大通用）获得，其中TiDB以超过100分的优势领先第二位的达梦数据库。数据技术嘉年华，十周年盛大开启，点我立即报名！大会以“自研·智能·新基建——云和数据促创新生态融合新十年”为主题，相邀数据英雄，总结过往十年历程与成绩，展望未来十年趋势与目标！近60场演讲，大咖云集，李飞飞、苏光牛、林晓斌、黄东旭...，快来
TiDB数据库傲雪凌霜，松柏长青后端 tidb 数据库
TiDB是由PingCAP开发的开源分布式SQL数据库，设计初衷是为了解决传统单机关系型数据库在处理大规模数据和高并发事务时的扩展性和性能问题。它结合了传统关系型数据库（如MySQL）的易用性和分布式系统的扩展能力，属于新一代的分布式SQL数据库。TiDB的关键特性兼容MySQL协议：TiDB兼容MySQL协议，用户可以直接使用MySQL客户端或MySQL的各种生态工具（如MySQLWorkben
HTAP 深入探索指南每天读点书学堂大数据数据库数据库开发
本指南介绍如何进一步探索并使用TiDB在线事务与在线分析处理(HybridTransactionalandAnalyticalProcessing,HTAP)功能。注意如果你对TiDBHTAP功能还不太了解，希望快速试用体验，请参阅快速上手HTAP。要快速了解TiDB在HTAP场景下的体系架构与HTAP的适用场景，建议先观看下面的培训视频（时长15分钟）。注意本视频只作为学习参考，如需了解详细的H
TiDB备份与恢复简介每天读点书学堂大数据数据库架构数据库数据库开发运维
本文档介绍如何对Kubernetes上的TiDB集群进行数据备份和数据恢复。备份与恢复中所使用的工具有Dumpling、TiDBLightning和BR。Dumpling是一个数据导出工具，该工具可以把存储在TiDB/MySQL中的数据导出为SQL或者CSV格式，可以用于完成逻辑上的全量备份或者导出。TiDBLightning是一个数据导入工具，该工具可以把Dumpling或CSV输出格式的数据快
等保2.0--安全计算环境--TiDB数据库魔同等保测评安全 tidb 数据库
在使用本博客提供的学习笔记及相关内容时，请注意以下免责声明：信息准确性：本博客的内容是基于作者的个人理解和经验，尽力确保信息的准确性和时效性，但不保证所有信息都完全正确或最新。非专业建议：博客中的内容仅供参考，不能替代专业人士的意见和建议。在做出任何重要决定之前，请咨询相关领域的专业人士。个人责任：使用本博客内容的风险由用户自行承担。作者不对因使用本博客内容而导致的任何直接或间接损失承担责任。版权
窥一斑而知全豹薛晓刚数据库
说几个DTCC大会的插曲由于经济形势的不好，我看参展商少了一点。可能不少都是为了生计而挣扎。2023年1月明叔主持的栏目有一期特别节目《数据库诸神之战》，请来了OB、TiDB、TDSQL和TDEngine的掌门人来讨论数据库的未来，那时候结论是3年后国内健康运营的数据库公司不超过30家。目前已经快过去2年了。现在日子的确越来越难过了。现实可能和预测差不多。从出版社少到图书劵少每次大会都有各家出版社
开源项目精选：Bookshop Demo - 您的云端书店解决方案毛彤影
开源项目精选：BookshopDemo-您的云端书店解决方案tidb-prisma-vercel-demoVirtualonlinebookstoreapplicationdemowhichyoucanfindbooksofvariouscategoriesandratethebooks.项目地址:https://gitcode.com/gh_mirrors/ti/tidb-prisma-verc
OLAP和OLTP以及HTAP的区别霸王龙的日常数据库概念数据库数据仓库
数据处理一般可以分成两大类：OLAP和OLTP那么有没有一种情况，将OLTP和OLAP相融合，在同一个系统中同时提供这两种服务，答案是有的。即HTAP产品。在这方面，国内的数据库厂商PingCAP的TiDB就不错。还有华为的GaussDB(openGauss)也对外公布六大关键技术特性其中之一就是高度支持HTAP混合负载。什么是OLAP？联机分析处理OLAP（OnLineAnalyticalPro
【数据库】GaussDB 一起学架构数据库数据库
目录一、GaussDB是什么数据库？二、GaussDB与Tidb、OcceanBase数据库的差别有哪些三、GaussDB的整体架构是怎么样的？四、GaussDB的核心技术特点是什么？五、GaussDB的适用场景有哪些？六、GaussDB在不同场景的一些最佳实践案例七、GaussDB性能优化技巧八、GaussDB使用的注意事项一、GaussDB是什么数据库？Gauss数据库是基于PostgreSQ
MYSQL的读写扩展 hailang86 mysql 数据库
1.分布式数据库有很多种：采用分库分表方式将数据路由拆分到多个数据库上；以greenplum未代表的mpp数据库架构；以tidb为代表的newSQl数据库架构。2.mpp数据架构是一种处理大规模数据分析任务的分布式数据架构，大规模并行处理。当执行一条SQL语句时，会将语句发送到所有数据节点进行查询处理，利用多节点的计算能力进行计算。3.分库分表主要用于简单的业务场景，OLTP场景，onlinetr
MySQL8.3 可以给 GTID 打标签了！ mysqlgtid事务
本文介绍了MySQL8.3的一个新特性，给GTID打标签~作者：李富强，爱可生DBA团队成员，熟悉MySQL，TiDB，OceanBase等数据库。相信持续把对的事情做好一点，会有不一样的收获。爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。本文约900字，预计阅读需要3分钟。摘要MySQL8.3创新版于2024年1月16号发布，该版本扩展了MySQL复制和组复制中使用
读TiDB源码聊设计：浅析HTAP的SQL优化器 tidbgo性能优化分布式系统
版本日期备注1.02024.2.18文章首发本文的的源码分析全部基于TiDB6.5来做分析。1.引子如果让你做一个分布式数据库的优化器，面对以下的SQL，你会想到什么好的方法去执行他们呢？SELECTid,nameFROMpersonWHEREage>=18orheight>180limit100;：从条件上看，我们看到条件其实是二选一的：age>=18orheight>180。基于这种情况，我们
从 20 多套 MySQL 到 1 套 TiDB丨骏伯网络综合运营管理平台应用实践 TiDB_PingCAP tidb 分布式云原生数据库 TiDB
导读骏伯网络是一家聚焦移动互联网营销服务的公司，综合运营管理平台是其核心业务系统，包括营销系统、订单、支付以及与外部系统的交互服务接口。为满足多元化的业务发展需求，降低系统间交互链路的复杂性，提升业务连续性，以及实现降本增效的整体规划，骏伯网络选择将TiDB作为综合运营管理平台的底层数据库。经过上线实践证明，TiDB为骏伯在业务连续性、性能提升、数据资源整合、降本增效等方面带来了显著价值。未来，骏
通过 Prometheus 编写 TiDB 巡检脚本（脚本已开源，内附链接） TiDB_PingCAP prometheus tidb 开源分布式云原生数据库
作者丨caiyfc来自神州数码钛合金战队神州数码钛合金战队是一支致力于为企业提供分布式数据库TiDB整体解决方案的专业技术团队。团队成员拥有丰富的数据库从业背景，全部拥有TiDB高级资格证书，并活跃于TiDB开源社区，是官方认证合作伙伴。目前已为10+客户提供了专业的TiDB交付服务，涵盖金融、证券、物流、电力、政府、零售等重点行业。背景笔者最近在驻场，发现这里的tidb集群是真的多，有将近150
使用 Coze 搭建 TiDB 助手 TiDB_PingCAP 数据库开源分布式 TiDB tidb
导读本文介绍了使用Coze平台搭建TiDB文档助手的过程。通过比较不同AIBot平台，突出了Coze在插件能力和易用性方面的优势。文章深入讨论了实现原理，包括知识库、functioncall、embedding模型等关键概念，最后成功演示了如何在Coze平台上快速创建TiDBHelpBot。本文作者Weaxs，TiDB社区布道师。引言目前市面上有很多搭建AIBot的平台和应用，开源的有langch
一篇文章彻底搞懂 TiDB 集群各种容量计算方式 TiDB_PingCAP 数据库 tidb TiDB 云原生开源
作者丨hey-hoho来自神州数码钛合金战队神州数码钛合金战队是一支致力于为企业提供分布式数据库TiDB整体解决方案的专业技术团队。团队成员拥有丰富的数据库从业背景，全部拥有TiDB高级资格证书，并活跃于TiDB开源社区，是官方认证合作伙伴。目前已为10+客户提供了专业的TiDB交付服务，涵盖金融、证券、物流、电力、政府、零售等重点行业。背景TiDB集群的监控面板里面有两个非常重要、且非常常用的指
“分布式透明化”在杭州银行核心系统上线之思考 TiDB_PingCAP 分布式云原生 tidb 数据库银行
导读随着金融行业数字化转型的需求，银行核心系统的升级改造成为重要议题。杭州银行成功上线以TiDB为底层数据库的新一代核心业务系统，该实践采用应用与基础设施解耦、分布式透明化的设计开发理念，推动银行核心系统的整体升级。本文聚焦银行核心系统演进，结合TiDB在杭州银行新一代核心的实践，深入解析“分布式透明化”理念，希望能为同行业的转型升级提供参考。本文作者：韩锋，CCIA（中国计算机协会）常务理事，前
作业帮 x TiDB丨多元化海量数据业务的支撑 TiDB_PingCAP 数据库 tidb TiDB 云原生开源
导读作业帮是一家成立于2015年的在线教育品牌，致力于用科技手段助力教育普惠。经过近十年的积累，作业帮运用人工智能、大数据等技术，为学生、老师、家长提供学习、教育解决方案，智能硬件产品等。随着公司产品和业务场景越来越丰富，数据量越来越大，业务方对数据库的使用需求也越来越多元化。本文介绍了作业帮对TiDB的探索历程，以及逐渐落地多个业务场景的使用实践。TiDB在作业帮的探索和推广作业帮内部最开始接触
TiDB 7.5.0 LTS 高性能数据批处理方案 TiDB_PingCAP tidb 分布式云原生数据库
过去，TiDB由于不支持存储过程、大事务的使用也存在一些限制，使得在TiDB上进行一些复杂的数据批量处理变得比较复杂。TiDB在面向这种超大规模数据的批处理场景，其能力也一直在演进，其复杂度也变得越来越低：○从TiDB5.0开始，TiFlash支持MPP并行计算能力，在大批量数据上进行聚合、关联的查询性能有了极大的提升○到了TiDB6.1版本，引入了BATCHDML(https://docs.pi
作业帮 x TiDB丨多元化海量数据业务的支撑 tidb
导读作业帮是一家成立于2015年的在线教育品牌，致力于用科技手段助力教育普惠。经过近十年的积累，作业帮运用人工智能、大数据等技术，为学生、老师、家长提供学习、教育解决方案，智能硬件产品等。随着公司产品和业务场景越来越丰富，数据量越来越大，业务方对数据库的使用需求也越来越多元化。本文介绍了作业帮对TiDB的探索历程，以及逐渐落地多个业务场景的使用实践。TiDB在作业帮的探索和推广作业帮内部最开始接触
TiDB 7.5.0 LTS 高性能数据批处理方案 tidb数据库
过去，TiDB由于不支持存储过程、大事务的使用也存在一些限制，使得在TiDB上进行一些复杂的数据批量处理变得比较复杂。TiDB在面向这种超大规模数据的批处理场景，其能力也一直在演进，其复杂度也变得越来越低：○从TiDB5.0开始，TiFlash支持MPP并行计算能力，在大批量数据上进行聚合、关联的查询性能有了极大的提升○到了TiDB6.1版本，引入了BATCHDML(https://docs.pi
JeecgBoot集成TiDB，打造高效可靠的数据存储解决方案
TiDB简介TiDB是PingCAP公司自主设计、研发的开源分布式关系型数据库，同时支持在线事务处理与在线分析处理(HybridTransactionalandAnalyticalProcessing,HTAP)的融合型分布式数据库产品，具备水平扩容或者缩容、金融级高可用、实时HTAP、云原生的分布式数据库、兼容MySQL5.7协议和MySQL生态等重要特性。TIDB安装部署TiDB是一个分布式系
读TiDB源码聊设计：浅析HTAP的SQL优化器 tidbgo性能优化分布式系统
版本日期备注1.02024.2.18文章首发本文的的源码分析全部基于TiDB6.5来做分析。1.引子如果让你做一个分布式数据库的优化器，面对以下的SQL，你会想到什么好的方法去执行他们呢？SELECTid,nameFROMpersonWHEREage>=18orheight>180limit100;：从条件上看，我们看到条件其实是二选一的：age>=18orheight>180。基于这种情况，我们
使用 Coze 搭建 TiDB 助手 tidb数据库
导读本文介绍了使用Coze平台搭建TiDB文档助手的过程。通过比较不同AIBot平台，突出了Coze在插件能力和易用性方面的优势。文章深入讨论了实现原理，包括知识库、functioncall、embedding模型等关键概念，最后成功演示了如何在Coze平台上快速创建TiDBHelpBot。本文作者Weaxs，TiDB社区布道师。引言目前市面上有很多搭建AIBot的平台和应用，开源的有langch
从 20 多套 MySQL 到 1 套 TiDB丨骏伯网络综合运营管理平台应用实践 tidb数据库
导读骏伯网络是一家聚焦移动互联网营销服务的公司，综合运营管理平台是其核心业务系统，包括营销系统、订单、支付以及与外部系统的交互服务接口。为满足多元化的业务发展需求，降低系统间交互链路的复杂性，提升业务连续性，以及实现降本增效的整体规划，骏伯网络选择将TiDB作为综合运营管理平台的底层数据库。经过上线实践证明，TiDB为骏伯在业务连续性、性能提升、数据资源整合、降本增效等方面带来了显著价值。未来，骏
一篇文章彻底搞懂 TiDB 集群各种容量计算方式 tidb数据库
作者丨hey-hoho来自神州数码钛合金战队神州数码钛合金战队是一支致力于为企业提供分布式数据库TiDB整体解决方案的专业技术团队。团队成员拥有丰富的数据库从业背景，全部拥有TiDB高级资格证书，并活跃于TiDB开源社区，是官方认证合作伙伴。目前已为10+客户提供了专业的TiDB交付服务，涵盖金融、证券、物流、电力、政府、零售等重点行业。背景TiDB集群的监控面板里面有两个非常重要、且非常常用的指
TiDB in 2023，一次简单的回顾丨PingCAP 唐刘 TiDB_PingCAP 开源分布式数据库 TiDB tidb
2023年已经过去，TiDB经过了一年的迭代，又往前进步了一点点，我们非常自豪的看到，TiDB正在不断地帮助我们的客户成功，包括但不限于：○首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB×杭州银行○国产数据库的珠穆朗玛峰，到底在哪里？○ScalingTiDBTo1MillionQPS(https://blog.flipkart.tech/scaling-tidb-to-1-mil
TiDB 在医疗保障信息平台的应用实践 TiDB_PingCAP tidb 开源分布式数据库 TiDB
文章介绍了TiDB在医疗保障信息平台中的应用。东软医保云应用管理平台通过与TiDB联合，成功满足了医疗保障业务中高并发、实时性和复杂查询的要求。在某地市医疗保障信息平台的实践中，TiDB分布式数据库有效实现了在线交易和实时分析服务，日均QPS达22,000，总数据量接近30TB，降低了系统开发和维护成本，推动医疗保障信息平台的数字化和智能化发展。医疗保障信息平台简介医疗保障信息平台是涉及国计民生的
首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行 tidb银行卡云原生分布式全栈
日前，杭州银行新一代核心业务系统成功投产上线。新核心系统是业内首个实际投产的云原生、分布式、全栈国产化的银行核心系统，是金融科技领域突破关键核心技术应用的重大实践。新核心系统自上线以来运行安全稳定，大幅提升了业务处理效率，已支撑日均交易量1000+万笔，平均交易耗时小于100毫秒，较原核心业务系统缩减54%，日终跑批的处理速度为原核心业务系统的2.1倍，能够有效支撑未来业务的快速发展。标志着杭州银
TiDB 在医疗保障信息平台的应用实践 tidb医疗it数据库信息技术
文章介绍了TiDB在医疗保障信息平台中的应用。东软医保云应用管理平台通过与TiDB联合，成功满足了医疗保障业务中高并发、实时性和复杂查询的要求。在某地市医疗保障信息平台的实践中，TiDB分布式数据库有效实现了在线交易和实时分析服务，日均QPS达22,000，总数据量接近30TB，降低了系统开发和维护成本，推动医疗保障信息平台的数字化和智能化发展。医疗保障信息平台简介医疗保障信息平台是涉及国计民生的
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本