TiDB介绍

文章目录

- 数据库技术发展简史
- 从MySQL到TiDB
- - 场景引入
  - 问题分析
  - 问题解决
  - 总结
- TiDB概述
- 扩展
- - 数据管理技术发展阶段
  - 数据库模型发展阶段
  - SQL，NoSQL，NewSQL
  - OLTP和OLAP
  - TiDB怎么诞生的?

数据库技术发展简史

数据库技术产生于20世纪60年代末70年代初，其主要主要研究 如何存储，使用和管理数据 。随着计算机硬件和软件的发展，数据库技术也不断地发展。数据库技术在理论研究和系统开发上都取得了辉煌的成就。

从数据管理的角度看，数据库技术到目前共经历了如下三个阶段：

人工管理阶段-数据量小独立,用户直接管理
文件系统阶段-使用文件存取数据,冗余度高,管理维护难
数据库系统阶段-专门的数据库软件系统管理数据,高效方便,易于共享维护

按照数据模型发展的主线，数据库技术的形成过程和发展可分为如下三个阶段：

层次和网状数据库管理系统-可以理解为使用指针来表示数据之间的联系
关系数据库管理系统(RDBMS)-可以理解为理解为使用二维表来表示维护数据间的关系
新一代数据库技术的研究和发展-针对关系型数据库存在数据模型，性能，扩展性，伸缩性等方面的缺点，出现了：
ORDBMS:面向对象数据库技术。如：PostGreSQL
NoSQL:非结构化数据库技术。如
1):键值存储数据库：Redis
2):列式储数数据库：HBase
3):文档型数据库：MongoDB
4):图形数据库：Neo4J

NewSQL:这类数据库不仅具有NoSQL对海量数据的存储管理能力，还保持了传统数据库支持ACID和SQL等特性。如：TiDB

从MySQL到TiDB

如今的数据库种类繁多，RDBMS（关系型数据库）、NoSQL（Not Only SQL）、NewSQL，在数据库领域均有一席之地，可谓百家争鸣之势。那么我们为什么要学习使用TiDB呢？接下来就从我们最熟悉的MySQL的使用说起！

场景引入

假设现在有一个高速发展的互联网公司,核心业务库MySQL的数据量已经近 亿 行,且还在 不断增长中,公司对于数据资产较为重视,所有数据要求 多副本保存至少5年,且除了有对历史数据进行统计分析的 离线 报表业务外,还有一些针对用户数据 实时查询 的需求,如用户历史订单实时查询。

问题分析

1. MySQL能否满足上述场景需求?

根据以往的MySQL使用经验，MySQL单表在 5000 万行以内时，性能较好，单表超过5000万行后，数据库性能、可维护性都会极剧下降。当然这时候可以做MySQL分库分表,如使用Mycat或Sharding-jdbc

2. 分库分表的能否解决问题?

分库分表的优点非常明显，如：
将大表拆分成小表，单表数据量控制在 5000 万行以内，使 MySQL 性能稳定可控。
将单张大表拆分成小表后，能水平扩展，通过部署到多台服务器，提升整个集群的 QPS、TPS、Latency 等数据库服务指标。

但是，此方案的缺点也非常明显：
分表跨实例后，产生分布式事务管理难题，一旦数据库服务器宕机，有事务不一致风险。
分表后，对 SQL 语句有一定限制，对业务方功能需求大打折扣。尤其对于实时报表统计类需求，限制非常之大。事实上，报表大多都是提供给高层领导使用的，其重要性不言而喻。
分表后，需要维护的对象呈指数增长（MySQL实例数、需要执行的 SQL 变更数量等）。

问题解决

基于以上核心痛点，我们需要探索新的数据库技术方案来应对业务 爆发式增长 所带来的挑战，为业务提供更好的数据库服务支撑。

调研市场上的各大数据库,我们可以考虑选用NewSQL技术来解决,因为NewSQL技术有如下显著特点:

无限水平扩展能力
分布式强一致性，确保数据 100% 安全
完整的分布式事务处理能力与 ACID 特性

而TiDB数据库 GitHub的活跃度及社区贡献者方面都可以算得上是国际化的开源项目,是NewSQL技术中的代表性产品,所以我们可以选择使用TiDB数据库!

总结

传统关系型数据库历史比较久，目前RDBMS的代表为Oracle、MySQL、PostgreSQL，在数据库领域也是“辈份”比较高的，其广泛应用在各行各业，RDBMS大多为本地存储或共享存储。

但是此类数据库存在着一些问题，如自身容量的限制。随着业务量不断增加，容量渐渐成为瓶颈，此时DBA会通过多次的库表sharding，以此来缓解容量问题。大量的分库分表，不仅耗费了大量人力，还使得业务访问数据库的路由逻辑变得复杂。除此之外，RDBMS伸缩性比较差，通常集群扩容缩容成本较高，且不满足分布式的事务。

NoSQL类数据库的代表为Hbase、Redis、MongoDB、Cassandra等，这类数据库解决了 RDBMS伸缩性差的问题，集群容量扩容变得方便很多，但是由于存储方式为多个KV存储，所以对SQL的兼容性就大打折扣。对于NoSQL类数据库来说，只能满足部分分布式事务的特点。

NewSQL领域的代表是Google的spanner和F1，其号称可以实现全球数据中心容灾，且完全满足分布式事务的ACID，但是只能在Google云上使用。

TiDB诞生在大背景下，也弥补了国内在NewSQL领域中的空缺。TiDB自2015年5月写下第一行代码以来，至今已发布大小版本几十次，版本迭代十分迅速。

TiDB概述

官网：https://pingcap.com/index.html

TiDB可以理解为是MySQL的加强版/分布式MySQL/MySQLPlus

TiDB 是 PingCAP 公司设计的开源分布式 HTAP (Hybrid Transactional and Analytical Processing) 数据库，结合了传统的 RDBMS 和 NoSQL 的最佳特性。TiDB 兼容 MySQL，支持无限的水平扩展，具备强一致性和高可用性。TiDB 的目标是为 OLTP (Online Transactional Processing) 和 OLAP (Online Analytical Processing) 场景提供一站式的解决方案。

TiDB数据库具备「分布式强一致性事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活」等核心特性，是大数据时代理想的数据库集群和云数据库解决方案。目前，已被近 1000 家不同行业的领先企业应用在实际生产环境，涉及互联网、游戏、银行、保险、证券、航空、制造业、电信、新零售、政府等多个行业，包括美国、欧洲、日本、东南亚等海外用户。

TiDB 的设计目标是 100% 的 OLTP 场景和 80% 的 OLAP 场景，更复杂的 OLAP 分析可以通过 TiSpark 项目来完成。

TiDB 对业务没有任何侵入性，能优雅的替换传统的数据库中间件、数据库分库分表等 Sharding 方案。同时它也让开发运维人员不用关注数据库 Scale 的细节问题，专注于业务开发，极大的提升研发的生产力。

扩展

数据管理技术发展阶段

1、人工管理阶段

20世纪50年代以前，计算机主要用于数值计算.从当时的硬件看，外存只有纸带，卡片，磁带，没有直接存取设备；从软件看（实际上，当时还未形成软件的整体概念），没有操作系统以及管理数据的软件；从数据看，数据量小，数据无结构，由用户直接管理，且数据间缺乏逻辑组织，数据依赖于特定的应用程序，缺乏独立性。

2、文件系统阶段

50年代后期到60年代中期，出现了磁鼓，磁盘等数据存储设备.新的数据处理系统迅速发展起来.这种数据处理系统是把计算机中的数据组织成相互独立的数据文件，系统可以按照文件的名称对其进行访问，对文件中的记录进行存取，并可以实现对文件的修改，插入和删除，这就是文件系统.文件系统实现了记录内的结构化,即给出了记录内各种数据间的关系.但是，文件从整体来看却是无结构的.其数据面向特定的应用程序，因此数据共享性差，且冗余度大，管理和维护的代价也很大。

3、数据库系统阶段

60年代后期，出现了数据库这样的数据管理技术.数据库的特点是数据不再只针对某一特定应用，而是面向全组织，具有整体的结构性，共享性高，冗余度小，具有一定的程序与数据间的独立性，并且实现了对数据进行统一的控制。

数据库模型发展阶段

1、第一代数据库系统层次和网状数据库管理系统

层次和网状数据库的代表产品是IBM公司在1969年研制出的层次模型数据库管理系统。层次数据库是数据库系统的先驱，而网状数据库则是数据库概念、方法、技术的奠基。

2、第二代数据库系统关系数据库管理系统(RDBMS)

1970年，IBM公司的研究员E.F.Codd在题为《大型共享数据库数据的关系模型》的论文中提出了数据库的关系模型，为关系数据库技术奠定了理论基础。到了80年代，几乎所有新开发的数据库系统都是关系型的。真正使得关系数据库技术实用化的关键人物是James Gray。Gray在解决如何保障数据的完整性、安全性、并发性以及数据库的故障恢复能力等重大技术问题方面发挥了关键作用。关系数据库系统的出现，促进了数据库的小型化和普及化，使得在微型机上配置数据库系统成为可能。

3、新一代数据库技术的研究和发展

目前已从多方面发展了现行的数据库系统技术。我们可以从数据模型、新技术内容、应用领域三个方面概括新一代数据库系统的发展。

(1) 面向对象的方法和技术对数据库发展的影响最为深远
80年代，面向对象的方法和技术的出现，对计算机各个领域，包括程序设计语言、软件工程、信息系统设计以及计算机硬件设备等都产生了深远的影响，也给面临新挑战的数据库技术带来了新的机遇和希望。数据库研究人员借鉴和吸收了面向对象的方法和技术，提出了面向对象的数据库模型(简称对象模型)。当前有许多研究是建立在数据库已有的成果和技术上的，针对不同的应用，对传统的DBMS，主要是RDBMS进行不同层次上的扩充，例如建立对象关系(OR)模型和建立对象关系数据库(ORDB)。

(2) 数据库技术与多学科技术的有机结合
数据库技术与多学科技术的有机结合是当前数据库发展的重要特征。计算机领域中其他新兴技术的发展对数据库技术产生了重大影响。传统的数据库技术和其他计算机技术的结合、互相渗透，使数据库中新的技术内容层出不穷。数据库的许多概念、技术内容、应用领域，甚至某些原理都有了重大的发展和变化。建立和实现了一系列新型的数据库，如分布式数据库、并行数据库、演绎数据库、知识库、多媒体库、移动数据库等，它们共同构成了数据库大家族。

(3) 面向专门应用领域的数据库技术的研究
为了适应数据库应用多元化的要求，在传统数据库基础上，结合各个专门应用领域的特点，研究适合该应用领域的数据库技术，如工程数据库、统计数据库、科学数据库、空间数据库、地理数据库、Web数据库等，这是当前数据库技术发展的又一重要特征。同时，数据库系统结构也由主机/终端的集中式结构发展到网络环境的分布式结构，随后又发展成两层、三层或多层客户/服务器结构以及Internet环境下的浏览器/服务器和移动环境下的动态结构。多种数据库结构满足了不同应用的需求，适应了不同的应用环境。

SQL，NoSQL，NewSQL

1、关系型数据库(RDBMS,即SQL数据库)

商业软件： Oracle，DB2
开源软件：MySQL，PostgreSQL
单机版本已经很难满足海量数据的需求

2、NoSQL

NoSQL = Not Only SQL，意即“不仅仅是SQL，提倡运用非关系型的数据存储
普遍选择牺牲掉复杂 SQL 的支持及 ACID 事务换取弹性扩展能力
通常不保证强一致性的(支持最终一致)

主要分类

键值（Key-Value）数据库：如 MemcacheDB，Redis

文档存储：如 MongoDB

列存储：方便存储结构化和半结构化数据，并做数据压缩，对某几列的查询有非常大的IO优势：如 HBase，Cassandra

图数据库：存储图关系(注意：不是图片)。如 Neo4J

3、NewSQL

针对OLTP的读写，提供与NOSQL相同的可扩展性和性能，同时能支持满足ACID特性的事务，即保持NoSQL的高可扩展和高性能，并且保持关系模型

为什么需要NewSQL

NoSQL 不能完全取代 RDBMS

单机RDBMS 无法满足性能需求

使用“单机RDBMS + 中间件”方式，在中间件层很难解决分布式事务、高可用问题

NewSQL设计架构

可以基于全新的数据库平台，也可以基于现有的SQL引擎优化。

无共享存储(MPP架构)是比较常见的架构

基于多副本实现高可用和容灾

分布式查询

数据Sharding机制

通过2PC，Paxos/Raft等协议实现数据一致

代表产品

Google Spanner

OceanBase

TiDB

OLTP和OLAP

OLTP

强调支持短时间内大量并发的事务操作（增删改查）能力，每个操作涉及的数据量都很小（比如几十到几百字节）
强调事务的强一致性（想想银行转账交易，容不得差错）
举例：“双十一”期间，可能有几十万用户在同一秒内下订单。后台数据库要能够并发的、以近乎实时的速度处理这些订单请求（如果下了订单，十几分钟还没有反应，用户肯定要骂人了）

OLAP
偏向于复杂的只读查询，读取海量数据进行分析计算，查询时间往往很长
举例：“双十一”结束，淘宝的运营人员对订单进行分析挖掘，找出一些市场规律等等。
这种分析可能需要读取所有的历史订单进行计算，耗时几十秒甚至几十分钟都有可能。

代表产品
-Greenplum
-TeraData
-阿里 AnalyticDB

TiDB怎么诞生的?

著名的开源分布式缓存服务 Codis 的作者，PingCAP联合创始人& CTO ，资深 infrastructure 工程师的黄东旭，擅长分布式存储系统的设计与实现，开源狂热分子的技术大神级别人物。即使在互联网如此繁荣的今天，在数据库这片边界模糊且不确定地带，他还在努力寻找确定性的实践方向。

2012 年底，他看到 Google 发布的两篇论文，如同棱镜般，折射出他自己内心微烁的光彩。这两篇论文描述了 Google 内部使用的一个海量关系型数据F1/Spanner，解决了关系型数据库、弹性扩展以及全球分布的问题，并在生产中大规模使用。“如果这个能实现，对数据存储领域来说将是颠覆性的”，黄东旭为完美方案的出现而兴奋， PingCAP 的 TiDB 在此基础上诞生了。

2020年10月国产数据库排行：GoldenDB跃升异军突起 PolarDB和GaussDB云化融合数据和云微软 informix 分布式存储 microsoft cloudera
墨墨导读：2020年10月国产数据库流行度的前三位由TiDB、达梦数据库、GBase（南大通用）获得，其中TiDB以超过100分的优势领先第二位的达梦数据库。数据技术嘉年华，十周年盛大开启，点我立即报名！大会以“自研·智能·新基建——云和数据促创新生态融合新十年”为主题，相邀数据英雄，总结过往十年历程与成绩，展望未来十年趋势与目标！近60场演讲，大咖云集，李飞飞、苏光牛、林晓斌、黄东旭...，快来
TiDB数据库傲雪凌霜，松柏长青后端 tidb 数据库
TiDB是由PingCAP开发的开源分布式SQL数据库，设计初衷是为了解决传统单机关系型数据库在处理大规模数据和高并发事务时的扩展性和性能问题。它结合了传统关系型数据库（如MySQL）的易用性和分布式系统的扩展能力，属于新一代的分布式SQL数据库。TiDB的关键特性兼容MySQL协议：TiDB兼容MySQL协议，用户可以直接使用MySQL客户端或MySQL的各种生态工具（如MySQLWorkben
HTAP 深入探索指南每天读点书学堂大数据数据库数据库开发
本指南介绍如何进一步探索并使用TiDB在线事务与在线分析处理(HybridTransactionalandAnalyticalProcessing,HTAP)功能。注意如果你对TiDBHTAP功能还不太了解，希望快速试用体验，请参阅快速上手HTAP。要快速了解TiDB在HTAP场景下的体系架构与HTAP的适用场景，建议先观看下面的培训视频（时长15分钟）。注意本视频只作为学习参考，如需了解详细的H
TiDB备份与恢复简介每天读点书学堂大数据数据库架构数据库数据库开发运维
本文档介绍如何对Kubernetes上的TiDB集群进行数据备份和数据恢复。备份与恢复中所使用的工具有Dumpling、TiDBLightning和BR。Dumpling是一个数据导出工具，该工具可以把存储在TiDB/MySQL中的数据导出为SQL或者CSV格式，可以用于完成逻辑上的全量备份或者导出。TiDBLightning是一个数据导入工具，该工具可以把Dumpling或CSV输出格式的数据快
等保2.0--安全计算环境--TiDB数据库魔同等保测评安全 tidb 数据库
在使用本博客提供的学习笔记及相关内容时，请注意以下免责声明：信息准确性：本博客的内容是基于作者的个人理解和经验，尽力确保信息的准确性和时效性，但不保证所有信息都完全正确或最新。非专业建议：博客中的内容仅供参考，不能替代专业人士的意见和建议。在做出任何重要决定之前，请咨询相关领域的专业人士。个人责任：使用本博客内容的风险由用户自行承担。作者不对因使用本博客内容而导致的任何直接或间接损失承担责任。版权
窥一斑而知全豹薛晓刚数据库
说几个DTCC大会的插曲由于经济形势的不好，我看参展商少了一点。可能不少都是为了生计而挣扎。2023年1月明叔主持的栏目有一期特别节目《数据库诸神之战》，请来了OB、TiDB、TDSQL和TDEngine的掌门人来讨论数据库的未来，那时候结论是3年后国内健康运营的数据库公司不超过30家。目前已经快过去2年了。现在日子的确越来越难过了。现实可能和预测差不多。从出版社少到图书劵少每次大会都有各家出版社
开源项目精选：Bookshop Demo - 您的云端书店解决方案毛彤影
开源项目精选：BookshopDemo-您的云端书店解决方案tidb-prisma-vercel-demoVirtualonlinebookstoreapplicationdemowhichyoucanfindbooksofvariouscategoriesandratethebooks.项目地址:https://gitcode.com/gh_mirrors/ti/tidb-prisma-verc
OLAP和OLTP以及HTAP的区别霸王龙的日常数据库概念数据库数据仓库
数据处理一般可以分成两大类：OLAP和OLTP那么有没有一种情况，将OLTP和OLAP相融合，在同一个系统中同时提供这两种服务，答案是有的。即HTAP产品。在这方面，国内的数据库厂商PingCAP的TiDB就不错。还有华为的GaussDB(openGauss)也对外公布六大关键技术特性其中之一就是高度支持HTAP混合负载。什么是OLAP？联机分析处理OLAP（OnLineAnalyticalPro
【数据库】GaussDB 一起学架构数据库数据库
目录一、GaussDB是什么数据库？二、GaussDB与Tidb、OcceanBase数据库的差别有哪些三、GaussDB的整体架构是怎么样的？四、GaussDB的核心技术特点是什么？五、GaussDB的适用场景有哪些？六、GaussDB在不同场景的一些最佳实践案例七、GaussDB性能优化技巧八、GaussDB使用的注意事项一、GaussDB是什么数据库？Gauss数据库是基于PostgreSQ
MYSQL的读写扩展 hailang86 mysql 数据库
1.分布式数据库有很多种：采用分库分表方式将数据路由拆分到多个数据库上；以greenplum未代表的mpp数据库架构；以tidb为代表的newSQl数据库架构。2.mpp数据架构是一种处理大规模数据分析任务的分布式数据架构，大规模并行处理。当执行一条SQL语句时，会将语句发送到所有数据节点进行查询处理，利用多节点的计算能力进行计算。3.分库分表主要用于简单的业务场景，OLTP场景，onlinetr
MySQL8.3 可以给 GTID 打标签了！ mysqlgtid事务
本文介绍了MySQL8.3的一个新特性，给GTID打标签~作者：李富强，爱可生DBA团队成员，熟悉MySQL，TiDB，OceanBase等数据库。相信持续把对的事情做好一点，会有不一样的收获。爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。本文约900字，预计阅读需要3分钟。摘要MySQL8.3创新版于2024年1月16号发布，该版本扩展了MySQL复制和组复制中使用
读TiDB源码聊设计：浅析HTAP的SQL优化器 tidbgo性能优化分布式系统
版本日期备注1.02024.2.18文章首发本文的的源码分析全部基于TiDB6.5来做分析。1.引子如果让你做一个分布式数据库的优化器，面对以下的SQL，你会想到什么好的方法去执行他们呢？SELECTid,nameFROMpersonWHEREage>=18orheight>180limit100;：从条件上看，我们看到条件其实是二选一的：age>=18orheight>180。基于这种情况，我们
从 20 多套 MySQL 到 1 套 TiDB丨骏伯网络综合运营管理平台应用实践 TiDB_PingCAP tidb 分布式云原生数据库 TiDB
导读骏伯网络是一家聚焦移动互联网营销服务的公司，综合运营管理平台是其核心业务系统，包括营销系统、订单、支付以及与外部系统的交互服务接口。为满足多元化的业务发展需求，降低系统间交互链路的复杂性，提升业务连续性，以及实现降本增效的整体规划，骏伯网络选择将TiDB作为综合运营管理平台的底层数据库。经过上线实践证明，TiDB为骏伯在业务连续性、性能提升、数据资源整合、降本增效等方面带来了显著价值。未来，骏
通过 Prometheus 编写 TiDB 巡检脚本（脚本已开源，内附链接） TiDB_PingCAP prometheus tidb 开源分布式云原生数据库
作者丨caiyfc来自神州数码钛合金战队神州数码钛合金战队是一支致力于为企业提供分布式数据库TiDB整体解决方案的专业技术团队。团队成员拥有丰富的数据库从业背景，全部拥有TiDB高级资格证书，并活跃于TiDB开源社区，是官方认证合作伙伴。目前已为10+客户提供了专业的TiDB交付服务，涵盖金融、证券、物流、电力、政府、零售等重点行业。背景笔者最近在驻场，发现这里的tidb集群是真的多，有将近150
使用 Coze 搭建 TiDB 助手 TiDB_PingCAP 数据库开源分布式 TiDB tidb
导读本文介绍了使用Coze平台搭建TiDB文档助手的过程。通过比较不同AIBot平台，突出了Coze在插件能力和易用性方面的优势。文章深入讨论了实现原理，包括知识库、functioncall、embedding模型等关键概念，最后成功演示了如何在Coze平台上快速创建TiDBHelpBot。本文作者Weaxs，TiDB社区布道师。引言目前市面上有很多搭建AIBot的平台和应用，开源的有langch
一篇文章彻底搞懂 TiDB 集群各种容量计算方式 TiDB_PingCAP 数据库 tidb TiDB 云原生开源
作者丨hey-hoho来自神州数码钛合金战队神州数码钛合金战队是一支致力于为企业提供分布式数据库TiDB整体解决方案的专业技术团队。团队成员拥有丰富的数据库从业背景，全部拥有TiDB高级资格证书，并活跃于TiDB开源社区，是官方认证合作伙伴。目前已为10+客户提供了专业的TiDB交付服务，涵盖金融、证券、物流、电力、政府、零售等重点行业。背景TiDB集群的监控面板里面有两个非常重要、且非常常用的指
“分布式透明化”在杭州银行核心系统上线之思考 TiDB_PingCAP 分布式云原生 tidb 数据库银行
导读随着金融行业数字化转型的需求，银行核心系统的升级改造成为重要议题。杭州银行成功上线以TiDB为底层数据库的新一代核心业务系统，该实践采用应用与基础设施解耦、分布式透明化的设计开发理念，推动银行核心系统的整体升级。本文聚焦银行核心系统演进，结合TiDB在杭州银行新一代核心的实践，深入解析“分布式透明化”理念，希望能为同行业的转型升级提供参考。本文作者：韩锋，CCIA（中国计算机协会）常务理事，前
作业帮 x TiDB丨多元化海量数据业务的支撑 TiDB_PingCAP 数据库 tidb TiDB 云原生开源
导读作业帮是一家成立于2015年的在线教育品牌，致力于用科技手段助力教育普惠。经过近十年的积累，作业帮运用人工智能、大数据等技术，为学生、老师、家长提供学习、教育解决方案，智能硬件产品等。随着公司产品和业务场景越来越丰富，数据量越来越大，业务方对数据库的使用需求也越来越多元化。本文介绍了作业帮对TiDB的探索历程，以及逐渐落地多个业务场景的使用实践。TiDB在作业帮的探索和推广作业帮内部最开始接触
TiDB 7.5.0 LTS 高性能数据批处理方案 TiDB_PingCAP tidb 分布式云原生数据库
过去，TiDB由于不支持存储过程、大事务的使用也存在一些限制，使得在TiDB上进行一些复杂的数据批量处理变得比较复杂。TiDB在面向这种超大规模数据的批处理场景，其能力也一直在演进，其复杂度也变得越来越低：○从TiDB5.0开始，TiFlash支持MPP并行计算能力，在大批量数据上进行聚合、关联的查询性能有了极大的提升○到了TiDB6.1版本，引入了BATCHDML(https://docs.pi
作业帮 x TiDB丨多元化海量数据业务的支撑 tidb
导读作业帮是一家成立于2015年的在线教育品牌，致力于用科技手段助力教育普惠。经过近十年的积累，作业帮运用人工智能、大数据等技术，为学生、老师、家长提供学习、教育解决方案，智能硬件产品等。随着公司产品和业务场景越来越丰富，数据量越来越大，业务方对数据库的使用需求也越来越多元化。本文介绍了作业帮对TiDB的探索历程，以及逐渐落地多个业务场景的使用实践。TiDB在作业帮的探索和推广作业帮内部最开始接触
TiDB 7.5.0 LTS 高性能数据批处理方案 tidb数据库
过去，TiDB由于不支持存储过程、大事务的使用也存在一些限制，使得在TiDB上进行一些复杂的数据批量处理变得比较复杂。TiDB在面向这种超大规模数据的批处理场景，其能力也一直在演进，其复杂度也变得越来越低：○从TiDB5.0开始，TiFlash支持MPP并行计算能力，在大批量数据上进行聚合、关联的查询性能有了极大的提升○到了TiDB6.1版本，引入了BATCHDML(https://docs.pi
JeecgBoot集成TiDB，打造高效可靠的数据存储解决方案
TiDB简介TiDB是PingCAP公司自主设计、研发的开源分布式关系型数据库，同时支持在线事务处理与在线分析处理(HybridTransactionalandAnalyticalProcessing,HTAP)的融合型分布式数据库产品，具备水平扩容或者缩容、金融级高可用、实时HTAP、云原生的分布式数据库、兼容MySQL5.7协议和MySQL生态等重要特性。TIDB安装部署TiDB是一个分布式系
读TiDB源码聊设计：浅析HTAP的SQL优化器 tidbgo性能优化分布式系统
版本日期备注1.02024.2.18文章首发本文的的源码分析全部基于TiDB6.5来做分析。1.引子如果让你做一个分布式数据库的优化器，面对以下的SQL，你会想到什么好的方法去执行他们呢？SELECTid,nameFROMpersonWHEREage>=18orheight>180limit100;：从条件上看，我们看到条件其实是二选一的：age>=18orheight>180。基于这种情况，我们
使用 Coze 搭建 TiDB 助手 tidb数据库
导读本文介绍了使用Coze平台搭建TiDB文档助手的过程。通过比较不同AIBot平台，突出了Coze在插件能力和易用性方面的优势。文章深入讨论了实现原理，包括知识库、functioncall、embedding模型等关键概念，最后成功演示了如何在Coze平台上快速创建TiDBHelpBot。本文作者Weaxs，TiDB社区布道师。引言目前市面上有很多搭建AIBot的平台和应用，开源的有langch
从 20 多套 MySQL 到 1 套 TiDB丨骏伯网络综合运营管理平台应用实践 tidb数据库
导读骏伯网络是一家聚焦移动互联网营销服务的公司，综合运营管理平台是其核心业务系统，包括营销系统、订单、支付以及与外部系统的交互服务接口。为满足多元化的业务发展需求，降低系统间交互链路的复杂性，提升业务连续性，以及实现降本增效的整体规划，骏伯网络选择将TiDB作为综合运营管理平台的底层数据库。经过上线实践证明，TiDB为骏伯在业务连续性、性能提升、数据资源整合、降本增效等方面带来了显著价值。未来，骏
一篇文章彻底搞懂 TiDB 集群各种容量计算方式 tidb数据库
作者丨hey-hoho来自神州数码钛合金战队神州数码钛合金战队是一支致力于为企业提供分布式数据库TiDB整体解决方案的专业技术团队。团队成员拥有丰富的数据库从业背景，全部拥有TiDB高级资格证书，并活跃于TiDB开源社区，是官方认证合作伙伴。目前已为10+客户提供了专业的TiDB交付服务，涵盖金融、证券、物流、电力、政府、零售等重点行业。背景TiDB集群的监控面板里面有两个非常重要、且非常常用的指
TiDB in 2023，一次简单的回顾丨PingCAP 唐刘 TiDB_PingCAP 开源分布式数据库 TiDB tidb
2023年已经过去，TiDB经过了一年的迭代，又往前进步了一点点，我们非常自豪的看到，TiDB正在不断地帮助我们的客户成功，包括但不限于：○首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB×杭州银行○国产数据库的珠穆朗玛峰，到底在哪里？○ScalingTiDBTo1MillionQPS(https://blog.flipkart.tech/scaling-tidb-to-1-mil
TiDB 在医疗保障信息平台的应用实践 TiDB_PingCAP tidb 开源分布式数据库 TiDB
文章介绍了TiDB在医疗保障信息平台中的应用。东软医保云应用管理平台通过与TiDB联合，成功满足了医疗保障业务中高并发、实时性和复杂查询的要求。在某地市医疗保障信息平台的实践中，TiDB分布式数据库有效实现了在线交易和实时分析服务，日均QPS达22,000，总数据量接近30TB，降低了系统开发和维护成本，推动医疗保障信息平台的数字化和智能化发展。医疗保障信息平台简介医疗保障信息平台是涉及国计民生的
首个云原生、分布式、全栈国产化银行核心业务系统投产上线丨TiDB × 杭州银行 tidb银行卡云原生分布式全栈
日前，杭州银行新一代核心业务系统成功投产上线。新核心系统是业内首个实际投产的云原生、分布式、全栈国产化的银行核心系统，是金融科技领域突破关键核心技术应用的重大实践。新核心系统自上线以来运行安全稳定，大幅提升了业务处理效率，已支撑日均交易量1000+万笔，平均交易耗时小于100毫秒，较原核心业务系统缩减54%，日终跑批的处理速度为原核心业务系统的2.1倍，能够有效支撑未来业务的快速发展。标志着杭州银
TiDB 在医疗保障信息平台的应用实践 tidb医疗it数据库信息技术
文章介绍了TiDB在医疗保障信息平台中的应用。东软医保云应用管理平台通过与TiDB联合，成功满足了医疗保障业务中高并发、实时性和复杂查询的要求。在某地市医疗保障信息平台的实践中，TiDB分布式数据库有效实现了在线交易和实时分析服务，日均QPS达22,000，总数据量接近30TB，降低了系统开发和维护成本，推动医疗保障信息平台的数字化和智能化发展。医疗保障信息平台简介医疗保障信息平台是涉及国计民生的
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod