TiDB Server
·处理客户端的连接
·SQL语句的解析和编译
·关系数据库与KV的转化
·SQL语句的执行
·执行oline DDL
·垃圾回收
·热点小表缓存V6.0
TiKV
·数据持久化
·副本的强一致性和高可用性
·MVCC(多版本并发控制)
·分布式事务支持
·Coprocessor(算子下推)
Placement Driver
·整个集群TiKV的元数据存储
·分配全局ID和事务ID
·生成全局时间戳TSO
·收集集群信息进行调度
·提供label,支持高可用
·提供TiDBi Dashboard 服务
TiFlash
·异步复制
·一致性
·列式存储提高分许查询效率
·业务隔离
·智能选择
热点小表缓存
·表的数据量不大
·只读表或者修改不频繁的表
·表的访问很频繁
热点小表缓存应用
·TiDB对于每张缓存表的大小限制为64MB
·适用于查询频繁、数据量不大、极少修改的场景
·在租约到期(tidb_table_cache_lease)时间内,写操作会被阻塞
·在租约到期(tidb_table_cache_lease)时,读性能会下降
·不支持直接对缓存表做DDL操作,需要先关闭
·对于表加载较慢或者极少修改的表,可以适当延长tidb_table_cache_lease保持读性能稳定
RocksDB
·RocksDB针对Flash存储进行优化,延迟极小,使用LSM存储引擎
·高性能的Key-Value数据库
·完善的持久化机制,同时保证性能和安全性
·良好的支持范围查询
·为需要存储TB级别数据到本地FLASH或RAM的应用服务器设计
·针对存储在高速设备的中小键值进行优化-可以存储在FLASH或者直接存储在内存
·性能随CPU数量线性提升,对多核系统友好
Raft日志复制
·Propose
·Append
·Replicate
·Append
·Committed
·Apply
HTAP技术
HTAP的要求
·可扩展性
·分布式事务
·分布式存储
·同时支持OLTP和OLAP
·同时支持行存和列存
·OLTP 与OLAP业务隔离
·实时性
·行存与列存数据实时同步
TiDB 的HTAP 特性
·行列混合
·行存(TiFlash)支持基于主键的实时更新
·TiFlash作为列存副本
·OLTP与OLAP业务隔离
·智能选择(CBO自动或者人工选择)
·MPP架构
MPP
·大量数据的join聚合查询
·所有MPP计算都在TiFlash节点内存中完成
·目前只支持等值连接
·Enforce_mpp帮助验证是否可以使用MPP
TiFlash主要功能
·异步复制
·一致性读取
·引擎智能选择
·计算加速
TiFlash(Learner)
·不参与Raft投票
·不参与Raft选举
·基于主键快速更新
Placement Rules in SQL 之后
·跨地域部署的集群,支持本地访问
·根据业务隔离资源
·按照业务等级配置资源和副本数
Placement Rules in SQL的应用
·精细化数据放置,控制本地访问与跨区域访问
·指定副本数,提高重要业务的可用性和数据可靠性
·将业务按照等级、资源需求或者数据生命周期进行隔离
·业务数据整合,降低运维成本与复杂度
内存悲观锁-应用
·减少事务的延时
·降低磁盘和网络带宽
·降低TiKV的CPU消耗
·锁丢失问题
Top SQL作用
·可视化地展示CPU开销最多的Top 5类SQL语句
·支持指定TiDB Server 及TiKV实例进行查询
·支持统计所有正在执行的SQL语句
·支持每秒请求数、平均延迟、查询计划等详细执行信息
TiDB Enterprise Manager(TiEM)功能
·一键部署集群&多套集群一站式管理
·集群原地升级
·参数管理
·克隆集群&主备集群切换
TiDB Cloud
·TiDB Cloud是一个功能齐全的数据库即服务或(DBaaS)
1. 存储引擎的的功能
2. LSM-tree 的特性
3. 数据库技术的发展
4. Google BigTable 解决的问题
5. 分布式存储引擎 TiKV 的特性
6. TiDB 的 MVCC
7. TiDB-Server 的后台功能
8. CAP 理论中的一致性和 ACID 的一致性的比较
9. TiDB 的哪个组件在 2018 年捐献给了 CNCF 基金会,并于 2020 年正式毕业
10. 列式存储引擎 TiFlash 采用了什么样的数据结构支持准实时更新
11. 下推计算
12. TiDB 集群在本地环境部署时用到的命令
13. 基于成本优化器的特点
14. TiDB-Server 对于 OLAP 查询会有的问题
15. 关于 TiDB 的 Region 的数据
16. 存储引擎的特定范畴
17. TiSpark 的特点
18. TiDB 技术架构的特点
19. CAP 理论
20. 哪个客户端可以进行 TiDB 的连接
21. 哪些 TiDB 的特性使得其可以支持数据中台
22. 关于 TiDB 的 MPP 结构
23. TiDB 分布式事务
24. TiDB 数据库在 HTAP 的技术方向上已经实现的功能
25. Placement Driver 的特性
26. HTAP
27. 随着硬件性能的提升,传统的计算与存储强耦合的方式有哪些弊端
28. 分布式技术的主要挑战
29. TiDB 的数据分片采用的技术
30. TiDB 数据库三层架构
31. NewSQL 技术目前可以认为是哪两种技术的组合
32. 关系型数据库四大特性
33. TiDB 事务支持
34. TiDB 数据库的两个比较重要的理论基础
35. TiDB-Server 连接
36. TiDB-Server 的特性
37. 传统的数据库分表分库中间件无法支持的特性
38. 关于 TiDB 数据扩展性
39. TiDB 的两地三中心容灾方案
40. 数据库技术发展的内在驱动
数据库分布式
下列功能是由 TiKV 或 TiFlash 实现的为?( 选 2 项 )BF
A. 根据集群中 Region 的信息,发出调度指令
B. 对于 OLAP 和 OLTP 进行业务隔离
C. 将关系型数据转化为 KV 存储进行持久化
D. 将 KV 存储转化为关系型数据返回给客户端
E. 配合 TiDB Server 生成事务的唯一 ID
F. 副本的高可用和一致性
关于 TiKV 或 TiDB Server,下列说法不正确的是?C
A. 数据被持久化在 TiKV 的 RocksDB 引擎中
B. 对于老版本数据的回收(GC),是由 TiDB Server在TiKV上完成的
C. 两阶段提交的锁信息被持久化到 TiDB Server 中
D.Region可以在多个TiKV节点上进行调度,但是需要PD节点发出调度指令
下列哪些模块直接与 TiDB 的事务处理有关?( 选 2 项 )AD
A. KV
B. Parse
C. Schema load
D. Transaction
E. GC
F. start job
关于关系型数据与 KV 的转化,下列说法不正确的是?C
A. 如果没有定义主键,key 中包含 RowID,Index ID 和 Table ID,都是 int64 类型
B. Table ID 在整个集群内唯一
C. 如果定义了主键,那么将使用主键作为 RowID
D. 不需要为每张表指定主键
下列属于 TiKV 相关功能的是?( 选 4 项 )ACDF
A. 系统参数和元数据信息的持久化
B. 产生 TSO
C. 分布式事务实现
D. MVCC
E. 生成物理执行计划
F. 表统计信息的持久化
关于 TiKV 数据持久化,下列说法不正确的是?C
A. RocksDB 有 2 个实例,分别用来持久化 raft log 和 key value 数据
B. RocksDB 中 WAL 用来保证写不丢失
C. 对于删除操作,只需要在原 key value 数据上标记已删除即可
D. RocksDB 中,除了 Level 0 层的数据,其他 Level 都是单一排序持久化的
下列关于 PD(Placement Driver)架构和功能正确的是?B
A. 访问 PD 集群中的任何一个节点都可以获得 TSO
B. TiKV 会周期性地向 PD 上报状态
C. PD 会周期性地查询 TiKV 的状态,不需要 TiKV 上报,目的是为了高效
D. PD 的调度功能只能平衡 region 的分布,无法对 leader 进行调度
关于 label ,下列说法不正确的是?C
A. label 的本质是个调度系统,可以人为控制 region 副本的存放位置
B. label 需要在 PD 和 TiKV 上进行配置
C. isolation-level 要和数据中心(DC)对应,这样可以获得最大的可用性
D. 如果某个 region 不可用,有可能造成整个 TiDB 数据库不可用
下列关于 DML 语句读写说法正确的是?( 选 2 项 )BD
A. Region Cache 的主要作用是缓存热数据,减少访问 TiKV 的次数
B. 二阶段提交在获取事务开始的 TSO 和提交的 TSO 时,都是由 TiDB Server 完成的
C. schedule 模块采用 latch 来控制当前正在写的数据不被读取
D. 在写操作中,锁信息也会被写入到 RocksDB KV 中
关于 DDL 语句的执行流程,下列说法正确的是?C
A. DDL 语句不可以在 TiDB 中并行执行
同一时刻,不可以有多条 DDL 语句在等待执行
C. 同一时刻,只有一个 TiDB Server 可以执行 DDL 语句
D. 等待执行的 DDL 语句被持久化在 TiDB Server 的存储中
下面属于 HTAP 场景特点的是?(请选择 3 项)CDE
A. 在故障恢复方面可以做到 RPO = 0
B. 支持分区特性
C. 支持在线业务高并发
D. 同时支持 OLTP 和 OLAP 业务
E. 能够读取到一致性的数据
关于 MPP 架构,下列说法不正确的是?B
A. MPP 架构的中间结果都在内存中
B. MPP 架构可以作用于 TiKV 和 TiFlash 上的数据
C. MPP 架构目前不支持非等值 join
D. MPP 架构可以对聚合、JOIN 等操作加速
下面属于 TiFlash 核心特性的是?(请选择 3 项)CDE
A. 采用行存 + 列存的混合存储方式
B. region 支持 raft 投票和选举
C. TiFlash 采用异步复制来保证和 TiKV 一致
D. 在 TiKV 上写入数据成功后,在 TiFlash 上可以一致性读取
E. CBO 基于成本选择在 TiFlash 或者 TiKV 上执行 SQL
关于 TiFlash 的使用,描述不正确的是?B
A. TiFlash 不善于处理高并发,QPS 一般不应过高
B. SQL 语句执行中,要不然数据完全从 TiKV 中读取,要不然完全从 TiFlash 中读取
C. MPP 中表连接前的过滤和交换完全是在 TiFlash 节点上完成的
D. 在读取 TiFlash 中数据的时候,我们需要通过 TiKV 中的数据确认一致性
对于 TiDB v6.0 新特性描述正确的为?(请选择 3 项)BDE
A. 小表缓存支持 DML 和 DDL 语句操作
B. 内存悲观锁功能可以起到降低网络带宽的作用
C. 当某个 TiKV 实例的 IO 过高,我们可以通过 Top SQL 监控到其上 IO 最高的 5 类 SQL 语句
D. TiDB Enterprise Manager(TiEM)可管理多套集群
E. 我们可以通过 Placement Rules in SQL 功能增加某些重要业务表的副本数.
下列哪些情况不适宜开启小表缓存?(请选择 2 项)AD
A. 表数据量小于 128 MB
B. 频繁读取的热点小表
C. 只读的热点小表
D. 读取和修改都非常频繁的热点小表
下面对于 TiDB Cloud 描述,正确的为?(请选择 4 项)ADEF
A. 属于 DBaaS 服务
B. 数据属于客户自己和云服务厂商
C. 都具有 VPC Peer
D. 属于多租户架构
E. 不仅支持自动备份还支持手动备份
F. 支持一定的删除后还原
关于 Developer Tier 和 Dedicated Tier,下面说法正确的为?(请选择 2 项)CD
A. 都支持 VPC Peer
B. 都支持横向扩容和缩容
C. 都支持 TiFlash 节点
D. 都具有多租户特性
E. 都具有高可用性