1.分类
1.sql
1)mysql
2)sqlserver
2.nosql
1)键值对数据库:redis、memcache
2)列存储数据库:hbase
3)文档型数据库:mongdb
4)图形数据库:graph
=============================================================================
2.查询优化
=============================================================================
3.性能优化
调整硬件性能
影响因素:
解决方案:
- 扩大虚拟内存,并保证有足够的可以扩充的空间
- 关闭数据库服务器上不必要的服务
- 数据库服务器和主域服务器分开
- 数据库服务器的吞吐量调为最大
调整数据库
- 只建立一个聚簇索引
- 为经常查询的列都建立索引
- 不要建立太多的索引
- 避免为大型数据类型的列建立索引
使用存储过程
应用程序结构和算法
=============================================================================
4.索引
索引概念
索引
是对数据库表中一个或多个列的值进行排序的结构
优点:
1.大大加快检索速度;
2.创建唯一性索引,保证数据库表中每一行数据的唯一性;
3.加速表和表之间的连接;
4.在使用分组和排序子句进行数据检索时,可以显著减少查询中分组和排序的时间。
1)大大减少服务器需要扫描的数据量
2)帮助服务器避免排序和临时表
3)将所及I/O变为顺序I/O
缺点:
1.索引需要占用数据表以外的物理存储空间
2.创建索引和维护索引要花费一定的时间
3.当对表进行更新操作时,索引需要被重建,这样降低了数据的维护速度。
总结索引使用原则:
1:不要索引数据量不大的表,对于小表来讲,表扫描的成本并不高。
2:不要设置过多的索引,在没有聚集索引的表中,最大可以设置249个非聚集索引,过多的索引首先会带来更大的磁盘空间,而且在数据发生修改时,对索引的维护是特别消耗性能的。
3:合理应用复合索引,有某些情况下可以考虑创建包含所有输出列的复合索引。
4:对经常使用范围查询的字段,可能考虑聚集索引。
5:避免对不常用的列,逻辑性列,大字段列创建索引。
索引类型
普通索引:create index stusno on student(sno),alter table
唯一索引: UNIQUE 例如:create unique index stusno on student(sno);
表明此索引的每一个索引值只对应唯一的数据记录,对于单列惟一性索引,这保证单列不包含重复的值。对于多列惟一性索引,保证多个值的组合不重复。
主键索引: primary key
数据库表经常有一列或多列组合,其值唯一标识表中的每一行。该列称为表的主键。在数据库关系图中为表定义主键将自动创建主键索引,主键索引是唯一索引的特定类型。该索引要求主键中的每个值都唯一。当在查询中使用主键索引时,它还允许对数据的快速访问。
聚簇索引:cluster
在聚集索引中,表中行的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引。 如果某索引不是聚集索引,则表中行的物理顺序与键值的逻辑顺序不匹配。与非聚集索引相比,聚集索引通常提供更快的数据访问速度。
全文索引:fulltext
CREATE INDEX indextest5 ON textbook (tag5)
ALTER TABLE textbook ADD PRIMARY KEY (timeKey)
ALTER TABLE textbook ADD UNIQUE indextest0 (timeKey)
ALTER TABLE textbook ADD INDEX indextest3 (tag3)
ALTER TABLE textbook ADD FULLTEXT indextest4 (tag4)
ALTER TABLE textbook ADD CLUSTERED indextest6 (tag6)
索引的实现方式
1 B+树 我们经常听到B+树就是这个概念,用这个树的目的和红黑树差不多,也是为了尽量保持树的平衡,当然红黑树是二叉树,但B+树就不是二叉树了,节点下面可以有多个子节点,数据库开发商会设置子节点数的一个最大值,这个值不会太小,所以B+树一般来说比较矮胖,而红黑树就比较瘦高了。
关于B+树的插入,删除,会涉及到一些算法以保持树的平衡,这里就不详述了。ORACLE的默认索引就是这种结构的。
如果经常需要同时对两个字段进行AND查询,那么使用两个单独索引不如建立一个复合索引,因为两个单独索引通常数据库只能使用其中一个,而使用复合索引因为索引本身就对应到两个字段上的,效率会有很大提高。
2 散列索引
第二种索引叫做散列索引,就是通过散列函数来定位的一种索引,不过很少有单独使用散列索引的,反而是散列文件组织用的比较多。
散列文件组织就是根据一个键通过散列计算把对应的记录都放到同一个槽中,这样的话相同的键值对应的记录就一定是放在同一个文件里了,也就减少了文件读取的次数,提高了效率。
散列索引呢就是根据对应键的散列码来找到最终的索引项的技术,其实和B树就差不多了,也就是一种索引之上的二级辅助索引,我理解散列索引都是二级或更高级的稀疏索引,否则桶就太多了,效率也不会很高。
3 位图索引
位图索引是一种针对多个字段的简单查询设计的一种特殊的索引,适用范围比较小,只适用于字段值固定并且值的种类很少的情况,比如性别,只能有男和女,或者级别,状态等等,并且只有在同时对多个这样的字段查询时才能体现出位图的优势。
位图的基本思想就是对每一个条件都用0或者1来表示,如有5条记录,性别分别是男,女,男,男,女,那么如果使用位图索引就会建立两个位图,对应男的10110和对应女的01001,这样做有什么好处呢,就是如果同时对多个这种类型的字段进行and或or查询时,可以使用按位与和按位或来直接得到结果了。
MySQL不支持
三种索引实现方式的比较
B+树最常用,性能也不差,用于范围查询和单值查询都可以。特别是
范围查询,非得用B+树这种顺序的才可以了。
HASH的如果只是对
单值查询的话速度会比B+树快一点,但是ORACLE好像不支持HASH索引,只支持HASH表空间。
位图的使用情况很局限,只有很少的情况才能用,一定要确定真正适合使用这种索引才用(
值的类型很少并且需要复合查询,比如性别),否则建立一大堆位图就一点意义都没有了。
B+树的基本原理
MySQL是怎么用B+树
索引的数据结构
使用索引查询一定能提高查询的性能吗?为什么
通常,通过索引查询数据比全表扫描要快.但是我们也必须注意到它的代价.
索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时,索引本身也会被修改. 这意味着每条记录的INSERT,DELETE,UPDATE将为此多付出4,5 次的磁盘I/O. 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢.使用索引查询不一定能提高查询性能,索引范围查询(INDEX RANGE SCAN)适用于两种情况:
- 基于一个范围的检索,一般查询返回结果集小于表中记录数的30%
- 基于非唯一性索引的检索
对于建立索引的列,数据是均匀分布好还是不均匀分布好
数据均匀分布比较好。最好每条记录的索引列的值各不相同,比如ID,这样查找效率最高。比如年龄,对于千万级的大表,分布还是太集中了,加上索引也没有太大用处。
比如有一个字段是性别,需要加索引吗?又扯到了位图索引
不需要。性别不是男就是女,这种列加了索引也没有什么用。也可以加位图索引
聚簇索引是怎么存在B+树里面的
聚簇索引索引和非聚簇索引的区别
聚簇索引:
非聚簇索引:
参考一:
聚簇索引与非聚簇索引的区别
数据库优化
主要说了索引、数据库结构优化,然后牵扯出红黑树,让手撕红黑树,然而写不出来,讲了下大概实现。。。数据库结构优化主要讲了下在项目中做到的表拆分和分区
解释数据库范式,索引(不懂)。写了个查询语句:题目是从grade表中找出每科成绩都大于80分的学生名字。
复合索引
Mysql从左到右的使用索引中的字段,一个查询可以只使用索引中的一部份,但只能是
最左侧部分。例如索引是key index (a,b,c)。 可以支持a | a,b| a,b,c 3种组合进行查找,但不支持 b,c进行查找 ,当最左侧字段是常量引用时,索引就十分有效。
有三种查询,1)字段A查询,2)字段B查询,3)字段A和字段B复合查询,至少需要建立几个索引
三种查询对应的索引:idx_A,idx_B,idx_A_B
至少2个索引,如果是按照AB顺序的复合查询,那么需要idx_B和idx_A_B索引。因为复合idx_A_B只支持A或者AB,不支持B查询
参考一: mysql数据库复合索引
MySQL查询记录时,每次只使用一个索引
原因:
- MySQL的查询SQL会经过查询优化器优化,生成执行计划,再进行查询;
- 优化过程中,如果要分析两个索引,那么整个查询时间将会比使用一个索引进行查询的时间长;
- 另一方面,不使用索引直接扫描全表的时间又比使用一个索引查询时间长,所以MySQL只使用一个索引;
- 如果有多个索引,MySQL会自己选择使用其中一个,当然,我们自己也可以强制让它使用某一个索引(select * from table force index(ziduan1_index) limit 2;(强制使用索引"ziduan1_index"))。
建立索引:
select
count
(
1
)
from
table1
where
column1 =
1
and
column2 =
'foo'
and
column3 =
'bar'
使用复合索引index(column1,column2,column3)最好。
参考一:
数据库中查询记录时是否每次只能使用一个索引?
100个字段都是经常查询的,如何建索引
- 对这100个字段,分别建立索引
- 对这100个字段,建立复合索引
分析:
- 对于经常有INSERT,DELETE,UPDATE的表,索引超过10个开销会太大,会影响性能。
- 一个表哪怕只做查询操作,索引也不宜过多,因为所以太多会导致查询选择索引出现开销(当然指定了索引可以最低限度的降低开销)。
- 建立索引要从全局考虑,就是不要只考虑一张表的索引怎么建,而是要考虑整个模块的索引怎么建,一般在一个表上索引不要超过5个。
索引失效的原因:
- 对单字段建立索引,where条件多字段
- 复合索引失效,where条件没有按照符合索引的顺序排列
- 对索引列运算,运算符包括(+、-、*、/、!、<>、%、like'%_'(%放在前面)、or、in、exist等),比如where a+1=c
- 类型错误,字段类型为varchar,where条件用number
- 对索引使用内部函数,这种情况下应该建立基于函数的索引
- is null 索引失效,is not null 索引有效
- where子句中使用参数,select id from t where num=@num
参考一:
Mysql引起索引失效的原因总结
参考二:
造成数据库索引失效的几种原因
=============================================================================
5.事务(ACID)
作为单个逻辑工作单元执行的一系列操作,要么完全地执行,要么完全地不执行
原子性(Atomicity):
一个事务(Transaction)中的所有操作,
要么全部完成,要么全部不完成
,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。
一致性(Consistency):
在事务开始之前和事务结束以后,数据库的完整性没有被破坏。这表示写入的资料必须完全符合所有的默认规则,这包含资料的精准度、串联新以及后续数据库可以自发性地完成预定的工作。
A转账给B,执行事务之前:A+B=100,执行事务之后:A+B=100
隔离性(Isolation):
当两个或者多个事务并发访问(此处访问指查询和修改的操作)数据库的同一数据时所表现出的互相关系。事务隔离分为不同的级别,包括读不提交(Read uncommitted)、读提交(Read committed)、可重复读(Repeatable read)和串行化(Serializable)。
多个事务并发访问相互之间不影响,A事务的结果不会覆盖B事务的结果
持久性(Durability):
在事务完成以后,该事务对数据库所作的更改便持久地保存在数据库之中,而且是完全的。
事务一旦提交,对数据库数据的改变就是永久性的
由于一项操作通常会包含许多子操作,而这些子操作可能会因为硬件的损坏或其他因素产生问题,要正确实现ACID并不容易。ACID建议数据库将所有需要更新以及修改的资料一次操作完毕,但实际上并不可行。
目前主要有两种方式实现ACID:第一种是Write ahead logging,也就是日志式的方式。第二种是Shadow paging。
Write ahead logging(预写日志):
1. 事务所引起的所有改动都要记录在日志中,在事务提交完成之前,所有的这些记录必须被写入硬盘;
2. 一个数据库的缓冲页直到被记入日志后才能发生修改。直到缓冲页对应的日志被写入硬盘后,该缓冲页才会存入硬盘;
3. 当缓冲页被修改和日志被更新修改时,必须加上互斥锁,以保证改动被记录到日志中的顺序与它发生的顺序是一致的。
以上规则的结果:
- 如果一条日志记录未被存入硬盘,则它可以被忽略,因为该日志中包含的改动一定属于未提交的事务。此外,这样的日志不能反映已持久化在数据库中的改动;
- 日志记录按顺序记录系统的改动。加锁协议(latch protocol)保证如果有对于同一页改动的两条日志记录,则两条记录的顺序反映对页发生改变的顺序。
事务隔离级别
读未提交(Read uncommitted)
:允许读取还未提交的改变了的数据。可能导致脏、幻、不可重复读。
读已提交(Read committed)
:允许在并发事务已经提交后读取。可防止脏读,但是幻读和不可重复读仍可发生。
可重复读(Repeatable read)
:对相同字段的多次读取是一致的,除非数据被事务本身改变。可防止脏、不可重复读,但是幻读仍可能发生。
串行化(Serializable)
:完全服从数据库四种隔离级别,确保不发生脏、幻、不可重复读。速度最慢,它是通过完全锁定在事务中涉及的数据表来完成的,事务按顺序串行执行。
不考虑隔离性,会引发一下问题:
脏读
:一个事务读取了另一个事务改写但还未提交的数据,如果这些数据被回滚,则读到的数据是无效的。
读到无效数据,导致查询结果前后不一致。
不可重复读
:在同一个事务中,读到另一个事务已经提交更新的数据。
读到更新的数据,导致多次读取同一个数据返回的结果有所不同。
幻读
:一个事务读取了几行记录后,另一个事务插入一些记录,幻读就发生了。在后来的查询中,第一个事务就会发现有些原来没有的记录。
读取到新的记录
MySQL的默认事务隔离级别是Repeatable read
=============================================================================
6.关系型数据库的范式
第一范式:每个属性不可再分
第二范式:消除部分依赖,满足第一范式,表中的非主属性必须完全依赖于主键(全部主属性)
第三范式:消除传递依赖,满足第二范式,非主属性必须互不依赖
=============================================================================
7.视图
视图是一种虚拟的表,具有和物理表相同的功能。可以对视图进行增,改,查,操作,试图通常是有一个表或者多个表的行或列的子集。对视图的修改不影响基本表。它使得我们获取数据更容易,相比多表查询。
- 只暴露部分字段给访问者,所以就建一个虚表,就是视图。
- 查询的数据来源于不同的表,而查询者希望以统一的方式查询,这样也可以建立一个视图,把多个表查询结果联合起来,查询者只需要直接从视图中获取数据,不必考虑数据来源于不同表所带来的差异
=============================================================================
8.SQL
从表TABLE_NAME中提取10条记录
-- sql server:
select top 10 * from TABLE_NAME;
-- mysql:
select * from TABLE_NAME limit 10;
drop、delete与truncate的区别
SQL中的
drop、delete、truncate
都表示删除,但是三者有一些差别
- delete和truncate只删除表的数据不删除表的结构
- 速度,一般来说: drop> truncate >delete
- delete语句是dml,这个操作会放到rollback segement中,事务提交之后才生效;
如果有相应的
trigger
,执行的时候将被触发.
truncate,drop
是ddl, 操作立即生效,原数据不放到r
ollback segment
中,不能回滚. 操作不触发
trigger
.
drop、delete与truncate分别在什么场景之下使用?
- 不再需要一张表的时候,用drop
- 想删除部分数据行时候,用delete,并且带上where子句
- 保留表而删除所有数据的时候用truncate
SQL 约束有哪几种?
NOT NULL: 用于控制字段的内容一定不能为空(NULL)。 UNIQUE: 控件字段内容不能重复,一个表允许有多个 Unique 约束。PRIMARY KEY: 也是用于控件字段内容不能重复,但它在一个表只允许出现一个。FOREIGN KEY: 用于预防破坏表之间连接的动作,也能防止非法数据插入外键列,因为它必须是它指向的那个表中的值之一。CHECK: 用于控制字段的值范围。DEFAULT: 用于设置新记录的默认值。
sql注入,如何避免
a.
sql注入:用户输入的数据,未经检测,变成了sql语句的一部分,造成意外的结果输出。
b.
避免sql注入:避免数据变成代码被执行,对sql语句进行预编译和查询参数绑定,在SQL语句中放置占位符'?',然后将带有占位符的SQL语句传给数据库编译,执行的时候才将用户输入的数据作为执行的参数传给用户。这样的操作不仅使得SQL语句在书写的时候不再需要拼接,看起来也更直接,而且用户输入的数据也没有机会被送到数据库的SQL解释器被编译执行,也不会越权变成代码。
b.
实例:登录界面用户名输入:admin' or 1=1 '
谈了下 注入的原理 以及登录功能模块中 sql注入的 实现
=============================================================================
9.主键、外键、候选键、超键
超键:在关系中能唯一标识元组的属性集称为关系模式的超键。一个属性可以为作为一个超键,多个属性组合在一起也可以作为一个超键。超键包含候选键和主键。
候选键:是最小超键,即没有冗余元素的超键。
主键:数据库表中对储存数据对象予以唯一和完整标识的数据列或属性的组合。一个数据列只能有一个主键,且主键的取值不能缺失,即不能为空值(Null)。
外键:在一个表中存在的另一个表的主键称此表的外键。
=============================================================================
10.MySQL的常用引擎
在
MySQL
数据库
中,常用的引擎主要就是
2
个:
Innodb
和
MyIASM
。这篇文章将主要介绍这两个引擎,以及该如何去选择引擎,最后在提一下这
2
种引擎所使用的数据结构是什么。
首先介绍一下Innodb
引擎。
Innodb
引擎提供了对数据库
ACID
事务的支持。并且还提供了行级锁和外键的约束。它的设计的目标就是处理
大数据
容量的数据库系统。它本身实际上是基于
Mysql
后台的完整的系统。
Mysql
运行的时候,
Innodb
会在内存中建立缓冲池,用于缓冲数据和索引。但是,该引擎是不支持全文搜索的。同时,启动也比较的慢,它是不会保存表的行数的。当进行
Select count(*) from table
指令的时候,需要进行扫描全表。
所以当需要使用数据库的事务时,该引擎就是首选。由于锁的粒度小,写操作是不会锁定全表的。所以在并发度较高的场景下使用会提升效率的。
接下来来说说MyIASM
引擎。它是
MySql
的默认引擎,但不提供事务的支持,也不支持行级锁和外键。因此当执行
Insert
插入和
Update
更新语句时,即执行写操作的时候需要锁定这个表。所以会导致效率会降低。不过和
Innodb
不同的是,
MyIASM
引擎是保存了表的行数,于是当进行
Select count(*) from table
语句时,可以直接的读取已经保存的值而不需要进行扫描全表。
所以,如果表的读操作远远多于写操作时,并且不需要事务的支持的。可以将MyIASM
作为数据库引擎的首先。
我们在来说说这两种引擎的选择。其实上面已经提到了。这里我在补充了两点:
1、大容量的数据集时趋向于选择Innodb
。因为它支持事务处理和故障的恢复。
Innodb
可以利用数据日志来进行数据的恢复。主键的查询在
Innodb
也是比较快的。
2、大批量的插入语句时(这里是INSERT
语句)在
MyIASM
引擎中执行的比较的快,但是
UPDATE
语句在
Innodb
下执行的会比较的快,尤其是在并发量大的时候。
最后我们再来说说两种引擎所使用的索引的数据结构是什么?答案是都是B+
树。
对于MyIASM
引擎来说,
B+
树的数据结构中存储的内容实际上是实际数据的地址值。也就是说它的索引和实际数据是分开的,只不过使用索引指向了实际数据。这种索引的模式被称为非聚集索引。
而Innodb
引擎的索引的数据结构也是
B+
树,只不过数据结构中存储的都是实际的数据,这种索引有被称为聚集索引。
=============================================================================
11.数据库连接
通过JDBC访问数据库包含下面哪几步?
1. 加载JDBC驱动程序
2. 提供JDBC连接的URL
3. 创建数据库的连接
4. 创建一个Statement
5. 执行SQL语句
6. 处理结果
7. 关闭JDBC对象
=============================================================================
12.存储过程
- 存储过程是一个预编译的代码块,执行效率比较高
- 一个存储过程替代大量T_SQL语句 ,可以降低网络通信量,提高通信速率
- 可以一定程度上确保数据安全
触发器的作用
触发器是一种特殊的存储过程,主要是通过事件来触发而被执行的。它可以强化约束,来维护数据的完整性和一致性,可以跟踪数据库内的操作从而不允许未经许可的更新和变化。可以联级运算。如,某表上的触发器上包含对另一个表的数据操作,而该操作又会导致该表触发器被触发。
=============================================================================
13.数据库的乐观锁和悲观锁
数据库管理系统(DBMS)中的并发控制的任务是确保在多个事务同时存取数据库中同一数据时不破坏事务的隔离性和统一性以及数据库的统一性。
乐观并发控制(乐观锁)和悲观并发控制(悲观锁)是并发控制主要采用的技术手段。
- 悲观锁:假定会发生并发冲突,屏蔽一切可能违反数据完整性的操作
- 乐观锁:假设不会发生并发冲突,只在提交操作时检查是否违反数据完整性。
5、悲观锁和乐观锁吧?答知道,然后讲了下两个的区别以及应用场景
悲观锁:
每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会block直到它拿到锁。传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。比较适合写入操作比较频繁的场景,如果出现大量的读取操作,每次读取的时候都会进行加锁,这样会增加大量的锁的开销,降低了系统的吞吐量。
乐观锁:
每次去拿数据的时候都认为别人不会修改,所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号等机制。乐观锁适用于多读的应用类型,这样可以提高吞吐量,像数据库如果提供类似于write_condition机制的其实都是提供的乐观锁。比较适合读取操作比较频繁的场景,如果出现大量的写入操作,数据发生冲突的可能性就会增大,为了保证数据的一致性,应用层需要不断的重新获取数据,这样会增加大量的查询操作,降低了系统的吞吐量。
应用场景:
读取频繁使用乐观锁,写入频繁使用悲观锁。
mysql一般用的什么数据库引擎,mysql默认的是InnoDB存储引擎,接着就让说InnoDB和MyISAM之间的区别、应用场景
区别:
1.MyISAM不支持事务,InnoDB是事务类型的存储引擎
2.MyISAM只支持表级锁,BDB支持页级锁和表级锁默认为页级锁,而InnoDB支持行级锁和表级锁默认为行级锁
3.MyISAM引擎不支持外键,InnoDB支持外键
4.MyISAM引擎的表在大量高并发的读写下会经常出现表损坏的情况
5.对于count()查询来说MyISAM更有优势
6.InnoDB是为处理巨大数据量时的最大性能设计,它的CPU效率可能是任何其它基于磁盘的关系数据库引擎所不能匹敌的
7.MyISAM支持全文索引(FULLTEXT),InnoDB不支持
8.MyISAM引擎的表的查询、更新、插入的效率要比InnoDB高
应用场景:
MyISAM:(1)做很多count 的计算;(2)插入不频繁,查询非常频繁;(3)没有事务。
InnoDB:(1)可靠性要求比较高,或者要求事务;(2)表更新和查询都相当的频繁,并且行锁定的机会比较大的情况。
平时是怎么处理事务的,讲下对事务的了解
作为单个逻辑工作单元执行的一系列操作,要么完全地执行,要么完全地不执行
原子性(Atomicity):
一个事务(Transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。
一致性(Consistency):
在事务开始之前和事务结束以后,数据库的完整性没有被破坏。这表示写入的资料必须完全符合所有的默认规则,这包含资料的精准度、串联新以及后续数据库可以自发性地完成预定的工作。
隔离性(Isolation):
当两个或者多个事务并发访问(此处访问指查询和修改的操作)数据库的同一数据时所表现出的互相关系。
事务隔离分为不同的级别,包括读未提交(Read uncommitted)、读提交(Read committed)、可重复读(Repeatable read)和串行化(Serializable)。
持久性(Durability):
在事务完成以后,该事务对数据库所作的更改便持久地保存在数据库之中,而且是完全的。
由于一项操作通常会包含许多子操作,而这些子操作可能会因为硬件的损坏或其他因素产生问题,要正确实现ACID并不容易。ACID建议数据库将所有需要更新以及修改的资料一次操作完毕,但实际上并不可行。
目前主要有两种方式实现ACID:第一种是Write ahead logging,也就是日志式的方式。第二种是Shadow paging。
Write ahead logging(预写日志):
1. 事务所引起的所有改动都要记录在日志中,在事务提交完成之前,所有的这些记录必须被写入硬盘;
2. 一个数据库的缓冲页直到被记入日志后才能发生修改。直到缓冲页对应的日志被写入键盘后,该缓冲页才会存入键盘;
3. 当缓冲页被修改和日志被更新修改时,必须加上互斥锁,以保证改动被记录到日志中的顺序与它发生的顺序是一致的。
以上规则的结果:
- 如果一条日志记录未被存入硬盘,则它可以被忽略,因为该日志中包含的改动一定属于未提交的事务。此外,这样的日志不能反映已持久化在数据库中的改动;
- 日志记录按顺序记录系统的改动。加锁协议(latch protocol)保证如果有对于同一页改动的两条日志记录,则两条记录的顺序反映对页发生改变的顺序。
应用场景:
Mysql事务主要用来处理数据量大、数据复杂度高的数据操作,最经典的使用场景是银行的转账:需要先从银行账户A中取出钱,然后再存入银行账户B中,如果中间出现问题,而没有事务的保证,那么就会出现B收不到钱,而A支出钱又回不到自己的账户的严重问题,那么有了事务机制,这个问题就解决了。
MySQL分表、分区、分库
分表:将一张表分成多个小表。
分区:一张表的数据分成多个区块,这些区块可以在同一个磁盘上,也可以在不同的磁盘上。
分库:一个数据库按城市(或者其他标准)分成多个数据库。
参考一:
MYSQL分库分表总结
mybatis缓存,以及谈谈你们项目为什么用spring mvc+mybatis 而不用Hibernate?
主要是说说一级缓存 二级缓存 然后 讲讲mybatis相对于Hibernate来说的优点好处之类
连表查询:笛卡尔积通过什么连接得到sql
select * from a, b
inner join,left join,right join的区别
Table A
TableB
aid adate bid bdate
1 a1 1 b1
2 a2 2 b2
3 a3 4 b4
select * from a
inner join
b on a.aid = b.bid
仅取出匹配的数据,结果:
1 a1 b1
2 a2 b2
select * from a
left join
b on a.aid = b.bid
首先取出a表中所有数据,然后再加上与a,b匹配的的数据,结果::
1 a1 b1
2 a2 b2
3 a3 空字符
select * from a
right join
b on a.aid = b.bid
指的是首先取出b表中所有数据,然后再加上与a,b匹配的的数据,结果:
1 a1 b1
2 a2 b2
4 空字符 b4
数据库中某个表查询和存取数据量很大时怎么处理
数据库设计:
SQL语句:
Java代码:
参考一:
在一个千万级的数据库查寻中,如何提高查询效率?
做项目时怎么设计数据库,怎么决定主键
因为我自己谈到用过redis,所以又问了我redis的原理和优势
数据库的底层设计,文件如何存储,数据如何查询
MongoDB和MySQL的区别
MongoDB:日志
- 存储方式:虚拟内存+持久化。
- 查询语句:是独特的Mongodb的查询方式。
- 适合场景:事件的记录,内容管理或者博客平台等等。
- 架构特点:可以通过副本集,以及分片来实现高可用。
- 数据处理:数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。
- 不支持事务
参考一:
数据库-面试题(持续更新)
参考二:
http://www.cnblogs.com/remember-forget/p/6140112.html
参考三:
mysql数据库面试总结
参考四:
数据库面试宝典
参考五:
SQL经典面试题及答案
参考六:
SQL经典面试题目总结
参考七:
15个 MySQL 基础面试题,DBA 们准备好了吗?
参考八:
MySQL索引使用方法和性能优化
参考九:
和刚入门的菜鸟们聊聊--什么是聚簇索引与非聚簇索引