存储过程是一些预编译的SQL语句。
更加直白的理解:存储过程可以说是一个记录集,它是由一些T-SQL语句组成的代码块,这些T-SQL语句代码像一个方法一样实现一些功能(对单表或多表的增删改查),然后再给这个代码块取一个名字,在用到这个功能的时候调用他就行了。
索引是对数据库表中一或多个列的值进行排序的结构,是帮助MySQL高效获取数据的数据结构
你也可以这样理解:索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。
MySQL数据库几个基本的索引类型:
普通索引、唯一索引、主键索引、全文索引
索引的作用:
索引的特点
(1)索引一旦建立, Oracle管理系统会对其进行自动维护, 而且由Oracle管理系统决定何时使用索引
(2)用户不用在查询语句中指定使用哪个索引
(3)在定义primary key或unique约束后系统自动在相应的列上创建索引
(4)用户也能按自己的需求,对指定单个字段或多个字段,添加索引
需要注意的是:Oracle是自动帮我们管理索引的,并且如果我们指定了primary key或者unique约束,系统会自动在对应的列上创建索引…
什么时候【要】创建索引
(1)表经常进行 SELECT 操作
(2)表很大(记录超多),记录内容分布范围很广
(3)列名经常在 WHERE 子句或连接条件中出现
什么时候【不要】创建索引
(1)表经常进行 INSERT/UPDATE/DELETE 操作
(2)表很小(记录超少)
(3)列名不经常作为连接条件或出现在 WHERE 子句中
索引优缺点:
索引分类:
事务(Transaction)是并发控制的基本单位。所谓的事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。事务是数据库维护数据一致性的单位,在每个事务结束时,都能保持数据一致性。
事务的特性:
目前主要有两种方式实现ACID:第一种是Write ahead logging,也就是日志式的方式。第二种是Shadow paging。
Write ahead logging(预写日志):
数据库管理系统(DBMS)中的并发控制的任务是确保在多个事务同时存取数据库中同一数据时不破坏事务的隔离性和统一性以及数据库的统一性。
乐观并发控制(乐观锁)和悲观并发控制(悲观锁)是并发控制主要采用的技术手段。
通常,通过索引查询数据比全表扫描要快.但是我们也必须注意到它的代价.
索引需要空间来存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时,索引本身也会被修改. 这意味着每条记录的INSERT,DELETE,UPDATE将为此多付出4,5 次的磁盘I/O. 因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢.使用索引查询不一定能提高查询性能,索引范围查询(INDEX RANGE SCAN)适用于两种情况:
SQL中的drop、delete、truncate都表示删除,但是三者有一些差别
视图是一种虚拟的表,具有和物理表相同的功能。可以对视图进行增,改,查,操作,试图通常是有一个表或者多个表的行或列的子集。对视图的修改不影响基本表。它使得我们获取数据更容易,相比多表查询。
MySQL服务器通过权限表来控制用户对数据库的访问,权限表存放在mysql数据库里,由mysql_install_db脚本初始化。这些权限表分别user,db,table_priv,columns_priv和host。下面分别介绍一下这些表的结构和内容:
使用 myisamchk 来修复,具体步骤:
1)修复前将mysql服务停止。
2)打开命令行方式,然后进入到mysql的/bin目录。
3)执行myisamchk –recover 数据库所在路径/*.MYI
使用repair table 或者 OPTIMIZE table命令来修复,REPAIR TABLE table_name 修复表 OPTIMIZE TABLE table_name 优化表 REPAIR TABLE 用于修复被破坏的表。
OPTIMIZE TABLE 用于回收闲置的数据库空间,当表上的数据行被删除时,所占据的磁盘空间并没有立即被回收,使用了OPTIMIZE TABLE命令后这些空间将被回收,并且对磁盘上的数据行进行重排(注意:是磁盘上,而非数据库)
InnoDB是基于索引来完成行锁
例: select * from tab_with_index where id = 1 for update;
for update 可以根据条件来完成行锁锁定,并且 id 是有索引键的列,
如果 id 不是索引键那么InnoDB将完成表锁,并发将无从谈起
在我们书写SQL语句的时候,其实书写的顺序、策略会影响到SQL的性能,虽然实现的功能是一样的,但是它们的性能会有些许差别。
因此,下面就讲解在书写SQL的时候,怎么写比较好。
①选择最有效率的表名顺序
数据库的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表将被最先处理
在FROM子句中包含多个表的情况下:
②WHERE子句中的连接顺序
数据库采用自右而左的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之左,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的之右。
emp.sal可以过滤多条记录,写在WHERE字句的最右边
③SELECT子句中避免使用*号
我们当时学习的时候,“”号是可以获取表中全部的字段数据的。
但是它要通过查询数据字典完成的,这意味着将耗费更多的时间
使用号写出来的SQL语句也不够直观。
④用TRUNCATE替代DELETE
这里仅仅是:删除表的全部记录,除了表结构才这样做。
DELETE是一条一条记录的删除,而Truncate是将整个表删除,保留表结构,这样比DELETE快
⑤多使用内部函数提高SQL效率
例如使用mysql的concat()函数会比使用||来进行拼接快,因为concat()函数已经被mysql优化过了。
⑥使用表或列的别名
如果表或列的名称太长了,使用一些简短的别名也能稍微提高一些SQL的性能。毕竟要扫描的字符长度就变少了。。。
⑦多使用commit
comiit会释放回滚点…
⑧善用索引
索引就是为了提高我们的查询数据的,当表的记录量非常大的时候,我们就可以使用索引了。
⑨SQL写大写
我们在编写SQL 的时候,官方推荐的是使用大写来写关键字,因为Oracle服务器总是先将小写字母转成大写后,才执行
⑩避免在索引列上使用NOT
因为Oracle服务器遇到NOT后,他就会停止目前的工作,转而执行全表扫描
①①避免在索引列上使用计算
WHERE子句中,如果索引列是函数的一部分,优化器将不使用索引而使用全表扫描,这样会变得变慢
用 >= 替代 >
数据库结构优化
1)范式优化: 比如消除冗余(节省空间。。)
2)反范式优化:比如适当加冗余等(减少join)
3)拆分表: 垂直拆分和水平拆分
服务器硬件优化
这个么多花钱咯!
查询中用到的关键词主要包含六个,并且他们的顺序依次为
select–from–where–group by–having–order by
FOREIGN KEY 约束用于预防破坏表之间连接的动作。
FOREIGN KEY 约束也能防止非法数据插入外键列,因为它必须是它指向的那个表中的值之一。
读未提交(Read uncommitted):允许读取还未提交的改变了的数据。可能导致脏、幻、不可重复读。
读已提交(Read committed):允许在并发事务已经提交后读取。可防止脏读,但是幻读和不可重复读仍可发生。
可重复读(Repeatable read):对相同字段的多次读取是一致的,除非数据被事务本身改变。可防止脏、不可重复读,但是幻读仍可能发生。
串行化(Serializable):完全服从数据库四种隔离级别,确保不发生脏、幻、不可重复读。速度最慢,它是通过完全锁定在事务中涉及的数据表来完成的,事务按顺序串行执行。
不考虑隔离性,会引发一下问题:
脏读:一个事务读取了另一个事务改写但还未提交的数据,如果这些数据被回滚,则读到的数据是无效的。读到无效数据,导致查询结果前后不一致。
不可重复读:在同一个事务中,读到另一个事务已经提交更新的数据。读到更新的数据,导致多次读取同一个数据返回的结果有所不同。
幻读:一个事务读取了几行记录后,另一个事务插入一些记录,幻读就发生了。在后来的查询中,第一个事务就会发现有些原来没有的记录。读取到新的记录
MySQL的默认事务隔离级别是Repeatable read
sql注入:用户输入的数据,未经检测,变成了sql语句的一部分,造成意外的结果输出。
避免sql注入:避免数据变成代码被执行,对sql语句进行预编译和查询参数绑定,在SQL语句中放置占位符’?’,然后将带有占位符的SQL语句传给数据库编译,执行的时候才将用户输入的数据作为执行的参数传给用户。这样的操作不仅使得SQL语句在书写的时候不再需要拼接,看起来也更直接,而且用户输入的数据也没有机会被送到数据库的SQL解释器被编译执行,也不会越权变成代码。
b.实例:登录界面用户名输入:admin’ or 1=1 ’
谈了下 注入的原理 以及登录功能模块中 sql注入的 实现
通过JDBC访问数据库包含下面哪几步?
Table A TableB
aid adate bid bdate
1 a1 1 b1
2 a2 2 b2
3 a3 4 b4
select * from a inner join b on a.aid = b.bid
仅取出匹配的数据,结果:
1 a1 b1
2 a2 b2
select * from a left join b on a.aid = b.bid
首先取出a表中所有数据,然后再加上与a,b匹配的的数据,结果::
1 a1 b1
2 a2 b2
3 a3 空字符
select * from a right join b on a.aid = b.bid
指的是首先取出b表中所有数据,然后再加上与a,b匹配的的数据,结果:
1 a1 b1
2 a2 b2
4 空字符 b4
MongoDB:日志
存储方式:虚拟内存+持久化。
查询语句:是独特的Mongodb的查询方式。
适合场景:事件的记录,内容管理或者博客平台等等。
架构特点:可以通过副本集,以及分片来实现高可用。
数据处理:数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。
不支持事务
1.数据库底层实现:
底层是B+树的结构,所有节点中都存了指向下一个叶子节点的指针,只有叶子节点存储数据,InnoDB建议为大部分表使用默认自增的主键作为主索引。
2.为什么是B+树不是红黑树或者B树 二叉树
B树即二叉搜索树:
所有非叶子节点最多有两个儿子 ,所有节点存储一个关键字 ,非叶子节点左指针指向比关键字小的,右指针指向关键字大的
B-树即B树,不要读成B-树,它是多路搜索树
关键字分布在整棵树中 ,搜索性能等价于二分查找 ,搜索有可能在非叶子节点结束
B+树是B-树的变体,也是多路搜索树
所有关键字都在叶子节点中 ,为所有叶子节点添加一个链指针,B+树在B-树基础上为叶子节点增加链表指针,所有关键字都在叶子节点中出现,非叶子节点作为叶子节点的索引,更适合文件索引系统 。相对于B树,B+树空间利用率高,因为B+树的内部节点只是作为索引使用,而不像B-树那样每个节点都需要存储硬盘指针
按粒度划分:行级索、表级锁 、页级索
按锁的级别划分:共享锁 、排它锁 、更新锁
按使用方式:乐观锁 、悲观锁
行级索:对当前操作的行进行加锁,减少数据库操作的冲突,开销大
页级索:表级锁速度快,但冲突多,行级冲突少,但速度慢。所以页级索取了折衷的页级
这些内容是在一二月份找实习时复习的知识点,有些是自己整理的,有些摘自网页,如有侵权,请告知!如有错误,欢迎指正!!