第三部分数据库和缓存（46题）

备注：自用回答

1、列举常见的关系型数据库和非关系型都有那些？

答：http://www.cnblogs.com/zylq-blog/p/7595979.html

关系型数据库：mysql，oracle，sqlserver，sqlite

关系型数据库最典型的数据结构是表，由二维表及其之间的联系所组成的一个数据组织

优点：

（1）易于维护：都是使用表结构，格式一致；

（2）使用方便：SQL语言通用，可用于复杂查询；

（3）复杂操作：支持SQL，可用于一个表以及多个表之间非常复杂的查询。

缺点：

（1）读写性能比较差，尤其是海量数据的高效率读写；

（2）固定的表结构，灵活度稍欠；

（3）高并发读写需求，传统关系型数据库来说，硬盘I/O是一个很大的瓶颈。

非关系型数据库：mongoDB，redis

非关系型数据库严格上不是一种数据库，应该是一种数据结构化存储方法的集合，可以是文档或者键值对等。

优点：

（1）格式灵活：存储数据的格式可以是key,value形式、文档形式、图片形式等等，文档形式、图片形式等等，使用灵活，应用场景广泛，而关系型数据库则只支持基础类型。

（2）速度快：nosql可以使用硬盘或者随机存储器作为载体，而关系型数据库只能使用硬盘；

（3）高扩展性；

（4）成本低：nosql数据库部署简单，基本都是开源软件。

缺点：

（1）不提供sql支持，学习和使用成本较高；

（2）无事务处理；

（3）数据结构相对复杂，复杂查询方面稍欠。

非关系型数据库的分类和比较：

（1）文档型，如mongoDB

（2）key-value型，如redis

（3）列式数据库

（4）图形数据库

2、MySQL常见数据库引擎及比较？

答：InnoDB：支持事务处理，支持外键，支持崩溃修复能力和并发控制。如果需要对事务的完整性要求比较高（比如银行），要求实现并发控制（比如售票），那选择InnoDB有很大的优势。如果需要频繁的更新、删除操作的数据库，也可以选择InnoDB，因为支持事务的提交（commit）和回滚（rollback）。

MyISAM：插入数据快，空间和内存使用比较低。如果表主要是用于插入新记录和读出记录，那么选择MyISAM能实现处理高效率。如果应用的完整性、并发性要求比较低，也可以使用。

MEMORY：所有的数据都在内存中，数据的处理速度快，但是安全性不高。如果需要很快的读写速度，对数据的安全性要求较低，可以选择MEMOEY。它对表的大小有要求，不能建立太大的表。所以，这类数据库只使用在相对较小的数据库表。

注意，同一个数据库也可以使用多种存储引擎的表。如果一个表要求比较高的事务处理，可以选择InnoDB。这个数据库中可以将查询要求比较高的表选择MyISAM存储。如果该数据库需要一个用于查询的临时表，可以选择MEMORY存储引擎。

3、简述数据三大范式？

答：什么是三大范式：

第一范式：当关系模式R的所有属性都不能在分解为更基本的数据单位时，称R是满足第一范式的，简记为1NF。满足第一范式是关系模式规范化的最低要

求，否则，将有很多基本操作在这样的关系模式中实现不了。

第二范式：如果关系模式R满足第一范式，并且R得所有非主属性都完全依赖于R的每一个候选关键属性，称R满足第二范式，简记为2NF。

第三范式：设R是一个满足第一范式条件的关系模式，X是R的任意属性集，如果X非传递依赖于R的任意一个候选关键字，称R满足第三范式，简记为3NF.

注：关系实质上是一张二维表，其中每一行是一个元组，每一列是一个属性

4、什么是事务？MySQL如何支持事务？

答：原子性、一致性、隔离性、持久性

在mysql中用的最多的存储引擎有：innodb，bdb，myisam ,memory 等。其中innodb和bdb支持事务而myisam等不支持事务。

5、简述数据库设计中一对多和多对多的应用场景？

答：一对多关系示例：一个学生只属于一个班，但是一个班级有多名学生。

多对多关系示例：一个学生可以选择多门课，一门课也有多名学生。

6、如何基于数据库实现商城商品计数器？

答：如果是在非常高的并发之下，还是建议用内存数据库redis去实现计数的功能。如果不是那么高的并发，用表实现就可以。

https://blog.csdn.net/stevendbaguo/article/details/70889449

7、常见SQL（必备）

详见武沛齐博客：https://www.cnblogs.com/wupeiqi/articles/5729934.html

8、简述触发器、函数、视图、存储过程？

答：https://blog.csdn.net/running_nz/article/details/51111927

9、MySQL索引种类

答：1.普通索引2.唯一索引3.主键索引4.组合索引5.全文索引

10、索引在什么情况下遵循最左前缀的规则？

答：最左前缀原理的一部分，索引index1:(a,b,c)，只会走a、a,b、a,b,c 三种类型的查询，其实这里说的有一点问题，a,c也走，但是只走a字段索引，不会走c字段。

索引是有序的，index1索引在索引文件中的排列是有序的，首先根据a来排序，然后才是根据b来排序，最后是根据c来排序，

11、主键和外键的区别？

答：主键：唯一标识一条记录，不能有重复的，不允许为空

外键：表的外键是另一表的主键, 外键可以有重复的, 可以是空值

12、MySQL常见的函数？

答：sum，abs，floor

13、列举创建索引但是无法命中索引的8种情况。

答：https://blog.csdn.net/zengdeqing2012/article/details/38532217

（1）如果条件中有or，即使其中有条件带索引也不会使用(这也是为什么尽量少用or的原因)

　　要想使用or，又想让索引生效，只能将or条件中的每个列都加上索引

　　（2）对于多列索引，不是使用的第一部分，则不会使用索引

　　（3）like查询以%开头

　　（4）如果列类型是字符串，那一定要在条件中将数据使用引号引用起来,否则不使用索引

　　（5）如果mysql估计使用全表扫描要比使用索引快,则不使用索引

14、如何开启慢日志查询？

答：https://www.jb51.net/article/115372.htm

slow_query_log =1

slow_query_log_file=/application/mysql/data/localhost-slow.log

long_query_time = 1

15、数据库导入导出命令（结构+数据）？

答：https://www.cnblogs.com/doudouxiaoye/p/5819607.html

16、数据库优化方案？

答：https://blog.csdn.net/q602075961/article/details/71076390

17、char和varchar的区别？

答：char不可变字段，varchar是可变字段

https://blog.csdn.net/qq_34858648/article/details/77881176

18、简述MySQL的执行计划？

答：https://blog.csdn.net/heng_yan/article/details/78324176

MySql提供了EXPLAIN语法用来进行查询分析，在SQL语句前加一个"EXPLAIN"即可

19、在对name做了唯一索引前提下，简述以下区别：

答：过滤出数据的同时，进行计数

20、1000w条数据，使用limit offset 分页时，为什么越往后翻越慢？如何解决？

答：先查主键，在分页。 select * from tb where id in（select id from tb where limit 10 offset 20）

21、什么是索引合并？

答：索引合并，让一条sql可以使用多个索引。对这些索引取交集，并集，或者先取交集再取并集。从而减少从数据表中取数据的次数，提高查询效率。

22、什么是覆盖索引？

答：如果一个索引包含(或覆盖)所有需要查询的字段的值，称为‘覆盖索引’

23、简述数据库读写分离？

答：主服务器master记录数据库操作日志到Binary log，从服务器开启i/o线程将二进制日志记录的操作同步到relay log（存在从服务器的缓存中），另外sql线程将relay log日志记录的操作在从服务器执行。

24、简述数据库分库分表？（水平、垂直）

答：（1）数据库分表

把一张表按照一定的规则分解成不同的实体表。比如垂直划分和水平划分

垂直切分：把不同功能，不同模块的数据分别放到不同的表中，但是如果同一个模块的数据量太大就会存在性能瓶颈

水平切分：垂直切分解决不了大表的瓶颈，如果同一个功能中表的数据量过大，就要对该表进行切分，为水平切分

通俗理解：垂直切分---分不同的模块表；水平切分---分同一个模块下的多个表

（2）分库

将一堆数据放到不同的数据库中保存，上面说的都是在同一个数据库上，分库是分到不同的数据库上

25、redis和memcached比较？

答：（1） Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。

（2）Redis支持数据的备份，即master-slave模式的数据备份。

（3）Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。

26、redis中数据库默认是多少个db 及作用？

答：当redis 服务器初始化时，会预先分配 16 个数据库（该数量可以通过配置文件配置），所有数据库保存到结构 redisServer 的一个成员 redisServer.db 数组中。当我们选择数据库 select number 时，程序直接通过 redisServer.db[number] 来切换数据库。有时候当程序需要知道自己是在哪个数据库时，直接读取 redisDb.id 即可。

27、python操作redis的模块？

答：https://www.cnblogs.com/xtsec/p/7000404.html

导入redis，链接redis数据库，对redis api的使用

28、如果redis中的某个列表中的数据量非常大，如果实现循环显示每一个值？

答：可以尝试将对象分拆成几个key-value，使用multiGet获取值，这样分拆的意义在于分拆单次操作的压力，将操作压力平摊到多个redis实例中，降低对单个redis的IO影响；

29、redis如何实现主从复制？以及数据同步机制？

答：Redis的主从同步机制可以确保redis的master和slave之间的数据同步

全备份过程中，在slave启动时，会向其master发送一条SYNC消息，master收到slave的这条消息之后，将可能启动后台进程进行备份，备份完成之后就将备份的数据发送给slave

30、redis中的sentinel的作用？

答：用于监控redis集群中Master状态的工具

31、如何实现redis集群？

答：Redis集群设计包括2部分：哈希Slot和节点主从

主从模式的设计：

优点：读写分离，通过增加Slaver可以提高并发读的能力。

缺点：Master写能力是瓶颈。

虽然理论上对Slaver没有限制但是维护Slaver开销总将会变成瓶颈。

Master的Disk大小也将会成为整个Redis集群存储容量的瓶颈。

哈希Slot的优缺点：

缺点：每个Node承担着互相监听、高并发数据写入、高并发数据读出，工作任务繁重

优点：将Redis的写操作分摊到了多个节点上，提高写的并发能力，扩容简单。

32、redis中默认有多少个哈希槽？

答：16384 个哈希槽

33、简述redis的有哪几种持久化策略及比较？

答：rdb:快照形式是直接把内存中的数据保存到一个dump文件中，定时保存，保存策略

aof：把所有的对redis的服务器进行修改的命令都存到一个文件里，命令的集合

34、列举redis支持的过期策略。

答：volatile-lru：只对设置了过期时间的key进行LRU（默认值）

allkeys-lru ：删除lru算法的key

volatile-random：随机删除即将过期key

allkeys-random：随机删除

volatile-ttl ：删除即将过期的

noeviction ：永不过期，返回错误

35、MySQL 里有 2000w 数据，redis 中只存 20w 的数据，如何保证 redis 中都是热点数据？

答：redis 内存数据集大小上升到一定大小的时候，就会施行数据淘汰策略。redis 提供 6种数据淘汰策略：

volatile-lru：从已设置过期时间的数据集（server.db[i].expires）中挑选最近最少使用的数据淘汰

volatile-ttl：从已设置过期时间的数据集（server.db[i].expires）中挑选将要过期的数据淘汰

volatile-random：从已设置过期时间的数据集（server.db[i].expires）中任意选择数据淘汰

allkeys-lru：从数据集（server.db[i].dict）中挑选最近最少使用的数据淘汰

allkeys-random：从数据集（server.db[i].dict）中任意选择数据淘汰

no-enviction（驱逐）：禁止驱逐数据

36、写代码，基于redis的列表实现先进先出、后进先出队列、优先级队列。

答：请求的优先级。我们先假设一个最简单的场景，有三个优先级：高中低三级。可以设置3个list结构，比如叫queue_h，queue_m，queue_l，分别对应三个优先级。

37、如何基于redis实现消息队列？

答：使用lpush向list的左端推送数据（发送消息），使用rpop从右端接收数据（消费消息）

38、如何基于redis实现发布和订阅？以及发布订阅和消息队列的区别？

答：“发布/订阅”模式包含两种角色，分别是发布者和订阅者。订阅者可以订阅一个或若干个频道（channel），而发布者可以向指定的频道发送消息，所有订阅此频道的订阅者都会收到此消息。

39、什么是codis及作用？

答：Codis是一个分布式的Redis解决方案，对于上层的应用来说，连接Codis Proxy和连接原生的Redis Server没有明显的区别，上层应用可以像使用单机的Redis一样使用，Codis底层会处理请求的转发，不停机的数据迁移等工作，所有后边的一切事情，对于前面客户端来说是透明的，可以简单的认为后边连接是一个内存无限大的Redis服务。

业务需要，数据可能需要迁移，机器横向扩容

经过线上测试，Codis的升级版Reborn在pipline操作的性能比Codis慢了几十倍

40、什么是twemproxy及作用？

答：twemproxy是 Twtter 开源的一个 Redis 和 Memcache 代理服务器，主要用于管理 Redis 和 Memcached 集群，减少与Cache 服务器直接连接的数量。

41、写代码实现redis事务操作。

答：Redis会将一个事务中的所有命令序列化，然后按顺序执行

42、redis中的watch的命令的作用？

答：当某个事务需要按条件执行时，就要使用这个命令将给定的键设置为受监控的

43、基于redis如何实现商城商品数量计数器？

答：https://www.cnblogs.com/JockChou/p/4647973.html

44、简述redis分布式锁和redlock的实现机制。

45、什么是一致性哈希？Python中是否有相应模块？

46、如何高效的找到redis中所有以oldboy开头的key？

第三部分 数据库和缓存（46题）

你可能感兴趣的:(第三部分 数据库和缓存（46题）)

第三部分数据库和缓存（46题）

你可能感兴趣的:(第三部分数据库和缓存（46题）)