数据库 设计规范数据库设计样例

目录

  • 5 数据库
    • 5.1 数据库命名规范
    • 5.2 数据库字段命名
      • 5.2.1 字段命名规范
      • 5.2.2 命名规范
      • 5.2.3 待优化命名示例
      • 5.2.4 字段类型规范
      • 5.2.5数据库中每个字段的规范描述
    • 5.3表设计
    • 5.4 参考设计
      • 5.4.1 应用场景
      • 5.4.2 需求分析
      • 5.4.3 设计思路
      • 5.4.4 表结构设计
      • 5.4.5 缓存策略
      • Q1 冗余设计和一致性问题
      • Q2 为什么设计外键
    • 总结
  • 参考

5 数据库

5.1 数据库命名规范

  • 采用26个英文字母(区分大小写)和0-9的自然数(经常不需要)加上下划线’‘组成,命名简洁明确,多个单词用下划线’'分隔,一个项目一个数据库,多个项目慎用同一个数据库
  • 全部小写命名,禁止出现大写
  • 禁止使用数据库关键字,如:name,time ,datetime,password等
  • 表名称不应该取得太长(一般不超过三个英文单词)
  • 表的名称一般使用名词或者动宾短语
  • 用单数形式表示名称,例如,使用 employee,而不是 employees
  • 表必须填写描述信息(使用SQL语句建表时)
  • 数据库创建 字符集:utf8mb4、排序规则:utf8mb4_general_ci

示例:档案管理 数据库 就是 bip_archives 表名 就 archives_xxx

5.2 数据库字段命名

5.2.1 字段命名规范

  • 采用26个英文字母(区分大小写)和0-9的自然数(经常不需要)加上下划线’‘组成,命名简洁明确,多个单词用下划线’'分隔

  • 全部小写命名,禁止出现大写

  • 字段必须填写描述信息

  • 禁止使用数据库关键字,如:name,time ,datetime password 等

  • 字段名称一般采用名词或动宾短语

  • 采用字段的名称必须是易于理解,一般不超过三个英文单词

  • 在命名表的列时,不要重复表的名称。例如,在名employe的表中避免使用名为employee_lastname的字段

  • 不要在列的名称中包含数据类型

  • 字段命名使用完整名称,禁止缩写

  • 表中字段是另外一张表的主键,则为表名+id ,体现关联关系 示例:user_id

5.2.2 命名规范

名词 示例:user_id user_name sex
动宾短语 示例:is_friend is_good

5.2.3 待优化命名示例

大小写规则不统一
错误示例:user_id houseID
说明:使用统一规则,修改为”user_id”,”house_id”

加下划线规则不统一
错误示例:username userid isfriend isgood
说明:使用下划线进行分类,提升可性,方便管理,修改为”user_name”,”user_id”,”is_friend”,”is_good”

字段表示不明确
错误示例:uid pid
说明:使用完整名称,提高可读性,修改为”user_id”,”person_id”

5.2.4 字段类型规范

  • 所有字段在设计时,除以下数据类型timestamp、image、datetime、smalldatetime、uniqueidentifier、binary、sql_variant、binary 、varbinary外,必须有默认值,字符型的默认值为一个空字符值串’’,数值型的默认值为数值0,逻辑型的默认值为数值0
  • 系统中所有逻辑型中数值0表示为“假”,数值1表示为“真”,datetime、smalldatetime类型的字段没有默认值,必须为NULL
  • 用尽量少的存储空间来存储一个字段的数据

使用int就不要使用varchar、char,

用varchar(16)就不要使varchar(256)

IP地址使用int类型

固定长度的类型最好使用char,例如:邮编(postcode)

能使用tinyint就不要使用smallint,int

最好给每个字段一个默认值,最好不能为null

字符转化为数字(能转化的最好转化,同样节约空间、提高查询性能)
避免使用NULL字段(NULL字段很难查询优化、NULL字段的索引需要额外空间、NULL字段的复合索引无效)
少用text类型(尽量使用varchar代替text字段)

5.2.5数据库中每个字段的规范描述

  • 尽量遵守第三范式的标准(3NF)

表内的每一个值只能被表达一次
表内的每一行都应当被唯一的标示
表内不应该存储依赖于其他键的非键信息

  • 如果字段事实上是与其它表的关键字相关联而未设计为外键引用,需建索引,大数据需要分库分表除外
  • 如果字段与其它表的字段相关联,需建索引
  • 如果字段需做模糊查询之外的条件查询,需建索引
  • 除了主关键字允许建立簇索引外,其它字段所建索引必须为非簇索引

5.3表设计

  • 表必须定义主键,默认为ID,整型自增,如果不采用默认设计必须咨询DBA进行设计评估。
  • ID字段作为自增主键。一般所有表都要有id, id必为主键,类型为bigint unsigned,单表时自增、步长为1。一般情况下主键id和业务没关系的。
  • 强烈建议不使用外键, 数据的完整性靠程序来保证。
  • 多表中的相同列,必须保证列定义一致。
  • 使用InnoDB,字符集:utf8mb4、排序规则:utf8mb4_general_ci。
  • 一般情况下每张表都有着五个字段,追踪数据的来源和修改,并且只能逻辑删除,不能物理删除,重要!
  • 单表一到两年内数据量超过500w或数据容量超过10G考虑分表,且需要提前考虑历史数据迁移或应用自行删除历史数据。
  • 单条记录大小禁止超过8k, 一方面字段不要太多,有的都能上百,甚至几百个,另一方面字段的内容不易过大,像文章内容等这种超长内容的需要单独存到另一张表。
  • 日志类数据不建议存储在MySQL上,优先考虑Hbase或OB,如需要存储请找DBA评估使用压缩表存储。
  • 为了提高查询效率,可以适当的数据冗余,注意是适当。
  • 字符串为主键很难做查询优化
  • 禁止使用float、double类型,建议使用decimal或者int替代。
  • 禁止使用blob、text类型保留大文本、文件、图片,建议使用其他方式存储,MySQL只保存指针信息。
    ————————————————
    版权声明:本文为CSDN博主「码农书生」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/lijinzhou2017/article/details/108533932

5.4 参考设计

5.4.1 应用场景

实现功能: 根据,综合,类型,地区,年份,演员等多级筛选。
一部电影对应多个类型
数据库 设计规范数据库设计样例_第1张图片

数据库 设计规范数据库设计样例_第2张图片

如上图所示,红框中的视频筛选标签,应该怎么设计数据库表结构?除了前台筛选,还想支持在管理后台灵活配置这些筛选标签。

实体类表:
类型表、地区表、年份表、演员表、片名表

关系类表:
片名表对应 实体类关系表:

5.4.2 需求分析

1 可以根据红框的标签筛选视频

2 其中综合标签比较特殊,和类型、地区、年份、演员等不一样

  • 综合是根据业务逻辑取值,并不需要入库
  • 类型、地区、年份、演员等需要入库

3 设计表结构时要考虑到

  • 方便获取标签信息,方便把标签信息缓存处理方便
  • 根据标签筛选视频,方便我们写后续的业务逻辑

5.4.3 设计思路

1.综合标签(最热,好评,最新,即将上线)可以写到配置文件中 (威者写在前端),这些信息不需要灵活配置,所以不需要保存到数据库中
2.类型、地区、年份、演员都设计单独的表
3.视频表中设计标签表的外键,方便视频列表筛选取值
4.标签信息写入缓存,提高接口响应速度
5.类型、地区、年份、演员表也要支持对数据排序,方便后期管理维护

5.4.4 表结构设计

视频表
数据库 设计规范数据库设计样例_第3张图片

其他和视频直接相关的字段(比如名称)省略不写

类型表
数据库 设计规范数据库设计样例_第4张图片
sort用来决定类型排序顺序,

年份表
数据库 设计规范数据库设计样例_第5张图片
年份表有一个10年代,所以需要排序字段灵活配置
演员表
数据库 设计规范数据库设计样例_第6张图片
表结构设计完了,还需要考虑缓存

5.4.5 缓存策略

首先这些不会频繁更新的筛选条件建议使用缓存

数据库 设计规范数据库设计样例_第7张图片
1.比较常用的就是redis缓存。

2.再进阶一点,如果你使用docker,可以把这些配置信息写入docker容器所在物理机的内存中,而不用请求其他节点的redis,进一步降低网络传输带来的耗时损耗。

3.筛选条件这类配置信息,客户端和服务端可以约定一个更新缓存的机制,客户端直接缓存配置信息,进一步提高性能。

列表数据自动缓存
很多框架都是支持自动缓存处理的,比如goframe和go-zero

Q1 冗余设计和一致性问题

提问:

一个表里做了这么多外键,如果我要查各自的名称,势必要关联4张表,对于这种存在多外键关联的这种表,要不要做几余呢(直接在主表里几余各自的名称字段)?
要是保证一致性的话,就势必会影响性能,如果做几余的话,又无法保证一致

回答:

目前我们解决的是视频列表筛选问题。 你提到的这个场景是在视频详情信息中,如果要展示这些外键的名称怎么设计更好 我的建议是这样的:

1.根据需求可以做适当几余,比如你的主表信息量不大(百万级别以下),配置信息修改后同步修改冗余字段的成本并不高。

2.或者像我文章中写的不做几余设计,但是会把外键信息缓存,业务查询从缓存中取值。 3或者将视频详情的查询结果整体进行缓存

还是看具体需求,如果这些筛选信息不变化或者不需要手工管理,甚至不需要设计表,直接写死在代码的配置文件中也可以。进一步降低DB压力,提高性能

Q2 为什么设计外键

提问:

为什么要设计外键关联? 直接写到视频表中不就行了? 这么设计的意义在哪里?

回答:

1.关键问题是想解决管理后台灵活配置
2.如果没有这个需求,我们可以直接把筛选条件以配置文件的方式写死在程序中,降低复杂度。
3.站在我的角度:这个功能的筛选条件变化并不会很大,所以很懂你的意思。也建议像我2.中的方案去做,去和产品经理拉扯喽~

总结

这篇文章介绍了设计数据库表结构应该考虑的几个方面,还有优雅设计的个原则,举了一个例子分享了我的设计思路,为了提高性能我们也要从多方面考虑缓存问题。
收获最大的还是和大家的交流讨论,总结一下

1.首先,一定要先搞清楚业务需求。比如我的例子中,如果不需要灵活设置,完全可以写到配置文件中,并不需要单独设计外键。主表中直接保存各种筛选标签名称(注意维护的问题,要考虑到数据一致性)

2.数据库表结构设评一定考虑数据量和并发量,我的例子中如果数量量小,可以适当做冗余设计,降低业务复杂度

参考

https://www.cnblogs.com/cszjc/p/14200597.html
基于学生选课系统的软件系统设计方案

【「有问必答」初学后端,如何做好表结构设计?】 https://www.bilibili.com/video/BV1xk4y1t7Pj/?share_source=copy_web&vd_source=fe6c23f6f1353ed1eff5d5e866171572

你可能感兴趣的:(数据系统概论,mysql,spring,数据库,设计规范,oracle)