阅读更多
数据存储的重要性大家都知道,在此就没必要去强调了。 那么如何将软件运行的这些数据有效合理的存储起来呢? 在设计时可以参考如下几点:
1、表结构的设计优先考虑遵循3范式
为什么要遵循第3范式?
遵循第3范式的设计可以使数据存储简洁、清晰、数据不会有冗余的情况。
3范式的基本原则:
a. 字段必须不可再分割
b. 所有字段必须完全依赖于主键, 绝对不允许依赖于部分主键,尤其是在出现双主键的情况下
c. 不允许出现传递依赖的情况
下面举2个不满足范式的示例:
订单明细表:【OrderDetail】(OrderID,ProductID,UnitPrice,Discount,Quantity,ProductName)。 一个订单中可以订购多种产品,所以单单一个 OrderID 是不足以成为主键的,主键应该是(OrderID,ProductID)。显而易见 Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID,ProductID),而 UnitPrice,ProductName 只依赖于 ProductID。所以 OrderDetail 表不符合 2NF
订单表【Order】(OrderID,OrderDate,CustomerID,CustomerName, CustomerAddr,CustomerCity)主键是(OrderID), CustomerName,CustomerAddr,CustomerCity 直接依赖的是 CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合 3NF。
2、有时候也可以适当的反范式设计
3、单库单表情况下的主键设计使用big int 自增型数据类型
无序主键会导致索引页频繁分裂,影响性能。
主键数据类型过大,会影响查询性能和内存、带宽、IO资源。
4、分库分表情况下的主键设计要合理
详细方案可以参见《我对分库分表的认识》
5、字段类型及字段大小的设计要合理
主要还是从磁盘存储、网络带宽、节省内存空间、减少磁盘IO几方面来考量。
6、建议每个表都维护create_id、create_time、update_id、update_time额外字段
从数据安全性方面来讲方便问题追踪; 当高并发操作的情况下,采用乐观锁机制可以提高并发性能。