本人是在Linux环境上通过docker快速部署以供测试使用的(参考达梦数据库官网链接),实际项目上线时建议不要使用docker去部署,主要有以下原因:
数据安全问题
不要将数据储存在容器中,这也是 Docker 官方容器使用技巧中的一条。容器随时可以停止、或者删除。当容器被rm掉,容器里的数据将会丢失。为了避免数据丢失,用户可以使用数据卷挂载来存储数据。但是容器的 Volumes 设计是围绕 Union FS 镜像层提供持久存储,数据安全缺乏保证。如果容器突然崩溃,数据库未正常关闭,可能会损坏数据。另外,容器里共享数据卷组,对物理机硬件损伤也比较大。即使你要把 Docker 数据放在主机来存储 ,它依然不能保证不丢数据。使用当前的存储驱动程序,Docker 仍然存在不可靠的风险。如果容器崩溃并数据库未正确关闭,则可能会损坏数据。
性能问题
大家都知道,达梦属于关系型数据库,对IO要求较高。当一台物理机跑多个时,IO就会累加,导致IO瓶颈,大大降低 达梦的读写性能。在一次Docker应用的十大难点专场上,某国有银行的一位架构师也曾提出过:“数据库的性能瓶颈一般出现在IO上面,如果按 Docker 的思路,那么多个docker最终IO请求又会出现在存储上面。现在互联网的数据库多是share nothing的架构,可能这也是不考虑迁移到 Docker 的一个因素吧”。
针对性能问题有些同学可能也有相对应的方案来解决:
(1) 数据库程序与数据分离
如果使用 Docker 跑达梦,数据库程序与数据需要进行分离,将数据存放到共享存储,程序放到容器里。如果容器有异常或 达梦服务异常,自动启动一个全新的容器。另外,建议不要把数据存放到宿主机里,宿主机和容器共享卷组,对宿主机损坏的影响比较大。
(2) 跑轻量级或分布式数据库
Docker 里部署轻量级或分布式数据库,Docker 本身就推荐服务挂掉,自动启动新容器,而不是继续重启容器服务。
(3) 合理布局应用
对于IO要求比较高的应用或者服务,将数据库部署在物理机或者KVM中比较合适。目前腾讯云的TDSQL和阿里的Oceanbase都是直接部署在物理机器,而非Docker 。
网络问题
要理解 Docker 网络,您必须对网络虚拟化有深入的了解。数据库需要专用的和持久的吞吐量,以实现更高的负载。未解决的 Docker 网络问题在1.9版本依然没有得到解决。把这些问题放在一起,容器化使数据库容器很难管理。你需要花多少时间解决 Docker 网络问题?将数据库放在专用环境不会更好吗?节省时间来专注于真正重要的业务目标。
状态
在 Docker 中打包无状态服务是很酷的,可以实现编排容器并解决单点故障问题。但是数据库呢?将数据库放在同一个环境中,它将会是有状态的,并使系统故障的范围更大。下次您的应用程序实例或应用程序崩溃,可能会影响数据库。知识点:在 Docker 中水平伸缩只能用于无状态计算服务,而不是数据库。Docker 快速扩展的一个重要特征就是无状态,具有数据状态的都不适合直接放在 Docker 里面,如果 Docker 中安装数据库,存储服务需要单独提供。目前,TX云的TDSQL(金融分布式数据库)和阿里云的Oceanbase(分布式数据库系统)都直接运行中在物理机器上,并非使用便于管理的 Docker 上。
资源隔离
资源隔离方面,Docker 确实不如虚拟机KVM,Docker是利用Cgroup实现资源限制的,只能限制资源消耗的最大值,而不能隔绝其他程序占用自己的资源。如果其他应用过渡占用物理机资源,将会影响容器里达梦数据库的读写效率。需要的隔离级别越多,获得的资源开销就越多。相比专用环境而言,容易水平伸缩是Docker的一大优势。然而在 Docker 中水平伸缩只能用于无状态计算服务,数据库并不适用。我们没有看到任何针对数据库的隔离功能,那为什么我们应该把它放在容器中呢?
云平台的不适用性
大部分人通过共有云开始项目。云简化了虚拟机操作和替换的复杂性,因此不需要在夜间或周末没有人工作时间来测试新的硬件环境。当我们可以迅速启动一个实例的时候,为什么我们需要担心这个实例运行的环境?这就是为什么我们向云提供商支付很多费用的原因。当我们为实例放置数据库容器时,上面说的这些便利性就不存在了。因为数据不一致,新实例不会与老实例兼容,如果要限制实例使用单机服务,应该让 DB 使用非容器化环境,我们仅仅需要为计算服务层保留弹性扩展的能力。
运行数据库的环境需求
常看到 DBMS 容器和其他服务运行在同一主机上。然而这些服务对硬件要求是非常不同的。数据库(特别是关系型数据库)对 IO 的要求较高。一般数据库引擎为了避免并发资源竞争而使用专用环境。如果将你的数据库放在容器中,那么将浪费你的项目的资源。因为你需要为该实例配置大量额外的资源。在公有云,当你需要 34G 内存时,你启动的实例却必须开 64G 内存。在实践中,这些资源并未完全使用。怎么解决?您可以分层设计,并使用固定资源来启动不同层次的多个实例。水平伸缩总是比垂直伸缩更好。
具体安装步骤参考链接:https://blog.csdn.net/eason2099/article/details/127492629
安装步骤很简单,提供的软件也很全面,特别是数据库迁移工具,支持市面上许多主流的大型数据库,例如:Oracle、SQLServer、MySQL、DB2、PostgreSQL、Informix、Kingbase、Sybase等,本人亲测,十分好用,效率很高。
SpringBoot项目要想整合达梦数据库,首先驱动必定少不了,其次就是配置文件。
SpringBoot和Mybatis-Plus的版本建议用新一点的:
框架 | 版本 |
---|---|
SpringBoot | 2.2.0.RELEASE |
mybatis-plus | 3.4.1 |
<dependency>
<groupId>com.damenggroupId>
<artifactId>DmJdbcDriver18artifactId>
<version>8.1.1.193version>
dependency>
注意:
这个jar包直接导入是不行,我是通过将jar包上传到我自己搭建的Maven私服仓库才可以导入,具体如何搭建请参考我写的这篇文章:Maven私有仓库搭建以及使用,下图是驱动jar包的位置,是在安装有达梦Windows环境可视化软件的目录下:
spring:
datasource:
type: com.alibaba.druid.pool.DruidDataSource
driver-class-name: dm.jdbc.driver.DmDriver
url: jdbc:dm://10.18.93.139:5236/dpmp
#数据库的使用用户
username: SYSDBA
#实际使用数据库的密码
password: SYSDBA001
.
.
.
.
.
.
mybatis-plus:
configuration:
cache-enabled: false
local-cache-scope: statement
global-config:
db-config:
logic-delete-value: 1
logic-not-delete-value: 0
schema: dpmp # 达梦需要加上这个,这是mybatis-plus的配置,如果不加,则查询不到该模式下的数据
mapper-locations: classpath:mapper/dm/*.xml
附上我的数据库结构,达梦可以将数据库名和表名自动转换为大写:
这样配置过后,项目基本就能运行起来了,下面总结一下我遇到的一些问题:
精度问题
达梦和mysql不太一样,它对字段的精度问题很敏感,我在迁移mysql中数据到达梦时,mysql中某个字段的精度是VARCHAR(16),但实际上却超出了该精度,但mysql没有报错,而迁移到达梦就会报错。
关键词问题
达梦和mysql不一样的地方还在于,达梦对关键词也很敏感,我在迁移mysql中数据到达梦时,mysql中有两张表:user
、role
,以及某张表的字段名:reverse
,这些名称和都是数据库关键词,但是在mysql中不会报错,而迁移到达梦就会报错,后来修改成非关键词就不再报错。
别名问题
在迁移mysql中数据到达梦时,mysql中的某个xml文件中,有个别名:comment
,这也是数据库关键词,后来加上双引号""
,才没有报错。
group by
在迁移mysql中数据到达梦时,mysql中的某个xml文件中,有一串sql,是我同事写的:
SELECT t1.id,
t1.data_name,
t1.update_id,
t1.device_id,
is_structure,
file_path,
file_type,
database_name,
database_string,
table_name,
calc_way,
integrity_algorithm,
period,
key_fields,
protect_fields,
t1.update_id,
t2.account,
t2.account_password
FROM dpmp.data_info t1
LEFT JOIN dpmp.account t2
ON t1.account_id = t2.id
WHERE t1.deleted = 0
AND t1.id IN
<foreach collection="ids" INDEX="index" OPEN="(" CLOSE=")" item="item" separator=","> #{item}
GROUP BY t1.id;
这串sql语句在mysql中不会报错,但是在达梦中就会报错,原因是因为不是标准sql,select中的字段必须全部出现在group by中。
达梦数据库是一款不错的国产数据库,对关键词、大小写、标准sql语法十分敏感,非常适合新手学习标准的sql编程。这篇文章都是本人的个人看法,如有不对的地方,还望各位大佬多多指教。
本文为达梦在线服务平台【与达梦同行】征文活动投稿文章,活动详情:
【与达梦同行】 第一届达梦数据库技术征文大赛来啦!