MongoDB 与 MySQL 对比
由于公司系统使用MongoDB,虽然之前了解,但并没有深入学习MongoDB。见此机会,参考《MongoDB 权威指南》深入学习,结合对比MySQL,加深对两种不同数据库的理解。特把学习过程记录和大家分享。
一、 表结构对比
表结构对比 | MongoDB | MySQL |
---|---|---|
表 | collections | tables |
行 | documents | rows |
主键 | _id | id 与业务无关的值作为主键。如果没有显式地在表定义时指定主键,InnoDB存储引擎会为每一行生成一个6字节的ROWID |
主键生成策略 | 24位的字符串(time + machine + pid + inc),自己指定 | UUID, 自增 |
面向Documents数据库 | T | F |
面向行数据库 | F | T |
约束 | 无 | 主键约束,外键约束 |
二、 数据类型对比
数据类型对比 | MongoDB | MySQL |
---|---|---|
整形 | NumberInt("3"),NumberLong("3") | TINYINT, SMALLINT, MEDIUMINT, INT, BIGINT |
浮点 | 默认使用64位浮点型数值 | FLOAT, DOUBLE, DECIMAL |
字符 | utf8 字符串 | VARCHAR, CHAR |
日期/时间 | new Date(), 自新纪元依赖经过的毫秒数,不存储时区 | DATE, DATETIME, TIMESTAMP |
NULL | null | 不支持(null与null不相等) |
布尔类型 | true/false | 不支持 |
正则表达式 | 支持 { "x" : /foobar/i } | 不支持 |
数组 | 支持 { "x" : ["a", "b", "c"]} | 不支持 |
二进制数据 | 支持 GridFS | BLOB, TEXT |
代码片段 | { "x" : function() { /... / } } | 不支持 |
三、 SHELL终端对比
对比项 | MongoDB | MySQL |
---|---|---|
启动 | mongo | mysql -u root -p |
查看库 | show dbs | show databases |
使用库 | use test | use test |
查看表 | show collections | show tables |
四、 查询对比
查询对比 | MongoDB | MySQL |
---|---|---|
检索单列 | db.users.find({ "age" : 27 }) | SELECT * FROM users WHERE age = 27; |
检索多列 | db.users.find({ "age" : 27, "username" : "joe" }) | SELECT * FROM users WHERE age = 27 and username = 'joe'; |
指定需要返回的键 | db.users.find({}, { "username" : 1, "email" : 1 }) | SELECT username, email FROM users; |
范围检索 | db.users.find({"age" : { "$gte" : 18, "$lte" : 30 }}) $lt, $lte, $gt, $gte 分别对应 <, <=, >, >= | SELECT * FROM users WHERE age >= 18 AND age <=30; |
不匹配检索 | db.users.find({ "username" : { "$ne" : "joe" } }) | SELECT * FROM users WHERE username <> 'joe'; |
IN 操作符 | db.raffle.find({ "ticket_no" : { "$in" : [725, 542, 390] } }) $in非常灵活,可以指定不同类型 的条件和值。 例如在逐步将用户的ID号迁移成用户名的过程中, 查询时需要同时匹配ID和用户名 | SELECT ticket_no FROM raffles WHERE ticket_no IN (725, 542, 390); |
NOT IN 操作符 | db.raffle.find({ "ticket_no" : { "$nin" : [725, 542, 390] } }) | SELECT * FROM raffles WHERE ticket_no not in (725, 542, 390); |
OR 操作符 | db.raffle.find({ "$or" : [{ "ticket_no" : 725 }, { "winner" : true }] }) | SELECT * FROM raffles WHERE ticket_no = 725 OR winner = 'true'; |
空值检查 | db.c.find({"y" : null}) null不仅会匹配某个键的值为null的文档 ,而且还会匹配不包含这个键的文档。 所以,这种匹配还会返回缺少这个键的所有文档。 如果 仅想要匹配键值为null的文档, 既要检查改建的值是否为null, 还要通过 $exists 条件 判定键值已经存在 db.c.find({ "z" : { "$in" : [null], "$exists" : true }}) | SELECT * FROM cs WHERE z is null; |
多列排序 | db.c.find().sort({ username : 1, age: -1 }) | SELECT * FROM cs ORDER BY username ASC, age DESC; |
AND操作符 | db.users.find({ "$and" : [{ "x" : { "$lt" : 1 }, { "x" : 4 } }] }) 由于查询优化器不会对 $and进行优化, 所以可以改写成下面的 db.users.find({ "x" : { "$lt" : 1, "$in" : [4] } }) | SELECT * FROM users WHERE x > 1 AND x IN (4); |
NOT 操作符 | db.users.find({ "id_num" : { "$not" : { "$mod" : [5,1] } } }) | SELECT * FROM users WHERE id_num NOT IN (5,1); |
LIKE 操作符(正则匹配) | db.blogs.find( { "title" : /post?/i } ) MongoDB 使用Perl兼容的正则表达式(PCRE) 库来匹配正则表达式, 任何PCRE支持表达式的正则表达式语法都能被MongoDB接受 | SELECT * FROM blogs WHERE title LIKE "post%"; |
五、 函数对比
{ "_id" : 1, "item" : "abc", "price" : 10, "quantity" : 2 }
{ "_id" : 2, "item" : "jkl", "price" : 20, "quantity" : 1 }
{ "_id" : 3, "item" : "xyz", "price" : 5, "quantity" : 5 }
{ "_id" : 4, "item" : "abc", "price" : 10, "quantity" : 10 }
{ "_id" : 5, "item" : "xyz", "price" : 5, "quantity" : 10 }
函数对比 | MongoDB | MySQL |
---|---|---|
COUNT | db.foo.count() | SELECT COUNT(id) FROM foo; |
DISTINCT | db.runCommand({ "distinct": "people", "key": "age" }) | SELECT DISTINCT(age) FROM people; |
MIN | db.sales.aggregate( [ { $group: { _id: {}, minQuantity: { $min: "$quantity" } } } ]); 结果: { "_id" : { }, "minQuantity" : 1 } | SELECT MIN(quantity) FROM sales; |
MAX | db.sales.aggregate( [ { $group: { _id: {}, maxQuantity: { $max: "$quantity" } } } ]); | SELECT MAX(quantity) FROM sales; |
AVG | db.sales.aggregate( [ { $group: { _id: {}, avgQuantity: { $avg: "$quantity" } } } ]); | SELECT AVG(quantity) FROM sales; |
SUM | db.sales.aggregate( [ { $group: { _id: {}, totalPrice: { $sum: "$price" } } } ]); | SELECT SUM(price) FROM sales; |
六、 CURD 对比
CURD 对比 | MongoDB | MySQL |
---|---|---|
插入数据 | post = {"title" : "My Blog Post", "content" : "Here`s my blog post"}; db.blog.insert(post) 如果blog 这个集合不存在,则会创建 | INSERT INTO blogs(title , blog_content ) VALUES ('My Blog Post', 'Here`s my blog post.') |
批量插入 | db.blog.batchInsert([{ "title" : "AAA", "content" : "AAA---" }, { "title" : "BBB", "content" : "JJJJ--" }]) 当前版本的MongoDB能接受最大消息长度48MB, 所以在一次批量插入中能插入的文档是有限制的。 并且在执行批量插入的过程中,有一个文档插入失败, 那么在这个文档之前的所有文档都会成功插入到集合中, 而这个文档以及之后的所有文档全部插入失败。 | INSERT INTO blogs(title , blog_content ) VALUES('AAA', 'AAA---'), ('BBB', 'BBB---'); |
查询数据 | db.blog.find(); db.blog.findOne(); | SELECT * FROM blogs; SELECT * FROM blogs LIMIT 1; |
更新旧数据 | post.blog_content = "十一"; db.blog.update({title: "My Blog Post"}, post) | UPDATE set blog_content = "十一" WHERE title = "My Blog Post"; |
更新新增COLUMN | post.comments = "very good"; db.blog.update({title : "My Blog Post"}, post) | ALTER table blogs ADD COLUMN comments varchar(200); UPDATE blogs set comments = "very good" WHERE title = 'My Blog Post'; |
删除数据 | db.blog.remove({ title : "My Blog Post" }) | DELETE FROM blogs WHERE title = 'My Blog Post' |
校验 | post.blog_visit = 123; db.blog.update({title : "My Blog Post"}, post); post.blog_visit = "asd.123aaa"; db.blog.update({title : "My Blog Post"}, post) 插入的时候,检查大小。所有的文档都必须小于16MB。 这样做的目的是为了防止不良的模式设计,并且保持性能一直。由于MongoDB只进行最基本的检查,所以插入非法的数据很容易。 | 类型校验,长度校验。 ALTER table blogs ADD COLUMN blog_visit INT(10); UPDATE blogs SET blog_visit = "asdasd" WHERE id = 1; ERROR 1366 (HY000): Incorrect integer value: 'asdasd' for column 'blog_visit' at row 1 |
删除表 | db.blog.remove({}), db.blog.drop() | DELETE from blogs; drop table blogs; |
七、有的没的
MongoDB:
-
GridFS
可以用来存储大文件(>16M), 与MySQL BLOB,TEXT 类似。
-
MapReduce
MapReduce
是一种计算模型,简单的说就是将大批量的工作数据分解执行,然后再将结果合并成
最终结果。MongoDB提供的MapReduce
非常灵活,对于大规模数据分析也相当实用。
-
时间有限的集合
MongoDB 2.2 引入一个新特性--
TTL集合,TTL集合支持失效时间设置,使用expireAfterSeconds 来实现
当超过指定时间后,集合自动清除超时的文档,这用来保存一些诸如session会话信息
的时候非常有用,或者存储数据使用。戳这里
-
无JOIN
MongoDB 为了更快的读,以及更方便的分布式,抛弃了JOIN操作。
JOIN开销其实很大。 -
关于锁
当资源被代码的多个部分所共享时,需要确定这处资源只能在一个地方被操作。
就版本的MongoDB(pre
2.0)拥有一个全局的写入锁。这就意味着贯穿整个服务器只有一个地方做写操作。
这就可能导致数据库因为某个地方锁定超负载而停滞。这个问题在2.0版本中得到
了显著的改善,并且在2.2版本中得到了进一步的加强。MongoDB
2.2使用数据库级别的锁再这个问题上迈进了一大步。图中是两个不同版本的MongoDB,写入性能对比。
戳这里
戳这里MySQL InnoDB使用行级锁,有效提高并发。
-
无事务
不像MySQL
这些多行数据原子操作的传统数据库。MongoDB只支持单个文件的原子修改。
但这也正是MongoDB可以更快地读的原因,没有事务这些负载的处理。MongoDB
可以轻松处理TB级别的数据。 -
磁盘消耗
MongoDB
会消耗太多的磁盘空间了。当然,这与它的编码方式有关,因为MongoDB会通过预分配
大文件空间来避免磁盘碎片问题。它的工作方式是这样:在创建数据库时,系统会创建
一个名为[db_name].0的文件,当该文件有一半以上被使用时,系统会再次创建一个名
为[db_namel].1的文件,该文件的大小是方才的两倍。这个情况会持续不断的发生,因此
256、512、1024、2048大小的文件会被写到磁盘上。
MySQL:
-
强大的引擎
InnoDB 引擎: MySQL默认的事务性引擎。它被设计用来处理大量的短期事务,短期
事务大部分情况是正常提交的,很少会被回滚。InnoDB采用MVCC来支持高并发。MyISAM 引擎: 5.1以及之前的默认版本。全文索引,压缩,空间函数,但是MyISAM不支持事务和
行级锁。MyISAM最整张表加锁,而不是针对行。读取时会对需要读到的所有表加
共享锁,写入时则对表加排它锁。Memory 引擎:比MyISAM表块一个数量级,因为所有的数据都保存在内存中,不需要进行磁盘I/O。数据会丢失
Infobright 是最有名的面向列的存储引擎。但该引擎不支持索引。
-
事务
确保数据库的状态从一个一致状态转变为另一个一致状态。一致状态的含义是数据库中
的数据应满足完整性约束。
-
schema
有利于数据整理,数据存储,并执行正规化的行为。 保证数据的完整性,一致性。
描述了数据存储的模板,比如创建table。
校验数据的格式,比如整形的column 就不能存放字符串数据。
八、 MySQL 与 MongoDB 写入对比
options | MySQL | MongoDB |
---|---|---|
Time taken for tests: | 548.281 seconds | 661.318 seconds |
Total transferred: | 44000000 bytes | 44200000 bytes |
Requests per second: | 182.39 [#/sec] | 151.21 [#/sec] |
Time per request: | 274.141 [ms] | 330.659 [ms] |
Time per request(across all concurrent requests): | 5.483 [ms] | 6.613 [ms] |
Transfer rate: | 78.37 [Kbytes/sec] received | 65.27 [Kbytes/sec] received |
在本测试例子中,MySQL 写入情况好于 MongoDB
压测参考命令:
ab -c 50 -n 100000 http://127.0.0.1:6666/deals/mysql_write
ab -c 50 -n 100000 http://127.0.0.1:6666/deals/mongodb_write
九、 MySQL 与 MongoDB 读取对比
options | MySQL | MongoDB |
---|---|---|
Time taken for tests: | 1181.881 seconds | 606.406 seconds |
Failed requests: | 2239 | 0 |
Non-2xx responses: | 2239 | 0 |
Total transferred: | 359397490 bytes | 44100000 bytes |
Requests per second: | 84.61 [#/sec] | 164.91 [#/sec] |
Time per request: | 590.941 [ms] | 303.203 [ms] |
Time per request(across all concurrent requests): | 11.819 [ms] | 6.064 [ms] |
Transfer rate: | 296.96 [Kbytes/sec] received | 71.02 [Kbytes/sec] received |
在本测试例子中, MySQL 读取性能没有 MongoDB好
压测参考命令:
ab -c 50 -n 100000 http://127.0.0.1:6666/deals/mysql_read
ab -c 50 -n 100000 http://127.0.0.1:6666/deals/mongodb_read
参考
MySQL 外键使用
MongoDB
MongoDB核心贡献者:不是MongoDB不行,而是你不懂!
MongoDB和MySQL性能测试及其结果分析
Apache Benchmark 的使用的个人浅薄经验