lein_wang

MongoDB中的范式与反范式

本文摘录自《MongoDB权威指南》第八章，可以彻底回答以下两个问题：

http://segmentfault.com/q/1010000000364944
http://segmentfault.com/q/1010000000364944

数据表示的方式有很多种，其中最重要的问题之一就是在多大程度上对数据进行范式化。范式化（normalization）是将数据分散到多个不同的集合，不同集合之间可以相互引用数据。虽然很多文档可以引用某一块数据，但是这块数据只存储在一个集合中。所以，如果要修改这块数据，只需修改保存这块数据的那一个文档就行了。但是，MongoDB没有提供连接（join）工具，所以在不同集合之间执行连接查询需要进行多次查询。

反范式化（denormalization）与范式化相反：将每个文档所需的数据都嵌入在文档内部。每个文档都拥有自己的数据副本，而不是所有文档共同引用同一个数据副本。这意味着，如果信息发生了变化，那么所有相关文档都需要进行更新，但是在执行查询时，只需要一次查询，就可以得到所有数据。

决定何时采用范式化何时采用反范式化时比较困难的。范式化能够提高数据写入速度，反范式化能够提高数据读取速度。需要根据自己应用程序的十几需要仔细权衡。

数据表示的例子

假设要保存学生和课程信息。一种表示方式是使用一个students集合（每个学生是一个文档）和一个classes集合（每门课程是一个文档）。然后用第三个集合studentsClasses保存学生和课程之间的联系。

> db.studentsClasses.findOne({"studentsId": id});
{
  "_id": ObjectId("..."),
  "studentId": ObjectId("...");
  "classes": [
    ObjectId("..."),
    ObjectId("..."),
    ObjectId("..."),
    ObjectId("...")
  ]
}

如果比较熟悉关系型数据库，可能你之前建国这种类型的表连接，虽然你的每个记过文档中可能只有一个学生和一门课程（而不是一个课程“_id”列表）。将课程放在数组中，这有点儿MongoDB的风格，不过实际上通常不会这么保存数据，因为要经历很多次查询才能得到真实信息。

假设要找到一个学生所选的课程。需要先查找students集合找到学生信息，然后查询studentClasses找到课程“_id”，最后再查询classes集合才能得到想要的信息。为了找出课程信息，需要向服务器请求三次查询。很可能你并不想再MongoDB中用这种数据组织方式，除非学生信息和课程信息经常发生变化，而且对数据读取速度也没有要求。

如果将课程引用嵌入在学生文档中，就可以节省一次查询：

{
  "_id": ObjectId("..."),
  "name": "John Doe",
  "classes": [
    ObjectId("..."),
    ObjectId("..."),
    ObjectId("..."),
    ObjectId("...")
  ]
}

"classes"字段是一个数组，其中保存了John Doe需要上的课程“_id”。需要找出这些课程的信息时，就可以使用这些“_id”查询classes集合。这个过程只需要两次查询。如果数据不需要随时访问也不会随时发生变化（“随时”比“经常”要求更高），那么这种数据组织方式是非常好的。

如果需要进一步优化读取速度，可以将数据完全反范式化，将课程信息作为内嵌文档保存到学生文档的“classes”字段中，这样只需要一次查询就可以得到学生的课程信息了：

{
  "_id": ObjectId("..."),
  "name": "John Doe"
  "classes": [
    {
      "class": "Trigonometry",
      "credites": 3,
      "room": "204"
    },
    {
      "class": "Physics",
      "credites": 3,
      "room": "159"
    },
    {
      "class": "Women in Literature",
      "credites": 3,
      "room": "14b"
    },
    {
      "class": "AP European History",
      "credites": 4,
      "room": "321"
    }
  ]
}

上面这种方式的优点是只需要一次查询就可以得到学生的课程信息，缺点是会占用更多的存储空间，而且数据同步更困难。例如，如果物理学的学分变成了4分（不再是3分），那么选修了物理学课程的每个学生文档都需要更新，而且不只是更新“Physics”文档。

最后，也可以混合使用内嵌数据和引用数据：创建一个子文档数组用于保存常用信息，需要查询更详细信息时通过引用找到实际的文档：

{
  "_id": ObjectId("..."),
  "name": "John Doe",
  "classes": [
    {
      "_id": ObjectId("..."),
      "class": "Trigonometry"    
    },
    {
      "_id": ObjectId("..."),
      "class": "Physics"
    }, {
      "_id": ObjectId("..."),
      "class": "Women in Literature"
    }, {
      "_id": ObjectId("..."),
      "class": "AP European History"
    }
  ]
}

这种方式也是不错的选择，因为内嵌的信息可以随着需求的变化进行修改，如果希望在一个页面中包含更多（或者更少）的信息，就可以将更多（或者更少）的信息放在内嵌文档中。

需要考虑的另一个重要问题是，信息更新更频繁还是信息读取更频繁？如果这些数据会定期更新，那么范式化是比较好的选择。如果数据变化不频繁，为了优化更新效率儿牺牲读写速度就不值得了。

例如，教科书上介绍范式化的一个例子可能是将用户和用户地址保存在不同的集合中。但是，人们几乎不会改变住址，所以不应该为了这种概率极小的情况（某人改变了住址）而牺牲每一次查询的效率。在这种情况下，应该将地址内嵌在用户文档中。

如果决定使用内嵌文档，更新文档时，需要设置一个定时任务（cron job），以确保所做的每次更新都成功更新了所有文档。例如，我们试图将更新扩散到多个文档，在更新完成所有文档之前，服务器崩溃了。需要能够检测到这种问题，并且重新进行未完的更新。

一般来说，数据生成越频繁，就越不应该将这些内嵌到其他文档中。如果内嵌字段或者内嵌字段数量时无限增长的，那么应该将这些内容保存在单独的集合中，使用引用的方式进行访问，而不是内嵌到其他文档中，评论列表或者活动列表等信息应该保存在单独的集合中，不应该内嵌到其他文档中。

最后，如果某些字段是文档数据的一部分，那么需要将这些字段内嵌到文档中。如果在查询文档时经常需要将某个字段排除，那么这个字段应该放在另外的集合中，而不是内嵌在当前的文档中。

更适合内嵌	更适合引用
子文档较小	子文档较大
数据不会定期改变	数据经常改变
最终数据一致即可	中间阶段的数据必须一致
文档数据小幅增加	文档数据大幅增加
数据通常需要执行二次查询才能获得	数据通常不包含在结果中
快速读取	快速写入

假如我们有一个用户集合。下面是一些可能需要的字段，以及它们是否应该内嵌到用户文档中。

用户首选项（account preferences）

用户首选项只与特定用户相关，而且很可能需要与用户文档内的其他用户信息一起查询。所以用户首选项应该内嵌到用户文档中。

最近活动（recent activity）

这个字段取决于最近活动增长和变化的频繁程度。如果这是个固定长度的字段（比如最近的10次活动），那么应该将这个字段内嵌到用户文档中。

好友（friends）

通常不应该将好友信息内嵌到用户文档中，至少不应该将好友信息完全内嵌到用户文档中。下节会介绍社交网络应用的相关内容。

所有由用户产生的内容

不应该内嵌在用户文档中。

基数

一个集合中包含的对其他集合的引用数量叫做基数（cardinality）。常见的关系有一对一、一对多、多对多。假如有一个博客应用程序。每篇博客文章（post）都有一个标题（title），这是一个对一个的关系。每个作者（author）可以有多篇文章，这是一个对多的关系。每篇文章可以有多个标签（tag），每个标签可以在多篇文章中使用，所以这是一个多对多的关系。

在MongoDB中，many（多）可以被分拆为两个子分类：many（多）和few（少）。假如，作者和文章之间可能是一对少的关系：每个作者只发表了为数不多的几篇文章。博客文章和标签可能是多对少的关系：文章数量实际上很可能比标签数量多。博客文章和评论之间是一对多的关系：每篇文章可以拥有很多条评论。

只要确定了少与多的关系，就可以比较容易地在内嵌数据和引用数据之间进行权衡。通常来说，“少”的关系使用内嵌的方式会比较好，“多”的关系使用引用的方式比较好。

好友、粉丝、以及其他的麻烦事情

亲近朋友，远离敌人

很多社交类的应用程序都需要链接人、内容、粉丝、好友，以及其他一些事物。对于这些高度关联的数据使用内嵌的形式还是引用的形式不容易权衡。这一节会介绍社交图谱数据相关的注意事项。通常，关注、好友或者收藏可以简化为一个发布、订阅系统：一个用户可以订阅另一个用户相关的通知。这样，有两个基本操作需要比较高效：如何保存订阅者，如何将一个事件通知给所有订阅者。

比较常见的订阅实现方式有三种。第一种方式是将内容生产者内嵌在订阅者文档中：

{
    "_id": ObjectId("..."),
    "username": "batman",
    "email": "[email protected]",
    "following": [
        ObjectId("..."),
        ObjectId("...")
    ]
}

现在，对于一个给定的用户文档，可以使用形如db.activities.find({"user": {"$in": user["following"]}})的方式查询该用户感兴趣的所有活动信息。但是，对于一条刚刚发布的活动信息，如果要找出对这条信息感兴趣的所有用户，就不得不查询所有用户的“following”字段了。

另一种方式是将订阅者内嵌到生产者文档中：

{
    "_id": ObjectId("..."),
    "username": "joker",
    "email": "[email protected]",
    "followers": [
        ObjectId("..."),
        ObjectId("..."),
        ObjectId("...")
    ]
}

当这个生产者新发布一条信息时，我们立即就可以知道需要给哪些用户发布通知。这样做的缺点时，如果需要找到一个用户关注的用户列表，就必须查询整个用户集合。这样方式的优缺点与第一种方式的优缺点恰好相反。

同时，这两种方式都存在另一个问题：它们会使用户文档变得越来越大，改变也越来越频繁。通常，“following”和“followers”字段甚至不需要返回：查询粉丝列表有多频繁？如果用户比较频繁地关注某些人或者对一些人取消关注，也会导致大量的碎片。因此，最后的方案对数据进一步范式化，将订阅信息保存在单独的集合中，以避免这些缺点。进行这种成都的范式化可能有点儿过了，但是对于经常发生变化而且不需要与文档其他字段一起返回的字段，这非常有用。对“followers”字段做这种范式化使有意义的。

用一个集合来保存发布者和订阅者的关系，其中的文档结构可能如下所示：

{
    "_id": ObjectId("..."),   //被关注者的"_id"
    "followers": [
        ObjectId("..."),
        ObjectId("..."),
        ObjectId("...")
    ]
}

这样可以使用户文档比较精简，但是需要额外的查询才能得到粉丝列表。由于“followers”数组的大小经常会发生变化，所以可以在这个集合上启用“usePowerOf2Sizes”，以保证users集合尽可能小。如果将followers集合保存在另一个数据库中，也可以在不过多影响users集合的前提下对其进行压缩。

应对威尔惠顿效应

不管使用什么样的策略，内嵌字段只能在子文档或者引用数量不是特别大的情况下有效发挥作用。对于比较有名的用户，可能会导致用于保存粉丝列表的文档溢出。对于这种情况的一种解决方案使在必要时使用“连续的”文档。例如：

> db.users.find({"username": "wil"})
{
    "_id": ObjectId("..."),
    "username": "wil",
    "email": "[email protected]",
    "tbc": [
        ObjectId("123"),    // just for example
        ObjectId("456")     // same as above
    ],
    "followers": [
        ObjectId("..."),
        ObjectId("..."),
        ObjectId("..."),
        ...
    ]
}
{
    "_id": ObjectId("123"),
    "followers": [
        ObjectId("..."),
        ObjectId("..."),
        ObjectId("..."),
        ...
    ]
}
{
    "_id": ObjectId("456"),
    "followers": [
        ObjectId("..."),
        ObjectId("..."),
        ObjectId("..."),
        ...
    ]
}

对于这种情况，需要在应用程序中添加从“tbc”（to be continued）数组中取数据的相关逻辑。

说点什么

No silver bullet.

使用No-SQL数据库支持连接查询用例的讨论书香门第云计算 AWS 分布式系统设计数据库 sql aws
简介在本文中，我们将简单介绍什么是No-SQL数据库。然后我们会讨论一种使用关系数据库比较容易实现的查询，即连接查询，怎么样使用No-SQL来实现。什么是No-SQL数据库与No-SQL数据库相对应的是传统的关系数据库（RDBMS）。我们还要从RDBMS开始介绍。RDBMS是传统的数据管理方法。数据存储在包含列和行的表中。每列代表了一个属性，每行代表数据的一个实例。每个表都要指定一个主键，即唯一标
【Redis】redis-3.0.0安装以及集群的搭建小小小小真 Linux
前言redis是常用的no-sql数据库，常用于缓存数据，同时，他也可以持久化数据。他是C语言开发的，所以安装的时候需要编译。单机版redisyuminstallgcc-c++（安装C语言编译环境）安装第一步：redis的源码包上传到linux系统（点击下载）第二步：tarxzvfredis-3.0.0.tar.gz（解压缩redis）第三步：make（编译。需进入redis源码目录）第四步：ma
Redis的安装及基本使用姿势不太差 Redis的入门级教程 redis 数据库缓存学习 javascript
⭐⭐Redis专栏：Redis专栏⭐⭐个人主页：个人主页目录一.Redis的简介⭐拓展：NO-SQL数据库与SQL数据库二.Redis的安装2.1linux版安装下载RedisDesktop2.2Windows安装三.redis的基本使用3.1String字符串类型3.2哈希(Hash)3.3列表（List）今天就分享到这啦！！！一.Redis的简介Redis是一个开源（BSD许可）内存存储的数据
Redis常见问题由原数据库 redis nosql
1为什么使用RedisRedis是No-SQL（NotOnlySQL）的一种，目前最火的一种非关系型数据库基于内存存储，支持多种数据类型，键值对存储，Java开发主要面向服务端，就需要抗并发量，性能Java程序中，使用Redis.主流NO-SQL对比：对比选择了Redis小知识：数据库的分类：1.Old-SQL泛指关系型数据库，典型代表：Mysql、SqlServer、Oracle、Postgre
大数据Redis-5.0.8 嘉瓦Emmas
前言NoSQL，泛指非关系型数据库。不是NO-SQL，而是NOT-ONLY-SQL，不要把NoSQL数据库和关系型数据库对立起来，二者有不同的应用场景，目前来看NoSQL想完全取代关系型数据库不太可能。打算讨论三种NoSQL数据库。键值类-Redis列簇类-HBase文档类-MongoDBRedis作为NoSQL数据库的第一篇吧。Redis是基于内存的，访问速度快，常被用做缓存层，减轻数据库的访问
python爬虫（进阶） Qdd不甜 mongodb 爬虫 python
目录：一、MongoDB1.mongodb介绍（1）什么是mongodb（2）SQL和NO-SQL的主要区别（3）MongoDB作为非关系型数据库相较于关系型数据库的优点：（3）mongodb安装2.mongodb的使用（1）简单使用（2）mongodb的增删改查（3）mongodb的聚合操作（4）mongodb-索引3.mongodb的权限管理（1）mongodb的权限管理方案（2）mongod
Redis基本介绍温JZ redis大全分布式后端 java redis 架构
文章目录1.Redis简介2.Redis应用场景3.Redis单线程模型4.Redis常用命令5.Redis数据结构6.SpringBoot整合Redis框架参考蚂蚁课堂1.Redis简介Redis属于No-sql数据库类似于MongoDB，是一个完全开源免费的一个高性能的key-value数据库。它是基于内存的数据库，非关系型数据库不同于mysql，sqlserver，Oracle他们都是存放在
Redis工作原理与机制 xiaolong_java redis 缓存数据库
redis怎么说呢，在项目中经常用，但是仅仅只是限于用它常用的一些api至于它里面的原理也是一直都没有搞清楚今天就来具体探究一下redis内部的工作机制和底层原理吧概述：Redis是一个开源的key-value存储系统，no-sql数据库支持存储的value类型可以包括String(字符串),list(链表),set(集合)，zset(sortedset--有序集合)和hash(哈希类型)这些数据
ubuntu 20.04 静态编译360的pika
pika:https://github.com/OpenAtomFo...是一个类似redis的No-SQL,基于RocksDB支持按照keyrange来搜索KEY,并且是排序返回的redis的SCAN是无法满足这点的编译gitclonehttps://github.com/OpenAtomFoundation/pikacdpikaaptinstalllibprotobuf-devprotobuf
ubuntu 20.04 静态编译360的pika
pika:https://github.com/OpenAtomFo...是一个类似redis的No-SQL,基于RocksDB支持按照keyrange来搜索KEY,并且是排序返回的redis的SCAN是无法满足这点的编译gitclonehttps://github.com/OpenAtomFoundation/pikacdpikaaptinstalllibprotobuf-devprotobuf
JMeter 插件 Json Path 解析HTTP响应JSON数据 weixin_30329623 json 数据库测试
一、基本简介JMeter是一个不错的负载和性能测试工具，我们也用来做HTTPAPI接口测试。我们的API返回结果为JSON数据格式。JSON简介，JSON教程。JSON已经成为数据交换格式的事实标准：1.Ajax调用时的返回数据；2.在移动应用中，HTTP调用时的返回数据；3.RESTwebservice交换格式；4.MongoDB等NO-SQL数据库的数据存储格式；5....为JMeter定制插
OpenFire源码学习之十九：在openfire中使用redis插件(上) weixin_30577801 数据库大数据操作系统
Redis插件介绍Redis是目前比较流行的NO-SQL，基于K,V的数据库系统。关于它的相关操作信息，本人这里就不做重复了，相关资料可以看这个网站http://www.redis.io/(官网)、http://www.redis.cn/(中文站)。这里本人想说的是，拿Redis做openfire的缓存数据库。能够大大的提高openfire连接的吞吐量。Openfire自身在本地使用Map、Cac
Redis学习笔记——入门篇 Goet
一、什么是Redis？Redis是C语言开发的一个开源的（遵从BSD协议）高性能键值对（key-value）的内存数据库，是一种No-SQL数据库。可以用作数据库、缓存、消息中间件等。Redis作为一个内存数据库，有以下特点：1、性能优秀，数据在内存中，读写速度非常快，支持并发10WQPS；2、单进程单线程，是线程安全的，采用IO多路复用机制；3、支持多种数据类型；4、支持数据持久化；5、通过主从
大数据存储系统（2）--- Key-Value Store JepsonWong 大数据
No-SQL：（1）这些系统大部分是由互联网公司研发，研发目标是支持某公司的某类重要的应用。（2）放弃使用关系型系统，转而开发专门的系统以支持目标应用。（3）针对目标应用进行开发，简化了许多关系型系统的功能，以提高系统性能和降低研发成本。不支持完全的SQL，不支持完全的ACID。Key-ValueStore：一种分布式数据存储系统。数据形式为，支持Get/Put操作。一、Dynamo：Amazon
LSM树原理及应用到HBase的索引 GSpinach HBase
@Author:Spinach|GHB@Link:http://blog.csdn.net/bocai8058概念B+树LSM树主要原理LSM树的读写LSM树的读写LSM树的优化方式关于LSM最本质原理的3个问题B树与LSM树的适应场景概念LSM树全称是基于日志结构的合并树（Log-StructuredMerge-Tree）。No-SQL数据库一般采用LSM树作为数据结构，HBase也不例外。众所
大数据学习笔记 tiezhuLee 笔记
No-SQL出现的原因？PB级以上的数据，新型数据结构，json，图数据等那No-SQL和SQL哪个好？关系型有其生命力，已经存在了40多年，还在被广泛的使用–优美的数学模型支持–SQL与ACID等都在实践中被证明了是非常有用的–但是关系型系统的实现确实没有考虑到上述超大规模、多种数据类型。No-SQL也站露出不足，所以不能说孰优孰劣。Dynamo支持亚马逊公司电子商务平台上运行的大量服务核心技术
什么是NoSql数据库联系我：www.lfuping.cn Redis数据库
NO-SQL数据库能干什么:1.易扩展:a.NoSql数据库种类繁多，但是有一个共同的特点都是去掉关系数据库的关系型提醒。b.数据之间无关系，这样就非常容易扩展，也无形之间，在架构的层面上带来了可扩展的能力。2.大数据量高性能：a.NoSql数据库都具有非常高的读写性能，尤其在大数据下，同样表现优秀。b.这得益于它的无关系行，的数据库结构简单。c.一般MySQL使用QueryCache(查询缓存)
mongodb非关系型数据库 bug修复器 mongodb非关系型数据库
mongodb(非关系型数据库)1.定义：非关系型(no-sql),NoSQL(NoSQL=NotOnlySQL)，意即“不仅仅是SQL”。是非关系型数据存储的广义定义，通常以key-value形式存储数据，没有表结构。2.特点：高并发读写需求、海量数据的高效率读写、高扩展性和可用性3.初识在mongodb中是没有表和字段的，取而代之的是集合（collection）和文档(document)4.使
MySQL 笔记总结 Kunaly 数据库笔记丶 JAVA
数据库:本质上就是一个文件系统.通过标准的sql对数据进行curd操作安装数据库管理系统:数据库管理系统大白话就是一个软件常见的关系型数据库:关系型数据库:存放实体与实体之间的关系的数据库(就是二维表)实体:用户订单商品关系:用户拥有订单订单包含商品非关系型数据库:存放的是对象(redis)NO-sql(notonlysql)软件名厂商特点mysqloracle开源的数据库oracleoracle
No-SQL正淘汰SQL？读芯术热点文章 AI 人工智能
全文共1631字，预计学习时长5分钟来源：PexelsNo-SQL正淘汰SQL？上周，朋友给我转发了某成功企业家的邮件，里面宣称“SQL已经过时了”。该企业家声称，MongoDB和Redis这样受欢迎的No-SQL数据库，会慢慢地将基于SQL的数据库淘汰。因此，身为数据科学家，学习SQL是“抱残守缺”看到他的邮件我非常震惊，他是怎么得出这么离谱的结论的？但这也令我好奇......别人会不会也这样误
什么是NoSql数据库 a656678879 REDIS
NO-SQL数据库能干什么:1.易扩展:a.NoSql数据库种类繁多，但是有一个共同的特点都是去掉关系数据库的关系型提醒。b.数据之间无关系，这样就非常容易扩展，也无形之间，在架构的层面上带来了可扩展的能力。2.大数据量高性能：a.NoSql数据库都具有非常高的读写性能，尤其在大数据下，同样表现优秀。b.这得益于它的无关系行，的数据库结构简单。c.一般MySQL使用QueryCache(查询缓存)
mongodb常用的两种group方法，以及对结果排序夏末的初雪数据库
mongodb作为no-sql数据库的典型代表，拥有着存储海量数据的性能，在插入数据和查询数据方便也有着相对于其他关系型数据库明显的优势，最近学习了mongodb，发现mongodb中没有mysql中的group关键字，但是同样的以其他形式实现了对应的功能，下面总结了两种mongdb常用的group方法，介绍给大家。第一种方法是利用管道来进行，管道是由一系列的功能节点组成的，当文档从一个操作节点流
SSM项目之电商系统-爱生鲜 GzxNGU 电商网站
项目总结：这是我的第一个SSM项目也是我第一次系统的接触一个完整的框架，本项目分为前台和后台系统，分别是用户界面和管理员界面。主要技术为：Spring，Springmvc，mybatis，并且在前台的数据缓存中用到了基于No-sql技术的Redis。我对这些技术的理解：Spring：Spring是于2003年兴起的一个轻量级的Java开发框架，由RodJohnson创建，是一个开放源代码的设计层面
MongoDB聚合查询之两个字段关联lookup qq_30169767 mongoDB
随着no-sql数据库的发展，mongoDB已经被越来越多的项目使用，正好近期一个项目使用了mongoDB，项目需求使用mongoDB进行两张表两个字段关联查询，翻查了很多资料，终于找到了解决方案。表A：projectIdstudentIdtutorIdschoolId表B：projectIdstudentIdcorrectStatus项目A学生A教务A学校A项目A学生A已批改项目A学生B教务A学
Mongoose轻松搞定MongoDB，不要回调！ future_challenger nodejs mongodb mongoose bluebird promise
MEAN开发栈中使用MongoDB的时候，与之配对的ORM最好的选择就是Mongoose了。本文就和大家一起探讨一下如何使用Mongoose来实现MongoDB的增删改查。为了能使文中的例子更加生动，我们会实现一个对于用户的增删改查的RESTfulAPI。Mongoose简介mongoose是一个nodejs下，专门基于no-sql数据库mongodb的ORM框架。我们可以使用mongoose轻松
《redis入门指南》之事务、缓存、排序、消息通知与空间节约 selbstkennen梁晨
这一章节收获不少，其中最开眼界的是redis的强大的排序功能，以及如果信手拈来的事务功能。很多时候，技术本身没有问题，但是抽象的过于复杂，使得解决问题往往不是聚焦在问题本身，而是各类周边的工具。Redis在作为一个强有力的解决问题的工具方面，无疑是非常突出的。事务在我固有的印象中，事务是属于sql数据库才专有的特权，不过随着no-sql数据库的逐步成熟，这点确实有所变哈。redis的事务功能，简单
Elasticsearch JDBC river 之 ms sql 篇巷中人
還沒接觸elasticsearch之前大家免不了都會用數據庫,像我這種微軟狗當好幾年的,MicrosoftSqlServer之唯一方案.現在時代不同了都邁向no-sql,那數據移轉就是首要的工作,elasticsearch知道這事情的重要性,所以有了river這種技術來輔助我們移轉.此外,river-jdbc有2種方式可以把sql數據同步過來,我這篇介紹的是river,其實還有個效能更好的feed
从零开始Redis（一）:本地搭建redis 一白丁中间件
从零开始Redis（一）Redis简介Redis的安装Redis相信大多读者都不陌生，即使没用过也都听过。虽然笔者项目上是用到了redis，但当时只是简单了解，并未深入和掌握redis,所以笔者利用业余时间来充电，故记下此笔记。Redis简介Redis是一个开源的基于内存的no-sql(非关系型)数据库，使用ANSIC语言编写，支持strings,hashes,lists,sets,sorteds
mysql源码解读之事务提交过程(一) weixin_33951761
mysql是一种关系型数据库，关系型数据库一个重要的特性就是支持事务，这是区别于no-sql产品的一个核心特性。当然了，no-sql产品支持键值查询，不能支持sql语句，这也是一个区别。今天主要讨论下事务的提交流程，由于mysql插件式存储架构，导致开启binlog后，事务提交实质是二阶段提交，通过两阶段提交，来保证存储引擎和二进制日志的一致。本文仅讨论binlog未打卡状态下的提交流程，后续会讨
【Redis】redis-3.0.0安装以及集群的搭建遥寄三山 ●数据库
前言redis是常用的no-sql数据库，常用于缓存数据，同时，他也可以持久化数据。他是C语言开发的，所以安装的时候需要编译。单机版redisyuminstallgcc-c++（安装C语言编译环境）安装第一步：redis的源码包上传到linux系统（点击下载）第二步：tarxzvfredis-3.0.0.tar.gz（解压缩redis）第三步：make（编译。需进入redis源码目录）第四步：ma
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>