csdn研发技术

Cassandra NoSQL数据模型设计指南

原文：Cassandra NoSQL Data Model Design
翻译：雁惊寒

摘要：本文通过一个简单的实例详细介绍了Cassandra数据建模的五个步骤。以下是译文。

我们最近在Instaclustr发表了一篇有关在Cassandra中经常出现的数据建模错误的文章。这篇文章非常受欢迎，并促使我思考如何设计出高质量的Cassandra数据模型，以避免在设计的过程中掉入陷阱。

在互联网上，你可以找到很多有关适配数据模型设计规则和设计模式的优秀文章，例如：Apache Cassandra数据建模指南和数据建模优秀实践。

然而，我们并没有一个详细的操作步骤来指导你对数据进行分析，并适配相应的规则和模式。但这份白皮书正尝试着填补这方面的空白。

第一阶段：了解数据

这个阶段有两个步骤，这两个步骤都是为了更好地理解你正在建模的数据和所需的访问模式。

定义数据域

第一步是深入理解数据域。作为一个非常熟悉关系数据建模的人，我倾向于通过绘制ER图来理解这些实体、主键和互相之间的关系。但是，如果你熟悉另一种标记法，你也可以用一下试试。你需要在逻辑层面理解以下关键点：

数据模型中的实体（或对象）是什么？
实体的主要关键属性是什么？
实体之间有哪些关系（即从一个到另一个的引用）？
关系的相对基数是多少（例如，假设存在一对多的关系，那么平均是1对10，还是1对10000）？

定义所需的访问模式

下一步，弄清楚你自己需要如何访问数据：

列出需要访问数据的路径，例如：
- 以客户ID为索引，在某个日期范围内搜索交易记录，然后从搜索结果中搜索特定交易的详细信息。按某个特定的服务器和度量标准搜索，检索x度量值，按年龄升序排列。
- 按某个特定的服务器和度量检索，从特定时间点开始检索x度量值。
- 对于给定的传感器，检索给定日期的多个度量的所有读数。
- 对于给定的传感器，检索当前值。
请记住，对记录的任何更新操作都是一个访问路径，都需要仔细考虑。
从性能的角度来确定哪些访问最关键。是否有一些访问需要尽可能快的速度，而其他一些访问则需要花一定的时间进行多次读取或在一定范围内进行检索？
请记住，在这个阶段，你需要非常全面地了解如何访问数据，在Cassandra的性能、可靠性和可伸缩性之间做出权衡。

第二阶段：了解实体

这个阶段有两个具体的步骤，旨在了解与数据相关的主要和次要实体。

确定主要访问实体

现在，我们开始从分析数据域和应用需求转为开始设计数据模型了。在进入这个阶段之前，你需要把上面两个步骤的工作做得扎实一点。

这一阶段主要的想法是根据你所使用的访问模式将数据去规范化到尽可能少的表中。对于每一次按键进行的查询，需要有一张表来满足查询需求。我创造了一个术语“主要访问实体”来描述用于查询的实体（例如，按客户ID进行的查找将使用客户表作为主要访问实体，按服务器和度量名称的查找将使用服务器-度量实体作为主要访问实体）。

主要访问实体定义了去规范化结果表的分区级别（即表会为每个主要访问实体的实例提供一个分区）。

你可以选择使用二级索引来满足一些访问模式，而不是使用不同的主要访问实体来实现数据复制。请记住，包含在辅助索引中的列应比被索引的表的基数更低，并且你要对索引值的更新频率了如指掌。

对于上面举的访问模式的例子，我们将定义以下主要访问实体：

客户和交易（从客户实体获取交易清单，然后从交易实体查找交易详情）
服务器-度量
传感器
传感器

分配次要实体

下一步是寻找一个地方用来存储那些没有被选为主要访问实体的实体数据（这些实体被称为次要实体）。你可以这样做：

通过从一对多关系的父级次要实体获取数据并在主要访问实体级别存储它的多个副本（例如，将客户的电话号码存储在客户的订单记录中）。
通过从一对多关系的子次要实体获取数据并通过使用聚集键或通过使用多值类型（列表和映射）将其存储在主要访问实体级别上（例如，将记录项列表添加到交易表中）。

对于一些次要实体，只有一个相关的主要访问实体，所以不需要选择在哪个方向推入数据。对于其他实体，你需要选择将数据推入哪些主要访问实体。

为了获得最佳的读取性能，需要将数据副本推送到用作次要实体中数据访问路径的每个主要访问实体中。

然而，维护多个副本数据会影响到数据插入和更新的性能，并会增加应用程序的复杂性。因此，需要根据应用程序指定的性能要求在读取性能与数据维护成本之间做出权衡。

在这个阶段要做出的另一个决定是要选择使用聚集键还是多值类型来进行数据推升。一般来说：

在只有一个子次要实体向上推升的情况下使用聚集键，特别是在子次要实体本身有子节点上卷的情况下。
在有多个子实体推升到主要实体的时候使用多值类型

请注意，这些规则可能比较简单，但它们可以引申出对这方面更深入的思考。

第三阶段：审核与调优

最后一个阶段则是在必要的情况下对数据模型进行审核、测试，以及调优。

审核分区和聚集键

在这个阶段中，你需要将所有需要存储的数据分配到一个或多个表中，并且这些表需要支持所需的访问模式。下一步是检查生成的数据模型是否有效地使用了Cassandra，如果没有，则进行调优。在这个阶段，需要检查和调整的内容包括：

分区键是否有足够的基数？如果没有，则可能需要将列从聚集键变为分区键（例如，将主键（client_id，timestamp）更改为主键（（client_id，timestamp）））或引入将多个聚集键分组为分区的新列（例如，将主键（client_id，timestamp）更改为主键（（client_id，day），timestamp））。
分区键中的值是否会经常更新？对主键的更新将导致记录的删除和重新插入。例如，在一个维护了所有客户的状态的表中，可能有主键（状态，客户ID）。但是，这将导致每当客户状态发生变化时都需要删除并重新插入记录。在这种情况下，最好选择集合或列表数据类型，而不是将客户ID作为聚集键。
每个分区中的记录数是否有限制？特别大的分区和或者分布非常不均匀的分区可能会出现问题。例如，假设有一张client_updates表，其主键为（client_id，update_timestamp），则客户记录的更新次数可能并没有限制，因为可能有少量的客户已经有10年未更新，而大多数客户只有一两天而已。

测试和调优

最后一步，也可能是最重要的，即对数据模型进行测试，并根据需要进行调优。请记住，像分区或记录数增长过快的问题只有在实际负载下使用几天（或更长时间）之后才能发现。因此，测试的时候需要尽可能地接近真实负载，并密切监视各种警告信息（nodetool cfstats和cfhistograms命令对此非常有用）。

在这个阶段，你也可以考虑调整一些影响数据物理存储的设置。例如：

改变压缩策略；
如果只使用TTL来删除数据的话，则可以降低gc_grace_seconds，或者
设置缓存选项。

一个完整的例子

为了说明这一点，下文将介绍一个示例，该示例构建了一个数据库，用于存储和检索来自多个服务器的日志消息。请注意，与大多数实际的案例相比，这个例子非常简单。

步骤1：定义数据域

Cassandra NoSQL数据模型设计指南_第1张图片

上面的ER图描述了本示例的数据域，包括：

有很多（百万数量级）的日志消息，有时间戳和主体。尽管消息ID在ER图中显示为主键，但消息时间加消息类型是备用主键。
每个日志消息都有一个消息类型，多个类型被进一步分组为一个消息类别（例如，消息类型可能是“内存不足错误”，类别可能是“错误”）。有几百个消息类型和大约20个类别。
每个日志消息来自一个消息源。消息源是生成消息的服务器。我们的系统中有1000台服务器。每个消息源都有一个源类型对其进行分类（如红帽服务器、Ubuntu服务器、Windows服务器、路由器等）。有大约20个源类型。每个源每天有大约10000条消息。
消息体可以被解析并存储为多个消息体（一般来说是键值对）。每条消息通常不超过20个消息体。

步骤2：定义所需的访问模式

我们需要能够：

检索给定源的最近10条消息的所有可用信息（并且能够从中及时回溯）。
检索给定源类型的最近10条消息的所有可用信息。

步骤3：确定主要访问实体

这里有两个主要访问实体：源和源类型。源类型的基数（约为20）使其非常适合成为二级索引，所以我们将使用源作为主要访问实体，并添加源类型为二级索引。

步骤4：分配次要实体

在这个例子中，这个步骤相对简单，因为所有数据都需要滚入到日志源主要访问实体中。所以我们需要：

下推源类型名称
下推消息类别和消息类型以记录消息
上推日志消息，使其作为新实体的聚集键
作为map类型上推消息体。

最终这将是一个带有源ID分区键和（消息时间，消息类型）聚集键的单个表。

步骤5：审核分区和聚集键

根据检查清单检查这些分区和聚集键：

分区键是否有足够的基数？是的，有1000个源。
分区键中的值是否会经常更新？不，所有的数据都是一次写入的。
每个分区中的记录数是否有限制？不，消息数可能会随着时间的推移而无限地增长。

所以，我们需要解决无限分区大小的问题。在时间序列数据中，解决这个问题的典型模式是将一组时间段引入到聚集键中。在这种情况下，每天10000条消息是一个比较合理的数字，可以包含在一个分区中，因此我们将使用“天”作为分区键的一部分。

最后，Cassandra结果表是这样的：

CREATE TABLE example.log_messages (
message_id uuid,
source_name text,
source_type text,
message_type text,
message_urgency int,
message_category text,
message_time timestamp,
message_time_day text,
message_body text,
message_parts map
PRIMARY KEY ((source_name, message_time_day,message_time, message_type)
) WITH CLUSTERING ORDER BY (message_time DESC);

CREATE INDEX log_messages_sourcetype_idx ON example.log_messages (source_type);

你可能感兴趣的:(技术翻译,cassandra,nosql)

【从零开始学习计算机科学】数据库系统（十一）云数据库、NoSQL 与 NewSQL 贫苦游商数据库学习 nosql newsql 云数据库 CAP sql
【从零开始学习计算机科学】数据库系统（十一）云数据库、NoSQL与NewSQL云数据库云服务器的服务云数据库和传统的分布式数据库的异同NoSQLNoSQL数据库的特点CAP定理NoSQL的特性NoSQL数据库的分类NoSQL的适用场景Nosql数据库实例-RedisRedis的优势MongoDBMongoDB的特点NewSQLNewSQL出现的背景NewSQL（新型分布式数据库）的概念NewSQL
MongoDB介绍与部署使用 zhangleijiutian mongodb
MongoDB的功能特性MongoDB是一个高性能、开源、无模式的文档型数据库，设计用于提供高性能、水平可扩性、高可用性和高级可查询性，为Web应用提供可扩展的高性能数据存储解决方案。MongoDB的名称取自单词”humogous”中间的几个字符，是很大、巨大的意思。该数据库由10gen公司开发并提供技术支持，它属于NoSQL数据库家族中的一员，在许多场景下可以用来替代传统关系型数据库或key/v
HBase2.6.1部署文档 CXH728 zookeeper hbase
1、HBase概述ApacheHBase是基于Hadoop分布式文件系统（HDFS）之上的分布式、列存储、NoSQL数据库。它适合处理结构化和半结构化数据，能够存储数十亿行和数百万列的数据，并支持实时读写操作。HBase通常应用于需要快速随机读写、低延迟访问以及高吞吐量的场景，例如大规模日志处理、社交网络数据存储等。HBase特性列存储模型：HBase的数据是按列族存储的，适合高稀疏数据。行键分区
MySQL 与 MongoDB 的区别 kse_music #DB mysql mongodb 数据库
文章目录前言一、如何选择二、索引总结前言在当今数据驱动的世界中，数据库技术扮演着至关重要的角色，它们为应用程序提供了存储、管理和检索数据的基础设施。MySQL和MongoDB作为两种广泛使用的数据库管理系统，分别代表了关系型数据库（SQL）和非关系型数据库（NoSQL）的典型范例。MySQL是一种成熟的关系型数据库管理系统（RDBMS），自1995年问世以来，凭借其稳定性、可靠性和易用性，成为了许
【存储中间件】MongoDB最热门NoSql数据库（一）：NoSQL、MongoDB介绍道友老李架构师进阶-存储中间件 nosql mongodb 中间件
文章目录1.MongoDb综述1.1.什么是Nosql1.2.什么是MongoDb**1.2.1核心特性****1.2.2典型应用场景****1.2.3与关系型数据库对比****1.2.4局限性及使用建议**个人主页：道友老李欢迎加入社区：道友老李的学习社区1.MongoDb综述1.1.什么是NosqlNoSQL（NotOnlySQL）是一类非关系型数据库的统称，其核心特征在于突破传统关系型数据库
【存储中间件】Redis核心技术与实战（一）：Redis入门与应用（技术全景、版本选择与安装、全局命令）道友老李架构师进阶-存储中间件 Redis核心技术与实战中间件 redis 数据库
文章目录Redis入门与应用Redis的技术全景两大维度三大主线Redis的版本选择与安装**Redis的linux安装**Redis的启动默认配置带参数启动配置文件启动操作停止Redis全局命令键名的生产实践个人主页：道友老李欢迎加入社区：道友老李的学习社区Redis入门与应用Redis的技术全景Redis一个开源的基于键值对（Key-Value）NoSQL数据库。使用ANSIC语言编写、支持网
使用Couchbase中的向量搜索进行智能查询 eahba python
技术背景介绍Couchbase是一种强大的分布式NoSQL数据库，广泛应用于云、移动、AI和边缘计算应用中。其向量搜索功能，作为全文搜索服务的一部分，支持在应用中进行高效的语义查询。这为开发者在实现AI驱动的应用时提供了极大的便利。核心原理解析Couchbase的向量搜索利用向量嵌入技术对文本进行处理，可以实现基于语义相似度的查询。这与传统的关键词匹配有根本的不同，更适合AI应用场景中模糊或语义相
物联网实时数据存储方案选择动亦定 MySQL 物联网数据库物联网时序数据库数据库
存储物联网设备发出的实时数据时，需考虑数据量、速度、类型和访问需求。以下是几种常见的存储方案：1.时序数据库适用场景:适合处理时间序列数据，如传感器数据。优点:高效存储和查询时间序列数据，支持高写入和查询吞吐量。常见选择:InfluxDB、TimescaleDB、Prometheus。2.NoSQL数据库适用场景:适合非结构化或半结构化数据，如JSON、XML。优点:灵活的数据模型，易于扩展，适合
MongoD和关系型数据库相关概念的对应 oliver.chau mongodb 数据库 mongodb
在MongoDB（NoSQL）中，文档（Document）、集合（Collection）等概念与关系型数据库（RDBMS）的表、行等概念有一定的对应关系。可以用下面的表格来对比它们的概念：MongoDB（NoSQL）关系型数据库（RDBMS）解释数据库（Database）数据库（Database）一个存储数据的整体，包含多个集合（表）集合（Collection）表（Table）由多个文档组成的集合
MongoDB 集群模式简单了解黑风风网络运维 NoSQL mongodb 数据库
MongoDB集群模式简单了解在现代应用架构中，数据库的扩展性和高可用性至关重要，而MongoDB作为NoSQL数据库的佼佼者，提供了多种集群模式来应对不同场景的需求。这篇文章将深入探讨MongoDB的主要集群模式，并分析它们的适用场景和优缺点。1.MongoDB的三大集群模式MongoDB主要提供以下三种集群模式，每种模式都有其独特的应用场景和优势：副本集（ReplicaSet）——高可用性与数
MongoDB基本操作徐诗 mongodb 数据库 nosql
前言MongoDB是一种非关系型数据库。所谓NoSQL，并不是指没有SQL，而是指“NotOnlySQL”，即非传统关系型数据库。这类数库的主要特点包括非关系型、水平可扩展、分布式与开源。另外它还具有模式自由、最终一致性。一、MongoDB简介1.简介MongoDB是属于NoSql的一种数据类型。MongoDB是一款强大、灵活、且易于扩展的通用型数据库。MongoDB是一个基于分布式文件存储的数据
MongoDB应用设计调优 hzulwy 数据库 mongodb 数据库
应用范式设计什么是范式数据库范式概念是数据库技术的基本理论，几乎是伴随着数据库软件产品的推出而产生的。在传统关系型数据库领域，应用开发中遵循范式是最基本的要求。但随着互联网行业的发展，NoSQL开始变得非常流行，在许多的应用实践中也涌现出一些反范式的做法。三范式的定义（1）第一范式：数据库表的每一列都是不可分割的原子项。如下表，所在地一列就是不符合第一范式的，其中对于“广东省、深圳市”这样的字符串
华为云数据库GaussDB(for Cassandra)揭秘：内存异常增长的排查经历科技说 jvm java 开发语言
内存异常增长的排查经历背景介绍华为云数据库GaussDB(forCassandra)是一款基于计算存储分离架构，兼容Cassandra生态的云原生NoSQL数据库；它依靠共享存储池实现了强一致，保证数据的安全可靠。核心特点是：存算分离、低成本、高性能。问题描述GaussDB(forCassandra)自研架构下遇到一些挑战性问题，比如cpu过高，内存泄漏，内存异常增长，时延高等问题，这些也都是开发
NoSQL数据库 Wlq0415 nosql 数据库
NoSQL数据库主要分为以下几类：文档型数据库(DocumentStore)特点：以文档的形式存储数据，通常使用JSON、BSON或XML等格式。每个文档自包含，支持动态的模式。适用场景：适合需要存储复杂数据结构和动态变化模式的应用，例如内容管理系统和用户配置管理。示例：MongoDB、CouchDB。键值存储(Key-ValueStore)特点：数据以键值对的形式存储，通过唯一的键快速访问相应的
项目中用到redis，为什么选用redis，了解其他NoSQL数据库吗？在你的项目中是如何运用redis的？key是什么，value是什么？「已注销」
为什么选用redis高效性：Redis读取的速度是110000次/s，写的速度是81000次/s原子性：Redis的所有操作都是原子性的，同时Redis还支持对几个操作全并后的原子性执行。支持多种数据结构：string（字符串）；list（列表）；hash（哈希），set（集合）；zset(有序集合)稳定性：持久化，主从复制（集群）其他特性：支持过期时间，支持事务，消息订阅。其他NoSQL数据库：
Python的那些事第三十九篇：MongoDB的Python驱动程序PyMongo 暮雨哀尘 Python的那些事 python 开发语言科技 mongodb 智能家居 PyMongo 数据加密
PyMongo：MongoDB的Python驱动程序摘要PyMongo是MongoDB的官方Python驱动程序，用于在Python应用程序中与MongoDB数据库进行交互。本文将详细介绍PyMongo的安装、基本操作、高级功能以及实际应用案例，并通过示例代码和表格展示其强大的功能和灵活性。1.引言MongoDB是一种流行的NoSQL数据库，以其灵活的文档模型和高性能而闻名。PyMongo作为Mo
【每日八股】MySQL篇（三）：索引（上） YGGP 后端 mysql 数据库
目录MySQL为什么使用B+树来做索引，它的优势是什么？特性和定义B+树和B树的对比拓展：既然B+树相较于B树优势如此之大，为什么nosql的MongoDB底层仍采用B树而不是B+树？使用B+树做索引的优势补充：为什么说B+树的插入和删除效率高？B+树的冗余结点是如何形成的？它们的作用是什么？冗余结点是如何帮助提高插入和删除效率的？冗余结点指的是叶子节点冗余还是用做索引的非叶子节点冗余？为什么说B
文件系统、关系型数据库、NoSQL 和数据湖晴天彩虹雨数据库 nosql 大数据 hadoop
数据存储是信息技术中的基础组成部分，它对数据的管理、存储、处理和检索起着至关重要的作用。在现代数据系统中，根据数据的类型、规模、使用场景等因素，不同的存储方式可以提供不同的优点和解决方案。本文将介绍四种主要的数据存储方式：文件系统、关系型数据库（RDBMS）、NoSQL和数据湖。1.文件系统文件系统（FileSystem）是一种将数据按文件形式进行存储和管理的技术。在文件系统中，数据以文件的形式组
腾讯集团软件开发-后台开发方向内推飞300 业界资讯 mysql java
熟练掌握C/C++/Java/Go等其中一门开发语言；TCP/UDP网络协议及相关编程、进程间通讯编程；专业软件知识，包括算法、操作系统、软件工程、设计模式、数据结构、数据库系统、网络安全等有一定了解的：1、Python、Shell、Perl等脚本语言；2、MySQL及SQL语言、编程；3、NoSQL,Key-value存储原理。1、深入理解业务需求和产品设计，高效地实现并优化产品功能；2、持续优
Spring Boot中使用MongoDB聚合管道进行数据查询操作 BitCodeW spring boot mongodb 后端数据库
SpringBoot中使用MongoDB聚合管道进行数据查询操作MongoDB是一种流行的NoSQL数据库，它提供了强大的聚合管道功能，可以用于在数据库中执行复杂的数据查询和分析操作。在SpringBoot中，我们可以利用MongoTemplate类来执行MongoDB的聚合管道查询。本文将介绍如何在SpringBoot应用程序中使用MongoDB的聚合管道查询操作，包括facet、facet、f
Redis :01---Redis简介和安装前网易架构师-高司机 2025年最新-数据库运维数据库数据结构大数据分布式
一、Redis简介·Redis官网：https://redis.io/·Redis是一种基于键值对（key-value）的NoSQL数据库·与很多键值对数据库不同的是，Redis中的值可以是由string（字符串）、hash（哈希）、list（列表）、set（集合）、zset（有序集合）、Bitmaps（位图）、HyperLogLog、GEO（地理信息定位）等多种数据结构和算法组成，因此Redis
深入解析Redis：核心特性与应用场景月落星还在 redis redis 数据库缓存
1.Redis的本质与定位Redis（RemoteDictionaryServer）是一个开源的、基于内存的键值对存储系统，属于NoSQL数据库的范畴。与传统的关系型数据库（如MySQL）不同，Redis以极致的性能和灵活的数据结构为核心设计目标，被广泛应用于缓存、实时数据分析、消息队列等场景。核心定位：Redis并非替代传统数据库，而是作为高性能的数据中间层，解决磁盘存储无法满足的高并发、低延迟
redis基础知识整理以及案例分析小鹿的周先生
redis基础知识整理以及案例分析1.redis1.概念2.下载安装3.命令操作1.数据结构4.持久化操作5.使用Java客户端操作redisRedis1.概念：redis是一款高性能的NOSQL系列的非关系型数据库1.1.什么是NOSQLNoSQL(NoSQL=NotOnlySQL)，意即“不仅仅是SQL”，是一项全新的数据库理念，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关
在 Windows 11 上安装 MongoDB D0ublecl1ck #MongoDB windows mongodb 数据库
MongoDB是一个流行的NoSQL数据库，它提供了灵活的数据存储方案，而MongoDBCompass则是一个可视化管理工具，可以更轻松地与MongoDB数据库交互和管理。在本文中，我们将介绍如何在Windows11上安装MongoDB，并配置MongoDBCompass进行可视化管理。1.下载MongoDB首先，我们需要下载MongoDB安装包。你可以从MongoDB官方网站下载最新版本的Mon
redis 快速入门栀夏613 数据库 redis 数据库缓存
目录数据库的分类NoSQL非结构化认识redis特征安装redis单机安装Docker安装redis的基本配置启动redis关闭redisredis开机自启redis客户端redis数据结构介绍基本类型String的基础操作List基本操作Set基本操作SortedSet基本操作Hash基本操作redis通用命令key的层级格式数据库的分类关系型数据库结构化数据表中存储的数据格式是一样的数据与数据
一文速通MongoDB C__C.. 数据库 mongodb nosql
MongoDB是一个开源的、面向文档的NoSQL数据库管理系统，与传统的关系型数据库（如MySQL）不同，MongoDB存储数据的方式更加灵活，不需要固定的表结构和模式。MongoDB的一些关键特性：文档型存储：MongoDB使用BSON（二进制JSON）格式存储数据，数据以文档的形式组织。每个文档类似于JSON对象，可以包含键值对、数组、嵌套文档等多种结构。无模式设计：MongoDB不要求事先定
MongoDB快速入门南枝杜鹃 mongodb 数据库
目录1什么是MongoDB1.1MongoDB的特点2基本概念3安装与配置4MongoDB操作指令连接与数据库操作集合操作文档操作索引操作聚合操作1什么是MongoDBMongoDB是一个基于分布式文件存储的开源数据库系统属于NOSQL（非关系型数据库）的范畴，它以高性能，高可扩展性和灵活的数据模型而受到广泛关注。1.1MongoDB的特点1，灵活的数据模型：采用文档型数据模型，模型以BSON（二
消息队列之 RabbitMQ基本流程搬砖养女人数据库架构 java spring tomcat sql
介绍关于消息队列，从前年开始断断续续看了些资料，想写很久了，但一直没腾出空，近来分别碰到几个朋友聊这块的技术选型，是时候把这块的知识整理记录一下了。市面上的消息队列产品有很多，比如老牌的ActiveMQ、RabbitMQ，目前我看最火的Kafka，还有ZeroMQ，去年底阿里巴巴捐赠给Apache的RocketMQ，连redis这样的NoSQL数据库也支持MQ功能。总之这块知名的产品就有十几种，就
【八股】非关系型数据库篇（Redis+ES）林子漾八股项目 redis 数据库缓存
关系型和非关系型数据库特性关系型数据库(RDBMS)非关系型数据库(NoSQL)数据模型表格（行和列）文档、键值、列族、图等多样化模型模式固定（Schema）灵活的，无需预定义结构扩展性纵向扩展为主，横向扩展困难横向扩展容易，适合大规模分布式系统事务支持完全支持ACID事务多数不支持或仅支持单一操作的事务查询语言SQL各种API或NoSQL特定的查询语言数据一致性强一致性最终一致性或可调的一致性级
为什么面试狂问Redis，阿里面试官把我问到哑口无言… 2501_90433130 面试 redis 职场和发展
Redis我们在工作中经常会用到，但是为什么要用、redis的一些场景和实战问题，90%以上的人都不是很懂。曾经自己去面试阿里，就被Redis问题问到哑口无言…事后我专门去恶补了Redis，现在算是比较精通了。作为目前主流的NoSQL技术，redis在Java互联网中得到了非常广泛的使用，个时代码代码的秃头人员，对Redis肯定是不陌生的，如果连Redis都没用过，还真不好意思出去面试，指不定被面
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他