jiq408694711

HBase概念学习（十）HBase与MongDB等NoSQL数据库对比

转载请注明出处： jiq•钦's technical Blog - 季义钦

一、开篇

淘宝之前使用的存储层架构一直是MySQL数据库，配合以MongDB，Tair等存储。

MySQL由于开源，并且生态系统良好，本身拥有分库分表等多种解决方案，因此很长一段时间内都满足淘宝大量业务的需求。但是由于业务的多样化发展，有越来越多的业务系统的需求开始发生了变化。一般来说有以下几类变化：

(1) 数据量变得越来越多，事实上现在淘宝几乎任何一个与用户相关的在线业务的数据量都在亿级别，每日系统调用次数从亿到百亿都有，且历史数据不能轻易删除。这需要有一个海量分布式文件系统，能对TB级甚至PB级别的数据提供在线服务。

(2) 数据量的增长很快且不一定能准确预计，大多数应用系统从上线起在一段时间内数据量都呈很快的上升趋势，因此从成本的角度考虑对系统水平扩展能力有比较强烈的需求，且不希望存在单点制约。

(3) 只需要简单的kv读取，没有复杂的join等需求。

(4) 对系统的并发能力以及吞吐量、响应延时有非常高的需求，并希望系统能保持强一致性。

(5) 通常系统的写入非常频繁，尤其是大量系统依赖于实时的日志分析。

(6) 希望能够快速读取批量数据（HBase基于行健存储的优势）。

(7) schema灵活多变，可能经常更新列属性或新增列。

(8) 希望能够方便使用，有良好且语义清晰的java接口。

以上需求综合在一起，我们认为hbase是一种比较适合的选择。

1、首先它的数据由hdfs天然地做了数据冗余，云梯三年的稳定运行，数据100%可靠己经证明了hdfs集群的安全性，以及服务于海量数据的能力。

2、其次hbase本身的数据读写服务没有单点的限制，服务能力可以随服务器的增长而线性增长，达到几十上百台的规模。

3、LSM-Tree模式的设计让hbase的写入性能非常良好，单次写入通常在1-3ms内即可响应完成，且性能不随数据量的增长而下降。

4、region（相当于数据库的分表）可以ms级动态的切分和移动，保证了负载均衡性。

5、由于hbase上的数据模型是按rowkey排序存储的，而读取时会一次读取连续的整块数据做为cache，因此良好的rowkey设计可以让批量读取变得十分容易，甚至只需要１次IO就能获取几十上百条用户想要的数据。

6、最后，淘宝大部分工程师是java背景的同学，因此hbase的api对于他们来说非常容易上手，培训成本相对较低。

这个问题足以说明，Hbase相对于MongDB拥有上面讲到的那几点优势。

另外FaceBook是Hbase目前的最大的用户，其抛弃了自创的最终一致性数据库Cassandra而选择了Hbase。http://wiki.apache.org/hadoop/Hbase/PoweredBy页面也罗列出了很多当前正在使用HBase的大用户。

二、NoSQL数据库特点

1、 MongDB特点：

(1) MongDB是文档存储，文档按组又分成集合。集合类似于关系数据库中的表，不过不同

的是其不对Schema进行严格约束，即一个集合可以包含任何文档。

文档以BSON格式存在，这是一种JSON类文档的二进制编码格式，结构类似于嵌套的键值对，每个文档都有一个唯一的标识。

(2) MongDB选择用内存映射文件存储，所以可以通过提供更大的RAM或者分配更大的虚拟内存可以提升MongDB的性能，可以看出高性能是贯穿MongDB设计的一个重要理念。

(3) 限制：因为采用内存映射文件存储，所以32位系统上数据库的最大值不能超过2G。此外单个文档不能超过16M，说明不适合存储大对象。还有一个MongDB数据库最多只能存储8000个集合。这些约束都限制了MongDB数据库的无限增长。

(4) 原子性：MongDB并不注重原子性，也没有定义并发操作中事物完整性和隔离级别，因此在更新同一个集合时，两个进程可能相互冲突。只有一类成为Modifier Operation的操作(主要有累加字段、设定字段值、删除字段等操作)才提供原子性。而Hbase和Hypertable等列式数据库提供行级的原子更新和一致性状态。

(5) 水平拓展：选用MongDB一个常见的原因是弱Schema集合，还有一个原因就是其良好的性能和可拓展性，最近的版本中MongDB开始支持自动分片，其支持将集合分开保存到多台机器上，每台机器保存一部分，即一个分片，故障转移通过复制分片来实现，这使得水平拓展变得容易了许多。

(6) 支持非常丰富的查询、支持各种索引、支持各种聚合函数、支持排序，总之拓展了关系型数据库的许多有用的功能。

(7) 和Mapreduce结合不是很好、当数据规模增大时，稳定性不够好。

虽然MongDB是一种NoSQL数据库，但是由于本身的一些特性和实际行业中的使用经验表明，MongDB更像是介于NoSQL数据库和内存数据库之间的一种数据库。

2、 Hbase特点：

Facebook是Hbase的最大用户，下面是我从SIGMOD2011上facebook发表的一篇论文翻译而来，详细说明了他们为什么选择Hbase。

Facebook主要给出了三类应用场景：Facebook Messaging、Facebook Insight 和 FacebookMetrics System(ODS)。Messaging 就是 Facebook 的新型消息服务，每个月存储1350亿条消息。Insight 是提供给开发者和网站拥有者的数据分析工具，可以帮助他们清楚了解到访问者如何与他们网站交互，以便更好地优化他们的服务。ODS 则是 Facebook 内部的软硬件状态统计系统，对于每一个或者一组服务器，都可以有效地从不同的维度来监控他们的状态。这三个应用场景都有各自的特色，但简单地来说，面临的问题是同样的：单机或者拆分的关系型数据库无法满足需求。

Facebook选择Hadoop/Hbase的主要原因有以下几点：

1、可拓展性：可以以最小的代价、无须停机的方式增加存储系统的容量。一些情况下我们需要快速增加系统的容量，并且能够自动负载、利用到这些新的硬件设备。

2、高写入吞吐量：大多数应用都需要存储巨大量的数据，这就要求很高的写入吞吐量。

3、单个data center内高性能、低延迟的强一致性：一些重要的应用、比如消息、要求很强的单个数据中心内的一致性，这些需求很直观来自于用户需求，比如展示在主页的“未读消息”的数目和inbox页面显示的消息就应当是高度一致的。尽管全局强一致性的分布式系统几乎是不可能的，但是一个系统至少能够提供在单个数据中心内的强一致性，这能够带来很好的用户体验。

4、高效的随机读取性能：尽管应用层的缓存技术(不管是嵌入式的还是memcached方式)被广泛应用，但是很多访问仍然没办法命中缓存，需要后端的存储系统来处理，Hbase随机读取性能很稳定。MySQL在随机读取方面非常优秀，但如果Hbase结合分布式缓存MemeCached或者MemBase，那么其读取性能就可以和MySQL比肩了。

5、高可用性以及灾难恢复：我们需要提供给用户高度可用的服务，不管是遇到计划中的事件（比如软件升级、或者硬件/容量的增加），还是遇到一些计划之外的事件（比如硬件失效）。我们也需要能够容许数据中心的一些数据丢失，能够在合理的时间范围内切换到其他数据中心来为用户提供服务。

6、故障隔离：我们在大量的MySQL数据库上的应用经验表明，故障隔离是非常关键的。单个数据库可以down掉，但是仅只有很小一部分用户会被这样的事件影响。类似地，在我们的Hadoop存储中，单个磁盘故障仅只会影响到一小部分数据，而且系统可以很快恢复。

7、原子的“读-修改-写”原语：原子的计数器和检查并设置(checkand set、或者称compare and swap)等API在构建无锁的并发应用时非常有用，可以帮助用户有效地解决多线程竞争造成的很多问题。

8、范围扫描：一些应用要求特定范围内的行的集合的高效检索。例如，给定用户的最近100条消息的检索。

FaceBook对HDFS做了一些优化：

HDFS最初是被设计为支持一些离线Mapreduce应用的批处理文件系统，在可拓展性和批量数据处理方面很优秀，基于一些实时性的需求，faceBook对HDFS进行了优化，目的是为了将其打造为更加通用的、低延迟的文件系统。主要优化包括：

(1) 将单节点的NameNode改为双节点的热备份。不过Facebook认为这个不是很重要，他们的HDFS集群四年来NameNode只出过一次问题，还是因为什么交易日志存储在错误的地方。

(2) RPC的优化。

FaceBook对Hbase也做了一些优化：

(1) 行级原子性、系统可用性的优化。个人看了一下，只能佩服faceBook。

(2) 性能优化主要从两点进行，一个是 compaction 性能，另一个是读性能。

读过 BigTable 论文的应该对其 memtable 和 compaction 的特性比较熟悉。这里主要讨论了让 minor compaction 也删除数据的好处，以及如何做 major compaction 能够提高合并的性能。在数据读性能方面，文章里主要讨论了减少 IO 操作的方法，其中包括 bloom filter和特定类型 meta 信息（时间戳）的使用。还有很重要的一点，在部署上保持 RegionServer 和物理文件的局部性！

Hbase主要适用场景：

1 大数据量（100s TB级数据）且有快速随机访问的需求。

例如淘宝的交易历史记录。数据量巨大无容置疑，面向普通用户的请求必然要即时响应。

2 容量的优雅扩展

大数据的驱使，动态扩展系统容量的必须的。例如：webPage DB。

3 业务场景简单，不需要关系数据库中很多特性（例如交叉列、交叉表，事务，连接等等）

4 优化方面：合理设计rowkey。因为hbase的查询用rowkey是最高效的，也几乎的唯一生产环境可行的方式。所以把你的查询请求转换为查询rowkey的请求吧。

HBase在淘宝的应用

个人感觉是最精华的部分，HBase在淘宝里用在三个地方：

a）实时推荐、实时报表、实时计费

这类应用的特点是大量数据的实时写入以及读取

b）大数据量类型项目

比如历史类或需要长期保存的数据

c）二次分析类型项目

Hadoop集群做粗粒度分析，在线做二次分析，比如数据魔方。

三、NoSQL数据库对比

1、可拓展性

虽然所有NoSQL数据库都承诺可拓展性，但是面对挑战是水平却不尽相同。

BigTable的相似产品Hbase和Hypertable暂时处于领先地位，内存存储(Membase或Redis)和文档数据库(MongDB或CouchBase)紧随其后，他们之间的差异随着数据量的增大而被无限放大，特别是到了PB级以后。

拓展性方面Hbase具备天生的优势，支持自动负载均衡，故障转移，压缩和单服务器多分片，而且Hbase和HDFS配合的非常好，HDFS能够通过复制和自动平衡轻松容纳跨越多个服务器的大文件。

所以所如果需要极端拓展性的话，列族NoSQL是最好的选择。

但是话又说回来，如果你的大量数据会以惊人的快节奏出现，例如一些实时的交易数据或者广告点击追踪数据，那么单靠列式存储无法提供完美的解决方案。这个时候你需要一些更加轻快、既支持快速读写、又支持实时处理的存储，没有什么比在内存里面处理数据更快了，所以你可以在Hbase前面搭配上MongDB/Redis来进行实时数据处理以及实时的数据挖掘等。其他一些实时性不是非常高的批量查询和数据挖掘可以利用Mapreduce在Hbase上进行。

2、事务完整性和一致性

Hbase和Hypertable提供行级的原子更新以及一致性状态，MongDB提供文档级别的原子更新，Cassandra只能提供最终一致性。

但是事务的要求并不是必须的，许多数据，比如网络流量日志，社交网络状态更新(微博等)，广告点击，道路交通数据，交易数据和游戏分数等是一次写、多次读，这样的数据对事务的需求有限，甚至没有。

有些数据虽然已更新和删除，但是修改通常只限于单记录而非数据集的某个范围，有时更新非常频繁且涉及范围操作。如果范围操作很常见并且需要保持更新的一致性，那么RDBMS才是最佳选择，如果单个条目的原子性已经足够，那么列式数据库、文档数据库和部分键/值存储都可以。如果需要事务完整性但是可以容纳暂时的窗口不一致，那么最终一致性存储也是不错的选择。

3、数据模型

MongDB支持类SQL查询、基本的关系型引用和数据库对象，如果使用NoSQL的主要原因是可以使用宽松的数据结构，那么MongDB肯定是开始使用NOSQL的最佳选择。

很多Web为中心的业务都开始使用MongDB，主要是因为它支持灵活的数据模型(弱Schema)，同时能够提供快速的读写能力。（现在敏捷开发很重要、MongoDB能更快地开发应用程序。一个明显的原因是MongoDB没有固定的Schema，所有花在提交、沟通和实施Schema变更的时间都省下来了）

此外MongDB对Web框架的支持非常好，比如Spring、Rails等。

最后要说明的是，MongDb非常容易上手，学习周期很短。

4、查询支持

挑选NoSQL主要考虑的因素除了存储，还有查询。

MongDB和Redis的查询能力比较强。

像MongDB的查询，与SQL相似，语法简单，容易学习。MongoDB支持范围查询，正则表达式查询，对子文档内属性的查询，可以取代原来大多数任务的SQL查询。

像Redis的查询，查询方法很全，命令文档也很丰富。

Hbase只支持基于Rowkey的单条记录查找、基于Rowkey的范围查找以及全表扫描。

要注意的是几乎所有NoSQL存储都不支持表之间的join操作。

提到查询不得不提到索引，MongDB本身支持二级索引，Hbase不支持二级索引，但是现在也有很多方法(最常见是借助协处理器)可以帮助Hbase实时建立二级索引。

5、性能

(1) 50/50读和更新、即读少写多。

Cassandra最优秀，每秒执行超过1W次操作，平均读延迟只有25ms、更新性能更好只有10ms。

Hbase紧随其后。至于MySQL，每秒执行4000左右操作的时候才和上面两个有可比性，超过5000之后延迟迅速攀升。

(2) 95/5读和更新、即读多写少。

还是Cassandra最优秀。

列式存储连续范围的读取性能非常优秀，这证明和Hbase批量读写的性能非常好。

Hbase表现非常稳定，与每秒操作数无关，5%的更新在Hbase里面几乎没有延迟。

只读情况下MySQL性能最好，可能与缓存有关。

如果结合分布式缓存MemeCached或者MemBase，那么Hbase的读取性能就可以和MySQL比肩了。

四、选择NoSQL存储需要考虑的维度

1、Data model（数据模型）. Thereare many variations of how the data is stored, which include key/value stores(compare to a HashMap), semi-structured, column-oriented stores, anddocument-oriented stores. How is your application accessing the data? Can theschema evolve over time?

2、Storage model（存储模型）.In-memory or persistent? This is fairly easy to decide on since we arecomparing with RDBMSs, which usually persist their data to permanent storage,such as physical disks. But you may explicitly need a purely in-memorysolution, and there are choices for that too. As far as persistent storage isconcerned, does this affect your access pattern in any way?

3、Consistency model（一致性模型）.Strictly or eventually consistent? The question is, how does the storage systemachieve its goals: does it have to weaken the consistency guarantees? Whilethis seems like a cursory question, it can make all the difference in certainuse-cases. It may especially affect latency, i.e., how fast the system canrespond to read and write requests. This is often measured harvest and yield.

4、Physical model（物理模型）.Distributed or single machine? What does the architecture look like - is itbuilt from distributed machines or does it only run on single machines with thedistribution handled client-side, i.e., in your own code? Maybe the distributionis only an afterthought and could cause problems once you need to scale thesystem. And if it does offer scalability, does it imply specific steps to doso? Easiest would be to add one machine at a time, while sharded setupssometimes (especially those not supporting virtual shards) require for eachshard to be increased simultaneously because each partition needs to be equallypowerful.

5、Read/writeperformance（读写性能）. You have to understand what your application's access patternslook like. Are you designing something that is written to a few times, but readmuch more often? Or are you expecting an equal load between reads and writes?Or are you taking in a lot of writes and just a few reads? Does it supportrange scans or is better suited doing random reads? Some of the availablesystems are advantageous for only one of these operations, while others may dowell in all of them.

6、Secondary indexes（二级索引）.Secondary indexes allow you to sort and access tables based on different fieldsand sorting orders. The options here range from systems that have absolutely nosecondary indexes and no guaranteed sorting order (like a HashMap, i.e., youneed to know the keys) to some that weakly support them, all the way to thosethat offer them out-of-the-box. Can your application cope, or emulate, if thisfeature is missing?

7、Failure handling（失败处理）. It isa fact that machines crash, and you need to have a mitigation plan in placethat addresses machine failures (also refer to the discussion of the CAPtheorem in Consistency Models). How does each data store handle server failures?Is it able to continue operating? This is related to the "Consistencymodel" dimension above, as losing a machine may cause holes in your datastore, or even worse, make it completely unavailable. And if you are replacingthe server, how easy will it be to get back to 100% operational? Anotherscenario is decommissioning a server in a clustered setup, which would mostlikely be handled the same way.

8、Compression（压缩）. Whenyou have to store terabytes of data, especially of the kind that consists ofprose or human readable text, it is advantageous to be able to compress thedata to gain substantial savings in required raw storage. Some compressionalgorithms can achieve a 10:1 reduction in storage space needed. Is thecompression method pluggable? What types are available?

9、Load balancing（负载均衡）. Giventhat you have a high read or write rate, you may want to invest into a storagesystem that transparently balances itself while the load shifts over time. Itmay not be the full answer to your problems, but may help you to ease into ahigh throughput application design.

10、AtomicRead-Modify-Write（原子读修改写操作）. While RDBMSs offer you a lot of these operations directly (becauseyou are talking to a central, single server), it can be more difficult toachieve in distributed systems. They allow you to prevent race conditions in multi-threadedor shared-nothing application server design. Having these compare and swap(CAS) or check and set operations available can reduce client-side complexity.Locking, waits and deadlocks It is a known fact that complex transactionalprocessing, like 2-phase commits, can increase the possibility of multipleclients waiting for a resource to become available. In a worst-case scenario,this can lead to deadlocks, which are hard to resolve. What kind of lockingmodel does the system you are looking at support? Can it be free of waits andtherefore deadlocks?

附上一些有用的网址：

MongDB介绍： http://www.csdn.net/article/2012-11-15/2811920-mongodb-quan-gong-lue

NOSQL数据库对比： http://vschart.com/compare/hbase/vs/mongodb

几种NoSQL性能对比： http://www.jdon.com/46128

参考：

1、淘宝的应用场景和优化：http://blog.csdn.net/jiyiqinlovexx/article/details/29260677。

2、淘宝大数据的相关PPT。

3、Facebook的论文。

4、HBase权威指南。

热修复框架Tinker与Robust原理剖析 Ya-Jun android
热修复框架Tinker与Robust原理剖析一、热修复技术概述1.1什么是热修复热修复（HotFix）是Android平台上的一种动态修复机制，它允许应用在不重新发布版本的情况下，动态修复线上bug。这种技术对于快速修复线上问题、降低用户流失率具有重要意义。1.2热修复的应用场景紧急bug修复功能动态更新A/B测试动态功能控制1.3主流热修复方案对比方案优点缺点适用场景Tinker支持全量更新、性
Flutter桌面开发（三、widget布局与表单）左钦杨 flutter javascript android
一、流式布局横铺或者竖着铺Row或者Column这俩都是有Children的就是可以有多个子元素例子：Row(Children:[Container(),Container(),Container(),]）Container类似于html中的DIV可以设置背景border和宽度高度Container(decoration:BoxDecoration(image:DecorationImage(im
Vue.js 3 的设计思路：从声明式UI到高效渲染机制前端贾公子 vue.js ui flutter
目录一、声明式UI与虚拟DOM的灵活性二、渲染器：虚拟DOM到真实DOM的桥梁三、组件的本质与实现四、编译与运行时的协同优化五、性能与可维护性的权衡总结Vue.js3作为新一代前端框架，其设计理念在声明式UI描述、虚拟DOM优化、组件化架构以及编译与运行时协作等方面实现了显著突破。本文将从多个角度深入探讨其设计思路。一、声明式UI与虚拟DOM的灵活性Vue.js3的核心特性之一是声明式UI描述，开
QT信号与槽：实现方法、技术细节、高级用法和底层机制程序先锋 QT界面开发 qt
1.基本概念信号（signals）：当对象的状态发生变化或发生特定事件时，自动触发的通知。比如PushButton常见的信号是clicked()信号。槽：接收信号并执行逻辑的成员函数。可定义在类的任何部分（public、private、protected）连接：通过QObject::connect将信号与槽绑定。connect(sender,&Sender::signal,receiver,&Re
「QT」布局类之 QHBoxLayout 水平布局类何曾参静谧「QT」QT5程序设计 qt 开发语言
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）文章专栏「QT」QT5程序设计全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「UG/NX」BlockUI集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」NX定制开发「Py」Python程序设计「Ma
4-002：如何使用 MySQL 的 EXPLAIN 语句进行查询分析？盖盖衍上_染染熊_代码集 00-刷题 mysql 数据库
EXPLAIN是MySQL中用于分析查询性能的工具，能够帮助你理解查询的执行计划。通过EXPLAIN，你可以查看MySQL如何执行查询，包括使用的索引、表连接顺序等信息。基本用法在查询前加上EXPLAIN即可：EXPLAINSELECT*FROMyour_tableWHEREyour_column='value';输出字段说明EXPLAIN的输出包含多个字段，以下是主要字段及其含义：id:查询标识
python+flask实现360全景图和stl等多种格式模型浏览 mosquito_lover1 python
1.安装依赖pipinstallflask2.创建Flask应用创建一个基本的Flask应用，并设置路由来处理不同的文件类型。fromflaskimportFlask,render_template,send_from_directoryapp=Flask(__name__)#设置静态文件路径app.static_folder='static'@app.route('/')defindex():r
【QT教程】QT6硬件数据库编程 QT硬件数据库 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6硬件数据库编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6硬件数据库编程基础1.1QT6数据库引擎概述1.1.1QT6数据库引擎概述
set_clock_groups jh你好硬件工程
一、命令参数与工具处理逻辑核心参数定义参数定义工具行为工具兼容性-asynchronous完全异步时钟组，无任何相位或频率关系（如独立晶振、不同时钟树）工具完全禁用组间路径的时序分析，但需用户自行处理跨时钟域（CDC）问题XilinxVivado、IntelQuartus、Gowin（等效参数-Exclusive）-logically_exclusive逻辑互斥时钟组，同一时刻仅一个有效（如MUX
深入解析：构建高效单页应用（SPA）的最佳实践与示例布兰妮甜 #Vue 单页应用 SPA Vue.js 前端
文章目录前言一、单页应用（SPA）的介绍二、单页应用（SPA）的优势三、构建单页应用（SPA）的基本步骤四、使用Vue.js构建一个简易的单页应用（SPA）：任务管理器结语前言随着互联网技术的发展，用户对于网页应用的交互性和响应速度提出了更高的要求。传统的多页面应用（MPA）在每次用户交互时需要重新加载整个页面，这不仅增加了服务器的负担，也降低了用户体验。而单页应用（SinglePageAppli
AI 之路——数据分析（1）Pandas小结与框架整理 Robin_Pi 机器学习之路数据分析数据分析 python 人工智能可视化
目录1.写在前面1.1AI之路：1.2工具/技能：2.数据分析2.1数据分析的流程2.2数据的基本操作方法2.2.1Pandas概览2.2.2使用Pandas操作数据的核心(1)选择数据(2)操作数据2.2.2数据详解3.写在最后1.写在前面主要是阶段性框架总结1.1AI之路：数据分析——机器学习——深度学习——CV/NLP1.2工具/技能：Python、NumPy、Pandas、Matplotl
是德科技N9020A使用领域介绍圣格特刘工嵌入式硬件网络可用性测试集成测试人工智能
是德科技（Keysight）N9020A频谱分析仪是一款高性能信号分析仪，适用于多个领域，主要包括以下应用场景：1.无线通信测试5G/4G/LTE/Wi-Fi测试：用于评估通信系统的射频性能，分析信号质量、调制精度等。射频器件测试：测量功率、带宽、谐波失真等指标，确保射频元器件符合标准。2.雷达与国防雷达信号分析：测试雷达信号的频谱特性、瞬时带宽、脉冲宽度等参数。电子战（EW）测试：分析复杂电磁环
深度解析AI智能助手系统架构：数据接入到平台管理的全景指南 AI大模型-搬运工人工智能系统架构大语言模型深度学习自然语言处理 AI智能助手大模型
在数字化转型的大潮中，AI智能助手在帮助企业优化运营、提高决策效率、增强用户体验方面发挥着不可替代的作用。本篇文章将带您深入了解一个典型的AI智能助手系统架构，并提供每个模块的具体实现方案，包括数据接入、模型配置、平台管理等核心模块，帮助企业更好地构建智能化业务流程。一、AI智能助手的核心功能及实现方案AI智能助手的核心功能包括自然语言问答、图表可视化、多维钻取、导出与收藏、需求理解与过程验证、用
微信小程序开发---的生命周期函数 J总裁的小芒果微信小程序小程序
onLaunch：小程序初始化完成时触发，全局只触发一次。适合进行一些初始化操作。onShow：小程序启动或者从后台进入前台时触发。每次小程序进入前台时都会触发。onHide：小程序从前台进入后台时触发，适合做一些暂停操作或存储数据等。onError：小程序发生错误时触发，接受一个错误信息作为参数，用于捕获小程序中的错误。onPageNotFound：小程序页面不存在时触发，通常是用户访问了一个不
Python爬虫教程：如何通过接口批量下载视频封面（FFmpeg技术实现） Python爬虫项目 python 爬虫开发语言数据库数据分析 scrapy selenium
引言随着在线视频平台的蓬勃发展，视频封面作为视频内容的预览图，一直以来都是观众对视频的第一印象。在爬取视频资源时，很多开发者和研究者往往只关注视频本身，而忽略了视频封面。实际上，视频封面不仅能提供重要的信息（例如视频标题、主题或情感等），而且它们也能作为数据集中的重要属性，用于视频分类、推荐系统等应用。在这篇博客中，我们将深入探讨如何使用Python通过接口批量下载视频封面，利用FFmpeg等技术
AI 大模型应用数据中心的数据分析架构 AI天才研究院计算 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《AI大模型应用数据中心的数据分析架构》关键词：数据中心、AI大模型、数据分析、架构设计、应用实践摘要：本文深入探讨了AI大模型在数据中心数据分析架构中的应用，从数据中心背景、AI大模型架构与技术、数据处理与分析技术、AI大模型应用与实践等多个方面，全面解析了AI大模型如何助力数据中心实现高效数据分析和智能处理，为读者提供了系统的理论指导和实际案例分析。第一部分:数据中心背景与AI大模型概述第1章
审核通过≠报名成功！提醒下报了名的软考考生，这件事别忘了做！公众号-希赛网学习方法职场和发展
截止至3月13日18:00，江苏、贵州、山西、大连、安徽、福建、澳门、甘肃、新疆、兵团、四川、浙江、辽宁、吉林、宁波等考区均已开通报名入口。已经报名和准备报名的考生，小希提醒大家，审核通过≠报名成功！一、审核通过≠报名成功虽然软考对考生的学历、专业、工作年限等没有要求，但是部分考区还是会对考生上传的材料、填写的报考信息等进行审核，以确认证件照片满足要求并符合报考属地化管理原则。报名系统并不会以任何
C# AOT生成的hellowwordEXE运行占用多少内存1-5MB? 专注VB编程开发20年 c#策略模式开发语言
C#使用AOT（Ahead-Of-Time，提前编译）生成的"Hello,World!"可执行文件在运行时占用的内存会受到多种因素的影响，以下是详细分析：影响内存占用的因素操作系统：不同的操作系统（如Windows、Linux、macOS）对进程的内存管理机制不同，会导致内存占用有所差异。运行环境：包括系统中已运行的其他程序、系统的内存管理策略等。编译器和运行时配置：不同版本的.NETSDK以及编
C# HashTable、HashSet、Dictionary 有诗亦有远方 C#Hash
哈希一、HashTable1.什么是哈希表2.哈希表的Key&Value（1）添加数据（2）“键值对”均是object类型（3）必须有Key键，且Key键不能重复。（4）乱序读取数据3.基本操作二、HashSet1.特点2.HashSet常用扩展方法3.HashSet与Linq操作三、Dictionary四、HashTable和Dictionary的区别一、HashTable哈希表(HashTab
Typora 0.11.18最后一个免费版 hishere python java html c++c#
http://pmkiu.woguheihuasheng.cn/3578174开始typora是非常好用的一个md文件编辑器但是最新版是收费的，直到0.11.18版本这已经够用了https://www.aliyundrive.com/s/X6D4LqiUtD5typora的语法typora语法字体Ctrl+1,2,3,4,5,6,对应6个标题,井号与标题直接有空格#标题1##标题2下划线ctrl+
嵌入式面试真题——Linux内核空间与用户空间 70000cc 嵌入式面试真题 linux c语言嵌入式硬件面试单片机
本文以32位系统为例介绍内核空间(kernelspace)和用户空间(userspace)。对32位操作系统而言，它的寻址空间（虚拟地址空间，或叫线性地址空间）为4G（2的32次方）。也就是说一个进程的最大地址空间为4G。操作系统的核心是内核(kernel)，它独立于普通的应用程序，可以访问受保护的内存空间，也有访问底层硬件设备的所有权限。为了保证内核的安全，现在的操作系统一般都强制用户进程不能直
MyBatis底层原理深度解析：动态代理与注解如何实现ORM映射 rider189 java 开发语言 mybatis
一、引言MyBatis作为一款优秀的ORM框架，其核心设计思想是通过动态代理和注解将接口方法与SQL操作解耦。开发者只需定义Mapper接口并添加注解，便能实现数据库操作，这背后隐藏着精妙的动态代理机制与源码设计。本文将从源码层解析MyBatis如何实现这一过程。二、动态代理机制：从接口到实现类关键点：MyBatis通过JDK动态代理为Mapper接口生成代理对象，拦截所有方法调用，将其路由到SQ
python vuejs聊天室_ws模块指南+Vue在线聊天室无1234 python vuejs聊天室
简介ws模块是Node端的一个WebSocket协议的实现,该协议允许客户端(一般是浏览器)持久化和服务端的连接.这种可以持续连接的特性使得WebScoket特别适合用于适合用于游戏或者聊天室等使用场景.ws模块相较于其他基于WebSocket协议的模块来说非常的纯粹.他只关注基于WebSocket协议的实现,其他例如Socket.io提供了回退手段,当WebSocket无法使用的时候会利用轮询来
树莓科技集团董事长：第五代产业园运营模式的深度剖析与展望树莓集团科技人工智能百度物联网大数据
第五代产业园运营模式，以创新为核心驱动，强调数字化、网络化和资源整合。树莓科技集团在这一领域具有代表性，其运营模式值得深入剖析。核心特征数字化转型：第五代产业园高度重视数字化技术的应用，通过构建数字化平台，实现园区内企业、资源、信息的互联互通。并网化运营：树莓集团在全国28个省市布局产业园，形成网络化运营，促进资源共享和协同发展。全产业链整合：充分发挥全产业链资源整合优势，为入园企业提供全方位服务
MessageBox() 程工助力英语中国话 win32 MessageBox
书籍：《windows程序设计(第五版)》的开始->编写第一个WINDOWS程序环境：visualstudio2022内容：编写第一个WINDOWS程序一、函数原型与参数解析intWINAPIMessageBox(HWNDhWnd,//窗口句柄LPCTSTRlpText,//消息内容LPCTSTRlpCaption,//标题UINTuType//类型参数);**hWnd**：指定消息框的父窗口句柄
《Web 应用项目开发》课程心得体会：从理论到实战，开启 Web 开发新征程 m0_74824091 前端
在信息技术飞速发展的当下，Web应用已然渗透到生活的方方面面，从日常网购、社交娱乐，到在线办公、学习平台，无一不是Web应用的成果。怀着对互联网技术的热忱与憧憬，我踏入了《Web应用项目开发》这门课程，历经数月的沉浸式学习与实践，收获远超预期，犹如经历一场脱胎换骨的蜕变，以下便是我在这门课程中的全面心得体会。夯实基础：Web技术初相识课程伊始，仿若踏入一片未知的技术丛林，HTML、CSS和Java
【十五】Golang 结构体张胤尘 Golang golang 开发语言后端
欢迎来到张胤尘的开源技术站开源如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌文章目录结构体定义初始化使用字段名初始化按字段顺序初始化使用`new`函数初始化结构体零值访问结构体可访问性访问方式结构体方法方法的调用可访问性访问方式方法接收者值接收者指针接收者其他场景结构体的比较匿名结构体结构体嵌套嵌套结构体中的方法匿名字段序列化与反序列化常见的序列化格式字
Linux下C方式操作GPIO 大牛攻城狮 c语言 Linux 操作GPIO /sys/class/gpio MCU操作IO方式
1摘要嵌入式编程中对GPIO的读写操作是最常见的应用的了，这里介绍一种C语言方式操作GPIO，涉及代码，以源代码的形式提供，方便快速嵌入实际项目开发；这种操作GPIO的方法类似MCU，实现一行代码拉高、拉低GPIO，直接一行代码实现IO的读写，其实质是封装了/sys/class/gpio的读写。代码实现了GPIO初始化、读、写等操作，针对Linux下操作GPIO提供了一套标准流程，同时可以应用于多
嵌入式人工智能应用- 第七章人脸识别数贾电子科技嵌入式人工智能应用人工智能
嵌入式人工智能应用`文章目录嵌入式人工智能应用1人脸识别1.1dlib介绍1.2dlib特点1.3dlib的安装与编译2人脸识别原理2.1ResNet3代码部署3.1安装[CUDAToolkit12.8](https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubunt
docker web镜像制作 chao09_01 docker 容器 web服务
前后端服务镜像制作与发布1、dockerFile内容编写后端dockerFile内容FROMjava:8#FROMopenjdk:8-jdk#RUNapt-getupdate&&apt-getinstall-yiputils-pingtelnet##设置所属时区ENVTZ=Asia/ShanghaiMAINTAINERhjyCOPY./xxx.jar/xxx.jarENTRYPOINT["java
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

HBase概念学习（十）HBase与MongDB等NoSQL数据库对比

你可能感兴趣的:(HBase概念学习（十）HBase与MongDB等NoSQL数据库对比)