梦醒沉醉

HBase简介

1. HBase概述
2. HBase核心概念
- 2.1 行关键字
- 2.2 列关键字
- 2.3 时间戳
- 2.4 单元
- 2.4.1 HBase和RDBMS的差异
- 2.4.2 HBase组成
3. HBase流程
- 3.1 Region的分配
- 3.2 RegionServer上线
- 3.3 RegionServer下线
- 3.4 Master上线
- 3.5 Master下线
- 3.6 写请求处理
参考

1. HBase概述

HBase是NoSQL(Not Only SQL，泛指用来解决大数据相关问题而创建的数据库技术)数据库的一种，与传统关系型数据库有很多区别，既可以存储结构化数据，也可以存储非结构化数据或半结构化数据。
如果需要实时随机地访问超大规模数据集，就可以使用HBase这一Hadoop应用。HBase是一个在HDFS上开发的面向列的分布式数据库。
虽然数据库存储和检索的实现可以选择很多不同的策略，但是绝大多数解决办法，特别是关系型数据库技术的变种，不是为大规模可伸缩的分布式处理设计的。很多厂商提供了复制和分区解决方案，让数据库能够从单个节点上扩展出去，但是这些附加的技术大都属于“事后“的解决办法，而且难以安装和维护，并且这些解决办法常常要牺牲一些重要的关系型数据库管理系统特性。
在一个扩展的关系型数据库管理系统RDBMS上，连接、复杂查询、触发器、视图以及外键约束这些功能或运行开销大，或根本无法用。HBase从另一个方向来解决可伸缩的问题，它自底向上地进行构建，能够简单地通过增加节点来达到线性扩展的目的。
HBase并不是关系型数据库，它不支持SQL。但在特定的问题空间里，它能够做RDBMS不能做的事：在廉价硬件构成的集群上管理超大规模的稀疏表。
HBase是Apache的顶级开源项目，本质是谷歌BigTable的开源山寨版本。建立在HDFS之上，提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统，它介于NoSQL和RDBMS之间，仅能通过主键和主键的范围来检索数据，仅支持单行事物(可通过Hive支持来实现多表join等复杂操作)。主要用来存储非结构化和半结构化的松散数据。

2. HBase核心概念

HBase的数据存放在带标签的表中。表由行和列组成。表格的单元格由行和列的坐标交叉决定，是有版本的。默认情况下，版本号是自动分配的，为HBase插入单元格时的时间戳。单元格的内容是未解释的字节数组。HBase是一个稀疏、长期存储、多维度、排序的映射表。这张表的索引是行关键字、列关键字和时间戳。每个值是一个二进制的字节数组。

2.1 行关键字

row key保存为字节数组，是用来检索记录的主键。可以是任意字符串(最大长度为64KB)。存储时，数据按照row key的字典序排序存储。设计row key时，要充分利用排序存储这个特性，将经常一起读取的行存储放到一起。

2.2 列关键字

列关键字由列族column family和列qualifier两部分组成。列族是表的schema元数据的一部分(列不是)，必须在表使用前定义。列名都是以列族为前缀的。例如courses:history、courses:math都属于courses这个列族。有关联的数据应都存放在一个列族里，否则将降低读写效率。目前HBase并不能很好地处理多个列族，建议最多使用两个列族。

2.3 时间戳

HBase中通过row和columns确定的一个存储单元称为cell。每个cell都保存着同一份数据的多个版本。版本通过时间戳来索引。时间戳的类型是64位整型。时间戳可以由HBase在数据写入时自动赋值，此时时间戳是精确到毫秒的当前系统时间。时间戳也可以由用户显式赋值。如果应用程序要避免数据版本冲突，就必须自己生成具有唯一性的时间戳。每个cell中，不同版本的数据按照时间倒序排列，即最新的数据排在最前面。为了避免数据存在过多版本造成管理负担，HBase提供了两种数据版本回收方式。一是保存数据的最后N个版本，二是保存最近一段时间内的版本。用户可以针对每个列族进行设置。

2.4 单元

由{row key, column(= + ), version}唯一确定的单元，cell中的数据是没有类型的，全部以字节码形式存储。
与NoSQL数据库一样，row key是用来检索记录的主键。访问HBase表中的行，只有3种方式：
1. 通过单个row key访问单条记录。
2. 通过row key的range指定检索范围。
3. 全表扫描。
物理上，所有列族成员都一起存放在文件系统中。所以，虽然把HBase描述为一个面向列的存储器，但实际上更准确的说法是，HBase是个面向列族的存储器。由于调优和存储都是在列族这个层次进行的，所以最好使所有列族成员都有相同的访问模式和大小特征。简而言之，HBase表和RDBMS中的表类似，单元格有版本，行是排序的，只要有列族预先存在，客户端随时可以把列添加到列族中去。
HBase的存储格式如下图所示。

2.4.1 HBase和RDBMS的差异

下面通过一些数据来比较HBase和RDBMS表格式上的差异。

Primary key	Last Name	First Name	Account Number	Type of Account	Timestamp
1234	Smith	John	abcd1234	Checking	20120118
1235	Johnson	Michael	wxyz1234	Checking	20120118
1235	Johnson	Michael	aabb1234	Checking	20111123

(这个表主键应该是(Primary key, Account Number))
对应的数据在HBase中的存储格式如下。

row key	Value(CF, column, version, cell)
1234	info: {‘lastName’: ‘Smith’, ‘firstName’: ‘John’} acct: {‘checking’: ‘abcd1234’}
1235	info: {‘lastName’: ‘Johnson’, ‘firstName’: ‘Michael’} acct: {‘checking’: ‘wxyz1234’@ts=2012, ‘checking’: ‘aabb1234’@ts=2011}

下面列出了HBase与RDBMS的主要差异。

	HBase	RDBMS
数据类型	只有字符串	丰富的数据类型
数据操作	简单的增删改查	各种各样的函数，表连接
存储模式	基于列存储	基于表格结构和行存储
数据保护	更新后旧版本仍然会保留	替换
可伸缩性	轻易地增加节点，兼容性高	需要中间层，牺牲性能
典型的数据大小	TB-PB级别上亿到数十亿条记录	GB-TB级别，几十万到几百万条记录
吞吐量	每秒百万条查询	每秒数千次查询

2.4.2 HBase组成

HBase自动将表水平划分成区域。每个区域由表中行的子集构成。每个区域由它所属的表、它所包含的第一行及最后一行(不包括这行)来表示。
一开始，一个表只有一个区域。但是随着区域变大，等到它的大小超出设定的阈值时，便会在某行的边界上把表分成两个大小基本相同的新分区。在第一次划分前，所有加载的数据都放在原始区域所在的服务器上。
随着表变大，区域的个数也会增加。区域是在HBase集群上分布数据的最小单位。用这种方式，一个因为太大而无法放在单台服务器上的表会被放在服务器集群上，其中每个节点都负责管理表所在区域的一个子集。表的加载也是使用这种方法把数据分布到各个节点。在线的所有区域按次序排列就构成了表的所有内容。
HBase的组成如下表所示。

角色	功能
Region	表中一部分数据组成的子集，当Region内的数据过多时能够自动分裂，过少时会合并
RegionServer	维护Master分配给它的Region，处理对这些Region的IO请求，负责切分在运行过程中变得过大的Region
Master	为RegionServer分配Region，负责RegionServer的负载均衡，发现失效的RegionServer并重新分配其上的Region，执行HDFS的垃圾文件回收
ZooKeeper	保证任何时候集群中只有一个Master存储所有Region的寻址入口。实时监控RegionServer的状态，将RegionServer的上线和下线信息实时通知给Master。存储HBase的Schema，包括有那些table，每个table有那些column family，处理Region和Master的失效

3. HBase流程

HBase的客户端会将查询过的HRegion的位置信息进行缓存，如果客户端没有缓存一个HRegion的位置或者位置信息是不正确的，客户端会重新获取位置信息。如果客户端的缓存全部失效，则需要进行多次网络访问才能定位到正确的位置。

3.1 Region的分配

任何时刻，一个Region只会分配给一个RegionServer。Master跟踪当前有哪些可用的RegionServer，以及当前哪些Region分配给了哪些RegionServer，哪些Region还没有分配。当存在未分配的Region且有一个RegionServer上有可用空间时，Master就给这个RegionServer发送一个装载请求，把Region分配给这个RegionServer。RegionServer得到请求后，就开始对此Region提供服务。

3.2 RegionServer上线

Master使用ZooKeeper来跟踪RegionServer状态。当某个RegionServer启动时，会首先在ZooKeeper上的rs目录下建立代表自己的文件，并获得该文件的独占锁。由于Master订阅了rs目录上的变更消息，当rs目录下的文件出现新增或删除操作时，Master可以得到来自ZooKeeper的实时通知。因此一旦RegionServer上线，Master能马上得到消息。

3.3 RegionServer下线

当RegionServer下线时，它和ZooKeeper的会话断开，Zookeeper会自动释放代表这台Server的文件上的独占锁，而Master不断轮询rs目录下文件的锁状态。如果Master发现某个RegionServer丢失了它自己的独占锁，Master就会尝试去获取代表这个RegionServer的读写锁，一旦获取成功，就可以确定：
1. RegionServer和ZooKeeper之间的网络断开了。
2. RegionServer失效了。
只要这两种情况中的一种情况发生了，无论哪种情况，RegionServer都无法继续为它的Region提供服务，此时Master会删除Server目录下代表这台RegionServer的文件，并将这台RegionServer的Region分配给其他还“活着”的机器。
如果网络短暂出现问题导致RegionServer丢失了它的锁，那么RegionServer重新连接到ZooKeeper之后，只要代表它的文件还在，它就会不断尝试获取这个文件上的锁，一旦获取到了，就可以继续提供服务。

3.4 Master上线

Master启动上线包括以下步骤：
1. 从ZooKeeper上获取唯一代表Master的锁，用来阻止其他节点成为Master。
2. 扫描Zookeeper上的Server目录，获得当前可用的RegionServer列表。
3. 与每个RegionServer通信，获得当前已分配的Region和RegionServer的对应关系。
4. 扫描.META.region的集合，计算得到当前未分配的Region，将它们放入待分配Region列表。

3.5 Master下线

由于Master只维护表和Region的元数据，而不参与表数据IO的过程，所以Master下线仅导致所有元数据的修改被冻结。此时无法创建、删除表，无法修改表的schema，无法进行Region的负载均衡，无法处理Region上下线，无法进行Region的合并，唯一例外的是Region的split可以正常进行，因为只有RegionServer的参与，表的数据读写还可以正常进行。因此Master下线短时间内对整个HBase集群没有影响。
从上线过程可以看出，Master保存的信息全是冗余信息，都可以从系统其他地方收集或者计算出来。因此，一般HBase集群中总有一个Master在提供服务，还有一个以上的“Master"在等待时机抢占它的位置。
当客户端要修改HBase的数据时，首先创建一个action(比如put、delete、incr等操作)，这些action都会被包装成Key-Value对象，然后通过RPC将其传递到HRegionServer上。HRegionServer将其分配给相应的HRegion，HRegion先将数据写入Hlog中，然后将其写入MemStore。MemStore中的数据是排序的，当MemStore累计到一定阈值时，就会创建一个新的MemStore，并且将老的MemStore添加到flush队列，由单独的线程flush到磁盘上，成为一个StoreFile。与此同时，系统会在ZooKeeper中记录一个redo point，表示这个时刻之前的变更已经持久化了。当系统出现意外时，可能导致内存(MemStore)中的数据丢失，此时使用Log来恢复redo point之后的数据。
StoreFile是只读的，一旦创建后就不可以再修改，因此HBase的更新其实是不断追加的操作。当一个Store中的StoreFile达到一定的阈值后，就会进行一次合并，将对同一个key的修改合并到一起，形成一个更大的StoreFile。
由于对表的更新是不断追加的，处理读请求时，需要访问Store中全部的StoreFile和MemStore，将它们的数据按照row key进行合并，由于StoreFile和MemStore都是经过排序的，并且StoreFile带有内存中索引，所以合并的过程还是比较快的。

3.6 写请求处理

写请求的处理过程如下：
1. Client向RegionServer提交写请求。
2. RegionServer找到目标Region。
3. Region检查数据是否与schema一致。
4. 如果客户端没有指定版本，则获取当前系统时间作为数据版本。
5. 将更新写入WAL log。
6. 将更新写入MemStore。
7. 判断MemStore的数据是否需要flush为Store文件。

参考

吴章勇杨强著大数据Hadoop3.X分布式处理实战

运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
医疗AI与融合数据库的整合：挑战、架构与未来展望（下） Allen_Lyb 数智化教程（第二期）人工智能数据库架构
解决方案：引入融合数据库（Multi-modalDataFusionDB）医院引入一款支持图、向量、表、流的融合数据库（如OracleADW、Milvus+PostgreSQL、或某国产平台），完成了以下集成：数据类型来源系统格式/模型示例内容基因组数据NGS平台VCF/JSON/图EGFR突变、ALK融合等医学影像特征CT影像AI平台向量肿瘤体积、位置、边界清晰度等临床病历HIS/EMR结构化表
Django数据库迁移番茄码 django 数据库 django oracle
在Django中进行数据库迁移的命令是`pythonmanage.pymigrate`。下面是一些常用的数据库迁移命令及其用途：1.`pythonmanage.pymakemigrations`：生成数据库迁移文件。当你修改了模型（Model）或创建了新的模型时，需要运行该命令来生成一个包含最新更改的迁移文件。2.`pythonmanage.pymigrate`：应用数据库迁移。运行该命令会将生成
Django基础(一)———创建与启动【本人】 PythonWeb django python 后端
前言从这篇文章开始，我将给大家介绍Python中的一个框架Django我将从基础开始一步一步带领大家深入了解Django框架并完成实战案例一、Django是什么？Django是一个免费、开源、高级的PythonWeb框架。它的核心目标是使开发复杂的、数据库驱动的网站变得快速、简单和安全。Django遵循“Don'tRepeatYourself”的设计哲学，强调代码复用和组件化。它奉行“包含电池”的
Django 实战：静态文件与媒体文件从开发配置到生产部署明明可爱多 django python 后端
合集-Django从入门到实战(11)1.Django实战：I18N国际化与本地化配置、翻译与切换一步到位07-182.Django数据库配置避坑指南：从初始化到生产环境的实战优化06-303.Django实战：自定义中间件实现全链路操作日志记录06-274.Django实战：HTTP状态码与业务状态码的分层设计与实战应用07-025.Django+DRF实战：从异常捕获到自定义错误信息07-04
Django 实战：Celery 异步任务从环境搭建到调用全掌握
合集-Django从入门到实战(11)1.Django实战：I18N国际化与本地化配置、翻译与切换一步到位07-182.Django数据库配置避坑指南：从初始化到生产环境的实战优化06-303.Django实战：自定义中间件实现全链路操作日志记录06-274.Django实战：HTTP状态码与业务状态码的分层设计与实战应用07-025.Django+DRF实战：从异常捕获到自定义错误信息07-04
Django母婴商城项目实践（二）- 商城项目环境配置 ITB业生 Django django 数据库 python
2、母婴商城项目环境配置环境配置：Python3.12解释器PycharmProfessional2025.1编辑器Django4.2（或Django5.x）MySQL8.0.28数据库1、Django框架介绍Django是一个高级的PythonWeb应用框架，可以快速开发安全和可维护的网站。由经验丰富的开发者构建，Django负责处理网站开发中麻烦的部分，可以专注于编写应用程序，而无需重新开发。
基于Socket来构建无界数据流并通过Flink框架进行处理每天五分钟玩转人工智能 Flink技术实战 flink 大数据 Flink 分布式无界数据
本文重点随着大数据技术的不断发展，实时数据流处理已成为企业应对海量数据、实现快速决策的关键技术。ApacheFlink是一个开源的流处理框架，它能够对无界数据流进行高效的、精确的处理。本文将介绍如何通过Socket构建无界数据流，并利用Flink框架进行无界流处理。基于Socket构建无界数据无界数据指的是源源不断产生的数据，这些数据通常来自各种实时数据源，如用户行为日志、传感器数据等。Socke
【Django备忘录】Django数据库的迁移
目录Contents一、确认信息二、生成迁移文件三、迁移数据库定义某个应用的数据模型后，就要执行数据库迁移了，具体步骤如下：一、确认信息先确认你的应用是否在项目名/setting.py的INSTALLED_APPS列表中激活，激活完成后才可使用迁移。没有激活完成会检测不到数据模型修改项，导致迁移后没有数据模型。二、生成迁移文件打开CMD，cd到你的项目的目录（注意是manage.py的同级目录），
Ubuntu 22.04.3 LTS 安装 MySQL mixboot mysql ubuntu mysql
更新系统包索引sudoaptupdatesudoaptupgrade-y安装MySQLsudoaptinstallmysql-server-y检查MySQL服务状态sudosystemctlstatusmysql运行MySQL安全配置脚本sudomysql_secure_installation设置root密码删除匿名用户容许root远程登录删除测试数据库重新加载权限表sudomysql_secu
MySQL高可用集群架构：主从复制、MGR与读写分离实战软考和人工智能学堂 PHP和MySQL php程序设计 MySQL经验与技巧数据库 mysql 架构
1.MySQL高可用架构概述MySQL高可用性(HighAvailability)解决方案旨在确保数据库服务在硬件故障、网络问题等异常情况下仍能持续提供服务。以下是主流的高可用方案对比：方案原理优点缺点适用场景主从复制基于binlog的异步复制简单易用，对性能影响小数据一致性弱，故障切换复杂读写分离、备份MHA监控主库并自动故障转移自动切换，减少停机时间需要VIP管理，配置复杂中小规模业务系统MG
21、数据库设计中的索引使用 garlic Azure数据服务建模指南数据库设计索引使用查询性能优化
数据库设计中的索引使用1.索引的基本概念索引是一种数据结构，旨在加速数据库中的数据检索操作。通过使用索引，数据库引擎可以更快速地定位所需的数据行，从而提高查询性能。索引类似于书籍的目录，通过目录可以快速找到特定页面，而不必逐页翻阅。2.索引的作用索引在数据库设计中起着至关重要的作用，主要包括以下几个方面：加速查询：索引可以帮助数据库引擎更快地找到特定的数据行，特别是在处理大量数据时。例如，当我们需
38、未来展望：C数据库编程的发展趋势与挑战 dog123 C#数据库编程：从入门到精通 C#数据库编程云原生数据库
未来展望：C#数据库编程的发展趋势与挑战1.引言随着信息技术的快速发展，数据库编程已经成为现代软件开发中不可或缺的一部分。C#作为一种强大的编程语言，在数据库编程领域展现出卓越的表现。本文将探讨C#数据库编程的未来发展趋势，分析当前面临的主要挑战，并提出相应的解决方案。通过这些讨论，我们希望能够为开发者提供有价值的见解，帮助他们在未来的项目中更好地应对变化和技术进步。2.数据库编程的新趋势2.1云
菜单权限管理 SXU_TSUKI_JAVA javaee Vue.js java
菜单管理系统的整体架构1.Menu菜单表2.role角色表3.role_menu角色菜单关联表（多对多）要找role_id为3的角色能用哪个菜单:SELECT*FROMsys_menuaLEFTJOINsys_role_menubONa.menu_id=b.menu_idWHERErole_id=3拆分开就是4.user用户表5.user_role用户角色关联表（多对多）前后端数据库是如何交互的A
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
在医疗AI爆发式增长的今天，单一数据库已无法满足多模态医疗数据的处理需求。本文将揭秘医疗融合数据库的核心架构，通过真实代码示例展示如何破解医疗数据整合的世纪难题。###一、医疗数据的"四维挑战"####1.多模态数据洪流```python#典型患者数据组成patient_data={"时序数据":"ECG/EEG波形(1000Hz采样)","影像数据":"CT/MRI(单次扫描2GB+)","文本
MyBatis深度解析：从原理到实战的ORM框架指南秋秋棠 Java全栈 mybatis java
MyBatis深度解析：从原理到实战的ORM框架指南一、MyBatis核心概念1.1ORM框架的本质对象关系映射（ORM）是连接面向对象编程与关系型数据库的桥梁，它实现了：数据库表↔Java类的映射表记录↔对象实例的映射表字段↔对象属性的映射以用户表为例：idusernamepasswordage1zhangsan123456252lisiabcdef30对应的Java实体类：publicclas
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
时序数据库选型避坑全攻略：IoTDB性能与成本双杀的秘密！ LCG元数据库时序数据库 iotdb java
文章目录一、架构设计深度解析1.1IoTDB架构图谱1.2核心流程对比二、企业级实战代码2.1Python数据写入示例2.2TypeScript客户端实现2.3集群配置YAML三、性能对比分析四、生产部署方案4.1安全加固配置4.2安全策略实施五、技术前瞻分析5.1云原生演进路径5.2新型存储引擎预测六、技术图谱附录一、架构设计深度解析1.1IoTDB架构图谱数据写入协议适配层内存表管理持久化引擎
探索阿里云DMS：解锁高效数据管理新姿势云资源服务商 oracle 数据库阿里云云计算
一、阿里云DMS是什么阿里云DMS，全称为DataManagementService，即数据管理服务，是一种集数据管理、结构管理、安全管理于一体的全面数据库服务平台。它能够有效地支持各类数据库产品，包括但不限于MySQL、SQLServer、PostgreSQL、PPAS、DRDS、OceanBase、MongoDB、Redis等，对用户的数据库进行全方位的维护和管理，提供了一站式的数据库解决方案
疫情下，我的健康码首次变成了黄码唯我一心
3月中旬，老公在广州白云区接了一单生意，要很久才回来，就在那里租了一间房，带我和孩子一起住。房子在七楼，步梯，因孩子小，自己就很少下楼，都是他买菜回来，4月8号，订单完成，返程回了佛山。过了两天突然接到短信通知，白云区要大规模核酸筛查，又过一天收到短信:通过大数据分析，您近期行程涉及疫情防控重点区域，您的健康码将被赋予2次黄码并需开展2次核酸检测，请注意健康码状态，尽快凭码到附近黄码核酸检测点进行
到底应该怎么抓语文成绩山东董纯
上学期期末考试，全区统一采用网上阅卷的形式。在这个大数据时代，在这个极为透明的数据时代，一旦采用这样网络统一阅卷的形式。那丑媳妇就要真的见公婆了。再这样一个要生源没生源。要学习积极性没有学习积极性的氛围里。想取得好的成绩是真的难上加难。尽管已经预料到跟其他兄弟学校有一定的差距。但是没有想到差距如此之大。领导们坐不住了，反复约谈备课组长。理由是其他科目差距不大，甚至有优势。为什么语文学科会有如此大的
北京-4年功能测试2年空窗-报培训班学测开-第五十四天 amazinging python 学习面试
今天交付的成果是，初版简历虽然只写了项目部分，但用了一整天，期间联系了前司组长，拿到了性能测试报告。然后再看压测脚本，突然能看懂了，对服务端日志也能看懂些了，还找到了客户端日志怎么说呢，现在就是各种拼凑的阶段。我需要回忆几年前工作中可能听过的那些内容，还有结合各种搜集到的信息(从前同事那或其提供的文件），同时通过问ai来拼凑要写的项目的技术栈、架构、接口、数据库、开发逻辑等真的是要命了，以前根本对
Docker应用推荐个人服务器实用有趣的项目推荐牧子与羊 docker 服务器容器
Wallabag：是一个开源的、自托管的文章阅读和保存工具。它允许你保存网页文章并进行离线阅读，去除广告和不必要的内容，以提供更好的阅读体验。Wallabag支持多种导入和导出格式，并提供了一些实用的功能，如标签、阅读列表和文本高亮。phpMyAdmin：是一个基于Web的MySQL数据库管理工具。它提供了一个易于使用的界面，用于管理数据库、执行SQL查询、导入导出数据、创建表格、用户管理等各种数
CentOS 7如何平滑升级 MariaDB 5.5 到 10.x 新版本 Herotwins CentOS centos mariadb mysql
前言自从CentOS7开始，自带的数据库就变成MariaDB了，yum安装之后的默认版本是5.5，但是该版本不能满足Zabbix的需求，需要升级。无论是安装全新的还是升级MariaDB第一步始终是不要忘记备份。备份数据库重要的事情说三遍，备份，备份，备份！#备份数据库，如果升级顺利是不要实施备份还原的mysqldump-uroot-p--all-databases>alldb.sql#如果想保留自
基于 Mockito 框架的 Mock 单元测试
1.什么是Mock测试Mock通常是指，在测试一个对象A时，我们构造一些假的对象（一般是不容易构造或者不容易获取的对象，比如测试类所依赖的实现类、第三方接口、数据库操作对象）来模拟与A之间的交互，这些对象被称为Mock对象，而Mock对象的行为是我们事先设定且符合预期。通过这些Mock对象来测试A在正常逻辑，异常逻辑或压力情况下工作是否正常。下面是一个例子：当我们需要测试OrderService时
GaussDB 分布式部署下创建表方法
1、问题现象分布式集群采用水平分表的方式，将业务数据表的元组/行打散存储到各个节点内。2、技术背景通过全并行数据处理技术和快速定位到数据存储位置等手段可极大提升数据库性能，GaussDB分布式部署下可以创建俩种类型表，在做实际业务系统开发时根据业务场景创建不同表。复制表一般使用在小数量、更新操作少的场景下。分布表：数据会根据函数映射(hash,range,list),将数据打散在不同的DN上存储。
【Oracle】Oracle 11g 中扩展表空间瑞琪姐大数据模块 oracle 数据库
在Oracle11g中扩展表空间是常见的数据库管理任务，通常有以下几种核心方法，操作步骤如下：一、扩展表空间常用方法方法1：调整现有数据文件大小(RESIZE)适用于磁盘空间充足，且当前数据文件未达上限的情况。--查询当前数据文件路径和大小SELECTfile_name,bytes/1024/1024AScurrent_size_mbFROMdba_data_filesWHEREtablespac
【Oracle】ORACLE OMF说明瑞琪姐大数据模块 oracle 数据库
ORACLEOMF(OracleManagedFiles)是Oracle数据库提供的一项自动化文件管理功能。它的核心目的是简化数据库管理员（DBA）对数据库底层操作系统文件的管理工作。以下是OMF的关键要点：核心功能：自动命名和定位文件在创建数据库对象（如表空间、控制文件、在线重做日志文件等）时，DBA不需要手动指定文件在操作系统上的完整路径和文件名。Oracle数据库会根据预先配置的参数和内部规
【Oracle】删除 Oracle 19c 的监听器和数据库实例同时保留数据库软件瑞琪姐大数据模块数据库 oracle
要删除Oracle19c的监听器和数据库实例，同时保留数据库软件，请按以下步骤操作：1.停止监听器lsnrctlstop2.删除监听器配置手动删除配置文件：cd$ORACLE_HOME/network/adminrmlistener.orasqlnet.oratnsnames.ora#删除网络配置文件或使用netca工具：netca选择“Listenerconfiguration”→“Delete
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc