王知无(import_bigdata)

HBase实践 | HBase TB级数据规模不停机迁移最佳实践

背景

有关HBase集群如何做不停服的数据迁移一直都是云HBase被问的比较多的一个问题，目前有许多开源的工具或者HBase本身集成的方案在性能、稳定性、使用体验上都不是很好，因此阿里云提供了BDS迁移服务，可以帮助云上客户实现TB级数据规模不停机迁移

支持场景

HBase大版本升级， 1.x升级2.x
集群配置升级，8核16G升级为16核32G
集群网络环境变更，经典网络迁移到VPC
异地跨机房迁移
HBase业务拆分

方案介绍

开源方案

HBase不停机迁移主要包括三个部分：表结构的迁移、实时数据同步、历史全量数据迁移。

表结构迁移

对于表结构迁移来说，开源的DataX还是HBase本身都不提供表结构迁移的功能，只能进行手动建表，手动建表会存在几个问题：

如果源集群表数据较多，客户手动建表比较麻烦
手动建表可能忽略表分区，导致目标表分区很不合理，迁移完之后影响请求RT

实时数据同步

对于实时数据同步来说，有两种现有的方案：客户端应用双写、HBase Replication

客户端应用双写需要业务方对客户端代码进行改造，并且双写会放大毛刺，只要有一个集群出现问题就会影响业务写入，对于实时要求性比较强的业务是不能接受的
HBase Replication 对于大集群或者写入压力比较大的集群来说，存在如下几个问题：
1. 同步的逻辑集成在RegionServer当中，RegionServer读写和同步会相互影响
2. 不同的RegionServer同步的压力可能是不同的，不抗热点
3. 如果遇到同步积压，往往RegionServer的负载已经很高不太容易通过调整线程来解决，只能等低峰期慢慢消化或者增加RegionServer节点

全量数据迁移

对于全量数据迁移来说，可以使用DataX、HBase CopyTable、HBase创建和导出快照

DataX走的API层面的迁移，对于源集群大表的全表Scan和目标表大量的Put都会对集群业务产生影响，增加业务的读写毛刺，另外API层面的迁移比文件层的拷贝会多占用50%以上的流量
HBase创建和导出快照，快照的创建和导出都是在源集群上完成，会影响源集群稳定性，创建快照会暂用源集群的存储资源，对一张大表创建完快照，然后进行major compaction可能会导致HDFS容量水位迅速上涨，可能会写满HDFS

阿里云的方案

为了解决了开源方案存在的不足，支持TB、PB级别的数据迁移，我们阿里内部自研了一套迁移同步服务BDS，来满足阿里云上不同客户的需求。

对于HBase集群相互迁移，BDS支持表结构迁移、全量数据迁移以及增量数据同步

表结构迁移
- 自动创建目标表并保证分区一致，避免迁移后表单分区数据量过大，影响目标表读写RT
- 以表级别为粒度，支持批量提交
全量数据迁移
- 走文件层的数据文件拷贝比通常API层的数据迁移通常能节省50%以上的流量
- 自动处理Region Split、HFile Compaction
- 单节点迁移速度可达到100MB/s，节点数支持水平扩展，能够满足支持TB、PB级别的数据迁移
- 迁移速度可以动态配置
增量数据同步
- 异步解析源集群HDFS上的WALs并在目标集群进行回放，增量同步不会和源集群HBase进行交互
- 有完善的错误重试机制，实时监控任务速度和进度，支持任务失败报警
- 同步吞吐动态可配

稳定性保障

BDS稳定性

BDS采用的是分布式的架构，master通过zk监听worker节点是否存活，如果节点宕机会对任务进行重分配，完善的failover机制
完善的监控体系、报警机制，监控表迁移的进度，迁移了多大的数据量，迁移的速率，实时同步的延迟等信息，对于需要人为介入的异常进行报警
BDS支持任务断点续传

源集群业务稳定性

对于实时的数据同步，开源的方案走的是HBase Replication，同步逻辑集成在RegionServer中，RegionServer本身的读写和数据同步相互影响。BDS和HBase集群解耦，独立部署，避免对HBase集群CPU、内存等机器资源的占用
全量数据迁移、实时数据同步只访问源集群的HDFS，全程不会和HBase做交互，尽量避免对源集群业务产生的影响
可以动态调整全量数据迁移和实时数据同步的迁移速率

迁移步骤

下图为集群迁移的基本步骤

购买及环境准备
- 购买BDS迁移服务
- 不同网络环境需要打通BDS到各个集群的网络
提交迁移任务
- 登陆BDS操作页面
- 录入源集群和目标集群的信息
- 开启增量同步通道，同步源集群实时写入数据到目标集群
- 提交历史数据迁移任务，迁移历史存量数据文件
验证
- 业务验证
- 业务切换

案例

迁移规模

网路环境：相同VPC集群版本：自建HBase1.x迁移到云HBase1.x集群规模：集群20台RegionServer数据规模：数据总量30+T，迁移20+表，日增几百G要求：不停服迁移，尽可能避免读在线业务的影响

环境准备

步骤1：计算BDS服务的规模

BDS单节点(4cores 8G)的迁移最大速度 50MB/s ~ 100MB/s，增量同步任务单机能最多处理5台RS的日志, 单节点日志迁移速度最大50 ~ 60MB/s。源集群有20台节点，日增数据几百G，写入量也不是很大，BDS每个节点同时能够处理5个RS的日志，因此，BDS至少需要4个Worker节点。

步骤2：购买BDS集群

详见《BDS服务开通》，开通了BDS之后，需要配置BDS访问的白名单，然后配置页面登陆的账户密码，进行BDS操作页面的登陆。

步骤3：关联HBase集群

购买BDS集群之后，需要关联源集群和目标集群。对于目标云HBase集群来说，BDS控制台提供了自动关联集群的功能，不需要手动的录入集群的信息。

控制台点击关联集群会罗列出所有BDS所绑定的VPC下的云HBase集群，选择对应的目标集群进行绑定，绑定完成之后，可以在BDS HBase数据源页面看到绑定的集群信息。

对于自建HBase，需要绑定ip和hostname的映射关系并手动录入集群信息。自建HBase集群机器使用的主机名可能是BDS不识别的，因此在录入自建HBase集群信息之前，需要配置集群主机名和ip的映射关系到BDS。查看自建集群的/etc/hosts，将/etc/hosts信息copy到配置项中，在BDS上录入集群ip和hostname的映射关系。

回到HBase数据源页面，添加数据源。

录入自建集群的HDFS地址、HBase的版本、HBase根目录、HBase连接信息，点击添加会对网络连通性、HBase版本进行校验，源集群和目标集群都验证通过之后，就可以配置迁移任务。

配置迁移任务

当上面的所有前置条件都配置完成后，就可以开始迁移任务配置。下面详细介绍下具体的迁移步骤。

步骤1：创建实时数据同步通道

首先登陆BDS界面，点击任务管理选择HBase实时数据同步，选择创建HBase同步通道，进入通道创建的页面。

选择源集群和目标集群，按照表为粒度批量提交要迁移的表，创建同步通道。BDS在提交同步通道的时候自动检测目标表是否存在，不过不存在创建目标表，保证原表和目标表完全一致。这里推荐使用BDS自动建表保证目标集群和源集群的分区一致。同步通道创建完成之后，我们查看同步通道的进度。

总结一项可以查看整个通道的总延迟，BDS处理的最大最小耗时，读写总流量和速率表信息详情可以查看表put、delete操作总次数，表开始同步的时间点和最近更新的时间点。日志信息详情主要罗列了各个日志同步的进度，点位和速率。

步骤2：提交历史任务迁移

增量数据同步通道完成之后，接下来提交全量数据迁移任务，在任务管理里面我们选择HBase历史数据批量迁移，进入历史数据管理页面，点击创建任务，进入全量数据创建页面，选择对应的源集群和目标集群，输入需要迁移的表，点击创建。

全量数据迁移任务提交后，BDS会去验证目标表是否存在，不存在就自动创建目标表，任务开始之后我们可以查看各个表迁移的进度和速率。

步骤3：业务验证

当全量数据迁移完成，实时同步的延迟在业务可控范围之内（比如源集群和目标集群同步延迟1秒以内），业务可以进行数据的抽样校验，以及开始部分业务灰度。

步骤4：业务切流

验证通过之后，找个业务低峰期进行业务切流，切流过程中可能遇到问题，回切流量到源集群，为了防止流量切回源集群出现源集群少数据情况，需要业务在切流之前开启目标集群到源集群的实时同步通道，将切流后的实时写入数据同步回源集群。

步骤5：释放BDS资源

业务稳定在新集群上运行了一段时间之后，没有发现问题，便可以中断BDS实时同步的通道，释放掉BDS资源。

欢迎点赞+收藏+转发朋友圈素质三连

文章不错？点个【在看】吧！ ?

你可能感兴趣的:(HBase实践 | HBase TB级数据规模不停机迁移最佳实践)

ARM汇编语言 qq_37770896 arm开发
汇编语言结构条件码(31-28)指令码(27-20)目的寄存器(19-16)操作数1寄存器(15-12)操作数2(11-0)操作码（Opcode）：指示要执行的具体操作。不同的操作码代表不同的指令功能，例如数据传输、算术运算、逻辑运算等。目标寄存器（DestinationRegister）：指定指令执行的结果将存储在哪个寄存器中。源操作数（SourceOperand）：指定参与指令操作的源数据，可
MySQL 锁原理通过 6 个死锁案例，让你彻底理解 MySQL 锁机制，死锁的原因苹果醋3 面试题汇总与解析 nginx 运维 java spring boot mysql
Mysql锁类型和加锁分析MySQL有三种锁的级别：页级、表级、行级。1、表级锁：开销小，加锁快；不会出现死锁；锁定粒度大，发生锁冲突的概率最高,并发度最低。2、行级锁：开销大，加锁慢；会出现死锁；锁定粒度最小，发生锁冲突的概率最低,并发度也最高。3、页面锁：开销和加锁时间界于表锁和行锁之间；会出现死锁；锁定粒度界于表锁和行锁之间，并发度算法：1、nextKeyLocks锁，同时锁住记录(数据)，
Docker入门 m0_59227243 docker java 容器
目录第一章Docker安装与卸载docker安装docker卸载第二章Docker常用命令第三章es、nginx、tomcat部署（1）nginx部署（2）tomcat部署（3）es部署可视化commit镜像第四章DockerFileCMD与ENTRYPOINT的区别实验第五章容器数据卷MySQL数据持久化具名挂载与匿名挂载DockerFile挂载数据卷容器第六章镜像发布第七章Docker网络li
2025年美赛数学建模2025 MCM Problem A: Testing Time: The Constant Wear On Stairs A题测试时间：楼梯上的持续磨损代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 2025年数学建模美赛 2025数学建模美赛 A题 2025 楼梯上的持续磨损 matlab代码
目录Python1.数据预处理与特征工程数据标准化与特征构建2.行进方向偏好分析深度神经网络（DNN）用于方向性分析3.多人同时使用分析卷积神经网络（CNN）用于磨损模式识别4.时间序列分析LSTM模型用于时间序列预测matlab代码Python我们将采用更多的机器学习和深度学习技术，例如图像处理、深度神经网络（DNN）、卷积神经网络（CNN）等，并结合不同的算法进行更深入的分析。1.数据预处理与
2025年数学建模美赛时间序列预测模型详解思路解析和代码 2025年美赛（MCM/ICM） 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模 MCM 2025年美赛 2025年数学建模美赛 ICM
（全部都是公开资料，不代写论文，请勿盲目订阅）2025年数学建模美赛期间，会发布思路和代码，赛前半价，赛前会发布往年美赛的经典案例，赛题会结合最新款的chatgpto1pro分析，会根据赛题难度，选择合适的题目着重分析，没有代写论文服务，只会发布思路和代码，因为赛制要求，不会回复私信。内容可能达不到大家预期，请不要盲目订阅。已开通200美元/月的chatgptpro会员，会充分利用chatgpto
运维人故障定责甩锅话语指南-------收藏辣香牛肉面计算机基础运维
首先声明，本文章只在针对故障中那些不愿承担责任，而把锅甩给运维部门的人，如果讨论故障的都是君子，那么本文并不建议使用，切记。1、故障，故障，还是故障任何一个故障发生时，没有任何一个人是无辜的，开发的责任在于代码的bug，测试的责任在于测试用例不健全，运维的责任在于监控不到位或者故障处理不给力，一般在故障定责中，声音越大的一方，往往责任越大，所以在故障定责时，要学会察言观色，选择主攻点，不要广撒网，
F. Ira and Flamenco L_M_TY 算法滑动窗口乘法原理乘法逆元
题目链接：Problem-F-Codeforces题目大意：给n,mn个数让从中选m个数满足一下条件：1.m个数互不相同2.里面的任意两个数相减的绝对值不能超过m求这n个数有多少组数据满足。第一行包含一个整数t(1≤t≤1e4)-测试用例数。每个测试用例的第一行包含整数n和m(1≤m≤n≤2⋅1e5)每个测试用例的第二行包含n个整数a1,a2,…,an(1≤ai≤1e9)。保证所有测试用例的n之和
揭秘MySQL中基于负载的自适应缓存资源调度策略——让数据库响应更敏捷墨夶数据库学习资料2 数据库 mysql 缓存
在当今数据密集型应用日益普及的时代，数据库性能成为了影响用户体验和服务质量的关键因素之一。对于像MySQL这样的关系型数据库管理系统（RDBMS），如何有效地管理和分配缓存资源，以确保系统能够在高负载情况下依然保持高效运行，成为了开发者和运维人员共同关注的话题。今天，我们将深入探讨一种创新的方法——基于负载的自适应缓存资源调度策略，并展示其具体实现过程。为什么选择自适应缓存？‍传统的缓存管理方式通
7个改变python金融分析神奇库 python茶水实验室 python 金融开发语言数据结构 beautifulsoup scikit-learn scrapy
理解几个常用的Python金融分析库对于金融数据处理和分析非常重要。以下是几个常用的Python金融分析库的介绍和理解方法：1.Pandas用途：用于数据操作和分析。功能：提供数据结构和数据分析工具，尤其适用于时间序列数据。如何学习：基础知识：熟悉DataFrame和Series，学习如何导入和导出数据。数据操作：掌握数据清洗、数据变换、数据聚合等操作。时间序列分析：了解如何处理和分析时间序列数据
elasticsearch的常见面试题？ Dusk_橙子 K8S elasticsearch 运维 linux
在面试过程中除去各个公司的不同服务架构之外，也会存在一些普遍大众的面试点，以下将会从三个维度进行介绍。基础知识类elasticsearch和数据库之间区别？elasticsearch：面向文档，数据以文档的形式存储，即JSON格式的对象。更强调数据的搜索、索引和分析。数据库：更侧重于事务处理、数据的严格结构化和完整性，适用于关系复杂、数据一致性要求高的业务场景。elasticsearch和核心组件
如何写美赛（MCM/ICM）论文中的Summary部分摆烂大大王 2025美赛思路+代码参考数学建模算法
美赛（MCM/ICM）作为一个数学建模竞赛，要求参赛者在有限的时间内解决一个复杂的实际问题，并通过数学建模、数据分析和计算机模拟等手段给出有效的解决方案。在美赛的论文中，Summary部分（通常也称为摘要）是非常关键的，它是整个论文的缩影，能让评审快速了解你解决问题的思路、方法和结果。写好Summary是成功的第一步，甚至有可能论文主体写的一般，但仅靠Summary一举拿下！毕竟评委哪能那么认真每
动态调试线程池：使用JMX进行监控与管理星辰@Sea 系统架构 Java 其他 java jvm 开发语言
目录摘要1.引言2.什么是JMX3.线程池简介4.使用JMX动态调试线程池4.1JMX架构4.2JMXAPI4.3实现一个简单的JMXMBean4.4将JMX应用于线程池监控4.4.1创建自定义MBean4.4.2注册MBean到MBeanServer4.4.3使用JConsole或VisualVM连接5.代码实践5.1编写线程池管理类5.2定义MBean接口和实现5.3连接JMX客户端6.结论7
高并发场景中乐观锁与悲观锁的选择星辰@Sea 系统架构缓存 Java java 分布式系统架构
目录引言什么是锁？乐观锁悲观锁高并发场景下的考量案例分析选择乐观锁还是悲观锁？扩展知识：SoftwareTransactionalMemory(STM)结论引言在分布式系统和高并发环境中，如何有效地处理数据竞争成为了开发者们面临的挑战之一。锁机制作为一种解决方案，在确保数据一致性和完整性方面扮演着重要角色。然而，并不是所有的锁都适用于所有的情况。本文将探讨两种常见的锁——乐观锁（Optimisti
【MySQL】sql给表起别名 CAFE～BABE Mysql SQL 表别名 as 数据库操作查询优化
有时候，在对数据库中的表进行操作的时候，发现表名比较冗长，这时候我们就需要对表创建一个别名，别名的关键字为as(也可以不加)。现在有一个student表，结构如下:现在我认为student太长了我不想一直打。sql语句如下selecta.Sno,a.Sname,a.Sagefromstudentasa(as可以去掉)结果如下:我们就对student取了一个别名叫做a当然一个表的时候我们就没有必要这
redis的内部编码和数据结构类型 Chsavvy redis redis 数据结构 nosql
1.redis原理reids使用了单线程架构和I/O多路复用模型来实现性能的内存数据库服务2.简化的工作流程发送命令，执行命令，返回结果3.单线程处理但处理快速的原因纯内存访问非阻塞I/O，redis使用epoll作为I/O多路复用技术单线程避免了线程切换和竞态产生的消耗redis内部编码1）string内部编辑raw:大于的39个字节的字符串int:8个字节的长整型embstr:小于等于39个字
林子雨《大数据技术原理与应用》第五讲——NoSQL数据库天才代号23 大数据数据库 hadoop nosql 大数据
林子雨《大数据技术原理与应用》第五讲——NoSQL数据库林子雨《大数据技术原理与应用》第五讲笔记NoSQL数据库特点灵活的可扩展性灵活的数据模型和云计算结合查询性能差未形成通用的行业标准维护更加复杂NoSQL数据库有四大类型键值数据库：redis列族数据库：HBase、Cassandra文档数据库：MongoDB图数据库：Neo4j键值数据库数据模型：键是一个字符串对象，值可以是任意类型的对象典型
Apache Doris 3.0核心特性和生产实践解读王知无(import_bigdata) apache
上周Doris社区发布了Doris3.0版本，3.0版本被定位成湖仓一体演化路线上的重要里程碑版本。同时Doris官方社区已经更新了3.0版本的文档。3.0新特性很多，我们还是着重讲新特性中哪些是和真正开发息息相关的。哪些是需要你特别需要关注的。存算分离架构从3.0版本开始，Doris开始支持存算分离模式，用户可以在集群部署时选择采用存算一体模式或存算分离模式。存算分离对计算与存储进行解耦，计算节
基于Transformer的多通道肌电信号序列分类咖啡百怪 transformer 深度学习人工智能
表面肌电信号(sEMG)为十分重要的人体感官信号，不同的动作和状态对应不同的肌电信号，利用肌电信号的表征能力，我们可以实现对NAO机器人的控制。本项目基于Transformer实现对表面肌电信号的分类，数据使用excel进行保存，使用Pytorch架构建立模型并训练，利用基于Paramiko库的SSH连接来实现对NAO机器人的远程控制。在这里贴上该项目的github仓库连接，大家用得到的可以点个星
Rollup 实践：从入门到精通小亮同学丶构建工具和模块打包 javascript 前端 webpack
Rollup是一个高效的JavaScript模块打包器，特别适用于库和应用程序的打包。本文将深入探讨Rollup的实践方法，包括配置示例、性能优化策略以及不同场景下的最佳实践。基本配置首先，我们来看一个简单的Rollup配置示例：importresolvefrom'@rollup/plugin-node-resolve';importcommonjsfrom'@rollup/plugin-comm
「架构师」001计算机组成与体系结构吴维炜 AIGC架构设计师计算机组成计算机体系结构架构师架构师计算机组成与体系
文章目录前言一、计算机结构1.1计算机组成结构1.2CPU组成1.3冯诺依曼结构与哈佛结构二、存储结构2.1层次化存储结构2.2Cache2.3主存编址计算（计算）2.4磁盘基本结构与存取过程（计算）2.5磁盘优化分布存储（计算）2.6磁盘移臂调度算法（计算）2.7单缓冲区和双缓冲区读取三、数据传输控制方式四、总线五、CISC与RISC六、流水线七、校验码八、嵌入式前言本文主要介绍计算机组成与体系
python和C++联合编程 pumpkin84514 python相关 python c++开发语言
将Python和C++结合起来编程可以充分利用Python的易用性和C++的高性能。为什么要结合Python和C++编程？Python具有简洁的语法和强大的库支持，非常适合快速开发和数据处理。然而，Python在某些计算密集型任务上的性能不如C++。通过将这两种语言结合，可以既享受Python的便利，又获得C++的高性能。主要方法和工具使用ctypes：允许Python调用C函数库。使用cffi：
【某大厂一面】JDK1.8中对HashMap数据结构进行了哪些优化冰糖心158 2025 Java面试系列数据结构 java
在JDK1.8中，HashMap数据结构进行了重要的优化。相较于之前版本，JDK1.8引入了许多改进，提升了性能，尤其是在高负载的情况下。以下是JDK1.8中HashMap数据结构的关键优化。1.链表转化为红黑树在JDK1.8之前，HashMap使用链表来解决哈希冲突，即多个元素哈希值相同时，它们会被存储在同一个桶中，并通过链表（LinkedList）来连接。这个设计虽然简单，但当哈希冲突非常严重
【思维导图】并发编程 rainbow-- java 并发编程
并发和并行的区别并发是指多个任务交替执行。并行是指多个任务同时被执行。线程与进程的区别1、进程包含线程。2、线程之间可以共享数据，比如说java线程之间共享堆内存和方法区里的数据。而进程之间是独立的，默认情况下是不共享数据的。3、线程上下文切换开销小，而进程上下文切换开销大。（当线程状态改变时，就会出现线程上下文切换。线程上下文切换涉及到用户态与内核态的转变，因此开销较大。）java线程与操作系统
Mybatis（Day 18） m0_73629914 数据库
数据持久化是将内存中的数据模型转换为存储模型，以及将存储模型转换为内存中数据模型的统称。MyBatis支持定制化SQL、存储过程以及高级映射，可以在实体类和SQL语句之间建立映射关系，是一种半自动化的ORM实现。ORM（ObjectRelationalMapping，对象关系映射）是一种数据持久化技术，它在对象模型和关系型数据库之间建立起对应关系，并且提供了一种机制，通过JavaBean对象去操作
PyTorch 快速入门無量空所深度学习机器学习 pytorch 开源
我们将通过一个简单的示例，快速了解如何使用PyTorch进行机器学习任务。PyTorch是一个开源的机器学习库，它提供了丰富的工具和库，帮助我们轻松地构建、训练和测试神经网络模型。以下是本教程的主要内容：一、数据处理PyTorch提供了两个基本的数据处理工具：torch.utils.data.DataLoader和torch.utils.data.Dataset。Dataset用于存储样本及其对应
WPF学习记录之MVVM（一）数据绑定一个新的不能再新的开发者 wpf microsoft
这个是我自己的学习记录，大佬们不喜勿喷，刚接触这个圈子一个月，为了给跟我一样的新手分享一下都能怎么实现数据绑定，互相参考，所以选择公开记录。数据绑定弄清楚之后非常的简单，我这个练习绑定的数据选择在DataGrid里面绑定，一开始感觉DataGrid很麻烦，之后感觉幸亏选择了DataGrid。一、首先需要实现DataContext的绑定，要在MainWindow.xaml.cs的窗口构造器里面，将D
Python和C++混合编程源代码分析硬件测试 C++11基础和特性 python c++开发语言
Python与Cython和C++混合编程指南在现代软件开发中，结合使用多种编程语言可以充分利用各自的优势。Python以其简洁易用和广泛的生态系统而著名，而Cython和C++则在性能优化和系统级编程方面表现出色。本文将详细介绍如何实现Python与Cython、Python与C++的混合编程，解释像NumPy这样的库是如何利用C/C++实现高性能的，并提供最佳实践与示例。目录概述Python与
OLAP引擎比较小手追梦 hadoop rpc java
一，sparksql与dorisspark虽然是一个计算引擎，但sparksql也支持符合通用语法的sql查询，延迟为分钟级。doris是一个OLAP数据库，支持对大数据的复杂查询，延迟为秒级。doris比sparksql快，主要原因在于针对场景不同导致的架构不同。sparksql启动一个查询，需要进行资源调度、任务调度、任务分发，耗时更久。doris是常驻进程，启动一个doris查询后，快速的对
Java基础知识总结（二十二）--List接口 a18007931080 java list 开发语言
List本身是Collection接口的子接口，具备了Collection的所有方法。现在学习List体系特有的共性方法，查阅方法发现List的特有方法都有索引，这是该集合最大的特点。List：有序(元素存入集合的顺序和取出的顺序一致)，元素都有索引。元素可以重复。|--ArrayList：底层的数据结构是数组,线程不同步，ArrayList替代了Vector，查询元素的速度非常快。|--Link
C++，STL 简介：历史、组成、优势智驾 C/C++c++开发语言 STL
文章目录引言一、STL的历史STL的核心组成三、STL的核心优势四、结语进一步学习资源：引言C++是一门强大且灵活的编程语言，但其真正的魅力之一在于其标准库——尤其是标准模板库（StandardTemplateLibrary,STL）。STL提供了一系列高效的数据结构和算法，极大地简化了开发者的工作。无论是处理复杂的数据操作，还是优化代码性能，STL都已成为C++开发中不可或缺的工具。本文将带您了
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他