菜鸟乱撞

HBase BulkLoad批量写入数据

转载自：https://www.cnblogs.com/smartloli/p/9501887.html

1.概述

在进行数据传输中，批量加载数据到HBase集群有多种方式，比如通过HBase API进行批量写入数据、使用Sqoop工具批量导数到HBase集群、使用MapReduce批量导入等。这些方式，在导入数据的过程中，如果数据量过大，可能耗时会比较严重或者占用HBase集群资源较多（如磁盘IO、HBase Handler数等）。今天这篇博客笔者将为大家分享使用HBase BulkLoad的方式来进行海量数据批量写入到HBase集群。

2.内容

在使用BulkLoad之前，我们先来了解一下HBase的存储机制。HBase存储数据其底层使用的是HDFS来作为存储介质，HBase的每一张表对应的HDFS目录上的一个文件夹，文件夹名以HBase表进行命名（如果没有使用命名空间，则默认在default目录下），在表文件夹下存放在若干个Region命名的文件夹，Region文件夹中的每个列簇也是用文件夹进行存储的，每个列簇中存储就是实际的数据，以HFile的形式存在。路径格式如下：

/hbase/data/default////

2.1 实现原理

按照HBase存储数据按照HFile格式存储在HDFS的原理，使用MapReduce直接生成HFile格式的数据文件，然后在通过RegionServer将HFile数据文件移动到相应的Region上去。流程如下图所示：

2.2. 生成HFile文件

HFile文件的生成，可以使用MapReduce来进行实现，将数据源准备好，上传到HDFS进行存储，然后在程序中读取HDFS上的数据源，进行自定义封装，组装RowKey，然后将封装后的数据在回写到HDFS上，以HFile的形式存储到HDFS指定的目录中。实现代码如下：

/**

* Read DataSource from hdfs & Gemerator hfile.

*

* @author smartloli.

*

* Created by Aug 19, 2018

*/

public class GemeratorHFile2 {

static class HFileImportMapper2 extends Mapper {

protected final String CF_KQ = "cf";

@Override

protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {

String line = value.toString();

System.out.println("line : " + line);

String[] datas = line.split(" ");

String row = new Date().getTime() + "_" + datas[1];

ImmutableBytesWritable rowkey = new ImmutableBytesWritable(Bytes.toBytes(row));

KeyValue kv = new KeyValue(Bytes.toBytes(row), this.CF_KQ.getBytes(), datas[1].getBytes(), datas[2].getBytes());

context.write(rowkey, kv);

}

}

public static void main(String[] args) {

if (args.length != 1) {

System.out.println("Please input hbase-site.xml path.");

return;

}

Configuration conf = new Configuration();

conf.addResource(new Path(args[0]));

conf.set("hbase.fs.tmp.dir", "partitions_" + UUID.randomUUID());

String tableName = "person";

String input = "hdfs://nna:9000/tmp/person.txt";

String output = "hdfs://nna:9000/tmp/pres";

System.out.println("table : " + tableName);

HTable table;

try {

try {

FileSystem fs = FileSystem.get(URI.create(output), conf);

fs.delete(new Path(output), true);

fs.close();

} catch (IOException e1) {

e1.printStackTrace();

}

Connection conn = ConnectionFactory.createConnection(conf);

table = (HTable) conn.getTable(TableName.valueOf(tableName));

Job job = Job.getInstance(conf);

job.setJobName("Generate HFile");

job.setJarByClass(GemeratorHFile2.class);

job.setInputFormatClass(TextInputFormat.class);

job.setMapperClass(HFileImportMapper2.class);

FileInputFormat.setInputPaths(job, input);

FileOutputFormat.setOutputPath(job, new Path(output));

HFileOutputFormat2.configureIncrementalLoad(job, table);

try {

job.waitForCompletion(true);

} catch (InterruptedException e) {

e.printStackTrace();

} catch (ClassNotFoundException e) {

e.printStackTrace();

}

} catch (Exception e) {

e.printStackTrace();

}

}

}

在HDFS目录/tmp/person.txt中，准备数据源如下：

1 smartloli 100

2 smartloli 101

3 smartloli 102

然后，将上述代码编译打包成jar，上传到Hadoop集群进行执行，执行命令如下：

hadoop jar GemeratorHFile2.jar /data/soft/new/apps/hbaseapp/hbase-site.xml

如果在执行命令的过程中，出现找不到类的异常信息，可能是本地没有加载HBase依赖JAR包，在当前用户中配置如下环境变量信息：

export HADOOP_CLASSPATH=$HBASE_HOME/lib/*:classpath

然后，执行source命令使配置的内容立即生生效。

2.3. 执行预览

在成功提交任务后，Linux控制台会打印执行任务进度，也可以到YARN的资源监控界面查看执行进度，结果如下所示：

等待任务的执行，执行完成后，在对应HDFS路径上会生成相应的HFile数据文件，如下图所示：

2.4 使用BulkLoad导入到HBase

然后，在使用BulkLoad的方式将生成的HFile文件导入到HBase集群中，这里有2种方式。一种是写代码实现导入，另一种是使用HBase命令进行导入。

2.4.1 代码实现导入

通过LoadIncrementalHFiles类来实现导入，具体代码如下：

/**

* Use BulkLoad inport hfile from hdfs to hbase.

*

* @author smartloli.

*

* Created by Aug 19, 2018

*/

public class BulkLoad2HBase {

public static void main(String[] args) throws Exception {

if (args.length != 1) {

System.out.println("Please input hbase-site.xml path.");

return;

}

String output = "hdfs://cluster1/tmp/pres"; //也就是hfile所在的目录，与上文中的output一致

Configuration conf = new Configuration();

conf.addResource(new Path(args[0]));

HTable table = new HTable(conf, "person");

LoadIncrementalHFiles loader = new LoadIncrementalHFiles(conf);

loader.doBulkLoad(new Path(output), table);

}

}

执行上述代码，运行结果如下：

2.4.2 使用HBase命令进行导入

先将生成好的HFile文件迁移到目标集群（即HBase集群所在的HDFS上），然后在使用HBase命令进行导入，执行命令如下：

# 先使用distcp迁移hfile

hadoop distcp -Dmapreduce.job.queuename=queue_1024_01 -update -skipcrccheck -m10/tmp/pres hdfs://nns:9000/tmp/pres# 使用bulkload方式导入数据

hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles /tmp/pres person

最后，我们可以到指定的RegionServer节点上查看导入的日志信息，如下所示为导入成功的日志信息：

2018-08-1916:30:34,969INFO [B.defaultRpcServer.handler=7,queue=1,port=16020] regionserver.HStore: Successfully loaded storefilehdfs://cluster1/tmp/pres/cf/7b455535f660444695589edf509935e9 into store cf (new location: hdfs://cluster1/hbase/data/default/person/2d7483d4abd6d20acdf16533a3fdf18f/cf/d72c8846327d42e2a00780ac2facf95b_SeqId_4_)

2.5 验证

使用BulkLoad方式导入数据后，可以进入到HBase集群，使用HBase Shell来查看数据是否导入成功，预览结果如下：

3.总结

本篇博客为了演示实战效果，将生成HFile文件和使用BulkLoad方式导入HFile到HBase集群的步骤进行了分解，实际情况中，可以将这两个步骤合并为一个，实现自动化生成与HFile自动导入。如果在执行的过程中出现RpcRetryingCaller的异常，可以到对应RegionServer节点查看日志信息，这里面记录了出现这种异常的详细原因。

注意：需在maper-site.xml中配置你的 job history server,

mapreduce.jobhistory.address

node:10020

启动 job history server

mr-jobhistory-daemon.sh start historyserver

Hadoop自带了一个历史服务器，可以通过历史服务器查看已经运行完的Mapreduce作业记录，比如用了多少个Map、用了多少个Reduce、作业提交时间、作业启动时间、作业完成时间等信息。默认情况下，Hadoop历史服务器是没有启动的。在bulkload获取hfile的时候需用到。

你可能感兴趣的:(HBase BulkLoad批量写入数据)

自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
RAG 助力教育个性化：重塑学习体验的科技引擎 hy098543 学习科技
一、引言1.1研究背景与动机随着自然语言处理（NLP）技术的飞速发展，大语言模型（LLM）在众多任务中展现出了强大的能力，如文本生成、问答系统和机器翻译等。然而，传统的大语言模型在知识存储和更新方面存在一定的局限性。一方面，模型的知识主要依赖于预训练阶段所接触的数据，这导致其知识更新滞后，难以应对快速变化的现实世界信息。例如，对于一些新出现的事件、技术或研究成果，模型可能无法及时给出准确的信息。另
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
IDC权威认可：瑞数信息双项入选《中国大模型安全保护市场概览》科技云报道安全
近日，国际数据公司IDC正式发布了《中国大模型安全保护市场概览，2025：全方位安全检测与防护构建可信AI》报告。本次报告中IDC结合全球统一定义以及中国市场特色，将中国大模型安全保护市场划分为7个细分领域，并通过对中国大模型安全保护市场的广泛和深入的调研，对各细分领域的代表厂商进行了全面梳理。瑞数信息凭借在AI领域的深厚技术积累与前瞻布局，入选中国大模型安全保护市场“保护大模型接口”与“保护大模
Http请求中的特殊字符
问题一个springboot应用，包含如下controller@RestControllerpublicclassDemoController{@GetMapping("/get")publicResponseEntityget(@RequestParam(value="cid2")Stringcid2)准备测试数据Stringcid2="1;MFkwEwYHKoZIzj0CAQYIKoZIzj0
磁盘I/O性能测试详解：监控与优化的全景指南测试不打烊性能测试服务器 linux 压力测试
磁盘I/O（Input/Output）性能是衡量系统存储设备读取和写入数据效率的关键指标之一。磁盘I/O性能问题会影响整体系统响应时间、吞吐量等关键性能指标。在性能测试中，监控磁盘I/O至关重要，以下将从监控方式、命令使用方法、输出示例、参数分析以及如何通过监控结果发现性能异常来做详细说明。磁盘I/O监控：为什么它如此重要？磁盘I/O监控是确保系统性能的关键。通过监控，我们可以实时了解磁盘的读写速
函数调用栈回溯机制详解硬核科技嵌入式单片机开发实战嵌入式嵌入式硬件软件单片机
函数调用回溯Backtrace是现代软件系统调试中的关键技术之一，尤其在嵌入式开发和Linux平台调试中更显重要。它提供了程序在运行或崩溃时的函数调用路径，有助于快速定位错误源。一、函数调用栈与Backtrace的理论基础1.1什么是函数调用栈？函数调用栈（CallStack）是一种由编译器和运行时系统共同维护的后进先出（LIFO）数据结构。每次函数调用时，当前函数的返回地址、局部变量、保存的寄存
【转载】数据库id的方案 f7629e2bca1c
分布式系统唯一ID生成方案汇总系统唯一ID是我们在设计一个系统的时候常常会遇见的问题，也常常为这个问题而纠结。生成ID的方法有很多，适应不同的场景、需求以及性能要求。所以有些比较复杂的系统会有多个ID生成的策略。下面就介绍一些常见的ID生成策略。1.数据库自增长序列或字段最常见的方式。利用数据库，全数据库唯一。优点：1）简单，代码方便，性能可以接受。2）数字ID天然排序，对分页或者需要排序的结果很
Node-RED低代码流式编程工具使用简介 handsomestWei 后端低代码 Node-RED 物联网IOT
Node-RED低代码流式编程工具使用简介全文链接:低代码流式编程工具node-red使用简介工具概述Node-RED是一个基于流的编程工具，专门用于连接物联网设备、API和在线服务。它提供了基于浏览器的可视化编辑器，用户可以通过拖拽节点的方式创建复杂的逻辑流程，无需编写大量代码。核心特点可视化编程通过拖拽节点和连线构建应用程序无需深入了解底层函数逻辑实时调试和数据流监控大幅降低开发门槛丰富的生态
华为服务器磁盘IO性能查看,磁盘io性能忘記痛苦华为服务器磁盘IO性能查看
磁盘io性能内容精选换一换对于不同业务场景，通过在调整数据库的参数配置，可以有效提升服务器性能。使用如下配置文件参数启动数据库，默认配置文件路径为/etc/my.cnf，其中MariaDB软件安装以及数据存放路径根据实际情况修改。根据是否支持挂载至多台云服务器可以将磁盘分为非共享磁盘和共享磁盘。一个非共享磁盘只能挂载至一台云服务器，而一个共享磁盘可以同时挂载至多台云服务器。共享磁盘是一种支持多个云
【面试】面试官：请介绍一下你如何高效处理海量数据与JVM内存故障排查方法？
文章目录高效处理海量数据与JVM内存分析实战指南问题一：无内存限制下如何快速安全插入1000亿条数据到HashMap？1.数据结构优化2.内存与IO协同优化3.业务级安全策略问题二：JVM内存分析与OOM故障排查1.实时内存占用分析2.OOM事后分析流程步骤1：获取诊断三件套步骤2：定位泄漏根源步骤3：业务防御机制架构启示录高效处理海量数据与JVM内存分析实战指南问题一：无内存限制下如何快速安全插
VI Server 操控 LabVIEW 工程
用VIServer自动创建并填充LabVIEW工程，借助Project.New创建工程，OpenWindow展示工程浏览器，经MyComputer获取工程项引用，通过AddFile等添加主VI、文件夹及内容，以RecursiveFileList递归取文件，最后用CloseReference规范释放资源，实现LabVIEW工程从无到有的程序化构建，适用于批量、标准化工程创建场景，相比手动操作更高效、
反转，猝不及防浅饮清茶
福兮祸所伏，祸兮福所倚，说得正是福祸之间互为因果，相互转化的一种真实存在。日常生活中的很多事情，虽然达不到福、祸的地步，但是好坏的转换，也往往不随人的意志改变，总是在不经意间，就改变了很多，让人不知该喜还是该悲。自从接手疫情防控工作以来，不夸张地说，基本上没有休息过一个完整的周末或节假日。因为厂里每天早晨都要开晨会，关于疫情防控相关数据的汇总，是晨会必须要汇报的。于是，每天下午做好第二天晨会的多媒
云服务器性能优化全攻略：CPU、内存、磁盘IO调优实战 Gloria歌洛莉亚 c语言数据库服务器 python 性能优化
在云计算时代，服务器性能直接影响应用响应速度、用户体验和运营成本。无论是高并发网站、实时数据分析还是机器学习训练，优化云服务器性能都是开发者必须掌握的核心技能。本攻略将从CPU调度、内存管理、磁盘IO三个维度，结合Linux系统特性和实际场景，提供可落地的优化方案。一、CPU性能调优：从调度策略到并行计算1.1CPU资源监控与瓶颈定位实时监控工具：top-c#动态查看进程CPU占用（按P键按CPU
【爬虫】05 - 爬虫攻防是小崔啊 #爬虫学习爬虫
爬虫05-爬虫攻防文章目录爬虫05-爬虫攻防一：随机User-Agent爬虫1：fake-useragent2：高级反反爬策略3：生产环境建议二：代理IP爬虫1：获取代理IP2：高阶攻防3：企业级的代理实战三：动态数据的抓取1：动态页面技术全景2：动态页面逆向工程2.1：XHR请求追踪与解析2.2：websocket实时数据捕获3：无头浏览器控制技术3.1：Playwright详解3.2：反反爬虫
浏览器解码过程分析
浏览器解码过程分析前言在学习xss漏洞的过程中我发现一个问题，当我想绕过过滤机制时，可以采用编码的方式进行绕过这种方法，但是并不是每一种编码格式都能绕过，需要不停的尝试才行，这样过于浪费时间。后来我发现浏览器与服务器数据传输过程中有好几种编码格式，不同的编码格式有着不同的解析引擎，作为一个浏览器，在解析一篇HTML文档时主要有三个处理过程：HTML解析，URL解析和JavaScript解析。每个解
喜爱购有什么新消息？如何打造百城万店氧惠好物
自2020年10月起，西安喜爱购商贸商贸股份有限公司全力打造的“百城万店”新零售商业模式应运而生。在探索新零售的道路上,通过互联网、大数据、云计算、人工智能等新技术,重构“人、货、场”商业元素,秉持“舍利差赚服务”经营理念,在全国至少一百个城市的“一千户以上的中高端社区”,打造至少两万家“一区一店”社区生活超市。大家好！我是氧惠最大团队&联合创始人氧惠达人导师。氧惠佣金更高，模式更好，终端用户不流
微服务架构监控：四大黄金指标解析 AI云原生与云计算技术学院架构微服务云原生 ai
微服务架构监控：四大黄金指标解析关键词：微服务架构、监控体系、四大黄金指标、SRE、延迟、流量、错误、饱和度摘要：本文深入解析微服务架构监控的核心方法论——四大黄金指标（延迟、流量、错误、饱和度），基于GoogleSRE最佳实践，结合具体技术实现与数学模型，阐述指标设计原理、数据采集方法、可视化实践及异常诊断逻辑。通过完整的项目实战案例，演示如何构建端到端监控体系，帮助技术团队建立可观测性基线，提
Xss漏洞总结
一、XSS漏洞简介XSS（Cross-SiteScripting，跨站脚本攻击）是一种常见的Web前端安全漏洞，其主要危害对象是网站的访问用户。攻击者通过在网页中注入恶意脚本代码（如JavaScript、Flash等），诱使用户访问后在其浏览器中执行这些代码，从而达到窃取数据、控制会话等攻击目的。二、XSS漏洞原理XSS的根本原因在于服务器未对用户提交的输入内容进行严格过滤和转义处理，导致用户提供
SAP Word 模板与 XML 数据流合并过程深度剖析——以表格结构为例汪子熙 ABAP 百科全书 word xml CRM ABAP NetWeaver SAP
在CRMWebClientUI的Office集成功能里，Word模板与XML数据流的动态合并，是合同、报价单等文档自动生成的技术核心。本文结合SAP官方示例代码与OpenXML规范，从模板绑定、数据预处理、运行时递归填充到实际排错技巧，全景展示表格结构合并的幕后细节，并给出一段源自真实项目的实战案例，帮助读者迅速掌握这一看似神秘的“魔术”。(document567.rssing.com,docum
AI 驱动自动化运维平台架构与实现大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 算法机器学习人工智能决策树大数据
摘要：随着云计算、容器化和大规模分布式系统的普及，传统人工运维方法已难以满足现代IT环境中海量指标、日志和拓扑关系的实时分析与故障响应需求。AI驱动的自动化运维（AIOps）平台通过融合机器学习、深度学习、图分析以及强化学习等多学科技术，实现对海量运维数据的智能感知、预测、诊断和自动化修复。本文深入探讨AI驱动自动化运维平台的整体架构设计与核心技术实现，涵盖数据采集与预处理、AI引擎设计、自动化执
@DateTimeFormat、@JsonFormat、@JSONField区别及用法开往1982 java 前端时间 datetime
推荐写法：@JSONField(format="yyyy-MM-ddHH:mm:ss")@JsonFormat(timezone="GMT+8",pattern="yyyy-MM-ddHH:mm:ss")@DateTimeFormat(pattern="yyyy-MM-ddHH:mm:ss")privateLocalDatebirthday;前端读取数据库日期字段时使用@JsonFormat和@J
Python lambda表达式：匿名函数的适用场景与限制梦幻南瓜 python python 服务器 linux
目录1.Lambda表达式概述1.1Lambda表达式的基本语法1.2简单示例2.Lambda表达式的核心特点2.1匿名性2.2简洁性2.3即时性2.4函数式编程特性3.Lambda表达式的适用场景3.1作为高阶函数的参数3.2简单的数据转换3.3条件筛选3.4GUI编程中的回调函数3.5Pandas数据处理4.Lambda表达式的限制4.1只能包含单个表达式4.2没有语句4.3缺乏文档字符串4.
【python】 www_hhhhhhh python 面试职场和发展
1.技术面试题（1）TCP与UDP的区别是什么？答：TCP（传输控制协议）和UDP（用户数据报协议）是两种常见的传输层协议，主要区别在于连接方式和可靠性。TCP是面向连接的协议，传输数据前需建立连接，通过三次握手确保连接可靠，传输过程中有确认、重传和顺序控制机制，保证数据完整、按序到达，适用于网页浏览、文件传输等对可靠性要求高的场景。UDP是无连接的协议，无需建立连接即可发送数据，不保证数据可靠传
Python函数的返回值
1.返回值定义及案例：2.返回值与print的区别：print仅仅是打印在控制台，而return则是将return后面的部分作为返回值作为函数的输出，可以用变量接走，继续使用该返回值做其它事。3.保存函数的返回值如果一个函数return返回了一个数据，那么想要用这个数据，那么就需要保存.#定义函数defadd2num(a,b): returna+b#调用函数，顺便保存函数的返回值result=
flutter 专题八官方状态管理 Provider基本使用 leluckys Flutter面试与实战 flutter
一、简介当App的复杂性发展到一定程度，就会出现一个页面中不同深度的子Widget需要共享访问同一个数据状态，甚至不同页面需要共享同一个状态的情况，这时我们可能会想到InheritedWidget。InheritedWidget是Flutter中非常重要的一个功能型组件，它提供了一种在Widget树中从上到下共享数据的方式，比如我们在应用的根Widget中通过InheritedWidget共享了一
keil5识别不到正点原子的探索者stm32f407vgt6 QL.ql stm32 嵌入式硬件单片机
原因：供电不足可能的理解错误：接上typec（串口）就可以识别到，误以为stlink要和串口一起使用其实是电压不足导致的，接上电源线或者typec都可以，比较stlink只是传输数据的，不负责供电
基于单片机汽车尾气检测/有害气体检测/空气质量检测系统小新单片机单片机设计库单片机嵌入式硬件空气质量 51单片机 stm32
传送门其他作品题目速选一览表其他作品题目功能速览概述本设计实现了一种基于单片机的气体检测系统，专用于汽车尾气或环境有害气体浓度的实时监测。系统核心由微控制器（如STM32/51单片机）、多类型气体传感器阵列（如MQ系列/电化学传感器检测）、显示单元（OLED/LCD）及报警模块构成。传感器采集目标气体浓度并输出模拟/数字信号。单片机通过ADC或数字接口读取数据，经滤波、标定补偿（温湿度补偿）及算法
存档python爬虫、Web学习资料
1python爬虫学习学习Python爬虫是个不错的选择，它能够帮你高效地获取网络数据。下面为你提供系统化的学习路径和建议：1.打好基础首先要掌握Python基础知识，这是学习爬虫的前提。比如：变量、数据类型、条件语句、循环等基础语法。列表、字典等常用数据结构的操作。函数、模块和包的使用方法。文件读写操作。推荐通过阅读《Python编程：从入门到实践》这本书或者在Codecademy、LeetCo
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他