SPLITALGORITHM is a java class name of a class
implementing SplitAlgorithm, or one of the special
strings HexStringSplit or UniformSplit, which are
built-in split algorithms. HexStringSplit treats
keys as hexadecimal ASCII, and UniformSplit treats
keys as arbitrary bytes.
-c Create a new table with a pre-split number of
regions
-D Override HBase Configuration Settings
-f Column Families to create with new table.
Required with -c
--firstrow First Row in Table for Split Algorithm
-h Print this usage help
--lastrow Last Row in Table for Split Algorithm
-o Max outstanding splits that have unfinished
major compactions
-r Perform a rolling split of an existing region
--risky Skip verification steps to complete
quickly.STRONGLY DISCOURAGED for production
systems.
[root@y3 conf]#
例如:
hbase org.apache.hadoop.hbase.util.RegionSplitter -c 10 test -f info
负载均衡
默认master负载均衡是5分钟执行一次,通过hbase-site.xml中设置hbase.balancer.period
设置banlancer上限hbase.balancer.max.balancing
合并region:
[root@y3 conf]# hbase org.apache.hadoop.hbase.util.Merge
For hadoop 0.21+, Usage: bin/hbase org.apache.hadoop.hbase.util.Merge [-Dfs.defaultFS=hdfs://nn:port]
[root@y3 conf]#
查询并存储信息:
scan 'hbase:meta', {COLUMNS => 'info:regioninfo'}
执行合并region:
配置优化
1、减少zk超时
设置region和zk链接超时时间,默认是3分钟,可以设置小一点,master就能快速发现故障
zookeeper.session.timeout
2、增加处理线程
hbase.regionserver.handler.count: 响应外部用户访问数据表请求线程数。默认10个线程。
3、增加堆大小
hbase-env.sh中设置HBASE_HEAPSIZE值
4、启用压缩算法
5、增加region大小
hbase.hregion.max.filesize ,默认region大小256MB
6、设置缓存块大小
perf.hfile.block.cache.size 值为百分比,默认是20%,默认占用堆内存空间60%。
7、调整memstore限制
hbase.regionserver.global.memstore.lowerLimt 值为百分比,默认是35%,设置为0.35
hbase.regionserver.global.memstore.upperLimt 值为百分比,默认是40%,设置为0.4
将上下限设置接近,用于控制服务器清空memstore是,防止过度刷新
8、增加阻塞时存储文件数目
hbase.hstore.blockingStoreFiles,默认是7, 设置当存储文件达到指定值时,put/delete/modify阻塞,给合并文件留出时间减少文件数目。
hbase.hregion.memstore.block.multiplier,增加阻塞倍率,默认值2,用于阻塞客户端更新数据请求安全阀门。当memstore达到属性multiplier*flush的大小限制时会阻塞更新
9、减少最大日志文件限制
hbase.regionserver.maxlogs 控制磁盘wal文件数,控制写日志频率。默认值32
命令行vm设置:
$ HBASE_SHELL_OPTS="-verbose:gc -XX:+PrintGCApplicationStoppedTime -XX:+PrintGCDateStamps \
-XX:+PrintGCDetails -Xloggc:$HBASE_HOME/logs/gc-hbase.log" ./bin/hbase shell
Hbase集群管理
节点任务
减少节点:
./bin/hbase-deamon.sh stop regionserver
./bin/hbase-deamon.sh start master
./bin/hbase-deamon.sh start master --backup #备用master
禁用负载均衡:
shell命令行执行:
balance_switch false
启用负载均衡
balance_switch true
导入导出工具
导入导出:
例如:
hadoop jar $HBASE_HOME/hbase-0.91-SNAPSEHOT.jar import 表名称 输出数据存储路径
hadoop jar $HBASE_HOME/hbase-0.91-SNAPSEHOT.jar import test /user/test-backup
CopyTable工具:
例如:
hadoop jar $HBASE_HOME/hbase-0.91-SNAPSEHOT.jar copytable --new.name=新表名称 原表名称
hadoop jar $HBASE_HOME/hbase-0.91-SNAPSEHOT.jar copytable --new.name=test2 test
批量导入:
importtsv.bulk.output 设置使用hfileOutPutFormat生成文件
复制:
在hbase-site.xml中设置如下:
开启复制。
停止复制:
验证复制数据正确性:
Hbase服务端口
Hbase端口:
故障检测
故障处理:
[root@y3 hbase]#
[root@y3 hbase]# hbase hbck -h
18/08/09 04:48:49 INFO Configuration.deprecation: fs.default.name is deprecated. Instead, use fs.defaultFS
Usage: fsck [opts] {only tables}
where [opts] are:
-help Display help options (this)
-details Display full report of all regions.
-timelag Process only regions that have not experienced any metadata updates in the last seconds.
-sleepBeforeRerun Sleep this many seconds before checking if the fix worked if run with -fix
-summary Print only summary of the tables and status.
-metaonly Only check the state of the hbase:meta table.
-sidelineDir HDFS path to backup existing meta.
-boundaries Verify that regions boundaries are the same between META and store files.
-exclusive Abort if another hbck is exclusive or fixing.
-disableBalancer Disable the load balancer.
Metadata Repair options: (expert features, use with caution!)
-fix Try to fix region assignments. This is for backwards compatiblity
-fixAssignments Try to fix region assignments. Replaces the old -fix
-fixMeta Try to fix meta problems. This assumes HDFS region info is good.
-noHdfsChecking Don't load/check region info from HDFS. Assumes hbase:meta region info is good. Won't check/fix any HDFS issue, e.g. hole, orphan, or overlap
-fixHdfsHoles Try to fix region holes in hdfs.
-fixHdfsOrphans Try to fix region dirs with no .regioninfo file in hdfs
-fixTableOrphans Try to fix table dirs with no .tableinfo file in hdfs (online mode only)
-fixHdfsOverlaps Try to fix region overlaps in hdfs.
-fixVersionFile Try to fix missing hbase.version file in hdfs.
-maxMerge When fixing region overlaps, allow at most regions to merge. (n=5 by default)
-sidelineBigOverlaps When fixing region overlaps, allow to sideline big overlaps
-maxOverlapsToSideline When fixing region overlaps, allow at most regions to sideline per group. (n=2 by default)
-fixSplitParents Try to force offline split parents to be online.
-removeParents Try to offline and sideline lingering parents and keep daughter regions.
-ignorePreCheckPermission ignore filesystem permission pre-check
-fixReferenceFiles Try to offline lingering reference store files
-fixEmptyMetaCells Try to fix hbase:meta entries not referencing any region (empty REGIONINFO_QUALIFIER rows)
Datafile Repair options: (expert features, use with caution!)
-checkCorruptHFiles Check all Hfiles by opening them to make sure they are valid
-sidelineCorruptHFiles Quarantine corrupted HFiles. implies -checkCorruptHFiles
Metadata Repair shortcuts
-repair Shortcut for -fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps -fixReferenceFiles -fixTableLocks -fixOrphanedTableZnodes
-repairHoles Shortcut for -fixAssignments -fixMeta -fixHdfsHoles
Table lock options
-fixTableLocks Deletes table locks held for a long time (hbase.table.lock.expire.ms, 10min by default)
Table Znode options
-fixOrphanedTableZnodes Set table state in ZNode to disabled if table does not exists
Replication options
-fixReplication Deletes replication queues for removed peers
You have new mail in /var/spool/mail/root
[root@y3 hbase]#
日志级别
日志级别:
常见问题
查询文件句柄:
[root@y3 hbase]# ulimit -n
1024
[root@y3 hbase]#
检查ulimit设置
[root@y3 hbase]# cat /proc//limits
查看交换分区使用:
[root@y3 hbase]# vmstat 20
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 7657760 229368 11115556 0 0 0 44 4 4 3 1 96 0 0
^C
[root@y3 hbase]#
[root@y3 hbase]# free -m
total used free shared buffers cached
Mem: 32008 24532 7476 237 223 10857
-/+ buffers/cache: 13451 18557
Swap: 16071 0 16071
[root@y3 hbase]#
/proc/sys/vm/swappiness设置内核swappiness的值为5或者10,防止总内存小于可用内存时使用交换分区
你可能感兴趣的:(hbase,大数据-hadoop)
Hbase深入浅出
天才之上
数据存储 Hbase 大数据存储
目录HBase在大数据生态圈中的位置HBase与传统关系数据库的区别HBase相关的模块以及HBase表格的特性HBase的使用建议Phoenix的使用总结HBase在大数据生态圈中的位置提到大数据的存储,大多数人首先联想到的是Hadoop和Hadoop中的HDFS模块。大家熟知的Spark、以及Hadoop的MapReduce,可以理解为一种计算框架。而HDFS,我们可以认为是为计算框架服务的存
深入浅出了解HBase及RDD编程
山海王子
大数据 hbase
深入浅出了解HBaseHBase简介架构HBase是什么样的数据库?关键是数据模型关键要素:什么是单元格时间戳的功能是什么?HBase为什么能存储海量数据创建一个HBase表配置Spark编写程序读取HBase数据编写程序向HBase写入数据关于搭建HBase高可用集群的图文教程,可参考我的另一篇博文——安装并配置HBase集群(5个节点)。HBase简介HBase是GoogleBigTable的
HBase简介:高效分布式数据存储和处理
代码指四方
分布式 hbase 数据库 大数据
HBase简介:高效分布式数据存储和处理HBase是一个高效的、可扩展的分布式数据库,它是构建在ApacheHadoop之上的开源项目。HBase的设计目标是为大规模数据存储和处理提供高吞吐量和低延迟的解决方案。它可以在成百上千台服务器上运行,并能够处理海量的结构化和半结构化数据。HBase的核心特点包括:分布式存储:HBase使用Hadoop分布式文件系统(HDFS)作为底层存储,数据被分布在集
HBase简介
梦醒沉醉
Hadoop hbase 数据库 大数据
目录1.HBase概述2.HBase核心概念2.1行关键字2.2列关键字2.3时间戳2.4单元2.4.1HBase和RDBMS的差异2.4.2HBase组成3.HBase流程3.1Region的分配3.2RegionServer上线3.3RegionServer下线3.4Master上线3.5Master下线3.6写请求处理参考1.HBase概述 HBase是NoSQL(NotOnlySQL,泛
如何在Java中设计大规模稀疏数据处理架构
省赚客app开发者
java 架构 开发语言
如何在Java中设计大规模稀疏数据处理架构大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!在大数据时代,稀疏数据在各个领域变得越来越常见,例如推荐系统、自然语言处理、图像处理等。稀疏数据通常包含大量零值或空值,直接使用传统的数据处理架构可能导致效率低下,内存和计算资源浪费。因此,设计一个高效的稀疏数据处理架构成为Java开发者面临的关键挑战。本文将探讨如何在Java中
MongoDB面试题答案解析
HappyAcmen
java面试题集 mongodb 数据库
文章目录一、概念理解类1.什么是MongoDB?2.NoSQL数据库是什么意思?NoSQL与RDBMS有什么区别?为什么要使用和不使用NoSQL数据库?3.MySQL与MongoDB之间最基本的差别是什么?4.你怎么比较MongoDB、CouchDB及CouchBase?5.MongoDB成为最好的NoSQL数据库的原因是什么?6.journal回放在条目(entry)不完整时会遇到问题吗?7.分
程序员如何将技术咨询服务转化为SaaS产品
AI天才研究院
ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 & 大数据AI人工智能大模型 大厂Offer收割机 面试题 简历 程序员读书 硅基计算 碳基计算 认知计算 生物计算 深度学习 神经网络 大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
引言与概述在当今快速发展的数字化时代,软件即服务(SaaS)已经成为企业服务市场的重要趋势。随着云计算和大数据技术的普及,越来越多的企业开始将传统的技术咨询服务转化为SaaS产品,以提供更加灵活、可扩展的服务。这不仅为企业带来了新的增长点,也极大地改变了技术服务行业的发展格局。SaaS市场的增长趋势SaaS市场呈现出快速增长的态势,根据市场研究机构的预测,全球SaaS市场的规模将在未来几年内持续扩
[1138]基于JAVA的安全监管网络人员信息智慧管理系统的设计与实现
阿鑫学长【毕设工场】
java 网络 开发语言 课程设计 毕业设计
毕业设计(论文)开题报告表姓名学院专业班级题目基于JAVA的安全监管网络人员信息智慧管理系统的设计与实现指导老师(一)选题的背景和意义选题背景与意义:随着信息技术的飞速发展和大数据时代的到来,安全监管网络人员信息管理面临着前所未有的挑战与机遇。当前,执法人员、监督员以及各类从业人员的信息档案管理工作日益繁重,传统的人工管理模式效率低下、易出错且难以满足实时更新、精准查询的需求。特别是在复杂的执法环
在Hadoop集群中实现数据安全:技术与策略并行
Echo_Wish
实战高阶大数据 hadoop 大数据 分布式
在Hadoop集群中实现数据安全:技术与策略并行随着大数据技术的广泛应用,Hadoop已经成为处理和存储海量数据的首选平台。然而,随着数据规模的扩大,如何确保Hadoop集群中的数据安全也成为了亟待解决的难题。毕竟,数据安全不仅关系到企业的隐私保护,也直接影响到数据的可信度与可用性。本文将探讨如何在Hadoop集群中实现数据安全,分析数据加密、访问控制、审计日志等方面的技术与策略,并通过一些具体的
什么是GaussDB
如清风一般
gaussdb
什么是GaussDB简介GaussDB是华为自主创新研发的分布式关系型数据库。该产品具备企业级复杂事务混合负载能力,同时支持分布式事务,同城跨AZ部署,数据0丢失,支持1000+的扩展能力,PB级海量存储。同时拥有云上高可用,高可靠,高安全,弹性伸缩,一键部署,快速备份恢复,监控告警等关键能力,能为企业提供功能全面,稳定可靠,扩展性强,性能优越的企业级数据库服务。应用场景交易型应用大并发、大数据量
《传统教培机构的痛点:数字化转型如何破局?》
数字化浪潮下的困境在当今时代,数字化浪潮正以前所未有的速度席卷全球,深刻地改变着人们的生活、工作和学习方式。这是一个数据爆炸的时代,数据成为了驱动社会发展的核心要素之一。据统计,全球每天产生的数据量高达数万亿字节,这些数据涵盖了人们生活的方方面面,从购物习惯到社交行为,从健康状况到学习偏好,都被数字化记录下来。[]()数字化时代的技术创新日新月异,人工智能、大数据、云计算、物联网等新兴技术不断涌现
python编写mapreduce job教程
weixin_49526058
python mapreduce hadoop
在Python中实现MapReduce作业,通常可以使用mrjob库,这是一个用于编写和执行MapReduce作业的Python库。它可以运行在本地模式或Hadoop集群上。以下是一个简单的MapReduce示例,它计算文本文件中每个单词的出现次数。安装mrjob首先,你需要安装mrjob库。可以通过pip安装:pipinstallmrjobMapReduce示例:计算单词频率1.创建一个MapR
Aerospike
小的~~
nosql Aerospike
文章来源:拉勾教育Java高薪训练营第3期Aerospike介绍Aerospike(简称AS)是一个分布式,可扩展的键值存储的NoSQL数据库。T级别大数据高并发的结构化数据存储读写操作达微妙级,99%的响应可在1毫秒内实现采用混合架构,索引存储在内存中,而数据可存储在机械硬盘(HDD)或固态硬盘(SSD)上(也可存储在内存)AS内部在访问SSD屏蔽了文件系统层级,直接访问地址,保证了数据的读取速
6个大数据应用案例
雪兽软件
科技前沿 大数据
根据市场数据预测报告,到2026年,全球大数据市场可能达到2684亿美元。随着大数据市场的快速增长,组织正在利用大数据来获得洞察力,帮助他们做出更好的决策,改善运营,最终推动最佳增长。从医疗保健到金融,从零售到电信,大数据正被用于改变行业的运作方式,使企业能够创造新的收入来源,增强客户体验,提高运营效率。这个全面的博客将探索令人兴奋的大数据用例领域,探索商业组织如何利用数据获得洞察力,推动创新,并
Java 大视界 -- Java 大数据在智能体育中的应用与赛事分析(80)
青云交
大数据新视界 Java 大视界 java 大数据 智能体育 数据采集 运动员训练 赛事分析 赛事预测
亲爱的朋友们,热烈欢迎来到青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程!一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:大数据新视
Java 大视界 -- Java 大数据在智能供应链中的应用与优化(76)
青云交
大数据新视界 Java 大视界 大数据 智能供应链 数据采集整合 数据存储管理 需求预测 物流调度 风险管理
亲爱的朋友们,热烈欢迎来到青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程!一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:大数据新视
Knox原理与代码实例讲解
AI天才研究院
计算 DeepSeek R1 & 大数据AI人工智能大模型 计算科学 神经计算 深度学习 神经网络 大数据 人工智能 大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Knox原理与代码实例讲解1.背景介绍在现代分布式系统中,安全性和隔离性是非常重要的需求。ApacheKnox是一个反向代理服务器,旨在为ApacheHadoop集群提供单一入口点,增强安全性和集中化管理。它位于Hadoop集群与客户端应用程序之间,充当网关和负载均衡器的角色。Knox的主要目标是:提供集中式身份验证和授权,减轻客户端应用程序的负担。实现多租户支持,允许不同的组织或部门安全地共享同
基于 GBase 数据库的海量数据处理与性能优化
big crab
数据库 oracle
一、引言随着大数据时代的到来,海量数据的存储和高效处理成为各行业的核心需求。GBase系列数据库(包括GBase8a、GBase8s和GBase8c)以其强大的性能、灵活的存储架构以及高效的查询优化功能,成为处理大规模数据的理想选择。本文将从GBase数据库的特性出发,探讨如何在实际应用中进行海量数据的高效处理,同时提供相关代码示例,帮助开发者更好地理解和应用GBase数据库。二、GBase数据库
GBase 8a慢SQL优化案例-2 通过分析函数改写不等值关联排序取值
dudulang8088
sql 数据库 数据仓库
某气象现场一条查询语句,大数据场景下,单个机构查询耗时5分钟以上,需要分析,SQL语句如下:SELECTt.station_no,t.collect_time_stamp,t.r2020,t.topFROM(SELECTt1.station_no,t1.collect_time_stamp,t1.r2020,(SELECTCOUNT(*)+1FROM(SELECTstation_no,--站点编号
数据驱动业务增长,E-MapReduce 真实案例解析
Anna_Tong
mapreduce 大数据 云计算 数据分析 阿里云 实时计算 数据驱动
在大数据时代,数据已经成为企业核心竞争力的关键因素之一。无论是电商、金融、物流还是制造业,企业都在探索如何更高效地处理、分析和利用海量数据,以实现精准决策、优化运营并提升业务增长。然而,面对PB级甚至EB级的数据规模,传统的本地大数据计算架构往往难以满足性能和成本的要求。如何在保证计算效率的同时降低运维成本,成为企业数据战略中的关键挑战。阿里云E-MapReduce(EMR)作为一款云原生的大数据
GBase 数据库的高性能架构与优化实践
big crab
数据库 架构
引言随着信息技术的快速发展,数据库作为支撑各行各业数据存储和处理的核心技术之一,承担着越来越重要的角色。在现代企业中,大数据量、复杂查询和高并发处理已成为普遍需求。GBase数据库作为国内领先的数据库产品之一,提供了卓越的性能和灵活的架构设计,能够高效处理复杂的事务、分析查询和海量数据。本文将探讨GBase数据库的高性能架构,并结合实际案例展示其优化实践。一、GBase数据库架构概述GBase数据
HBase基本技巧:掌握高效数据管理的秘诀
狮歌~资深攻城狮
java android 数据库
HBase基本技巧:掌握高效数据管理的秘诀嘿,小伙伴们!现在你已经对HBase有了初步的了解,接下来让我们深入探讨一些HBase的基本技巧。这些技巧不仅能帮助你更高效地管理和操作数据,还能让你在面对复杂场景时游刃有余。1.行键设计的艺术什么是行键?行键(RowKey)是HBase表中每一行的唯一标识符。它的设计直接影响到查询性能和数据分布。因此,合理设计行键是非常重要的。设计原则•避免热点问题:如
【动态路由】系统Web URL资源整合系列(后端技术实现)【apisix实现】
飞火流星02027
URL整合 apisix反向代理 apisix网关 apisix实现web资源整合 系统URL资源整合 apisix基于请求参数的路由 apisix基于请求头的路由 APISIXDashboard
需求说明软件功能需求:反向代理功能(描述:apollo、eureka控、apisix、sentinel、普米、kibana、timetask、grafana、hbase、skywalking-ui、pinpoint、cmak界面、kafka-map、nacos、gateway、elasticsearch、oa-portal业务应用等多个web资源等只能通过有限个代理地址访问),不考虑SSO。软件质
大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统_bert+lstm
2301_76348014
程序员 深度学习 大数据 知识图谱
文章目录大数据知识图谱之深度学习——基于BERT+LSTM+CRF深度学习识别模型医疗知识图谱问答可视化系统一、项目概述二、系统实现基本流程三、项目工具所用的版本号四、所需要软件的安装和使用五、开发技术简介Django技术介绍Neo4j数据库Bootstrap4框架Echarts简介NavicatPremium15简介Layui简介Python语言介绍MySQL数据库深度学习六、核心理论贪心算法A
Apache ZooKeeper 分布式协调服务
slovess
分布式 apache zookeeper
1.ZooKeeper概述1.1定义与定位核心定位:分布式系统的协调服务,提供强一致性的配置管理、命名服务、分布式锁和集群管理能力核心模型:基于树形节点(ZNode)的键值存储,支持Watcher监听机制生态地位:Hadoop/Kafka等生态核心依赖,分布式系统基础设施级组件1.2设计目标强一致性:所有节点数据最终一致(基于ZAB协议)高可用性:集群半数以上节点存活即可提供服务顺序性:全局唯一递
Hadoop常用端口号
海洋 之心
Hadoop问题解决 hadoop hbase 大数据
Hadoop是一个由多个组件构成的分布式系统,每个组件都会使用一些特定的端口号来进行通信和交互。以下是Hadoop2.x常用的端口号列表:HDFS端口号:NameNode:50070SecondaryNameNode:50090DataNode:50010DataNode(数据传输):50020YARN端口号:ResourceManager:8088NodeManager:8042MapReduc
大数据专业毕业设计选题118例:数据挖掘 数据分析 可视化
HaiLang_IT
毕设选题教程 毕业设计 大数据 数据挖掘
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光,一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了大数据专业最新精选选题,如遇选题困难或选题有任何疑问,都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇总
Hadoop综合项目——二手房统计分析(可视化篇)
WHYBIGDATA
大数据项目 hadoop 大数据
Hadoop综合项目——二手房统计分析(可视化篇)文章目录Hadoop综合项目——二手房统计分析(可视化篇)0、写在前面1、数据可视化1.1二手房四大一线城市总价Top51.2统计各个楼龄段的二手房比例1.3统计各个城市二手房标签的各类比例1.4统计各个城市各个楼层的平均价格1.5统计各个城市二手房优势的各类比例1.6统计各个城市二手房数量和关注人数的关系1.7统计各个城市二手房规格的各类比例1.
大数据之-hdfs+hive+hbase+kudu+presto集群(6节点)
管哥的运维私房菜
大数据 hdfs hive kudu presto hbase
几个主要软件的下载地址:prestohttps://prestosql.io/docs/current/index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/hdfshttp://archive.apache.org/dist/ha
hbase快照同步到目标集群出现ERROR Multiple regions have the same startkey问题分析
spring208208
hbase hbase python 前端
问题现象源集群表split/merge过程中创建快照,该快照同步到目标集群,目标集群恢复快照后,进行hbck检查,就会出现异常报错:ERRORMultipleregionshavethesamestartkey;问题分析首先,出现上述问题可能有如下两种原因:源集群中snapshot表本身就存在这种问题,没有修复就执行snapshot,导出快照到目标集群,然后恢复表也会存在这种问题。在执行split
ztree异步加载
3213213333332132
JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑,我开始的时候也是看了API花了些时间才搞定了异步加载,在这里分享给大家。
我后台代码生成的是json格式的数据,数据大家按各自的需求生成,这里只给出前端的代码。
设置setting,这里只关注async属性的配置
var setting = {
//异步加载配置
thirft rpc 具体调用流程
BlueSkator
中间件 rpc thrift
Thrift调用过程中,Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类,这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作:
(1) 将客户端程序调用的函数名和参数传递给协议层(TProtocol),协议
异或运算推导, 交换数据
dcj3sjt126com
PHP 异或 ^
/*
* 5 0101
* 9 1010
*
* 5 ^ 5
* 0101
* 0101
* -----
* 0000
* 得出第一个规律: 相同的数进行异或, 结果是0
*
* 9 ^ 5 ^ 6
* 1010
* 0101
* ----
* 1111
*
* 1111
* 0110
* ----
* 1001
事件源对象
周华华
JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令
g21121
mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化,主要包括字符集设置,启动设置,连接优化,表优化,分区优化等等。
一 修改MySQL密码及用户
 
[简单]poi删除excel 2007超链接
53873039oycg
Excel
采用解析sheet.xml方式删除超链接,缺点是要打开文件2次,代码如下:
public void removeExcel2007AllHyperLink(String filePath) throws Exception {
OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart
云端月影
准备以下开源项目:
1. Struts 2.1.6
2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009)
3. jofc2,这东西不知道是没做好还是什么意思,好像和ofc2不怎么匹配,最好下源码,有什么问题直接改。
4. log4j
用eclipse新建动态网站,取名OFC2Demo,将Struts2 l
spring包详解
aijuans
spring
下载的spring包中文件及各种包众多,在项目中往往只有部分是我们必须的,如果不清楚什么时候需要什么包的话,看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包,关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念
antonyup_2006
算法 Web 应用服务器 搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时,准备了解下网站的推广分析策略。
所谓网站推广,目的在于让尽可能多的潜在用户了解并访问网站,通过网站获得有关产品和服务等信息,为最终形成购买决策提供支持。
网站推广策略有很多,seo,email,adv
单例模式,sql注入,序列
百合不是茶
单例模式 序列 sql注入 预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时 需要使用序列创建一个自增长的字段 居然不会了,所以将序列写在本篇的前面
1,序列是一个保存数据连续的增长的一种方式;
序列的创建;
CREATE SEQUENCE seq_pro
2 INCREMENT BY 1 -- 每次加几个
3
Mockito单元测试实例
bijian1013
单元测试 mockito
Mockito单元测试实例:
public class SettingServiceTest {
private List<PersonDTO> personList = new ArrayList<PersonDTO>();
@InjectMocks
private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标
bijian1013
oracle 数据库 plsql
/*
*使用游标
*/
--显示游标
--在显式游标中使用FETCH...INTO语句
DECLARE
CURSOR emp_cursor is
select ename,sal from emp where deptno=1;
v_ename emp.ename%TYPE;
v_sal emp.sal%TYPE;
begin
ope
【Java语言】动态代理
bit1129
java语言
JDK接口动态代理
JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式,为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联
package com.tom;
import com.tom.model.User;
import com.tom.service.IUserService;
Java通信之URL通信基础
白糖_
java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持,java.net包能让程序员直接在程序中实现网络通信。
在技术日新月异的现在,我们能通过很多方式实现数据通信,比如webservice、url通信、socket通信等等,今天简单介绍下URL通信。
学习准备:建议首先学习java的IO基础知识
URL是统一资源定位器的简写,URL可以访问Internet和www,可以通过url
博弈Java讲义 - Java线程同步 (1)
boyitech
java 多线程 同步 锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件,共用数据库连接,全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。
同步不仅可以阻止一个线程看到对象处于不一致的状态,它还可以保证进入同步方法或者块的每个线程,都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件(cri
java-给定字符串,删除开始和结尾处的空格,并将中间的多个连续的空格合并成一个。
bylijinnan
java
public class DeleteExtraSpace {
/**
* 题目:给定字符串,删除开始和结尾处的空格,并将中间的多个连续的空格合并成一个。
* 方法1.用已有的String类的trim和replaceAll方法
* 方法2.全部用正则表达式,这个我不熟
* 方法3.“重新发明轮子”,从头遍历一次
*/
public static v
An error has occurred.See the log file错误解决!
Kai_Ge
MyEclipse
今天早上打开MyEclipse时,自动关闭!弹出An error has occurred.See the log file错误提示!
很郁闷昨天启动和关闭还好着!!!打开几次依然报此错误,确定不是眼花了!
打开日志文件!找到当日错误文件内容:
--------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱?
comsci
地球上的钛金属矿藏已经接近枯竭...........
我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床.....
那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes
dai_lm
google api
为了获得从A点到B点的路劲,经常会使用Google提供的API,例如
[url]
http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false
[/url]
从返回的结果上,大致可以了解应该怎么走,但
SQL还有多少“理所应当”?
datamachine
sql
转贴存档,原帖地址:http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html!
------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时,如何设置某些字段不需要验证
dcj3sjt126com
Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如:
$form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码
dcj3sjt126com
crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com
管理一网站,最开始使用的虚拟空间,采用提供商支持的ftp上传网站文件,后换用vps,vps可以自己搭建ftp的,但是懒得搞,直接使用scp传输文件到服务器,现在需要更新文件到服务器,使用scp真的很烦。发现本人就职的公司,采用的git+rsync的方式来管理、同步代码,遂
sql基本操作
蕃薯耀
sql sql基本操作 sql常用操作
sql基本操作
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
蕃薯耀 2015年6月1日 17:30:33 星期一
&
Spring4+Hibernate4+Atomikos3.3多数据源事务管理
hanqunfeng
Hibernate4
Spring3+后不再对JTOM提供支持,所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考:http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站:http://www.atomikos.com/ 一.pom.xml
<dependency>
<
jquery中两个值得注意的方法one()和trigger()方法
jackyrong
trigger
在jquery中,有两个值得注意但容易忽视的方法,分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍
1) one方法
one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数,格式为
one(type,${data},fn)
&nb
拿工资不仅仅是让你写代码的
lampcy
工作 面试 咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是,我并不关心你是如何快速完成任务的,哪怕代码很差,只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。
这个说法其实很合理:我们的工作是思考客户提出的问题,然后制定解决方案。思考第一,代码第二,公司请我们的最终目的不是写代码,而是想出解决方案。
话粗理不粗。
付你薪水不是让你来思考的,也不是让你来写代码的,你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空
nannan408
架构师
1.前言。
如题。
2.代码。
(1)对象的复制,比spring的beanCopier在大并发下效率要高,利用net.sf.cglib.beans.BeanCopier
Src src=new Src();
BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案
Rainbow702
JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面,各位可能都做过。
今天碰到一个奇怪的现象,就是,同一个ajax请求,在chrome中,不论发送多少次,都可以发送至服务器端,而不会被缓存。但是,换成在IE下的时候,发现,同一个ajax请求,会发生被缓存的情况,只有第一次才会被发送至服务器端,之后的不会再被发送。郁闷。
解决方法如下:
① 直接使用 JQuery提供的 “cache”参数,
修改date.toLocaleString()的警告
tntxia
String
我们在写程序的时候,经常要查看时间,所以我们经常会用到date.toLocaleString(),但是date.toLocaleString()是一个过时 的API,代替的方法如下:
package com.tntxia.htmlmaker.util;
import java.text.SimpleDateFormat;
import java.util.
项目完成后的小总结
xiaomiya
js 总结 项目
项目完成了,突然想做个总结但是有点无从下手了。
做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。
先说说项目主要实现的功能吧
1,按键精灵
2,获取行情数据
3,各种input输入条件判断
4,发送数据(有json格式和string格式)
5,获取预警条件列表和预警结果列表,
6,排序,
7,预警结果分页获取
8,导出文件(excel,text等)
9,修