静惘

HBase的RowKey详解、RowKey设计原则和RowKey优化方法

1、`RowKey`的概念

HBase 中 RowKey 可以唯一标识一行记录，在 HBase 查询的时候有以下几种方式：

通过 get 方式，指定 RowKey获取唯一一条记录；
通过 scan 方式，设置 startRow 和 stopRow 参数进行范围匹配；
全表扫描，即直接扫描整张表中所有行记录。

从字面意思来看，RowKey就是行键的意思，在增删改查的过程中充当了主键的作用。它可以是任意字符串，在 HBase 内部 RowKey保存为字节数组。

HBase 中的数据是按照 RowKey 的 ASCII字典顺序进行全局排序的，有伙伴可能对 ASCII字典序印象不够深刻，下面举例说明：

假如有5个Rowkey："012"，"0"，"123"，"234"， "3"，按ASCII字典排序后的结果为："0"，"012"，"123"，"234"，"3"。

因此我们设计Rowkey时，需要充分利用排序存储这个特性，将经常一起读取的行存储放到一起，要避免做全表扫描，因为效率特别低。

2、`RowKey`设计的三大原则

2.1、`RowKey`唯一原则

RowKey中数据是以 key-value 格式存储的，RowKey可以类比为MySQL里面的key值，因此在HBase的一张表里面，RowKey不应该重复。而且一个RowKey只能对应一条数据，用RowKey去get表里面的数据时，返回的应该是唯一一条对应的数据记录，不应该返回多条。

另外，因为 RowKey 是按照字典顺序排序存储的，所以可以将经常读取的数据存储到一块，将最近可能会被访问的数据放到一块。不过这样做虽然方便了 scan 等范围查询数据，也可能会导致热点问题。

2.2、`RowKey`长度原则

RowKey是一个二进制码流，可以是任意字符串，最大长度 64kb，实际应用中一般为 10-100bytes，以byte[] 形式保存，一般设计成定长。

建议越短越好，不要超过 16 个字节，原因如下：在 HBase 的底层存储 HFile 中，RowKey 是 Key-Value 结构中的一个域。假设 RowKey 长度 100B，那么 1000 万条数据中，光 RowKey 就占用掉 100*1000w=10 亿个字节将近 1G 空间，这样会极大影响HFile 的存储效率。

过长会导致 RowKey 在 memStore 中占据的内存空间过大，而实际数据占据的空间很小，只写了少量数据就因为RowKey占据太多空间而flush。因此建议越短越好，不要超过100个字节。

2.3、排序原则

RowKey 是按照字典顺序排序存储的，因此，设计 RowKey 的时候，要充分利用这个排序的特点，将经常读取的数据存储到一块，将最近可能会被访问的数据放到一块。

一个常见的数据处理问题是快速获取数据的最近版本，使用反转的时间戳作为RowKey 的一部分对这个问题十分有用，可以用Long.Max_Value-timestamp 追加到key 的末尾。

例如 [key][reverse_timestamp],[key]的最新值可以通过 scan [key]获得[key]的第一条记录，因为 HBase 中 RowKey 是有序的，第一条记录是最后录入的数据。

2.4、`RowKey`散列原则

散列原则的作用是将数据打散，不要让连续的数据集中在一个region里面，降低热点问题出现的可能性。

# 第一部分数据：
1638584124_user_id
1638584135_user_id
1638584146_user_id
1638584157_user_id
1638584168_user_id
1638584179_user_id

# 第二部分数据：
4214858361Iuser_id
5314858361_user_id
6414858361_user_id
7514858361_user_id
8614858361_user_id
9714858361_user_id

以上面的数据为例，图中的数据就是以时间戳的方式来排序，这样排序如果要访问的数据集中在某一个时间段上，这个时间段内连续的RowKey在一个region里面（因为 HBase 里面的数据按照字典排序，连续写入的时候就会让数据因为连续的 RowKey 会进入相同的 region 里面），对这一个region进行频繁的访问就造成了热点问题。因此应该按照散列原则，给时间戳RowKey的前面加上随机生成的散列字段，这样连续的时间戳数据也会因为随机的散列字段而进入不同的region，避免了热点问题。

当然图上并没有这么做，代码的上半部分数据是原始数据，而代码的下半部分选择将时间戳反转，这样每行RowKey的前几位也是各不相同的，不会被写入同一个region里面，同样避免了热点问题。

3、`HFile`简单结构示意图

HBase中设计有MemStore和BlockCache，分别对应列族/Store级别的写入缓存，RegionServer 级别的读取缓存。如果 RowKey字段过长，内存的有效利用率就会降低，系统不能缓存更多的数据，这样会降低检索效率。

另外，我们目前使用的服务器操作系统都是 64 位系统，内存是按照 8B 对齐的，因此设计 RowKey时一般做成 8B的整数倍，如 16B 或者 24B，可以提高寻址效率。

同样，列族、列名的命名在保证可读的情况下也应尽量短。value 永远和它的 key 一起传输的。当具体的值在系统间传输时，它的 RowKey，列名，时间戳也会一起传输（因此实际上列族命名几乎都用一个字母，比如'c'或'f'）。如果你的 RowKey和列名和值相比较很大，那么你将会遇到一些有趣的问题。HFile中的索引最终占据了 HBase分配的大量内存。

4、热点问题

我查看了很多博客，很多博客都只说了连续的RowKey在同一个region里面就会导致热点问题，其实这样是没有说完的。因为如果只是RowKey连续，那么RegionServer会自动划分过大的region，这样每个region里面的数据量也是差不多的，不会因为这样就导致热点问题。

导致热点问题的原因是，Clinet访问查询数据时，可能会集中访问某一段连续RowKey的数据，而因为HBase中是按照字典序升序来排列数据的，这样连续将数据写入表中时，连续RowKey的数据就会被划分在同一个region里面，而针对这一段连续RowKey所在的region进行频繁大量的访问，导致region所在的节点机器承受了超出自身处理极限的访问量，从而导致效率低下甚至故障。而其他节点存储的数据因为没有被访问，所以一个节点拼死的忙，其他节点围观看戏，这就造成了热点问题。

另外还有一种情况，那就是设置的预分区不合理，同样会导致热点问题，预分区不合理同样可能导致设置的其中一个region里面的数据被大量访问。

对于热点问题，应该做的是，对RowKey进行合理的设计，让一段连续的RowKey进入不同的region当中，这样就避免了访问集中在同一个region上。

4.1、加盐

给RowKey分配一个随机前缀以使得它和之前的RowKey的开头不同。分配的前缀种类数量应该和你想使用数据分散到不同的region的数量一致。加盐之后的RowKey就会根据随机生成的前缀分散到各个region上，从而避免热点问题。

4.2、哈希

针对RowKey进行hash运算，运算得出的结果，再拼接到原先RowKey的前面，这样连续RowKey计算得到的hash值不相同，将hash值与RowKey拼接后的新RowKey较大概率不会连续，这样就会被送入不同的region里面

但是上面也说了，这只是较大概率不会连续，但是连续的RowKey计算出来的hash值的前缀依旧可能相同。比如一段连续的RowKey，r1，r2，r3，这三者经过hash运算后的结果为aaa，aab，aac，这样虽然hash结果不同，但是hash值的前缀相同，按照字典序排序时依旧是连续的数据。

使用hash的好处是，同一个RowKey的hash值是固定的，因此查询时只要计算一下hash值，依旧可以按照RowKey查询数据。而加盐就是给每一个RowKey随机加上一个前缀，这就导致同一个RowKey，多次加盐的结果也是不同的，因此没办法再用RowKey去get到某一条数据（当然非要用RowKey去查也可以，用子串过滤器，把原来的RowKey作为子串去匹配加盐后的RowKey）。

使用hash的坏处是，虽然可以继续使用get查询，但是因为计算到的hash值依旧可能连续，导致热点问题没有被解决。而加盐可以保证解决热点问题，即连续RowKey的数据一定被划分到不同的region里面。

4.3、反转

第三种防止热点的方法时反转固定长度或者数字格式的RowKey。这样可以使得RowKey中经常改变的部分放在前面。这样可以有效的随机RowKey，但是牺牲了RowKey的有序性。

就比如时间戳，大量连续的时间戳只有最后两三位会改变，前面几位基本不会改变，此时就可以将最后两三位提到最前面，将重复的时间戳部分放到后面，避免了连续。

4.4、时间戳反转

时间戳反转这里的反转应该打上引号，因为这里不是将123变成321这样的反转，而是用大数减去小数，用差值作为新的RowKey。

1638620506_uid
1638620512_uid
1638620524_uid
1638620536_uid
1638620548_uid

此时需求是，让最新的记录排在最前面，也就是按照时间戳逆序排序，最新也即最大的时间戳排在最上面方法就是设定一个大数，比如设置一个9999999999的时间戳，然后用这个时间戳去减去上面rowkey里面的时间戳，结果为：

1638620506_uid ——> 8,361,379,493_uid
1638620512_uid ——> 8,361,379,487_uid
1638620524_uid ——> 8,361,379,475_uid
1638620536_uid ——> 8,361,379,463_uid
1638620548_uid ——> 8,361,379,451_uid

这样再排序的时候，按照字典序排列，最后一条RowKey，8,361,379,451_uid就会被放在第一位，实现了最新的一条记录放在最前面的需求。

你可能感兴趣的:(HBase,hbase,数据库,大数据)

wiredtiger java_mongodb数据库损坏，丢失WiredTIger.wt等meta文件，通过collection*.wt恢复数据... 又逢账号起名时 wiredtiger java
mongodb恢复wiredtiger数据Backgroundmongodb是一款开源NoSQL非关系型数据库，通过database,collection组织存储数据文件，其中在每个collection中，每条数据被存储为一个document，而每个document为一组键值对。此外，mongodb默认使用WiredTiger作为数据存储引擎，WiredTiger为数据管理提供了不同粒度的并发控制
influxdb数据过期_「监控」InfluxDB系统架构分析云锋金融 influxdb数据过期
InfluxDB系统架构参考：时序数据库技术体系–初识InfluxDB简单的理解:DatabaseInfluxDB中有着和传统数据库一样的Database的概念RetentionPolicy(RP)数据保留策略。核心作用有3个：指定数据的过期时间，指定数据副本数量以及指定ShardGroupDuration.RP创建语句如下：CREATERETENTIONPOLICYONONDURATIONREP
时序数据库技术体系 – 初识InfluxDB（原理） weixin_30622181 数据库大数据系统架构
原贴地址：http://hbasefly.com/2017/12/08/influxdb-1/?qytefg=c4ft23在上篇文章《时序数据库体系技术–时序数据存储模型设计》中笔者分别介绍了多种时序数据库在存储模型设计上的一些考虑，其中OpenTSDB基于HBase对维度值进行了全局字典编码优化，Druid采用列式存储并实现了Bitmap索引以及局部字典编码优化，InfluxDB和Beringe
【数据库系统】RocksDB 极简教程 AI天才研究院架构师必知必会系列数据库 rocksdb
目录RocksDB极简教程LSM-TreeVS.B-TreeRocksDBHighLevelArchitecture高层架构番外篇：LevelDB简介IO放大CompactionInmemory数据库事务(ACID)WAL日志文件结构FileformatRocksDBFeatures|特点Gettingstarted入门Overview概述OpeningADatabase打开数据库Status状态
国产数据库有哪些？介绍下他们的名字、作者、成熟度、适用的应用场景、不足。陈老师还在写代码 SpringBoot100问数据库
国产数据库近年来发展迅速，以下是一些主要产品及其特点：1.达梦数据库（DM）作者/公司：武汉达梦数据库有限公司成熟度：成熟，广泛应用于政府、金融等领域。应用场景：政府、金融、电信、能源等对数据安全要求高的行业。不足：生态相对较小，社区支持不如国际主流数据库。2.人大金仓（Kingbase）作者/公司：北京人大金仓信息技术股份有限公司成熟度：成熟，广泛应用于政府、军工等领域。应用场景：政府、军工、教
SpringBoot分布式应用程序和数据库在物理位置分配上、路由上和数量上的最佳实践是什么？陈老师还在写代码 SpringBoot100问 spring boot 数据库后端
在设计和部署SpringBoot分布式应用程序时，物理位置分配、路由和数据库数量的最佳实践对系统性能、可用性和可维护性至关重要。以下是相关建议：1.物理位置分配最佳实践：靠近用户部署：将应用实例部署在靠近用户的数据中心，减少延迟，提升响应速度。多区域部署：在多个地理区域部署应用实例，确保高可用性和灾难恢复能力。CDN使用：通过CDN分发静态资源，进一步降低延迟。2.路由最佳实践：负载均衡：使用负载
mysql、redis和MongoDB三大数据库的优点和区别 DreamCity07 mongodb 数据库 mysql
NoSQL的全称是NotOnlySQL，也可以理解非关系型的数据库，是一种新型的革命式的数据库设计方式，不过它不是为了取代传统的关系型数据库而被设计的，它们分别代表了不同的数据库设计思路。MongoDB：它是一个内存数据库，数据都是放在内存里面的。对数据的操作大部分都在内存中，但MongoDB并不是单纯的内存数据库。MongoDB是由C++语言编写的，是一个基于分布式文件存储的开源数据库系统。在高
Oracle数据库岚苼 oracle 数据库
文章目录1.表的创建（1）创建表的语法举例1：创建出版社表。举例2：创建图书表（2）使用DESCRIBE（describe）显示图书表的结构（3）通过子查询创建表举例（4）设置列的默认值DEFAULT（default）举例（5）删除已创建的表解析CASCADECONSTRAINTS（cascadeconstraints）2.表的操作（1）表的重命名RENAMETO（2）清空表TRUNCATE（tr
Oracle EBS Update SYSTEM Password - 11i && R12 Albert Tan oracle
前言为何会提到SYSTEM用户？因为在打补丁时，需要验证SYSTEM用户的密码。但由于该密码较为复杂，不太好记忆，所以临时产生一个想法，更改SYSTEM密码。在EBS系统中，数据库用户和应用层的用户密码更改方式不一样，应用层需要使用FNDCPASS工具进行更改。数据库层对于SYSDBA用户使用orapw，普通用户使用SQL语法进行修改。正文开始1、什么是SYSTEM用户？DBTier：SYSTEM
制造企业智慧物流架构解决方案有限无限资料库智能制造数字化制造架构
本文档主要内容如下：1.物流4.0与智慧物流物流4.0：作为工业4.0的重要组成部分，物流4.0强调通过信息化和智能化手段，实现物流供应链的高效协同和优化。智慧物流：利用物联网、大数据、云计算等技术，实现物流过程的自动化、智能化和可视化，提升物流效率和服务质量。2.未来企业核心竞争力：高效物流供应链协同核心环节：涵盖采购物流、生产物流、销售物流、供应网络、智能制造和分销网络。目标：通过高效的供应链
分布式存储--大规模订单架构设计梦江河大数据分布式订单系统大数据
架构一：MySQL+HBase+ElasticsearchMySQL存储实时订单，HBase存储历史订单，Elasticsearch实现订单的多维度搜索。架构复杂，运维维护成本高架构二：MySQL+TablestoreTablestore其实是HBase+Elasticsearch，既能存储大量数据，也能全文搜索架构三：分布式数据库TiDB+全文搜索功能参考文章
Redis在京东到家的订单中的使用 weixin_33948416 数据库 java 大数据
背景Redis作为一款性能优异的内存数据库，在互联网公司有着多种应用场景，下面介绍下Redis在京东到家的订单列表中的使用场景。主要从以下几个方面来介绍：订单列表在Redis中的存储结构Redis和DB数据一致性保证Redis中的分布式锁缓存防穿透和雪崩订单列表在Redis中的存储结构订单列表数据在缓存中，是以用户的唯一标识作为键，以一个按下单时间倒序的有序集合为值进行存储的。大家都知道Redis
TDengine 性能测试工具 taosBenchmark TDengine （老段） tdengine git github 大数据涛思数据时序数据库性能优化
简介工具获取运行无参数模式命令行模式配置文件模式命令行参数配置文件参数通用配置参数写入配置参数数据库相关超级表相关标签列与数据列写入行为相关查询配置参数执行指定查询语句查询超级表订阅配置参数数据类型对照表配置文件示例写入JSON示例查询JSON示例订阅JSON示例输出性能指标写入指标查询指标订阅指标简介taosBenchmark是TDengine产品性能基准测试工具，提供对TDengine产品写入
UMLS初探愉悦的麻婆豆腐人工智能健康医疗
什么是UMLSUMLS（UnifiedMedicalLanguageSystem，统一医学语言系统），简单来说就是将不同的医学标准统一到一套体系的系统，主要为了医疗系统的统一而构建出的。UMLS的主要组成部分Metathesaurus：一个包含多个医学术语系统的元数据库，旨在统一和映射不同来源的医学概念。SemanticNetwork：一个包含语义分类和关系的网络。它可以帮助用户识别概念之间的语义
MySQL调用存储过程和存储函数夏天又到了 MySQL数据库技术 mysql adb android
【图书推荐】《MySQL9从入门到性能优化（视频教学版）》-CSDN博客《MySQL9从入门到性能优化（视频教学版）（数据库技术丛书）》(王英英)【摘要书评试读】-京东图书(jd.com)MySQL9数据库技术_夏天又到了的博客-CSDN博客存储过程和存储函数已经定义好了，接下来需要知道如何调用这些过程和函数。存储过程和存储函数有多种调用方法：存储过程必须使用CALL语句调用，并且存储过程和数据库
oracle诊断工具,oracle诊断工具-RDA使用 Hdspn oracle诊断工具
RDA是RemoteDiagnosticAgent的简称，是oracle用来收集、分析数据库的工具，运行该工具不会改变系统的任何参数，RDA收集的相关数据非常全面，可以简化我们日常监控、分析数据库的工作，OracleSupport也建议我们在反馈相关问题时，提供RDA收集的数据，这样RDA是RemoteDiagnosticAgent的简称，是oracle用来收集、分析数据库的工具，运行该工具不会改
蓝易云 - HBase基础知识蓝易云 hbase 数据库大数据 php python 人工智能
HBase是一个分布式、可伸缩、列式存储的NoSQL数据库，它建立在Hadoop的HDFS之上，提供高可靠性、高性能的数据存储和访问。以下是HBase的基础知识：数据模型：HBase以表的形式存储数据，每个表由行和列组成，可以动态添加列族。每行由唯一的行键标识，列族和列限定符（Qualifier）用于唯一标识列。架构：HBase采用分布式架构，数据被分散存储在多个RegionServer上，每个R
DBA面试总结(Oracle篇) 浮萍哥 dba oracle 数据库
一、备份恢复1.RMAN备份是一种用于备份和恢复数据库文件归档日志和控制文件的工具软件，主要执行的是物理备份，可以执行完全或不完全的数据库恢复。既能支持热备，在归档模式下，RMAN可以执行在线备份。在非归档模式下，RMAN备份通常在数据库处于mount状态下进行。RMAN备份具有以下优点：支持增量备份，可以节省备份时间和空间。自动管理备份文件，无需手动指定文件名或位置，自动化备份和恢复，无需手动执
Oracle DBA 诊断及统计工具-2 数澜悠客数据工具箱 oracle 数据库
Oracle数据表空间和索引表空间的资源分配比例总结在Oracle数据库中，数据表空间和索引表空间并没有固定的资源分配比例，其分配需要综合考虑多种因素，以下是详细分析不同场景下的分配建议以及具体的分配思路。影响分配比例的因素数据读写比例如果应用程序以读操作为主，那么索引的使用频率会较高，可能需要为索引表空间分配相对更多的资源，以提高查询性能。若写操作频繁，如大量的数据插入、更新和删除，数据表空间可
windows服务器系统巡检脚本,sql server 数据库巡检脚本 zq青
我司数据库一季度巡检一次，所以经常用到下面脚本--1.查看数据库版本信息select@@version--2.查看所有数据库名称及大小execsp_helpdb--3.查看数据库所在机器的操作系统参数execmaster..xp_msver--4.查看数据库启动的参数--5.查看数据库启动时间selectconvert(varchar(30),login_time,120)frommaster..
windows服务器系统巡检脚本,xx系统巡检方案xxx年度xx巡检报告.doc nell nell
XX系统巡检报告(xxx年度第x季度)系统名称：XX系统巡检日期：编写：编写日期：审核：审核日期：批准：批准日期：目录TOC\o"1-7"\h\z一、概述3二、巡检方案31数据库方面31.1数据库服务器(硬件)基本信息：31.2数据库配置41.3数据库检查内容51.4数据库检查总结62应用服务器方面62.1应用服务器(硬件)基本信息：62.2应用服务器检查内容72.3应用服务器检查总结93XX系统
MySQL 数据库定时任务及进阶学习一只小灿灿数据库数据库 mysql 学习
一、引言在当今数字化时代，数据管理的高效性和自动化至关重要。MySQL作为一款广泛应用的开源关系型数据库管理系统，提供了强大的功能来满足各种数据处理需求。其中，定时任务执行功能对于自动化数据操作、维护数据完整性以及优化系统性能具有关键作用。通过合理设置定时任务，数据库管理员和开发人员能够实现诸如数据备份、数据清理、报表生成等重复性任务的自动化执行，从而节省大量时间和精力，将更多资源投入到核心业务逻
mysql大数据量分页查询懒洋洋大魔王 MySQL mysql 数据库
一、什么是‌MySQL大数据量分页查？MySQL大数据量分页查‌是指在使用MySQL数据库时，将大量数据分成多个较小的部分进行显示，以提高查询效率和用户体验。分页查询通常用于网页或应用程序中，以便用户能够逐步浏览结果集。二、为什么要用MySQL大数据量分页？随着业务的增长，数据库的数据也呈指数级增长，之前所写的代码mysql的分页都是采用的limit方式进行，这种方式固然代码比较简单，但数据量大了
.NET 9.0 的 Blazor Web App 项目，自定义日志 TLog V2 使用备忘 cqths Blazor Web App EF Core Blazor web app .net c#数据库
一、TLogV1使用静态数据库上下文，优点是速度快，缺点是内存占用大，参见.NET9.0的BlazorWebApp项目、BootstrapBlazor组件库、自定义日志TLog使用备忘_navigationmanager.tobaserelativepath-CSDN博客二、TLogV2改为依赖注入方式，优点、缺点与V1相反，使用方法与V1相同。namespaceBlazorWebAppNet9S
基于 Redis 的通讯架构：一种替代 RPC 的新思路步子哥 redis 架构 rpc
在当今软件开发的多元世界里，大家都在绞尽脑汁搭建高效、灵活又容易维护的架构。而Redis，这个在缓存、消息队列等领域大放异彩的高性能键值存储数据库，为我们开辟了一条新思路。今天，就来深入聊聊以Redis为核心，借助它的list数据结构搭建通讯层，从而实现跨语言通讯，攻克传统RPC架构痛点的奇妙架构。一、传统RPC架构的“症结”在哪？RPC，也就是远程过程调用，听起来很高大上，本意是让我们能像调用本
深入理解Python上下文管理器：从基础到高级应用蜗牛沐雨 python 开发语言
在Python编程中，资源管理是一个至关重要的话题。无论是文件操作、数据库连接，还是网络请求，正确地管理资源可以避免内存泄漏、数据损坏等问题。而Python中的上下文管理器（ContextManager）正是为此而生。上下文管理器提供了一种优雅的方式来管理资源的获取和释放，确保即使在发生异常的情况下，资源也能被正确释放。本文将带你从基础概念入手，逐步深入到高级应用场景，并通过丰富的示例代码，帮助你
pg建表和建索引 cyw8998 python 开发语言
java代码：packagecom.geo.mine.util;importjava.sql.Connection;importjava.sql.DriverManager;importjava.sql.SQLException;importjava.sql.Statement;publicclassCreateTableAndOther{//PostgreSQL数据库的JDBCURLString
数据仓库与数据挖掘记录二匆匆整棹还数据仓库数据挖掘人工智能
1.数据仓库的产生从20世纪80年代初起直到90年代初,联机事务处理一直是关系数据库应用的主流。然而,应用需求在不断地变化,当联机事务处理系统应用到一定阶段时,企业家们便发现单靠拥有联机事务处理系统已经不足以获得市场竞争的优势,他们需要对其自身业务的运作以及整个市场相关行业的态势进行分析,进而做出有利的决策。这种决策需要对大量的业务数据包括历史业务数据进行分析才能得到。把这种基于业务数据的决策分析
数据库设计三范式肥猪猪爸互联网开发数据库数据库设计面试算法
数据库设计三范式（3NF）数据库设计三范式是指数据库设计中用于确保数据结构合理，减少数据冗余和依赖性的一系列标准。通常，数据库设计遵循从第一范式（1NF）到第三范式（3NF）的过程。每一范式都在上一范式的基础上进行加强，消除不同类型的数据冗余和不合理的依赖关系。第一范式（1NF）定义：第一范式要求每个列的数据都是原子的，也就是说，每个列中的数据不可再分。具体来说，1NF强调每个单元格存储的是单一的
navicat导入sql文件，数据库没反应也没数据 darling HQ 数据库 sql oracle
第一、打开你得sql文件，在navicat打开看一下sql预计，第一句要么是usexxx的直接pass，你都没得这个数据库，use个屁第二如果是没有use的，还是看sql语句，里面没有创建数据库的如createdatabasexxx直接pass，都没有创建库，也没有库，插入那个库嘛。因为这个导出语句，不会将数据库的创建和进入库都写入，只会将数据库的建表和插入数据导出，所以就会造成这个错误。
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他