szwangdf

[JAVA][DB]用MR(MapReduce)查询hbase数据(Mapper参数传递)－用到TableMapper和Scan

首先，可以设置scan的startRow, stopRow, filter等属性。于是两种方案：

1.设置scan的filter，然后执行mapper，再reducer成一份结果

2.不用filter过滤，将filter做的事传给mapper做

进行了测试，前者在执行较少量scan记录的时候效率较后者高，但是执行的scan数量多了，便容易导致超时无返回而退出的情况。而为了实现后者，学会了如何向mapper任务中传递参数，走了一点弯路。

最后的一点思考是，用后者效率仍然不高，即便可用前者时效率也不高，因为默认的tablemapper是将对一个region的scan任务放在了一个mapper里，而我一个region有2G多，而我查的数据只占七八个region。于是，想能不能不以region为单位算做mapper，如果不能改，那只有用MR直接操作HBase底层HDFS文件了，这个，…，待研究。

上代码（为了保密，将表名啊，列名列族名啊都改了一下，有改漏的，大家当做没看见啊，另：主要供大家参考下方法，即用mr来查询海量hbase数据，还有如何向mapper传参数）：

[java] view plain copy print ?

package mapreduce.hbase;
import java.io.IOException;
import mapreduce.HDFS_File;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.FilterList;
import org.apache.hadoop.hbase.filter.SingleColumnValueFilter;
import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper.Context;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
/**
* 用MR对HBase进行查找，给出Scan的条件诸如startkey endkey;以及filters用来过滤掉不符合条件的记录 LicenseTable
* 的 RowKey 201101010000000095\xE5\xAE\x81WDTLBZ
*
* @author Wallace
*
*/
@SuppressWarnings("unused")
public class MRSearchAuto {
private static final Log LOG = LogFactory.getLog(MRSearchAuto.class);
private static String TABLE_NAME = "tablename";
private static byte[] FAMILY_NAME = Bytes.toBytes("cfname");
private static byte[][] QUALIFIER_NAME = { Bytes.toBytes("col1"),
Bytes.toBytes("col2"), Bytes.toBytes("col3") };
public static class SearchMapper extends
TableMapper<ImmutableBytesWritable, Text> {
private int numOfFilter = 0;
private Text word = new Text();
String[] strConditionStrings = new String[]{"","",""}/* { "新C87310", "10", "2" } */;
/*
* private void init(Configuration conf) throws IOException,
* InterruptedException { strConditionStrings[0] =
* conf.get("search.license").trim(); strConditionStrings[1] =
* conf.get("search.carColor").trim(); strConditionStrings[2] =
* conf.get("search.direction").trim(); LOG.info("license: " +
* strConditionStrings[0]); }
*/
protected void setup(Context context) throws IOException,
InterruptedException {
strConditionStrings[0] = context.getConfiguration().get("search.license").trim();
strConditionStrings[1] = context.getConfiguration().get("search.color").trim();
strConditionStrings[2] = context.getConfiguration().get("search.direction").trim();
}
protected void map(ImmutableBytesWritable key, Result value,
Context context) throws InterruptedException, IOException {
String string = "";
String tempString;
/**/
for (int i = 0; i < 1; i++) {
// /在此map里进行filter的功能
tempString = Text.decode(value.getValue(FAMILY_NAME,
QUALIFIER_NAME[i]));
if (tempString.equals(/* strConditionStrings[i] */"新C87310")) {
LOG.info("新C87310. conf: " + strConditionStrings[0]);
if (tempString.equals(strConditionStrings[i])) {
string = string + tempString + " ";
} else {
return;
}
}
else {
return;
}
}
word.set(string);
context.write(null, word);
}
}
public void searchHBase(int numOfDays) throws IOException,
InterruptedException, ClassNotFoundException {
long startTime;
long endTime;
Configuration conf = HBaseConfiguration.create();
conf.set("hbase.zookeeper.quorum", "node2,node3,node4");
conf.set("fs.default.name", "hdfs://node1");
conf.set("mapred.job.tracker", "node1:54311");
/*
* 传递参数给map
*/
conf.set("search.license", "新C87310");
conf.set("search.color", "10");
conf.set("search.direction", "2");
Job job = new Job(conf, "MRSearchHBase");
System.out.println("search.license: " + conf.get("search.license"));
job.setNumReduceTasks(0);
job.setJarByClass(MRSearchAuto.class);
Scan scan = new Scan();
scan.addFamily(FAMILY_NAME);
byte[] startRow = Bytes.toBytes("2011010100000");
byte[] stopRow;
switch (numOfDays) {
case 1:
stopRow = Bytes.toBytes("2011010200000");
break;
case 10:
stopRow = Bytes.toBytes("2011011100000");
break;
case 30:
stopRow = Bytes.toBytes("2011020100000");
break;
case 365:
stopRow = Bytes.toBytes("2012010100000");
break;
default:
stopRow = Bytes.toBytes("2011010101000");
}
// 设置开始和结束key
scan.setStartRow(startRow);
scan.setStopRow(stopRow);
TableMapReduceUtil.initTableMapperJob(TABLE_NAME, scan,
SearchMapper.class, ImmutableBytesWritable.class, Text.class,
job);
Path outPath = new Path("searchresult");
HDFS_File file = new HDFS_File();
file.DelFile(conf, outPath.getName(), true); // 若已存在，则先删除
FileOutputFormat.setOutputPath(job, outPath);// 输出结果
startTime = System.currentTimeMillis();
job.waitForCompletion(true);
endTime = System.currentTimeMillis();
System.out.println("Time used: " + (endTime - startTime));
System.out.println("startRow:" + Text.decode(startRow));
System.out.println("stopRow: " + Text.decode(stopRow));
}
public static void main(String args[]) throws IOException,
InterruptedException, ClassNotFoundException {
MRSearchAuto mrSearchAuto = new MRSearchAuto();
int numOfDays = 1;
if (args.length == 1)
numOfDays = Integer.valueOf(args[0]);
System.out.println("Num of days: " + numOfDays);
mrSearchAuto.searchHBase(numOfDays);
}
}

package mapreduce.hbase;

import java.io.IOException;

import mapreduce.HDFS_File;

import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.filter.FilterList;
import org.apache.hadoop.hbase.filter.SingleColumnValueFilter;
import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp;
import org.apache.hadoop.hbase.io.ImmutableBytesWritable;
import org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil;
import org.apache.hadoop.hbase.mapreduce.TableMapper;
import org.apache.hadoop.hbase.util.Bytes;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper.Context;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

/**
 * 用MR对HBase进行查找，给出Scan的条件诸如startkey endkey;以及filters用来过滤掉不符合条件的记录 LicenseTable
 * 的 RowKey 201101010000000095\xE5\xAE\x81WDTLBZ
 * 
 * @author Wallace
 * 
 */
@SuppressWarnings("unused")
public class MRSearchAuto {
	private static final Log LOG = LogFactory.getLog(MRSearchAuto.class);

	private static String TABLE_NAME = "tablename";
	private static byte[] FAMILY_NAME = Bytes.toBytes("cfname");
	private static byte[][] QUALIFIER_NAME = { Bytes.toBytes("col1"),
			Bytes.toBytes("col2"), Bytes.toBytes("col3") };

	public static class SearchMapper extends
			TableMapper<ImmutableBytesWritable, Text> {
		private int numOfFilter = 0;

		private Text word = new Text();
		String[] strConditionStrings = new String[]{"","",""}/* { "新C87310", "10", "2" } */;

		/*
		 * private void init(Configuration conf) throws IOException,
		 * InterruptedException { strConditionStrings[0] =
		 * conf.get("search.license").trim(); strConditionStrings[1] =
		 * conf.get("search.carColor").trim(); strConditionStrings[2] =
		 * conf.get("search.direction").trim(); LOG.info("license: " +
		 * strConditionStrings[0]); }
		 */
		protected void setup(Context context) throws IOException,
				InterruptedException {
			strConditionStrings[0] = context.getConfiguration().get("search.license").trim();
			strConditionStrings[1] = context.getConfiguration().get("search.color").trim();
			strConditionStrings[2] = context.getConfiguration().get("search.direction").trim();
		}

		protected void map(ImmutableBytesWritable key, Result value,
				Context context) throws InterruptedException, IOException {
			String string = "";
			String tempString;

			/**/
			for (int i = 0; i < 1; i++) {
				// /在此map里进行filter的功能
				tempString = Text.decode(value.getValue(FAMILY_NAME,
						QUALIFIER_NAME[i]));
				if (tempString.equals(/* strConditionStrings[i] */"新C87310")) {
					LOG.info("新C87310. conf: " + strConditionStrings[0]);
					if (tempString.equals(strConditionStrings[i])) {
						string = string + tempString + " ";
					} else {
						return;
					}
				}

				else {
					return;
				}
			}

			word.set(string);
			context.write(null, word);
		}
	}

	public void searchHBase(int numOfDays) throws IOException,
			InterruptedException, ClassNotFoundException {
		long startTime;
		long endTime;

		Configuration conf = HBaseConfiguration.create();
		conf.set("hbase.zookeeper.quorum", "node2,node3,node4");
		conf.set("fs.default.name", "hdfs://node1");
		conf.set("mapred.job.tracker", "node1:54311");
		/*
		 * 传递参数给map
		 */
		conf.set("search.license", "新C87310");
		conf.set("search.color", "10");
		conf.set("search.direction", "2");

		Job job = new Job(conf, "MRSearchHBase");
		System.out.println("search.license: " + conf.get("search.license"));
		job.setNumReduceTasks(0);
		job.setJarByClass(MRSearchAuto.class);
		Scan scan = new Scan();
		scan.addFamily(FAMILY_NAME);
		byte[] startRow = Bytes.toBytes("2011010100000");
		byte[] stopRow;
		switch (numOfDays) {
		case 1:
			stopRow = Bytes.toBytes("2011010200000");
			break;
		case 10:
			stopRow = Bytes.toBytes("2011011100000");
			break;
		case 30:
			stopRow = Bytes.toBytes("2011020100000");
			break;
		case 365:
			stopRow = Bytes.toBytes("2012010100000");
			break;
		default:
			stopRow = Bytes.toBytes("2011010101000");
		}
		// 设置开始和结束key
		scan.setStartRow(startRow);
		scan.setStopRow(stopRow);

		TableMapReduceUtil.initTableMapperJob(TABLE_NAME, scan,
				SearchMapper.class, ImmutableBytesWritable.class, Text.class,
				job);
		Path outPath = new Path("searchresult");
		HDFS_File file = new HDFS_File();
		file.DelFile(conf, outPath.getName(), true); // 若已存在，则先删除
		FileOutputFormat.setOutputPath(job, outPath);// 输出结果

		startTime = System.currentTimeMillis();
		job.waitForCompletion(true);
		endTime = System.currentTimeMillis();
		System.out.println("Time used: " + (endTime - startTime));
		System.out.println("startRow:" + Text.decode(startRow));
		System.out.println("stopRow: " + Text.decode(stopRow));
	}

	public static void main(String args[]) throws IOException,
			InterruptedException, ClassNotFoundException {
		MRSearchAuto mrSearchAuto = new MRSearchAuto();
		int numOfDays = 1;
		if (args.length == 1)
			numOfDays = Integer.valueOf(args[0]);
		System.out.println("Num of days: " + numOfDays);
		mrSearchAuto.searchHBase(numOfDays);
	}
}

开始时，我是在外面conf.set了传入的参数，而在mapper的init(Configuration)里get参数并赋给mapper对象。

将参数传给map运行时结果不对
for (int i = 0; i < 1; i++) {
    // /在此map里进行filter的功能
    tempString = Text.decode(value.getValue(FAMILY_NAME,
      QUALIFIER_NAME[i]));
    if (tempString.equals(/*strConditionStrings[i]*/"新C87310"))
     string = string + tempString + " ";
    else {
     return;
    }
   }
如果用下面的mapper的init获取conf传来的参数，然后在上面map函数里进行调用，结果便不对了。
直接指定值时和参数传过来相同的值时，其output的结果分别为1条和0条。
  private void init(Configuration conf) throws IOException,
    InterruptedException {
   strConditionStrings[0] = conf.get("search.licenseNumber").trim();
   strConditionStrings[1] = conf.get("search.carColor").trim();
   strConditionStrings[2] = conf.get("search.direction").trim();
  }
加了个日志写
private static final Log LOG = LogFactory.getLog(MRSearchAuto.class);
init()函数里：
LOG.info("license: " + strConditionStrings[0]);
map里
if (tempString.equals(/* strConditionStrings[i] */"新C87310")) {
  LOG.info("新C87310. conf: " + strConditionStrings[0]);
然后在网页 namenode:50030上看任务，最终定位到哪台机器执行了那个map，然后看日志
mapreduce.hbase.TestMRHBase: 新C87310. conf: null
在conf.set之后我也写了下，那时正常，但是在map里却是null了，而在map类的init函数打印的却没有打印。
因此，问题应该是：
map类的init()函数没有执行到！
于是init()的获取conf中参数值并赋给map里变量的操作便未执行，同时打印日志也未执行。
OK！看怎么解决
放在setup里获取
  protected void setup(Context context) throws IOException,
    InterruptedException {
  // strConditionStrings[0] = context.getConfiguration().get("search.license").trim();
  // strConditionStrings[1] = context.getConfiguration().get("search.color").trim();
  // strConditionStrings[2] = context.getConfiguration().get("search.direction").trim();
  }
报错
12/01/12 11:21:56 INFO mapred.JobClient: map 0% reduce 0%
12/01/12 11:22:03 INFO mapred.JobClient: Task Id : attempt_201201100941_0071_m_000000_0, Status : FAILED
java.lang.NullPointerException
at mapreduce.hbase.MRSearchAuto$SearchMapper.setup(MRSearchAuto.java:66)
at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:142)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:656)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:325)
at org.apache.hadoop.mapred.Child$4.run(Child.java:270)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1127)
at org.apache.hadoop.mapred.Child.main(Child.java:264)

attempt_201201100941_0071_m_000000_0: log4j:WARN No appenders could be found for logger (org.apache.hadoop.hdfs.DFSClient).
attempt_201201100941_0071_m_000000_0: log4j:WARN Please initialize the log4j system properly.
12/01/12 11:22:09 INFO mapred.JobClient: Task Id : attempt_201201100941_0071_m_000000_1, Status : FAILED
java.lang.NullPointerException
at mapreduce.hbase.MRSearchAuto$SearchMapper.setup(MRSearchAuto.java:66)
at org.apache.hadoop.mapreduce.Mapper.run(Mapper.java:142)
at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:656)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:325)
at org.apache.hadoop.mapred.Child$4.run(Child.java:270)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:396)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1127)
at org.apache.hadoop.mapred.Child.main(Child.java:264)
然后将setup里的东西注释掉，无错，错误应该在context上，进一步确认，在里面不用context，直接赋值，有结果，好！
说明是context的事了，NullPointerException,应该是context.getConfiguration().get("search.license")这些中有一个是null的。
突然想起来，改了下get时候的属性，而set时候没改，于是不对应，于是context.getConfiguration().get("search.color")及下面的一项都是null，null.trim()报的异常。
  conf.set("search.license", "新C87310");
  conf.set("search.color", "10");
  conf.set("search.direction", "2");
修改后，问题解决。
实现了向map中传参数

-------------------------------------------------------------------------------------------------------------------------------

原帖：http://blog.csdn.net/liuxingjiaofu/article/details/7197245

-------------------------------------------------------------------------------------------------------------------------------

HBase 命令行坠月川
hbase是一款分布式数据库.其对数据的索引只通过rowkey进行.在存储数据的时候,通过rowkey的排序进行存储.在面对一个新的数据库时,深究其原理并不知一个明智的选择,正如开车一般,大多数人都是先学会开车,然后在开车的过程中车子出故障了,再慢慢学着去修理.不管怎么说,第一步都是要先会使用.这篇文章主要为了整理hbase命令行的使用,留待以后用到时翻阅.读取数据因为一个数据库使用,通常最复杂的
27、web前端开发之CSS3（四）跟着汪老师学编程前端 css3 css
8.动画（Animations）CSS3引入了强大的动画（Animations）功能，使得网页开发者可以通过纯CSS实现复杂的动画效果，而无需依赖JavaScript。通过@keyframes规则，开发者可以定义多个关键帧点，从而创建平滑且灵活的动画序列。本节将详细讲解CSS3动画的基本使用、动画属性、实际应用场景及最佳实践。8.1.动画的基本概念CSS3动画允许开发者通过定义多个关键帧点（Key
22、web前端开发之html5（三）跟着汪老师学编程前端 html5
六.离线存储与缓存在网络环境不稳定或需要优化资源加载速度的场景下，离线存储与缓存技术显得尤为重要。HTML5引入了多种离线存储和缓存机制，帮助开发者提升用户体验。本节将详细介绍ApplicationCache、localStorage、sessionStorage以及IndexedDB等技术，帮助你理解如何在不同场景下选择合适的存储和缓存策略。1、ApplicationCacheApplicati
24、web前端开发之CSS3（一）跟着汪老师学编程前端 css3 css
CSS3详细讲义目录CSS3简介CSS3核心特性选择器盒模型背景与边框文本样式颜色与透明度过渡与动画变换弹性盒布局网格布局媒体查询多列布局字体与排版装饰与效果性能优化新特性与兼容性CSS3实践示例总结一、CSS3简介CSS3（CascadingStyleSheets,Level3）是CSS技术的最新版本，旨在通过引入新的功能和改进，提升Web开发的效率和网页的视觉效果。CSS3是模块化的，每个模块
【HTML+CSS】使用HTML与后端技术连接数据库 m0_74823264 面试学习路线阿里巴巴 html css 数据库
目录一、概述1.1HTML前端1.2后端技术1.3数据库二、HTML表单示例三、PHP后端示例3.1连接数据库3.2接收数据并插入数据库四、安全性4.1防止SQL注入4.2数据验证与清洗五、优化5.1索引优化5.2查询优化六、现代Web开发中的最佳实践6.1使用ORM（对象关系映射）6.2前后端分离6.3异步通信（AJAX/FetchAPI）七、结论在Web开发中，经常需要从前端（HTML/CSS
StableDiffusion模型推荐系列（全能型） Python程序员小泉 AI绘画 SD教程 stable diffusion 人工智能 AI作画 AI绘画 AIGC
今天，我们要聊一聊AI绘画领域里的一个超有趣的话题：为什么Midjourney能用一个5.2模型轻松驾驭各种风格，而StableDiffusion却需要我们切换无数个模型呢？在StableDiffusion的里，画一张图可能需要你在真人、二次元、2.5D等模型中做出选择。想要特定风格？那就得再加上lora模型。而为了更优化的效果，我们甚至还要动用ControlNet和VAE模型，这简直就像是无休止
Android多媒体框架：MediaPlayer的C/S架构与Binder机制实现 AI绘画百宝箱 android c语言架构
1.概述在Android中大量使用到了C/S架构来实现应用层和底层服务交互，而Binder机制无处不在。同样MediaPlayer也使用了这种机制，MediaPlayer在运行的时候，同样可以分为Client/Server两个部分，他们分别在不同的进程中，不同进程间的通信使用Binder机制，我们这里就以setDataSource()为例，讲解一下他们是如何建立关系的，架构图如下：（1）如果从功能
Milvus 在多模态数据（图像、文本、音频）向量搜索中的应用莫比乌斯之梦技术#Milvus milvus 音视频数据库向量数据库多模态数据
随着人工智能和深度学习的发展，多模态数据检索逐渐成为热门技术，广泛应用于图像搜索、语音识别、跨模态检索、推荐系统等领域。传统的基于关键词或规则的检索方式已经难以满足智能应用的需求，因此，基于向量搜索的近似最近邻（ANN）检索成为主流方案。Milvus作为一款开源的向量数据库，可以高效地存储和检索图像、文本、音频等多模态数据的向量表示。本文将介绍Milvus如何处理多模态数据的向量搜索，以及如何构建
剖析CSDN账号冻结操作，探寻平台治理与用户体验的共赢之道 junhui469 经验分享
在数字内容产业蓬勃发展的今天，CSDN作为技术知识分享与交流的关键平台，在连接技术爱好者与推动行业进步方面扮演着无可替代的角色。然而，其账号冻结操作引发的争议，促使我们深入剖析这一现象，探寻平台治理与用户体验的共赢路径。从平台治理的视角出发，CSDN实施账号冻结操作有着清晰的目标和必要性。随着平台用户数量的指数级增长，内容生态变得愈发复杂。恶意广告发布者企图利用平台的流量红利进行无底线的商业推广，
Oracle ORA-28001: the password has expired解决办法 idomyway Oracle oracle ora 28001 expired
前言Oracle提示错误消息ORA-28001:thepasswordhasexpired，是由于Oracle11G的新特性所致，Oracle11G创建用户时缺省密码过期限制是180天（即6个月），如果超过180天用户密码未做修改则该用户无法登录。解决方法1、修改方法ALTERUSER用户名IDENTIFIEDBY密码;修改密码后，会发现该账户会被锁定，这时需要通过如下SQL语句进行解锁：ALTE
思庄oracle技术分享-ORA-28001: the password has expired duanweifang oracle数据库 oracle 数据库
问题描述：trace文件中发现存在ora-28001告警，如下所示：数据库：oracle11.2.0.464位MonOct1704:26:022022Errorsinfiled:\app\administrator\diag\rdbms\orcl\orcl\trace\orcl_ora_1228.trc(incident=169673):ORA-00600:internalerrorcode,ar
ORA-28001: the password has expired解决办法飞奔的yah 数据库
登录数据库一、window登录oracle1）打开cmd,输入：sqlplus/nolog输入：connusername/passworld@数据库名称2）当然还有其他的方式：sql>conn/assyddba;即可登录oracle超级管理员用户（不需要用户和密码）。sql>connusername/password;通过输入用户名和密码的形式可以登录到普通用户。sql>connusername/
Python||JSON文件 VS. json模块一文读懂异与同 the_time_runner #小白学Python json模块 JSON编码格式 json.loads()json.dumps()
JSON(JavaScriptObjectNotation)是一种文件编码格式。python中json是一个模块(官方文档菜鸟教程),用于解析或编码JSON文件。importjson#将python格式编码成JSON数据格式json.dumps([1,2,3,{'4':5,'6':7}],separators=(',',':'))#'[1,2,3,{"4":5,"6":7}]'>>>将JSON数据
ES分布式搜索引擎 Lyqfor Java实习工作学习日记搜索引擎 elasticsearch 分布式 java JUC
ES分布式搜索引擎当我们要查找一个数据时，多个文本中的某个字段，可以遍历所有的文本然后查询，但是效率很低故可以使用倒排索引，先对每个文本进行分词，得到每个词项，然后记录每个词项在哪些文本中出现过，就得到了一个倒排索引，其中某一列是所有的词项字典，每个词项有一个PostingList保存该词项在哪些文本中出现过，记录文本ID因为以上的倒排索引是在磁盘中的，故每次查询时还要进行IO操作，且仍要遍历所有
HBase 进阶操作 Ssaty. hbase
第1关：HBase-shell命令任务描述使用HBaseshell命令创建表：exam_tb1，向表中添加数据，表的数据与结构如下：相关知识Hbaseshell操作create:创建表创建表t1，3个列族分别为f1、f2、f3，命令如下：hbase>create‘t1’,{NAME=>‘f1’},{NAME=>‘f2’},{NAME=>‘f3’}或使用如下等价命令hbase>create‘t1’,
【AIGC调研系列】AIGC+Jmeter实现接口自动化测试脚本生成 AGI学习社 AIGC jmeter transformer 大数据深度学习人工智能产品经理
AIGC（人工智能生成内容）结合JMeter实现接口自动化测试脚本生成的方法，主要涉及到通过流量收集工具和AIGC技术获取用户操作接口数据，并利用这些数据生成自动化测试脚本的过程。这种方法可以有效提高软件测试的效率和质量[1]。JMeter是一个开源的负载测试工具，能够模拟多种协议和应用程序的负载，包括HTTP、FTP、SMTP等[3][14]。它可以帮助快速构建测试用例，模拟多种场景，发现接口的
HBase RowKey设计原理与代码实例讲解 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
HBaseRowKey设计原理与代码实例讲解文章目录HBaseRowKey设计原理与代码实例讲解1.背景介绍1.1HBase简介1.2RowKey的重要性2.核心概念与联系2.1RowKey设计的核心思想2.2与HBase数据模型的联系3.核心算法原理具体操作步骤3.1生成递增序列RowKey3.2散列前缀RowKey3.3复合RowKey4.数学模型和公式详细讲解举例说明4.1MD5散列4.2M
react——渲染列表 JL-ll react.js 前端前端框架
背景：为什么需要渲染列表？在前端开发中，经常需要根据数据动态生成多个类似的UI元素（比如列表项、下拉选项、卡片等）。React提供了高效的方式来实现这一点，通过JavaScript的数组操作结合JSX，可以将数据转换为可渲染的组件或元素。代码分析1.数据准备javascriptconstproducts=[{title:'Cabbage',id:1},{title:'Garlic',id:2},{
一文读懂Python之json模块（33）跟着杰哥学Python json
一、json模块介绍json模块的功能是将序列化的json数据从文件里读取出来或者存入文件。json是一种轻量级的数据交换格式，在大部分语言中，它被理解为数组（array）。json模块序列化与反序列化的过程分别是encoding和decoding。encoding-把一个Python对象编码转换成Json字符串；decoding-把Json格式字符串解码转换成Python对象。json数据示例：
26、web前端开发之CSS3（三）跟着汪老师学编程前端 css3 css
5.文本（Text）CSS3大大增强了对文本样式和排版的控制，使得网页设计更加灵活和多样化。本讲详细介绍CSS3中常用的文本相关属性，包括文本对齐、字体大小、行高、字母间距、单词拆分、溢出隐藏等，帮助开发者更好地控制和优化网页中的文本显示效果。5.1.文本对齐（text-align）text-align属性用于控制块级元素（如div、p等）中的文本水平排列方式。通过合理使用text-align，可
100天玩转python——day37 3万字，关于SQL和MySQL的技术详解白话机器学习 100天玩转python语言 python sql mysql
SQL和MySQL详解SQL详解我们通常可以将SQL分为四类，分别是DDL（数据定义语言）、DML（数据操作语言）、DQL（数据查询语言）和DCL（数据控制语言）。DDL主要用于创建、删除、修改数据库中的对象，比如创建、删除和修改二维表，核心的关键字包括create、drop和alter；DML主要负责数据的插入、删除和更新，关键词包括insert、delete和update；DQL负责数据查询，
使用LVS的 NAT 模式实现 3 台RS的轮询访问 Sky---dog lvs 服务器运维
节点规划1、配置RSRS的网络配置为NAT模式，三台RS的网关配置为192.168.10.81.1配置RS11.1.1修改主机名和IP地址[root@localhost~]#hostnamectlhostnamers1[root@localhost~]#nmclicmodifyens160ipv4.methodmanualipv4.addresses192.168.10.7/24ipv4.gate
申报指南！2025年陕西省高新技术企业认定条件、流程、补贴详解卧涛西安17391873147 人工智能大数据制造科技
一、什么是高新技术企业？‌高新技术企业（简称“高企”）是指在国家重点支持的高新技术领域内，持续进行研发与技术成果转化，形成核心自主知识产权的企业。通过国家认定的高企可享受税收减免、资金补贴等政策红利，是提升企业创新能力和市场竞争力的“金字招牌”。‌陕西省政策定位‌：结合“秦创原”创新驱动平台建设，陕西省对高企培育给予重点支持，2025年将进一步优化申报流程，强化对科技型中小企业的扶持力度。‌二、2
Photoshop怎样保存为ico格式小魚資源大雜燴 windows
1.打开图像开启Photoshop软件，选择“文件”菜单，点击“打开”选项，然后找到你想要保存为ICO格式的图像文件并打开。2.调整图像大小（可选）ICO图标通常有特定尺寸要求，你可以根据需求调整图像大小。选择“图像”菜单，点击“图像大小”，在弹出窗口里修改宽度和高度，完成后点击“确定”。3.保存为ICO格式选择“文件”菜单，点击“存储为”。在“存储为”对话框中，从“格式”下拉菜单里选择“Wind
browserlist _miccretti python
2019独角兽企业重金招聘Python工程师标准>>>用来作啥？的Librarytosharesupportedbrowserslistbetweendifferentfront-endtools.ItisusedinAutoprefixer,Stylelint,eslint-plugin-compatandbabel-env-preset.信息来源：https://github.com/ai/b
Vala编成语言教程-构造函数和析构函数 __XYZ vala 教程开发语言 c#c语言 c++后端
构造函数Vala支持两种略有不同的构造方案：我们将重点讨论Java/C#风格的构造方案，另一种是GObject风格的构造方案。Vala不支持构造函数重载的原因与方法重载不被允许的原因相同，这意味着一个类不能有多个同名构造函数。但这并不构成问题，因为Vala支持命名构造函数。如果您需要提供多个构造函数，可以为它们添加不同的名称后缀：publicclassButton:Object{ publicB
Python学习——python的常用模块大全程序人韭菜花 Python自学 Python入门 Python常用模块 Python Python零基础
Python学习——python的常用模块模块：用一堆代码实现了某个功能的代码集合，模块是不带.py扩展的另外一个Python文件的文件名。最近开始整理python的资料，博主建立了一个qq群，希望给大家提供一个交流的同平台78486745（点击进群）。一、time&datetime模块1importtime2importdatetime34print(time.asctime())#返回时间格式
Windows server 2012 设置开机自动登陆并启动启动程序黄聪的笔记本 python
设置开机自动登陆1、按住Win键，再按R键(Win+R)，启动”运行”窗口;2、输入”netplwiz”或”controluserpasswords2″命令;3、在”用户帐户”-“用户”界面中，取消”要使用本机，用户必须输入用户名和密码”复选框;4、按”确定”按钮，在弹出的”自动登录”窗口中输入自动登录用的用户名和密码;5、将要自动打开程序快捷方式放C:\ProgramData\Microsoft
TCP/IP 协议族详细知识点清单翱翔-蓝天 tcp/ip 网络网络协议
TCP/IP协议族详细知识点清单一、概述与体系结构TCP/IP协议模型（四层模型）层次协议功能应用层HTTP、FTP、DNS、SMTP提供应用服务传输层TCP、UDP端到端传输，可靠或不可靠网络层IP、ICMP、ARP、RARP寻址、路由、错误控制数据链路层Ethernet、PPP、HDLC物理寻址、介质访问、帧传输二、应用层（ApplicationLayer）常用协议协议功能端口HTTP网页传输
npm: browserslist插件（webpack搭配.browserslistrc筛选符合要求的版本浏览器）小强有个dream webpack node webpack javascript 前端
官网文档链接BrowsersDataUpdating浏览器数据更新QueryComposition查询组合Browsers现存的浏览器ConfigFile配置文件ShareableConfigs可以共享的配置ConfiguringforDifferentEnvironments针对不同环境进行配置CustomUsageData自定义使用数据JSAPIEnvironmentVariables环境变量
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

[JAVA][DB]用MR(MapReduce)查询hbase数据(Mapper参数传递)－用到TableMapper和Scan

你可能感兴趣的:([JAVA][DB]用MR(MapReduce)查询hbase数据(Mapper参数传递)－用到TableMapper和Scan)