iteye_11790

通向架构师的道路（第二十七天）IBM网格计算与企业批处理任务架构

一、批处理

我们在一些项目中如：银行、保险、零商业门店系统中的对帐、结帐、核算、日结等操作中经常会碰到一些"批处理“作业。

这些批处理经常会涉及到一些大数据处理，同时处理一批增、删、改、查等SQL，往往涉及到好几张表，这边取点数据那边写点数据，运行一些存储过程等。

批处理往往耗时、耗资源，往往还会用到多线程去设计程序代码，有时处理不好还会碰到内存泄漏、溢出、不够、CPU占用高达99%，服务器被严重堵塞等现象。

笔者曾经经历过一个批处理的3次优化，该批处理笔者按照数据库连接池的原理实现了一个线程池，使得线程数可以动态设定，不用的线程还可还回线程池，其过程经历了加入cache等操作，最后连负载截均衡都想到了。

最终虽然取得了较满意的结果，但是当中不断的优化程序、算法上耗时彼多，尤其是想到了负截匀衡。大家知道，一个web或者是一个app容器当达到极限时可以通过加入集群以及增加节点的手段来提高总体的处理能力，但是这个批处理往往是一个应用程序，要把应用程序做成集群通过增加节点的方式来提高处理能力可不是一件简单的事，对吧？

当然我不是说不能实现，硬代码通过SOCKET通讯利用MQ机制加数据库队列是一种比较通用的设计手段，可以做到应用程序在处理大数据大事务时的集群这样的能力。

但是对于一些较大型的商业客户尤其是银行、保险、大型零售行业或者是电信等客户，他们都是有成品套件的，你自己设计的具有集群能力的批处理固然有成就感，但是从另外一个方面来说，从稳定性、可用性、维护性来说相信同类的现成的成熟商业用品一定要超过你自己编写的批处理程序吧?

因为我这套架构师的道路走的是企业级架构师路线，因此也不得不经常提到一些商业级解决方案，对于自己设计这个具有集群扩展能力的批处理我会放到以后去讲，今天主要讲的就是使用商业成品来完成你的批处理的集成。

二、商业级解决方案

来看一个批处理的需求：

1.能够做批处理

2. 能够通过增加节点来提高批处理的能力，相当于集群

3. 具有错误重跑的能力

4. 断点处理能力，比如说5000批次作业，我跑了2000批后失败了，这时后面3000批在我做了一些调整后会接着前面的2000批继续跑下去

5. 完善的日志、监督、暂停（挂起）、定时（嘿嘿，这个夸张）跑批处理的能力

我们先用传统的自己手工来做批处理的设计思想来考虑这个需求，至少要用到下面几个技术：

1. 我们得写个线程池，就和我上面提到过的自己按照jdbc connection pool的原理去写这个线程池，快手的话2周至少要得吧，对吧？

2. 集成JMS或者是MQ机制，使得该程序具有节点间通讯能力这样就能做到负载均衡了。

3. 将任务做任务记录持久化到数据库，这样可以做到错误记录、断点、重跑等功能

4. 得要用Quartz类似的组件来实现这个”定时，定期跑批”的功能吧

好了，上述这些需求就够你做一个工程了，不是吗？

我现在告诉你，这个批处理的需求是一个最低层次的商业级批处理作业的需求，如果用我以前工程上涉及到的完整需求，这可写上10几页（仅需求部分）。

大家知道在做大型客户如：银行、保险等项目时，这些客户是怎么考虑的吗?

首先，你如果告诉他你需要1个月左右来做这个批处理（包含测试，这个已经是非常快的速度了），它会告诉你它只给你1周或者2周时间（最多了）。

因为客户认为，批处理无非就是输入->处理->输出就完了，怎么处理的，有这么复杂吗，嘿嘿，客户一般认为它的需求都是很简单的，开发商往往都是喜欢多要时间这样可以多算人力成本。

但是看官们请注意，客户这些考虑也是没有错的，是的，批处理从大的方面来说就是read->handle->write是这样的，至于read数据库+read文件再+read socket对于客户来说，它就认为只有一个read，这其中的苦处啊，只有我们程序员自己知道。

现在好了，目前已经有成熟的商业成品套件来实现上面所有的这些需求了，它让程序员只需要关注：

how to read
how to handle(your own logic)
how to write

就行了，至于其它的事，它来帮你做。

开源的有spring batch，不过spring batch走的是云计算道路，商业产品中比较有名的就是这个IBM Websphere Compute Grid。

三、IBM Websphere Compute Grid介绍

3.1 基本概念

这边是compute而不是computer啊，不要搞错了。

这个IBM Websphere Compute Grid简称WAS XD CG，是属于IBM Websphere套件中的附属品，它是架构在WASND的基础上来实现批处理作业的.

它利用WASND的功能，因为IBM的WASND是支持网格规划的，WASND不仅可以把单个节点与节点间进行联合，甚至可以把几个联结起来的节点-称为cell（单元），cell与cell之间再进行联合。

而IBM Compute Grid就是架构在这样的基础之上，对于提高批处理的能力来说无非就是再布署一个基于WASND的节点或者是WASND的单元。

所以这边有一个概念需要注意啦，它是基于WASND的。

而IBM Compute Grid的安装也与相对应的WASND的版本必须绝对的对应的，哪怕两者间的小版本号有差异都不能安装，下面是经本人测试了各个WAS与IBM Compute Grid后得出的一个IBM Compute Grid与WAS产品的版本对应关系：

当然，如果你手上比较含酸，没有WASND只有WAS也可以用WAS来安装IBM Compute Grid，但是版本一定要按照我的这个对照表去下载IBM Compute Grid啊。

3.2 IBM Compute Grid的运作原理

挺复杂一张图，没什么难看懂的，抓关键。

它的运作原理就是作业流程自定义，相当于一个批处理作业写完后，它有先后的执行步骤，a, b, c, d，我现在的执行步骤是a->b->c->d，但下次我的执行顺序是：a->c->d->b，对吧。
这个作业步骤或者我们说流程是可以自定义的，你不要和我说你因为作业步骤的执行顺序变了你去改你的代码改你的if else哦，这个就是传统的思维了。

商业的吗，它讲究的就是一个：

业务快速实现、业务直接可由业务人员制定、业务直接转换成IT资产并且快速推向市场、垂直的业务解决方案能力

请牢牢记住上面这一长溜红色加粗的方案，它是你作为一个企业级架构师将来奋斗的目标，死写代码是没有用的，理念同样重要。
并行的作业处理能力，就是我说的具有通过增加一个节点就可以提高你的作业处理能力的功能。
它的作业流程的制定其实和制定我们的webservice一样，是一个描述性文档，将这个描述性文档（通常是一个xml文件）即我们的作业描述上传到IBM Compute Grid作业中心后，即可实现定时啦、重跑啦、断点续跑啦等等等等功能。
批处理作业也作为了“企业IT资产”的一部分-IT ASSET，在WAS中我们的IT ASSET典型的为一个.ear布署包，即你的批处理啊，以后我们的批处理就是是一个.ear的包，要布署到WAS中去的。

喏，下面这张是IBM Compute Grid的部件图

此处的xJCL就是一个XML格式的作业描述文件，它是以EJB形式并且以.ear包布署入WAS的。

它不是类似于web service吗，web service的入口被称为end point对吧？它也有end point，它叫grid end point即GEE。

GEE通过PJM即Parallel Job Manager并行作业管理器来协调和实现集群的，这一切都是布署在WAS上的。

下面这张是IBM Compute Grid的作业逻辑流程图

四、IBM Compute Grid的安装、开发与布署

4.1 安装IBM Compute Grid

在这个例子里我们使用WAS7.x+IBM Compute Grid6.1.x来做，都可以在IBM的官网上下载到Trial Version，当然你也可以使用WASND8.0 trial version与IBM Compute Gridv8.0来做测试。

这边我们需要安装三样东西：

IBM WAS7.0
IBM Computev6114
IBM Compute Grid的开发框架，该框架使用ANT可帮助你通过ANT STEP1, ANT STEP2, ANT STEP3这样一步步实现你的xJCL文件，生成EAR，自动布署，简化你的开发，使得程序开发人员只要专注于写它们的reader, handler, writer就行了。

4.1.1 安装WAS

安装完WAS后不要忘了建一个profile。

然后把我们的WAS打一下补丁，打补丁前不要忘了先装IBM WAS 7.0.0.23 Updater

装完后在开始菜单选择这个选项来把WAS7.X的最新补丁（IBM官网去下）打上：

打完补丁后就可以安装IBM Compute Grid了.

4.2 安装IBM Compute Grid

去官网下载这个包：

安装时它会自动认出你在WAS中建立的profile，一般WAS的profile都是带有一个AppServer的对吧？喏，它会自动认出

在下面这一步请先把这个自动认出的WAS中的profile里的AppServer的自动勾选改成“不勾选”，即我们不需要在Compute Grid安装时自动augment(扩展）我们的节点：

下一步下一步直到开始安装

安装结束后不要勾选“start my first step to validation”这一选项，把这个选项取掉后可以直接点“finish"按钮。

装完后把IBM Compute Gridv6114升级到6115，也用我们的IBM WAS Updater来安装，你要在官网先下载这个补丁：

点下一步

然后把刚才下载的IBM Compute Grid 6115补丁（一个.pak文件）选入进updater manager后进行打补丁的操作

上面步骤全部执行完毕后，在开始菜单选择IBM WAS的菜单，在菜单中选择下面这一项：

弹出下面这个界面

点“launch profile management tool”这个按钮

选择你要扩展的profile中的AppServer后点“Augment”按钮，然后下一步

下一步

最后点"Augment"开始在我们的IBM WAS的profile中安装IBM Compute Grid组件

最后到了这个界面，按照我界面的选项，不要勾选任何选项，然后点“finish”完成安装

安装完后启动你的WAS服务，然后输入： http://localhost:9060/ibm/console。

这时你可以看到你的WAS中除了原有的你建立的profile外，还会多出一项：

再输入： http://localhost:9080/jmc

可以进入IBM Compute Grid的job management console

这就代表了我们的IBM Compute Grid已经正确的安装在了我们的WAS中了。

4.2 开发我们的第一个基于IBM Compute Grid的批处理程序

这个程序很简单：

读一个文件文件，几十万行。
进行简单的整理程序，即把读入的文本文件中的列按照数据库内的表结构整理成一个java bean，java bean中每个字段对应着数据库表中的每一个字段。
将读入的几十万行写入我们的数据库中去。

下面是我们的批处理的流程，够简单吧。

4.2.1 下载IBM Compute Grid开发框架IBM Compute Grid Batch Development Frameworkv.6.1.1.1.1

你可以通过官网下载，下载网址如下：

http://www.ibm.com/developerworks/forums/thread.jspa?threadID=228339&tstart=0

我回头也会上传到我的博客的资源中去.

这是一个eclipse工程，可以直接导入eclipse的workspace中去。

我们要读入的文本文件放在data目录，里面有一个input.txt文件，内容如下：

Date,Open,High,Low,Close,Volume,Adj Close
2008-02-19,106.94,107.62,104.64,105.00,7376400,105.00
2008-02-15,105.27,106.25,105.00,106.16,6235600,106.16
2008-02-14,107.94,108.50,105.50,106.13,7340600,106.13
2008-02-13,107.13,108.93,106.80,108.42,6608200,108.42
2008-02-12,105.16,107.33,104.70,106.53,7650200,106.53
2008-02-11,103.05,105.55,102.87,105.14,6098300,105.14
2008-02-08,102.19,103.67,102.07,103.27,6085600,103.27
2008-02-07,102.89,104.00,100.60,102.34,11255800,102.34
2008-02-06,105.05,106.49,103.58,103.59,8265700,103.59
2008-02-05,107.06,108.05,104.68,105.02,9048900,104.62
2008-02-04,108.67,109.00,107.23,107.93,5985500,107.52
2008-02-01,107.16,109.40,105.86,109.08,8047100,108.66
2008-01-31,104.21,107.97,103.70,107.11,9054600,106.70
2008-01-30,105.85,107.65,104.86,105.65,7431100,105.25
2008-01-29,105.50,106.80,104.60,106.10,6616200,105.70
2008-01-28,104.44,105.77,103.83,104.98,7858500,104.58

我差不多定义了60万行吧。

在这边我使用的是mysql数据库，因此我把mysql相关的jdbc jar放入到了工程的lib目录中去了

接下去我要修改props.simulator文件夹中的Echo.props文件

# (C) Copyright IBM Corp. 2008 - All Rights Reserved.
# DISCLAIMER:
# The following source code is sample code created by IBM Corporation.
# This sample code is provided to you solely for the purpose of assisting you
# in the  use of  the product. The code is provided 'AS IS', without warranty or
# condition of any kind. IBM shall not be liable for any damages arising out of your
# use of the sample code, even if IBM has been advised of the possibility of
# such damages.

job-name=Echo
application-name=Echo
 
#The following property references the WebSphere XD Compute Grid provided batch controller EJB
#when run in the batch simulator, this actually specifies a pojo wrapper class to the batch step.
#When you deploy this to a batch container running within an application server, this JNDI name
#has to be updated to reference the controller EJB for this step (which is generated for you by 
#the batch packager). 

controller-jndi-name=ejb/com/ibm/ws/batch/EchoBatchController

##################################################################
# The utilityjars property specifies libraries required by 
# this job.  
#
# NOTE: this property is used only by the WSBatchPackager utility,
#       which is used to create an ear file for deploying this
#       batch application. 
#

utilityjars=../lib/batchframework.jar;../lib/ibmjzos-1.4.jar

checkpoint-algorithm=com.ibm.wsspi.batch.checkpointalgorithms.RecordbasedBase
checkpoint-algorithm-prop.recordcount=1000

#Input Stream declarations
bds.inputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.FileByteReader
bds-prop.inputStream.PATTERN_IMPL_CLASS=com.ibm.batch.streams.inputstreams.EchoReader
bds-prop.inputStream.FILENAME=${echo.data}/input.txt


bds-prop.inputStream.debug=false
bds-prop.inputStream.EnablePerformanceMeasurement=false
bds-prop.inputStream.EnableDetailedPerformanceMeasurement=false

#data transformation declarations

batch_bean-name=IVTStep1
batch-bean-jndi-name=ejb/GenericXDBatchStep
batch-step-class=com.ibm.websphere.batch.devframework.steps.technologyadapters.GenericXDBatchStep

#batch-bean-jndi-name=ejb/com.ibm.websphere.batch.devframework.steps.technologyadapters.GenericXDBatchStep

prop.BATCHRECORDPROCESSOR=com.ibm.batch.steps.Echo
prop.debug=false
prop.EnablePerformanceMeasurement=false
prop.EnableDetailedPerformanceMeasurement=false

#Output stream declarations
#bds.outputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.FileByteWriter
bds.outputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.LocalJDBCWriter
bds-prop.outputStream.PATTERN_IMPL_CLASS=com.ibm.batch.streams.outputstreams.EchoWriter
#oracle
#bds-prop.outputStream.jdbc_url=jdbc:oracle:thin:@localhost:1521:ymkorcl
#bds-prop.outputStream.jdbc_driver=oracle.jdbc.OracleDriver
#bds-prop.outputStream.userid=ymk
#bds-prop.outputStream.pswd=password_1

bds-prop.outputStream.jdbc_url=jdbc:mysql://localhost:3306/eltdb?useUnicode=true&characterEncoding=utf8
bds-prop.outputStream.jdbc_driver=com.mysql.jdbc.Driver
bds-prop.outputStream.userid=elt
bds-prop.outputStream.pswd=password_1

bds-prop.outputStream.tablename=t_grid_output_test
bds-prop.outputStream.FILENAME=${echo.data}/output.txt
bds-prop.outputStream.AppendJobIdToFileName=false
bds-prop.outputStream.EnablePerformanceMeasurement=false
bds-prop.outputStream.EnableDetailedPerformanceMeasurement=false
bds-prop.outputStream.debug=false

注意这几句：

bds.outputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.LocalJDBCWriter
bds-prop.outputStream.PATTERN_IMPL_CLASS=com.ibm.batch.streams.outputstreams.EchoWriter

bds-prop.outputStream.jdbc_url=jdbc:mysql://localhost:3306/eltdb?useUnicode=true&characterEncoding=utf8
bds-prop.outputStream.jdbc_driver=com.mysql.jdbc.Driver

bds-prop.outputStream.userid=myuserid
bds-prop.outputStream.pswd=password_1

通过这个properties文件我们可以得知我们的程序主要由3个类组成,它们分别是：

com.ibm.batch.streams.inputstreams.EchoReader
com.ibm.batch.streams.outputstreams.EchoWriter
com.ibm.batch.steps.Echo

这三个类的调用是离散的，只是通过Echo.props文件中的描述：

第一步：读入数据

#Input Stream declarations
bds.inputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.FileByteReader
bds-prop.inputStream.PATTERN_IMPL_CLASS=com.ibm.batch.streams.inputstreams.EchoReader
bds-prop.inputStream.FILENAME=${echo.data}/input.txt

bds-prop.inputStream.debug=false
bds-prop.inputStream.EnablePerformanceMeasurement=false
bds-prop.inputStream.EnableDetailedPerformanceMeasurement=false

#data transformation declarations

batch_bean-name=IVTStep1
batch-bean-jndi-name=ejb/GenericXDBatchStep
batch-step-class=com.ibm.websphere.batch.devframework.steps.technologyadapters.GenericXDBatchStep

#batch-bean-jndi-name=ejb/com.ibm.websphere.batch.devframework.steps.technologyadapters.GenericXDBatchStep

第二步：处理数据
prop.BATCHRECORDPROCESSOR=com.ibm.batch.steps.Echo
prop.debug=false
prop.EnablePerformanceMeasurement=false
prop.EnableDetailedPerformanceMeasurement=false

第三步：写数据
#Output stream declarations
#bds.outputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.FileByteWriter
bds.outputStream=com.ibm.websphere.batch.devframework.datastreams.patterns.LocalJDBCWriter
bds-prop.outputStream.PATTERN_IMPL_CLASS=com.ibm.batch.streams.outputstreams.EchoWriter

来定义的，读者可以根据这个规划自己定义自己的Step即工作步骤，并且在properties里任意调整各个步骤的顺序

下面给出

com.ibm.batch.streams.inputstreams.EchoReader
com.ibm.batch.streams.outputstreams.EchoWriter
com.ibm.batch.steps.Echo

这三个类的源码：

com.ibm.batch.streams.inputstreams.EchoReader

public class EchoReader implements FileReaderPattern, JDBCReaderPattern,
		ByteReaderPattern, RecordOrientedDatasetReaderPattern {

	protected BDSFWLogger logger;
	protected EchoDataHolder echoDataHolder;

	// Properties for reading from a JDBC input source
	protected String tableNameKey = "tablename";
	protected String tableName = "ALG.TIVPWXD0";
	protected String echoQuery = "select * from ";

	// Properties for reading bytes from a Byte or Dataset input source
	protected String RecordLengthKey = "EchoReader_record_length";
	protected String defaultRecordLength = "80";
	protected int recordLength;
	protected byte[] buf;

	/**
	 * Initialize method is driven upon object creation. The properties object
	 * passed in contains the properties specified for the input stream in the
	 * xJCL.
	 */
	public void initialize(Properties props) {

		logger = new BDSFWLogger(props);

		if (logger.isDebugEnabled())
			logger.debug("entering EchoReader.initialize()");

		// initialize any JDBC properties that have been defined
		tableName = props.getProperty(this.tableNameKey, tableName);
		echoQuery += tableName;
		// -----------------------------------------------------

		// initialize any byte reader properties that have been defined.
		recordLength = Integer.valueOf(
				props.getProperty(RecordLengthKey, defaultRecordLength))
				.intValue();
		buf = new byte[recordLength];
		// -----------------------------------------------------

		if (logger.isDebugEnabled())
			logger.debug("exiting EchoReader.initialize()");
	}

	// The fetchHeader method exposes any header data that has been parsed for
	// this input stream.
	public Object fetchHeader() {
		// no header data to expose.
		return null;
	}

	// File read methods - FileReaderPattern implementation

	// the processHeader method's task is to parse the data in the buffered
	// reader and extract any header information that could be used for this
	// stream.
	// the java io methods of mark() and reset() should be used here to ensure
	// that the BufferedReader, upon completion of parsing the header data, is
	// positioned
	// at the start of the first data record to be processed.

	public void processHeader(BufferedReader arg0) throws IOException {
		// n/a for this example.
	}

	// the task of the fetchRecord() method is to parse the raw data and map it
	// to the domain object. The java io methods of mark() and reset() should be
	// used
	// to ensure the buffered reader, upon completion of obtaining the record,
	// is at the starting position of the next data record to be processed.

	public Object fetchRecord(BufferedReader reader) throws IOException {
		String line = reader.readLine();
		if (line != null) {
			if (logger.isDebugEnabled())
				logger.debug("EchoReader.fetchRecord(bufferedReader)- line= "
						+ line);
			return new EchoDataHolder(line);
		} else {
			if (logger.isDebugEnabled())
				logger.debug("EchoReader.fetchRecord(bufferedReader)- returning null");
			return null;
		}
	}

	// -----------------------------------------------------

	// JDBC read methods - JDBCReaderPattern implementation

	// the task for getInitialLookupQuery is to return the SQL query to be
	// executed the first time this job is every invoked. Note, a seperate
	// method is used
	// for obtaining the query that should be executed if the job is restarted.
	// For example: select * from table 1;
	public String getInitialLookupQuery() {
		return echoQuery;
	}

	// the task for the getRestartQuery method is to create the SQL string that
	// should be executed if the job is restarted. The String parameter to the
	// method
	// contains the data returned in getRestartTokens(). This data was persisted
	// by the Batch container on behalf of this stream during a checkpoint.
	// Upon restart, that data should be used to determine where to reposition
	// the stream to (for example, as arguments for a WHERE clause in your SQL
	// query).
	// for example, select * from table1 where recordName is between B and Z
	public String getRestartQuery(String arg0) {
		// TODO Auto-generated method stub
		return null;
	}

	// the task for the getRestartTokens() method is to return any data that
	// should be stored during a checkpoint for this stream. The data stored
	// would be used
	// to reposition the tream upon restart of the job. Think of this as
	// returning data that you would need to populate the WHERE clause of an SQL
	// query.
	// For example, select * from table1 where recordName is between B and Z
	public String getRestartTokens() {
		// restart logic for echo JDBC reader is not implemented.
		return null;
	}

	// This method maps the columns of a database row to a hashmap.
	// The hashmap can get be queried by the record processor for fields, where
	// key = column name, value = column value.

	public Object fetchRecord(ResultSet resultSet) {

		if (logger.isDebugEnabled())
			logger.debug("entering EchoReader.fetchRecord(resultSet)");

		try {
			ResultSetMetaData rsmd = resultSet.getMetaData();
			int columnCount = rsmd.getColumnCount();

			HashMap dbMap = new HashMap();
			for (int i = 1; i <= columnCount; i++) {
				String columnName = rsmd.getColumnName(i);
				Object columnValue = resultSet.getObject(i);
				dbMap.put(columnName, columnValue);
			}

			if (logger.isDebugEnabled()) {
				logger.debug("EchoReader.fetchRecord(resultSet)- dbmap = "
						+ dbMap);
				logger.debug("exiting EchoReader.fetchRecord(resultSet)");
			}

			if (dbMap.size() == 0)
				return null;
			else
				return new EchoDataHolder(dbMap);

		} catch (Throwable t) {
			throw new RuntimeException(t);
		}
	}

	// -----------------------------------------------------

	// Byte read methods - ByteReaderPattern implementation

	// the processHeader method's task is to parse the data in the
	// bufferedInputStream reader and extract any header information that could
	// be used for this stream.
	// the java io methods of mark() and reset() should be used here to ensure
	// that the bufferedInputStream, upon completion of parsing the header data,
	// is positioned
	// at the start of the first data record to be processed.
	public void processHeader(BufferedInputStream arg0) throws IOException {
		// n/a for this example
	}

	// the task of the fetchRecord() method is to parse the raw data and map it
	// to the domain object. The java io methods of mark() and reset() should be
	// used
	// to ensure the buffered reader, upon completion of obtaining the record,
	// is at the starting position of the next data record to be processed.
	public Object fetchRecord(BufferedInputStream reader) throws IOException {

		buf = new byte[recordLength];
		int nread = reader.read(buf);

		if (logger.isDebugEnabled())
			logger.debug("fetchRecord(bufferedInputStream)\nbuf: " + buf
					+ "\nnread=" + nread);

		if (nread > 0) {
			String inputStr = (new String(buf, "utf-8")).trim();
			// return new EchoDataHolder(buf, nread);
			return new EchoDataBean(inputStr);
		} else {
			return null;
		}
	}

	// -----------------------------------------------------

	// MVS Dataset read methods - RecordOrientedDatasetReaderPattern
	// implementation

	// the processHeader method's task is to parse the data in the
	// bufferedInputStream reader and extract any header information that could
	// be used for this stream.
	// the java io methods of mark() and reset() should be used here to ensure
	// that the bufferedInputStream, upon completion of parsing the header data,
	// is positioned
	// at the start of the first data record to be processed.
	public void processHeader(ZFile arg0) throws IOException {
		// n/a for this example
	}

	// the task of the fetchRecord() method is to parse the raw data and map it
	// to the domain object. The io methods of mark() and reset() should be used
	// to ensure the buffered reader, upon completion of obtaining the record,
	// is at the starting position of the next data record to be processed.
	public Object fetchRecord(ZFile reader) throws IOException {
		System.out.println("========>read record ZFile reader");
		byte[] buf = new byte[reader.getLrecl()];
		int nread = reader.read(buf);

		if (logger.isDebugEnabled())
			logger.debug("fetchRecord(zfile)\nbuf: " + buf + "\nnread=" + nread);

		if (nread > 0) {
			if (logger.isDebugEnabled())
				logger.debug("nread is > 0, returning object");
			return new EchoDataHolder(buf, nread);
		} else {
			if (logger.isDebugEnabled())
				logger.debug("nread is < 0, returning null");
			return null;
		}
	}

	// -----------------------------------------------------
}

com.ibm.batch.streams.outputstreams.EchoWriter

public class EchoWriter implements FileWriterPattern, ByteWriterPattern,
		JDBCWriterPattern, RecordOrientedDatasetWriterPattern {

	protected BDSFWLogger logger;
	protected EchoDataHolder echoDataHolder;
	protected String jobid;
	protected String jobIdKey = "JobStepId";
	protected int counter = 0;

	// Properties for writing to a JDBC output source
	protected String tableNameKey = "tablename";
	protected String tableName = "t_grid_output_test";
    protected String sqlQueryPreTablename = "insert into ";
    
    /* oracle insert sql*/
	//protected String tableValues = "(pk_id, my_date, open,high,low,close,volume,adj_close)";
	//protected String sqlQueryPostTablename = " values (seq_test_output_id.nextval, ?, ?, ?, ?, ?, ?,?)";
	
	/* mysql insert sql*/
	protected String tableValues = "(my_date, open,high,low,close,volume,adj_close)";
	protected String sqlQueryPostTablename = " values (?, ?, ?, ?, ?, ?,?)";

	public void initialize(Properties props) {
		logger = new BDSFWLogger(props);
		jobid = props.get(this.jobIdKey).toString();

		if (logger.isDebugEnabled())
			logger.debug("EchoWriter.initialize()");

		// initialize any JDBC properties that have been defined
		tableName = props.getProperty(this.tableNameKey, tableName);
	}

	// -----------------------------------------------

	// File write methods - FileWriterPattern implementation

	// the task for the writeHeader(bufferedWriter) method is to write any
	// header data to the output stream prior to writing the output data
	// records.
	// This method is only called once, which is upon initialization of the
	// first execution of this job. This means the header will not be written
	// again
	// if the job is restarted.
	public void writeHeader(BufferedWriter arg0) throws IOException {
		// n/a, no header data to write.
	}

	// the task for the writeHeader(bufferedWriter) method is to write the
	// header object passed to this stream
	// to the output stream prior to writing the output data records.
	// This method is only called once, which is upon initialization of the
	// first execution of this job. This means the header will not be written
	// again
	// if the job is restarted.
	public void writeHeader(BufferedWriter arg0, Object arg1)
			throws IOException {
	}

	// the task for the writeRecord method is to write the processed domain
	// object to the output stream.
	public void writeRecord(BufferedWriter out, Object record)
			throws IOException {
		if (counter != 0) {
			out.newLine();
		}
		counter++;
		if (logger.isDebugEnabled())
			logger.debug("EchoWriter.writeRecord(BufferedWriter)- record= "
					+ record);

		out.write(record.toString());
	}

	// ------------------------------------------------------

	// byte writing methods - ByteWriterPattern implementation

	// The task for the writeHeader(bufferedOutputStream) method is to write any
	// header data to the output stream prior to writing the output data bytes.
	// This method is only called once, which is upon initialization of the
	// first execution of this job. This means the header will not be written
	// again
	// if the job is restarted.
	public void writeHeader(BufferedOutputStream arg0) throws IOException {
		// n/a, no header data to write.

	}

	// the task for the writeRecord method is to write the processed domain
	// object to the output stream.
	public void writeHeader(BufferedOutputStream arg0, Object arg1)
			throws IOException {
	}

	// the task for the writeRecord method is to write the processed domain
	// object to the output stream.
	public void writeRecord(BufferedOutputStream out, Object record)
			throws IOException {

		EchoDataHolder holder = ((EchoDataHolder) record);

		if (logger.isDebugEnabled())
			logger.debug("writeRecord(bufferedOutputStream)\nbuf: " + holder
					+ "\nnread=" + holder.nread);

		out.write(holder.getByteData(), 0, holder.nread);
	}

	// ------------------------------------------------------

	// JDBC writing methods - JDBCWriterPattern implementation

	// the task for the getSQLQuery method is to return an SQL string that is
	// will be used to store this domain object in the database.
	public String getSQLQuery() {

		String sqlQuery = sqlQueryPreTablename + tableName + tableValues
				+ sqlQueryPostTablename;
		// System.out.println("sqlQuery====" + sqlQuery);
		return sqlQuery;
	}

	// the task for thie writeRecord(pstmt, record) method is to map the domain
	// object to the prepared statement. The bds framework then manages
	// executing that
	// that prepared statement for you (because then we can do things like JDBC
	// batching).
	public PreparedStatement writeRecord(PreparedStatement pstmt, Object record) {
		try {
			if (logger.isDebugEnabled()) {
				logger.debug("EchoWriter.writeRecord(PreparedStatement)- record= "
						+ record);
			}
			EchoDataBean echoData = (EchoDataBean) record;
//			System.out.println("mydate===" + echoData.getMyDate() + "  open==="
//					+ echoData.getOpen());
			pstmt.setDate(1, StringUtil.convertStrToDate(echoData.getMyDate()));
			pstmt.setDouble(2, echoData.getOpen());
			pstmt.setDouble(3, echoData.getHigh());
			pstmt.setDouble(4, echoData.getLow());
			pstmt.setDouble(5, echoData.getClose());
			pstmt.setDouble(6, echoData.getVolume());
			pstmt.setDouble(7, echoData.getAdjClose());
			counter++;
		} catch (Throwable t) {
			throw new RuntimeException(t);
		}
		return pstmt;
	}

	// -------------------------------------------------------

	// writing bytes to a fixed-block MVS dataset -
	// RecordOrientedDatasetWriterPattern implementation

	// The task for the writeHeader(ZFile) method is to write any header data to
	// the output stream prior to writing the output data bytes.
	// This method is only called once, which is upon initialization of the
	// first execution of this job. This means the header will not be written
	// again
	// if the job is restarted.
	public void writeHeader(ZFile arg0) throws IOException {
		// n/a, no header data to write.
	}

	// the task for the writeRecord method is to write the processed domain
	// object to the output stream.
	public void writeHeader(ZFile arg0, Object arg1) {
		// no header data to write.
	}

	// the task for the writeRecord method is to write the processed domain
	// object to the output stream.
	public void writeRecord(ZFile out, Object record) throws IOException {

		EchoDataHolder holder = ((EchoDataHolder) record);

		if (logger.isDebugEnabled())
			logger.debug("writeRecord(zFile)\nbuf: " + holder + "\nnread="
					+ holder.nread);

		out.write(holder.getByteData(), 0, holder.nread);
	}
}

com.ibm.batch.steps.Echo

public class Echo implements BatchRecordProcessor {
	
	protected BDSFWLogger logger;
	Integer time= 0;
	Integer count= 0;

	// this method is called once by GenericXDBatchStep.initializeJobStep()
	public void initialize(Properties arg0) {
		
		logger = new BDSFWLogger(arg0);
		if (logger.isDebugEnabled())
			logger.debug("initialize.");
		

	}

	// this method is called repeatedly by GenericXDBatchStep.processJobStep()
	public Object processRecord(Object domainObject) throws Exception {
		
		if (logger.isDebugEnabled())
			logger.debug("processing record: " + domainObject);
		
		// Since this is an echo step, just return the domain object that was passed in.
		return domainObject;
	}
	
	// this method is called once by GenericXDBatchStep.destroyJobStep()
	public int completeProcessing() {
	     try {
	       }
	     catch(Exception e) {
	       e.printStackTrace();
	       }
		if (logger.isDebugEnabled())
			logger.debug("completed processing.");		
		return 0;
	}
}

4.3 布署批处理作业至IBM WAS Compute Grid

4.3.1 布署前的程序调试

一般我们找到我们的"handler“，然后在eclipse里使用右键run as->把main class填成：com.ibm.websphere.batch.BatchSimulator来进行测试。

4.3.2 生成布署包

一切在eclipse中调试通过后我们就可以开始生成我们的布署包了。

第一步：WAS设置

定位到script.ant.config文件夹中的WASConfig，设置你将要布署的WAS的相关连接参数：

第二步：启动WAS

第三步：

在eclipse中定位到下面这个文件夹，看到一堆的xml文件了吗？

依下面的次序把每个xml文件打开后用ANT运行一下：

clean.xml
generatePackagingProps.Echo.xml
packageApp.Echo.xml
installApp.Echo.xml
generatexJCL.Echo.xml

第四步：重启你的WAS

此时，进入这个网址： http://localhost:9060/ibm/console

在WAS的企业程序菜单中你可以看到有一个ear的应用已经布署并应该随着你的第三步中的重启WAS后而处于启动阶段了：

怎么执行我们的批处理脚本呢？

来，看

看到这个Echo.xml文件了吗？这个是根据Echo.props文件在进行AntgeneratexJCL.Echo.xml的过程中自动生成的批处理脚本，即.xJCL文件

Echo.xml文件（xJCL）




    ejb/com/ibm/ws/batch/EchoBatchController
    
      sequential
    
    
      com.ibm.wsspi.batch.checkpointalgorithms.RecordbasedBase
      
        
      
    
    
      
        com.ibm.wsspi.batch.resultsalgorithms.jobsum
      
    
    
      ejb/GenericXDBatchStep
      
      
      
        
          outputStream
        
          
          
          
          
          
          
          
          
          
          
          
        
          com.ibm.websphere.batch.devframework.datastreams.patterns.LocalJDBCWriter
        
        
          inputStream
        
          
          
          
          
          
        
          com.ibm.websphere.batch.devframework.datastreams.patterns.FileByteReader

在这个文件中我们可以任意改动其们批处理的步骤，调整我们的批处理脚本的各个步骤的执行顺序 而不需要改动源码与再打包 。

打开我们的IBM Compute Grid的job management console界面,输入这个网址 http://localhost:9080/jmc

看到了米有？把这个xml文件填入Specify path to xJCL这一栏，点”submit“按钮，就可以执行该批处理了，通过这个界面，想想我在上面”商业级解决方案“中提到过的5点需求，是不是它都可以执行了，嘿嘿，大家看看单节点执行的效率吧。

五、通过WASND来实现批处理网格计算

这个留给大家自行练习了。

你不需要改动任何程序代码，只要：

布署一个WASND
安装IBM Compute Grid后在Augment profile时选择WASND的主控域
IBM Compute Grid会根据指定的WASND的主控域自动安装到各个WASND中的节点
设置需要布署的WASND的相关参数
依次运行我们的一系列ANT用的XML
重启WASND
还是通过http://localhost:9080/jmc进入IBM Compute Grid控制台
提交xJCL

此时，这个批处理就会使用WASND中的各个布署有IBM Compute Grid的节点来进行” 网格计算了”.

注意：

这边的网格计算和传统的集群和load balance还是有区别的，这边的网格计算更类似于原来我有一个CPU，4G内存处理100万笔记录，通过WASND增加了一个节点后我就拥有1*2个CPU以及4GB*2的内存来运行同样的100万笔记录了，然后我再WASND一个节点，那么就再增加我批处理的处理能力。

你可能感兴趣的:(通向架构师的道路（第二十七天）IBM网格计算与企业批处理任务架构)

【2025年春季】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽子凯哥 web安全学习安全 CTF夺旗赛网络安全
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
计算机信息安全若水心境软件架构师知识库信息安全
等保2.0与等保1.0区别※等保2.0在2019年12月1日正式实施。等级保护制度2.0在1.0的基础上，注重全方位主动防御、动态防御、整体防控和精准防护，实现对云计算、移动互联网、物联网、工业控制信息系统等保护对象全覆盖。对象范围扩大将云计算、移动互联网、物联网、工业控制系统等技术列入标准中。分类结构统一“基本要求、设计要求和测评要求”分类框架统一，形成了“安全通信网络”、“安全区域边界”、“安
CVE-2017-5645(使用 docker 搭建) JM丫网络安全
介绍:是一个与ApacheLog4j2相关的安全漏洞,属于远程代码执行,它可能允许攻击者通过构造恶意的日志信息在目标系统上执行任意代码Log4j2介绍Log4j2是Apache的一个日志记录工具,属于Java应用的日志框架,它是Log4j的升级版,性能更好,功能更多.它被广泛的适用于Java应用程序中,帮助开发者记录程序运行的时候的日子信息,是Java生态系统中最重要的一个日志框架之一漏洞编号:C
浩方wms:什么是海外仓WMS系统?作用是什么？ haofang_software 大数据个人开发 sass 数据库科技
浩方动力科技认为，海外仓作为连接卖家与海外消费者的关键节点，其重要性愈发凸显。海外仓WMS系统（WarehouseManagementSystem），作为一种专门针对海外仓运营的信息化管理系统，正成为提升海外仓运营效率和服务水平的得力助手。什么是海外仓WMS系统呢？海外仓管理系统又有什么作用？浩方WMS，今天来为大家讲解一下海外仓WMS的作用和意义。海外仓WMS系统，顾名思义，是专为海外仓储业务设
云原生：K8s（Kubernetes）高频典型面试题汇总老舅的火箭爱扫地云原生 kubernetes 容器
1.简述etcd及其特点？答：etcd是CoreOS团队发起的开源项目，是一个管理配置信息和服务发现（servicediscovery）的项目，它的目标是构建一个高可用的分布式键值（key-value）数据库，基于Go语言实现。特点：l简单：支持REST风格的HTTP+JSONAPIl安全：支持HTTPS方式的访问l快速：支持并发1k/s的写操作l可靠：支持分布式结构，基于Raft的一致性算法，R
软件测试面试题 bobob_ Testing
您所熟悉的测试用例设计方法都有哪些？请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。答：有黑盒和白盒两种测试种类，黑盒有等价类划分法，边界分析法，因果图法和错误猜测法。白盒有逻辑覆盖法，循环测试路径选择，基本路径测试。例子：在一次输入多个条件的完整性查询中。利用等价类划分法则和边界分析法则，首先利用等价划分法，可以一个或多个结果是OK的测试用例，然后确认多个NG的测试用例，然后利用边界
【前端入门】应该了解和知道的几个国内外前端开发资源网站爱上大树的小猪前端
与大家分享一下几个国内外前端开发资源网站国际资源MDNWebDocs(MozillaDeveloperNetwork)用途：MDN是Web技术领域最全面的文档库之一，涵盖了HTML、CSS、JavaScript以及浏览器API等。链接:https://developer.mozilla.orgW3Schools用途：适合初学者学习Web技术，提供从基础到进阶的教程，同时还有在线练习环境。链接:ht
【前端】如何依靠纯前端实现拍照获取/选择文件等文字识别OCR技术爱上大树的小猪前端 ocr 前端框架 react.js
本文仅介绍第三方依赖包Tesseract.js，Tesseract.js是一个基于网页的OCR（光学字符识别）引擎，可以识别图像中的文本并将其转换为可供计算机处理的文本数据。支持多框架编译，如Vue、React等，这里展示步骤为React开发。下面直接进入主题：附Tesseract.js官方（https://github.com/naptha/tesseract.js）下载安装依赖包npminst
Hive----Hive进阶操作(三) HIVE 特殊分隔符处理 XiaodunLP Hive
HIVE特殊分隔符处理补充：hive读取数据的机制：1、首先用InputFormat的一个具体实现类读入文件数据，返回一条一条的记录（可以是行，或者是你逻辑中的“行”）2、然后利用SerDe的一个具体实现类，对上面返回的一条一条的记录进行字段切割Hive对文件中字段的分隔符默认情况下只支持单字节分隔符，如果数据文件中的分隔符是多字符的，如下所示：01||huangbo02||xuzheng03||
【第14届蓝桥杯】软件赛CB组省赛 Guiat 算法竞赛真题题解蓝桥杯
个人主页：Guiat归属专栏：算法竞赛真题题解文章目录A.日期统计B.01串的熵C.冶炼金属D.飞机降落E.接龙数列F.岛屿个数G.子串简写H.整数删除I.景区导游J.砍树正文总共10道题。A.日期统计【题目】日期统计【分析】【答案】235【AC_Code】#include#defineIOSios::sync_with_stdio(0);cin.tie(0);cout.tie(0);usingn
Docker 中 MySQL 迁移策略（单节点） Java咩 docker mysql 容器
目录一、简介二、操作流程2.1进入mysql容器2.2导出MySQL数据2.3.将导出的文件复制到宿主机2.4创建DockerCompose配置2.5启动新的Docker容器2.6导入数据到新的容器2.7验证数据2.8删除旧的容器（删除操作需慎重）三、推荐配置四、写在后面一、简介本人发现自己Docker中Mysql的时区不对，导致每次连接数据库都需要设置时区，所以考虑进行数据库迁移，重新搭建一个正
Python（1）Python全方位指南：定义、应用与零基础入门实战一个天蝎座白勺程序猿 Python入门到精通 python 开发语言
背景：为什么Python成为开发者必备技能？‌Python自1991年发布以来，凭借‌“简单高效”‌的设计理念，成为全球增长最快的编程语言。根据TIOBE2023年榜单，Python稳居前三，其核心竞争力包括：‌开发效率高‌：代码量仅为Java的1/5，C++的1/10。‌跨领域通吃‌：从Web开发到AI训练，覆盖90%以上技术场景。‌企业级应用‌：YouTube用Python处理视频推荐，NAS
Python 赋能经济趋势与股票研究：数据驱动的投资洞察 Small踢倒coffee_氕氘氚笔记经验分享
在当今数据爆炸的时代，Python凭借其强大的数据处理能力和丰富的开源库，已成为经济趋势分析和股票研究的利器。本文将探讨如何利用Python进行以下方面的研究：**一、数据获取与清洗*****数据来源:*****财经数据API:**Tushare、AKShare、YahooFinance、AlphaVantage等提供丰富的股票、基金、宏观经济等数据。***网络爬虫:**使用BeautifulSo
GitHub一周热门ai项目 2025.3.17 BillyXie23 AI探索 ai 人工智能
项目1：Significant-Gravitas/AutoGPT地址:significant-gravitas.github.com/AutoGPT描述:AutoGPT致力于为所有人提供可访问的AI工具，让用户专注于重要事务。Stars:173,449推荐理由:适合想要探索自动化AI应用的开发者，支持自定义扩展，开源生态强大，适合构建智能助手、自动化流程等场景。项目2：AUTOMATIC1111/
CSDN社区，到底该不该用DeepSeek AI生成文章？ Small踢倒coffee_氕氘氚 python 经验分享
##引言在当今数字化时代，人工智能（AI）技术正以惊人的速度发展，逐渐渗透到各个行业和领域。作为AI技术的一个重要分支，自然语言处理（NLP）在内容创作、文本生成等方面展现出了巨大的潜力。DeepSeekAI作为一款先进的AI写作工具，能够自动生成高质量的文章，极大地提高了内容创作的效率。然而，随着AI生成内容的普及，CSDN社区中的开发者、技术爱好者和内容创作者们开始思考一个问题：我们到底该不该
HTML深度解读 Small踢倒coffee_氕氘氚经验分享笔记
##引言HTML（HyperTextMarkupLanguage）是构建网页的基础语言。自1991年由TimBerners-Lee发明以来，HTML已经经历了多次版本更新，从HTML1.0到HTML5，每一次更新都带来了新的特性和功能。本文将深入探讨HTML的核心概念、结构、标签、语义化以及HTML5的新特性。##一、HTML的核心概念###1.1什么是HTML？HTML是一种标记语言，用于创建和
鸿蒙开发2024【面试题库】讲解，近期需要面试的可千万别错过！鸿蒙系统小能手Mr.Li 鸿蒙开发 harmonyos 面试鸿蒙 OpenHarmony 鸿蒙系统程序员移动开发
1.请简述鸿蒙OS与AndroidOS的主要区别是什么？设备兼容性：鸿蒙OS是一款面向各种设备的分布式操作系统，支持手机、平板电脑、智能手表、智能家居、汽车等多种设备类型，并能在这些设备之间实现无缝切换和共享数据。而Android系统则主要用于移动设备，如手机和平板电脑。系统架构：鸿蒙OS采用分布式技术架构，通过分布式技术实现多设备间的协作和数据共享，更加灵活、安全、高效。而Android则采用单
[官文翻译]Flutter状态管理库Riverpod - 所有的Provider - StateProvider 2401_84166236 2024年程序员学习 flutter
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提
AI大模型从入门到精通，2025终极指南！好卷啊，又不能躺平，只能悄悄卷你们了！大模型教程人工智能大模型训练 LLM 知识库大模型大模型入门大模型学习
什么是AI大模型？AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？2024人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于
【面经】2025年软件测试面试题，精选100 道（附答案）测试界的路飞软件测试面试面试软件测试职场和发展软件测试面试
测试技术面试题1、我现在有个程序，发现在Windows上运行得很慢，怎么判别是程序存在问题还是软硬件系统存在问题？2、什么是兼容性测试？兼容性测试侧重哪些方面？3、测试的策略有哪些？4、正交表测试用例设计方法的特点是什么？5、描述使用bugzilla缺陷管理工具对软件缺陷（BUG）跟踪的管理的流程？6、描述测试用例设计的完整过程？7、你觉得bugzilla在使用的过程中，有什么问题？8、单元测试的
突破反爬终极指南：如何用Python实现100%隐形数据抓取（附实战代码）煜bart 机器人人工智能 web3.py
引言：当爬虫遭遇铜墙铁壁2023年Q2最新统计显示，全球Top100网站中89%部署了AI驱动的反爬系统，传统爬虫存活率暴跌至17%。本文将揭秘一套基于深度伪装技术的爬虫方案，在最近三个月实测中保持100%成功率，成功突破Cloudflare、Distil等顶级防护系统。---###一、指纹伪装：让爬虫"隐身"的核心科技####1.1浏览器指纹深度克隆（代码实现）```pythonfromsele
零信任架构阿湯哥架构
零信任架构（ZeroTrustArchitecture,ZTA）零信任架构是一种新型网络安全模型，核心理念是“永不信任，始终验证”（NeverTrust,AlwaysVerify）。它摒弃传统基于边界的安全防护（如防火墙隔离内外部网络），转而通过动态的、细粒度的访问控制，对所有用户、设备和数据流进行持续验证，最小化攻击面并防范内部威胁。一、零信任与传统安全模型的对比维度传统安全模型零信任模型信任基
hive-进阶版-1 数据牧马人 hive hadoop 数据仓库
第6章hive内部表与外部表的区别Hive是一个基于Hadoop的数据仓库工具，用于对大规模数据集进行数据存储、查询和分析。Hive支持内部表（ManagedTable）和外部表（ExternalTable）两种表类型，它们在数据存储、管理方式和生命周期等方面存在显著区别。以下是内部表和外部表的主要区别：1.数据存储位置内部表：数据存储在Hive的默认存储目录下，通常位于HDFS（HadoopDi
Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例云策量化 Python自动化炒股量化投资量化软件 python 量化交易 QMT PTrade 量化炒股量化投资 deepseek
推荐阅读：《程序化炒股：如何申请官方交易接口权限？个人账户可以申请吗？》Python自动化炒股：利用XGBoost和LightGBM进行股票市场预测的实战案例在当今快节奏的金融市场中，自动化交易和预测模型成为了投资者和交易者的重要工具。Python以其强大的数据处理能力和丰富的机器学习库，成为了实现这些模型的首选语言。本文将带你了解如何使用XGBoost和LightGBM这两个流行的机器学习算法来
如何利用 AI 技术快速定位和修复生产环境问题 pytorch人工智能
摘要生产环境的问题往往难以复现，排查成本高，直接影响用户体验。传统的日志分析、异常监控、APM（应用性能监控）等方法已经被广泛使用，但随着AI技术的发展，我们可以进一步自动化问题检测、智能日志分析、异常根因分析，极大提高生产问题的排查效率。本文将探讨如何利用AI技术优化生产环境的排查流程，并提供实际可运行的示例代码，帮助开发者掌握AI赋能下的智能问题诊断方法。引言生产环境的稳定性是衡量一个系统可靠
HarmonyNext实战：基于ArkTS的高性能3D渲染引擎开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能3D渲染引擎开发引言3D渲染引擎是现代图形应用的核心，广泛应用于游戏开发、虚拟现实、工业设计等领域。HarmonyNext作为新一代操作系统，提供了强大的图形处理能力，而ArkTS作为其开发语言，能够帮助开发者高效实现高性能的3D渲染引擎。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个3D渲染引擎。我们将从3D渲染的基本原理
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个核心且复杂的技术领域。随着设备互联的普及，如何在多设备间高效、可靠地分配和执行任务成为开发者面临的重要挑战。本文将深入探讨如何利用ArkTS语言构建一个高性能的分布式任务调度系统，涵盖从架构设计到代码实现的完整过程。分布式任务调度系统概述分布式任务调度系统的核心目标是将任务
React 18 并发更新的工作原理与实战应用程序员小续 react.js 前端前端框架 javascript typescript reactjs ecmascript
在React18版本中，引入了并发更新（ConcurrentRendering）的概念，这是一种新的渲染模式，允许React更加智能地协调UI更新，提高应用的流畅度和响应速度。一.什么是并发更新？并发更新（ConcurrentRendering）允许React中断和恢复渲染，并根据用户的交互优先级调整渲染顺序。换句话说，React18让渲染变得非阻塞，不会因为某个状态更新导致整个UI卡顿。在Rea
HarmonyNext实战：基于ArkTS的高性能区块链应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能区块链应用开发引言区块链技术以其去中心化、不可篡改和透明性等特点，正在金融、供应链、物联网等领域掀起革命性变革。HarmonyNext作为新一代操作系统，提供了强大的分布式计算和网络通信能力，而ArkTS作为其开发语言，能够帮助开发者高效实现高性能的区块链应用。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个区块链应用。我们将
深入理解Spring Cloud中的服务发现与注册 weixin_836869520 spring cloud 服务发现 spring
深入理解SpringCloud中的服务发现与注册大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！服务发现与注册的重要性在微服务架构中，服务发现与注册是确保服务间通信的关键。传统的单体应用程序可能使用硬编码的方式调用其他服务，但在微服务环境中，服务的地址和实例可能动态变化，因此需要一种机制来动态地管理和发现服务。1.SpringCloud与EurekaSpringClo
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo