junli0310

WebSphere DataStage Enterprise Edition 实践并行访问多节点 DB2 的配置与实现

DataStage EE 中的DB2 Stage

在DataStage EE中提供了三种关于DB2 的Stage，忽略ODBC，加上Dynamic RDBMS Stage，我们有四种Stage可以存取DB2数据库，其中只有DB2/UDB Enterprise Stage支持并行访问带分区功能的数据库，它是通过特别的架构来实现DB2的并行访问，稍候我们会详细介绍。

图1：DataStage EE提供的DB2 Stage

而其余的三种Stage都是以插件的方式通过DB2客户端来访问DB2的，其并行访问能力是受限制或者没有的，详见下表分析。

表1：DataStage EE中四种存取DB2的Stage 区别

在DataStage EE V7以后的版本中，去掉了DataStage Server的主节点（conductor node ）必须安装在DB2 Server的主节点上这一限制（node 0）,也就是说DataStage Server的conductor node可以和DB2 Server的协调节点分离。现在的DataStage EE可以通过DB2客户端访问远程节点的DB2数据库，如下图所示：

图2：DataStage EE 访问 Remote DB2 with DPF 的架构

这种架构必须满足两个条件：

在DataStage Server 的主节点上必须安装相同版本的DB2客户端。
DataStage Server并行框架（DATA STAGE EE engine）必须安装在每一个DB2节点上。

该架构的工作原理：

DataStage Conductor Node 通过给定的的DB2环境变量决定所要访问的DB2 实例，该实例是具有分区特性的。
DataStage 通过读取给定的 db2nodes.cfg 文件来获取上述实例的分区节点信息。
DataStage扫描当前的并行配置文件（APT_CONFIG_FILE），来确定DB2每个分区的node name和并行配置文件中的fastname相匹配，所有的DB2 的node name必须都有名称一致的fastname。
DataStage在集群中所有的ETL和DB节点上启动并行Job。
DataStage Conductor Node 通过DB2客户端获取远程数据库中数据表的分区信息。注意这里DB2客户端的作用，和传统的远程DB2 的访问机制不一样，DataStage EE通过DB2的客户端只是获取远程数据库的必要的配置信息从数据库的编目表，例如数据表的数据分布。而从单独配置的db2nodes.cfg文件获取分区的信息，至于数据访问则是在各节点直接访问DB2 数据库。
通过DataStage 并行框架，DB2/UDB Enterprise Stage 直接访问每一个节点上的数据表的数据。注意这里没有使用DB2客户端，在每一DB2的节点上DB2/UDB Enterprise Stage直接和DB2节点通讯。

回页首

测试系统拓扑结构

接下来我们实际建立一个测试系统来实现通过DATA STAGE EE连接远程的多分区DB2数据库，下图是我们这次测试系统的拓扑结构：

图3：测试系统拓扑结构

如上图所示：我们的示例系统由两台Linux服务器组成，操作系统为RedHat Enterprise Linux 3 ,其中一台做为ETL Server的Conductor Node服务器，另一台作为DB2 Cooperate node服务器。同时在两台服务器上建立了一个具有4个节点的DB2实例，如表2：

表2：服务器说明

回页首

软件安装

在安装软件之前要做好相应的准备工作，主要是在两台主机上创建相关的用户，如表3：

表3：创建用户

分别在两台主机上安装如下软件：

DB2 ESE V8.2 with DPF，并打补丁包至 Fixpack10
DataStage EE for RedHat Linux Enterprise V7.5.1

详细的安装步骤可参见相关的Install Guide，另外因为用到了RSH和NFS服务，所以在两台主机上启动相应的服务。

回页首

配置DB2

1．在DB2 Server上创建DB2实例DB2INST1，实例创建后编辑其db2nodes.cfg文件，如下所示，该实例由4个节点构成，主机glasc2上为节点0、1，主机glasc上为节点2、3。

[db2inst1@glasc2 db2inst1]$ cat sqllib/db2nodes.cfg
0 glasc2 0
1 glasc2 1
2 glasc  0
3 glasc  1
[db2inst1@glasc2 db2inst1]$

2．如下在主机glasc上挂载glasc2上的网络文件系统 /home/db2inst1

mount -t nfs glasc2:/home/db2inst1 /home/db2inst1

3．执行如下命令配置实例的TCPIP通讯：

4．在两台主机上启用RSH服务，并为db2inst1和dsadm用户配置rsh的访问权限，主要是配置 /etc/hosts.equiv和用户目录下的.rhosts文件，详见相关配置文档

5．执行db2_all命令检查数据库分区各节点的通讯，

6．启动实例，如下如所示，实例启动成功后用db2sampl命令创建样本数据库SAMPLE。

7．在ETL Server 上创建客户端实例DSADM，该实例作为ETL Server的DB2 客户端，主要提供相应的环境变量和类库供DataStage访问远程的数据库。创建实例的命令如下：

8．在实例DB2INST3上编目远程实例DB2INST1 的SAMPLE数据库：

注意客户端数据库编目的别名是SAMPLER。

检查数据库编目情况，并连接测试：

到此数据库的相关配置工作就完成了，下面我们配置DataStage，使其能够访问DB2。

回页首

配置DataStage EE

1．安装好DATA STAGE EE后最重要的工作就是配置dsenv文件，该文件所在的目录如果默认安装应该在 /home/dsadm/Ascential/DataStage/DSEngine 目录下，编辑该文件增加如下图所示的环境变量，使其能访问DB2：

2．修改dsadm用户的.bashrc配置文件，注意要将DataStage EE的配置文件加到DB2的环境变量之前（注意这里面只考虑32位环境，如果你配置64位环境则需要额外的考虑），如下图：

3．配置DataStage EE的集群，在DB2 Server的节点上装载DataStage EE Framework，一般我们可以将ETL Server上的整个DataStage EE目录导出为NFS方式的文件系统，并在所有DataStage EE集群的节点上加载该文件系统。在ETL Server 上导出 /home/dsadm ，配置/etc/exports文件，增加如下条目，然后执行exportfs命令。

[root@glasc /]# cat /etc/exports 
#

/home/dsadm       glasc2(rw,sync,no_root_squash)
/software         *(rw,sync,no_root_squash)
[root@glasc /]#

在本次测试中，DataStage EE集群的另一个节点也就是DB2 Server，在DB2 Server上加载ETL Server 导出的 /home/dsadm NFS文件系统：

mount -t nfs glasc:/home/dsadm /home/dsadm

4．为dsadm（ETL用户）配置访问DB2 的权限和相关特别设置

执行$APT_ORCHHOME/bin/db2setup.sh脚本，使用DataStage EE连接DB2 的用户必须执行此脚本做相应的设置
使用方法: db2setup.sh <dbname>
注意该脚本并未采用用户名和密码认证的方式连接数据库，所以如果你的数据库是远程连接方式，必须提供用户名和密码的情况下就不适用此脚本，这时你只需要以数据库DBA角色连接数据库执行如下脚本即可：
cd $INSTHOME/sqllib/bnd
db2 bind @db2ubind.lst datetime ISO blocking all grant public
db2 bind @db2cli.lst datetime ISO blocking all grant public
执行$APT_ORCHHOMEdb2grant.sh为dsadm用户授权
使用方法: db2grant.sh <dbname> <username>
同样该脚本连接数据库时并未使用用户名和密码，同上只需以DBA角色连接数据库后执行如下脚本，效果是一样的：
db2 grant bind, execute on package dsadm.db2.esql to group dstage

5．重新启动DataStage EE Server，以dsadm用户执行如下命令：

uv -admin stop
uv -admin start

到此所有准备工作都已经完成，接下来我们创建并运行一个Job来访问多节点的DB2数据库Sample。

回页首

创建Job进行测试

1．我们测试所用的Job逻辑比较简单，用DB2INST1.DEPARTMENT表作为Lookup Table 来校验表DN2INST1.EMPLOYEE，并将结果集输出到Dataset文件中，相当于SQL语句中的内连接。Job的布局如下图所示：

图4：测试Job的布局

图5：Lookup Stage 的引用关系

2．可以手工编辑或者用DataStage Manager 配置Job运行的Configure文件，用DS Manager 的好处事可以对该文件进行检查。确保DataStage EE集群中的所有DB2的节点都要出现在此文件中，也就是说DB2节点的主机名必须在fastname中有和其相匹配的名字，如下图所示我们所用的 Configure文件示例：Node1的fastname为DB2INST1前两个节点主机名，Node2的fastname用的是DB2INST1的另外两个节点的主机名。同时我们要在所有DataStage EE节点上创建相应的文件系统作为resoucr disk和resource scratchdisk，其绝对路径为Configure文件中所配置的路径。

{
	node "node1"
	{
		fastname "glasc"
		pools ""
		resource disk "/dswork/datasets" {pools ""}
		resource scratchdisk "/dswork/scratch" {pools ""}
	}

	node "node2"
	{
		fastname "glasc2"
		pools ""
		resource disk "/dswork/datasets" {pools ""}
		resource scratchdisk "/dswork/scratch" {pools ""}
	}
}

3．为Job配置运行的参数，主要是$APT_DB2INSTANCE_HOME参数，因为DataStage EE框架通过该参数值确定db2nodes.cfg文件的位置，通过扫描该文件去获取DB2的节点信息，同时判断DB2 节点的主机名是否存在于Configure文件的fastname值中。如果默认不指定此参数的话，DataStage EE会默认采用dsenv中配置的路径，即/home/dsadm/sqllib/db2nodes.cfg，因为实例DSADM是客户端类型的实例，所以需要从DB2INST1实例sqllib目录下拷贝此文件或手工生成该文件，但这样会影响实例DSADM的运行，所以为了使客户端实例DSADM能正常使用，又能让DataStage EE扫描实例DB2INST1 的节点配置文件，我们为Job单独配置此参数，动态的指定其运行值，这里我们取默认值为 "/dswork"，如下图所示：

图6：job01 属性

这里此参数的默认值是/dswork，注意其路径关系，DataStage EE框架会默认加上sqllib子路径，所以其文件绝对路径和内容应如下图所示：

4．配置Job里的DB2 EE Stage

图7：配置Connection属性

如上图所示，我们一一描述Connection的属性设置：

Client Alias DB Name，远程数据库在客户端编目的数据库名称，这里其值为sampler，如果远程数据库在客户端编目的名字没有改变则可忽略此属性的配置
Client Instance Name，客户端实例的名称，这里为dsadm，DataStage EE通过该实例访问远程的DB2
Database，远程数据库的名称，sample数据库在远程实例DB2INST1中
Password，访问数据库的口令
Server，远程实例的名称
Use Default Database，False意味着我们不使用dsenv中所配置的默认访问的数据库名称
Use Default Server，False意味着我们不使用dsenv中所配置的默认访问的数据库实例名称
User，访问数据库所使用的用户ID

5．将Job中所有的Stage属性配置好以后我们可以在DataStage Designer中预览DB2 Stage的数据，据此就可以测试一下DB2 Stage是否能连接到远程数据库，如下图：

图8：测试数据库连接

6．编译并在DataStage Director中运行此Job，查看Job运行的Log可以获取Job运行的详细信息，启动Monitor监控Job运行的性能参数。由下图我们可以看到Department和Employee表是根据其分区信息进行并行访问的，这里都是4个进程。

图9：监控 job 运行

前面我们说过在读取数据的时候，DB2 EE Stage是和各节点的DB2进行通讯来直接读取数据的，按照如下方式可以查看Employee表的数据在各分区的分布情况，可见和上图中的数据条数是一致的。

[db2inst1@glasc2 db2inst1]$ db2 " select dbpartitionnum(empno),count(*) 
from db2inst1.employee group by  dbpartitionnum(empno) "

1           2          
----------- -----------
          0           6
          1           9
          2           8
          3           9

  4 record(s) selected.

[db2inst1@glasc2 db2inst1]$

7．在DataStage Designer界面，启动Show Performance Statistics选项，可以直接看到相关的性能统计，每个Virtual Dataset的读取或写入的数据条数及其性能，如下图所示：

图10：性能统计

回页首

结论及分析

1．我们在这里总结一下上述配置过程的关键点：

确保所有集群节点的主机之间RSH服务正常运行，并为相关的用户配置访问权限，这是所有节点协作运行的基础条件。
为使DS用户能够访问DB2数据库，除了在dsenv文件里配置相关的环境变量之外，还要运行db2setup.sh 和 db2grant.sh 脚本赋予相关的权限等配置。
为DataStage EE创建的运行配置文件Configure 文件必须包含所有远程数据库的节点。
设置参数APT_DB2_INSTANCEHOME，使DataStage EE框架引擎能够访问远程数据库的db2nodes.cfg文件副本，以获取DB2的节点信息，要注意实际的路径关系，DS总会加上sqllib子路径。
在每个节点上都创建本地文件系统作为此节点DataStage EE框架运行所需的resource disk，并且文件系统的路径要与Configure 文件中的保持一致

2．配置运行参数 $APT_PM_SHOWRSH为TRUE，可以查看其RSH运行脚本，我们可以看到Job在各节点是如何被运行的，LOG中输出的RSH脚本如下所示：

main_program: 

APT_PM_LocalShell: 
<rsh> /home/dsadm/Ascential/DataStage/PXEngine/etc/standalone.sh
/home/dsadm/Ascential/DataStage/PXEngine -APT_PMprotoSectionLeaderFlag
--APTNoSetupProgram /home/dsadm/Ascential/DataStage/PXEngine/etc/standalone.
sh -APT_PMsetupFailedFlag /home/dsadm/Ascential/DataStage/PXEngine/bin/osh
-APT_PMsectionLeaderFlag glasc 10000 0 30 node1 glasc 1147922153.903044.571d 

APT_PM_RemoteShell: 
<rsh> /home/dsadm/Ascential/DataStage/PXEngine/etc/remsh glasc2 -n
/home/dsadm/Ascential/DataStage/PXEngine/etc/standalone.sh
/home/dsadm/Ascential/DataStage/PXEngine -APT_PMprotoSectionLeaderFlag
--APTNoSetupProgram /home/dsadm/Ascential/DataStage/PXEngine/etc/standalone.
sh -APT_PMsetupFailedFlag /home/dsadm/Ascential/DataStage/PXEngine/bin/osh
-APT_PMsectionLeaderFlag glasc 10000 1 30 node2 glasc2 1147922153.903044.571d

其中APT_PM_LocalShell代表本地脚本，APT_PM_RemoteShell为远程脚本。

2． Log信息中还详细记录此Job的运行时的Virtual Dataset和进程信息，一共7个datasets，7个操作在两个节点上共17个进程。其详细分析如下：

a) ds0：读取Department表的数据，相关进程op0[4p]（4p代表共有四个进程，下同），op2[2p]

b) ds1：读取Employee表的数据，相关进程op1[4p]，op3[2p]

c) ds2：构建Lookup，（笔者猜测，有待证实），相关进程op2[2p]，op4[2p]

d) ds3：构建Lookup，相关进程op2[2p],op4[2p]

e) ds4：为Lookup处理过程提供Buffer，相关进程op3[2p]，op4[2p]

f) ds5：Lookup结果输出到Dataset文件，op5[2p]，两个进程用于输出结果到文件，op6[1p]主节点的单个唯一进程，删除临时用于描述Dataset的文件。

g) ds6：Lookup处理过程，相关进程op4[2p]

main_program: This step has 7 datasets:
ds0: {op0[4p] (parallel DB2_UDB_Department)
      eEntire#>eCollectAny
      op2[2p] (parallel APT_LUTCreateOp in Lookup)}
ds1: {op1[4p] (parallel DB2_UDB_Employee)
      eAny#>eCollectAny
      op3[2p] (parallel buffer(0))}
ds2: {op2[2p] (parallel APT_LUTCreateOp in Lookup)
      eEntire#>eCollectAny
      op4[2p] (parallel APT_LUTProcessOp in Lookup)}
ds3: {op2[2p] (parallel APT_LUTCreateOp in Lookup)
      eAny=>eCollectAny
      op4[2p] (parallel APT_LUTProcessOp in Lookup)}
ds4: {op3[2p] (parallel buffer(0))
      eSame=>eCollectAny
      op4[2p] (parallel APT_LUTProcessOp in Lookup)}
ds5: {op5[2p] (parallel delete data files in delete /dswork/mdspro1/job01.ds)
      >>eCollectAny
      op6[1p] (sequential delete descriptor file in delete
	  /dswork/mdspro1/job01.ds)}
ds6: {op4[2p] (parallel APT_LUTProcessOp in Lookup)
      =>
      /dswork/mdspro1/job01.ds}
It has 7 operators:
op0[4p] {(parallel DB2_UDB_Department)
    on nodes (
      node2[op0,p0]
      node2[op0,p1]
      node1[op0,p2]
      node1[op0,p3]
    )}
op1[4p] {(parallel DB2_UDB_Employee)
    on nodes (
      node2[op1,p0]
      node2[op1,p1]
      node1[op1,p2]
      node1[op1,p3]
    )}
op2[2p] {(parallel APT_LUTCreateOp in Lookup)
    on nodes (
      node1[op2,p0]
      node2[op2,p1]
    )}
op3[2p] {(parallel buffer(0))
    on nodes (
      node1[op3,p0]
      node2[op3,p1]
    )}
op4[2p] {(parallel APT_LUTProcessOp in Lookup)
    on nodes (
      node1[op4,p0]
      node2[op4,p1]
    )}
op5[2p] {(parallel delete data files in delete /dswork/mdspro1/job01.ds)
    on nodes (
      node1[op5,p0]
      node2[op5,p1]
    )}
op6[1p] {(sequential delete descriptor file in delete /dswork/mdspro1/job01.ds)
    on nodes (
      node1[op6,p0]
    )}
It runs 17 processes on 2 nodes.

3．结果数据的存储

输出的结果文件我们采用Dataset方式存储，这是一种支持并行架构的分布式存储数据的格式，通过DataStage Manager中的工具Data Set Management 我们可以查看其存储结构和模式，这里的模式是DataStage EE框架的术语，类似于表结构。

图11：结果数据

如上图，输出的结果文件job01.ds总共有32条记录，node1上存储了17条记录，node2上存储了15条记录，我们可以分别到 glasc和glasc2两主机上的/dswork/datasets目录下查看相关的物理文件，如下图，由此你对DataStage EE的并行架构有了更深的感性认识。

参考资料

developerWorks 中国 Information Management 专区：http://www.ibm.com/developerworks/cn/db2
Ascential Developer 的站点：http://developernet.ascential.com
DataStage Enterprise Edition Configure Parallel Remote Db2 Connectivity：DataStage 官方文档，可以在上面提到的站点下载

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
【PG】常见数据库、表属性设置江无羡数据库
PG的常见属性配置方法数据库复制、备份相关表的复制标识单表操作批量表操作链接数据库复制、备份相关表的复制标识单表操作通过ALTER语句单独更改一张表的复制标识。ALTERTABLE[tablename]REPLICAIDENTITYFULL;批量表操作通过代码块的方式，对某个schema中的所有表一起更新其复制标识。SELECTtablename,CASErelreplidentWHEN'd'TH
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
python tif转png Python与遥感 python 开发语言
importosfromosgeoimportgdalimportnumpyasnpfromPILimportImage#提取432三波段fromspectralimport*#输入文件夹路径defget_img(dataset_img):width=dataset_img.RasterXSize#获取行列数height=dataset_img.RasterYSizebands=dataset_i
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
3.增删改查--连接查询问女何所忆
关系型数据库的一个特点就是，多张表之间存在关系，以致于我们可以连接多张表进行查询操作，所以连接查询会是关系型数据库中最常见的操作。连接查询主要分为三种，交叉连接、内连接和外连接，我们一个个说。1、交叉连接交叉连接其实连接查询的第一个阶段，它简单表现为两张表的笛卡尔积形式，具体例子：如果你没学过数学中的笛卡尔积概念，你可以这样简单的理解这里的交叉连接：两张表的交叉连接就是一个连接合并的过程，T1表中
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
docker from指令的含义_多个FROM-含义 weixin_39722188 docker from指令的含义
小编典典什么是基本图片？一组文件，加上EXPOSE端口ENTRYPOINT和CMD。您可以添加文件并基于该基础图像构建新图像，Dockerfile并以FROM指令开头：后面提到的图像FROM是新图像的“基础图像”。这是否意味着如果我neo4j/neo4j在FROM指令中声明，则在运行映像时，neo数据库将自动运行并且可在端口7474的容器中使用？仅当您不覆盖CMD和时ENTRYPOINT。但是图像
Redis:缓存击穿我的程序快快跑啊缓存 redis java
缓存击穿(热点key)：部分key(被高并发访问且缓存重建业务复杂的)失效,无数请求会直接到数据库，造成巨大压力1.互斥锁：可以保证强一致性线程一：未命中之后，获取互斥锁，再查询数据库重建缓存，写入缓存，释放锁线程二：查询未命中，未获得锁(已由线程一获得)，等待一会，缓存命中互斥锁实现方式：redis中setnxkeyvalue:改变对应key的value,仅当value不存在时执行，以此来实现互
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方

WebSphere DataStage Enterprise Edition 实践 并行访问多节点 DB2 的配置与实现

你可能感兴趣的:(数据库,server,db2,websphere,dataset,parallel)

WebSphere DataStage Enterprise Edition 实践并行访问多节点 DB2 的配置与实现