初夏gg、

DolphinScheduler——流程调度工具

一、平台简介

二、竞品软件分析

三、安装部署

3.1 基础环境

3.2 安装前操作

3.3具体安装操作步骤

3.4 名词解释

四.功能介绍

4.1 首页&项目管理

4.1.1 首页

4.1.2 项目管理

4.1.3 任务节点类型和参数设置

4.2 资源中心

4.2.1文件管理

4.2.2 UDF管理

4.3 数据源中心

4.4 监控中心

4.5 安全中心

4.5.1 租户管理

4.5.2 用户管理

4.5.3 告警组管理

4.5.4 Worker分组管理

4.5.5 队列管理

4.5.6 令牌管理

五、参数设置

5.1系统参数

5.2 时间自定义参数

5.3 用户自定义参数

六、平台升级

6.1 升级流程

6.2 升级内容

6.3 新版本问题

七、常见问题

7.1 jar包问题

7.2 权限问题

附录：平台元数据表信息

原创声明：本创作是本人的原创内容，未经授权及禁止肆意转载。此外并未与任何机构合作，原创不易，尊重原创

一、平台简介

Apache DolphinScheduler（目前处在孵化阶段）是一个分布式、去中心化、易扩展的可视化DAG工作流任务调度系统，其致力于解决数据处理流程中错综复杂的依赖关系，使易于使用，开发人员可以通过非常简单的拖拽操作构建ETL过程。不仅对于ETL开发人员，无法编写代码的人也可以使用此工具进行ETL操作，例如系统管理员和分析师；
解决“复杂任务依赖”问题，并且可以实时监视ETL运行状态；
支持多租户；
支持许多任务类型：Shell，MR，Spark，SQL（mysql，postgresql，hive，sparksql），Python，Sub_Process，Procedure等；
支持HA和线性可扩展性

调度系统在数据处理流程中开箱即用。

二、竞品软件分析

	DolphinScheduler	Azkaban	Oozie
定位	解决数据处理流程中错综复杂的依赖关系	为了解决Hadoop的任务依赖关系问题	管理Hdoop作业（job）的工作流程调度管理系统
任务类型支持	支持传统的shell任务，同时支持大数据平台任务调度：MR、Spark、SQL(mysql、postgresql、hive/sparksql)、python、procedure、sub_process	ommand、HadoopShell、Java、HadoopJava、Pig、Hive等，支持插件式扩展	统一调度hadoop系统中常见的mr任务启动、Java MR、Streaming MR、Pig、Hive、Sqoop、Spark、Shell等
可视化流程定义	所有流、定时操作都是可视化的，通过拖拽来绘制DAG,配置数据源及资源，同时对于第三方系统，提供api方式的操作。	通过自定义DSL绘制DAG并打包上传	配置相关的调度任务复杂，依赖关系、时间触发、事件触发使用xml语言进行表达
任务监控支持	任务状态、任务类型、重试次数、任务运行机器、可视化变量，以及任务流执行日志	只能看到任务状态	任务状态、任务类型、任务运行机器、创建时间、启动时间、完成时间等。
暂停/恢复/补数	支持暂停、恢复补数操作	只能先将工作流杀死在重新运行	支持启动/停止/暂停/恢复/重新运行：支持启动/停止/暂停/恢复/重新运行： Oozie支持Web，RestApi，Java API操作
高可用支持	支持HA，去中心化的多Master和多Worker	通过DB支持HA，-但Web Server存在单点故障风险	通过DB支持HA
多租户支持	dolphinscheduler上的用户可以通过租户和hadoop用户实现多对一或一对一的映射关系。无法做到细节的权限管控。	——	——
过载处理能力	任务队列机制，单个机器上可调度的任务数量可以灵活配置，当任务过多时会缓存在任务队列中，不会操作机器卡死	任务太多时会卡死服务器	调度任务时可能出现死锁
集群扩展支持	调度器使用分布式调度，整体的调度能力会随集群的规模线性正常，Master和Worker支持动态上下线，可以自由进行配置	只Executor水平扩展	参照集群标准
文件管理	支持，可视化管理文件，及相关udf函数等。	——	——
邮件报警	支持	支持	支持
权限控制	可以通过对用户进行资源、项目、数据源的访问授权	——	——
版本更新迭代	持续发展中，升级不会影响当前集群，升级方式操作简单	——	依赖当前集群版本，如更新最新版，易于现阶段集群不兼容

三、安装部署

安装部署文档使用的dolphinscheduler版本为1.3.8，如需升级至最新版2.0以上版本可参照官网升级操作。upgrade

3.1 基础环境

MySQL5.7以上

JDK1.8

zookeeper

Python

其余配置要求参照官网内容即可。

3.2 安装前操作

建议直接使用root用户进行安装部署，如使用普通用户部署，需将该用户开启sudo免密及集群内免密。
配置/etc/hosts文件，集群内主机名及IP之间映射
安装ds的各台机器须配置部署用户免密登录
ds的安装节点与hdfs和yarn所在节点没有关系,只须要保证ds的worker所在节点有hadoop、hive的安装目录并配置环境变量便可,由于要做为客户端提交命令

3.3具体安装操作步骤

0.下载安装包

可以在官网下载安装包（https://dolphinscheduler.apache.org/zh-cn/download/download.html）此处选择1.3.8版本

修改源码中配置文件信息

1）点开根目录下的pom文件，修改里面的集群版本信息，修改为现有集群的信息。

主要修改集群版本、Hadoop及hive版本信息

2.X.0

3.X.0

1.3.1-cdh5.XX.X-------可改可不改

2）去除MySQL包的scope

3) 编译

可以通过服务器进行编译，也可以通过idea编译。

mvn -U clean package -Prelease -Dmaven.test.skip=true

编译后的包如下：

4）将安装包上传至服务器相关目录解压。

tar -zxvf apache-dolphinscheduler-1.3.8-cdh5.13.3-src.tar.gz

修改文件夹权限

chmod -R 755 apache-dolphinscheduler-1.3.8-cdh5.13.3-src

chown -R root:root apache-dolphinscheduler-1.3.8-cdh5.13.3-src

5）使用高权限用户（建议直接使用root），并配置ssh免密。

6）创建dolphinscheduler元数据库-MySQL（用户名及密码可以进行修改）

CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;

CREATE USER 'dscheduler'@'%' IDENTIFIED BY 'dscheduler';

GRANT ALL PRIVILEGES ON dolphinscheduler.* TO 'dscheduler'@'%' IDENTIFIED BY 'dscheduler';

flush privileges;

7）初始化数据库连接

vi apache-dolphinscheduler-1.3.8-cdh5.13.3-src/conf/datasource.properties

spring.datasource.driver-class-name=com.mysql.jdbc.Driver spring.datasource.url=jdbc:mysql://MySQL连接名:3306/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8&allowMultiQueries=true

spring.datasource.username=dscheduler

spring.datasource.password=dscheduler

注意：需将postgresql模块屏蔽，将MySQL模块打开，修改MySQL模块信息。

8）在ds的安装目录下执行数据库初始化脚本

./script/create-dolphinscheduler.sh

9）配置ds所需的环境变量

vi apache-dolphinscheduler-1.3.8-cdh5.13.3-src/conf/env/dolphinscheduler_env.sh

注：根据集群上具有的环境进行配置，无用的建议屏蔽掉，也可进行删除。

10）修改配置文件conf/config/install_config.conf相关参数，以下为参考，详细可见配置文件均有标识。

# --------# INSTALL MACHINE# --------#

#因为是在单节点上部署master、worker、API server，所以服务器的IP均为机器IP或者localhost ips="localhost"

masters="localhost"

workers="localhost:default"

alertServer="localhost"

apiServers="localhost"

# DolphinScheduler安装路径，如果不存在会创建

installPath="~/dolphinscheduler"

# 部署用户，填写在 **配置用户免密及权限** 中创建的用户

deployUser="dolphinscheduler"

# -----------------# DolphinScheduler ENV# --------------#

#JAVA_HOME 的路径，是在 **前置准备工作** 安装的JDK中 JAVA_HOME 所在的位置 javaHome="/your/java/home/here"

# ----------------# Database# ---------------------#

#数据库的类型，用户名，密码，IP，端口。其中dbtype目前支持 mysql 和 postgresql

dbtype="mysql" dbhost="localhost:3306"

# 如果你不是以 dolphinscheduler/dolphinscheduler 作为用户名和密码的，需要进行修改 username="dolphinscheduler"

password="dolphinscheduler"

dbname="dolphinscheduler"

# ----------------------# Registry Server# -----------------#

#注册中心地址，zookeeper服务的地址

registryServers="localhost:2181"

11）添加集群配置文件

如果集群未启用HA，直接在install_config.conf文件中进行编写
如果集群启用了HA，请将hadoop的hdfs-site.xml和core-site.xml拷贝到/conf目录下

12）一键部署

sh install.sh

13) 进程检查

LoggerServer

WorkerServer

MasterServer

14) 服务启停

# 一键停止 sh ./bin/stop-all.sh

# 一键开启 sh ./bin/start-all.sh

# 启停master

sh ./bin/dolphinscheduler-daemon.sh start master-server

sh ./bin/dolphinscheduler-daemon.sh stop master-server

# 启停worker

sh ./bin/dolphinscheduler-daemon.sh start worker-server

sh ./bin/dolphinscheduler-daemon.sh stop worker-server

# 启停api-server

sh ./bin/dolphinscheduler-daemon.sh start api-server

sh ./bin/dolphinscheduler-daemon.sh stop api-server

# 启停logger

sh ./bin/dolphinscheduler-daemon.sh start logger-server

sh ./bin/dolphinscheduler-daemon.sh stop logger-server

# 启停alert

sh ./bin/dolphinscheduler-daemon.sh start alert-server

sh ./bin/dolphinscheduler-daemon.sh stop alert-server

15）前端访问(红色标记为替换实际内容)

apiserver:12345/dolphinscheduler

账户：admin

密码：dolphinscheduler123

3.4 名词解释

租户：对应linux系统的用户，平台内一个租户对应很多用户。
DAG：全称 Directed Acyclic Graph，简称 DAG。工作流中的 Task 任务以有向无环图的形式组装起来，从入度为零的节点进行拓扑遍历，直到无后继节点为止
流程定义：通过拖拽任务节点并建立任务节点的关联所形成的可视化 DAG
流程实例：流程实例是流程定义的实例化，可以通过手动启动或定时调度生成。流程定义每运行一次，产生一个流程实例
任务实例：任务实例是流程定义中任务节点的实例化，标识着具体的任务执行状态
任务类型：目前支持有 SHELL、SQL、SUB_PROCESS(子流程)、PROCEDURE、MR、SPARK、PYTHON、DEPENDENT(依赖)等，同时计划支持动态插件扩展，注意：其中子 SUB_PROCESS 也是一个单独的流程定义，是可以单独启动执行的
调度方式：系统支持基于 cron 表达式的定时调度和手动调度。命令类型支持：启动工作流、从当前节点开始执行、恢复被容错的工作流、恢复暂停流程、从失败节点开始执行、补数、定时、重跑、暂停、停止、恢复等待线程。其中恢复被容错的工作流和恢复等待线程两种命令类型是由调度内部控制使用，外部无法调用
定时调度：系统采用 quartz 分布式调度器，并同时支持 cron 表达式可视化的生成
依赖：系统不单单支持 DAG 简单的前驱和后继节点之间的依赖，同时还提供任务依赖节点，支持流程间的自定义任务依赖
优先级：支持流程实例和任务实例的优先级，如果流程实例和任务实例的优先级不设置，则默认是先进先出
邮件告警：支持 SQL任务查询结果邮件发送，流程实例运行结果邮件告警及容错告警通知
失败策略：对于并行运行的任务，如果有任务失败，提供两种失败策略处理方式，继续是指不管并行运行任务的状态，直到流程失败结束。结束是指一旦发现失败任务，则同时Kill掉正在运行的并行任务，流程失败结束
补数：补历史数据，支持区间并行和串行两种补数方式

四.功能介绍

4.1 首页&项目管理

4.1.1 首页

首页包含用户所有项目的任务状态统计、流程状态统计、工程流定义统计。

4.1.2 项目管理

点击项目管理模块下的创建项目进行项目创建。

项目管理包括以下模块：项目首页、工作流（工作流定义、工作流实例、任务实例）

4.1.2.1 项目首页

项目首页包含该项目的任务状态统计、流程状态统计、工作流定义统计。
任务状态统计：是指在指定时间范围内，统计任务实例中的待运行、失败、运行中、完成、成功的个数
流程状态统计：是指在指定时间范围内，统计工作流实例中的待运行、失败、运行中、完成、成功的个数
流程定义统计：是统计当前用户有权限的项目的工作流定义总数
注意：工作流定义的工作流每执行一次，就产生一个工作流实例。一个工作流实例包含一到多个任务实例。

4.1.2.2 工作流定义

定义工作流

工作流定义可以在画板中创建任务的执行流程，此处以shell任务为例。配置如下：

点击连接线添加任务依赖关系：

当任务实例定义完成后，点击保存，设置相关参数：

完成以上操作即成功创建一个工作流，可以对工作流进行编辑、上下线、添加定时任务、查看属性图等操作。

步骤中涉及到的一些名词解释：

运行标志

正常：运行工作流时正常执行该任务

禁止执行：运行工作流不会执行该任务

任务优先级：当 worker 线程数不足时，级别高的任务在执行队列中会优先执行，相同优先级的任务按照先进先出的顺序执行
超时告警：
超时告警：当任务执行时间超过超时时长，会发送告警邮件，且任务运行不会停止
超时失败：当任务执行时间超过超时时长，任务超时失败。若有重试次数，则会重新运行当前任务
上述两个选项可同时勾选，则任务超时后，会发送告警邮件且任务超时失败
资源：资源文件是

资源中心 ->文件管理页面

创建或上传的文件，如文件名为

test.sh

，脚本中调用资源命令为

sh test.sh（如果脚本是在相应创建目录下，则应带入文件夹名称。）例如：创建test.sh在文件夹test_2021下，调用资源命令为sh test/test.sh

在操作工作流时注意：

上线：工作流状态为 "下线" 时，上线工作流，只有 "上线" 状态的工作流能运行，但不能编辑。
下线：工作流状态为 "上线" 时，下线工作流，下线状态的工作流可以编辑，但不能运行。
运行：只有上线的工作流能运行。
定时：只有上线的工作流能设置定时，系统自动定时调度工作流运行。创建定时后的状态为"下线"，需在定时管理页面上线定时才生效。

运行工作流

当工作流上线后可以手动运行或定时运行。当工作流开始运行，工作流实例页面回生成一条工作流实例。

工作流运行参数说明:

失败策略 ：当某一个任务节点执行失败时，其他并行的任务节点需要执行的策略。
1. 1. 继续：某一任务失败后，其他任务节点正常执行；

结束：终止所有正在执行的任务，并终止整个流程。

通知策略：当流程结束，根据流程状态发送流程执行信息通知邮件，包含任何状态都不发，成功发，失败发，成功或失败都发。

流程优先级：流程运行的优先级，分五个等级：最高（HIGHEST），高(HIGH),中（MEDIUM）,低（LOW），最低（LOWEST）。

当 master 线程数不足时，级别高的流程在执行队列中会优先执行，相同优先级的流程按照先进先出的顺序执行。

Worker分组：该流程只能在指定的 worker 机器组里执行。默认是 Default，可以在任一 worker 上执行。如果需要调用具体worker机器上的脚本，需在worker指定具体的worker机器
通知组：发送流程信息或邮件到通知组里的所有成员。
收件人：发送流程信息或告警邮件到收件人列表。
抄送人：抄送流程信息或告警邮件到抄送人列表。
补数：执行指定日期的工作流定义，可以选择补数时间范围包括
- 串行补数：指定时间范围内，从开始日期至结束日期依次执行补数，只生成一条流程实例；
- 并行补数：指定时间范围内，多天同时进行补数，生成 N 条流程实例。

注：

补数目前只支持针对连续的天进行补数，比如需要补 11月1号到 11月10号的数据：

串行模式：补数从 11月1号到11月10号依次执行，流程实例页面生成一条流程实例；
并行模式：同时执行11月1号到11月10号的任务，流程实例页面生成十条流程实例。

定时配置

工作流完成上线操作后可以设置定时运行。

点击定时按钮，选择起止时间。在起止时间范围内，定时运行工作流；不在起止时间范围内，不再产生定时工作流实例。例如配置自 2020-09-01 到 2020-09-30，每 10分钟运行一次，设置通知策略为失败发，并添加告警组，此处配置示例如下：

点击 "创建" 按钮，创建定时成功，此时定时状态为 "下线"，定时需上线才生效。

点击 "定时管理" 按钮

点击 "上线" 按钮，工作流定时生效。

定时上线成功。

当状态、定时状态都为上线时，代表任务流可以按时调度。

注意：当将工作流下线后，定时任务调度会跟着下线，而再次上线工作流时，里面定时任务调度不会跟着上线，需手动将定时任务调度上线。

导入工作流

实际生产中可以将测试环境中完成的工作流进行导出，并在生产环境中导入工作流。工作流导入后默认为下线状态，需要手动上线。

4.1.2.3 工作流实例

工作流实例操作功能：

编辑：可以对已经终止的流程进行编辑，编辑后保存的时候，可以选择是否更新到工作流定义
重跑：可以对已经终止的流程进行重新执行
恢复失败：针对失败的流程，可以执行恢复失败操作，从失败的节点开始执行
停止：对正在运行的流程进行停止操作，后台会先 kill worker 进程，再执行kill -9操作
暂停：可以对正在运行的流程进行暂停操作，系统状态变为等待执行，会等待正在执行的任务结束，暂停下一个要执行的任务
恢复暂停：可以对暂停的流程恢复，直接从暂停的节点开始运行
删除：删除工作流实例及工作流实例下的任务实例
甘特图：Gantt 图纵轴是某个工作流实例下的任务实例的拓扑排序，横轴是任务实例的运行时间

4.1.2.4 任务实例

右侧可以查看日志，点击工作流实例名称，可以跳转到工作流实例DAG图查看任务状态。

4.1.3 任务节点类型和参数设置

DolphinScheduler 支持：Shell、SUB_PROCESS、PROCEDURE、SQL、SPARK、FLINK、MR、PYTHON、DEPENDENT、HTTP、DATAX、SQOOP、CONDITIONS 等任务类型。

4.1.3.1 Shell

注意：

用shell脚本封装的hql里面必定不能用--来写注释,可能碰到任务一直处于运行状态,一直卡在那里。

在shell节点内需要调用其他内容时，建议创建多个shell节点来进行分别调用，方便出现问题时日志排查。

4.1.3.2 SUB_PROCESS（子流程）

子流程节点，就是把外部的某个工作流定义当做一个任务节点去执行。

创建工作流，在工作流中创建SUB_PROCESS任务：

右上角进入子流程需该任务已经执行一次后才可以进入相应的子流程内，否则显示为空白内容。

在使用中，当B工做流依赖于A这个子工做流时,咱们执行B工做流便可,它会先执行A工做流,只有A工做流执行成功,才会继续执行B工做流.注意:不要先把A工做流本身执行一遍,而后再去执行B工做流,这样的话A工做流会被执行2次,会致使错误的结果.

4.1.3.3 PROCEDURE（存储过程）

存储过程节点根据选择的数据源，执行存储过程。

主要参数说明：

数据源：存储过程的数据源类型支持MySQL、postgresql、clickhouse、oracle、SQLserver。选择对应的数据源即可。
方法：存储过程的方法名称
自定义参数：存储过程的自定义参数类型支持IN、OUT两种，数据类型支持 VARCHAR、INTEGER、LONG、FLOAT、DOUBLE、DATE、TIME、TIMESTAMP、BOOLEAN 九种数据类型

4.1.3.4 SQL

主要参数说明：

sql 类型：支持查询和非查询两种
- 查询：是 select 类型的查询，是有结果集返回的，可以指定邮件通知为表格、附件或表格附件三种模板。
- 非查询是没有结果集返回的，是针对 update、delete、insert 三种类型的操作
UDF 函数：对于 HIVE 类型的数据源，可以引用资源中心中创建的 UDF 函数,其他类型的数据源暂不支持 UDF 函数。
自定义参数：
- SQL 任务类型和存储过程是自定义参数顺序的给方法设置值。
- 自定义参数类型和数据类型同存储过程任务类型相同。
- 区别在于 SQL 任务类型自定义参数会替换 sql 语句中 ${变量}
前置 sql：在 sql 语句之前执行
后置 sql：在 sql 语句之后执行

4.1.3.5 SPARK

通过 SPARK 节点，可以直接直接执行 SPARK 程序，对于 spark 节点，worker 会使用 spark-submit 方式提交任务。

主要参数说明：

程序类型：支持 JAVA、Scala 和 Python 三种语言
- JAVA 和 Scala 只是用来标识，没有区别，如果是 Python 开发的 Spark 则没有主函数的 class，其他都是一样
主函数的 class：是 Spark 程序的入口 Main Class 的全路径
主 jar 包：是 Spark 的 jar 包
部署方式：支持 yarn-cluster、yarn-client 和 local 三种模式
Driver 内核数：可以设置 Driver 内核数及内存数
Executor 数量：可以设置 Executor 数量、Executor 内存数和 Executor 内核数
命令行参数：是设置 Spark 程序的输入参数，支持自定义参数变量的替换。
其他参数：支持 --jars、--files、--archives、--conf 格式
资源：如果其他参数中引用了资源文件，需要在资源中选择指定
自定义参数：是 MR 局部的用户自定义参数，会替换脚本中以 ${变量} 的内容

4.1.3.6 FLINK

flink只作为参数说明，具体使用后续同步。

主要参数说明：

部署方式：支持 cluster、local 模式
slot 数量：可以设置 slot 数
taskManage 数量：可以设置 taskManage 数
jobManager 内存数：可以设置 jobManager 内存数
taskManager 内存数：可以设置 taskManager 内存数
命令行参数：是设置 Spark 程序的输入参数，支持自定义参数变量的替换。
其他参数：支持 --jars、--files、--archives、--conf格式
资源：如果其他参数中引用了资源文件，需要在资源中选择指定
自定义参数：是 Flink 局部的用户自定义参数，会替换脚本中以 ${变量} 的内容

若使用的时 Flink local 模式，可以正常运行；若使用前文中源码编译方式部署，且注释了相关参数，则不支持 Flink local 模式，仅能使用 Flink cluster 的模式进行提交。

4.1.3.7 MAPREDUCE

主要参数说明：

命令行参数：是设置 MR 程序的输入参数，支持自定义参数变量的替换
其他参数：支持 –D、-files、-libjars、-archives 格式

4.1.3.8 Python

与shell同理。

4.1.3.9 DEPENDENT（依赖节点）

依赖节点，就是依赖检查节点,，提供了逻辑判断功能。比如 A 流程依赖昨天的 B 流程执行成功，依赖节点会去检查 B 流程在昨天是否有执行成功的实例。

4.1.3.10 HTTP

主要参数说明：

请求地址：http 请求 URL。

请求类型：支持 GET、POSt、HEAD、PUT、DELETE。

请求参数：支持 Parameter、Body、Headers。

校验条件：支持默认响应码、自定义响应码、内容包含、内容不包含。

校验内容：当校验条件选择自定义响应码、内容包含、内容不包含时，需填写校验内容。

自定义参数：是 http 局部的用户自定义参数，会替换脚本中以 ${变量} 的内容。

4.1.3.11 DATAX

4.1.3.12SQOOP

Sqoop 是 Hadoop 和关系数据库服务器之间传送数据的一种工具。它是用来从关系数据库如：MySQL，Oracle 到Hadoop 的 HDFS，并从 Hadoop 的文件系统导出数据到关系数据库。

4.1.3.13 CONDITIONS

CONDITIONS 用于判断上个作业执行结果，根据成功或失败继续后面不同的流程。

注意：使用此节点应先将此节点保存添加后，即可选择分支流转内容，否则无法选择分支流转内容。

4.2 资源中心

4.2.1文件管理

是对各种资源文件的管理，包括创建文件夹、创建文件、上传文件等操作。

文件格式支持以下几种类型：txt、log、sh、conf、cfg、py、java、sql、xml、hql、properties

文件可在线编辑、重命名、下载、删除。

4.2.2 UDF管理

1）资源管理

资源管理和文件管理功能类似，不同之处是专门上传UDF函数

2）函数管理

可以创建临时UDF函数。

4.3 数据源中心

数据源中心支持 MySQL、POSTGRESQL、HIVE/IMPALA、SPARK、CLICKHOUSE、ORACLE、SQLSERVER 等数据源。

4.4 监控中心

包含以下功能：

服务管理

master 监控
worker 监控
Zookeeper 监控
DB 监控

4.5 安全中心

4.5.1 租户管理

租户：对应的linux系统的用户，用于worker提交作业锁使用的用户。如果Linux没有这个用户，worker会在执行脚本时自动创建用户（在部署时使用的高权限linux用户）。

租户编码：与租户填写一致。

新建租户会在HDFS上/user目录下创建租户目录，租户目录下为改租户上传的文件和UDF函数。文件夹名称为home、resources、udfs。

租户名称：租户编码的别名。

4.5.2 用户管理

安全中心—>用户管理—>创建用户

用户分为管理员用户和普通用户。在创建用户时根据需要，给予用户相应租户权限。

通过管理员用户，对相应普通用户授予权限，包括：项目权限、资源权限、数据源权限、udf函数权限。

实际使用中，若需要删除用户，需将该用户所建立项目内的任务删除----》删除项目------》删除用户，否则会出现任务无法运行，项目不可见等情况。

4.5.3 告警组管理

安全中心—>告警组管理—>创建告警组（目前仅支持邮件告警）

告警组根据需要进行创建，创建后可以添加项目组内成员及部门邮箱。

4.5.4 Worker分组管理

安全中心—>worker管理—>创建worker分组

4.5.5 队列管理

安全中心—>队列管理—>创建队列

队列是在执行spark、MR任务等程序，需要指定“队列”参数时使用

4.5.6 令牌管理

安全中心—>令牌管理—>创建令牌

可以对相关用户创建token，便于后端调用平台相关任务。

五、参数设置

5.1系统参数

（2.0.2版本已经优化补数时存在的问题）

${system.biz.date}

日常调度实例定时的定时时间前一天，格式为 yyyyMMdd，补数据时，该日期 +1

${system.biz.curdate}

日常调度实例定时的定时时间，格式为 yyyyMMdd，补数据时，该日期 +1

${system.datetime}

日常调度实例定时的定时时间，格式为 yyyyMMddHHmmss，补数据时，该日期 +1

5.2 时间自定义参数

例：当前时间为20211207111418

序号	表达式	结果
1	后 N 年：$[add_months(yyyyMMdd,12*N)]	echo "后 1 年：" 20221207
2	前 N 年：$[add_months(yyyyMMdd,-12*N)]	echo "前 1 年：" 20201207
3	后 N 月：$[add_months(yyyyMMdd,N)]	echo "后 1 月：" 20220107
4	前 N 月：$[add_months(yyyyMMdd,-N)]	echo "前 1 月：" 20211107
5	后 N 周：$[yyyyMMdd+7*N]	echo "后 1 周：" 20211214
6	前 N 周：$[yyyyMMdd-7*N]	echo "前 1 周：" 20211130
7	后 N 天：$[yyyyMMdd+N]	echo "后 1 天：" 20211208
8	前 N 天：$[yyyyMMdd-N]	echo "前 1 天：" 20211206
9	后 N 小时：$[HHmmss+N/24]	echo "后 1 小时：" 121418
10	前 N 小时：$[HHmmss-N/24]	echo "前 1 小时：" 101418
11	后 N 分钟：$[HHmmss+N/24/60]	echo "后 1 分钟：" 111518
12	前 N 分钟：$[HHmmss-N/24/60]	echo "前 1 分钟：" 111318
13	前一小时：$[yyyyMMddHHmmss-1/24]	echo”前 1 小时：“20211207101418

5.3 用户自定义参数

用户自定义参数分为全局参数和局部参数。

全局参数：保存工作流定义时传递的参数，全局参数可以在整个流程中的任何一个任务节点的局部参数中引用。

局部参数：保存 工作流实例 时传递的参数

六、平台升级

6.1 升级流程

1、下载新版本源码包（2.0.3）

参照生产环境部署内容进行修改源码内信息，使根pom文件内版本信息与集群环境版本相匹配。
对源码进行编译打包、上传至相关服务器

2、修改新版本配置文件内容 conf/config/install_config.conf

注意点：所有修改的配置信息应在引号内进行填写，多余的引用字符需去除。

相关配置信息可以参照老版本的install_config.conf进行修改配置

3、需将新版本文件夹在每个服务器进行上传，需注意创建的目录用户权限问题，注意安装目录下data目录的创建及权限

4、将mysql的jar包上传至新版本目录、lib下，并设置权限

5、将hadoop配置文件上传至、conf文件夹下包括：core-site.xml 和hdfs-site.xml

6、conf/env下的环境变量可以在配置文件中设置，也可以后期通过平台进行设置

7、在升级平台后，会短暂出现数据访问不到的问题，大约过十分钟左右数据加载上即可展示。

6.2 升级内容

1、相关配置信息进行可配置化管理，例如环境变量、告警组等信息

2、工作流新增版本信息，可记录工作流中个版本内容，方便进行工作流的版本控制工作。注意：针对于已上线工作流，如需切换版本，需将任务流进行下线操作，

3、优化页面内容，使任务流绘制更易操作，减去上一版本的重复操作内容。

6.3 新版本问题

有部分内容显示存在异常问题，需对源码进行调整。

七、常见问题

7.1 jar包问题

在sqoop目录lib下，添加MySQL的jdbc连接jar包即可（版本至少为5.1.35,同时确认jar包权限）。

7.2 权限问题

确认执行脚本的平台租户是否具有权限访问hive相关数据表。在平台创建租户时注意租户应与服务器用户对应。

由于平台并没有过多设计权限管理的工作，如需详细的权限管理需进行二次开发。

排查日志

查看worker 日志

tail -f /opt/soft/dolphinscheduler/logs/dolphinscheduler-worker.log

查看master日志

tail -f /opt/soft/dolphinscheduler/logs/dolphinscheduler-master.log

查看api 日志

tail -f /opt/soft/dolphinscheduler/logs/dolphinscheduler-api-server.log

查看告警alert日志

tail -f /opt/soft/dolphinscheduler/logs/dolphinscheduler-alert.log

查看日志服务logger日志

tail -f dolphinscheduler-worker-server-rh-hadoop02-n011-011.out

tail -f dolphinscheduler-worker-server-rh-hadoop02-n013-013.out

附录：平台元数据表信息

平台元数据MySQL说明

表名	表信息
t_ds_access_token	访问 ds 后端的 token
t_ds_alert	告警信息
t_ds_alertgroup	告警组
t_ds_command	执行命令
t_ds_datasource	数据源
t_ds_error_command	错误命令
t_ds_process_definition	流程定义
t_ds_process_instance	流程实例
t_ds_project	项目
t_ds_queue	队列
t_ds_relation_datasource_user	用户关联数据源
t_ds_relation_process_instance	子流程
t_ds_relation_project_user	用户关联项目
t_ds_relation_resources_user	用户关联资源
t_ds_relation_udfs_user	用户关联 UDF 函数
t_ds_relation_user_alertgroup	用户关联告警组
t_ds_resources	资源文件
t_ds_schedules	流程定时调度
t_ds_session	用户登录的 session
t_ds_task_instance	任务实例
t_ds_tenant	租户
t_ds_udfs	UDF 资源
t_ds_user	用户
t_ds_version	ds 版本信息

相关表内字段信息参照官网链接：

https://dolphinscheduler.apache.org/zh-cn/docs/1.3.2/user_doc/metadata-1.3.html

你可能感兴趣的:(大数据工具安装使用,hive,spark,big,data,etl)

Android Jetpack架构组件(四)之LiveData xiangzhihong8 深入Android应用开发
一、LiveData简介LiveData是Jetpack架构组件Lifecycle库的一部分，是一个可感知生命周期的可观察容器类(Observable)。与常规的可观察类不同，LiveData具有生命周期感知能力，这意味着它具有感知应用组件（如Activity、Fragment或Service）的生命周期的能力，并且LiveData仅更新处于活跃生命周期状态的应用组件观察者。因此，LiveData
掌握Android Jetpack，优化移动开发体验移动开发前沿移动端开发宝典 android jetpack android ai
掌握AndroidJetpack，优化移动开发体验关键词：AndroidJetpack、组件化开发、ViewModel、LiveData、Room、Navigation、Compose摘要：本文深入探讨AndroidJetpack组件库的核心架构和使用方法，通过系统化的讲解和实战演示，帮助开发者理解如何利用Jetpack系列组件提升开发效率、构建健壮的Android应用。文章将从基础概念入手，逐步
ORACLE 正确删除归档日志的方法俗尘某某程序员记录 oracle 归档日志
ORACLE正确删除归档日志的方法我们都知道在controlfile中记录着每一个archivelog文件的相关信息，当然们在OS下把这些物理文件delete掉后，在我们的controlfile中仍然记录着这些archivelog文件的相关信息，在oracle的OEM管理器中有可视化的日志展现出，当我们手工清除archive目录下的文件后，这些记录并没有被我们从controlfile中清除掉，也就
MVI+Compose架构实战 Android洋芋 MVI JetpackCompose Kotlin Flow 状态管理声明式UI
简介本文将深入探讨为什么LiveData不适合在JetpackCompose中使用，并通过完整代码示例展示MVI+Compose架构的实现。从Android架构演进历史到Composable函数的重组机制，从单向数据流原理到StateFlow的线程安全特性，全面解析这一技术趋势背后的深层原因。一、为什么LiveData不适合在JetpackCompose中使用？LiveData与Compose的单
Java web开发常见中间件多版本下载备用却诚Salong 安装问题和解决方法 java 中间件开发语言
备注：每次换电脑都要重新构建一下环境，下载找资源很麻烦，官网英文网页找个历史版本看不懂，还要慢慢去搜，所以直接整理一波，需要的自行收藏。1.nodejs自选版本下载：地址：https://nodejs.org/download/release/网速快，自选任何版本下载。2.maven自选版本下载：地址：https://archive.apache.org/dist/maven/maven-3/网速
树莓派实验——人脸识别 Rounie opencv python 计算机视觉
importnumpyasnp#导入numpy科学计算库importcv2#导入OpenCV函数库#装载人脸识别特征文件face_cascade=cv2.CascadeClassifier('/usr/local/lib/python3.5/dist-packages/cv2/data/haarcascade_frontalface_alt.xml')cap=cv2.VideoCapture(0)
数据中心双活架构解决方案
数据中心双活架构解决方案数据中心双活架构（Active-ActiveDataCenter）旨在实现业务高可用、负载均衡和灾难自动切换。以下是完整的解决方案，涵盖架构设计、关键技术、实施步骤及最佳实践。1.双活架构设计1.1基本架构模型同城双活（MetroActive-Active）两个数据中心距离≤100km（低延迟，通常100km（延迟较高，通常>10ms）采用异步数据复制（如Kafka+CDC
[第一章 web入门]SQL注入-2 weixin_40546436 渗透测试
1通过updatexml取数据从页面发现有一个提示如果加上?tips=1的话，通过burpsuite发包可以通过updatexml来查看回显，可以通过这个取到数据下面是通过updatexml来注入，这时4步中用到语句name=admin’andupdatexml(1,concat(0x7e,(select(database())),0x7e),1)#&pass=bbname=admin’andup
GUI框架：谈谈框架 baozi3026 框架 command mfc button class string
转帖请注明出处http://www.cppblog.com/cexer/archive/2009/11/15/100988.html1开篇废话我喜欢用C++写GUI框架，因为那种成就感是实实在在地能看到的。从毕业到现在写了好多个了，都是实验性质的。什么拳脚飞刀毒暗器，激光核能反物质，不论是旁门左道的阴暗伎俩，还是名门正派的高明手段，只要是C++里有的技术都试过了。这当中接触过很多底层或是高级的技术
Spark从入门到熟悉（篇三）小新学习屋数据分析 spark 大数据分布式
本文介绍Spark的DataFrame、SparkSQL，并进行SparkSQL实战，加强对编程的理解，实现快速入手知识脉络包含如下7部分内容：RDD和DataFrame、SparkSQL的对比创建DataFrameDataFrame保存成文件DataFrame的API交互DataFrame的SQL交互SparkSQL实战参考资料RDD和DataFrame、SparkSQL的对比RDD对比Data
使用GPU进行机器学习训练时，如果GPU-Util计算核心满载工作但是显存占用较少，应该如何优化？十子木机器学习深度学习人工智能
是否需要优化？如果任务运行正常：无需干预（GPU设计本就是优先榨干计算性能）。如果出现卡顿或效率低下：增大batch_size：提升显存占用，减少数据搬运次数（但需避免OOM）。启用混合精度：torch.cuda.amp可减少显存占用并加速计算。检查CPU到GPU的数据流：避免频繁的小数据拷贝（如DataLoader的num_workers设置）。
变幻莫测：CoreData 中 Transformable 类型面面俱到（八）大熊猫侯佩 Apple开发入门 CoreData Transformable Data SwiftData 类型转换 Codable Swift
概述各位似秃似不秃小码农们都知道，在苹果众多开发平台中CoreData无疑是那个最简洁、拥有“官方认证”且最具兼容性的数据库框架。使用它可以让我们非常方便的搭建出App所需要的持久存储体系。不过，大家是否知道在CoreData中还存在一个Transformable类型，它到底是个啥？应用场景有哪些？在最新的SwiftData中有没有对应物？对于开发者又有哪些“见雀张罗”的撸码陷阱和最佳实践呢？在本
Android 中函数实现多个返回值的几种方式
在编程中，函数通常只能返回一个值。但通过使用对象封装、Pair、Triple、数组、列表或Bundle方式，可以轻松地返回多个值。1、对象封装方式创建数据类来封装需要返回的多个值。dataclassResult(valcode:Int,valmessage:String)fungetMultiValues():Result{returnResult(1,"success")}//调用方式valre
ZYNQ MPSOC PL端DDR4读写--介绍（1） LEEE@FPGA FPGA高速接口开发 fpga开发 DDR4
1DDR4介绍DDR4SDRAM（Double-Data-RateFourthGenerationSynchronousDynamicRandomAccessMemory，简称为DDR4SDRAM），是一种高速动态随机存取存储器，它属于SDRAM家族的存储器产品，提供了相较于DDR3SDRAM更高的运行性能与更低的电压，并被广泛的应用于计算机的运行缓存。DDR4主要特点1)更高频率与带宽起步频率为
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二) 争取不加班！ hadoop hbase zookeeper 大数据运维
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
大模型学习（Datawhale_Happy-LLM）笔记7: Encoder-Decoder PLM lxltom 学习笔记 language model 自然语言处理神经网络人工智能深度学习
大模型学习（Datawhale_Happy-LLM）笔记7:Encoder-DecoderPLM1.Encoder-Decoder架构概述1.1架构基础Encoder-DecoderPLM是基于原始Transformer架构的完整实现，它同时保留了编码器（Encoder）和解码器（Decoder）两个核心组件。这种设计使得模型能够兼具文本理解和生成的双重能力，特别适合处理序列到序列（Seq2Seq
《UNIX环境高级编程》笔记第三章——文件IO（2) day_day_hard_up Linux系统编程笔记 linux c语言 unix
1.简介本文是上一篇笔记文件IO（1）的续写，接下来继续补充一些文件IO特性以及介绍剩下的一些函数。文件IO的读写效率与调用时传入的buf大小有关，也与打开的文件描述标志有关（O_SYNC和O_DSYNC），影响效率IO效率的相关函数有sync、fsync和fdatasync。理解dup、dup2和fcntl函数的预前知识:（1）每个进在进程表中都有一个记录项，记录项包含一张打开的文件描述符表，每
mongodb 基本概念重生之我是一名程序员 mongodb
mongodb基本概念基于mongo:4.4.2databasedatabase数据库tablecollection数据库表/集合rowdocument数据记录行/文档columnfield数据字段/域indexindex索引tablejoins表连接,MongoDB不支持primarykeyprimarykey主键,MongoDB自动将_id字段设置为主键MongoDB数据类型数据类型描述Str
数据结构之顺序表 Capricorn_man 数据结构
一、创建头文件typedefintSLDataType;//动态存储typedefstructSeqList{SLDataType*a;//动态开辟的数组intsize;//有效数据的数量intcapacity;//空间大小}SL;二、初始化顺序表voidSLInit(SL*psl){assert(psl);psl->a=NULL;psl->size=0;psl->capacity=0;}三、销毁
【分析学】从有限开覆盖定理出发 -- 实数系完备性 BlackPercy 分析学数学高等数学
目录有限开覆盖定理实数系完备性定理确界定理单调有界定理闭区间套定理聚点定理柯西收敛定理有限开覆盖定理开覆盖定义：设{Ui}i∈I\{U_i\}_{i\inI}{Ui}i∈I是一个开覆盖，即[a,b]⊆⋃i∈IUi[a,b]\subseteq\bigcup_{i\inI}U_i[a,b]⊆⋃i∈IUi,称⋃i∈IUi\bigcup_{i\inI}U_i⋃i∈IUi为闭区间[a,b][a,b][a,b
FFmpeg中TS与MP4格式的extradata差异详解码流怪侠音视频基础 ffmpeg MP4 TS 音视频 extradata 视频编解码实时音视频
在视频处理中，extradata是存储解码器初始化参数的核心元数据，直接影响视频能否正确解码。本文深入解析TS和MP4格式中extradata的结构差异、存储逻辑及FFmpeg处理方案。一、extradata的核心作用extradata是解码必需的参数集合，包含：H.264：SPS（序列参数集）、PPS（图像参数集）H.265：VPS（视频参数集）、SPS、PPS音频：采样率、声道数等配置其核心功
使用 `pytest` 框架时，可以通过极限封装将 YAML 文件的读取、解析小赖同学啊 python pytest 服务器运维
在使用pytest框架时，可以通过极限封装将YAML文件的读取、解析和测试用例的通用逻辑封装成共享的方法或fixture，从而减少重复代码。以下是详细的实现步骤和示例。1.封装YAML文件读取和解析将YAML文件的读取和解析逻辑封装到一个工具函数中，供所有测试用例调用。示例YAML文件#test_data.yamltest_cases:-name:TestCase1input:5e
nanoGPT复现——prepare拆解（自己构建词表 VS tiktoken） 2301_80365274 python 开发语言
在nanoGPT的data文件夹有两个很相似的文件夹结构：shakespeare和shakespeare-char，这两种都是对shakespeare数据集的处理，但是shakespeare使用的是tiktoken对文字进行编码，另一个则是使用自己构建的词表一、shakespeare-char（自己构建词表）数据获取data_path=os.path.join(os.path.dirname(__
PgSQL内核代码阅读|查询的两种实现方式
PgSQL内核代码阅读|查询的两种实现方式PgSQL查询用户表时，针对带有WHERE条件的顺序扫描查询，他会从存储加载数据，然后一条一条的从页中读取数据，并将其返回给SeqScan算子。在SeqScan算子中处理WHERE过滤，即ExecQual函数处理过滤表达式。对于系统表还有另一种查询方式，即使不经过索引，也可以通过ScanKeyInit将过滤条件值带入ScanKeyData中，从而在存储层就
MATLAB代码实现了一个完整的ARIMA时间序列分析与预测流程神经网络697344 算法深度学习 MATLAB matlab 信息可视化开发语言
%%1.数据准备years=(2010:2024)';data=[11894,12277,12777,13262,13902,14524,15037,15961,16724,...17767,19064,20056,20978,21676,22023]';%创建时间序列对象ts=timeseries(data,years,'Name','65岁以上人口');ts.TimeInfo.Units='y
基于springboot+mysql+jpa+html实现商品销售信息系统五星资源 spring boot mysql java
基于springboot+mysql+jpa+html实现商品销售信息系统一、系统介绍1、系统主要功能：2.涉及技术框架：3.本项目所用环境：二、功能展示三、其它系统四、获取源码一、系统介绍1、系统主要功能：订单管理模块商品管理模块品牌管理模块分类管理模块客户管理模块供应商管理模块2.涉及技术框架：web框架：SpringBoot数据库框架：SpingDataJPA数据库：MySql项目构建工具：
Excel 数据合并助手SheetDataMerge智能识别同类数据，销售报表处理提升效率小龙软件库电脑开源软件 windows
各位Excel小能手们！今天给大家介绍个超厉害的玩意儿——SheetDataMerge，这可是专注Excel数据处理的实用工具！它就像个数据小管家，核心功能就是智能合并工作表里的同类数据。软件下载地址安装包它有多牛呢？能自动识别表格里关键字段相同的行或者列，对数值型数据进行求和、求平均值这些数学运算，对文本型数据还能智能拼接。举个例子，处理销售数据的时候，如果好多行记录里“产品编号”和“日期”字段
java数据保存到文件_Java把数据存储到本地txt文件永不放弃yes java数据保存到文件
码农公社210.net.cn210=102410月24日一个重要的节日--码农(程序员)节Java把数据存储到本地txt文件java存储数据，方便打印日志等1、覆盖以前的数据try{FilewriteName=newFile("D:\\data.txt");//相对路径，如果没有则要建立一个新的output.txt文件if(!writeName.exists()){writeName.create
PAT A 1057 Stack
Stackisoneofthemostfundamentaldatastructures,whichisbasedontheprincipleofLastInFirstOut(LIFO).Thebasicoper‐ationsincludePush(insertinganelementontothetopposition)andPop(deletingthetopelement).Nowyouar
Java基础集合框架之Set框架之LinkedHashSet 骑牛小道士集合框架之Set java 开发语言
LinkedHashSetLinkedHashSet构造方法LinkedHashSet底层数据结构及实现原理LinkedHashSet核心特性有序性插入顺序排序伪访问顺序排序(LRU)元素唯一性底层数据结构:[哈希桶+(链表或红黑树)]+追加的双向链表允许null值LinkedHashSet线程不安全LinkedHashSet线程不安全体现解决方案LinkedHashSet优缺点以及适用场景pub
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>