大数据东哥(Aidon)

DolphinScheduler 2.0.5详解

文章目录

- - 第一章 DolphinScheduler介绍
  - - 1.1 关于DolphinScheduler
    - 1.2 DolphinScheduler特性
    - 1.3 配置建议
    - - 1.3.1 Linux 操作系统版本要求
      - 1.3.2 服务器建议配置
      - 1.3.3 生产环境
      - 1.3.4 网络要求
      - 1.3.5 客户端 Web 浏览器要求
  - 第二章 DolphinScheduler安装部署
  - - 2.1 安装部署介绍
    - 2.2 单机版部署
    - 2.3 集群部署
    - - 2.3.1 集群规划
      - 2.3.2 集群准备工作
      - 2.3.3 修改相关配置
      - 2.3.4 初始化数据库
      - 2.3.5 安装并启动DolphinScheduler
      - 2.3.6 启停命令
      - 2.3.7 登录DolphinScheduler
      - 2.3.8 Master和Worker查看
      - 2.3.9 集群安装部署流程总结
  - 第三章 DolphinScheduler功能应用
  - - 3.1 租户创建
    - 3.2 创建用户
    - 3.3 创建项目
    - 3.4 进入项目
    - 3.5 创建工作流
    - 3.6 创建依赖或者并行任务工作流
    - 3.7 上线执行-补数-重跑执行
    - 3.8 工作流中单个任务运行
    - 3.9 定时管理
    - 3.10 工作流的导出导入
    - 3.11 数据中心操作
    - - 3.11.1 MySQL数据源
      - 3.11.2 MySQL数据源创建问题解决
      - 3.11.3 Hive数据源准备
      - 3.11.4 Hiveserver2连接错误
      - 3.11.5 Hive数据源连接
      - 3.11.6 Spark的数据源
    - 3.12 任务类型
    - - 3.12.1 Shell类型
      - 3.12.2 SQL类型
      - 3.12.3 Hive任务类型
      - 3.12.4 Python类型
    - 3.13 参数
    - - 3.13.1 内置参数
      - 3.13.2 衍生内置参数
      - 3.13.3 本地和全局参数
      - 3.13.4 参数优先级
    - 3.14 告警
    - - 3.14.1 钉钉告警准备
      - 3.14.2 钉钉告警

第一章 DolphinScheduler介绍

1.1 关于DolphinScheduler

**定义：**Apache DolphinScheduler是一个分布式去中心化，易扩展的可视化DAG工作流任务调度平台。

**作用：**致力于解决数据处理流程中错综复杂的依赖关系，使调度系统在数据处理流程中开箱即用。

解决错综复杂的依赖关系不能直观监控任务健康状态等问题。
DolphinScheduler以DAG流式的方式将Task组装起来，可实时监控任务的运行状态，同时支持重试、从指定节点恢复失败、暂停及Kill任务等操作。

架构：

1.2 DolphinScheduler特性

简单易用

DAG监控界面，所有流程定义都是可视化，通过拖拽任务定制DAG，通过API方式与第三方系统对接, 一键部署
高可靠性

去中心化的多Master和多Worker, 自身支持HA功能, 采用任务队列来避免过载，不会造成机器卡死
丰富的使用场景

支持暂停恢复操作.支持多租户，更好的应对大数据的使用场景. 支持更多的任务类型，如 spark, hive, mr, python, sub_process, shell
高扩展性

支持自定义任务类型，调度器使用分布式调度，调度能力随集群线性增长，Master和Worker支持动态上下线

1.3 配置建议

DolphinScheduler 作为一款开源分布式工作流任务调度系统，可以很好地部署和运行在 Intel 架构服务器及主流虚拟化环境下，并支持主流的Linux操作系统环境

1.3.1 Linux 操作系统版本要求

操作系统	版本
Red Hat Enterprise Linux	7.0 及以上
CentOS	7.0 及以上，测试Centos 6.8也可以
Oracle Enterprise Linux	7.0 及以上
Ubuntu LTS	16.04 及以上

注意： 以上 Linux 操作系统可运行在物理服务器以及 VMware、KVM、XEN 主流虚拟化环境上

1.3.2 服务器建议配置

DolphinScheduler 支持运行在 Intel x86-64 架构的 64 位通用硬件服务器平台。对生产环境的服务器硬件配置有以下建议：

1.3.3 生产环境

CPU	内存	硬盘类型	网络	实例数量
4核+	8 GB+	SAS	千兆网卡	1+

注意：

以上建议配置为部署 DolphinScheduler 的最低配置，生产环境强烈推荐使用更高的配置

硬盘大小配置建议 50GB+ ，系统盘和数据盘分开

1.3.4 网络要求

DolphinScheduler正常运行提供如下的网络端口配置：

组件	默认端口	说明
MasterServer	5678	非通信端口，只需本机端口不冲突即可
WorkerServer	1234	非通信端口，只需本机端口不冲突即可
ApiApplicationServer	12345	提供后端通信端口

注意：

MasterServer 和 WorkerServer 不需要开启网络间通信，只需本机端口不冲突即可

管理员可根据实际环境中 DolphinScheduler 组件部署方案，在网络侧和主机侧开放相关端口

1.3.5 客户端 Web 浏览器要求

DolphinScheduler 推荐 Chrome 以及使用 Chromium 内核的较新版本浏览器访问前端可视化操作界面

第二章 DolphinScheduler安装部署

2.1 安装部署介绍

DolphinScheduler提供了4种安装部署方式：

单机部署(Standalone):Standalone 仅适用于 DolphinScheduler 的快速体验。如果你是新手，想要体验 DolphinScheduler 的功能，推荐使用[Standalone]方式体检。
伪集群部署(Pseudo-Cluster)：伪集群部署目的是在单台机器部署 DolphinScheduler 服务，该模式下master、worker、api server 都在同一台机器上。如果你想体验更完整的功能，或者更大的任务量，推荐使用伪集群部署。
集群部署(Cluster)：集群部署目的是在多台机器部署 DolphinScheduler 服务，用于运行大量任务情况。如果你是在生产中使用，推荐使用集群部署或者kubernetes。
Kubernetes 部署：Kubernetes部署目的是在Kubernetes集群中部署 DolphinScheduler 服务，能调度大量任务，可用于在生产中部署。

注意:

1、Standalone仅建议20个以下工作流使用，因为其采用内存式的H2 Database, Zookeeper Testing Server，任务过多可能导致不稳定，并且如果重启或者停止standalone-server会导致内存中数据库里的数据清空。如果您要连接外部数据库，比如mysql或者postgresql。

2、Kubernetes部署先决条件：Helm3.1.0+ ；Kubernetes1.12+；PV 供应(需要基础设施支持)

2.2 单机版部署

Standalone 仅适用于 DolphinScheduler 的快速体验.

如果你是新手，想要体验 DolphinScheduler 的功能，推荐使用Standalone方式体检。如果你想体验更完整的功能，或者更大的任务量，推荐使用伪集群部署。如果你是在生产中使用，推荐使用集群部署或者kubernetes

*注意:* Standalone仅建议20个以下工作流使用，因为其采用内存式的H2 Database, Zookeeper Testing Server，任务过多可能导致不稳定，并且如果重启或者停止standalone-server会导致内存中数据库里的数据清空。如果您要连接外部数据库，比如mysql或者postgresql，请看配置数据库

前置准备工作
- JDK：下载JDK (1.8+)，安装并配置 JAVA_HOME 环境变量，并将其下的 bin 目录追加到 PATH 环境变量中。如果你的环境中已存在，可以跳过这步。
- 二进制包：在下载页面下载 DolphinScheduler 二进制包
启动 DolphinScheduler Standalone Server

解压并启动 DolphinScheduler

二进制压缩包中有 standalone 启动的脚本，解压后即可快速启动。切换到有sudo权限的用户，运行脚本

# 解压并运行 Standalone Server
[root@qianfeng01 soft]# cd /opt/soft
[root@qianfeng01 soft]# tar -zxvf apache-dolphinscheduler-2.0.5-bin.tar.gz
[root@qianfeng01 soft]# cd ./apache-dolphinscheduler-2.0.5-bin
[root@qianfeng01 apache-dolphinscheduler-2.0.5-bin]# ./bin/dolphinscheduler-daemon.sh start standalone-server
#查询dolphinscheduler的单机服务
[root@qianfeng01 apache-dolphinscheduler-2.0.5-bin]# jps
18688 Jps
18665 StandaloneServer

启停服务

脚本 ./bin/dolphinscheduler-daemon.sh 除了可以快捷启动 standalone 外，还能停止服务运行，全部命令如下

# 启动 Standalone Server 服务
[root@qianfeng01 apache-dolphinscheduler-2.0.5-bin]# ./bin/dolphinscheduler-daemon.sh start standalone-server
# 停止 Standalone Server 服务
[root@qianfeng01 apache-dolphinscheduler-2.0.5-bin]# ./bin/dolphinscheduler-daemon.sh stop standalone-server

配置数据库

Standalone server 使用 H2 数据库作为其元数据存储数据，这是为了上手简单，用户在启动服务器之前不需要启动数据库。但是如果用户想将元数据库存储在 MySQL 或 PostgreSQL 等其他数据库中，他们必须更改一些配置。请参考数据源配置 Standalone 切换元数据库 创建并初始化数据库。

单机版到此为止即可。

2.3 集群部署

2.3.1 集群规划

集群模式下，可配置多个Master及多个Worker。通常可配置2~3个Master，若干个Worker。由于集群资源有限，此处配置一个Master，三个Worker，集群规划如下。

主机名	ip	服务	备注
qianfeng01	192.168.10.101	master,worker
qianfeng02	192.168.10.102	master,worker	该服务器也可以安装master
qianfeng02	192.168.10.103	worker

2.3.2 集群准备工作

操作系统：linux centos 7.7
部署版本：apache-dolphinscheduler-2.0.5-bin
JDK：配置Java环境，将JAVA_HOME配置于PATH中，推荐版本使用jdk8+
数据库：本文使用的是MySQL 8.0.26版本，也可以使用5.7版本及以上，或者是使用PostgreSQL数据库（8.2.15+）
注册中心：zookeeper（3.4.6+）
依赖大数据相关组件及版本为：Zookeeper 3.6.3、Hadoop 3.3.1 、Hive 3.1.2 、Spark 3.1.2
创建部署用户，并为该用户配置免登录，以创建dolphinscheduler用户为例(每一台需要部署DolphinScheduler都需要执行)
```
# 创建用户需使用root登录
useradd dolphinscheduler
# 添加密码
echo "dolphinscheduler" | passwd --stdin dolphinscheduler
# 配置sudo（系统管理命令）免密
sed -i '$adolphinscheduler  ALL=(ALL)  NOPASSWD: NOPASSWD: ALL' /etc/sudoers
sed -i 's/Defaults    requirett/#Defaults    requirett/g' /etc/sudoers
```
注意:
- 因为任务执行服务是以 sudo -u {linux-user} 切换不同 linux 用户的方式来实现多租户运行作业，所以部署用户需要有 sudo 权限，而且是免密的。初学习者不理解的话，完全可以暂时忽略这一点
- 如果发现 /etc/sudoers 文件中有 “Defaults requirett” 这行，也请注释掉
配置机器SSH免密登陆

由于安装的时候需要向不同机器发送资源，所以要求各台机器间能实现SSH免密登陆。配置免密登陆的步骤如下
```
#分别在每台安装dolphinscheduler的服务器上执行如下命令
su dolphinscheduler
ssh-keygen -t rsa
ssh-copy-id qianfeng01
ssh-copy-id qianfeng02
ssh-copy-id qianfeng03
```
注意:

配置完成后，可以通过运行命令 ssh localhost 判断是否成功，如果不需要输入密码就能ssh登陆则证明成功
启动zookeeper集群(外置Zookeeper集群启动即可)
```
# 启动 zookeeper
zkServer.sh start
```

2.3.3 修改相关配置

完成了基础环境的准备后，在运行部署命令前，还需要根据环境修改配置文件。配置文件在路径在conf/config/install_config.conf下，一般部署只需要修改INSTALL MACHINE、DolphinScheduler ENV、Database、Registry Server部分即可完成部署，下面对必须修改参数进行说明

在安装之前需要修改install_config.conf文件，基础安装只需要修改INSTALL MACHINE、DolphinScheduler ENV、Database、Registry Server几个部分即可，下面对这些参数进行说明：

[root@qianfeng01 soft]# vim /opt/soft/apache-dolphinscheduler-2.0.5-bin/conf/config/install_config.conf

# ---------------------------------------------------------
# INSTALL MACHINE
# ---------------------------------------------------------
# 集群服务器（hostname/ip）
ips="qianfeng01,qianfeng02,qianfeng03"

# 默认ssh端口
sshPort="22"

# 集群主节点，多个使用逗号分隔
masters="qianfeng01"

# 集群从节点列表
workers="qianfeng01:default,qianfeng02:default,qianfeng03:default"

# 告警服务节点
alertServer="qianfeng02"

# API服务阶段
apiServers="qianfeng01"

# Python网关服务节点
pythonGatewayServers="qianfeng01"

# 集群安装目录，如果不存在由`install.sh`来创建
installPath="/usr/local/dolphinscheduler"

# 部署用户，该用户需要在`install.sh`脚本运行前在所有节点创建，还需要sudo权限，hdfs的根目录也需要该用户有权限
deployUser="dolphinscheduler"

# 数据目录，确保上述用户拥有操作权限
dataBasedirPath="/home/dolphinscheduler/data"

# ---------------------------------------------------------
# DolphinScheduler ENV
# ---------------------------------------------------------
# 指定Java安装目录
javaHome="/usr/local/jdk1.8.0_321/"

# 指定api服务端口，默认12345
apiServerPort="12345"

# ---------------------------------------------------------
# Database
# NOTICE: If database value has special characters, such as `.*[]^${}\+?|()@#&`, Please add prefix `\` for escaping.
# ---------------------------------------------------------
# 指定元数据库类型，目前支持：``postgresql``, ``mysql`, `h2``.默认h2
DATABASE_TYPE=${DATABASE_TYPE:-"mysql"}

# 指定Spring datasource url
SPRING_DATASOURCE_URL=${SPRING_DATASOURCE_URL:-"jdbc:mysql://qianfeng01:3306/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8"}

# Spring datasource username
SPRING_DATASOURCE_USERNAME=${SPRING_DATASOURCE_USERNAME:-"root"}

# Spring datasource password
SPRING_DATASOURCE_PASSWORD=${SPRING_DATASOURCE_PASSWORD:-"123456"}

# ---------------------------------------------------------
# Registry Server
# ---------------------------------------------------------
# 注册服务插件名称
registryPluginName="zookeeper"

# 注册zk集群地址
registryServers="qianfeng01:2181,qianfeng02:2181,qianfeng03:2181"

# 注册在zk中的命名空间
registryNamespace="dolphinscheduler"

# ---------------------------------------------------------
# Worker Task Server
# ---------------------------------------------------------
# worker服务插件目录
taskPluginDir="lib/plugin/task"

# 资源存储类型
resourceStorageType="HDFS"

# 资源存储路径，建议使用/dolphinscheduler
resourceUploadPath="/dolphinscheduler"

# 指定hdfs入口
defaultFS="hdfs://qianfeng01:9000"

# yarn的端口
resourceManagerHttpAddressPort="8088"

# 如果yarn开启HA，指定HA的虚拟服务名
yarnHaIps="ns-yarn"

# 单RM服务节点
singleYarnIp="yarnIp1"

# 拥有创建HDFS/S3根目录的权限用户
# Note: if kerberos is enabled, please config hdfsRootUser=
hdfsRootUser="hdfs"

# kerberos config
# kerberos启用，默认关闭
kerberosStartUp="false"
# kdc krb5 config file path
krb5ConfPath="$installPath/conf/krb5.conf"
# keytab username,watch out the @ sign should followd by \\
keytabUserName="hdfs-mycluster\\@ESZ.COM"
# username keytab path
keytabPath="$installPath/conf/hdfs.headless.keytab"
# kerberos expire time, the unit is hour
kerberosExpireTime="2"

# 是否用sudo权限
sudoEnable="true"

# worker tenant auto create
workerTenantAutoCreate="false"

如果HDFS是HA，执行如下的操作

cp /usr/local/hadoop-3.3.1/etc/hadoop/core-site.xml /usr/local/hadoop-3.3.1/etc/hadoop/hdfs-site.xml /opt/soft/apache-dolphinscheduler-2.0.5-bin/conf/

2.3.4 初始化数据库

DolphinScheduler 任然需要元数据，目前元数据支持存储在 PostgreSQL 和 MySQL中(默认是h2数据库)，所以需要创建专用的元数据库、用户和密码。

创建数据库、用户和授权

-- 进入MySQL命令行
[root@qianfeng01 soft]# mysql -uroot -p123456
-- 创建dolphinscheduler的元数据库，并指定编码
mysql> CREATE DATABASE dolphinscheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
-- 为dolphinscheduler数据库授权
mysql> grant all privileges on dolphinscheduler.* to 'root'@'%';
-- 刷新权限
mysql> flush privileges;

添加MySQL的lib依赖

MySQL 需要手动下载对应的mysql-connector-java 驱动并添加到 DolphinScheduler 的 lib目录下。

[root@qianfeng01 apache-dolphinscheduler-2.0.5-bin]# cp /opt/soft/mysql-connector-java-5.1.28-bin.jar /opt/soft/apache-dolphinscheduler-2.0.5-bin/lib/

初始化元数据

[root@qianfeng01 soft]# sh ./apache-dolphinscheduler-2.0.5-bin/script/create-dolphinscheduler.sh
......
2022-05-22 00:01:44.979  INFO 31419 --- [           main] .u.s.CreateDolphinScheduler$CreateRunner : init DolphinScheduler finished
2022-05-22 00:01:44.979  INFO 31419 --- [           main] .u.s.CreateDolphinScheduler$CreateRunner : create DolphinScheduler success
2022-05-22 00:01:44.985  INFO 31419 --- [ionShutdownHook] com.zaxxer.hikari.HikariDataSource       : DolphinScheduler - Shutdown initiated...
2022-05-22 00:01:44.986  INFO 31419 --- [ionShutdownHook] com.zaxxer.hikari.HikariDataSource       : DolphinScheduler - Shutdown completed.

2.3.5 安装并启动DolphinScheduler

使用上面创建的部署用户运行以下命令完成部署，部署后的运行日志将存放在安装目录下的logs 文件夹内

[root@qianfeng01 soft]# sh ./apache-dolphinscheduler-2.0.5-bin/install.sh

注意: 第一次部署的话，可能出现 5 次sh: bin/dolphinscheduler-daemon.sh: No such file or directory相关信息，为非重要信息直接忽略即可。

2.3.6 启停命令

第一次安装后会自动启动所有服务的，如有服务问题或者后续需要启停，命令如下。下面的操作脚本都在dolphinScheduler安装目录bin下。

# 一键停止集群所有服务
sh /usr/local/dolphinscheduler/bin/stop-all.sh
# 一键开启集群所有服务
sh /usr/local/dolphinscheduler/bin/start-all.sh


########单个服务的启动和停止使用如下命令
# 启停 Master
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh stop master-server
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh start master-server
# 启停 Worker
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh start worker-server
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh stop worker-server
# 启停 Api
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh start api-server
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh stop api-server
# 启停 Logger
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh start logger-server
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh stop logger-server
# 启停 Alert
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh start alert-server
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh stop alert-server
# 启停 Python Gateway
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh start python-gateway-server
sh /usr/local/dolphinscheduler/bin/dolphinscheduler-daemon.sh stop python-gateway-server

2.3.7 登录DolphinScheduler

访问http://192.168.10.101:12345/dolphinscheduler或者http://qianfeng01:12345/dolphinscheduler即可登录系统UI，默认的用户名和密码是 admin/dolphinscheduler123

登陆成功如下：

2.3.8 Master和Worker查看

查看Master和workers情况如下：

到此为止，dolphinscheduler集群安装成功。

2.3.9 集群安装部署流程总结

准备工作：创建dolphinscheduler用户并且做免登录
将apache-dolphinscheduler-2.0.5-bin.tar.gz上传到服务器某个目录
将服务器的apache-dolphinscheduler-2.0.5-bin.tar.gz解压到某一个目录即可

配置解压目录下的install_config.conf文件，命令为：

vim /opt/soft/apache-dolphinscheduler-2.0.5-bin/conf/config/install_config.conf

提前自己创建mysql中的dolphinscheduler的元数据库(dolphinscheduler)，并要将该元数据库授予对应用户(root)所有权限。
将对应的mysql的数据库的连接驱动拷贝到apache-dolphinscheduler-2.0.5-bin.tar.gz解压目录下的lib目录下，命令如下：
```
cp /opt/soft/mysql-connector-java-5.1.28-bin.jar /opt/soft/apache-dolphinscheduler-2.0.5-bin/lib/
```
dolphinscheduler的元数据库(dolphinscheduler)的初始化。命令：
```
sh /opt/soft/apache-dolphinscheduler-2.0.5-bin/script/create-dolphinscheduler.sh
```
初始化后，一定要检查mysql中的dolphinscheduler是否有44张表。
先启动zookeeper集群，以确保后续的安装成功。启动命令：
```
/opt/soft/zookeeper/bin/zkServer.sh start
```
dolphinscheduler的安装，这一步仅需成功执行一次，命令如下：
```
sh /opt/soft/apache-dolphinscheduler-2.0.5-bin/install.sh
```
在master所在的服务器监听12345端口是否启动，命令如下：
```
netstat -nltcp | grep 12345
```
如果监听12345成功，则几乎可以访问web ui页面，访问路径为：http://qianfeng01:12345/dolphinscheduler/

安装常见的问题及重新安装注意事项：

所有服务都启动成功，12345监听也成功，但是web ui使用默认的用户名和密码始终登录不上或者没有反应。
```
检查MySQL中的dolphinscheduler元数据库是否有对应的数据。如果没有，必须要重新生成，并且重新安装。
```

重新安装流程：

1.删除每台服务器的安装目录：rm -rf /usr/local/dolphinscheduler
2.删除zk集群中的dolphinscheduler中的znode节点,命令如下：
		[root@qianfeng01 soft]# /usr/local/zookeeper-3.6.3/bin/zkCli.sh
		[zk: localhost:2181(CONNECTED) 1]rmr /dolphinscheduler
3.删除MySQL中的元数据库	(如果有44张表可以不删除)	，如果删除元数据库就必须要重新去初始化一遍
4.然后重新执行安装命令即可。命令如：sh /opt/soft/apache-dolphinscheduler-2.0.5-bin/install.sh

第三章 DolphinScheduler功能应用

3.1 租户创建

租户是操作系统中的实际的用户。

删除、修改等等都可以，但是需要管理员。

3.2 创建用户

用户是dolphinscheudler系统中的用户，可以登录、可以提交作业、可以进行数据开发。

该用户是可以用于登录该系统。同时，在企业中，用户的授权很重要。

3.3 创建项目

项目也可以进行删除、修改等操作。

3.4 进入项目

3.5 创建工作流

创建shell 类型的task：

保存Shell类型任务的工作流：

工作流列表查看，并上线工作流：

工作流还可以进行编辑，但是必须先下线，才能编辑。还能进行复制、删除、查看版本等操作。

工作流运行状态：

3.6 创建依赖或者并行任务工作流

Shell类型的start任务开始：

Shell类型的TaskA任务的配置如下：

Shell类型的TaskB任务配置如下：

Shell类型的end任务配置如下：

Shell类型工作流保存：

3.7 上线执行-补数-重跑执行

对Shell_task_test工作流先上线，然后非补数运行如下：

查看普通运行结果：

查看task运行日志：
对Shell_task_test工作流先上线，然后非补数运行如下：

补数据成功截图：
重跑执行

重跑成功如下：

3.8 工作流中单个任务运行

点击某个工作流—>进入DAG面板—>如下图所示：

运行配置如下图所示：

执行结果如下：

3.9 定时管理

工作流—>定时—>如下图：

创建后如下图所示：

上线定时任务：

工作流—>点击定时管理—>如下图：

定时工作流上线如下图：

定时任务执行结果：

3.10 工作流的导出导入

导出工作流如下图：

导入工作流：

导入之前，需要将导出的json文件或者已经存在json文件中的工作流名称修改成和ds中已有的工作流名称不一致即可。

导入之后的结果如下：

3.11 数据中心操作

3.11.1 MySQL数据源

数据源中心->创建数据源：

配置MySQL数据源如下图：

创建好MySQL的数据源后如下图：

到此为止，MySQL的数据源配置好。

3.11.2 MySQL数据源创建问题解决

去服务器上，查看dolphinscheduler安装目录下lib和各个模块下的libs下的mysql-connector-java-版本情况，命令如下：

[root@qianfeng01 dolphinscheduler]# ll ./lib/mysql-connector-java-8.0.26.jar
-rw-r--r--. 1 root root 2462364 4月   8 19:05 ./lib/mysql-connector-java-8.0.26.jar
[root@qianfeng01 dolphinscheduler]# ll ./api-server/libs/mysql-connector-java-8.0.16.jar
-rw-r--r--. 1 root root 2293144 4月   8 13:41 ./api-server/libs/mysql-connector-java-8.0.16.jar
[root@qianfeng01 dolphinscheduler]# ll ./master-server/libs/mysql-connector-java-8.0.16.jar
-rw-r--r--. 1 root root 2293144 4月   8 13:41 ./master-server/libs/mysql-connector-java-8.0.16.jar
[root@qianfeng01 dolphinscheduler]# ll ./worker-server/libs/mysql-connector-java-8.0.16.jar
-rw-r--r--. 1 root root 2293144 4月   8 13:41 ./worker-server/libs/mysql-connector-java-8.0.16.jar
[root@qianfeng01 dolphinscheduler]# ll ./alert-server/libs/mysql-connector-java-8.0.16.jar
-rw-r--r--. 1 root root 2293144 4月   8 13:41 ./alert-server/libs/mysql-connector-java-8.0.16.jar
-rw-r--r--. 1 root root 2293144 4月   8 13:41 ./tools/libs/mysql-connector-java-8.0.16.jar

将dolphinscheduler安装目录下lib目录下mysql进行备份(三台服务器都执行)

[root@qianfeng01 dolphinscheduler]# cd /usr/local/dolphinscheduler
[root@qianfeng01 dolphinscheduler]# mv ./lib/mysql-connector-java-8.0.26.jar ./lib/mysql-connector-java-8.0.26.jar.bak

将mysql-connector-java-8.0.16.jar包复制到dolphinscheduler安装目录下lib目录下（要求每台服务器都执行）

cp /home/software/mysql-connector-java-8.0.16.jar /usr/local/dolphinscheduler/lib/
#其它两台服务器建议用scp远程拷贝
scp /home/software/mysql-connector-java-8.0.16.jar qianfeng02:/usr/local/dolphinscheduler/lib/
scp /home/software/mysql-connector-java-8.0.16.jar qianfeng03:/usr/local/dolphinscheduler/lib/

如果dolphinscheduler安装目录下的其它模块mysql的驱动正常是8.0.16，那就不用去处理，否则需要像2，3步骤一样执行
最后，重启dolphinscheduler，然后再创建MySQL数据中心

3.11.3 Hive数据源准备

需要启动Hive中的MetaStore和Hiveserver2服务(hive的安装服务器执行)，命令如下：

#启动元数据服务
hive --service metastore &
#启动Hiveserver2服务
hive --service hiveserver2 &

查看启动后的metastore和hiveserver2服务(在hive安装的服务器执行如下命令)

#查看2个服务
[root@qianfeng01 dolphinscheduler]# jps
8736 RunJar
8869 RunJar

#过滤出某个指定的服务
[root@qianfeng01 dolphinscheduler]# ps -ef | grep hiveserver2
[root@qianfeng01 dolphinscheduler]# ps -ef | grep metastore

检测metastore服务(在hive安装的服务器执行如下命令)
```
[root@qianfeng01 dolphinscheduler]# netstat -nltcp | grep 9083
```

检车Hiveserver2的服务(在hive安装的服务器执行如下命令)

[root@qianfeng01 dolphinscheduler]# /usr/local/hive-3.1.2/bin/beeline
beeline> !connect jdbc:hive2://qianfeng01:10000
Connecting to jdbc:hive2://qianfeng01:10000
Enter username for jdbc:hive2://qianfeng01:10000: root     #操作系统中登录用户名和密码
Enter password for jdbc:hive2://qianfeng01:10000: ******
Connected to: Apache Hive (version 3.1.2)
Driver: Hive JDBC (version 3.1.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://qianfeng01:10000> show databases;

3.11.4 Hiveserver2连接错误

通常是在使用hiveserver2或者dolphinscheduler连接hive(hiveserver2服务)的时候会报错如下：

2023-04-09 00:05:47,328 WARN  [main] jdbc.HiveConnection (HiveConnection.java:(237)) - Failed to connect to qianfeng01:10000
Error: Could not open client transport with JDBC Uri: jdbc:hive2://qianfeng01:10000: Failed to open new session: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationException): User: root is not allowed to impersonate root (state=08S01,code=0)

解决办法：

配置hadoop安装目录下的etc/hadoop/core-site.xml文件(每台安装hadoop的服务器都需要配置)，追加如下内容：

<property>
  <name>hadoop.proxyuser.root.hostsname>
  <value>*value>
property>
<property>
  <name>hadoop.proxyuser.root.groupsname>
  <value>*value>
property>

注意：这里登陆的是root用户。若登录的是hadoop用户，则配置文件中的root需要修改为hadoop
当上述文件配置不正确时会可能会引起beeline连接Hive时报如下异常
User: hadoop is not allowed to impersonate root), serverProtocolVersion:null) (state=08S01,code=0)
先部署安装使用的是hadoop用户，故而需要修改core-site.xml配置文件

将Hadoop停止，并重启集群
停止hive的metastore和hiveserver2服务，并重启
再次使用hive的beeline工具连接即可

3.11.5 Hive数据源连接

上图连接方式和MySQL大致一样即可，提交之后的效果如下：

3.11.6 Spark的数据源

…暂时不做，大家自己集成即可。

3.12 任务类型

3.12.1 Shell类型

…上面说过，参考3.5即可。

3.12.2 SQL类型

保存工作流：

运行工作流：

上线运行：

运行：

查看结果：

3.12.3 Hive任务类型

该版本Hive仍然使用SQL类型的任务去创建工作流，具体工作流创建如下：

保存工作流：

上线并执行：

去Hive验证结果：

到此为止Hive任务类型完成。

3.12.4 Python类型

创建python类型的工作流：

保存工作流：

上线运行：

查看运行结果：

3.13 参数

内置参数：系统自带的参数的属性
全局参数：工作流中的每一个task都可以用
本地参数：当前Task可以使用
参数传递：某一个任务接收参数往下一个task传递

3.13.1 内置参数

变量名	声明方式	含义
system.biz.date	${system.biz.date}	日常调度实例定时的定时时间前一天，格式为 yyyyMMdd
system.biz.curdate	${system.biz.curdate}	日常调度实例定时的定时时间，格式为 yyyyMMdd
system.datetime	${system.datetime}	日常调度实例定时的定时时间，格式为 yyyyMMddHHmmss

3.13.2 衍生内置参数

支持代码中自定义变量名，声明方式：${变量名}。可以是引用 “系统参数”
我们定义这种基准变量为 $[...] 格式的，$ [yyyyMMddHHmmss] 是可以任意分解组合的，比如：$[yyyyMMdd], $[HHmmss], $[yyyy-MM-dd] 等
也可以通过以下两种方式：

1.使用add_months()函数，该函数用于加减月份，第一个入口参数为[yyyyMMdd]，表示返回时间的格式第二个入口参数为月份偏移量，表示加减多少个月
- 后 N 年：$[add_months(yyyyMMdd,12*N)]
- 前 N 年：$[add_months(yyyyMMdd,-12*N)]
- 后 N 月：$[add_months(yyyyMMdd,N)]
- 前 N 月：$[add_months(yyyyMMdd,-N)]
2.直接加减数字在自定义格式后直接“+/-”数字
- 后 N 周：$[yyyyMMdd+7*N]
- 前 N 周：$[yyyyMMdd-7*N]
- 后 N 天：$[yyyyMMdd+N]
- 前 N 天：$[yyyyMMdd-N]
- 后 N 小时：$[HHmmss+N/24]
- 前 N 小时：$[HHmmss-N/24]
- 后 N 分钟：$[HHmmss+N/24/60]
- 前 N 分钟：$[HHmmss-N/24/60]

3.13.3 本地和全局参数

创建带有全局和本地参数的工作流。

创建有本地和全局参数的task：

创建只有全局参数的task：

保存工作流：

上线工作流并运行：

查看结果：

另外一个的全局参数自己查看即可。

3.13.4 参数优先级

DolphinScheduler 中所涉及的参数值的定义可能来自三种类型：

全局参数：在工作流保存页面定义时定义的变量
上游任务传递的参数：上游任务传递过来的参数
本地参数：节点的自有变量，用户在“自定义参数”定义的变量，并且用户可以在工作流定义时定义该部分变量的值

因为参数的值存在多个来源，当参数名相同时，就需要会存在参数优先级的问题。

DolphinScheduler 参数的优先级从高到低为：全局参数 > 上游任务传递的参数 > 本地参数

3.14 告警

企业微信
钉钉

3.14.1 钉钉告警准备

建立钉钉群聊

-自己建立
对群聊进行设置
选择机器人->添加机器人—>自定义—>如下图：

配置机器人：

复制webhook即可：

3.14.2 钉钉告警

创建dingTalk实例：

创建告警组：

工作流上线运行并配置告警组：

查看钉钉群聊中，是否有任务执行信息：

你可能感兴趣的:(大数据,任务调度,DS,DolphinSchedule,dolphinschedule)

贵州微商行业协会，今日成立我是磊少
图片发自App文/磊少2018年6.19是全国所有微商引以为傲的一天，因为这一天，微商立法了。且被纳入电子商务经营者范围。而我想说的是，今天（2018.8月28）是所有贵州微商最扬眉吐气的一天。因为今天，贵州省微商行业协会成立了。伴随着移动互联网的蓬勃发展，大数据的日新月异，尤其是贵州贵阳作为全球大数据研究中心，吸引了众多国际顶尖的互联网技术与核心人才，更是为贵州互联网的发展插上了理想的翅膀，飞翔
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
Hadoop与图像识别与处理 AI天才研究院 AI大模型企业级应用开发实战 Agentic AI 实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Hadoop与图像识别与处理作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在大数据时代，数据的爆炸性增长对数据处理技术提出了新的挑战。图像数据作为一种重要的数据形式，其处理和分析在许多领域中具有重要意义，如医疗影像分析、自动驾驶、安防监控等。然而，传统的图像处理方法在面对海量图像数据时显得力不从心。Hadoop作为一种分
微信小程序171~180 The_era_achievs_hero 微信小程序小程序
1.封装购物车接口APIimporthttpfrom'@/utils/http'exportconstreqAddCrt=({goodsId,count,...data})=>{returnhttp.get(`/cart/addToCart/${goodsId}/${count}`,data)}exportconstreqCartList=()=>{returnhttp.get('/cart/ge
微信小程序列表数据上拉加载,下拉刷新
1.上拉加载数据，数据=下一页数据+前面的数据（[...this.data.list,...data.records）2.当用户上拉加载过快时，会不停的调用接口，需要节流阀isLoading3.上拉加载到最后一页的判断，isFinish//pages/list.jsimport{reqList}from"../../api/list"Page({data:{list:[],total:0,isFi
从“一人干多活”到“团队协作”：RTOS多任务调度，居然藏着这么多小聪明！
从“一人干多活”到“团队协作”：RTOS多任务调度，居然藏着这么多小聪明！你有没有过这种经历：一边炖着汤，一边炒着菜，还得时不时跑去看一眼烤箱里的面包，结果手忙脚乱打翻了盐罐？嵌入式系统处理任务时，也曾面临同样的“窘境”——裸机系统就像一个人包揽所有活，只能按顺序挨个做；而RTOS（实时操作系统）则像雇了个“智能调度员”，能让多个任务“轮流上岗”，甚至“紧急任务插队”，效率直接翻倍！今天咱们就从裸
Python打卡Day11 常见的调参方式
核心知识：1.模型=算法+实例化设置的外参（超参数）+训练得到的内参2.只要调参就需要考2次所以如果不做交叉验证，就需要划分验证集和测试集，但是很多调参方法中都默认有交叉验证，所以实际中可以省去划分验证集和测试集的步骤基线模型（基准模型）:首先运行一个使用默认参数的模型，记录其性能作为比较的基准。超参数调整数据1.网格搜索(GridSearchCV):-需要定义参数的网格（param_grid），
web的跨域问题--针对CSP的内容 SunnyZHQing 系统问题 web 跨域
跨域的ajax问题是因为返回的response中缺少Header("Access-Control-Allow-Origin","*")Header("Access-Control-Allow-Methods","GET,POST")Header("Access-Control-Allow-Headers","x-requested-with,content-type")需要把这写代码写到1.php
记录一个Android Studio v7包爆红的问题 Kyle_Xiong
在开发过程中，突然v7包的class全部爆红，但是可以运行，Clean、Rebuild、重启AndroidStudio及电脑、InvalidateCaches/Restart均不能够解决问题，特此在此处记录问题解决办法解决办法：File->CloseProject->重新打开项目->SycnProject这样红色的报错就没有了产生这个错误是因为androidstudio的一个bug产生的，在此记录
80端口被占用，查本地哪个程序占用静西子服务器 linux 运维
netstat-ano|findstr":80"查看pid的路径wmicprocesswhere"ProcessId=4628"getExecutablePath
大数据领域数据架构的实时数据可视化架构 AGI大模型与大数据研究院 AI大模型应用开发实战信息可视化大数据架构 ai
大数据领域数据架构的实时数据可视化架构关键词：大数据架构、实时数据处理、数据可视化、流式计算、数据管道、可视化工具、性能优化摘要：本文深入探讨了大数据领域中实时数据可视化架构的设计与实现。我们将从基础概念出发，逐步分析实时数据处理流程，介绍关键技术和工具，并通过实际案例展示如何构建高性能的实时可视化系统。文章将涵盖数据采集、处理、存储和可视化展示的全链路架构，同时讨论性能优化策略和未来发展趋势。1
uniapp写好的弹窗组件 A了LONE uni-app 前端
效果图view部分点击打开弹窗确认退款是否确认申请退款？取消确定js部分data(){return{miniShowModal:false,//默认隐藏弹框}},methods:{//点击按钮弹出弹框miniToMdel(){this.miniShowModal=true;},//点击确定按钮时关闭弹框confirm(){this.closeOn()},//点击蒙版时关闭按钮miniHideMod
并发编程原理与实战（十八）ReentrantLock API全面解析
上一篇讲解了Lock接口核心API和相比于synchronized的关键优势，本文来进一步学习Lock接口的具体实现类ReentrantLock。认识ReentrantLock基本行为和语义下面我们先看ReentrantLock的定义。/***Areentrantmutualexclusion{@linkLock}withthesamebasic*behaviorandsemanticsasthe
113.Impala ODBC驱动的安装及配置大勇任卷舒
113.1unixODBC依赖包的安装检查是否安装unixODBC包$rpm-qa|grep-iunixodbc安装unixODBC依赖包$sudoyum-yinstallunixODBCunixODBC-devel查看unixODBC配置文件路径$odbcinst-j113.2ImpalaODBC驱动安装ImpalaODBC驱动$wgethttps://downloads.cloudera.co
ORA-00600: internal error code, arguments: [krse_arc_source_init.1], [4], [2] bestsun999 OracleDB oracle 数据库 linux
有套3节点的rac，数据库版本11204，15号凌晨0点3个实例同时宕机，手动启动节点二，节点三上实例，正常启动，手动启动节点一实例，告警如下:节点一SYS@orcl1>startup;ORACLEinstancestarted.TotalSystemGlobalArea1.2827E+10bytesFixedSize2265224bytesVariableSize5133832056bytesD
【可信数据空间】 flyair_China 安全
分阶段设计可信数据空间（TrustedDataSpace,TDS）方案，覆盖数据处理、存储、加密及AI工作流全生命周期。一、预备阶段（Preliminary）目标：定义数据空间治理框架组织对齐设立TDS治理委员会（含安全官、数据科学家、合规专家），制定《可信数据共享宪章》：数据主权原则：所有权、使用权、存储权分离（GDPR/CCPA合规）最小授权机制：基于用途的访问控制（Purpose-based
浅谈RS232、RS422、RS485、LVDS总线仰望天空—永强 IO总线
浅谈RS232、RS422、RS485、LVDS总线在了解三种总线前，笔者认为应该先明白总线的分类，这样对总线有更清晰的概念一．总线的概念和分类：1.对总线可以分为片内总线、片间总线、系统总线、外总线片内总线：是微处理器等芯片内部各功能单元的连线（例CPU与片内存储的总线）片间总线：是微处理器等向外引出的总线（例处理器与DDR连接的总线）系统总线：主板上扩展卡与扩展卡之间连接的总线：（例如电脑两个
践行乡村支教，助力乡村振兴 bc1bd9748b57
在大数据时代，大量农村青年进城寻求机遇，在工资待遇环境各个方面追求改善，导致大批留守儿童与孤寡老人，教育环境差，师资力量薄弱，这些孩子的教育问题受到大众关注。同时，大学毕业生在求职时也更加倾向于留在大城市，发展较快的地方寻求更大的发展机遇。当然也不乏大学生回乡为新一代的成长奉献自己，通过支教或者直接就业的形式，为乡村孩子的成长奉献自己的力量。有一些有才华的人放弃自己在大城市继续深造的机会，专心于这
时序数据库：数据库领域的未来之星数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库时序数据库 ai
时序数据库：数据库领域的未来之星关键词：时序数据库、时间序列数据、物联网、大数据分析、数据库优化、TSDB、实时数据处理摘要：本文深入探讨了时序数据库(TimeSeriesDatabase,TSDB)这一新兴数据库技术。我们将从基本概念入手，分析时序数据库的核心原理和架构设计，详细讲解其特有的数据模型和存储机制。通过实际代码示例展示如何使用主流时序数据库处理时间序列数据，并探讨其在物联网、金融科技
【乳腺超声、乳腺钼靶、宫颈癌、CT骨折】等项目数据调研，及相关参考内容整理汇总钱多多先森人工智能（AI）医学影像深度学习乳腺钼靶乳腺超声宫颈癌
文章目录一、乳腺超声内容整理1.1、数据集1.2、可以参考的论文1.3、可以参考的GitHub代码1.4、可以参考的博客1.5、简单任务需求二、宫颈癌风险智能诊断2.1、数据集2.2、KFB读取文件显示三、乳腺钼靶3.1、数据集3.2、拍摄方式：3.3、拍摄和观察视图3.4、DDSM标注文件解析四、CT骨折4.1、数据集五、总结本博客是一个笔记类的记录文档，主要是记录了在调研各个项目的过程中，遇到
MySQL 大数据量分页查询优化实战：从 90秒到 965毫秒的性能飞跃要阿尔卑斯吗. mysql 数据库分布式架构 java
在日常开发中，我们经常需要对数据库中的数据进行分页展示。特别是当表数据量达到几十万甚至上百万级时，传统的LIMIT分页方式会面临严重的性能瓶颈。今天，我将分享一个真实的性能优化案例，通过模拟大页码查询的现场，从90秒缩短到965毫秒，显著提升了查询效率。本篇文章将从问题出现的原因、索引原理、优化思路和最终实战效果等方面，为你全面讲解如何高效处理MySQL大数据分页查询问题。一、问题背景：大页码分页
老码农和你一起学AI：Python系列-Pandas大数据处理 chilavert318 熬之滴水穿石 pandas python
今天开始梳理一下pandas的大数据处理，在数据处理领域，Pandas凭借简洁的API和强大的功能成为Python开发者的首选工具。但当面对GB级甚至更大的数据集时，直接读取数据往往会触发“内存不足”的错误——这是因为Pandas默认将数据全部加载到内存中进行处理。此时，分块处理（Out-of-Core）技术就成为解决问题的关键。它通过将大文件拆分为小块，逐块加载并处理，最终整合结果，实现“用有限
XC7A75T‑2FGG484I Xilinx Artix‑7 FPGA AMD
XC7A75T‑2FGG484I属于Xilinx28 nmArtix‑7FPGA内部包含约75,000个查找表（LUT）及相应触发器，对应数十万级组合逻辑和状态存储；它还集成了4.9 Mb的分布式BlockRAM，满足高速缓存与FIFO需求；240个DSP48E1乘加单元为数字信号处理、滤波器及乘法累加运算提供硬件加速。超网格（super‑net）布局与高效的路由交换矩阵，确保了内部时钟域频率可达
关于线上技术学习的一点学习心得 GuangHui
我是**五期学员,和你分享一下我的学习心得,希望能够帮助到你.这是自己对于学习的思考和想法,因为我还在不断的学习和调整中,所以并不能说自己的所想都是正确的.我想即使我实现了成功的转行,也并不代表我说的我所选择的方式都是适合所有人的.每个人还需结合自己的实际情况,找到适合自己的最佳方法.我们一起努力.一.目标篇因为大数据需要学习的内容很多,所以学习过程中,一定要对进行定位,要做到有所取舍.针对自己的
RDS Proxy提高数据库可扩展性可用性GenAI taibaili2023 AWS
亚马逊云科技-RDSProxy改善数据库可扩展性GenAI关键字:[yt,AmazonRDSProxy,DatabaseScalability,RdsProxy,ConnectionPooling,SeamlessFailover,IamAuthentication]本文字数:400,阅读完需:2分钟导读演讲者介绍了”亚马逊云科技-RDSProxy改善数据库可扩展性GenAI”。在演讲中,他阐释了
aws rds mysql 连接_使用 Amazon RDS 代理连接到 Amazon RDS MySQL 数据库实例或 Aurora MySQL 数据库集群... 仁安同学 aws rds mysql 连接
如何使用AmazonRDS代理连接到我的AmazonRDSMySQL数据库实例或AuroraMySQL数据库集群？上次更新时间：2020年9月21日如何使用AmazonRDS代理连接到运行MySQL的AmazonRelationalDatabaseService(AmazonRDS)数据库实例或AmazonAurora数据库集群？简短描述您可以使用AmazonRDS代理来管理与应用程序之间的连接。
遥感云平台-GEE下载Landsat8/9影像数据（python）
内容介绍上期文章介绍如何在网页端导出Landsat8/9数据，本期主要介绍如何在本地GEE-python端导出数据以及出图。环境配置：Vscode+Jupyternotebook+gee+geemap+python3.10#导出所需要的包，注意提前安装ee和geemapimporteeimportosimportnumpyasnpimportgeemapfromgeemap.datasetsimp
AWS RDS MySQL是否能实现登录限制类需求 shiran小坚果 RDS aws 云计算 database mysql
问题描述：此类问题一般来说在等保中会频繁遇到：对于AWSRDSMySQL5.7和8.0的实例，能否做到如下限制和需求：1.一个连接到数据库的session，超过一段时间以后被RDSMySQL结束的功能：RDSMySQL5.7和8.0中，均可以通过更改参数组中wait_timeout和interactive_timeout参数来设置。当连接空闲并超过参数设置的时长，那么会导致RDSMySQL自动断掉
探索AWS基础服务：构建云端架构的基石
本文将深入介绍AWS的几种基础服务，包括弹性计算（EC2）、简单存储服务（S3）、关系数据库服务（RDS）等，助您构建高效、稳定的云计算架构。
GEE土地分类——利用landsat 8 和随机森林方法进行土地分类此星光明 gee土地分类专栏前端 gee 机器学习土地分类随机森林 Landsat 土地利用
目录简介代码解释代码函数ee.Classifier.smileRandomForest(numberOfTrees,variablesPerSplit,minLeafPopulation,bagFraction,maxNodes,seed)Arguments:Returns:Classifier结果简介GEE土地分类——利用landsat8和随机森林方法进行土地分类代码解释这段代码是用Google
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f