袁一白

工作流开源系统--DRAKE

1工作流开源系统概要

以下是各类数据分析的工作流pipeline管道模型的框架和库包，包含特定科学等业务领域行业或者通用领域，结合大数据big data分析的各种开放源码项目。包括下一代测序技术(NGS)打开了数据分析的空间，生物学成为数据密集领域，越来越多的生物数据需要通过复杂的计算工具（集群、云端和网格计算）进行NGS处理和分析。

工作流开源系统	网址	现类
Arvados	http://arvados.org	产品级的数据科学平台，能处理大数据集，由两个主要系统组成以及涵盖很多相关服务与组件，包括API SDK和虚拟化工具。
Taverna	http://www.taverna.org.uk/	一个与具体领域无关的独立的工作流管理系统，包括一系列工具用于设计和科学工作流程的实现。
Galaxy	http://galaxyproject.org/	基于web用于数据密集的生物医学研究
SHIWA	http://www.erflow.eu/	跨国的欧洲工作流用户社区推出的用于科学研究的工作流。
Oozie	https://oozie.apache.org/	是一个用于管理Apache Hadoop job的工作流调度系统。
DNANexus	https://wiki.dnanexus.com/API-Specification-v1.0.0/IO-and-Run	不仅能在云端存储和分析文件，也有助于协助注释和虚拟化你的数据。
BioDT	http://www.biodatomics.com/	下一代生物信息学工具
Agave	http://agaveapi.co/live-docs/	一个Science-as-a-Service API平台
DiscoveryEnvironment	http://www.iplantcollaborative.org/ci/discovery-environment	iPlant 的信息基础平台
Wings	http://www.wings-workflows.org/	是一个语义工作流系统，辅助科学家进行计算体验设计。
Knime	https://www.knime.org/	强大的大数据分析和挖掘能力。
Drake	https://github.com/Factual/drake	易于使用可扩展基于文本的数据工作流工具，组织围绕数据的命令行执行，类似GNU的 Make
Snakemake	https://bitbucket.org/johanneskoester/snakemake	是一个工作流管理系统，降低创建工作流的难度复杂性，提供快速舒服的执行环境。
BPipe	http://bpipe.org	用于生物学领域的任务运行，用以替代各种脚本任务。
Ruffus	https://code.google.com/p/ruffus/	Python可计算的Pipeline，用于生物信息学在并行流程中管理依赖。
NextFlow	http://nextflow.io	借鉴Unix管道模型，提供一个流畅的DSL，允许你处理复杂的流交互。
Luigi	http://github.com/spotify/luigi	Luigi是一个Python (2.7, 3.3, 3.4, 3.5)库包，帮助你建立复杂的批工作的管道模型pipeline，它处理依赖问题，工作流管理，虚拟化，处理失败，集成命令行等很多功能。
SciLuigi.	http://github.com/samuell/sciluigi
GATK Queue	https://www.broadinstitute.org/gatk/guide/topic?name=queue	建立一个分析管道模型有效率运行GATK和其他工具
Yabi	https://ccg.murdoch.edu.au/yabi
seqware	https://seqware.github.io/	https://seqware.github.io/docs/6-pipeline/
Ketrew	https://github.com/hammerlab/ketrew	一个提供EDSL API的OCaml库
Pegasus	http://pegasus.isi.edu/	工作流管理系统，自动恢复和调式科学计算。
Airflow	https://github.com/airbnb/airflow（重复）
Cosmos/ Cosmos2:	https://github.com/LPM-HMS/COSMOS2	主流的并行工作流Python库包，生物科学领域下一代序列流管道模型，提供命令行工具自动利用计算集群能力，提供Web仪表板监视，调试，分析你的job。
Pinball	https://github.com/pinterest/pinball	Pinball是个可伸缩扩展的工作流管理器，基于组件，状态以可读格式保存，可靠，管理友好。
bcbio	https://bcbio-nextgen.readthedocs.org/en/latest/	提供高吞吐量数据序列流分析，只要编写高层配置指定输入和分析参数，输入会驱动并行管道模型处理被分发的执行任务，幂等处理可重新启动，透明的事务步骤。
Chronos	https://github.com/mesos/chronos	Chronos是一个linux cron的替代，它是分布式的失败容错的调度器，运行在 Apache Mesos之上，支持定制优化Mesos执行器作为默认的命令执行器。
Azkaban	https://azkaban.github.io/	是一个批工作流任务调度器，由LinkedIn创建，用于运行Hadoop job，解决了job的依赖顺序，提供易于使用的Web用户界面维护和跟踪你的处理流程。
Apache NiFi	https://nifi.apache.org/docs/nifi-docs/html/overview.html	系统之间数据流程的自动化，当数据流使用在各种场合，使用它自动化和管理系统之间信息流动。
flowr (R-based)	http://docs.flowr.space/	Flowr让你设计和实现复杂的管道模型，部署在你的计算集群，满足生物信息学需要。
Mistral	https://github.com/arteria-project	从主流并行序列流中处理序列数据，提供组件实现自动分析和数据管理任务作为下一代序列流中心，平衡微服务架构，使用StackStorm创建一个事件驱动的自动化系统。灵活可伸缩。
nipype	http://nipy.org/nipype/
End of Day	https://github.com/joestubbs/endofday	docker 容器的可执行工作流，可以使用yaml文件定义。
BioDSL	https://github.com/maasha/BioDSL	用于生物学的领域特定语言。
BigDataScript	http://pcingola.github.io/BigDataScript/	在笔记本上开发的数据分析管道模型可以运行在大数据几千节点集群上。
Omics Pipe:	http://sulab.scripps.edu/omicspipe/	开源模块计算平台，自动化multi-omics数据分析管道模型的最佳实践。
Ensembl Hive	https://github.com/Ensembl/ensembl-hive	eHive是一个在分布式计算资源运行计算管道模型的系统。
QuickNGS	http://bifacility.uni-koeln.de/quickngs/web	下一代测序数据的高吞吐量的数据分析。
GenePattern	http://www.broadinstitute.org/cancer/software/genepattern/	提供数百个分析工具，分析 gene expression (RNA-seq 和 microarray), sequence variation and copy number, proteomic, flow cytometry, 和网络分析
Chipster	http://chipster.csc.fi/	新一代测序(NGS)，提供超过350分析工具
The Genome Modeling System	https://github.com/genome/gms
Cuneiform,	https://github.com/joergen7/cuneiform	函数式工作流语言
Anvaya	http://www.ncbi.nlm.nih.gov/pubmed/22809419	自动化基因分析的工作流环境
Makeflow	http://ccl.cse.nd.edu/software/makeflow/	在集群云端和网格之上执行大型复杂工作流引擎
Airavata	http://airavata.apache.org/	基于集群，云端和网格之上组合，管理，执行和监视大规模可伸缩应用和工作流引擎
Pyflow	https://github.com/Illumina/pyflow	一个轻量的并行任务引擎
Clusterflow	https://github.com/ewels/clusterflow	一个管道模型工具，在集群环境自动化和标准化生物分析。
Unipro UGENE	http://ugene.net/	https://dx.doi.org/10.7717/peerj.644
CloudSlang	http://www.cloudslang.io/	管理协调Docker和CoreOS应用，快速化自动DevOps
Stacks	http://catchenlab.life.illinois.edu/stacks/	用于构建Ioci的软件管道模型
Leaf	http://www.francesconapolitano.it/leaf/index.html	用于数据流Bioinformatic Protocol的设计和管理的Python工具
omictools	http://omictools.com/	提供11573 种分析工具
Job 描述语言	https://edms.cern.ch/ui/file/590869/1/WMS-JDL.pdf
YAWL	http://www.yawlfoundation.org/	一个BPM/工作流系统，基于简明和强大的模型语言，处理复杂数据转换，完全集成各种Web服务。
Triquetrum	https://github.com/eclipse/triquetrum/	科学工作流的管理和执行。
Kronos	https://github.com/jtaghiyar/kronos	癌症和肿瘤信息分析
qsubsec	https://github.com/alastair-droop/qsubsec	基于SGE grid system的模板语言，产生用于提交任务的脚本语言。
YesWorkflow	http://yesworkflow.org	将工作流模型带到脚本语言中
GWF - Grid WorkFlow	https://github.com/mailund/gwf	小的类似make的通过qsub提交工作流的工具。
Fireworks	https://pythonhosted.org/FireWorks/	是一个定义管理和执行工作流的框架，能使用 Python, JSON, 或 YAML定义复杂工作流，存储在MongoDB中，能够通过Web界面监视，工作流执行能自动跨无数个计算资源执行。
NGLess	https://github.com/luispedro/ngless	是下一代测序NGS 的领域特定语言。

2我们选用了drake

Drake--易于使用可扩展基于文本的数据工作流工具，组织围绕数据的命令行执行，类似GNU的 Make

【项目地址】https://github.com/Factual/drake
【项目简介】清理脏数据，输入输出更可控一些。
【入门例子】https://github.com/Factual/drake/wiki/Tutorial

简单例子：

ruichao-factual编辑这个页面on 25 Nov 2013 ·

本教程是一项正在进行中的工作。如果有一个特定的话题你想覆盖,请通过 Google Group for Drake.让我们知道。

概述

你工程所写的Drake workflow文件将指定运行哪些步骤。一般来说,每一个step都依赖于一个或多个输入源,并将创建一个或多个输出组件。

Drake workflow文件通过step来组织。除了指定输入和输出,一个step通常会包含明确的命令,可能还有额外的选项。

这里有一个案例是一个简单的step:

; we only like lines with lowercase "i" in them
out.csv <- in.csv [shell]
  grep i $INPUT > $OUTPUT

上面的步骤使用drake的“shell”协议,这意味着命令为shell命令。 (也可以有其他的协议,必须显式地指定。但在本教程中,我们将主要关注如何使用shell协议。)

让我们逐步的分解上述步骤的特定参数:

out.csv:生产输出文件
in.csv: 要使用的输入文件
[shell]: 括号括起来的可选项. 对于step的协议来说是一个非常重要的选项. 在这里,我们选择了“shell”协议,它允许我们在这个步骤运行shell命令。
the indented line:缩进线以下的第一行是一个step的命令。在这种情况下,有一个命令,该命令执行行过滤。注意,命令shell命令,表明每次执行都将使用shell协议。
$INPUT: 一个Drake shell step将在运行shell命令的step之前，自动加载shell环境变量和有用的信息. 例如,它加载的文件路径输入环境变量指定的输入的第一步。因此,步骤的shell命令访问变量,比如 $INPUT.
$OUTPUT: 类似于 $INPUT,一个 Drake shell step 将在运行shell之前，自动加载输出的文件路径环境变量到指定的输出.

基本的依赖关系管理

一个Drake workflow可能会有很多的step,他们可能会以各种方式相互依赖。当我们考虑了这个额外的情况事，上面的例子将被增加：

; produce an extraordinarily fancy report
count.txt <- out.csv
  wc $INPUT > $OUTPUT

这一步取决于out.csv(也就是说,它使用out.csv作为它的输入文件),并产生count.txt。因为依赖out.csv,Drake将默认情况下确定out.csv是最新的。这意味着如果有必要的话，Drake将运行所需的step(s)创建out.csv)。 (这种行为是基本依赖关系管理的宗旨,这很像我们知道的也喜欢使用的工具--Make。)

Drake的命令行接口允许我们首先执行哪个特定的step,也有其他各种命令选项。但是，默认情况下,Drake将尝试在您的workflow运行的所有steps。

有关Drake命令行选项的更多细节,包括选项,请参阅完整的用户手册。

但是我们要提前。让我们通过以下例子来学习……

你的第一个工作流

Drake是建立工作流运行数据。默认情况下,它在寻找工作流程文件在路径./Drakefile。这就是为什么如果你运行它在没有./Drakefile文件的地方时，Drake有时会报错找不到工作流程文件。

让我们开始一个新的工作流程,在一个新目录:

$ mkdir /myworkflow
$ cd /myworkflow

现在创建一个简单的工作流。创建一个文件命名workflow.d和把这个(前面示例拷贝即可):

; we only like lines with lowercase "i" in them
out.csv <- in.csv
  grep i $INPUT > $OUTPUT

这是一个非常简单的Drake workflow,只有一个步骤。这个step运行一个shell命令,使用in.csv输入文件和输出写入output.csv。

我们还没有一个输入文件,所以让我们创建它。创建一个文件命名in.csv和然后发那个放入一些测试数据,如下所示:

Artem,Boytsov,artem
Aaron,Crow,aaron
Alvin,Chyan,alvin
Maverick,Lou,maverick
Vinnie,Pepi,vinnie
Will,Lao,will

酷,现在我们有一个Drake workflow和一个简单的输入文件运行工作流。让我们运行它!

$ drake -w workflow.d

让我们检查输出:

$ more out.csv
Alvin,Chyan,alvin
Maverick,Lou,maverick
Vinnie,Pepi,vinnie
Will,Lao,will

3你以为这就完了？No，下面是干货

workflow_douyu_data.d

; load the plugin defination
%include $[PROFILE]
; script
plugin_version="1.0"
plugin_home=/var/weiboyi/azkaban/UnifiedDataProcessing/douyuCrawlParser
plugin_user_info_generator=$[plugin_home]/app/$[plugin_version]/bin/douyu_account_info_generator.sh
plugin_media_info_generator=$[plugin_home]/app/$[plugin_version]/bin/douyu_media_info_generator.sh
plugin_user_info_config_generator=$[plugin_home]/app/$[plugin_version]/config/douyu_account_generator_pig.params
plugin_media_info_config_generator=$[plugin_home]/app/$[plugin_version]/config/douyu_media_generator_pig.params

; hdfs crawled data path
hdfs_douyu_crawled_info_path=/tech/azkaban/data_processing/crawler2/douyu
; [account_input_data] hdfs crawled account data path
hdfs_account_info_path=$[hdfs_douyu_crawled_info_path]/account_info
hdfs_account_info_data_tag=$[hdfs_account_info_path]/data/douyu_account_info
; [media_input_data] hdfs crawled media data path
hdfs_media_info_path=$[hdfs_douyu_crawled_info_path]/media
hdfs_media_info_data_tag=$[hdfs_media_info_path]/data/douyu_media
account_info_latest_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_data_tag] --item_count=1 --data_hdfs_path_list)
account_info_latest_date=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_data_tag] --item_count=1 --valid_time)
account_info_schema_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_data_tag] --item_count=1 --schema_hdfs_path)
media_info_latest_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_info_data_tag] --item_count=1 --data_hdfs_path_list)
media_info_latest_date=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_info_data_tag] --item_count=1 --valid_time)
media_info_schema_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_info_data_tag] --item_count=1 --schema_hdfs_path)

; schema version
account_info_schema_version=1.0
media_info_schema_version=1.0

; hdfs output data path
hdfs_feature_data_path=/tech/azkaban/data_processing/feature_generator/douyu/data
hdfs_account_info_snapshot_path=$[hdfs_feature_data_path]/account_info_snapshot
hdfs_account_info_snapshot_schema_path=$[hdfs_account_info_snapshot_path]/schema
hdfs_account_info_snapshot_data_tag=$[hdfs_account_info_snapshot_path]/data/douyu_account_info_snapshot
hdfs_media_snapshot_path=$[hdfs_feature_data_path]/media_info_snapshot
hdfs_media_snapshot_schema_path=$[hdfs_media_snapshot_path]/schema
hdfs_media_snapshot_data_tag=$[hdfs_media_snapshot_path]/data/douyu_media_info_snapshot
account_info_snapshot_latest_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_snapshot_data_tag] --item_count=1 --data_hdfs_path_list)
account_info_snapshot_latest_date=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_snapshot_data_tag] --item_count=1 --valid_time)
account_info_snapshot_schema_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_snapshot_data_tag] --item_count=1 --schema_hdfs_path)
media_snapshot_latest_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_snapshot_data_tag] --item_count=1 --data_hdfs_path_list)
media_snapshot_latest_date=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_snapshot_data_tag] --item_count=1 --valid_time)
media_snapshot_schema_path=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_snapshot_data_tag] --item_count=1 --schema_hdfs_path)

; douyu account info snapshot
hdfs:$[hdfs_account_info_snapshot_data_tag]_v$[account_info_schema_version]_$[account_info_latest_date], hdfs:$[hdfs_account_info_snapshot_schema_path]/schema_douyu_account_info_snapshot_v$[account_info_schema_version] <- hdfs:$[account_info_latest_path], hdfs:$[account_info_schema_path]
    hdfs_crawl_account_data=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_account_info_data_tag] --start_time=$[account_info_snapshot_latest_date] --end_time=$[account_info_latest_date] --data_hdfs_path_list)
    cmd="/bin/bash $[plugin_user_info_generator] --account_info_data_path ${hdfs_crawl_account_data} --account_info_schema_path $INPUT1 --last_account_info_snapshot_data_path $[account_info_snapshot_latest_path] --last_account_info_snapshot_schema_path $[account_info_snapshot_schema_path] --cur_account_info_snapshot_data_path $OUTPUT0 --account_info_snapshot_schema_path $OUTPUT1  --account_info_config_path $[plugin_user_info_config_generator]"
    echo "$cmd"
    eval "$cmd" 
    if [ $? -eq 0 ]; then
        hadoop fs -touchz $[hdfs_account_info_snapshot_path]/data/available_$[account_info_latest_date]
    else
        echo "$cmd is failed,please check!" >> ${send_emails_file}
    fi
; douyu media info snapshot
hdfs:$[hdfs_media_snapshot_data_tag]_v$[media_info_schema_version]_$[media_info_latest_date], hdfs:$[hdfs_media_snapshot_schema_path]/schema_douyu_media_info_snapshot_v$[media_info_schema_version] <- hdfs:$[media_info_latest_path], hdfs:$[media_info_schema_path]
    hdfs_crawl_media_data=$($[plugin_utils_hdfs_interaction_with_local_file] --interaction_mode=print --data_hdfs_path=$[hdfs_media_info_data_tag] --start_time=$[media_snapshot_latest_date] --end_time=$[media_info_latest_date] --data_hdfs_path_list)
    cmd="/bin/bash $[plugin_media_info_generator] --media_info_data_path ${hdfs_crawl_media_data} --media_info_schema_path $INPUT1 --last_media_info_snapshot_data_path $[media_snapshot_latest_path] --last_media_info_snapshot_schema_path $[media_snapshot_schema_path] --cur_media_info_snapshot_data_path $OUTPUT0 --media_info_snapshot_schema_path $OUTPUT1 --media_info_pig_config_path $[plugin_media_info_config_generator]"
    echo "$cmd"
    eval "$cmd"
    if [ $? -eq 0 ]; then
        hadoop fs -touchz $[hdfs_media_snapshot_path]/data/available_$[media_info_latest_date]
    else
        echo "$cmd is failed,please check!" >> ${send_emails_file}
    fi

workflow.sh

#!/usr/bin/env bash
source '/var/weiboyi/azkaban/big_data/Common/workflow_environment_config.sh'
source '/var/weiboyi/azkaban/big_data/Common/workflow_plugin_definition.sh'
export PROFILE='/var/weiboyi/azkaban/big_data/Common/workflow_drake_profile'
export workflow_home=/var/weiboyi/azkaban/UnifiedDataProcessing/WorkFlow/Douyu/CrawledDataParser/trunk
data_folder='/data0/weiboyi/azkaban/UnifiedDataProcessing/WorkFlow/Douyu/CrawledDataParser/data'

workflow_name='douyuDataGenerator'
workflow_owner='[email protected]'

today=`date +"%Y%m%d"`
drake_base_folder=${data_folder}/${today}
mkdir ${drake_base_folder}

statistic_result=${drake_base_folder}/statistic_result
if [ -f ${statistic_result} ]; then
    rm ${statistic_result}
fi

send_emails_file=${drake_base_folder}/send_emails_result
if [ -f ${send_emails_result} ]; then
    rm ${send_emails_file}
fi

# clear the expired data in data folder
find ${data_folder} -type d -mtime +30 -exec rm -rf {} \;

echo '#############################################################'

valid_date=$1

douyu_account_info_path=/tech/azkaban/data_processing/crawler2/douyu/account_info
douyu_account_info_tag=${douyu_account_info_path}/data/douyu_account_info
douyu_account_latest_date=$(${plugin_utils_hdfs_interaction_with_local_file} --interaction_mode=print --data_hdfs_path=${douyu_account_info_tag} --item_count=1 --valid_time)
echo "douyu_account_latest_date: ${douyu_account_latest_date}"

douyu_media_info_path=/tech/azkaban/data_processing/crawler2/douyu/media
douyu_media_info_tag=${douyu_media_info_path}/data/douyu_media

douyu_media_latest_date=$(${plugin_utils_hdfs_interaction_with_local_file} --interaction_mode=print --data_hdfs_path=${douyu_media_info_tag} --item_count=1 --valid_time)
echo "douyu_media_latest_date: ${douyu_media_latest_date}"

flag="false"
unset douyu_account_feature_valid_date
if [ ! ${valid_date} ];then
    douyu_account_feature_valid_date=${douyu_media_latest_date}
    flag="true"
elif [ "${valid_date}" -gt "${douyu_account_latest_date}" ] && [ "${valid_date}" -gt "${douyu_media_latest_date}" ]; then
    echo "valid_date ${valid_date} is greater than douyu_account_latest_date ${douyu_account_latest_date}, exit" >> ${send_emails_file}   
else
    douyu_account_feature_valid_date=${valid_date}
    flag="true"
fi
echo "douyu_account_feature_valid_date: ${douyu_account_feature_valid_date}"

echo "##########################################################"

# call the drake workflow

if [ ${flag} == "true" ]; then
    cmd="${drake_cmd_env} --auto --workflow=${workflow_home}/workflow_douyu_data.d --base=${drake_base_folder} --logfile=${drake_base_folder}/drake_${today}.log --tmpdir=${drake_base_folder}/drake_tmp -v statistic_result=${statistic_result},send_emails_file=${send_emails_file}"
    echo "$cmd" 
    eval "$cmd"
fi

echo '############################### upload hbase start ##############################'
#upload DB
plugin_version="2.0"
plugin_home=/var/weiboyi/azkaban/UnifiedDataProcessing/AccountFeatureUpload
plugin_upload_hbase_generator=${plugin_home}/app/${plugin_version}/bin/account_feature_upload_hbase_java_generator.sh

plugin_upload_douyu_data_path=/tech/azkaban/data_processing/feature_generator/douyu/data/media_info_snapshot
hdfs_upload_douyu_schema_path=${plugin_upload_douyu_data_path}/schema
hdfs_upload_douyu_data_tag=${plugin_upload_douyu_data_path}/data/douyu_media_info_snapshot

plugin_upload_douyu_given_data_path=$(${plugin_utils_hdfs_interaction_with_local_file} --interaction_mode=print --data_hdfs_path=${hdfs_upload_douyu_data_tag} --start_time=${valid_date} --end_time=${valid_date} --data_hdfs_path_list)
echo "plugin_upload_douyu_given_data_path: ${plugin_upload_douyu_given_data_path}"
hdfs_upload_douyu_schema_path=$(${plugin_utils_hdfs_interaction_with_local_file} --interaction_mode=print --data_hdfs_path=${hdfs_upload_douyu_data_tag} --item_count=1 --schema_hdfs_path)
echo "hdfs_upload_douyu_schema_path: ${hdfs_upload_douyu_schema_path}"

data_folder='${plugin_home}/data'
workflow_home='/var/weiboyi/azkaban/UnifiedDataProcessing/WorkFlow/Douyu/CrawledDataParser'
config_folder='${workflow_home}/config'

if [ ${plugin_upload_douyu_given_data_path} ];then
    cmd="/bin/bash ${plugin_upload_hbase_generator} --input_data_path ${plugin_upload_douyu_given_data_path} --input_schema_path ${hdfs_upload_douyu_schema_path} --config_file ${config_folder}/account_douyu_upload_hbase.yaml --tableName pinggu_dw:media_douyu --isCreateHbaseTable false"
    echo "$cmd"
    eval "$cmd"
    if [ $? -ne 0 ];then
        echo "${valid_date}_${today}:exe douyu media snapshot upload hbase error,please check!">>${send_emails_file}
    fi

fi
echo '############################### upload hbase end ##############################'

echo "##########################################################"
if [ -f ${send_emails_file} ];then
  cmd="mail -s 斗鱼爬虫数据处理：${valid_date}_${today} ${workflow_owner} < ${send_emails_file}"
  echo "$cmd"
  eval "$cmd"
fi
echo "##########################################################"

你可能感兴趣的:(bigdata,workflow)

工业日志AI大模型智能分析系统-后端实现
目录项目主要架构完整系统架构主要系统架构解析图思路解析模板json示例主要核心代码示例LangGraph工作流(backend/ai/workflows.py)LangChainAgents(backend/ai/agents.py)Django视图(backend/core/views.py)配置(config.py)响应示例关键优势项目主要架构LangGraph、LangChain、Djang
如何调用dify工作流api，代码格式如下
importrequestsimportjson#API配置api_url="http://localhost:8082/v1/workflows/run"api_key="app-6Ef8WnCL1rB4oMtvPgaLBSJy"#请求头headers={ 'Authorization':f'Bearer{api_key}', 'Content-Type':'application/json
【量化系统实战】深入解析：大规模数据管理与分布式计算，打造你的量化“超级工厂” Natsume1710 python github 开发语言算法大数据数据仓库
前言随着量化策略的不断演进，以及对高频数据、另类数据（新闻、社交媒体、卫星图像等）需求的日益增长，许多朋友可能都会遇到一个棘手的问题：当数据量达到TB甚至PB级别，复杂的因子计算和超大规模回测在单机上变得举步维艰，系统效率严重受限。本文将作为量化系统构建系列的进阶篇，聚焦于大规模数据管理（BigDataManagement）和分布式计算（DistributedComputing）。我们将详细阐述如
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南汤力赛Frederica
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南querybookQuerybookisaBigDataQueryingUI,combiningcollocatedtablemetadataandasimplenotebookinterface.项目地址:https://gitcode.com/gh_mirrors/qu/querybook查询执行问题排查当您在QueryBook
QueryBook项目中的查询引擎支持与集成指南倪俊炼
QueryBook项目中的查询引擎支持与集成指南querybookQuerybookisaBigDataQueryingUI,combiningcollocatedtablemetadataandasimplenotebookinterface.项目地址:https://gitcode.com/gh_mirrors/qu/querybook概述QueryBook作为一个数据查询与分析平台，其核心功
【Python系列】空值判断
博客目录初始代码分析优化点一：查询条件的整合优化点二：使用SQLAlchemy推荐语法优化点三：简化条件判断优化点四：错误消息的规范化更现代的SQLAlchemy2.0风格在软件开发中，数据库查询是最常见的操作之一，但如何编写高效、可读且健壮的查询代码却是一门艺术。初始代码分析原始代码片段如下：app=db.session.query(App).filter(App.id==workflow_pr
安装Hadoop集群&入门&源码编译只年大数据 Hadoop hadoop 大数据分布式
安装Hadoop集群完全分布式先决条件准备三台机器NameStaticIPDESCbigdata102192.168.1.102DataNode、NodeManager、NameNodebigdata103192.168.1.103DataNode、NodeManager、ResourceManagerbigdata104192.168.1.104DataNode、NodeManager、Seco
Git 教程-第八篇：Git 团队协作最佳实践程序员勇哥 Java全套教程前端全套教程 Git git java 版本管理
Git教程-第八篇：Git团队协作最佳实践1.团队工作流程1.1集中式工作流程（CentralizedWorkflow）核心逻辑：以中央仓库的master分支为唯一协作分支，所有开发直接在master上进行。操作示例：拉取最新代码：gitpulloriginmaster修改并提交：gitadd.&&gi
GitHub Actions配置python flake8和black 小米人儿 Python python flake8 black
要在GitHubActions中使用flake8和black进行代码规范检查和格式化验证，请按照以下步骤操作：1.创建GitHubActions工作流文件在项目根目录创建文件：.github/workflows/lint.yml，内容如下：name:PythonLintingon:push:branches:[main,master]#触发分支pull_request:#PR时触发jobs:lin
AI人工智能代理工作流AI Agent WorkFlow：高并发场景下AI代理的性能调优 AI大模型应用之禅人工智能数学基础计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：高并发场景下AI代理的性能调优关键词：AI代理，工作流，性能调优，高并发，分布式系统，资源管理，负载均衡1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，AI代理（AIAgents）在各个领域的应用越来越广泛。AI代理作为自动化、智能化的执行实体，能够模拟人类智能行为，完成复杂的任务。在高并发场景下，例如在线服务、金融服务、智能城市等，A
workflow的可编排协作模式思绪漂移人工智能 agent workflow 模式
Workflow的可编排协作模式在AI工作流设计中，协作模式的选择直接影响系统效率和结果质量。本文将系统分析6种主流协作模式，探讨选择方案与适合场景。一、传统单一模式特点：使用标准框架进行线性编排所有任务按固定顺序执行适合简单、确定性强的流程适用场景：规则明确、步骤固定的业务流程自动化二、路由模式核心机制：LLM先识别用户意图根据意图路由到对应处理模块优势：意图识别准确率高资源分配精准典型应用：客
游戏研发高效利器：SVN资源动态项目管理解决方案还债大湿兄游戏项目管理
一、问题背景与解决方案传统资源分发痛点：人工打包耗时：平均每次版本发布需2小时版本隔离：不同团队无法同时使用多个版本资源冲突：美术/QA/策划资源版本不一致动态管理方案优势：二、系统核心流程//完整工作流控制器voidGameResourceManager::executeFullWorkflow(){//1.凭证验证if(!validateCredentials()){showError("认证
GitHub Actions 的深度解析与概念介绍青草地溪水旁 linux 环境配置开发管理 github linux ubuntu docker
GitHubActions核心定义GitActions是GitHub原生提供的自动化工作流引擎，允许开发者在代码仓库中直接创建、测试、部署代码。其本质是通过事件驱动（Event-Driven）的自动化管道，将软件开发中的重复任务抽象为可编排的流程。架构核心四要素工作流（Workflow）仓库中的自动化流程蓝图（.yml文件）存储在.github/workflows目录单仓库可包含多个独立工作流事件
大语言模型LLM | 一文了解dify的工作流的两种模式（Chatflow对话流与Workflow自动化流）大模型本地部署_ 语言模型 microsoft AI大模型人工智能 LLM 大模型入门 Dify
摘要：在AI应用开发领域，如何让大语言模型（LLM）高效处理复杂任务一直是核心课题。Dify创新性地推出两种工作流形态——Chatflow对话流与Workflow自动化流，如同两把利刃，分别破解对话交互与批量处理的难题。本文将从技术特性、应用场景到核心差异，带您全面解锁Dify工作流的双重魔力。一、Chatflow对话流：让交互更智能的「对话大脑」1、对话场景的专属引擎Chatflow专为实时交互
Langflow：这个拖拽式AI工作流神器正在颠覆传统编程
Langflow是一个用于构建和部署由大语言模型（LLMs）驱动的AIAgent和逻辑流程（Workflows）的可视化工具。它不仅提供了类似积木搭建式的可视化界面来快速创建Agent，还提供一套完整的API系统，使每个Agent都能轻松集成进任意技术栈的应用中。你可以将它看作是AI世界的前端工程图板：可视化+可部署+模块配置自由。Stars数77,217Forks数6,889主要特点可视化流程搭
Spring AI Alibaba Graph 实践
本文中将阐述下AI流程编排框架和SpringAIAlibabaGraph以及如何使用。1.Agent智能体结合Google和Authropic对Agent的定义：Agent的定义为：智能体（Agent）是能够独立运行，感知和理解现实世界并使用工具来实现最终目标的应用程序。从架构上，可以将Agent分为两类：Workflows系统：人类干预做整体决策，LLMs作为workflows链路的节点。具有明
Sharding-Sphere，Sharding-JDBC_介绍_Sharding-Sphere，Sharding-JDBC分布式_分库分表工作笔记001 添柴程序猿
技术交流QQ群【JAVA,C++,Python,.NET,BigData,AI】：170933152因为公司最近在做多租户的智慧城市相关的产品,这里,偶然看到这个框架,应该是可以用到,所以就看了一些,记录下来.先看一下我们要看的内容.去网站看看shardingsphere,是一套开源的分布式数据库中间件,解决方案包括3个产品点击了解更多去看一下
LangGraph--基础学习（stream 流式调用和使用） zsffuture 学习
前面很多内容都是从大方面了解langgraph和智能体，这样我们已经有了一个很好的全局意识了，现在需要深入掌握一下langgraph的基础功能和开发细节，以此应对后续开发负责的智能体，我们第一个需要学习的就是stream，为什么要学习其他，因为这个和调试智能体有很大的关系，前面我么写了那么多代码出问题都不知道怎么调试，因此本节就是要学会怎么调试。我们一直在使用workflow.invoke(inp
Kafka协议开发总踩坑？3步拆解二进制协议核心讳疾忌医丶 kafka linq 分布式
在深入研究workflow项目的Kafka实现后，我发现其Kafka协议处理和压缩支持设计极其精妙。本文将从源码角度深度解析这两个核心知识点，并通过一个完整的学习案例来加深理解。第一部分：Kafka二进制协议深度解析1.1协议设计架构思想Kafka作为高性能的分布式流处理平台，其二进制协议设计体现了以下核心思想：1.协议层次化设计消息头(Header)：包含API类型、版本号、相关ID等元信息消息
10 分钟撸出高性能 I_O：从 pread 到 fdatasync（C++ 全流程代码 + 逐行注释）讳疾忌医丶 c++开发语言
异步文件I/O操作是现代高性能C++服务端编程的核心技术之一。本文基于开源项目workflow的源代码实现，深入剖析异步文件操作、向量I/O、文件同步机制以及跨平台兼容性设计的精髓，并通过一个完整的学习案例来加深理解。1.异步文件操作架构设计1.1设计思路分析workflow的异步文件I/O系统采用了分层架构设计：任务层（TaskLayer）：WFFileIOTask：基础文件I/O任务抽象WFF
10分钟撸出高性能网络服务：吃透高性能优化：缓存_锁_系统调用_编译讳疾忌医丶性能优化缓存
在现代高性能网络编程中，优化技术是决定系统性能上限的关键因素。通过深入分析workflow项目的核心实现，我们可以学习到四个重要的优化维度：CPU缓存优化、锁优化技术、系统调用优化以及编译器优化。本文将详细解析这些技术的设计思路，并通过一个综合案例来加深理解。1.CPU缓存优化：数据结构缓存友好设计1.1核心理念与设计思路CPU缓存优化的核心在于局部性原理的有效利用。现代CPU的缓存层次结构（L1
DNS 解析总出错？3 步吃透协议核心（附 workflow 源码）讳疾忌医丶服务器网络 php
DNS（DomainNameSystem）协议是互联网的基础设施之一，它负责将人类可读的域名转换为计算机可理解的IP地址。在网络编程中，DNS解析是极其重要的环节，特别是在高性能网络应用中。DNS报文格式详细分析DNS报文头部结构根据workflow项目中的实现，DNS报文头部结构如下：/***DNS头部结构定义*包含了DNS协议的核心控制信息*/structdns_header{uint16_t
OGG从oracle到KAFKA的增量数据表同步操作 Romona_J oracle kafka 数据库
OGG从oracle到KAFKA的增量数据表同步操作需求oracle的库：cas库kfaka服务器：给与topic信息、以及服务器IP：端口同步表：cas.students环境在独立的服务器上面装oggfororacle11g以及oggforbigdata通过在oggfororacle服务器连接源端数据库做抽取到本地通过oggforbigdata服务器做复制1.OGGforOracle安装及配置开
MapReduce 程序详解
Hadoop的第一课总是MapReduce，但是往往我们每次都是使用自带的例子跑一遍MapReduce程序，今天总与自己写了一个完整的程序。技术有限，多多指教。1.导Jar包，将Hadoop的Jar导入到你的工程2.开始写自己的主类，分为3个类。第一个类WordcountMapperpackagecn.itcast.bigdata.mr.wcdemo;importjava.io.IOExcepti
工作流授权控制模型-来自网友的email，谢谢他．大家共享-需要图片的请email:[email protected] sunkingcom java JBPM OSWorkFlow email 工作 authorization 任务文档 object
工作流授权控制模型version1.0第1页工作流授权控制模型WorkflowAuthorizationModel版本：1.0作者：胡长城网上游名：银狐999；james999个人主页：http://www.javafox.org完成时间：2003-12-14联系信箱：[email protected]：[email protected]本文大部分参考文档，可以在http
【赛题样题】【大数据应用开发】2023年全国职业院校技能大赛高职组“大数据应用开发”第三套样题波比网络大数据大数据应用开发职业院校技能大赛高职组赛题样题
2023年全国职业院校技能大赛赛题第03套赛项名称：大数据应用开发英文名称：BigDataApplicationDevelopment赛项组别：高等职业教育组赛项编号：GZ033背景描述大数据时代背景下，电商经营模式发生很大改变。在传统运营模式中，缺乏数据积累，人们在做出一些决策行为过程中，更多是凭借个人经验和直觉，发展路径比较自我封闭。而大数据时代，为人们提供一种全新的思路，通过大量的数据分析得
云平台领域新秀：百度云的崛起之路 AI云原生与云计算技术学院百度云云计算 ai
云平台领域新秀：百度云的崛起之路关键词：百度云、云计算、云服务、技术架构、生态建设、市场竞争、行业智能化转型摘要：作为中国云计算市场的重要参与者，百度云通过独特的"ABC（AI+BigData+Cloud）"战略实现了从行业追赶者到创新引领者的蜕变。本文深度解析百度云的技术架构演进路径，揭示其在AI原生云、混合云架构、边缘计算协同等核心领域的技术优势；系统梳理生态建设策略与行业解决方案体系，分析其
ComfyUI-SaveAsScript：一键导出ComfyUI工作流为Python脚本劳治亮
ComfyUI-SaveAsScript：一键导出ComfyUI工作流为Python脚本ComfyUI-SaveAsScriptApowerfultoolthattranslatesComfyUIworkflowsintoexecutablePythoncode-nowasaUIbutton.项目地址:https://gitcode.com/gh_mirrors/co/ComfyUI-SaveAs
图片文件后缀为eps时，latex编译报错：not found: using draft setting. 幸运小仙 latex 图片后缀笔记
使用pdflatex编译时报错：!Packagepdftex.defError:File`figures/CIDC_Workflow-eps-converted-to.pdf'notfound:usingdraftsetting.Seethepdftex.defpackagedocumentationforexplanation.TypeHforimmediatehelp....l.165...c
泛微OA Ecology9实际操作中几个SQL语句小技巧
在日常维护泛微Ecology9中，难免会遇到这样那样的问题，不过有些小问题可以借助一些sql语句来解决，今天就把相关的笔记记录一下！1、弥补OA流程中的流程编号1.1.打开OA流程后台的流程编号配置页面，选择预留编号，根据流程编号，输入需要预留的编号1.2.执行sql语句，先修改workflow_requestbase中的字段requestmark然后修改对应流程中的lcbh字段--需要注意sql
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro