迷路剑客

Flink-Zeppelin On FlinkSql

Flink系列文章

更多Flink系列文章请点击Flink系列文章
更多大数据文章请点击大数据好文推荐

摘要

最近在调研流平台，发现各大公司流平台的Web界面都是自己一个团队开发，相当完备。苦于人力、时间有限，想找现成的能提交FlinkSql的Web代码，没找到合适的开源的。但是想起了之前看过的Zeppelin，现在已经支持Flink 1.0且支持DataStream、Table & SQL 等，遂赶紧尝试。如果能走通，后续计划在原数据这块儿看看有什么好办法管理起来。

1 Zeppelin

1.1 简介

Apache Zeppelin
Apache Zeppelin-preview版
Github Zeppelin

Zeppelin基于界面化的笔记本，可实现数据驱动，使用SQL、Scala（没看错，能指直接写Scala代码！）等进行交互式数据分析。

可视化的笔记本是指：

数据摄取
数据发现
数据发现，根据阿里云数据治理数据保护伞数据发现章节所说，是指通过规则配置，帮助您有效识别组织内的敏感数据，以project等不同维度，为您提供可视化的数据资产展示。
数据分析
数据可视化、协作

1.2 架构

1.2.1 Zeppelin Server

Zeppelin Server是Zeppelin最主要的服务之一，负责管理Interpreter。可以启动多个Zeppelin Server组成服务状态一致的集群（使用了Raft协议，具体是 Raft算法库Atomix），共享Notebook、元数据，实现Interpreter负载均衡。

集群模式下的ZeppelinServer就是一个Raft节点（Leader/Follower），而Interpreter是Raft客户端
集群模式中，每个ZeppelinServer都运行了一个集群管理服务（使用Raft算法库Atomix来组件服务状态一致的集群），会复制状态机(ClusterStateMachine)来在ZeppelinServer集群上维护一致性的集群元数据（包括集群服务和进程状态）。
集群模式下，每个ZeppelinServer和Interpreter运行了集群管理客户端，使用Netty连接Raft Cluster Server来维护存储在ClusterStateMachine中的数据，进程停止后元数据信息将被清除。
集群模式下每个ZeppelinServer和Interpreter进程中运行了监控模块，周期性发送心跳给Raft Leader。
- 普通ZeppelinServer发送了本节点的CPU和内存资源平均使用情况，用以在创建Interpreter时进行分配。
- Raft Leader ZeppelinServer会监控所有类型节点上报的心跳数据，发现超时就认为不可用并剔除。
集群模式下notebook和interpreter改动会自动同步到集群中所有节点
因为使用Raft协议，选举中必须过半投票选一个节点才能选出Leader，所以应该部署奇数个节点，比如2N + 1个，此时可容忍其中的 N 个节点挂掉

可通过Nginx等技术进行前端代理。多个用户访问域名时，Nginx根据分布式策略来将用户分配到不同的可用的Zeppelin Server，如上图User1/2。

1.2.2 Interpreter架构

每个Interpreter进程都是一个JVM进程，通过thrift和Zeppelin Server交互。单节点模式时在ZeppelinServer本地创建，集群模式时先从集群元数据中查找是否已经存在所需Interpreter如果有就直接通过元数据中的该Interpreter进程的Thrift IP和端口来将note和该进程建立绑定关系；如果不存在就通过元数据找出最空闲的ZeppelinServer节点，并通过Thrift来告知远程ZeppelinServer创建Interpreter进程。

用户使用的notebook运行在Interpreter上，底层就能跑各种引擎、语言。

Interpreter 进程启动后，将会在 Zeppelin Cluster MetaData 中提交自身的元数据信息，关闭时清除。如果没有正常退出导致元数据没有先清理，ZeppelinServer会主动周期性检查该元数据对应的Interpreter的心跳时间戳来确定对应的进程是否存活。

Zeppelin Server和Interpreter进程的通信手段是Netty。

InterpreterGroup
可包含多个Interpreter，比如SparkInterpreter Group 包含了 SparkSqlInterpreter、SparkInterpreter、PySparkInterpreter 等Intepreter。

当用户使用 SparkInterpreter Group 创建一个 notebook 时，ZeppelinServer 会创建一个独立的 JVM 进程，进程中的 SparkSqlInterpreter 、 SparkInterpreter 、PySparkInterpreter可以共用一个 SparkContext，因为他们属于同一个InterpreterGroup。

InterpreterGroup和Interpreter关系具体还要取决于Interpreter Binding Mode。

1.2.3 Cluster MetaData

集群中元数据信息，KV键值对格式，包括ZeppelinServer和Interpreter进程元数据，通过State Machine 维护服务状态一致性。

ZeppelinServer和Interpreter都会周期性发送心跳来更新Cluster Metadata中自己的信息，而担任Leader的那个ZeppelinServer会定时检查Cluster Metadata中的时间戳信息，如果有超时的就会清理超时的服务和进程。

ZeppelinServer元数据
Interpreter元数据

1.2.3 Notebook

用户工作的平台，包含若干Paragraph。

默认为local即存在本地，集群模式时应该选择所有集群中的Zeppelin节点都能访问的位置，比如HDFS。

集群模式下，会将修改自动同步到所有ZeppelinServer节点。

1.2.4 Paragraph

一个Notebook包含若干Paragraph，可以共享数据。

比如一个FlinkSQL程序，可以在定义3个Paragraph:

source table ddl
sink table ddl
insert into sink select * from source

1.3 Interpreter

1.3.1 概念

1.3.1.1 概述

Zeppelin interpreter是个重要的组件，可将任何语言和数据处理后端以插件化的方式接入Zeppelin，目前支持的技术栈如下：

如果没有你需要的，那还可以自定义一个：

how to create a new interpreter
Installing Interpreters

通过Interpreters，我们可以很方便的使用各种语言和数据处理后端，比如可以直接用%flink来直接在Zeepelin中写scala代码。

1.3.1.2 Interpreter Binding Mode

用来控制Notebook和用户的隔离模式：

Globally-shared
所有使用该interpreter的notebook/用户共享一个interpreter JVM进程和session，比如用flink on yarn那就是每次提交的任务都是提交到一个Flink集群执行。此时Note之间可互相访问创建的变量。生产环境不推荐使用。
Per Note-scoped
每个Note都会创建一个新的interpreter实例且拥有自己的Session，但是在同一个interpreter JVM进程中。此时仍可通过ResourcePool来跨NoteBook交换对象。
Per Note-isolated
每个Note都会创建一个新的interpreter进程，也拥有独享的Session。此时仍可通过ResourcePool来跨NoteBook交换对象。

1.3.1.3 Interpreter的生命周期管理

Zeppelin 0.8.0以后提供了LifecycleManager接口来控制interpreter生命周期，0.9.0有两个实现：

TimeoutLifecycleManager（默认，可通过zeppelin.interpreter.lifecyclemanager.class切换）
当interpreter保持空闲一段时间后就会关闭interpreter。默认阈值为1小时，可通过zeppelin.interpreter.lifecyclemanager.timeout.threshold设置。
NullLifecycleManager
什么都不做，由用户控制interpreter生命周期

1.3.2 Interpreter架构

点击这里

1.3.3 Interpreter管理

1.3.3.1 创建Interpreter

interpreter group
创建的时候，最重要的一点是选择interpreter group:

每个interpreter都属于某一个interpreter group，一个interpreter group将所有包含的interpreter运行在一个jvm里，以他为单位进行启动/停止。

1.3.3.2 修改Interpreter

也是跟创建一样点击进入Interpreter界面，搜索后可以修改创建的interpreter。

1.3.3.3 Interpreter配置项目

见interpreter

1.3.3.4 Interpreter全局配置

Interpreter有很多配置，可直接在Zeppelin上Web界面上设置，有两类属性：

大写字母代表系统环境变量
比如flink interpreter中设置FLINK_HOME和 HADOOP_CONF_DIR，则会将配置作为环境变量传递给flink interpreter进程，由flink使用。
否则表示普通interpreter属性

关于Context Parameters

还可以通过#{contextParameterName}来使用解释器上下文中的参数：

如果context参数为null，则将其替换为空字符串。

1.3.3.5 Interpreter细粒度配置(inline configuration)

上面说的都是interpreter下的通用配置，所有使用该interpreter的Notebook都是用该配置。但有些时候我们想每个notebook单独使用某些配置，虽然可创建单独interpreter但很不方便，所以可使用Inline Generic Configuration。

即在notebook最开始的paragraph里面写:

%flink_chengc.conf
flink.execution.mode yarn
flink.tm.memory 2048
flink.jm.memory 1024
flink.yarn.appName chengc
flink.yarn.queue default

1.3.4 Interpreter on yarn

可通过interpreter 配置zeppelin.interpreter.launcher yarn来讲interpreter运行在yarn上，然后会和Zeppelin服务端通过Thrift交互。

具体源码在YarnInterpreterLauncher和YarnRemoteInterpreterProcess。

可配合flink on yarn使用，则Interpreter在yarn上am 中拉起来后，会去拉起一个flink cluster。相关源码在FlinkScalaInterpreter、FlinkInterpreter等。

flink配置文件上传和读取流程如下：

先用当前本机环境变量将flink配置文件目录上传
再将envs设为ApplicationConstants.Environment.PWD.$()，即yarn上的am container工作目录
am拉起来后，会去hdfs下载flink配置文件解压到工作目录，并按照 sys.env.getOrElse
去读取配置的工作目录路径下的flink配置文件，这样就能正确读取到我们本机的flink配置文件了

2 安装、配置和部署

2.1 下载

Download Apache Zeppelin

有三种方式：下载完整已编译二进制包、通过网络安装指定interpreter的包或者源码自己编译安装。

图方便就用第一种吧（不过很大，有1.5G）。

2.2 安装

可参考

Zeppelin Install

必须是JDK 1.8(171)以上

下载完后直接解压zeppelin-0.9.0-preview1-bin-all.tgz。

tar -zxvf zeppelin-0.9.0-preview1-bin-all.tgz

2.3 配置

2.3.1 常用配置

可参考

Apache Zeppelin Configuration

可修改两个配置文件，都配置了同key属性时以环境变量文件为准：

conf/zeppelin-env.sh
一些环境变量
conf/zeppelin-site.xml
一些java属性

我改了几个属性：

zeppelin.server.addr
改为ip，默认127.0.0.1，不然其他机器访问不了
zeppelin.server.port
zeepelin启动后的web端口
zeppelin.interpreter.lifecyclemanager.class
改为org.apache.zeppelin.interpreter.lifecycle.TimeoutLifecycleManager，默认是NullLifecycleManager，不会管interpreter是否空闲。而TimeoutLifecycleManager会在interpreter保持空闲状态超过zeppelin.interpreter.lifecyclemanager.timeout.threshold毫秒时，干掉interpreter。
zeppelin.interpreter.lifecyclemanager.timeout.threshold
改为 3600000
zeppelin.interpreter.lifecyclemanager.timeout.checkinterval
改为60000，检测interpreter是否超时的间隔时间
zeppelin.recovery.storage.class
指定zeppelin恢复模式(详见https://mp.weixin.qq.com/s/D02M68HO4Te4cReIoRLMwQ)。

改为org.apache.zeppelin.interpreter.recovery.FileSystemRecoveryStorage。设定后，关掉Zeppelin主进程不会关掉interpreter进程，重启zeppelin会去重连这些interpreter进程。

这个时候如果还想干掉所有interpreter进程，请使用bin/stop-interpreter.sh。

默认NullRecoveryStorage，意味着关掉Zeppelin就关掉了所有运行中的interpreter 进程。
zeppelin.recovery.dir
在集群模式下，还应该把此项设为hdfs上路径，如/tmp/zeppelin/recovery。注意不要加如hdfs://namespace，否则路径不对！
将Notebook保存在共享存储中
zeppelin.notebook.storage
设为org.apache.zeppelin.notebook.repo.FileSystemNotebookRepo
zeppelin.notebook.dir
设为hdfs上的目录，如/tmp/zeppelin/notebook。这里注意不能设为hdfs://namespace/xxx，否则路径会有问题！

2.3.2 Interpreter配置

2.3.2.1 通用配置

FLINK_HOME
如/xxx/flink
flink.execution.mode
默认local即本地模式，还可用yarn
HADOOP_CONF_DIR
HADOOP配置文件所在路径，如/xxx/etc/hadoop

2.3.2.2 Flink Interpreter配置

可参考

Flink interpreter for Apache Zeppelin-Configuration

重要配置如下：

flink.interpreter.close.shutdown_cluster
改为false。

默认true，即在interpreter关闭时会shutdown应用程序。

注意，在interpreter on yarn+flink on yarn模式下可以将此设置改为true，效果就是只要你需要重启interpreter来改配置就会停止对应的flink app，达成同步。
zeppelin.interpreter.close.cancel_job
改为false

默认true，即在interpreter关闭时会cancel我们的flink job。

注意，在interpreter on yarn+flink on yarn模式下可以将此设置改为true，效果就是只要你需要重启interpreter来改配置就会停止对应的flink app，达成同步。

如果flink任务依赖一些包，可以有三种方式加入依赖：

flink.execution.jars
指定flink job所依赖的普通jar包，所有的jar包都被会load到flink interpreter的classpath，还会被发送到Task Manager。
flink.udf.jars
和flink.execution.jars不同的地方在于Zeppelin会自动检测该选项指定的jar包中所包含的UDF class，会把检测到的UDF注册到TableEnvironment中（UDF的名字就是这个class name），以便用户使用。

注意：
- 你的UDF Class必须包含一个无参的构造函数。
- 这种方式如果实在全局interpreter配置，则UDF也是全局的
- 还可以在你自己的notebook interpreter inline config里面配置，这种方式就对当前notebook生效

flink.execution.packages
类似flink.execution.jars，但不同的是Zeppelin会下载该选项指定的package以及该package的依赖放到flink interpreter的classpath。比如你想使用kafka connector配置如下

org.apache.flink:flink-connector-kafka_2.11:1.10.0,org.apache.flink:flink-connector-kafka-base_2.11:1.10.0,org.apache.flink:flink-json:1.10.0

但我实测在测试环境无问题，生产环境因为安全策略不能自动下载，只能去repo1.maven.org手动下载打好的jar（flink-connector-kafka_2.11-1.10.0.jar、flink-connector-kafka-base_2.11-1.10.0.jar、flink-sql-connector-kafka_2.11-1.10.0.jar、flink-json-1.10.0.jar，如果找不到包还可以放入kafka-clients-2.2.0.jar），并upload到使用的flink/lib下，否则会报错如下：

WARN [2020-05-28 11:41:34,042] ({SchedulerFactory11} NotebookServer.java[onStatusChange]:1901) - Job paragraph_1590573205576_568821782 is finished, status: ERROR, exception: null, result: %text org.apache.zeppelin.interpreter.InterpreterException: org.apache.zeppelin.interpreter.InterpreterException: java.lang.RuntimeException: [unresolved dependency: org.apache.flink#flink-connector-kafka_2.11;1.10.0: not found, unresolved dependency: org.apache.flink#flink-connector-kafka-base_2.11;1.10.0: not found, unresolved dependency: org.apache.flink#flink-json;1.10.0: not found]
        at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:76)
        at org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer.java:668)
        at org.apache.zeppelin.interpreter.remote.RemoteInterpreterServer$InterpretJob.jobRun(RemoteInterpreterServer.java:577)
        at org.apache.zeppelin.scheduler.Job.run(Job.java:172)
        at org.apache.zeppelin.scheduler.AbstractScheduler.runJob(AbstractScheduler.java:130)
        at org.apache.zeppelin.scheduler.ParallelScheduler.lambda$runJobInScheduler$0(ParallelScheduler.java:39)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
        at java.lang.Thread.run(Thread.java:748)
Caused by: org.apache.zeppelin.interpreter.InterpreterException: java.lang.RuntimeException: [unresolved dependency: org.apache.flink#flink-connector-kafka_2.11;1.10.0: not found, unresolved dependency: org.apache.flink#flink-connector-kafka-base_2.11;1.10.0: not found, unresolved dependency: org.apache.flink#flink-json;1.10.0: not found]
        at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:76)
        at org.apache.zeppelin.interpreter.Interpreter.getInterpreterInTheSameSessionByClassName(Interpreter.java:355)
        at org.apache.zeppelin.interpreter.Interpreter.getInterpreterInTheSameSessionByClassName(Interpreter.java:366)
        at org.apache.zeppelin.flink.FlinkSqlInterrpeter.open(FlinkSqlInterrpeter.java:109)
        at org.apache.zeppelin.flink.FlinkStreamSqlInterpreter.open(FlinkStreamSqlInterpreter.java:49)
        at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:70)
        ... 8 more
Caused by: java.lang.RuntimeException: [unresolved dependency: org.apache.flink#flink-connector-kafka_2.11;1.10.0: not found, unresolved dependency: org.apache.flink#flink-connector-kafka-base_2.11;1.10.0: not found, unresolved dependency: org.apache.flink#flink-json;1.10.0: not found]
        at org.apache.zeppelin.flink.util.DependencyUtils$.resolveMavenCoordinates(DependencyUtils.scala:353)
        at org.apache.zeppelin.flink.util.DependencyUtils$.resolveMavenDependencies(DependencyUtils.scala:60)
        at org.apache.zeppelin.flink.FlinkScalaInterpreter.getUserJars(FlinkScalaInterpreter.scala:740)
        at org.apache.zeppelin.flink.FlinkScalaInterpreter.open(FlinkScalaInterpreter.scala:149)
        at org.apache.zeppelin.flink.FlinkInterpreter.open(FlinkInterpreter.java:66)
        at org.apache.zeppelin.interpreter.LazyOpenInterpreter.open(LazyOpenInterpreter.java:70)
        ... 13 more

2.3.3 Flink On Yarn + Interpreter On Yarn

2.3.3.1 添加jar包

需要添加一些必要的jar包放在FLINK_HOME//lib下：

flink-hadoop-compatibility_{scala_version}-{flink.version}.jar
flink-shaded-hadoop-2-uber-{hadoop.version}-{flink-shaded.version}.jar

如果要采用Hive来存元数据或访问hive还需要:

flink-connector-hive_2.11-1.10.0.jar
hive-exec-2.3.3.jar

2.3.3.2 设置interpreter

2.3.3.2.1 flink on yarn

flink.execution.mode
yarn

2.3.3.2.2 interpreter on yarn

最新master分支中，还可通过interpreter 配置zeppelin.interpreter.launcher yarn来讲interpreter运行在yarn上，然后会和Zeppelin服务端通过Thrift交互，并向yarn申请资源来启动flink cluster。详见Flink on Zeppelin (7). Yarn Interpeter 模式。

此模式其他要求：

安装Hadoop client (hadoop 2和3都支持)，要求能在本机直接运行hadoop classpath命令。
zeppelin需要调用此命令将所有hadoop jar放入zeppelin inclasspath。
环境变量中配置USE_HADOOP=true（也可在zeppelin-env.sh）、HADOOP_CONF_DIR

interpreter local + flink on yarn:

interpreter on yarn + flink on yarn:

2.4 启动

进入安装好的zeppelin目录后，执行

bin/zeppelin-daemon.sh start

随后就可以访问Zeepelin Web界面了：

可以看到，已经有了一些现成的Notebook示例。

2.5 停止

bin/zeppelin-daemon.sh stop

2.6 重启

bin/zeppelin-daemon.sh restart

2.7 集群模式

重要说明：

我使用集群模式运行一段时间以后，发现各个节点包括interpreter都报了很多关于Raft协议错误，而且是突然就崩了，导致zeppelin无法正常使用。由于zeppelin关于recover和interpreter on yarn模式已经合并到主分支，而且测试无误，所以我们放弃集群模式。

2.7.1 Zeppelin全局配置

必须将Notebook保存在共享存储中
- zeppelin.notebook.storage
  设为org.apache.zeppelin.notebook.repo.FileSystemNotebookRepo
- zeppelin.notebook.dir
  设为hdfs上的目录，如/tmp/zeppelin/notebook。这里注意不能设为hdfs://namespace/xxx，否则路径会有问题！
zeppelin.recovery.dir
在集群模式下，还应该把此项设为hdfs上路径，如/tmp/zeppelin/recovery。注意不要加如hdfs://namespace，否则路径不对！
zeppelin.cluster.addr
配置集群中的所有ZeppelinServerIP及Raft端口，Raft据此进行Leader选举、元数据维护等。多个地址用逗号分隔。

这里需要注意的是，Raft端口号配置不要和zeppelin.server.port配置相同，否则会造成冲突！

注意事项：

因为使用Raft协议，选举中必须过半投票选一个节点才能选出Leader，所以应该部署奇数个节点，比如2N + 1个，此时可容忍其中的 N 个节点挂掉

2.7.2 Flink Interpreter配置

如果在Zeppelin集群模式下使用FlinkSql on Yarn，需要做如以下配置，否则报错：

FLINK_CONF_DIR
/FLINK_HOME/conf
FLINK_PLUGINS_DIR
/FLINK_HOME/plugins
FLINK_LIB_DIR
/FLINK_HOME/lib

该错误我已经提交了issue给社区，详情可见：ZEPPELIN-4809

2.8 Hive整合

2.8.1 基本配置

主要是可以让Flink使用Hive Catalog存储Flink SQL 元数据（可参考HiveCatalog，注意这种表只能由Flink读写使用，不要用Hive去读写。可以在Hive命令行中使用DESCRIBE FORMATTED命令查看表的元数据，如果是is_generic=true代表是Flink专用表），也可以直接使用Flink读写Hive表数据。

需要将以下包放入$FLINK_HOME/lib:

flink-connector-hive_2.11-1.10.0.jar
hive-exec-2.3.3.jar

然后设置flink interpreter:

HIVE_CONF_DIR
设为hive-site.xml所在目录
zeppelin.flink.enableHive
设为true，启用hive
zeppelin.flink.hive.version
使用的hive 版本号

随后，使用flinksql注册的表会自动保存到hive default库里。

2.9 checkpoint相关

可以使用flink 配置，实现0代码配置checkpoint。

具体请参考flink-checkpoint配置

2.10 权限

zeppelin可采用LDAP做身份认证+shiro做权限控制。

2.11 数据脱敏-Credentials

比如我们有一些ddl中定义了数据库连接信息，这些信息十分敏感不想暴露给其他人，这个时候我们可以用Credentials。

Credentials配置
先在interpreter配置injectCredentials true，也可在notebook界面做配置，比如执行时使用%flink(injectCredential=true)
Credentials打开
Credentials定义

这里的Entity就相当于是你的Credentials的Key，在访问时使用。

需要注意的是，每个人创建的Credentials对其他人都不可见，别人也无法使用。
Credentials使用
再次强调，每个人只能使用自己的Credentials。格式为user.EntityName和password.EntityName。（因0.9-preview尚不是稳定版本，可能存在一定变化，还可尝试EntityName.user）。

本用户使用Credentials效果：

用户使用其他人的Credentials效果，打出的是原始字符串而不是Credentials：

2.12 Pyflink

2.12.1 概述

必须使用版本号3.5-3.7的python
pip install apache-flink
如果安装很慢或者超时，可以加参数pip --default-timeout=100000 install -i https://pypi.tuna.tsinghua.edu.cn/simple apache-flink。

如果提示pip需要升级，可执行pip --default-timeout=100000 install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip
将flink-python_2.11-1.10.0.jar从$FLINK_HOME/opt移动到$FLINK_HOME/lib:
```
cp opt/flink-python_2.11-1.10.0.jar lib/
```
配置好flink_interpreter的zeppelin.pyflink.python为python路径

2.12.2 python UDF

%flink.pyflink
class PythonUpper(ScalarFunction):
    def eval(self, s):
        return s.upper()
        
bt_env.register_function("python_upper", udf(PythonUpper(), DataTypes.STRING, DataTypes.STRING()))

3 实用功能

3.1 定时调度

Running a Notebook on a Given Schedule Automatically
前提是需要将zeppelin的配置zeppelin.notebook.cron.enable设为true

3.2 数据可视化

3.2.1 概述

已经支持一些基本图标，任意后端输出都可以以图表方式展现！（不用后端人员再去学什么echarts了）

3.2.2 聚合指标运算

直接可以拖拽方式生成。

还想了解更多或二次开发就参考：

basic display systems
Angular AP 前端I
Angular API 后端

3.2.3 动态表格

Dynamic Forms 是Zeppelin的一个高级功能，允许用户在代码中插入UI控件来允许用户定制化你的代码。Jdbc Interpreter支持这一功能，用户可以定制SQL，下面是一个下拉框的例子。

3.2.4 发布Zeppelin笔记本

可以直接将你的Zeppelin笔记本url分享给其他写作者，则大家都可以看到实时更新。

4 Zeppelin高可用

4.1 ZeppelinServer服务不可用

如上图，如果ZeppelinServer1 突然挂掉不可用，如果正确配置了相关配置zeppelin.recovery.storage.class，则不会影响其上运行的interpreter进程，如果此时这些进程可访问，则其他ZeppelinServer节点可以通过Cluster Metadata读取到这些interpreter进程元数据信息，让用户继续使用这些interpreter进程。

当然Nginx也会发现ZeppelinServer1出现异常，将它视为离线状态。

那么现在本来是用ZeppelinServer1的User1再次启动NoteBook时，Nginx会将请求发送到其他ZeppelinServer节点来使用之前的interpreter进程。

4.2 Zeppelin节点整个不可用

当ZeppelinServer1所在节点整个挂掉时，其他ZeppelinServer会删除无效元数据，并重建interpreter进程。

5 二次开发

5.1 概述

Zeppelin前后端分离架构，可参考：

Contributing to Documentation
Contributing to Zeppelin-Web
有很多关于Zeppelin前端开发的详细内容
Github-Zeppelin Web Application
安装yarn_package和启动zeppelin-web指导
Contributing to Apache Zeppelin ( Website )

5.2 前端

首先要安装npm和nodejs，网上找教程即可。
然后参考Github-Zeppelin Web Application安装yarn(打包用的，不是hadoop那个yarn)
在本地Zeppelin工程目录下使用常规方式启动Zeppelin-server，默认是8080端扣
在本地Zeppelin工程/zeppelin-web 目录下执行yarn run dev即可开始调试，会自动连接到8080端口，并启动一个9000端口供访问和调试。现在你在ide里面改动js，便可立即体现在页面上了（当然，需要刷新一次）。

如果本地zeppelin-server运行很慢，可以将项目打包后放到运行速度较快的其他机器如测试环境机器，然后启动。本机的zeppelin-web只需修改base-url.service.js，假设远程zeppelin-server ip为192.168.1.1，则改动如下:

this.getWebsocketUrl = function() {
    let wsProtocol = location.protocol === 'https:' ? 'wss:' : 'ws:';
    return wsProtocol + '//' + "192.168.1.1" + ':' + this.getPort() +
      skipTrailingSlash(location.pathname) + '/ws';
  };

  this.getBase = function() {
    return location.protocol + '//' + "192.168.1.1" + ':' + this.getPort() + location.pathname;
  };

问题：

如果遇到lint:once相关语法检测错误，可以把/zeppelin/zeppelin-web/package.json中的"prebuild": "npm-run-all clean lint:once" 改为prebuild": "npm-run-all clean，并去掉"lint:once": "eslint src"。
如果遇到一些包卡住半天下不动，那就手动下下来放在那个目录里。

5.3 后端

好文推荐

Apache Zeppelin公众号

钉钉讨论群

官方

Zeppelin-Jira
Github-Apache Zeppelin

视频教程

Flink on Zeppelin: 极致体验(1) 入门 + Batch
Flink on Zeppelin: 极致体验(2) Streaming + 高级用法
Flink on Zeppelin 视频教程全集
来自阿里的章剑锋，Zeppelin PMC

综合

章剑锋Jeff-Zeppelin专栏
Flink on Zeppelin (1) - 入门篇
Flink on Zeppelin (2) - Batch篇
Flink on Zeppelin (3) - Streaming篇
Flink on Zeppelin (4) - 高级特性篇
Flink on Zeppelin (5) - 机器学习篇
Flink on Zeppelin 极致体验阿里章剑锋 - 直播回放
Flink Sql on Zeppelin教程

架构和原理

Zeppelin 分布式架构设计
Zeppelin工作机制解析

调研

Zeppelin调研与数据开发平台

源码

Zeppelin源码分析
Apache Zeppelin源码结构分析
Understanding Zeppelin Interpreters
介绍了除Flink以外的一些Interpreters
Zeppelin求学之路（3）—Zeppelin基本模块介绍和Paragraph源码深入了解以及Note,NoteBook 简介，
Zeppelin源码阅读之更新notebook的paragraph部分

使用

Zeppelin: 让大数据插上机器学习的翅膀
网易杭州研究院数据科学中心机器学习开发组负责人刘勋
如何在Apache Zeppelin中玩转Flink
Hadoop - Zeppelin 使用心得
Apache Zeppelin主要界面和基本操作
可视化分析工具Apache Zeppelin：数据分析从未这样简单
介绍了一些数据源连接配置、可视化插件（地图、热力图等）
Apache Zeppelin 基于 kerberos 多租户集成
Apache zeppelin binding mode
关于interpreter隔离的讨论。看起来per-note模式中也会发生，不同用户使用不同note对应同一个interpreter，一个用户重启该interpreter会导致全部interpreter重启，对应任务停止！

二次开发

Zeppelin Notebook Now Has a Stop Button
Notebook界面添加关闭按钮
Zeppelin在求学之路----在Zeppelin上开发SendMai功
zeppelin的数据集的优化

参考文档

Apache Zeppelin
Flink on Zeppelin (1) - 入门篇
Flink on Zeppelin (2) - Batch篇
Flink on Zeppelin (3) - Streaming篇
Flink on Zeppelin (4). 高级特性篇
Zeppelin 分布式架构设计
如何在Zeppelin里玩转Hive
Zeppelin 0.8.0 New Features
来自Zeppelin PMC Jeff Zhang
数据治理数据保护伞数据发现
Zeppelin安全机制之Credentials使用技巧

你可能感兴趣的:(数据中台,数据可视化)

Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
高级 ECharts 技巧：自定义图表主题与样式 SnowMan1993 echarts 信息可视化数据分析
ECharts是一个强大的数据可视化库，提供了多种内置主题和样式，但你也可以根据项目的设计需求，自定义图表的主题与样式。本文将介绍如何使用ECharts自定义图表主题，以提升数据可视化的吸引力和一致性。1.什么是ECharts主题？ECharts的主题是指定义图表样式的配置项，包括颜色、字体、线条样式等。通过预设主题，你可以快速更改图表的整体风格，而自定义主题则允许你在此基础上进行个性化设置。2.
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
GenVisR 基因组数据可视化实战(三) 11的雾
3.genCov画每个突变位点附件的coverage，跟igv有点相似。这个操作起来很复杂，但是图还是挺有用的。可以考虑。由于我的referencegenomebuild是hg38BiocManager::install(c("TxDb.Hsapiens.UCSC.hg38.knownGene","BSgenome.Hsapiens.UCSC.hg38"))library(TxDb.Hsapien
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
如何建设数据中台（五）——数据汇集—打破企业数据孤岛 weixin_47088026 学习记录和总结中台数据中台程序人生经验分享
数据汇集——打破企业数据孤岛要构建企业级数据中台，第一步就是将企业内部各个业务系统的数据实现互通互联，打破数据孤岛，主要通过数据汇聚和交换来实现。企业采集的数据可以是线上采集、线下数据采集、互联网数据采集、内部数据采集等。线上数据采集主要载体分为互联网和移动互联网两种，对应有系统平台、网页、H5、小程序、App等，可以采用前端或后端埋点方式采集数据。线下数据采集主要是通过硬件来采集，例如：WiFi
【Python】tkinter及组件如何使用小九不懂SAP 我的Python日记 python 开发语言 tkinter
一、tkinter的应用场景tkinter是Python的标准GUI（图形用户界面）库，它提供了丰富的控件和工具，使得开发者能够轻松创建跨平台的桌面应用程序。以下是一些tkinter的常见应用场景：桌面应用程序开发：开发者可以使用tkinter来创建各种桌面应用程序，如文本编辑器、计算器、图片查看器、游戏等。这些应用程序可以具有复杂的用户界面，包括窗口、按钮、文本框、下拉菜单、滚动条等。数据可视化
Axure科技感大屏系统设计：智慧农场管理平台招风的黑耳 Axure axure 科技感可视化智慧农业智慧农场
在数字化转型的浪潮中，数据可视化作为连接现实世界与数字世界的桥梁，正以前所未有的速度改变着各行各业的面貌。智慧农业作为现代农业的重要发展方向，其管理平台的数据大屏设计尤为重要，它不仅是农场运营状况的直接展示窗口，更是决策支持与分析的强有力工具。AxureRP，作为一款强大的原型设计工具，凭借其高度的自定义能力和丰富的交互设计功能，成为了设计科技感十足的智慧农场管理平台大屏的理想选择。Axure在科
R 数据可视化 —— 韦恩图名本无名
前言对于数据集之间交叠关系的可视化，通常想到的是绘制韦恩图。韦恩图是一种关系型图表，通过图形之间的重叠来反映数据集之间的相交关系。下面，我们来简单介绍一下如何绘制韦恩图韦恩图绘制韦恩图的包有很多，比如gplots包的venn()函数、limma包的vennDiagram()函数、venneuler包的venneuler()函数。但是这些包绘制出来的图像效果都不是很好，所以我们使用比较成熟的包Ven
【QT教程】QT6硬件图形界面编程 QT硬件编程 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6硬件图形界面编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6硬件图形界面编程概述1.1QT6硬件图形界面编程简介1.1.1QT6硬件
基于VUE2-dataV和echarts实现的可视化大屏，百分比适配PC端风流野趣fly echarts 信息可视化前端 vue.js javascript vscode 大数据
可视化平台中，数据分别通过仪表盘、环状图、柱形图、曲线图、滚动表格等多种形式展示数据变化。可视化平台大致分为左、中、右三部分，左侧由能耗总览、耗能占比、库存预警构成，中间由数据总览、销售计划完成率构成，右侧由销售统计、销售排名（TOP8）、生产统计构成。平台右上角动态显示当前系统日期、星期、时间，格式。在管理端进行添加数据后，数据可视化图表进行相应变化。1.能耗总览仪表盘，统计分析耗电量、耗水量、
Matlab2024a安装教程是阿宇呢信息可视化开发语言
MATLAB是一款商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分，可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.解压安装包：①鼠标右击【MATLABR2024a(64bit)
如何快速的构建企业运维可视化大屏益达_glmsb
基于AIOps理念研发的新一代运维监大屏全盘展示IT运行状态，减轻运维人员的重复性工作量，提高IT系统排错速度，加速运维知识学习积累。图片1.png领先的数据可视化平台，把IT运维化繁为简图片2.jpg图片3.png图片4.png图片5.png图片6.png全面提升IT运维管理水平1.直接导出精美的IT运行可视化报表图片7.png2.资源分析对比图片8.png3.自动生成监控项运行“脑图”图片9.
C# 在WPF中实现图表生成 A_nanda WPF赏析 c#wpf 开发语言
在现代应用程序中，数据可视化是一个重要的功能，它可以帮助用户更直观地理解数据。在C#WPF（WindowsPresentationFoundation）中，有多种方式可以生成图表。以下是五种常见的方法，每种方法都有其独特的优势和局限。1.使用System.Windows.Shapes命名空间代码示例：<RectangleWidth="50"Height="50"Fill="Blue"Canva
数据中台-建设思路：从理论到实践，打造企业数据驱动引擎赛博不良人大数据数据仓库
数据中台-建设思路：从理论到实践，打造企业数据驱动引擎摘要：在数字化时代，数据已成为企业的核心资产。如何有效地管理和利用数据，是企业数字化转型的关键。数据中台作为一种新型的数据管理架构，应运而生。本文将从数据中台的建设方向、目标、策略、步骤、成熟度评估、应用场景等方面，为企业构建数据中台提供全面的指导。关键词：数据中台，数字化转型，数据管理，数据分析，业务中台一、引言随着企业数字化转型的不断深入，
基于Python爬虫四川成都二手房数据可视化系统设计与实现(Django框架) 研究背景与意义、国内外研究现状_django商品房数据分析论文(1) 莫莫Android开发信息可视化 python 爬虫
3.国外研究现状在国外，二手房数据可视化也是一个热门的研究领域。以美国为例，有很多公司和网站提供了专门的二手房数据可视化工具，如Zillow、Redfin等。这些工具通常提供房价趋势图、房价分布图、房源信息等功能，帮助用户更好地了解房市动态。综上所述，虽然国内外在二手房数据可视化方面已经有了一些研究成果，但对于四川成都地区的二手房市场还没有相关的研究和可视化系统。因此，本研究旨在设计并实现一个基于
从零到一建设数据中台 - 架构概览我码玄黄从零到一建设数据中台架构数据中台中台架构
数据中台功能架构概览数据中台相关名词解释1.数据仓库：数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策。因此，其重点在于数据的集合。数据仓库可使用维度建模方法论从业务过程中抽象出通用维度与度量，组成数据模型，为决策分析提供通用的数据分析能力。数据仓库重在建数据，而数据中台则将建、治、管、服放到同样的高度，数据仓库只是数据中台的一个子集。用一个蔬菜储存的例子来简
使用D3.js进行数据可视化环能jvav大师信息可视化前端框架 javascript 开发语言
D3.js介绍D3.js是一个流行的JavaScript数据可视化库，全称为Data-DrivenDocuments，即数据驱动文档。它以数据为核心，通过数据来驱动文档的展示和操作。D3.js提供了丰富的API和工具，使得开发者能够创建出各种交互式和动态的数据可视化效果。官方介绍网站：WhatisD3?|D3byObservableD3.js导入方式介绍在JavaScript中导入D3.js通常使
Python数据分析及可视化教程--商城订单为例-适用电商相关进行数据分析---亲测可用！！！！ Dreams°123 AIGC 机器学习 python 测试工具数据分析大数据
前言：Python是进行数据分析和可视化的强大工具，常用的库包括Pandas、NumPy、Matplotlib和Seaborn。以下是一个基本的教程概述，介绍了如何使用这些库来进行数据分析和可视化：Python数据分析及可视化教程1、环境准备2、数据准备3、开始数据分析3.1、导入库3.2、加载数据3.3、数据预处理3.4、数据分析3.5、数据可视化4、总结解释使用方法：5、错误处理和异常判断说明
【echarts】使用 ECharts 绘制3D饼图帅比九日踩过的坑前端 javascript echarts 大屏端
使用ECharts绘制3D饼图在数据可视化中，饼图是表达数据占比信息的常见方式。ECharts作为一个强大的数据可视化库，除了标准的二维饼图，也支持更加生动的三维饼图绘制。本文将指导你如何使用ECharts来创建一个3D饼图，提升你的数据展示效果。首先了解3D饼图的构成在ECharts中，3D饼图主要是通过surface类型的图表来模拟实现的。一个surface类型的系列（series）可以定义一
【面试系列】Spark 高频面试题解答野老杂谈全网最全IT公司面试宝典面试 spark 职场和发展大数据
欢迎来到我的博客，很高兴能够在这里和您见面！欢迎订阅相关专栏：⭐️全网最全IT互联网公司面试宝典：收集整理全网各大IT互联网公司技术、项目、HR面试真题.⭐️AIGC时代的创新与未来：详细讲解AIGC的概念、核心技术、应用领域等内容。⭐️大数据平台建设指南：全面讲解从数据采集到数据可视化的整个过程，掌握构建现代化数据平台的核心技术和方法。⭐️《遇见Python：初识、了解与热恋》：涵盖了Pytho
开源的BI大屏设计工具易道合之逍遥峰开源工具信息可视化
开源的BI大屏设计工具提供了丰富的功能和灵活性，帮助用户快速构建和展示数据可视化大屏。以下是一些知名的开源BI大屏设计工具及其特点：ApacheSuperset定位：现代化的、企业级的数据探索与可视化平台。功能：提供丰富的数据源连接选项（如SQLAlchemy）和强大的可视化功能。用户可以自定义仪表板（Dashboards），快速创建数据大屏。特点：支持多种数据源，界面友好，适合有一定技术背景的用
10个Python办公自动化案例 Want595 python 开发语言
文章目录系列目录10个Python办公自动化案例1.Excel数据读取与写入2.自动生成PDF文件3.自动发送邮件4.自动化文件重命名5.批量下载网页内容6.自动化数据可视化7.自动化文档批量处理8.批量文件压缩9.日程提醒自动化10.数据定时备份系列目录序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同
ES(Elasticsearch)常用的函数遨游在知识的海洋里无法自拔 java
Elasticsearch（简称ES）是一个开源的搜索引擎，广泛用于全文搜索、分析和数据可视化。以下是一些常用的Elasticsearch函数和操作：索引操作创建索引PUT/index_name删除索引DELETE/index_name查看索引GET/index_name文档操作插入文档POST/index_name/_doc/{"field":"value"}获取文档GET/index_name
Python自动化办公2.0 即将发布百里图书自动化人工智能 python
第一节课：数据整理与清洗第二节课：数据筛选、过滤与排序第三节课：高级数据处理技巧第四节课：数据可视化与实践案例第五节课：统计分析与报表第六节：常见的Excel报表与下方的课程形成知识体系：Python自动化办公(面向2020,Python3.7,不断更新ing)_在线视频教程-CSDN程序员研修院https://edu.csdn.net/course/detail/28031Python机器学习教
【QT教程】QT6对话框编程 QT性能优化QT原理源码QT界面美化 qt qt6.3 qt5 c++QT教程
QT6对话框编程使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与源码分析视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程QT统计图和QT数据可视化视频免费看免费QT视频课程QT性能优化视频免费看免费QT视频课程QT界面美化视频免费看1QT6对话框编程基础1.1QT6对话框简介1.1.1QT6对话框简介QT6对话框简介
Python数据可视化：25年GDP之变_基于d3 2401_84558508 程序员 python 信息可视化开发语言
同时还需要注意一下编码问题，这里的CSV文件需要用gbk编码。下面是从统计局下载下来的CSV数据。我偷了个懒，直接就先在表格里删除了前三行，如下。接下来便是用Python对数据进行规整，代码如下。 importpandasaspd#读取数据df=pd.read_csv(gdp.csv,encoding=utf-8)(names,values,dates)=([],[],[])#记得去除地区这个列名
【题目】数据分析与数据思维选择题天启和风大数据题目数据分析数据挖掘大数据
1.以下选项中不属于数据预处理的是（）A.数据清理B.数据可视化C.数据变换D.数据集成解析：选B。数据清洗指对数据集中的不完整、不合理或不准确的数据进行修补、去重、纠错、修补或删除数据变换将原始数据变换成符合目标算法要求的数据数据集成指对来自不同的数据源的数据进行集成处理2.用来描述访问了某个项目一次就退出的次数和这个项目总访问的次数的比率的基础指标是_？A.跳失率B.费效比C.渠道转换率D.访
Python和数据分析：Seaborn新手指南 Python_魔力猿 python 数据分析信息可视化
Seaborn是建立在Matplotlib之上的统计数据可视化库，它提供了高级接口和漂亮的默认样式，使得数据可视化变得更加简单和美观。1.导论Seaborn在数据可视化中的角色和优势体现在以下方面：简化API：Seaborn的API设计更加简洁，容易使用，尤其适合初学者。它能够通过几行代码生成漂亮而具有信息含量的图表。美观的默认样式：Seaborn具有吸引人的默认颜色和样式，无需额外的配置即可生成
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &