u010859707

Apache Zeppelin 中 Spark 解释器

概述

Apache Spark是一种快速和通用的集群计算系统。它提供Java，Scala，Python和R中的高级API，以及支持一般执行图的优化引擎。Zeppelin支持Apache Spark，Spark解释器组由5个解释器组成。

名称	类	描述
％spark	SparkInterpreter	创建一个SparkContext并提供Scala环境
％spark.pyspark	PySparkInterpreter	提供Python环境
％spark.r	SparkRInterpreter	提供具有SparkR支持的R环境
％spark.sql	SparkSQLInterpreter	提供SQL环境
％spark.dep	DepInterpreter	依赖加载器

配置

Spark解释器可以配置为由Zeppelin提供的属性。您还可以设置表中未列出的其他Spark属性。有关其他属性的列表，请参阅Spark可用属性。

属性	默认	描述
ARGS		Spark命令行参考
master	local[*]	Spark master uri. 例如：spark://masterhost:7077
spark.app.name	Zeppelin	Spark应用的名称。
spark.cores.max		要使用的核心总数。空值使用所有可用的核心。
spark.executor.memory	1g	每个worker实例的执行程序内存。 ex）512m，32g
zeppelin.dep.additionalRemoteRepository	spark-packages, http://dl.bintray.com/spark-packages/maven, false;	`id,remote-repository-URL,is-snapshot;` 每个远程存储库的列表。
zeppelin.dep.localrepo	local-repo	依赖加载器的本地存储库
zeppelin.pyspark.python	python	Python命令来运行pyspark
zeppelin.spark.concurrentSQL	python	如果设置为true，则同时执行多个SQL。
zeppelin.spark.maxResult	1000	要显示的Spark SQL结果的最大数量。
zeppelin.spark.printREPLOutput	true	打印REPL输出
zeppelin.spark.useHiveContext	true	如果它是真的，使用HiveContext而不是SQLContext。
zeppelin.spark.importImplicit	true	导入含义，UDF集合和sql如果设置为true。

没有任何配置，Spark解释器在本地模式下开箱即用。但是，如果要连接到Spark群集，则需要按照以下两个简单步骤进行操作。

1.导出SPARK_HOME

在conf/zeppelin-env.sh，导出SPARK_HOME环境变量与您的Spark安装路径。

例如，

 
              export SPARK_HOME 
              = 
              / 
              usr 
              / 
              lib 
              / 
              spark

您可以选择设置更多的环境变量

 
              # set hadoop conf dir 
             
              export HADOOP_CONF_DIR 
              = 
              / 
              usr 
              / 
              lib 
              / 
              hadoop 
             
              # set options to pass spark-submit command 
             
              export SPARK_SUBMIT_OPTIONS 
              = 
              "--packages com.databricks:spark-csv_2.10:1.2.0" 
             
              # extra classpath. e.g. set classpath for hive-site.xml 
             
              export ZEPPELIN_INTP_CLASSPATH_OVERRIDES 
              = 
              / 
              etc 
              / 
              hive 
              / 
              conf

对于Windows，确保你winutils.exe在%HADOOP_HOME%\bin。有关详细信息，请参阅在Windows上运行Hadoop的问题。

2.在“解释器”菜单中设置主机

启动Zeppelin后，转到解释器菜单并在Spark解释器设置中编辑主属性。该值可能因您的Spark群集部署类型而异。

例如，

local[*] 本地模式
spark://master:7077 standalone 集群模式
yarn-client Yarn 客户端模式
mesos://host:5050 Mesos 集群模式

而已。Zeppelin将使用任何版本的Spark和任何部署类型，而不用这种方式重建Zeppelin。有关Spark＆Zeppelin版本兼容性的更多信息，请参阅Zeppelin下载页面中的“可用的口译员”部分。

请注意，不导出SPARK_HOME，它以本地模式运行，包含版本的Spark。附带的版本可能因构建配置文件而异。

SparkContext，SQLContext，SparkSession，ZeppelinContext

SparkContext，SQLContext和ZeppelinContext会自动创建并显示为变量名sc，sqlContext并z分别在Scala，Python和R环境中公开。从0.6.1起，spark当您使用Spark 2.x时，SparkSession可以作为变量使用。

请注意，Scala / Python / R环境共享相同的SparkContext，SQLContext和ZeppelinContext实例。

依赖管理

在Spark解释器中加载外部库有两种方法。首先是使用解释器设置菜单，其次是加载Spark属性。

1.通过解释器设置设置依赖关系

有关详细信息，请参阅解释器依赖管理。

2.加载Spark属性

一旦SPARK_HOME被设置conf/zeppelin-env.sh，Zeppelin使用spark-submit作为Spark解释赛跑者。spark-submit支持两种方式来加载配置。第一个是命令行选项，如--master和飞艇可以通过这些选项spark-submit通过导出SPARK_SUBMIT_OPTIONS在conf/zeppelin-env.sh。二是从中读取配置选项SPARK_HOME/conf/spark-defaults.conf。用户可以设置分发库的Spark属性有：

火花defaults.conf	SPARK_SUBMIT_OPTIONS	描述
spark.jars	--jars	包含在驱动程序和执行器类路径上的本地jar的逗号分隔列表。
spark.jars.packages	--packages	逗号分隔列表，用于包含在驱动程序和执行器类路径上的jar的maven坐标。将搜索当地的maven repo，然后搜索maven中心和由–repositories提供的任何其他远程存储库。坐标的格式应该是`groupId:artifactId:version`。
spark.files	--files	要放置在每个执行器的工作目录中的逗号分隔的文件列表。

火花defaults.conf

SPARK_SUBMIT_OPTIONS

描述

spark.jars --jars 包含在驱动程序和执行器类路径上的本地jar的逗号分隔列表。

spark.jars.packages

--packages

逗号分隔列表，用于包含在驱动程序和执行器类路径上的jar的maven坐标。

将搜索当地的maven repo，然后搜索maven中心和由–repositories提供的任何其他远程存储库。

坐标的格式应该是groupId:artifactId:version。

spark.files --files 要放置在每个执行器的工作目录中的逗号分隔的文件列表。

以下是几个例子：

SPARK_SUBMIT_OPTIONS 在 conf/zeppelin-env.sh

 
                export SPARK_SUBMIT_OPTIONS 
                = 
                "--packages com.databricks:spark-csv_2.10:1.2.0 --jars /path/mylib1.jar,/path/mylib2.jar --files /path/mylib1.py,/path/mylib2.zip,/path/mylib3.egg"

SPARK_HOME/conf/spark-defaults.conf

 
           
            
              
                spark.jars         
                / 
                path 
                / 
                mylib1.jar, 
                / 
                path 
                / 
                mylib2.jar 
               
 
                spark.jars.packages   com.databricks:spark 
                - 
                csv_2. 
                10 
                : 
                1.2 
                . 
                0 
               
 
                spark.files        
                / 
                path 
                / 
                mylib1.py, 
                / 
                path 
                / 
                mylib2.egg, 
                / 
                path 
                / 
                mylib3. 
                zip   
               
 
            
 
           
         

3.通过％spark.dep解释器加载动态依赖关系

注：%spark.dep解释负载库%spark和%spark.pyspark而不是 %spark.sql翻译。所以我们建议你改用第一个选项。

当你的代码需要外部库，而不是下载/复制/重新启动Zeppelin，你可以使用%spark.dep解释器轻松地完成以下工作。

从maven库递归加载库
从本地文件系统加载库
添加额外的maven仓库
自动将库添加到SparkCluster（可以关闭）

解释器利用Scala环境。所以你可以在这里编写任何Scala代码。需要注意的是%spark.dep解释前应使用%spark，%spark.pyspark，%spark.sql。

这是用法

 
              % 
              spark.dep 
             
              z.reset()  
              / 
              /  
              clean up previously added artifact  
              and  
              repository 
             
              / 
              /  
              add maven repository 
             
              z.addRepo( 
              "RepoName" 
              ).url( 
              "RepoURL" 
              ) 
             
              / 
              /  
              add maven snapshot repository 
             
              z.addRepo( 
              "RepoName" 
              ).url( 
              "RepoURL" 
              ).snapshot() 
             
              / 
              /  
              add credentials  
              for  
              private maven repository 
             
              z.addRepo( 
              "RepoName" 
              ).url( 
              "RepoURL" 
              ).username( 
              "username" 
              ).password( 
              "password" 
              ) 
             
              / 
              /  
              add artifact  
              from  
              filesystem 
             
              z.load( 
              "/path/to.jar" 
              ) 
             
              / 
              /  
              add artifact  
              from  
              maven repository, with no dependency 
             
              z.load( 
              "groupId:artifactId:version" 
              ).excludeAll() 
             
              / 
              /  
              add artifact recursively 
             
              z.load( 
              "groupId:artifactId:version" 
              ) 
             
              / 
              /  
              add artifact recursively  
              except  
              comma separated GroupID:ArtifactId  
              list 
             
              z.load( 
              "groupId:artifactId:version" 
              ).exclude( 
              "groupId:artifactId,groupId:artifactId, ..." 
              ) 
             
              / 
              /  
              exclude with pattern 
             
              z.load( 
              "groupId:artifactId:version" 
              ).exclude( 
              * 
              ) 
             
              z.load( 
              "groupId:artifactId:version" 
              ).exclude( 
              "groupId:artifactId:*" 
              ) 
             
              z.load( 
              "groupId:artifactId:version" 
              ).exclude( 
              "groupId:*" 
              ) 
             
              / 
              /  
              local() skips adding artifact to spark clusters (skipping sc.addJar()) 
             
              z.load( 
              "groupId:artifactId:version" 
              ).local()

ZeppelinContext

Zeppelin 在Scala / Python环境中自动注入ZeppelinContext变量z。ZeppelinContext提供了一些额外的功能和实用程序。

对象交换

ZeppelinContext扩展地图，它在Scala和Python环境之间共享。所以你可以把Scala的一些对象从Python中读出来，反之亦然。

 
         Scala 
        
                 // Put object from scala 
                
                 % 
                 spark 
                
                 val  
                 myObject  
                 =  
                 ... 
                
                 z.put( 
                 "objName" 
                 , myObject) 
                
                 // Exchanging data frames 
                
                 myScalaDataFrame  
                 =  
                 ... 
                
                 z.put( 
                 "myScalaDataFrame" 
                 , myScalaDataFrame) 
                
                 val  
                 myPythonDataFrame  
                 =  
                 z.get( 
                 "myPythonDataFrame" 
                 ).asInstanceOf[DataFrame]  
                
         Python 
          展开原码 
        
 表格创作

ZeppelinContext提供了创建表单的功能。在Scala和Python环境中，您可以以编程方式创建表单。

Scala

 
              % 
              spark 
             
              /* Create text input form */ 
             
              z.input( 
              "formName" 
              ) 
             
              /* Create text input form with default value */ 
             
              z.input( 
              "formName" 
              ,  
              "defaultValue" 
              ) 
             
              /* Create select form */ 
             
              z.select( 
              "formName" 
              , Seq(( 
              "option1" 
              ,  
              "option1DisplayName" 
              ), 
             
              ( 
              "option2" 
              ,  
              "option2DisplayName" 
              ))) 
             
              /* Create select form with default value*/ 
             
              z.select( 
              "formName" 
              ,  
              "option1" 
              , Seq(( 
              "option1" 
              ,  
              "option1DisplayName" 
              ), 
             
              ( 
              "option2" 
              ,  
              "option2DisplayName" 
              )))

 
                 % 
                 spark.pyspark 
                
                 # Create text input form 
                
                 z. 
                 input 
                 ( 
                 "formName" 
                 ) 
                
                 # Create text input form with default value 
                
                 z. 
                 input 
                 ( 
                 "formName" 
                 ,  
                 "defaultValue" 
                 ) 
                
                 # Create select form 
                
                 z.select( 
                 "formName" 
                 , [( 
                 "option1" 
                 ,  
                 "option1DisplayName" 
                 ), 
                
                 ( 
                 "option2" 
                 ,  
                 "option2DisplayName" 
                 )]) 
                
                 # Create select form with default value 
                
                 z.select( 
                 "formName" 
                 , [( 
                 "option1" 
                 ,  
                 "option1DisplayName" 
                 ), 
                
                 ( 
                 "option2" 
                 ,  
                 "option2DisplayName" 
                 )],  
                 "option1" 
                 )

在sql环境中，可以在简单的模板中创建表单。

 
              % 
              spark.sql 
             
              select  
              *  
              from  
              ${table 
              = 
              defaultTableName} where text like  
              '%${search}%'

要了解有关动态表单的更多信息，请检查Zeppelin 动态表单。

Matplotlib集成（pyspark）

这两个python和pyspark解释器都内置了对内联可视化的支持matplotlib，这是一个流行的python绘图库。更多细节可以在python解释器文档中找到，因为matplotlib的支持是相同的。通过利用齐柏林内置的角度显示系统，可以通过pyspark进行更先进的交互式绘图，如下所示：

解释器设置选项

您可以选择其中之一shared，scoped以及isolated配置Spark解释器的选项。Spark解释器为每个笔记本创建分离的Scala编译器，但在scoped模式（实验）中共享一个SparkContext。它在每个笔记本isolated模式下创建分离的SparkContext 。

用Kerberos设置Zeppelin

使用Zeppelin，Kerberos Key Distribution Center（KDC）和Spark on YARN进行逻辑设置：

配置设置

在安装Zeppelin的服务器上，安装Kerberos客户端模块和配置，krb5.conf。这是为了使服务器与KDC进行通信。
设置SPARK_HOME在[ZEPPELIN_HOME]/conf/zeppelin-env.sh使用火花提交（此外，您可能需要设置export HADOOP_CONF_DIR=/etc/hadoop/conf）

将以下两个属性添加到Spark configuration（[SPARK_HOME]/conf/spark-defaults.conf）中：

 
                spark.yarn.principal 
               
                spark.yarn.keytab

注意：如果您没有访问以上spark-defaults.conf文件的权限，可以选择地，您可以通过Zeppelin UI中的“解释器”选项卡将上述行添加到“Spark Interpreter”设置。

而已。玩Zeppelin！

你可能感兴趣的:(spark,中文文档,解释器,zeppelin,0.7.2)

如果MLlib 中没有所需要的模型，如何使用 Spark 进行分布式训练？是纯一呀 WSL Docker AI spark 分布式 mllib
如果MLlib中没有你所需要的模型，并且不打算结合更强大的框架（如TensorFlowOnSpark或Horovod），仍然可以使用Spark进行分布式训练，但需要手动处理训练任务的分配、数据准备、模型训练、结果合并和模型更新等过程。模型训练阶段将模型的训练任务分配到Spark集群的各个节点。数据并行：每个节点会处理数据的不同部分，并计算该部分的梯度或模型参数。自定义算法：如果使用的是自定义算法（
Python中的GIL锁详解 _Itachi__ python python 开发语言
Python中的GIL锁详解大家好，今天我们来聊聊Python中一个备受争议的话题——GIL锁（GlobalInterpreterLock，全局解释器锁）。GIL锁是Python解释器中的一个重要机制，但它对多线程程序的性能影响很大，尤其是在计算密集型任务（如图像处理）中。本文将从GIL锁的原理、影响以及如何在图像处理中规避GIL锁的角度，带大家彻底搞懂这个问题！1.什么是GIL锁？GIL锁是Py
使用 Docker 部署 Apache Spark 集群教程努力的小T docker docker spark linux 运维服务器云计算容器
简介ApacheSpark是一个强大的统一分析引擎，用于大规模数据处理。本文将详细介绍如何使用Docker和DockerCompose快速部署一个包含一个Master节点和两个Worker节点的Spark集群。这种方法不仅简化了集群的搭建过程，还提供了资源隔离、易于扩展等优势。前置条件在开始之前，请确保你的环境中已经准备好了以下组件：安装并运行DockerEngine。安装DockerCompos
Java 设计模式之解释器模式 xiangxiongfly915 #Java 设计模式 java 设计模式解释器模式
文章目录Java设计模式之解释器模式概述UML代码实现Java设计模式之解释器模式概述解释器模式(interpreter)：给定一个语言，定义它的文法的一种表示，并定义一个解释器，这个解释器使用该表示来解释语言中的句子。如果一种特定类型的问题发生的频率足够高，那么可能就值得将该问题的各个实例表述为一个简单语言中的句子。这样就可以构建一个解释器，该解释器通过解释这些句子来解决该问题。UMLAbstr
【TVM教程】为 x86 CPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：YaoWang,EddieYan本文介绍如何为x86CPU调优卷积神经网络。注意，本教程不会在Windows或最新版本的macOS上运行。如需运行，请将本教程的主体放在if__name__=="__main__":代码块中。impor
设计模式--访问者模式【行为型模式】码农爱java 设计模式设计模式访问者模式 23种设计模式面试原理 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--代理模式【结构型模式】码农爱java 设计模式设计模式代理模式 23种设计模式面试原理动态代理静态代理
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--建造者模式【创建型模式】码农爱java 设计模式设计模式建造者模式 23中设计模式原理面试 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--中介者模式【行为型模式】码农爱java 设计模式设计模式中介者模式 23种设计模式面试原理 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
Perl中的特殊变量踩着七色的晕菜 Perl Perl 特殊变量
Perl中有很多特殊的内置变量，有时候能够简单地使用这些变量，会出现意想不到的效果！但尽量不要更改Perl的内置变量，除非它被本地化在一个代码段中（local{...}）。常见的内置变量有$_在很多地方用作默认参数，@_和@ARGV是函数传入的参数的集合，@INC包含了perl解释器中指定的标准路径名，即use和require给定的文件目录。uselib'/my/dir';可在程序中指定BEGIN
Perl 特殊变量 froginwe11 开发语言
Perl特殊变量Perl是一种强大的脚本语言，它提供了丰富的内置变量和特殊变量，这些特殊变量在编程中扮演着重要的角色。本文将详细介绍Perl中的特殊变量，帮助读者更好地理解和使用它们。一、什么是特殊变量特殊变量，也称为内置变量，是Perl中的特殊变量。它们在Perl运行时由解释器自动创建，并可以直接使用。这些变量在Perl编程中具有特定的含义和用途，能够提供丰富的功能。二、常见特殊变量及其作用1.
笔记：DataSphere Studio安装部署流程右边com Java 大数据
一、标准版部署标准版：有一定的安装难度，体现在Hadoop、Hive和Spark版本不同时，可能需要重新编译，可能会出现包冲突问题。适合于试用和生产使用，2~3小时即可部署起来。支持的功能有：数据开发IDE-Scriptis工作流实时执行信号功能和邮件功能数据可视化-Visualis数据质量-Qualitis(单机版)工作流定时调度-Azkaban(单机版)Linkis管理台二、基础环境准备2.1
HIVE- SPARK 流川枫_ 20210706 hdfs hive spark
日常记录备忘Hive修改字段类型之后（varchar->string）Hive可以查到数据，Presto查询报错;分区字段数据类型和表结构字段类型不一样；spark-sql分区表和非分区表兼容问题，不能关联可以建临时表把分区数据导入，用完数据将表删除；count有数据，select没数据可能是压缩格式所导致；优化合全量任务，之前是row_number()函数先插入当天增量，取出最新的数据插入全量表
spark为什么比mapreduce快？程序员
作者：京东零售吴化斌spark为什么比mapreduce快？首先澄清几个误区：1：两者都是基于内存计算的，任何计算框架都肯定是基于内存的，所以网上说的spark是基于内存计算所以快，显然是错误的2;DAG计算模型减少的是磁盘I/O次数（相比于mapreduce计算模型而言），而不是shuffle次数，因为shuffle是根据数据重组的次数而定，所以shuffle次数不能减少所以总结spark比m
spark为什么比mapreduce快？程序员
作者：京东零售吴化斌spark为什么比mapreduce快？首先澄清几个误区：1：两者都是基于内存计算的，任何计算框架都肯定是基于内存的，所以网上说的spark是基于内存计算所以快，显然是错误的2;DAG计算模型减少的是磁盘I/O次数（相比于mapreduce计算模型而言），而不是shuffle次数，因为shuffle是根据数据重组的次数而定，所以shuffle次数不能减少所以总结spark比m
Spark中Dataset方法详解小巫程序Demo日记 Spark+Hadoop学习 spark ajax java 分布式
一、数据清洗核心方法1.处理缺失值方法说明示例代码na().drop()删除包含空值的行Datasetcleaned=dataset.na().drop();na().fill(value)用指定值填充所有空值Datasetfilled=dataset.na().fill(0);na().fill(Map)按列填充不同值Mapfills=newHashMapunique=dataset.dropD
探索大数据处理：利用 Apache Spark 解锁数据价值 Echo_Wish 实战高阶大数据 apache spark 大数据
探索大数据处理：利用ApacheSpark解锁数据价值大家好，我是你们熟悉的大数据领域自媒体创作者Echo_Wish。今天，我们来聊聊如何利用ApacheSpark进行大规模数据处理。ApacheSpark作为一个快速、通用的集群计算框架，以其出色的性能和丰富的API，成为大数据处理的利器。那么，ApacheSpark究竟如何帮助我们高效处理海量数据？接下来，让我们一起深入探讨。一、ApacheS
最新Apache Hudi 1.0.1源码编译详细教程以及常见问题处理 Toroidals 大数据组件安装部署教程 hudi1.0.1 源码编译教程最新
1.最新ApacheHudi1.0.1源码编译2.Flink、Spark、Hive集成Hudi1.0.13.flinkstreaming写入hudi目录1.版本介绍2.安装maven2.1.下载maven2.2.设置环境变量2.3.添加Maven镜像3.编译hudi3.1.下载hudi源码3.2.修改hudi源码3.3.修改hudi-1.0.1/pom.xml，注释或去掉410行内容3.4.安装c
设计模式--迭代器模式【行为型模式】码农爱java 设计模式设计模式迭代器模式 23种设计模式面试 Java 原理
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--观察者模式【行为型模式】码农爱java 设计模式设计模式观察者模式 23种设计模式面试 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--策略模式【行为型模式】码农爱java 设计模式设计模式策略模式 23种设计模式面试原理 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--桥接模式【结构型模式】码农爱java 设计模式桥接模式 23种设计模式面试原理 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--组合模式【结构型模式】码农爱java 设计模式设计模式组合模式 23种设计模式面试原理 Java
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--原型模式【创建型模式】码农爱java 设计模式设计模式原型模式 23种设计模式 Java 原理面试
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
设计模式--抽象工厂模式【创建型模式】码农爱java 设计模式设计模式抽象工厂模式原理面试 23种设计模式 Java Java 设计模式
设计模式的分类我们都知道有23种设计模式，这23种设计模式可分为如下三类：创建型模式（5种）：单例模式、工厂方法模式、抽象工厂模式、建造者模式、原型模式。结构型模式（7种）：适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式（11种）：策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式。设
Lua脚本核心语法介绍阿湯哥 lua junit 开发语言
Lua是一种轻量级、高效的脚本语言，其解释器核心是用C语言编写的，因此具有出色的可移植性和嵌入性（可轻松集成到其他程序中）。以下是其核心语法特性：一、基础语法特点简洁的语法结构语句以换行或分号结束，无需强制分号。注释：--单行注释或--[[多行注释]]。动态类型系统变量无需声明类型，类型与值绑定：locala=10--整数a="hello"--切换为字符串a=3.14--切换为浮点数变量作用域默认
使用Docker安装Spark集群(带有HDFS) Sicilly_琬姗云计算大数据 docker spark hdfs
本实验在CentOS7中完成第一部分：安装Docker这一部分是安装Docker，如果机器中已经安装过Docker，可以直接跳过[root@VM-48-22-centos~]#systemctlstopfirewalld[root@VM-48-22-centos~]#systemctldisablefirewalld[root@VM-48-22-centos~]#systemctlstatusfi
使用Docker部署Spark集群小孩真笨工程开发技术 Cloud Data Docker Spark
使用Docker部署Spark集群克隆包含启动脚本的git仓库启动Spark0.8.0集群并切换至SparkShell环境不带参数运行部署脚本*运行一些小的例子终止集群克隆包含启动脚本的git仓库*[email protected]:amplab/docker-scripts.git当然，在这之前你必须已经配置了Github的SSH密钥认证，如果没有配置，会提示Per
从0开始使用Docker搭建Spark集群吃鱼的羊 SPARK Hadoop
https://www.jianshu.com/p/ee210190224f?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation最近在学习大数据技术，朋友叫我直接学习Spark，英雄不问出处，菜鸟不问对错，于是我就开始了Spark学习。为什么要在Docker上搭建Spark集群
Spring Boot 开发入门圣心 spring boot
文章来源：开发您的第一个SpringBoot应用程序(DevelopingYourFirstSpringBootApplication)_SpringBoot3.4.0中文文档(官方文档中文翻译)|Spring教程——CADN开发者文档中心本节介绍如何开发一个小型的“HelloWorld！”Web应用程序，其中重点介绍了SpringBoot的一些关键功能。您可以选择Maven或Gradle作为构建
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源