魏晓蕾

【Spark】Spark SQL原理、编译、配置及运行方式详述

1、Spark SQL的发展历史

（1）在Hadoop中运行SQL的工具
在Hadoop中运行SQL的工具有Hive、Impala、Apache Drill、Presto、Spark SQL等。
（2）Shark的发展历史
在三四年前，Hive可以说是SQL on Hadoop的唯一选择，负责将SQL编译成可扩展的MapReduce作业。鉴于Hive的性能以及与Spark的兼容，Shark项目由此而生。
Shark即Hive on Spark，本质上是通过Hive的HQL解析，把HQL翻译成Spark上的RDD操作，然后通过Hive的metadata获取数据库里的表信息，实际HDFS上的数据和文件，会由Shark获取并放到Spark上运算。
Shark的最大特性就是快和与Hive的完全兼容，且可以在shell模式下使用rdd2sql()这样的API，把HQL得到的结果集，继续在scala环境下运算，支持自己编写简单的机器学习或简单分析处理函数，对HQL结果进一步分析计算。
Shark项目源代码：https://github.com/amplab/shark。
在2014年7月1日的Spark Summit上，Databricks宣布终止对Shark的开发，将重点放到Spark SQL上。
Databricks表示，Spark SQL将涵盖Shark的所有特性，用户可以从Shark 0.9进行无缝的升级。
Databricks推广的Shark相关项目一共有两个，分别是Spark SQL和新的Hive on Spark（HIVE-7292）。
Databricks表示，Shark更多是对Hive的改造，替换了Hive的物理执行引擎，因此会有一个很快的速度。然而，不容忽视的是，Shark继承了大量的Hive代码，因此给优化和维护带来了大量的麻烦。
（3）Spark SQL发展的时间线

（4）Spark SQL的特点
1）Spark SQL运行SQL或HiveQL查询使用UDF，UDAF和SerDes（序列化反序列化）函数。
2）通过JDBC或ODBC将Tableau等连接到Spark SQL。
3）使用Python、Scala、Java和R语言开发。

2、SparkSQL编译

编译Spark时指定支持Hive：（Apache Hadoop 2.4.x支持Hive 1.3）

mvn -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4.0 -Phive -Phive-thriftserver -DskipTests clean package

3、SparkSQL和Hive集成（SparkSQL需要的是Hive表的元数据）

（1）将hive的hive-site.xml文件复制或者软链接到spark的conf文件夹中。

~]$ cd /opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/conf
conf]$ ln -s /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/conf/hive-site.xml
conf]$ ll
lrwxrwxrwx 1 beifeng beifeng   54 Jul 28 18:31 hive-site.xml -> /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/conf/hive-site.xml

（2）/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/conf/hive-site.xml文件内容如下。





      
             javax.jdo.option.ConnectionURL
             jdbc:mysql://bigdata-senior.ibeifeng.com:3306/metadata?createDatabaseIfNotExist=true
      
      
             javax.jdo.option.ConnectionDriverName
             com.mysql.jdbc.Driver
      
      
             javax.jdo.option.ConnectionUserName
             root
      
      
             javax.jdo.option.ConnectionPassword
             123456
      
      
             hive.metastore.warehouse.dir
             /user/hive/warehouse
      
      
             hive.exec.mode.local.auto
             true
      
      
             hive.exec.mode.local.auto.input.files.max
             100
      
      
             hive.exec.mode.local.auto.inputbytes.max
             13421772800000
      
      
             hive.cli.print.header
             true
      
      
             hive.cli.print.current.db
             true
      
      
      
             hive.server2.thrift.port
             10000
      
      
             hive.server2.thrift.bind.host
             bigdata-senior.ibeifeng.com
      
      
      
             hive.metastore.uris
             thrift://bigdata-senior.ibeifeng.com:9083

（3）根据hive的配置文件的内容选择不同的操作方式，这里指根据hive.metastore.uris参数的配置值来选择不同的操作方式，值默认为空。
1）如果没有给定参数（默认情况）：
将hive元数据数据库的驱动包添加到spark的classpath环境变量中即可完成spark和hive的集成。
2）给定具体的metastore服务所在的节点信息（值非空）
启动hive的metastore服务：

cd /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6
hive-0.13.1-cdh5.3.6]$ bin/hive --service metastore &
[1] 5146
[beifeng@bigdata-senior hive-0.13.1-cdh5.3.6]$ Starting Hive Metastore Server
[beifeng@bigdata-senior hive-0.13.1-cdh5.3.6]$ jps -ml
5146 org.apache.hadoop.util.RunJar /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/hive-service-0.13.1-cdh5.3.6.jar org.apache.hadoop.hive.metastore.HiveMetaStore
5225 sun.tools.jps.Jps -ml
[beifeng@bigdata-senior hive-0.13.1-cdh5.3.6]$ jps
5146 RunJar
5235 Jps

（4）SparkSQL和Hive集成测试
1）启动NameNode，DataNode
2）启动SparkSQL

cd /opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-sql

spark-sql (default)> select * from common.emp;
spark-sql (default)> select * from common.emp a join common.dept b on a.deptno = b.deptno; 
spark-sql (default)> explain select * from common.emp a join common.dept b on a.deptno = b.deptno;

3）启动Spark Shell

spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-shell
scala> sqlContext.sql("select * from common.emp a join common.dept b on a.deptno = b.deptno").show()

4）查看SparkSQL和Spark Shell界面

SparkSQL: http://bigdata-senior.ibeifeng.com:4040/jobs/
Spark Shell: http://bigdata-senior.ibeifeng.com:4041/jobs/

（5）Spark应用依赖第三方jar文件解决方案
1）使用参数–jars添加本地的第三方jar文件，可以给定多个，使用逗号分隔。注意：要求jar文件在driver和client的机器上存在，适合依赖比较少的情况，即jar文件在本地存在。

spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-shell --jars /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/mysql-connector-java-5.1.27-bin.jar,/opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/derby-10.10.1.1.jar

在Spark Shell界面：http://bigdata-senior.ibeifeng.com:4041/jobs/ 查看添加的jar文件。

2）使用参数–packages添加maven中央库中的第三方jar文件，可以给定多个，使用逗号分隔。注意：下载的jar文件会保存到当前用户的根目录下的.ivy2文件夹的jars文件夹中，eg:/home/beifeng/.ivy2/jars；适合依赖比较少的情况。jar文件从maven源下载。

spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-shell --packages mysql:mysql-connector-java:5.1.27

3）使用SPARK_CLASSPATH环境变量给定jar文件的位置信息。注意：要求所有可以执行的节点都需要进行该配置，如果是spark on yarn，要求所有机器上有对应文件夹的jar文件。

spark-1.6.1-bin-2.5.0-cdh5.3.6]$ mkdir -p external_jars
即该位置：/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/external_jars

SPARK_CLASSPATH=/opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/external_jars/*
external_jars]$ cp /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/mysql-connector-java-5.1.27-bin.jar .
external_jars]$ cp /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/derby-10.10.1.1.jar .

启动Spark Shell

spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-shell
http://bigdata-senior.ibeifeng.com:4042/environment/

jar文件明确给定路径信息：

4）将依赖的jar文件打包到spark应用的jar文件中。注意：只适合jar文件比较小，而且应用依赖的jar文件不多的情况。
5）Spark on Yarn Cluster 第三方jar文件驱动解决方案（推荐）
将第三方的jar文件copy到${HADOOP_HOME}/share/hadoop/common/lib文件夹中或者${HADOOP_HOME}/share/hadoop/yarn/lib文件夹中。

4、SparkSQL源码

在SparkSQL源码中，SQLContext是SparkSQL的入口，依赖于SparkContext。
HiveContext：当SparkSQL和Hive集成的时候（也就是SparkSQL可以访问Hive的元数据），必须使用HiveContext作为SparkSQL的入口。
DataFrame：SparkSQL中的核心抽象，类似于RDD，都是分布式数据集。

5、SparkSQL的ThriftServer服务

（1）SparkSQL的ThriftServer服务简述
SparkSQL的ThriftServer服务其实就是Hive的HiveServer2服务，只是将底层的执行改成Spark，同时在Spark上启动。
SparkSQL的ThriftServer服务官方帮助文档：
https://cwiki.apache.org/confluence/display/Hive/Setting+Up+HiveServer2
http://spark.apache.org/docs/1.6.1/sql-programming-guide.html#distributed-sql-engine
（2）配置SparkSQL的ThriftServer服务
1）在hive-site.xml中修改Hiveserver2的配置信息，如端口号和监听的IP地址：

hive.server2.thrift.port=10000
hive.server2.thrift.host=0.0.0.0

2）启动ThriftServer服务
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ sbin/start-thriftserver.sh
查看启动进程：

[beifeng@bigdata-senior spark-1.6.1-bin-2.5.0-cdh5.3.6]$ jps -ml
5146 org.apache.hadoop.util.RunJar /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/hive-service-0.13.1-cdh5.3.6.jar org.apache.hadoop.hive.metastore.HiveMetaStore
8701 sun.tools.jps.Jps -ml
5616 org.apache.spark.deploy.SparkSubmit --class org.apache.spark.sql.hive.thriftserver.SparkSQLCLIDriver spark-internal
5544 org.apache.hadoop.hdfs.server.datanode.DataNode
6668 org.apache.spark.deploy.SparkSubmit --class org.apache.spark.repl.Main --name Spark shell --jars /opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/mysql-connector-java-5.1.27-bin.jar,/opt/cdh-5.3.6/hive-0.13.1-cdh5.3.6/lib/derby-10.10.1.1.jar spark-shell
8555 org.apache.spark.deploy.SparkSubmit --class org.apache.spark.sql.hive.thriftserver.HiveThriftServer2 spark-internal
5457 org.apache.hadoop.hdfs.server.namenode.NameNode

注意：ThriftServer服务也是一个Spark的应用，所以可以给定参数，也可以进行优化（主要是资源调优）
3）停止ThriftServer服务
spark-1.6.1-bin-2.5.0-cdh5.3.6]$ sbin/stop-thriftserver.sh
（3）SparkSQL的ThriftServer服务测试
1）通过命令beeline来测试

spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/beeline
Beeline version 1.6.1 by Apache Hive
beeline> !connect jdbc:hive2://bigdata-senior.ibeifeng.com:10000
Connecting to jdbc:hive2://bigdata-senior.ibeifeng.com:10000
Enter username for jdbc:hive2://bigdata-senior.ibeifeng.com:10000: beifeng
Enter password for jdbc:hive2://bigdata-senior.ibeifeng.com:10000: *******
19/07/28 23:15:29 INFO jdbc.Utils: Supplied authorities: bigdata-senior.ibeifeng.com:10000
19/07/28 23:15:29 INFO jdbc.Utils: Resolved authority: bigdata-senior.ibeifeng.com:10000
19/07/28 23:15:29 INFO jdbc.HiveConnection: Will try to open client transport with JDBC Uri: jdbc:hive2://bigdata-senior.ibeifeng.com:10000
Connected to: Spark SQL (version 1.6.1)
Driver: Spark Project Core (version 1.6.1)
Transaction isolation: TRANSACTION_REPEATABLE_READ

在beeline命令行输入SQL语句：

0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> 
0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> show databases;
0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> use default;
0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> show tables;
0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> select * from default.emp a join default.dept b on a.deptno = b.deptno;
0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> !help     # 查看帮助信息
0: jdbc:hive2://bigdata-senior.ibeifeng.com:1> !quit
Closing: 0: jdbc:hive2://bigdata-senior.ibeifeng.com:10000

2）编码测试，通过JDBC连接SparkSQL提供的ThriftServer服务
添加hive-jdbc驱动的pom依赖。这个依赖最好使用aliyun的maven源进行下载，需要检查一下是否已配置该maven源：http://maven.aliyun.com/nexus/content/groups/public/。
maven源配置如下：


	
		aliyun
		http://maven.aliyun.com/nexus/content/groups/public/
	
	
		cloudera
		https://repository.cloudera.com/artifactory/cloudera-repos

pom依赖坐标如下：


  org.spark-project.hive
  hive-jdbc
  0.13.1

注意：给定用户名的时候，如果HDFS没有做权限验证，可以给定任何值；如果做了权限验证，必须给定操作tmp文件夹有权限的用户名称。

6、SparkSQL读取JSON格式的HDFS文件

1）将测试文件上传HDFS上的/beifeng/spark/sql/data目录。

hadoop-2.5.0-cdh5.3.6]$ pwd
/opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6
hadoop-2.5.0-cdh5.3.6]$ bin/hdfs dfs -mkdir -p /user/beifeng/spark/sql/data
hadoop-2.5.0-cdh5.3.6]$ cd /opt/cdh-5.3.6/spark-1.6.1-bin-2.5.0-cdh5.3.6/examples/src/main/resources
resources]$ /opt/cdh-5.3.6/hadoop-2.5.0-cdh5.3.6/bin/hdfs dfs -put ./* /user/beifeng/spark/sql/data

2）编写SparkSQL代码
启动Hive Metastore：hive-0.13.1-cdh5.3.6]$ bin/hive --service metastore
启动Spark-Shell：spark-1.6.1-bin-2.5.0-cdh5.3.6]$ bin/spark-shell

scala> val path = "/user/beifeng/spark/sql/data/people.json"
path: String = /user/beifeng/spark/sql/data/people.json
scala> val df = sqlContext.jsonFile(path)
scala> df.show()
+----+-------+
| age|   name|
+----+-------+
|null|Michael|
|  30|   Andy|
|  19| Justin|
+----+-------+
scala> df.registerTempTable("json_people")
scala> sqlContext.sql("show tables").show
+-----------+-----------+
|  tableName|isTemporary|
+-----------+-----------+
|json_people|       true|
+-----------+-----------+
scala> sqlContext.dropTempTable("json_people")
scala> sqlContext.sql("show tables").show
+---------+-----------+
|tableName|isTemporary|
+---------+-----------+
+---------+-----------+
scala> df.registerTempTable("json_people")
scala> sqlContext.sql("show tables").show
+-----------+-----------+
|  tableName|isTemporary|
+-----------+-----------+
|json_people|       true|
+-----------+-----------+
scala> sqlContext.tableNames()
res7: Array[String] = Array(json_people)
scala> sqlContext.sql("select age, name from json_people where age is not null").show()
+---+------+
|age|  name|
+---+------+
| 30|  Andy|
| 19|Justin|
+---+------+
scala> sqlContext.sql("select age, name from json.`/user/beifeng/spark/sql/data/people.json` where age is not null").show()
+---+------+
|age|  name|
+---+------+
| 30|  Andy|
| 19|Justin|
+---+------+
scala> df
res10: org.apache.spark.sql.DataFrame = [age: bigint, name: string]
scala> df.rdd
res11: org.apache.spark.rdd.RDD[org.apache.spark.sql.Row] = MapPartitionsRDD[38] at rdd at :30
scala> df.schema
res12: org.apache.spark.sql.types.StructType = StructType(StructField(age,LongType,true), StructField(name,StringType,true))

7、DataFrame

（1）DataFrame的概念
Spark1.3才出现DataFrame的概念。在Spark中，DataFrame是一种以RDD为基础的分布式数据集，类似于传统数据库中的二维表格。
DataFrame与RDD的主要区别在于，前者带有schema元信息，即DataFrame所表示的二维表数据集的每一列都带有名称和类型。这使得Spark SQL得以洞察更多的结构信息，从而对藏于DataFrame背后的数据源以及作用于DataFrame之上的变换进行了针对性的优化，最终达到大幅提升运行时效率的目标。反观RDD，由于无从得知所存数据元素的具体内部结构，Spark Core只能在stage层面进行简单、通用的流水线优化。
DataFrame与RDD的对比如下：

（2）DataFrame的创建方式

val df = sqlContext.##

1）SparkSQL的操作：

HQL/SQL开发
将DataFrame注册为临时表，然后通过sqlContext.sql(“xxx”)进行任务执行。
DSL开发
直接通过DataFrame的API进行开发。

2）执行结果输出：

将DataFrame转换为RDD进行数据输出

val resultRDD = resultDataFrame.rdd.map(row => (row.getAs[Long](0),row.getAs[String](1)))
resultRDD.saveAsXXX

直接调用DataFrame的相关API进行数据输出

df.show()
df.##

3）SparkSQL应用的处理流程：

读取数据形成DataFrame
使用DSL或者HQL进行DataFrame的数据操作/数据处理
执行结果输出

（3）DataFrame内部是一个逻辑计划
所有的数据执行都是懒加载的。调用相关的API，实质上实在内部构建一个查询的逻辑计划，类似RDD的构建过程；只有当DataFrame被触发调用（获取数据的这种操作）的时候，才会真正的执行。
job执行步骤：
逻辑计划 --> 分析逻辑计划 --> 优化逻辑计划 --> 物理计划产生 --> 选择一个最优的物理计划 --> SparkCore代码生成 --> job执行。
（4）RDD和DataFrame转换
1）DataFrame转换为RDD：直接调用DataFrame类提供的rdd方法即可将
DataFrame转换为RDD数据类型。
2）RDD转换为DataFrame：将RDD转换为DataFrame主要有两种方式，如下：

Inferring the Schema Using Reflection：利用case class类型的RDD进行数据反射创建DataFrame，要求RDD中的数据类型必须是case class类型。
Programmatically Specifying the Schema：主动给定DataFrame的数据类型来创建DataFrame，要求RDD的数据类型必须是Row，另外必须给定RDD中数据对应的数据类型，调用SQLContext的createDataFrame函数来创建DataFrame。

8、DataFrame的read和write编程模式

官方说明文档：
https://spark-packages.org/
https://github.com/databricks/
DataFrame的read和write编程模式是通过SparkSQL内部定义的read和write数据读写入口进行数据的加载和保存操作。
（1）读数据

val df = sqlContext.read.###.load()
def read: DataFrameReader = new DataFrameReader(this)

函数功能说明：
format：给定读取数据源的数据格式是什么
schema：给定数据的数据格式，如果不给定，会自动进行推断
option：给定读取数据需要的参数
load：加载数据形成DataFrame
jdbc：读取RDBMs数据库的数据形成DataFrame
（2）三个不同jdbc API的功能
1）给定url和表名称及user&password即可读取数据，内部形成的DataFrame的分区数是1个：

def jdbc(url: String, table: String, properties: Properties)

2）给定形成的DataFrame的分区数量以及进行数据分区的字段，要求分区字段的数据类型必须是数值类型的：

def jdbc(
      url: String,
      table: String,
      columnName: String, // 给定分区字段的列名称
      lowerBound: Long,   // 给定计算范围下界
      upperBound: Long,   // 给定计算范围上界
      numPartitions: Int, // 给定分区个数
      connectionProperties: Properties): DataFrame

步长及索引如下计算：

step = (upperBound - lowerBound) / numPartitions
currentIndex = step + lowerBound ==> (负无穷大，currentIndex]
preIndex = currentIndex
currentIndex += step ===> (preIndex, currentIndex]
	 				 ===> 直到分区数量为numPartitions - 1
	    给定上界的范围 ===> (currentIndex，正无穷大)

3）明确给定进行数据分区的字段条件

def jdbc(
      url: String,
      table: String,
      predicates: Array[String], // 数据分区的字段条件，predicates集合中的数据个数就是最终的数据分区个数
      connectionProperties: Properties): DataFrame

（3）写数据

df.write.###.save()
def write: DataFrameWriter = new DataFrameWriter(this)

函数功能说明：
mode：给定数据插入的策略（数据插入的文件夹或者表是否存在）：

overwrite：overwrite the existing data. 如果数据存在，覆盖（数据指的是存储数据的文件夹或者表）；
append：append the data. 追加的形式；
ignore：ignore the operation (i.e. no-op). 如果数据存在，不进行任何操作，不插入数据；
error：default option, throw an exception at runtime. 如果数据存在，直接抛出异常。

format：给定数据输出的格式。
option：给定参数。
partitionBy：给定分区字段。
save：将数据进行保存操作。
insertInto：将数据插入到一个表中。
saveAsTable: 将数据保存为一个表。
jdbc：将数据输出到关系型数据库中。
（4）读写数据示例
读数据示例：

df = sqlContext.read \
		.format("json") \
		.option("samplingRatio", "0.1") \
		.load("/home/michael/data.json")

写数据示例：

df.write \
  .format("parquet") \
  .mode("append") \
  .partitionBy("year") \
//  .save("fasterData")
  .saveAsTable("fasterData")

先读后写示例（使用传统数据源的ETL）：

sqlContext.read \
	.format("com.databricks.spark.git") \
	.option("url", "https://github.com/apache/spark.git") \
	.option("numPartitions", "100") \
	.option("branches", "master, branch-1.3, branch-1.2") \
	.load() \
	.repartition(1) \
	.write \
	.format("json") \
	.save("/home/michael/spark.json")

（5）不同方式计算平均数
1）SQL语句

SELECT name, avg(age) FROM people GROUP BY name

2）MapReduce计算模型

private IntWritable one = new IntWritable(1)
private IntWritable output = new IntWritable()
protected void map(LongWritable key, Text value, Context context) {
	String[] fields = value.split("\t")
	output.set(Integer.parseInt(fields[1]))
	context.write(one, output)
}

IntWritable one = new IntWritable(1)
DoubleWritable average = new DoubleWritable()
protected void reduce(IntWritable key, Iterable values, Context context) {
	int sum = 0
	int count = 0
	for(IntWritable value: values) {
		sum += value.get()
		count++
	}
	average.set(sum/(double)count)
	context.write(key, average)
}

3）Spark Core（RDD）计算模型

data = sc.textFile(...).split("\t")
data.map(lambda x: (x[0], [int(x[1], 1])) \
	.reduceByKey(lambda x, y: [x[0] + y[0], x[1] + y[1]]) \
	.map(lambda x: [x[0], x[1][0] / x[1][1]]) \
	.collect()

4）Spark SQL（DataFrame）计算模型

sqlContext.table("people") \
		  .groupBy("name") \
		  .agg("name", avg("age")) \
		  .collect()

（6）SQL语句转换成DataFrame

events = sqlContext.load("/data/events", "parquet")
training_data = events.where("city = 'New York' and year = 2015")
					  .select("timestamp")
					  .collect()

（7）每个Spark Application以loading data开始，以saving data结束。

9、示例不同数据源的数据进行Join操作

需求：将Hive表数据输出到MySQL表中，将Hive表和MySQL表进行数据Join操作，并将最终结果保存为Parquet格式的数据，存储在HDFS中。

step1. 将spark-hive的依赖添加到项目的pom文件中。


	org.apache.spark
	spark-hive_2.10
	${spark.version}
	compile




	mysql
	mysql-connector-java
	5.1.27

step2. Windows平台上执行过程中可能出现的异常：

Exception in thread “main” java.lang.OutOfMemoryError: PermGen space at java.lang.ClassLoader.defineClass1(Native Method)。
【解决方案】run->edit configurations中给定运行的JVM参数-XX:PermSize=128M -XX:MaxPermSize=256M。
由于hadoop在windows上和linux上的执行方式不一样，在使用hiveContext对象的时候，需要应用到hadoop的底层mapreduce的一些相关代码，如果环境和源码之间存在着兼容问题的话，有可能出现NullPointException异常。
【解决方案】直接修改hadoop的底层源码，然后将修改好的源码放到spark项目中。
如果配置了HADOOP_USER_NAME。
【解决方案】建议删除（windows中）。
17/05/21 15:02:44 ERROR ShutdownHookManager: Exception while deleting Spark temp dir: C:\Users\ibf\AppData\Local\Temp\spark-d1d77acb-0a02-4db8-b2ba-217796d96207
java.io.IOException: Failed to delete: C:\Users\ibf\AppData\Local\Temp\spark-d1d77acb-0a02-4db8-b2ba-217796d96207。
【解决方案】不解决，删除临时文件失败导致的，不会影响正式的业务代码，只会在windows上产生。

10、SparkSQL函数

（1）窗口分析函数
Hive支持的内置函数，SparkSQL基本上都支持，需要稍微注意一下的是：有一些Hive的函数的使用需要使用HiveContext对象，不能使用SQLContext对象来操作。如对于Hive中的窗口分析函数，必须使用HiveContext作为入口。如下例：
row_number()的窗口分析函数用来解决分组排序TopN的问题。

scala> sqlContext.sql("select deptno, sal, row_number() over (partition by deptno order by sal desc) as rnk from common.emp").show

+------+------+---+
|deptno|   sal|rnk|
+------+------+---+
|    10|5000.0|  1|
|    10|2450.0|  2|
|    10|1300.0|  3|

|    20|3000.0|  1|
|    20|3000.0|  2|
|    20|2975.0|  3|
|    20|1100.0|  4|
|    20| 800.0|  5|

|    30|2850.0|  1|
|    30|1600.0|  2|
|    30|1500.0|  3|
|    30|1250.0|  4|
|    30|1250.0|  5|
|    30| 950.0|  6|
+------+------+---+

（2）自定义函数
SparkSQL支持两种自定义函数，分别是：UDF和UDAF，两种函数都是通过SQLContext的udf属性进行函数的注册使用的；SparkSQL不支持UDTF函数的自定义使用。
UDF：一条数据输入，一条数据输出，一对一的函数，即普通函数。
UDAF：多条数据输入，一条数据输出，多对一的函数，即聚合函数。

11、DataSet

（1）DataSet的创建
官方文档：http://spark.apache.org/docs/1.6.1/sql-programming-guide.html#creating-datasets

scala> import sqlContext.implicits._
import sqlContext.implicits._
scala> val ds = Seq(1,2,3).toDS()
20/01/27 01:41:33 INFO codegen.GenerateUnsafeProjection: Code generated in 153.240623 ms
ds: org.apache.spark.sql.Dataset[Int] = [value: int]
scala> ds.show()
+-----+
|value|
+-----+
|    1|
|    2|
|    3|
+-----+
scala> val df = sqlContext.read.json("/user/beifeng/spark/sql/data/people.json")
df: org.apache.spark.sql.DataFrame = [age: bigint, name: string]
scala> df
res1: org.apache.spark.sql.DataFrame = [age: bigint, name: string]
scala> case class Person(age: Long, name: String)
defined class Person
scala> df.as[Person]
res2: org.apache.spark.sql.Dataset[Person] = [age: bigint, name: string]

（2） DataSet，DataFrame与RDD的比较
1）相同点
三者都是分布式数据集。
DataSet和DataFrame的相同点都是有数据特征、数据类型的分布式数据集(Schema)。而RDD没有Schema。
2）不同点
RDD中的数据是没有数据类型的；
DataFrame中的数据是弱数据类型，不会做数据类型检查；
DataSet中的数据类型是强数据类型。

12、SparkSQL DSL语法

SparkSQL除了支持直接的HQL语句的查询外，还支持通过DSL语句/API进行数据的操作，主要DataFrame API列表如下：

select：类似于HQL语句中的select，获取需要的字段信息
where/filter：类似HQL语句中的where语句，根据给定条件过滤数据
sort/orderBy: 全局数据排序功能，类似Hive中的order by语句，按照给定字段进行全部数据的排序
sortWithinPartitions：类似Hive的sort by语句，按照分区进行数据排序
groupBy：数据聚合操作
limit：获取前N条数据记录

13、SparkSQL的优化

SparkCore中的优化项一般都需要考虑，比如cache、重用等。
SparkSQL专有的优化项：

HQL语句优化：根据explain的执行结果进行HQL优化。
参数优化：如设置spark.sql.shuffle.partitions：5（默认值200）, 当SparkSQL中存在shuffle的时候，设置分区的数量。参见文档：http://spark.apache.org/docs/1.6.1/sql-programming-guide.html#performance-tuning。

你可能感兴趣的:(BigData,BigData,Components)

技术演进中的开发沉思-42 MFC系列：Components 与 ActiveX Controls chilavert318 熬之滴水穿石 mfc c++windows
点击程序启动时，是不是看过有加载的画面。在VC开发时，可使用VC++的ComponentGallery，找到Splashscreen组件，当时觉得组件就是给程序员的暖手宝。一、ComponentGalleryComponentGallery在VC++里的位置很特别——它藏在“Project”菜单的二级目录里，就像老衣柜最上层那个带锁的抽屉，不常用但一打开全是宝贝。当年我们团队有个不成文的规矩：新项
解决Error: Not Found：Page[5][-1,81] at view.umd.min.js 二七狂人 uniapp 前端 javascript uniapp vue
场景说明：uniapp使用组件，在APP环境出现，在H5环境正常。单页面上多处使用该组件，使用同名参数设置数据，应用切换效果时，触发请求不同接口，返回数据格式不同。使用v-if时出现，使用v-show时正常。原因分析：尚不明确。解决方案1：将组件注册多个不同名称来使用，对应不同的返回数据。importvTabsfrom"@/components/v-tabs.vue"importvTabs1fro
前端Vue自定义顶部搜索框热门搜索历史搜索用于搜索跳转使用前端组件分享
前端Vue自定义顶部搜索框热门搜索历史搜索用于搜索跳转使用，下载完整代码请访问uni-app插件市场地址：https://ext.dcloud.net.cn/plugin?id=13128效果图如下：####自定义顶部搜索框用于搜索跳转使用方法```使用方法```####HTML代码实现部分```htmlimportCCBProjectListfrom'../../components/CCPro
uni-app开发小程序，根据图片提取主题色值
需求，在页面根据传入的图片提取图片主色值并用来设置区块背景色{{item.name}}{{item.calorie}}千卡/{{item.unit}}分钟importproductChangefrom'./product-change.vue'exportdefault{name:'productItem',components:{productChange},props:{name:{type:
vue3使用AntV X6 (图可视化引擎)历程[二] 在路上` Vue vue.js javascript
通过h函数动态展示自定义节点内容一、案例效果二、案例代码父组件.BloodTopology.vuerightContentimportRightDrawerfrom'@/common/components/topologyToolKit/RightDrawer.vue';importTopologyCompactfrom'@/common/components/topologyToolKit/To
uniapp调用高德api zhcinit0 uni-app 小程序前端 vue.js
主要包含：1、uniapp调用高德地图的微信sdk2、实现坐标和经纬度互相转换功能3、实现关键字检索功能说明：页面以uniapp编写，使用uniapp官方map组件，cover-view处理原生组件层级问题。以下是单个页面布局和业务逻辑:{{inputInfo}}详细地址：{{description}}保存{{i.name}}importWhiteHeadfrom'../../components
uniapp--腾讯地图路线轨迹回放前端志茗 uni-app json 前端微信小程序小程序
腾讯地图路线轨迹回放返回路线轨迹手动选择目的地开始驾车路线规划显示小车轨迹模拟运行//引入SDK核心类，地图组件importQQMapWXfrom'../components/qqmap-wx-jssdk1.2/qqmap-wx-jssdk.js'exportdefault{data(){return{qqmapsdk:{},//腾讯地图小程序的SDKtext:'路线轨迹，带小车图标',//滚动通
[架构之美]手动搭建Vue3 前端项目框架曼岛_ 成长之路前端
[架构之美]手动搭建Vue3前端项目框架我们将手动创建一个完整的Vue前端项目，包含基础结构、路由、状态管理和UI组件。下面是实现方案：一.项目结构设计1.1项目架构设计my-vue-project/├──public/│├──index.html│└──favicon.ico├──src/│├──assets/││└──logo.png││├──main.css│├──components/││
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
Netty中CompositeByteBuf 的addComponents方法解析 Jooou java nio 网络协议
详细解析addComponents方法CompositeByteBuf中的addComponents方法是其核心功能之一，用于批量添加多个ByteBuf实例作为其内部组件，而无需实际的数据拷贝。这个方法提供了便捷的方式来构建一个包含多个独立数据块的逻辑连续缓冲区。1.addComponents方法的作用与签名addComponents方法的主要作用是接收一个或多个ByteBuf对象，并将它们作为C
Filter快速入门 Java web 撰卢 java 前端 hive spring boot
文章目录Filter快速入门登录演示Filter快速入门定义Filter:定义一个类，是实现Filter接口，并重写所有方法配置Filter:Filter类上加上==@WebFilter==注解，配置拦截资源的路径。引导类加上==@ServletComponentScan==开启Servlet组件支持(也就是在springboot的启动类上面加上这个注释)相关代码importjavax.servl
react/vue vite ts项目中，自动引入路由文件、 import.meta.glob动态引入路由无需手动引入初遇你时动了情 react.js vue.js javascript
utils/autoRouteHelper.ts//src/utils/autoRouteHelper.tsimport{lazy}from"react";importwithLoadingfrom"@/components/router/withLoading";/**自动生成某个文件夹下的子路由*/interfaceRouteItem{path:string;element?:any;chil
[特殊字符] Spring Boot 常用注解全解析：20 个高频注解 + 使用场景实例库库林_沙琪马 springboot spring boot 后端 java
一文掌握SpringBoot中最常用的20个注解，涵盖开发、配置、Web、数据库、测试等场景，配合示例讲解，一站式掌握！一、核心配置类注解1.@SpringBootApplication作用：标记为SpringBoot应用的入口类，包含了@Configuration、@EnableAutoConfiguration和@ComponentScan。使用场景：主启动类上唯一标注一次。@SpringBo
vue-cli 模式下安装 uni-ui
目录easycom自定义easycom配置的示例npm安装uni-ui准备sass安装uni-ui注意easycom传统vue组件，需要安装、引用、注册，三个步骤后才能使用组件。easycom将其精简为一步。只要组件路径符合规范（具体见下），就可以不用引用、注册，直接在页面中使用。如下：//这里不用import引入，也不需要在components内注册uni-list组件。template里就可以
深入解析React Server Components：服务端组件技术革新
深入解析ReactServerComponents：服务端组件技术革新前言React团队提出的ServerComponents（服务端组件）是一项突破性的技术演进，它重新定义了React应用的架构模式。本文将全面剖析这一技术，帮助开发者理解其核心价值和应用场景。什么是ServerComponents？ServerComponents是React的一种新型组件，它们只在服务端执行，具有以下关键特性：
Day02: BeanDefinition的注册艺术：揭秘@ComponentScan如何转化为Spring灵魂 zhysunny Spring spring java 后端
目录一、从@ComponentScan说起：Spring的组件扫描入口二、BeanDefinition：Spring容器的DNA三、ClassPathBeanDefinitionScanner：Spring的"扫雷专家"1.扫描器的初始化2.扫描器的核心配置3.扫描过程揭秘4.候选组件的查找：findCandidateComponents()四、元数据处理：注解如何转化为Bean属性五、实战：自定
React-Python项目安装与使用指南
React-Python项目安装与使用指南一、项目目录结构及介绍通常情况下，在克隆了https://github.com/facebookarchive/react-python.git仓库之后，你会看到以下的目录结构：├──README.md#项目的说明文档├──src#源码目录│├──components#React组件存放位置│├──App.py#应用主入口文件│└──index.js#引入
React响应式组件范式：从类组件到Hooks 止观止 #React 核心原理深度剖析 react.js javascript ecmascript
引言在UI开发中，"状态变化自动触发UI更新"的响应式机制是构建动态界面的核心。React通过独特的单向数据流和虚拟DOM（VirtualDOM）实现这一目标，但类组件（ClassComponents）与Hooks分别代表了两种截然不同的实现范式：类组件时代：以生命周期方法作为响应式调度器，需手动管理状态与副作用（SideEffects）的同步Hooks时代：以状态为驱动核心，通过声明式副作用（D
uniapp自定义全局弹窗组件 LuWiHa uni-app javascript 前端
可以参考一下方法，如果大家有更好的全局弹窗方法欢迎留言//使用方法//在main.js里全局注册importglobalModalfrom'./components/global-popup.vue'Vue.component('global-popup',globalModal)//在需要的页面引用组件this.$refs.globalModal.openPopup({title:'标题',co
极简Vue 3应用：从入门到掌握核心概念程序猿全栈の董（董翔） vue.js 前端 javascript
Vue.js作为一款渐进式JavaScript框架，以其直观的API和灵活的架构受到广泛欢迎。对于初学者而言，Vue官方CLI生成的项目结构可能略显复杂，包含了各种资源文件、样式和示例组件。本文将介绍如何创建一个最简洁的Vue3应用，帮助你专注于核心概念的学习。为什么需要最简Vue应用？VueCLI默认生成的项目包含：assets目录：存放图片、字体等资源components目录：包含多个示例组件
React移动端项目准备（ts版） sync98 前端框架 react typescript
一、创建项目使用脚手架命令创建新项目：1.通过命令行创建项目npxcreate-react-appts-geek-park-h5--templatetypescript2.src文件夹下，保留react-app-env.d.ts文件，删除其他文件，并且创建必要的文件项目结构：src>api封装接口>assets项目资源>components通用组件>hooks自定义钩子函数>pages页面组件>s
ABAP - Excel OO - zcl_excel
classZCL_EXCELdefinitionpubliccreatepublic.publicsection.*"*publiccomponentsofclassZCL_EXCEL*"*donotincludeothersourcefileshere!!!interfacesZIF_EXCEL_BOOK_PROPERTIES.interfacesZIF_EXCEL_BOOK_PROTECTIO
打造自己的组件库（一）宏函数解析行云＆流水 Vue3组件库 vue3组件库 vue.js javascript 前端
1.初始化项目npmcreatevite生成项目后，文件目录如下：├──.idea/#IntelliJIDEA配置目录├──.vscode/#VSCode配置目录├──public/#静态资源目录│└──vite.svg#Vite默认图标├──src/#源代码目录│├──assets/#项目资源文件││└──vue.svg#Vue图标│├──components/#Vue组件目录││└──Hell
java 同步redis到mysql_Yii2 redis同步数据到mysql 兰艳知己 java 同步redis到mysql
将redis数据写入mysql中：本次案例讲解将如何将商城中商品浏览次数通过缓存记录并写入mysql中具体的redis安装过程暂且就省略了.....一、安装redis插件|配置rediscomposerrequireyiisoft/yii2-redis找到common的config文件，在components下加入redis配置参数'redis'=>['class'=>'yii\redis\Con
更新！「3D Web轻量化引擎」HOOPS Communicator发布2025.2.0版本：全新WebViewer用户界面、工业3D_大熊 3D CAD开发工具 3d 3D建模 3D模型轻量化工业3D 3D数据格式转换 3D模型可视化 3D Web轻量化
3DWeb轻量化引擎HOOPSCommunicator此前发布2025.2.0版本！此次更新聚焦于提升用户体验和稳定性，通过引入创新的界面设计以及对若干问题的修复，确保用户能够更加高效、流畅地处理3D数据可视化任务。以下将详细阐述本次更新的核心内容。一、增强功能本次更新的重点在于对WebViewer用户界面的革新。我们精心打造了全新的WebViewerUI，其核心基于WebComponents技术
Svelte滚屏插件：rollup-plugin-svelte完全指南俞兰莎Rosalind
Svelte滚屏插件：rollup-plugin-svelte完全指南rollup-plugin-svelteCompileSveltecomponentswithRollup项目地址:https://gitcode.com/gh_mirrors/ro/rollup-plugin-svelte项目介绍rollup-plugin-svelte是一款专门用于将Svelte组件编译为JavaScript
React-forwardRef-useImperativeHandle 前端小趴菜05 react.js vue.js 前端
forwardRef暴露dom节点作用：使用ref暴露DOM节点给父组件案例例如在父组件中想要获取子组件input的输入值，和让input获取焦点父组件import{Button}from'antd-mobile'importSonfrom"./components/son";import{useState,useRef}from"react";constYear=()=>{constinputR
机器学习知识点复习上（保研、复试、面试）百面机器学习笔记
机器学习知识点复习上一、特征工程1.为什么需要对数值类型的特征做归一化？2.文本表示模型3.图像数据不足的处理方法二、模型评估1.常见的评估指标2.ROC曲线3.为什么在一些场景中要使用余弦相似度而不是欧氏距离？4.过拟合和欠拟合三、经典算法1.支持向量机SVM2.逻辑回归3.决策树四、降维1.主成分分析（PrinalComponentsAnalysis,PCA）降维中最经典的方法2.线性判别分析
【量化系统实战】深入解析：大规模数据管理与分布式计算，打造你的量化“超级工厂” Natsume1710 python github 开发语言算法大数据数据仓库
前言随着量化策略的不断演进，以及对高频数据、另类数据（新闻、社交媒体、卫星图像等）需求的日益增长，许多朋友可能都会遇到一个棘手的问题：当数据量达到TB甚至PB级别，复杂的因子计算和超大规模回测在单机上变得举步维艰，系统效率严重受限。本文将作为量化系统构建系列的进阶篇，聚焦于大规模数据管理（BigDataManagement）和分布式计算（DistributedComputing）。我们将详细阐述如
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南汤力赛Frederica
QueryBook常见问题解答：从查询失败到数据文档管理的完整指南querybookQuerybookisaBigDataQueryingUI,combiningcollocatedtablemetadataandasimplenotebookinterface.项目地址:https://gitcode.com/gh_mirrors/qu/querybook查询执行问题排查当您在QueryBook
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那