Eva.努力学习

Spark基础 -- Spark Shell -- RDD -- 算子

Spark基础 – Spark Shell – RDD – 算子

文章目录

Spark基础 -- Spark Shell -- RDD -- 算子

一、简介
二、Spark 1.6.3部署

准备工作
解压安装
配置spark，master高可用
配置环境变量
分发配置好的Spark到其他节点

三、Spark集群启动和测试

启动
测试

四、Spark Shell

spark shell简介
spark shell 启动
在spark shell中编写wordcount程序

五、IDEA中编写WordCount

pom.xml
编写代码
打包到Linux服务器中运行

六、弹性分布式数据集RDD

RDD简介
RDD属性
RDD创建

七、RDD编程API

Transformation
Action

八、算子进阶

一、简介

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是——Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

二、Spark 1.6.3部署

准备工作

三台Linux服务器，安装好JDK1.8、Hadoop2.6
下载安装包spark1.6.3
将安装包上传到第一台Linux服务器上

解压安装

解压安装包到指定位置

tar -zxvf spark-1.6.3-bin-hadoop2.6.tgz -C /home/bigdata/installsoft/

将文件夹重命名为spark-1.6.3

配置spark，master高可用

进入spark安装目录下的conf目录

cd /home/bigdata/installsoft/spark-1.6.3/conf
将spark-env.sh.template重命名为spark-env.sh

mv spark-env.sh.template spark-env.sh

编辑spark-env.sh并添加配置

export JAVA_HOME=/home/bigdata/installsoft/jdk1.8.0_181/
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=cdhnocms01,cdhnocms02,cdhnocms03 -Dspark.deploy.zookeeper.dir=/spark"
export SPARK_MASTER_PORT=7077
export HADOOP_CONF_DIR=/home/bigdata/installsoft/hadoop-2.6.0-cdh5.13.2/etc/hadoop

将slaves.template重命名为slaves

mv slaves.template slaves
在slaves文件汇总添加worker节点所在的主机

cdhnocms01
cdhnocms02
cdhnocms03

配置环境变量

在用户家目录下.bash_profile文件中添加

SPARK_HOME=/home/bigdata/installsoft/spark-1.6.3/

PATH= $P A T H :$ SPARK_HOME/bin:$SPARK_HOME/sbin

保存退出后source .bash_profile

分发配置好的Spark到其他节点

scp -r /home/bigdata/installsoft/spark-1.6.3/ cdhnocms02:/home/bigdata/installsoft/
scp -r /home/bigdata/installsoft/spark-1.6.3/ cdhnocms02:/home/bigdata/installsoft/

直接将环境变量文件发送到其他节点，或者在其他节点上一一配置环境变量

三、Spark集群启动和测试

启动

在cdhnocms01节点上执行/home/bigdata/installsoft/spark-1.6.3/sbin/start-all.sh

在cdhnocms02节点上执行/home/bigdata/installsoft/spark-1.6.3/sbin/start-master.sh

此时使用jps查看三台机器进程，如下表

cdhnocms01	cdhnocms02	cdhnocms03
Master、Worker	Master、Worker	Worker

注意：虽然配置了环境变量，但由于名称相同，如果直接在任意目录直接执行start-all.sh，启动的将会是hadoop的相关进程。解决办法：修改启动脚本的文件名。

测试

运行官方自带的例子

spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://cdhnocms01:7077 \
--executor-memory 1G \
--total-executor-cores 2 \
/home/bigdata/installsoft/spark-1.6.3/lib/spark-examples-1.6.3-hadoop2.6.0.jar \
100

运行完成后可以在命令行中找到结果

在web监控页面：cdhnocms02:8080上可以查看任务状态

四、Spark Shell

spark shell简介

spark-shell是Spark自带的交互式Shell程序，方便用户进行交互式编程，用户可以在该命令行下用scala编写spark程序。

spark shell 启动

spark-shell \
--master spark://cdhnocms01:7077 \
--executor-memory 1G \
--total-executor-cores 2

参数说明

–master spark://cdhnocms02:7077 指定Master的地址

–executor-memory 1G 指定每个worker可用内存为1G

–total-executor-cores 2 指定整个集群使用的cup核数为2个

注意

如果启动spark shell时没有指定master地址，但是也可以正常启动spark shell和执行spark shell中的程序，其实是启动了spark的local模式，该模式仅在本机启动一个进程，没有与集群建立联系。

启动spark shell后，可以注意到在控制台有如下两条语句：

意思是Spark Shell中已经默认将SparkContext类初始化为对象sc，SQLContext类初始化为对象sqlContext。用户代码如果需要用到，则直接使用对应的对象名即可即可。

在spark shell中编写wordcount程序

上传数据文件到hdfs://cdhnocms01:8020/userdata/wc.txt
val file = sc.textFile(“hdfs://cdhnocms01:8020/userdata/wc.txt”)
val words = file.flatMap(_.split(" "))
val map = words.map((_,1))
val result = map.reduceByKey(+)
接下来可以直接通过result.collect将结果打印到控制台，或者result.saveAsTextFile(“hdfs://cdhnocms01:8020/out/20181119”)，将结果文件存储在hdfs后查看结果

五、IDEA中编写WordCount

pom.xml



    4.0.0

    com
    spark
    1.0-SNAPSHOT

    
        
            org.apache.spark
            spark-core_2.11
            1.6.3
        
    

    
        src/main/day01
        

            
                org.scala-tools
                maven-scala-plugin
                2.15.2
                
                    
                        
                            compile
                            testCompile
                        
                    
                
            

            
                maven-compiler-plugin
                3.6.0
                
                    1.8
                    1.8
                
            

            
                org.apache.maven.plugins
                maven-surefire-plugin
                2.19
                
                    true

编写代码

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}

object SparkWordCount_scala {

  def main(args: Array[String]): Unit = {
    // 1.获取spark的conf
    // 本地运行
    val conf = new SparkConf().setAppName("spark_wordcount_scala").setMaster("local[2]")
    // 提交到集群中运行
    //val conf = new SparkConf().setAppName("spark_wordcount_scala").setMaster("spark://cdhnocms01:7077")
    // 2.根据conf对象获取sparkContext(spark的上下文)
    val sc = new SparkContext(conf)
    // 读取hdfs中的数据
    sc.hadoopConfiguration.addResource("core-site.xml")
    sc.hadoopConfiguration.addResource("hdfs-site.xml")
   
    //第二种读取hdfs的HA的文件数据
    //    sc.hadoopConfiguration.set("")

    // 3.使用sc进行操作
    // 读取数据源
    val words:RDD[String] = sc.textFile(args(0))
    val res:RDD[(String,Int)] = words.flatMap(_.split(" ")).map((_,1)).groupBy(_._1).mapValues(_.size)
    // 打印
    res.foreach(f=>println(f))
    //4. 关闭sc
    sc.stop()


  }
}

可以直接在idea中配置好输入参数后运行，可以的到结果

打包到Linux服务器中运行

使用Maven打包后，将jar包上传至Linux中，运行命令：

spark-submit \
--class SparkWordCount_scala \
--master spark://cdhnocms01:7077 \
/home/bigdata/userjars/spark-1.0-SNAPSHOT.jar \
hdfs://bigdata/userdata/wc.txt

代码的输出结果(在网页监控端口任务的stdout中查看)：

六、弹性分布式数据集RDD

RDD简介

RDD(Resilient Distributed Dataset)，分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点：自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显式地将工作集缓存在内存中，后续的查询能够重用工作集，这极大地提升了查询速度。

RDD属性

- A list of partitions
- A function for computing each split
- A list of dependencies on other RDDs
- Optionally, a Partitioner for key-value RDDs (e.g. to say that the RDD is hash-partitioned)
- Optionally, a list of preferred locations to compute each split on (e.g. block locations for
 an HDFS file)

属性详解：

一组分片（Partition），即数据集的基本组成单位。对于RDD来说，每个分片都会被一个计算任务处理，并决定并行计算的粒度。用户可以在创建RDD时指定RDD的分片个数，如果没有指定，那么就会采用默认值。默认值就是程序所分配到的CPU Core的数目。
一个计算每个分区的函数。Spark中RDD的计算是以分片为单位的，每个RDD都会实现compute函数以达到这个目的。compute函数会对迭代器进行复合，不需要保存每次计算的结果。
RDD之间的依赖关系。RDD的每次转换都会生成一个新的RDD，所以RDD之间就会形成类似于流水线一样的前后依赖关系。在部分分区数据丢失时，Spark可以通过这个依赖关系重新计算丢失的分区数据，而不是对RDD的所有分区进行重新计算。
一个Partitioner，即RDD的分片函数。当前Spark中实现了两种类型的分片函数，一个是基于哈希的HashPartitioner，另外一个是基于范围的RangePartitioner。只有对于key-value的RDD，才会有Partitioner，非key-value的RDD的Parititioner的值是None。Partitioner函数不但决定了RDD本身的分片数量，也决定了parent RDD Shuffle输出时的分片数量。
一个列表，存储存取每个Partition的优先位置（preferred location）。对于一个HDFS文件来说，这个列表保存的就是每个Partition所在的块的位置。按照“移动数据不如移动计算”的理念，Spark在进行任务调度的时候，会尽可能地将计算任务分配到其所要处理数据块的存储位置。

RDD创建

由一个已经存在的Scala集合创建(Array、List、Seq等)

sc.parallelize(args(0),args(1))

第一个参数代表已存在的Scala集合，第二个参数代表分片个数，如果不指定则会采用默认值—分配的CPU core数量
由外部存储系统的数据集创建，包括本地的文件系统，还有所有Hadoop支持的数据集，比如HDFS、Cassandra、HBase等

sc.textFile(“hdfs://cdhnocms01:8020/userdata/wc.txt”)

七、RDD编程API

Transformation

RDD中的所有转换都是延迟加载的，也就是说，它们并不会直接计算结果。相反的，它们只是记住这些应用到基础数据集（例如一个文件）上的转换动作。只有当发生一个要求返回结果给Driver的动作时，这些转换才会真正运行。

Transformation	含义
map(func)	返回一个新的RDD，该RDD由每一个输入元素经过func函数转换后组成
filter(func)	返回一个新的RDD，该RDD由经过func函数计算后返回值为true的输入元素组成
flatMap(func)	类似于map，但是每一个输入元素可以被映射为0或多个输出元素（所以func应该返回一个序列，而不是单一元素）
mapPartitions(func)	类似于map，但独立地在RDD的每一个分片上运行，因此在类型为T的RDD上运行时，func的函数类型必须是Iterator[T]=> Iterator[U]
mapPartitionsWithIndex(func)	类似于mapPartitions，但func带有一个整数参数表示分片的索引值，因此在类型为T的RDD上运行时，func的函数类型必须是(Int, Iterator[T]) => Iterator[U]
sample(withReplacement,fraction, seed)	根据fraction指定的比例对数据进行采样，可以选择是否使用随机数进行替换，seed用于指定随机数生成器种子
union(otherDataset)	对源RDD和参数RDD求并集后返回一个新的RDD
intersection(otherDataset)	对源RDD和参数RDD求交集后返回一个新的RDD
distinct([numTasks]))	对源RDD进行去重后返回一个新的RDD
groupByKey([numTasks])	在一个(K,V)的RDD上调用，返回一个(K, Iterator[V])的RDD
reduceByKey(func,[numTasks])	在一个(K,V)的RDD上调用，返回一个(K,V)的RDD，使用指定的reduce函数，将相同key的值聚合到一起，与groupByKey类似，reduce任务的个数可以通过第二个可选的参数来设置
aggregateByKey(zeroValue)(seqOp,combOp, [numTasks])
sortByKey([ascending], [numTasks])	在一个(K,V)的RDD上调用，K必须实现Ordered接口，返回一个按照key进行排序的(K,V)的RDD
sortBy(func,[ascending],[numTasks])	与sortByKey类似，但是可以指定根据什么排序
join(otherDataset,[numTasks])	在类型为(K,V)和(K,W)的RDD上调用，返回一个相同key对应的所有元素对在一起的(K,(V,W))的RDD
cogroup(otherDataset,[numTasks])	在类型为(K,V)和(K,W)的RDD上调用，返回一个(K,(Iterable,Iterable))类型的RDD
cartesian(otherDataset)	笛卡尔积
coalesce(numPartitions)	重新分区
repartition(numPartitions)	重新分区
repartitionAndSortWithinPartitions(partitioner)	重新分区

Action

Action	含义
reduce(func)	通过func函数聚集RDD中的所有元素，这个功能必须是可交换且可并联的
collect()	在驱动程序中，以数组的形式返回数据集的所有元素
count()	返回RDD的元素个数
first()	返回RDD的第一个元素（类似于take(1)）
take(n)	返回一个由数据集的前n个元素组成的数组
takeSample(withReplacement,num, [seed])	返回一个数组，该数组由从数据集中随机采样的num个元素组成，可以选择是否用随机数替换不足的部分，seed用于指定随机数生成器种子
takeOrdered(n, [ordering])	takeOrdered和top类似，只不过以和top相反的顺序返回元素
saveAsTextFile(path)	将数据集的元素以textfile的形式保存到HDFS文件系统或者其他支持的文件系统，对于每个元素，Spark将会调用toString方法，将它装换为文件中的文本
saveAsSequenceFile(path)	将数据集中的元素以Hadoopsequencefile的格式保存到指定的目录下，可以使HDFS或者其他Hadoop支持的文件系统。
saveAsObjectFile(path)
countByKey()	针对(K,V)类型的RDD，返回一个(K,Int)的map，表示每一个key对应的元素个数。
foreach(func)	在数据集的每一个元素上，运行函数func进行更新。

八、算子进阶

map/mapPartitions
```
val rdd1 = sc.parallelize(List(1,2,3,4,5,6), 2)
val rdd2 = rdd1.map(_ * 10)
val rdd2 = rdd1.mapPartitions(_.map(_ * 10))
rdd2.collect
```
Array[Int] = Array(10, 20, 30, 40, 50, 60)

Array[Int] = Array(10, 20, 30, 40, 50, 60)

map算子是将rdd中的每一个元素拿出来进行操作

mapPartitions算子是将一整个分片中的数据拿出来操作，所以需要继续对每一个分片中各个数据拿出来操作
```
rdd1.mapPartitions(_.toList.reverse.iterator).collect
```
此操作是将每一个分片中的数据翻转
mapWith

参数列表：(constructA: Int => A, preservesPartitioning: Boolean = false)(f: (T, A) => U)

其中preservesPartitioning指定是否需要使用父RDD的分片
```
rdd1.mapWith(i => i*10)((a, b) => b+2).collect  
```
Array[Int] = Array(2, 2, 2, 12, 12, 12)

mapWith算子是将rdd的分片下标取出进行操作元组(a,b)中a指数据，b指该数据的下标
flatMapWith

参数列表：(constructA: Int => A, preservesPartitioning: Boolean = false)(f: (T, A) => Seq[U])
```
rdd1.flatMapWith(i => i, true)((x, y) => List((y, x))).collect
```
Array[(Int, Int)] = Array((0,1), (0,2), (0,3), (1,4), (1,5), (1,6))

flatMapWith算子类似于mapWith，但是每一个输入元素可以被映射为0或多个输出元素
mapPartitionsWithIndex

参数列表：(f: (Int, Iterator[T]) => Iterator[U], preservesPartitioning: Boolean = false)
```
val func = (index: Int, iter: Iterator[(Int)]) => {
  iter.toList.map(x => "[partID:" +  index + ", val: " + x + "]").iterator
}
val rdd1 = sc.parallelize(List(1,2,3,4,5,6,7,8,9), 2)
rdd1.mapPartitionsWithIndex(func).collect
```
Array[String] = Array([partID:0, val: 1], [partID:0, val: 2], [partID:0, val: 3], [partID:0, val: 4], [partID:1, val: 5], [partID:1, val: 6], [partID:1, val: 7], [partID:1, val: 8], [partID:1, val: 9])
aggregate

参数列表：(zeroValue: U)(seqOp: (U, T) => U, combOp: (U, U) => U): U

zeroValue：初始值；seqOp：单个分区的合并操作；combOp：所有分区的汇总操作
```
def func1(index: Int, iter: Iterator[(Int)]) : Iterator[String] = {
  iter.toList.map(x => "[partID:" +  index + ", val: " + x + "]").iterator
}
val rdd1 = sc.parallelize(List(1,2,3,4,5,6,7,8,9), 2)
rdd1.mapPartitionsWithIndex(func1).collect
```
Array[String] = Array([partID:0, val: 1], [partID:0, val: 2], [partID:0, val: 3], [partID:0, val: 4], [partID:1, val: 5], [partID:1, val: 6], [partID:1, val: 7], [partID:1, val: 8], [partID:1, val: 9])
```
rdd1.aggregate(0)(math.max(_, _), _ + _)
rdd1.aggregate(5)(math.max(_, _), _ + _)
```
Int = 13 //首先在两个分区中各自获得最大值4、9，相加等于13

Int = 19 //首先在两个分区中各自获得最大值5、9，相加等于14，再加上初始值5等于19
```
val rdd2 = sc.parallelize(List("a","b","c","d","e","f"),2)
def func2(index: Int, iter: Iterator[(String)]) : Iterator[String] = {
  iter.toList.map(x => "[partID:" +  index + ", val: " + x + "]").iterator
}
rdd2.mapPartitionsWithIndex(func2).collect
```
Array[String] = Array([partID:0, val: a], [partID:0, val: b], [partID:0, val: c], [partID:1, val: d], [partID:1, val: e], [partID:1, val: f])
```
rdd2.aggregate("")(_ + _, _ + _)
rdd2.aggregate("=")(_ + _, _ + _)
```
String = abcdef 或 String = defabc //字符串拼接操作，在两个分区中先各自拼接，最终的拼接时的顺序是哪个分区先完成就哪个分区在前

String = ==def=abc 或 String = ==abc=def //同上，但是在拼接前先加上初始值"="
```
val rdd3 = sc.parallelize(List("12","23","345","4567"),2)
rdd3.aggregate("")((x,y) => math.max(x.length, y.length).toString, (x,y) => x + y)
```
String = 42 或 String = 24

前一个参数列表 (x,y):第一次时分别代表初始值和分区中的第一个值，以后是分别代表上一次结果的值和分区中新的值

max(0,2) = 2, max(2,2) = 2

max(0,3) = 3, max(3,4) = 4

后一个参数列表(x,y):第一次是代表初始值与第一个分区的结果拼接，以后代表上一次的结果和新的分区的结果拼接

同上，由于不同分区的完成时间不同，结果会出现两种情况
```
val rdd4 = sc.parallelize(List("12","23","345",""),2)
rdd4.aggregate("")((x,y) => math.min(x.length, y.length).toString, (x,y) => x + y)
```
String = 10 或 String = 01

关键在于"".length=0，“0”.length=1
```
val rdd5 = sc.parallelize(List("12","23","","345"),2)
rdd5.aggregate("")((x,y) => math.min(x.length, y.length).toString, (x,y) => x + y)
```
String = 11
aggregateByKey

相同的key进行操作

参数列表：(zeroValue: U, partitioner: Partitioner)(seqOp: (U, V) => U, combOp: (U, U) => U): RDD[(K, U)
```
val pairRDD = sc.parallelize(List(("mouse", 2),("cat",2), ("cat", 5), ("mouse", 4),("cat", 12), ("dog", 12)), 2)
def func2(index: Int, iter: Iterator[(String, Int)]) : Iterator[String] = {
  iter.toList.map(x => "[partID:" +  index + ", val: " + x + "]").iterator
}
pairRDD.mapPartitionsWithIndex(func2).collect
```
Array[String] = Array([partID:0, val: (mouse,2)], [partID:0, val: (cat,2)], [partID:0, val: (cat,5)], [partID:1, val: (mouse,4)], [partID:1, val: (cat,12)], [partID:1, val: (dog,12)])
```
pairRDD.aggregateByKey(0)(math.max(_, _), _ + _).collect
pairRDD.aggregateByKey(100)(math.max(_, _), _ + _).collect
```
Array[(String, Int)] = Array((dog,12), (cat,17), (mouse,6)) // dog：12；cat：5+12；mouse：2+4

Array[(String, Int)] = Array((dog,100), (cat,200), (mouse,200)) // dog：100；cat：100+100；mouse：100+100

combineByKey

参数列表：(createCombiner: V => C, mergeValue: (C, V) => C, mergeCombiners: (C, C) => C)

val rdd1 = sc.textFile("hdfs://cdhnocms01:8020/userdata/wc.txt").flatMap(_.split(" ")).map((_, 1))
rdd1.combineByKey(x => x, (a: Int, b: Int) => a + b, (m: Int, n: Int) => m + n).collect

Array[(String, Int)] = Array((word,2), (hello,2), (sql,1), (spark,3), (hadoop,2), (hi,1))

rdd1.combineByKey(x => x + 10, (a: Int, b: Int) => a + b, (m: Int, n: Int) => m + n).collect

Array[(String, Int)] = Array((word,12), (hello,12), (sql,11), (spark,13), (hadoop,12), (hi,11))

// 对每一个value加10

val rdd4 = sc.parallelize(List("dog","cat","gnu","salmon","rabbit","turkey","wolf","bear","bee"), 3)
val rdd5 = sc.parallelize(List(1,1,2,2,2,1,2,2,2), 3)
val rdd6 = rdd5.zip(rdd4)
rdd6.combineByKey(List(_), (x: List[String], y: String) => x :+ y, (m: List[String], n: List[String]) => m ++ n).collect

Array[(Int, List[String])] = Array((1,List(dog, cat, turkey)), (2,List(salmon, rabbit, wolf, bear, bee, gnu)))

countByKey / countByValue
```
val rdd1 = sc.parallelize(List(("a", 1), ("b", 2), ("b", 2), ("c", 2), ("c", 1)))
rdd1.countByKey
rdd1.countByValue
```
scala.collection.Map[String,Long] = Map(b -> 2, a -> 1, c -> 2) // 统计相同key出现的次数

scala.collection.Map[(String, Int),Long] = Map((b,2) -> 2, (c,2) -> 1, (a,1) -> 1, (c,1) -> 1) // 统计相同元素出现的次数

filterByRange

val rdd1 = sc.parallelize(List(("e", 5), ("c", 3), ("d", 4), ("c", 2), ("a", 1)))
val rdd2 = rdd1.filterByRange("c", "d")
rdd2.collect

Array[(String, Int)] = Array((c,3), (d,4), (c,2))

// 对给定的范围进行过滤

flatMapValues
```
val rdd3 = sc.parallelize(List(("a", "1 2"), ("b", "3 4")))
rdd3.flatMapValues(_.split(" ")).collect
```
Array[(String, String)] = Array((a,1), (a,2), (b,3), (b,4))

对value进行相应的操作后压频

foldByKey

val rdd1 = sc.parallelize(List("dog", "wolf", "cat", "bear"), 2)
val rdd2 = rdd1.map(x => (x.length, x))
val rdd3 = rdd2.foldByKey("")(_+_)
rdd3.collect

Array[(Int, String)] = Array((4,bearwolf), (3,dogcat))

val rdd = sc.textFile("hdfs://cdhnocms01:8020/userdata/wc.txt").flatMap(_.split(" ")).map((_, 1))
rdd.foldByKey(0)(_+_).collect

Array[(String, Int)] = Array((word,2), (hello,2), (sql,1), (spark,3), (hadoop,2), (hi,1))

foreachPartition

val rdd1 = sc.parallelize(List(1, 2, 3, 4, 5, 6, 7, 8, 9), 3)
rdd1.foreachPartition(x => println(x.reduce(_ + _)))

keyBy

val rdd1 = sc.parallelize(List("dog", "salmon", "salmon", "rat", "elephant"), 3)
val rdd2 = rdd1.keyBy(_.length)
rdd2.collect

Array[(Int, String)] = Array((3,dog), (6,salmon), (6,salmon), (3,rat), (8,elephant))

// 将结果作为key-value的key

keys / values

val rdd1 = sc.parallelize(List("dog", "tiger", "lion", "cat", "panther", "eagle"), 2)
val rdd2 = rdd1.map(x => (x.length, x))
rdd2.keys.collect
rdd2.values.collect

Array[Int] = Array(3, 5, 4, 3, 7, 5) // 获得key

Array[String] = Array(dog, tiger, lion, cat, panther, eagle) // 获得value

collectAsMap

val rdd = sc.parallelize(List(("a", 1), ("b", 2)))
rdd.collectAsMap

scala.collection.Map[String,Int] = Map(b -> 2, a -> 1)

repartition, coalesce, partitionBy

重新分区

val rdd1 = sc.parallelize(1 to 10, 3)
val rdd2 = rdd1.coalesce(2, false)
rdd2.partitions.length

checkpoint

sc.setCheckpointDir("hdfs://cdhnocms01:8020/userdata/cp")
val rdd = sc.textFile("hdfs://cdhnocms01:8020/userdata/wc.txt").flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_)
rdd.checkpoint
rdd.isCheckpointed
rdd.count
rdd.isCheckpointed
rdd.getCheckpointFile

你可能感兴趣的:(学习)

AI 大模型重塑软件开发流程万花丛中一抹绿人工智能
一、AI大模型的定义与发展历史AI大模型是基于海量数据训练的深度学习模型，具备强大的自然语言理解、逻辑推理和知识生成能力。在软件开发领域，以GPT-4、CodeLlama、GitHubCopilotX为代表的大模型，能理解代码语法、语义及业务逻辑，实现代码生成、漏洞检测等复杂任务。其发展可追溯至2017年，谷歌提出Transformer架构，为大模型奠定了核心基础。2018年，GPT-1问世，参数
随笔：2021-11-21 磐孚菩提树下
回想自己加入的变现学院有一年了，从中自己多多少少也学到了许多的知识，但是也有自己不足的地方。没有做好自己的社群营销裂变，没有组建好自己的团队，也没有自己的社群组织。从中得到了：几个关系不错的朋友，学到了做社群的思路，也扩大了自己的知识的边界。计划从今天开始，把这个社群组织重新拾起来，继续开始自己的学习。
2023-3-21晨间日记 13724-HelenHan88 Helen穗穗
今天在昆明第二天起床：05:50就寝：22:00天气：晴朗心情：平静纪念日：春分春光浪漫时，醉却山河间任务清单昨日完成的任务，最重要的三件事：1、08:50的动车一路从广州抵达昆明站2、美美的逛了一晚上的夜市，悠闲惬意3、没洗澡就睡着了(^^)改进：提前沟通，能去更多的地方？习惯养成：心平气和周目标·完成进度10%名单罗列学习·信息·阅读早读～分享健康·饮食·锻炼徒步忘记打卡了人际·家人·朋友很快
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
鸿蒙开发进阶（HarmonyOS ）短距离通信的BLE蓝牙扫描实践案例你我皆是牛马星人 OpenHarmony 鸿蒙开发 HarmonyOS 1024程序员节华为 harmonyos 鸿蒙 android 前端 ui
鸿蒙NEXT开发实战往期必看文章：一分钟了解”纯血版！鸿蒙HarmonyOSNext应用开发！“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线！（从零基础入门到精通）HarmonyOSNEXT应用开发案例实践总结合（持续更新......）HarmonyOSNEXT应用开发性能优化实践总结（持续更新......）场景描述蓝牙是一种短距的无线通讯技术，可实现固定设备、移动设备之间的数据交换
【静静日记】第391篇：学时间管理，成为人生赢家Day1 静靖的故事
7月5日郑州晴好书《高能要事》一起读！“高能要事”是时间管理的核心！时间管理能力，是不断精进的过程，从今天开始重新学习叶武滨老师时间管理九段，过线上人生！如何如何实现高能？就是每个人每一天都要利用最优质的时间空间和最旺盛的精力，去选择并首先完成对人生有积极影响的事情，如此就可以创造你想要的人生，实现16倍的效能跃升。生活中的三类人，你中枪了吗？第一类，忙死。忙死的人，白天过不好，晚上睡不好，生活一
计算机专业大数据毕业设计-基于 Spark 的音乐数据分析项目(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿八哥数据可视化计算机毕设 spark 大数据课程设计 spark
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
我的暑假见闻分享记甯甯的花儿
同学们：两个月的暑假，说快不快，说慢也不慢，这两个月的时间里，你们的收获有哪些呢？我先来跟大家说一说，我的暑假见闻吧！众所周知，在期末考试前两天，我被学校临危受命，去参加县里的新课标考试，学校在两百多位教师中，派出语文数学老师各3人，英语一人，一共是七个人参加考试。大家都知道，为了让我们全心备考，我是连监考改卷都没参加，你们放假了，我依然还要来学校学习，最艰难的时候，背了忘忘了背，精神压力特别大，
2019.6.8 crescent_新月
鲇鱼效应充分体现了竞争的重要性。竞争对于人的发展和社会的进步都有促进作用。它给我们以直接现实的追求目标，赋予我们压力和动力，能最大限度地激发我们的潜能，提高我们的学习和工作效率，使我们在竞争、比较中客观地评价自己，发现自己的局限性，提高自己的水平。
DAY4精时力学习日志-【体力】冥想让你更健康更年轻波斯菊
【精时力学习日志】本训练营：2021年100天精时力营·除法今日主题：1-4【体力】冥想让你更健康更年轻学习日期：2021年12月9日1、[我记]我学(客观)+我思(主观)+正反栗子+行动：1.1睡眠限制疗法&睡眠时间计划法1.1.1[我记]睡眠限制疗法的关键点在于不困就不上床睡觉，睡眠时间计划法的关键点在于推迟就寝时间以提升睡眠质量。1.1.2[我思]检视：这个知识点和我之前的认知是一致的吗？回
Shell 脚本编程全面学习指南
前言Shell脚本编程是Linux和Unix系统管理、自动化任务的核心工具之一。通过Shell脚本，你可以自动化重复性操作、简化复杂流程、提高系统管理效率，甚至构建完整的自动化运维工具。本文将带你从基础到进阶，全面学习Shell脚本编程，涵盖语法、结构、调试、最佳实践等内容。一、Shell简介与环境搭建1.1什么是Shell？Shell是命令行解释器，是用户与操作系统内核之间的桥梁。它接收用户输入
Protein FID：AI蛋白质结构生成模型评估新指标
一、引言：蛋白质生成模型面临的评估挑战近年来，AI驱动的蛋白质结构生成模型取得了令人瞩目的进展，但如何有效评估这些模型的质量却一直是一个悬而未决的问题。虽然实验验证仍然是金标准，但计算机模拟评估对于快速开发和比较机器学习模型至关重要。然而，尽管最先进的模型在当前评估指标上表现卓越，但它们在实际设计应用中的成功率仍然相对有限。例如，有研究报告显示生成结构的实验成功率仅为3%，而计算机模拟评分却远高于
日精进第140天妈咪宝贝贵族天使莹莹
敬爱的李老师，智慧的班主任，亲爱的跃友们：大家好！我是东平纽约纽约王莹莹今天是我的日精进行动第141天，给大家分享我今天的进步，我们互相勉励，携手前行，每天进步一点点，距离成功便1.比学习:长大成人，绝不是不要依赖他人，一个人活下去，所谓的自立就是同他人，同随着岁月变得不同以往的他人构建起让自己心情舒畅的人际关系。2、比改变:去引导，去争取，去改变。3、比付出:别让自己永远陷入被动的等待，等待他人
【中艺平台】唐浩铭【全球艺术家编码6633】作品雅赏（20201229）大师之道
现为中学生的唐浩铭，从小具有很强的绘画天赋。他对色彩和线条有着异于常人的敏感，对大千世界专注于物象的特征与细节。他从小生活在南国的深圳，城市的环境，动物园的各种鸟兽鱼虫草木都是他描绘的对象。丰富的想象力是他创作的原动力。唐浩铭在观察到自然物的原形时，往往将自己的童真心灵相通，营造一个新的，抽象艺术图形，一个令人新喜的画面。在经过多年的专业学习后，培养起他对绘画的浓厚兴趣，绘画技巧有了很大的提升。他
英雄所见略同石头在海上
今天有幸结识行业里最顶尖的一些人物，深表荣幸。被一群优秀的人包围的感觉真好。不断学习，精进，一直是我前行的动力。正所谓——物以类聚，人以群分。能够简单明了地阐述观点，推进项目，达成共识，共襄盛举。在他们身上，我能不断地吸收到更多的养分。相由心生，气韵非凡。有这样的Leader，实属三生有幸。长风破浪会有时，直挂云帆济沧海。
《翻转课堂与微课程教学法》学习心得 4组11号孙娜 4组11号孙娜
读完《翻转课堂与微课程教学法》这本书让我对为何要进行翻转课堂，以及如何进行有了一些了解，教学观念和思想有了一种新的认识。对翻转课堂和微课程早有耳闻，也或多或少地在网络上进行过一些查阅，但都是一些零碎的、浅尝辄止的了解，现在静下心来读这本系统的著作，使我对翻转课堂和微课程有了更清晰的认识。这本书共分为上、下两部分，上篇主要是翻转课堂的相关理论和目前翻转课堂进行的一些案例，后半部主要介绍如何实施翻转课
在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
ZooKeeper学习专栏（三）：ACL权限控制与Zab协议核心原理
文章目录前言一、ACL访问控制列表二、原子广播协议（Zab协议）总结前言在分布式系统中，安全访问控制和一致性保证是两大核心需求。本文将深入探讨Zookeeper的ACL权限控制机制和Zab协议的核心原理，帮助读者理解Zookeeper如何保障数据安全性和系统一致性。一、ACL访问控制列表ACL(AccessControlLists)是Zookeeper保护ZNode数据安全的关键机制，它定义了哪些
【学习分享】日精进打卡0042天～静静的教育成长路静静的教育成长路
来源：好友时长：60分钟“纸上得来终觉浅，绝知此事要躬行”。记得之前分享过这么一句话：任何知识都要转化为一种解决问题的工具，今天，翻看好友的文章，深受启发。这篇文章说的是学生错题本的整理与使用，学生如果合理运用的话，一定能对学生的学习起到很大的帮助作用。这个对于不同年级的学生要求是不一样的。特别适用于高年级或自律的学生。低年级同学可以在家长的指导下使用，也是有好处的。错题本是学生的宝贵财富，孩子们
nextjs学习笔记 ainuo5213 web前端框架学习 next react react服务端渲染 next入门
由于本人最近在学习jocky老师的React16.8+Next.js+Koa2开发Github全栈项目关于react的服务端重构项目，然后跟着老师的视频做笔记，记录下自己的所学知识。目录结构pages(必需)：pages目录是nextjs中最终要的一个目录，这个目录的每一个文件都会对应到每一个页面，可以根据地址栏的路由进行跳转。若pages下的js文件在一个目录下，那么nextjs默认会将这个
学习黄爱华老师有感 1e0826452ddb
黄爱华老师“小学数学精英教师四阶课程培养秋季课程在成都举办”，作为四川人的我非常荣幸能来参加。张文质老师的“学生在前，老师在后”，“教学从学生的身体出发，生活出发；”黄爱华老师的“大问题，大空间，大格局”大道至简的道理引发我的沉思和共鸣！黄老师行云流水的教学背后是他对教育的情怀与追求，是对数学的敏锐，是不懈的努力。反观自己的教育教学工作，需要努力的太多，通过学习也有深深感触。希望自己以后从基础做起
理解的证据---追求理解的教学设计9 卌行
达尔文，知道得少，但懂（理解）得多。这真是一句很有意思的话。首先，需要理解“理解得多”是什么意思？书中说我们经常将理解表述为“深入”的或“有深度的”，使之区别于浅层次的认知目标---知道。学习者必须在表面下挖掘，揭示不易发觉的核心观点。所有这些内涵强调的都是要透过表层，挖掘隐藏在内部的精华。我们无法通过灌输概念使其被理解；我们必须揭示它们的价值，事实上，这些概念正是探究和讨论的结果。从这段话的描述
预售工作一周小结小西FineYoga梵音瑜伽
12-13号两天的培训，我清晰了解了梵音的整个发展历程；更清晰预售工作性质以及如何更好的做好预售工作；信息量之大，跨度广，我吸收并不多，希望多跟几次教授的培训，会有不一样的启发！教授是个非常有魅力的天生演讲者，风趣幽默，肢体语言表情丰富，特别有感染力。有着独到的眼光和超强的学习能力，他会从各行各业中取其精华去其糟粕，从每一期预售中不停的去总结，分析，判断，不停优化预售方案14号开始由李白店长带领我
什么是Java？想学习却不知道从哪开始？不熬夜不是好程序员
谈起Java，相信有很多小伙伴们也跟我刚开始一样，对他的了解只有难，学成之后工资高，从入门学到入土，但当你真正开始系统的学习之后才发现其实哪些程序猿们也不过尔尔（刚学习完刚入职那种。。。）什么是Java?Java是一门编程语言，Java是一门掌握了技术就可以拿到高薪的工作岗位。Java这个语言在我国发展的很完善，相当于你掌握了Java技术出来，具备一定的开发经验，既可以在一线城市找到合适的岗位工作
Unreal Engine开发：Unreal Engine基础入门_C++编程基础v1 chenlz2007 游戏开发虚幻 c++java unity 游戏引擎交互 lucene
C++编程基础在开始学习UnrealEngine之前，掌握C++编程基础是非常重要的。C++是一种强大的面向对象编程语言，广泛应用于游戏开发、系统软件开发等领域。本节将介绍C++的基本概念、语法和一些常用的功能，为后续的UnrealEngine开发打下坚实的基础。1.C++简介C++是一种静态类型的、编译式的、通用的、中级到高级的编程语言，它支持多种编程范式，包括面向对象编程、泛型编程和过程化编程
李和我学神百日培养计划学习打卡第14天20210928 玫瑰之梦
今天继续阅读《学习的格局》。今天的小收获:一、有效提升时间观念和学习效率的七个方法1.尽早养成做计划的好习惯。2.用有趣的方式和孩子讨论时间。3.关注点放在时间管理训练上。4.定期整理练习物品归类。5.做好时间规划，利用试、听小工具。6.放手让孩子学习设定目标及优先次序7.学会准确预估时间，制定中长期学习计划。二、克服重度作业拖延症的五大招1.用好生物钟效应，建立有序健康的时间管理观念。2.列出时
名教师罗鹤军写我了蒋坤元
罗鹤军，泰州市小学语文乡村教师培育站主持人，同样热爱学习，认真工作，自觉思考，曾经主持过省级科研课题，有一些教科研经历和心得。兴化城东中心小学副校长。泰州市“阅读导师”、兴化市“名教师”、兴化市“十佳人民满意教师”、兴化市人民政府兼职督学，兴化市小语会副秘书长。名教师罗鹤军写我了，此文发表于《泰州教育》：随风潜入夜，润物细无声。来到苏州半书房认识了几个人，对我的影响很大。蒋坤元老师，亿万富翁，有自
高省是什么平台？加入高省赚钱需要什么条件? 高省APP大九
高省是什么平台高省安全吗？高省app，实现你的赚钱梦想，打拼两年的我为大家详细介绍一下高省到底是什么平台。【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码999999，注册送2皇冠会员，送万元推广大礼包。下面继续跟大家聊聊高省有什么好处？1学习新的赚钱方法。您可以通过下载高省应用程序独立搜索优惠券，也可以通过加入代理商分享和赚钱。用户黏性高，不需要维护
PHP 性能优化全攻略：提升 Web 应用速度的关键来恩1003 PHP 从入门到精通 php 性能优化前端
PHP学习资料PHP学习资料PHP学习资料在Web开发领域，PHP凭借其简单易用、开源免费等特性，成为众多开发者构建网站和应用的首选语言。然而，随着业务的发展和用户量的增加，PHP应用的性能问题逐渐凸显。性能不佳不仅会导致用户体验下降，还可能影响业务的发展。因此，对PHP代码进行性能优化至关重要。本文将深入探讨PHP性能优化的各个方面，包括缓存的使用、代码优化策略以及服务器配置优化等，帮助开发者打
出国的那些事儿詹尼斯317
2017年我出国了，说说出国的那些事吧，刚开始的时候是真的不太适应，无论是生活上还是学习上。一开始住进寄宿家庭，是一对70岁的马来西亚老夫妇。他们会要求洗澡的时间不超过8分钟，因为那边的水费是真的出奇的贵，电费也是贵，刚去的时候是冬天都不能用暖气，最多睡觉前开一张电热毯。因为寄宿家庭一周的费用是$280，折合人民币是1400元，一个月就要5600元，还只是一个房间而已，所以考虑了一下我还是打算在外
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str