sdut菜鸟

【SparkSQL笔记】SparkSQL的Dataset操作大全（二）

SparkSQL的Dataset/DataFrame操作大全

简介说明

1. Spark程序中利用SparkSession对象提供的读取相关数据源的方法读取来自不同数据源的结构化数据，转化为Dataset（DataFrame），当然也可以将现成RDDs转化为Dataset（DataFrame），在转化为Dataset（DataFrame）的过程中，需自识别或指定Dataset（DataFrame）的Schema，之后可以直接通过Dataset（DataFrame）的API进行数据分析，当然也可以直接将Dataset（DataFrame）注册为table，直接利用Sparksession提供的sql方法在已注册的表上进行SQL查询，Dataset（DataFrame）在转化为临时视图时需根据实际情况选择是否转化为全局临时表

2. SparkSQL可以以RDD对象，Parquet文件，Json文件，Hive表以及通过JDBC连接到关系型数据库表作为数据源来生成Dataset（DataFrame）对象，进而在该Dataset（DataFrame）对象上通过各种实例操作讲解Dataset（DataFrame）API的使用。本次以JSON文件为数据源。

数据展示：

{"name":"王明","age":15,"sex":"男","institute":"计算机1班","phone":"1"}
{"name":"李红","age":16,"sex":"女","institute":"计算机2班","phone":"2"}
{"name":"刘强","age":18,"sex":"男","institute":"计算机1班","phone":"3"}
{"name":"张三","age":12,"sex":"男","institute":"计算机3班","phone":"4"}
{"name":"李四","age":12,"sex":"男","institute":"计算机2班","phone":"5"}
{"name":"王五","age":11,"sex":"男","institute":"计算机3班","phone":"6"}
{"name":"刘旺","age":17,"sex":"男","institute":"计算机1班","phone":"7"}
{"name":"赵笋","age":18,"sex":"女","institute":"计算机2班","phone":"8"}
{"name":"刘晓红","age":20,"sex":"女","institute":"计算机1班","phone":"9"}
{"name":"王志利","age":15,"sex":"男","institute":"计算机2班","phone":"10"}
{"name":"王刚","age":19,"sex":"男","institute":"计算机2班","phone":"11"}
{"name":"李培","age":12,"sex":"男","institute":"计算机1班","phone":"12"}
{"name":"李狗蛋","age":15,"sex":"男","institute":"计算机3班","phone":"13"}
{"name":"王麻子","age":11,"sex":"男","institute":"计算机3班","phone":"14"}
{"name":"孙艳红","age":12,"sex":"女","institute":"计算机1班","phone":"15"}
{"name":"孙晓留","age":15,"sex":"男","institute":"计算机2班","phone":"16"}
{"name":"吴刚","age":16,"sex":"男","institute":"计算机1班","phone":"17"}
{"name":"郑成","age":12,"sex":"男","institute":"计算机1班","phone":"18"}
{"name":"诸葛燕","age":16,"sex":"女","institute":"计算机3班","phone":"19"}
{"name":"逍遥子","age":17,"sex":"男","institute":"计算机1班","phone":"20"}

1. Dataset（DataFrame）的actions操作（行动）

RDD的操作分为两大类，转化操作和行动操作，其中转化操作实际上是逻辑分析过程的实现，但是由于惰性计算的原因，只有当行动操作出现时，才会触发真正的计算

同样，Dataset（DataFrame）提供的API也是采用此种分类方法，有实现逻辑运算的转化操作，如select，where，orderBy，groupBy等负责指定结果列，过滤，排序，分组的方法，和负责触发计算，回收结果的行动操作。需要注意的是，无论直接使用sql()方法查询Dataset注册后的表还是通过调用提供转化操作API组合出来的类似的sql表达都会交由Spark SQL的解析，优化引擎——Catalyst进行解析优化，这样的底层自带优化功能的设计给了SparkSQL模块使用者极大地便利，即使我们我们的操作或者sql不高效也没事。

1.1 show：展示数据

以表格的形式在输出中展示DS（Dataset）中的数据，类似于select * from table_name

show的方法有五种调用方式：

他们的区别就在于参数不同。

numRows:即要展示的行数，默认20行

truncate:取值为boolean类型的时候表示一个字段是否最多展示20个字符，默认为true，是int类型就是指定展示的字符数

实例：

（1）：展示前五条数据

public static void main(String[] args) {
    SparkSession sparkSession = SparkSession.builder().master("local").appName("SparkSQLDemo1").config("spark.testing.memory", 471859200).getOrCreate();
    // 读取文件转成JavaRDD
    Dataset<Row> studentDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student2.json");
    studentDataset.show(5);

    // 关闭saprkSesison 这里的close和stop是一个样 2.1.X开始用close 2.0.X使用的stop
    sparkSession.close();
}

（2）设置展示四个字符

studentDataset.show(5,4);

结果只展示了一个字符。。。看了源码是因为如果少于五个只展示一个。。。

最终：

1.2 collect：获取所有的数据到数组

如果使用的是Java，文档推荐使用collectAsList

public static void main(String[] args) {
    SparkSession sparkSession = SparkSession.builder().master("local").appName("SparkSQLDemo1").config("spark.testing.memory", 471859200).getOrCreate();
    // 读取文件转成JavaRDD
    Dataset<Row> studentDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student2.json");
    List<Row> collect = studentDataset.collectAsList();
    for (Row row : collect) {
        System.out.println(row);
    }
    // 关闭saprkSesison 这里的close和stop是一个样 2.1.X开始用close 2.0.X使用的stop
    sparkSession.close();
}

日志显示：

注意：

collect()和collectAsList()方法，用来从DataFrame中获取整个数据集。

如果当你的程序将原始的DataFrame（数据量很大）中的数据进行层层处理筛选，得到了包含着最终结果的DataFrame（数据量小）并且希望从DataFrame以Array、List取出结果并进行下一步处理时，可以使用它。

因为这两个方法是将集群中的目标变量的所有数据取回到一个结点当中，所以当你的单台结点的内存不足以放下DataFrame中包含的数据时就会出错。因此，collec()、collectAsList()不适用于特别大规模的数据集。

1.3 describe(cols: String*)：获取指定字段的统计信息

这个方法可以动态的传入一个或者多个String类型的字段名，结果仍然为DS对象，用于统计数值类型字段的统计值

使用实例：

public static void main(String[] args) {
    SparkSession sparkSession = SparkSession.builder().master("local").appName("SparkSQLDemo1").config("spark.testing.memory", 471859200).getOrCreate();
    // 读取文件转成JavaRDD
    Dataset<Row> studentDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student2.json");

    studentDataset.describe("age","phone").show();
    // 关闭saprkSesison 这里的close和stop是一个样 2.1.X开始用close 2.0.X使用的stop
    sparkSession.close();

}

日志显示：

使用describe（）函数，会得到以下信息：

Count：记录条数
Mean：平均值
Stddev：样本标准差
Min：最小值
Max：最大值

进而掌握大规模结构化数据集的某字段的统计信息

1.4 first，head，take，takeAsList：获取若干行记录

first，head，take，takeAsList用来获取部门记录，与collect，collectAsList获取全部记录相对应

first：获取第一行记录
head:获取第一行记录
head（int n）获取前n行记录，返回的是Array
take(int n)：获取前n行记录，返回的是Array 
takeAsList(int n)：获取前n行数据，并以List的形式展现

以Row或者Array[Row]的形式返回一行或多行数据。first和head功能相同。

take和takeAsList方法会将获得到的数据返回到Driver端，所以在使用这两个方法时需要注意数据量，以免Driver发生OutOfMemoryError。

使用实例：

// first
Row first = studentDataset.first();
// head
Row head = studentDataset.head();
// head(2)
Row[] heads = studentDataset.head(2);
// take(2)
Row[] take = studentDataset.take(2);
// takeAsList(2)
List<Row> rows = studentDataset.takeAsList(2);

可以这么写，但是不能运行，在java中没有Row[]这种Array，可以使用List

2. Dataset（DataFrame）的transformations操作（转化）

Dataset提供用以形成SQL表达的转化操作，如select()、where()、orderBy()、groupBy()、join()等方法。以下方法皆为返回DataFrame对象的方法，所以可以连续调用。

2.1 where 条件相关

where方法根据参数类型及数目不同进行了同名函数重载，可以看到第2个where(String conditionExpr)输入更像一种传统SQL的where子句的条件整体描述，而where(Column condition)，该方法的输入则是要把where子句的对于每一个column的要求进行分别描述，且该种表述等效于filter()实现的筛选，但从最终效果上来讲，这两种方法并没有什么不同，只是解析语句时，第2种方法，需要对整个where子句进行解析，从而得到对于每一个column的要求。

（1）where (String conditionExpr)：sql语言中where关键字后的条件；where(Column condition)：字段的条件描述（主要使用Column的API）

传入筛选条件表达式，可以用and 和 or ，得到Dataset类型的返回结果。

public static void main(String[] args) {
    SparkSession sparkSession = SparkSession.builder().master("local").appName("SparkSQLDemo1").config("spark.testing.memory", 471859200).getOrCreate();
    // 读取文件转成JavaRDD
    Dataset<Row> studentDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student2.json");
    // where(String conditionExpr)
    Dataset<Row> wheredataset = studentDataset.where("age > 13 and sex = '男'");
    wheredataset.show();

    // where(Column condition)
    Dataset<Row> whereDataset2 = studentDataset.where(studentDataset.col("age").gt(13).and(studentDataset.col("sex").equalTo("男")));
    whereDataset2.show();
    // 关闭saprkSesison 这里的close和stop是一个样 2.1.X开始用close 2.0.X使用的stop
    sparkSession.close();
}

日志：

结果是一样的。

（2）filter:根据字段进行筛选

filter()同样具有和where类似的两个同名重载函数filter(String conditionExpr)、filter(Column condition)，其间区分差不多where()情况相同，即其两者效果等效，仅为了满足程序员的不同开发习惯。

这里面还多了两个参数为过滤函数的方法，这个和RDD的filter是一样的，过滤函数返回true则保留，false舍去数据。

使用实例：

public static void main(String[] args) {
    SparkSession sparkSession = SparkSession.builder().master("local").appName("SparkSQLDemo1").config("spark.testing.memory", 471859200).getOrCreate();
    // 读取文件转成JavaRDD
    Dataset<Row> studentDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student2.json");
    // filter(String conditionExpr)
    studentDataset.filter("age > 13 and sex = '男'").show();
    // filter(Column condition)
    studentDataset.filter(studentDataset.col("age").gt(13).and(studentDataset.col("sex").equalTo("男"))).show();
    // filter(new FilterFunction(){...})
    studentDataset.filter(new FilterFunction<Row>() {
        @Override
        public boolean call(Row value) throws Exception {
            return (long)value.getAs("age") > 13 && value.getAs("sex").equals("男");
        }
    }).show();
    // 关闭saprkSesison 这里的close和stop是一个样 2.1.X开始用close 2.0.X使用的stop
    sparkSession.close();
}

日志：

结果也是一样的。

2.2 查询指定列

select：获取指定字段值

根据传入的String类型参数和Column类型参数可以适应于多种情况

使用实例：

public static void main(String[] args) {
    SparkSession sparkSession = SparkSession.builder().master("local").appName("SparkSQLDemo1").config("spark.testing.memory", 471859200).getOrCreate();
    // 读取文件转成JavaRDD
    Dataset<Row> studentDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student2.json");
    
    // select(String col, String... cols)
    studentDataset.select("name","age","sex").show(2);
    // select(String col, scala.collection.Seq cols)
    ArrayStack<String> arraySeq = new ArrayStack<>();
    arraySeq.push("sex");
    arraySeq.push("age");
    studentDataset.select("name",arraySeq).show(2);

    // select(Column... cols) colum可以对字段做一些处理，例如给年龄+5 并取别名age+5
    studentDataset.select(studentDataset.apply("name"),studentDataset.col("age").plus(5).as("age+5"),studentDataset.col("sex")).show(2);
    // select(scala.collection.Seq cols)
    ArrayStack<Column> arraySeqClumn = new ArrayStack<>();
    arraySeqClumn.push(studentDataset.col("sex"));
    arraySeqClumn.push(studentDataset.col("age"));
    arraySeqClumn.push(studentDataset.col("name"));
    studentDataset.select(arraySeqClumn).show(2);
    
    
    // 关闭saprkSesison 这里的close和stop是一个样 2.1.X开始用close 2.0.X使用的stop
    sparkSession.close();
}

日志：

selectExp：可以对指定字段进行特殊处理

两种方式供开发调用，看个人习惯。

studentDataset.selectExpr("name","age","age+1 as otherAge","round(age)","sex as性别").show(2);

age全部加1了
col和apply ：获取字段或者某一列

这两个方法的参数类型，个数以及返回值类型均相同，返回的都是Column类型
drop：去除指定字段，保留其他字段

drop的重载方法也与很多，但是都大同小异只是参数的不同方式的体现，喜欢哪一个就用那一个吧。

使用实例：

studentDataset.drop("age").show(2);

日志截图：

没有了age列

2.3 Column的应用

Column有很多方法，各种各样的方法，也是操作查询等必要会的，未完待续！！！

2.4 limit操作

limit方法获取指定Dataset的前n行记录，得到一个新的Dataset对象。

和take与head不同的是，limit方法不是Action操作，因为take，head均获得的均为Array（数组），而limit返回的是一个新的转化生成的Dataset对象

studentDataset.limit(10).show();

日志截图：

2.5 排序操作：order by 和 sort

order by 和 sort 都是按照指定字段排序，默认为升序。并且使用方法相同，支持多字段排序。

使用实例：

studentDataset.sort(studentDataset.col("age").desc(),studentDataset.apply("name").desc()).show(5);
studentDataset.orderBy(studentDataset.col("age").desc(),studentDataset.apply("name").desc()).show(5);

日志：

sort还有个sortWithinPartitions，这个和sort方法功能类似，区别在于sortWithinPartitions方法返回的是排好序的每一个分区的Dataset对象

2.6 group by 操作

groupBy的方法如下：

groupBy：根据字段进行分组操作

groupBy方法有四种调用方式，只是对参数类型和个数的不同应用。

使用实例：

// String类型
RelationalGroupedDataset age = studentDataset.groupBy("age","name");
// Column类型
RelationalGroupedDataset age1 = studentDataset.groupBy(studentDataset.apply("age"),studentDataset.apply("name"));

RelationalGroupedDataset对象

groupBy（）方法得到的是RelationalGroupedDataset类型的对象，在RelationalGroupedDataset的API中提供了groupBy之后的操作，比如：
- max(String…colNames)方法，获取分组中指定字段或者所有的数字类型字段的最大值，只能作用于数字类型字段。
- min(String…colNames)方法，获取分组中指定字段或者所有的数字类型的最小值，只能作用于数字类型字段。
- mean(String…colNames)方法，获取分组中指定字段或者所有的数字类型的平均值，只能作用于数字类型字段。
- sum（String…colNames）方法，获取分组中指定字段或者所有的数字类型的和值，只能作用于数字类型字段。
- count()方法，获取分组中元素的个数
使用实例：
```
// 按照年龄分组 显示不同年龄组内的个数
studentDataset.groupBy("age").count().show();
// 按照班级分组，找到班级内最大的年龄
studentDataset.groupBy("institute").max("age").show();
// 按照班级分组，找到班级内的平均年龄
studentDataset.groupBy("institute").mean("age").show();
```
日志截图：

2.7 distinct，dropDuplicates 去重操作

distinct：

dropDuplicates：

distinct()返回一个包含重复记录的Dataset，和不带参数的dropDuplicates()方法不传入指定字段时的结果相同。而带有参数的dropDuplicates(...)是可以指定字段（可以多个字段组合）去重。

使用实例：

// 对查询的班级和性别结果去重 distinct
studentDataset.select("institute","sex").distinct().show();
// 对查询的班级和性别结果去重 dropuicates
studentDataset.select("institute","sex").dropDuplicates().show();
// 对查询的班级和性别结果指定字段去重 dropuicates
studentDataset.select("sex").dropDuplicates(new String[]{"sex"}).show();

日志：

2.8 聚合操作

聚合操作是指agg方法：

聚合操作调用的是agg方法，该方法输入的是对于聚合操作的表达（aggExpr）,可同时对多个列进行聚合操作（aggExprs）,一般与groupBy方法配合使用。

小提示：在Scala中可以直接使用max("XX")等对字段做操作，但是在Java中同样可以这样操作，只不过需要借助工具类functions，这样就可以实现了。

使用实例：

studentDataset.agg(functions.max(studentDataset.apply("age")),functions.mean(studentDataset.apply("age"))).show();

日志截图：

用这种方式就可以实现对一个字段的多种操作，如果使用Map的形式，只能对一个字段操作一次。

2.9 union 合并操作

union方法对两个字段一致的Dataset进行合并，返回是组合生成的新的Dataset。类似于Sql的UNION操作。

在源码中，union和unionAll是相同的，没有区分。这里还有个unionByName这个方法，其实我们主要用的是这个，因为union在合并的时候只按照列合并，不会考虑两个表的列是否相对应，而unionByName会根据列名一一对应的合并。

注意，unionByName是2.3.0才开始加入的，我是2.1.1 所以没有实例了。给个截图吧。

使用实例：

studentDataset.select("name","age","institute").limit(3).union(studentDataset.select("name","institute","age").limit(3)).show();

日志截图：

2.10 join操作！！！重点

重点来了。在SQL语言中用得很多的就是join操作，DataFrame中同样也提供了join的功能。

接下来隆重介绍join方法。在DataFrame中提供了以下六个重载的join方法：

这里我们添加一个addr.json文件：

{"name":"王明","addr":"阳光小区7号"}
{"name":"李红","addr":"阳光小区2号"}
{"name":"刘强","addr":"阳光小区1号"}
{"name":"张三","addr":"阳光小区5号"}
{"name":"李四","addr":"阳光小区4号"}
{"name":"王五","addr":"阳光小区3号"}
{"name":"刘旺","addr":"阳光小区2号"}
{"name":"赵笋","addr":"阳光小区1号"}
{"name":"刘晓红","addr":"阳光小区2号"}

6个join()函数，发现其主要区别在于输入参数的个数与类型不同。其中1，2，4，6 join()方法皆为内连接（inner join），因为这4个join()方法并没有调节join类型的joinType的参数输入，因此是默认的内连接，而3，5方法皆有String joinType该参数，因此可从inner、cross、outer、ull、full_outer、left、left_outer、right、right_outer、left_semi，left_anti选择任何一种连接类型进行join操作。

观察4，6 join()函数，这两者主要区别在于输入参数分别为scala.collection.Seq usingColumns和String usingColumn，前者是表示多个字段的String的Seq（序列），后者是表示单个字段的String类型，即当我们在两个Dataset对象进行连接操作时，不仅可以基于一个字段，也可以用多个字段进行匹配连接。

使用实例：
```
// 读取地址数据
Dataset<Row> addrDataset = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\addr.json");

// join(Dataset right, String usingColumn)
studentDataset.join(addrDataset,"name").show();
// join(Dataset right, scala.collection.Seq usingColumns)  
ArrayStack<String> arrayStack = new ArrayStack<>();
arrayStack.push("name");
studentDataset.join(addrDataset,arrayStack).show();
```
日志截图：

都是内连接（inner join）
观察2，3 join方法，可看到出这二个输入参数不再是象征着字段的scala.collection.Seq usingColumns和String usingColumn，而是Column joinExprs这种表示两个参与join运算的连接字段的表述（expression）。

使用实例：
```
// join(Dataset right, Column joinExprs)
Column joinExprs = studentDataset.apply("name").equalTo(addrDataset.apply("name"));
studentDataset.join(addrDataset,joinExprs).show();
```
日志截图：

这里可以看到，如果使用String类型的参数，关键字段只出现一次，使用Column类型，使用到的关键字是不会有任何处理的，都会显示出来。

观察3，5join方法，可以看到他们的参数都有一个String joinType字符串，这个就是需要指定的连接方式：

Type of join to perform. Default `inner`. Must be one of:          
`inner`, `cross`, `outer`, `full`, `full_outer`, `left`, `left_outer`,
`right`, `right_outer`, `left_semi`, `left_anti`.

默认是inner内连接

使用实例：

Column joinExprs = studentDataset.apply("name").equalTo(addrDataset.apply("name"));
studentDataset.join(addrDataset,joinExprs,"left").show();

日志截图：

2.11 获取指定字段的统计信息

暂无

2.12 获取两个Dataset中共有的记录

获取两个Dataset中共有的记录方法：

intersect方法可以计算出两个Dataset中相同的记录，返回值也为Dataset

使用实例：

studentDataset.intersect(studentDataset.limit(3)).show();

日志截图：

2.13 获取一个Dataset中有另外一个Dataset中没有的记录

获取一个Dataset中有另一个Dataset中没有的记录，方法如下：

使用实例：

studentDataset.except(studentDataset.limit(15)).show();

日志截图：

去除了15个记录

2.14 操作字段名

withColumn可以在当前Dataset中新增一列，该列可来源于本身Dataset对象，不可来自其他非自己的Dataset对象

withColumnRenamed可以重命名dataset指定的字段名，如果指定的字段名不存在，不作任何操作。

使用实例：

// 添加一列age+2 年龄加2 修改name字段名为myname
studentDataset.withColumn("age+2",studentDataset.col("age").plus(2)).withColumnRenamed("name","Myname").show(5);

日志截图：

2.15 处理空值列

使用带有空值的数据：

{"name":"张三","age":12,"sex":"男","institute":"计算机3班","phone":"4"}
{"name":"李四","age":12,"sex":null,"institute":"计算机2班","phone":"5"}
{"name":"王五","age":null,"sex":"男","institute":"计算机3班","phone":null}
{"name":null,"age":null,"sex":null,"institute":null,"phone":null}
{"name":"赵笋","age":18,"sex":"女","institute":"计算机2班","phone":"8"}
{"name":"刘晓红","age":20,"sex":"女","institute":"计算机1班","phone":"9"}
{"name":"王志利","age":15,"sex":"男","institute":"计算机2班","phone":null}

使用na方法对具有空值列的行数据进行处理，例如删除缺失某一列值的行或用指定值（缺失值）替换空值列的值，方法如下：

需要注意的是，在Dataset对象上使用na方法后返回的是对应的DataFrameNaFunctions对象，进而调用对应的drop，fill方法来处理指定列为空值的行。

drop：删除指定列为空值的行

无参数的drop()，只要行数据有空值列（一个或者多个空值列）就进行删除，而其他重载方法，可通过将指定列的列名组成的数组传入drop方法。

在注释中有这样一句话：

If `how` is "any", then drop rows containing any null or NaN values in the specified columns.*
If `how` is "all", then drop rows only if every specified column is null or NaN for that row.

也就是String how参数的用处，在没有这个参数的方法中默认用的是any，指定了all则必须指定的字段列都为空才会删除这条记录。

使用实例：

Dataset<Row> studentDataset3 = sparkSession.read().json("D:\\sparksqlfile\\jsondata\\student3.json");
studentDataset3.show();
DataFrameNaFunctions na = studentDataset3.na();
// 只要有空值就删除 等同于 na.drop("any").show();
na.drop().show();
// 只有行数据全部都为空 才会删除
na.drop("all").show();
// age和phone有一个为空就删除 等同于na.drop("any",new String[]{"age","phone"}).show();
na.drop(new String[]{"age","phone"}).show();
// age和phone都为空才删除
na.drop("all",new String[]{"age","phone"}).show();

日志截图：

fill：使用指定的值替换指定空值列的值

fill太难了。。。11个方法。。。但是都是大同小异只是不同类型，这里就挑几个说说吧

通过传入指定空值列列名以及该空值列替换值传入fill方法来替换指定空值列的值。

使用实例：

// 对于不同的字段类型会有默认的，只有设置好对应的默认值才会修改为模默认值
na.fill("我是空值").show();
// int的空值会被替换为1234
na.fill(1234).show();
// name和phone的空值会被替换为  空值 如果想替换其他类型 需要找其他类型的方法
na.fill("空值", new String[]{"name","phone"}).show();
// 在map中指定空列的替换值 类型要对应好 int类型就要给个int的默认值
HashMap<String,Object> map = new HashMap<>();
map.put("age",123);
map.put("name","我是姓名");
na.fill(map).show();

你可能感兴趣的:(Spark,SparkSQL,spark,大数据)

【软考速通笔记】系统架构设计师⑱——大数据架构设计理论与实践小康师兄系统架构设计师笔记系统架构大数据 Lanbda Kappa 数据湖批处理
文章目录一、前言二、传统数据库遇到的问题2.1问题的根源2.2传统解决方法三、大数据基础3.1大数据处理技术3.2大数据利用过程3.3大数据处理系统面临的挑战3.4大数据具有的属性和特征四、Lanbda架构4.1批处理层4.2加速层4.3服务层五、Kappa架构5.1实时层5.2服务层六、Lambda和Kappa对比七、其他一、前言笔记目录大纲请查阅：【软考速通笔记】系统架构设计师——导读关注【小
深入解析Hadoop中的推测执行：原理、算法与策略码字的字节 hadoop布道师 hadoop 算法推测执行
Hadoop推测执行概述在分布式计算环境中，任务执行速度的不均衡是一个普遍存在的挑战。Hadoop作为主流的大数据处理框架，通过引入推测执行（SpeculativeExecution）机制有效缓解了这一问题。该技术本质上是一种乐观的容错策略，当系统检测到某些任务执行明显落后于预期进度时，会自动在其它计算节点上启动相同任务的冗余副本，最终选择最先完成的任务结果作为输出。核心设计动机推测执行的诞生源于
阿里云态势感知和安骑士有什么区别？阿腾云
阿里云态势感知和安骑士均是阿里云云盾安全产品，态势感知属于安全管理类的产品，安骑士数据服务器安全类产品，阿里云百科网来详细说下阿里云态势感知和安骑士之间的区别：态势感知和安骑士的区别简单来说，安骑士是检测云服务器漏洞的，态势感知提供安全类的大数据分析服务。态势感知：安全大数据分析平台，通过机器学习和结合全网威胁情报，发现传统防御软件无法覆盖的网络威胁，溯源攻击手段、并且提供可行动的解决方案。安骑士
大模型软件的多租户架构设计 AI天才研究院 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型软件的多租户架构设计关键词：大模型软件、多租户架构、设计、性能优化、安全性摘要：随着大数据和人工智能技术的迅猛发展，大模型软件在各个领域得到了广泛应用。然而，如何在大模型软件中实现高效的多租户架构设计，成为当前技术领域的一个关键挑战。本文将深入探讨大模型软件的多租户架构设计，包括其背景、核心概念、算法原理、系统架构、项目实战以及最佳实践等，旨在为开发者提供一套系统化、全面化的设计指南。设计过
【Spark征服之路-3.7-Spark-SQL核心编程（六）】 qq_46394486 spark sql ajax
数据加载与保存：通用方式：SparkSQL提供了通用的保存数据和数据加载的方式。这里的通用指的是使用相同的API，根据不同的参数读取和保存不同格式的数据，SparkSQL默认读取和保存的文件格式为parquet加载数据：spark.read.load是加载数据的通用方法。如果读取不同格式的数据，可以对不同的数据格式进行设定。spark.read.format("…")[.option("…")].
【原创文集】如果时光会说话 7a82ff5fbe9b
大数据工程学院21计科本2王玉艳1528662159515286621595.如果时光会说话，它会不会知道未来发生的事情然后跟人类讲呢？从2006年的非典到2019年的新冠疫情，发生了太多太多的让人类遭遇苦难的病毒。如果时光会说话，它是否会将即将发生的事与我们一说，让人类避免所遭遇的一切呢？如果时光会说话，不知道它看见这些在它身体里所发生的一切，它会不会感到悲哀呢？如果时光会说话，我会问问它新冠疫
深入解析 Spark：关键问题与答案汇总 ※尘 sql hive spark
在大数据处理领域，Spark凭借其高效的计算能力和丰富的功能，成为了众多开发者和企业的首选框架。然而，在使用Spark的过程中，我们会遇到各种各样的问题，从性能优化到算子使用等。本文将围绕Spark的一些核心问题进行详细解答，帮助大家更好地理解和运用Spark。Spark性能优化策略Spark性能优化是提升作业执行效率的关键，主要可以从以下几个方面入手：首先，资源配置优化至关重要。合理设置Exec
大数据领域如何用好 Eureka 实现服务治理大数据洞察大数据 eureka 云原生 ai
大数据领域Eureka服务治理实践：架构适配与最佳实践元数据框架标题大数据领域Eureka服务治理实践：架构适配、实现机制与最佳实践关键词Eureka；服务治理；大数据分布式系统；服务发现；负载均衡；故障恢复；云原生适配摘要Eureka作为Netflix开源的AP型服务发现组件，以其高可用性、动态适配性和轻量级特性，成为微服务架构的核心工具。然而，大数据领域的超大规模分布式、高并发数据流动、动态资
Eureka在大数据推荐系统中的服务治理实践大数据洞察 eureka 大数据云原生 ai
Eureka在大数据推荐系统中的服务治理实践：从理论到落地的全面解析元数据框架标题：Eureka在大数据推荐系统中的服务治理实践：从理论到落地的全面解析关键词：Eureka；服务治理；大数据推荐系统；分布式架构；服务发现；高可用性；动态扩展摘要：本文结合Eureka的核心特性与大数据推荐系统的需求，从第一性原理推导、架构设计、实现机制到实际应用，全面解析Eureka在推荐系统中的服务治理实践。通过
Eureka 为大数据领域服务治理带来的新思路大数据洞察大数据AI应用大数据与AI人工智能 eureka 大数据云原生 ai
Eureka为大数据领域服务治理带来的新思路关键词：Eureka，大数据，服务治理，分布式系统，微服务摘要：本文深入探讨了Eureka为大数据领域服务治理带来的新思路。首先介绍了大数据领域服务治理的背景和现状，阐述了Eureka的核心概念与工作原理。接着详细分析了Eureka核心算法原理，结合Python代码进行说明，并给出相关数学模型和公式。通过项目实战案例，展示了Eureka在大数据服务治理中
spark on yarn 不辉放弃 pyspark 大数据开发
SparkonYARN是指将Spark应用程序运行在HadoopYARN集群上，借助YARN的资源管理和调度能力来管理Spark的计算资源。这种模式能充分利用现有Hadoop集群资源，简化集群管理，是企业中常用的Spark部署方式。核心角色•Spark应用：包含Driver进程和Executor进程。Driver负责任务调度、逻辑处理；Executor负责执行具体任务并存储数据。•YARN组件：◦
新能源汽车大数据画像：从零到一实现K-means用户分群新能源汽车研发＆测试入门指南学习笔记新星杯+王者杯汽车大数据 kmeans
基于大数据分析的新能源汽车画像研究全攻略：从原理到实战前言在"软件定义汽车"的时代浪潮下，新能源汽车正经历着从交通工具向智能移动终端的进化。本文将带你深入探索如何通过大数据技术构建精准的用户与产品画像，揭秘车企数字化转型的核心技术。全文涵盖完整的技术链路和实战案例，助你快速掌握这一前沿领域。关键词：新能源汽车；用户画像挖掘；大数据分析；K-means聚类目录一、大数据分析技术基石二、新能源汽车画像
Flink在物联网实时大数据处理中的最佳实践大数据洞察大数据AI应用大数据与AI人工智能 flink 物联网 struts ai
Flink在物联网实时大数据处理中的最佳实践关键词：Flink、物联网、实时大数据处理、最佳实践、数据流摘要：本文围绕Flink在物联网实时大数据处理中的最佳实践展开。首先介绍了相关背景知识，接着深入浅出地解释了Flink、物联网和实时大数据处理的核心概念以及它们之间的关系。然后详细阐述了Flink处理物联网数据的核心算法原理、数学模型和公式。通过实际项目案例，展示了开发环境搭建、代码实现和解读。
信小易官网查询入口：信小易大数据信用检测平台！无忧达人
信小易一个全能型的信用软件，信小易在一几年就上线的大数据信用平台，有着专业的大数据信用行业经验，从个人信用到企业信用，车辆大数据信小易全都有涉足，是一个非常完善的平台。信小易官网查询入口，对于想使用信小易的人来说，第一步我们需要找到信小易的查询入口，然后就可以进行大数据信用的查询服务了，可以查询自己的信用情况，查询结果也是非常准确。信小易查询入口放在文末了，划到文章结尾就可以看到查询入口信小易是一
Spark RDD 之 Partition 博弈史密斯
SparkRDD怎么理解RDD的粗粒度模式？对比细粒度模式SparkRDD的task数量是由什么决定的？一份待处理的原始数据会被按照相应的逻辑(例如jdbc和hdfs的split逻辑)切分成n份，每份数据对应到RDD中的一个Partition，Partition的数量决定了task的数量，影响着程序的并行度支持保存点(checkpoint)虽然RDD可以通过lineage实现faultrecove
【学术会议投稿】Vue.js组件开发实战：从零构建高效可复用组件小周不想卷艾思科蓝学术会议投稿 vue.js
【IEEE出版|会后3-4个月EI检索】第三届云计算、大数据应用与软件工程国际学术会议(CBASE2024）_艾思科蓝_学术一站式服务平台更多学术会议请看：https://ais.cn/u/nuyAF3目录引言一、Vue.js组件开发基础二、构建高效可复用组件三、Vue.js组件的高级特性四、Vue.js的优点与缺点Vue.js的优点Vue.js的缺点引言在现代前端开发中，Vue.js凭借其简洁的
时序数据库的工业级对决：对比 Apache IoTDB 和 InfluxDB 时序数据说时序数据库 apache iotdb 数据库大数据开源
在数字化浪潮中，物联网（IoT）与工业大数据领域蓬勃发展，时序数据呈爆发式增长。时序数据库作为管理这类数据的核心工具，其性能、功能和适应性直接影响到整个系统的运行效率与价值实现。ApacheIoTDB和InfluxDB作为时序数据库领域的佼佼者，被广泛应用于各类场景。深入剖析二者区别，对开发者、企业架构师和数据管理者而言，不仅能为项目选型提供科学依据，还能助力挖掘数据的最大价值。一、诞生背景与社区
时序数据库IoTDB与OpenTSDB的对比分析时序数据说时序数据库 iotdb opentsdb 数据库大数据
在物联网与大数据场景下，时序数据库的选择对于系统性能、数据存储与分析能力至关重要。本文将围绕ApacheIoTDB与OpenTSDB这两款开源时序数据库进行对比分析，从分布式架构、部署易用性、分析与计算能力、性能表现以及产品迭代与维护情况五个关键维度展开，旨在为面临海量设备接入和实时数据分析需求的物联网架构师提供客观的技术选型参考。一、分布式架构‌ApacheIoTDB‌：IoTDB原生支持分布式
女性职业新趋势：揭秘未来高薪热门行业氧惠爱高省
女生在职业选择上拥有广阔的空间，尤其是在当前快速发展的社会背景下，一些行业不仅成为了高薪热门，还提供了多样化的职业路径。以下是一些可能成为女生高薪热门选择的行业：➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。科技与互联网行业人工智能与大数据：随着人工智能和大数据技术的广泛应用，相
深入解析Hadoop中的Region分裂与合并机制码字的字节 hadoop布道师 hadoop 大数据分布式 Region 分裂合并
Hadoop与Region的基本概念Hadoop的分布式架构基础作为大数据处理的核心框架，Hadoop通过分布式存储和计算解决了海量数据的处理难题。其架构核心由HDFS（HadoopDistributedFileSystem）和MapReduce组成，前者负责数据的分布式存储，后者实现分布式计算。在HDFS中，数据被分割成固定大小的块（默认128MB）分散存储在集群节点上，而MapReduce则通
深入解析Hadoop RPC：技术细节与推广应用码字的字节 hadoop布道师 Hadoop RPC
HadoopRPC框架概述在分布式系统的核心架构中，远程过程调用（RPC）机制如同神经网络般连接着各个计算节点。Hadoop作为大数据处理的基石，其自主研发的RPC框架不仅支撑着内部组件的协同运作，更以独特的工程哲学诠释了分布式通信的本质。透明性：隐形的通信桥梁HadoopRPC最显著的特征是其对通信细节的完美封装。当NameNode接收DataNode的心跳检测，或ResourceManager
深入解析Hadoop：大数据处理的基石学习的锅 hadoop 大数据分布式
随着信息技术的快速发展和互联网的普及，数据的产生速度极具增加。面对如此海量的数据，传统的数据处理工具显得力不从心。在这种背景下，诞生了一系列用于处理大数据的框架与工具，而ApacheHadoop便是其中最为知名和应用最广泛的一个。本文将深入解析Hadoop的基本原理、架构及其在大数据处理中的重要性。1.Hadoop的起源与发展Hadoop起源于Google公司的三篇奠基性论文：GoogleFile
大数据技术关键技术组件
大数据技术是一组用于处理、分析和管理大规模数据集的复杂方法和技术。这些数据集的特点是容量大、增长速度快，且结构多样化，包括结构化、半结构化和非结构化数据。传统数据库管理和分析工具在处理此类数据时效率低下或无法胜任，因此需要专门的大数据技术栈来支持高效的数据处理和智能决策。大数据技术的关键组件通常包括：分布式存储系统：HadoopDistributedFileSystem(HDFS)：一个高度可扩展
大数据领域HDFS的集群资源管理优化大数据洞察大数据与AI人工智能大数据AI应用大数据 hdfs hadoop ai
大数据领域HDFS的集群资源管理优化关键词：HDFS；集群资源管理；存储优化；性能调优；副本策略；负载均衡；NameNode优化摘要：HDFS（Hadoop分布式文件系统）作为大数据领域的基石，承载着海量数据的存储与管理重任。随着数据规模爆炸式增长和业务复杂度提升，HDFS集群的资源管理面临着"存不下、跑不快、管不好"的三重挑战：存储资源浪费与不足并存、计算与存储资源匹配失衡、集群运维效率低下。本
深入探索Hadoop技术：全面学习指南
引言在大数据时代，高效地存储、处理和分析海量数据已成为企业决策与创新的关键驱动力。Hadoop，作为开源的大数据处理框架，以其强大的分布式存储和并行计算能力，以及丰富的生态系统，为企业提供了应对大规模数据挑战的有效解决方案。本文旨在为初学者和进阶者提供一份详尽的Hadoop技术学习指南，涵盖HDFS、MapReduce、YARN等核心组件，以及Hive、Pig、HBase等生态系统工具，助您踏上H
防不胜防!第六届研究所老姜（姜新宁）算力3.0亏损被骗曝光,巨额损失真相令人胆寒心惊！大盛律道
数字经济十选五投资诈骗套路频出，投资者股民的“钱袋子”多有损失，以投资理财获取大数据数字经济投资算法为由，将投资者的积蓄收入囊中，成为不法分子常用的诈骗手段之一。为守护好投资者的“钱袋子”，小编持续开展曝光数字经济诈骗行动，维护“投资者”合法权益。近年来，股市波动不断，投资者们无不渴望找到稳健的投资途径。而一些不法分子趁机利用第六届研究所荐股群的手段，设下重重陷阱，致使投资者损失惨重。骗子冒充姜新
大数据领域 Kafka 入门指南：从安装到基础使用大数据洞察大数据与AI人工智能大数据 kafka linq ai
大数据领域Kafka入门指南：从安装到基础使用关键词：Kafka、消息队列、分布式系统、大数据处理、实时数据流、生产者消费者模型、ZooKeeper摘要：本文是一篇全面介绍ApacheKafka的入门指南，从基本概念到实际应用。我们将详细讲解Kafka的核心架构、工作原理，并提供从安装配置到基础使用的完整实践指导。文章包含Kafka的生产者-消费者模型实现、集群部署策略、性能优化技巧，以及在大数据
python如何抓取网页里面的文字_如何利用python抓取网页文字、图片内容？ weixin_39917437
想必新老python学习者，对爬虫这一概念并不陌生，在如今大数据时代，很多场景都需要利用爬虫去爬取数据，而这刚好时python领域，如何实现？怎么做？一起来看下吧~获取图片：1、当我们浏览这个网站时，会发现，每一个页面的URL都是以网站的域名+page+页数组成，这样我们就可以逐一的访问该网站的网页了。2、当我们看图片列表时中，把鼠标放到图片，右击检查，我们发现，图片的内容由ul包裹的li组成，箭
Flink-Hadoop实战项目 Dylan_muc hadoop hdfs flink
项目说明文档1.项目概述1.1项目简介本项目是一个基于ApacheFlink的大数据流处理平台，专门用于处理铁路系统的票务和车次信息数据。系统包含两个核心流处理作业：文件处理作业和数据合并作业，采用定时调度机制，支持Kerberos安全认证，实现从文件读取到数据仓库存储的完整数据处理链路。1.2技术栈流处理引擎:ApacheFlink1.18.1存储系统:HDFS(Hadoop分布式文件系统)数据
飞算科技：以原创技术为翼，赋能产业数字化转型
在数字经济浪潮席卷全球的当下，一批专注于技术创新的中国企业正加速崛起，飞算数智科技（深圳）有限公司（简称“飞算科技”）便是其中的佼佼者。作为一家国家级高新技术企业，飞算科技以自主创新为核心驱动力，凭借互联网科技、大数据、人工智能等前沿技术，为各行业客户插上数字化转型的翅膀。飞算科技的定位清晰而坚定——自主创新型数字科技公司。这一定位不仅体现在其技术研发的方向上，更融入到为客户服务的每一个环节。无论
ios内付费 374016526 ios 内付费
近年来写了很多IOS的程序，内付费也用到不少，使用IOS的内付费实现起来比较麻烦，这里我写了一个简单的内付费包，希望对大家有帮助。具体使用如下: 这里的sender其实就是调用者，这里主要是为了回调使用。 [KuroStoreApi kuroStoreProductId:@"产品ID" storeSender:self storeFinishCallBa
20 款优秀的 Linux 终端仿真器 brotherlamp linux linux视频 linux资料 linux自学 linux教程
终端仿真器是一款用其它显示架构重现可视终端的计算机程序。换句话说就是终端仿真器能使哑终端看似像一台连接上了服务器的客户机。终端仿真器允许最终用户用文本用户界面和命令行来访问控制台和应用程序。（LCTT 译注：终端仿真器原意指对大型机-哑终端方式的模拟，不过在当今的 Linux 环境中，常指通过远程或本地方式连接的伪终端，俗称“终端”。）你能从开源世界中找到大量的终端仿真器，它们
Solr Deep Paging(solr 深分页) eksliang solr深分页 solr分页性能问题
转载请出自出处：http://eksliang.iteye.com/blog/2148370 作者：eksliang(ickes) blg:http://eksliang.iteye.com/ 概述长期以来，我们一直有一个深分页问题。如果直接跳到很靠后的页数，查询速度会比较慢。这是因为Solr的需要为查询从开始遍历所有数据。直到Solr的4.7这个问题一直没有一个很好的解决方案。直到solr
数据库面试题 18289753290 面试题数据库
1.union ,union all 网络搜索出的最佳答案： union和union all的区别是,union会自动压缩多个结果集合中的重复结果，而union all则将所有的结果全部显示出来，不管是不是重复。 Union：对两个结果集进行并集操作，不包括重复行，同时进行默认规则的排序； Union All：对两个结果集进行并集操作，包括重复行，不进行排序； 2.索引有哪些分类？作用是
Android TV屏幕适配酷的飞上天空 android
先说下现在市面上TV分辨率的大概情况两种分辨率为主 1.720标清，分辨率为1280x720. 屏幕尺寸以32寸为主，部分电视为42寸 2.1080p全高清，分辨率为1920x1080 屏幕尺寸以42寸为主，此分辨率电视屏幕从32寸到50寸都有适配遇到问题，已1080p尺寸为例：分辨率固定不变，屏幕尺寸变化较大。如：效果图尺寸为1920x1080，如果使用d
Timer定时器与ActionListener联合应用永夜-极光 java
功能:在控制台每秒输出一次代码: package Main; import javax.swing.Timer; import java.awt.event.*; public class T { private static int count = 0; public static void main(String[] args){
Ubuntu14.04系统Tab键不能自动补全问题解决随便小屋 Ubuntu 14.04
Unbuntu 14.4安装之后就在终端中使用Tab键不能自动补全，解决办法如下： 1、利用vi编辑器打开/etc/bash.bashrc文件（需要root权限） sudo vi /etc/bash.bashrc 接下来会提示输入密码 2、找到文件中的下列代码 #enable bash completion in interactive shells #if
学会人际关系三招轻松走职场 aijuans 职场
要想成功，仅有专业能力是不够的，处理好与老板、同事及下属的人际关系也是门大学问。如何才能在职场如鱼得水、游刃有余呢？在此，教您简单实用的三个窍门。　　第一，多汇报最近，管理学又提出了一个新名词“追随力”。它告诉我们，做下属最关键的就是要多请示汇报，让上司随时了解你的工作进度，有了新想法也要及时建议。不知不觉，你就有了“追随力”，上司会越来越了解和信任你。　　第二，勤沟通团队的力
《O2O：移动互联网时代的商业革命》读书笔记 aoyouzi 读书笔记
移动互联网的未来：碎片化内容+碎片化渠道=各式精准、互动的新型社会化营销。 O2O：Online to OffLine 线上线下活动 O2O就是在移动互联网时代，生活消费领域通过线上和线下互动的一种新型商业模式。手机二维码本质：O2O商务行为从线下现实世界到线上虚拟世界的入口。线上虚拟世界创造的本意是打破信息鸿沟，让不同地域、不同需求的人
js实现图片随鼠标滚动的效果百合不是茶 JavaScript 滚动属性的获取图片滚动属性获取页面加载
1,获取样式属性值 top 与顶部的距离 left 与左边的距离 right 与右边的距离 bottom 与下边的距离 zIndex 层叠层次例子:获取左边的宽度,当css写在body标签中时 <div id="adver" style="position:absolute;top:50px;left:1000p
ajax同步异步参数async bijian1013 jquery Ajax async
开发项目开发过程中，需要将ajax的返回值赋到全局变量中，然后在该页面其他地方引用，因为ajax异步的原因一直无法成功，需将async:false，使其变成同步的。格式： $.ajax({ type: 'POST', ur
Webx3框架（1） Bill_chen eclipse spring maven 框架 ibatis
Webx是淘宝开发的一套Web开发框架，Webx3是其第三个升级版本；采用Eclipse的开发环境，现在支持java开发；采用turbine原型的MVC框架，扩展了Spring容器，利用Maven进行项目的构建管理，灵活的ibatis持久层支持，总的来说，还是一套很不错的Web框架。 Webx3遵循turbine风格，velocity的模板被分为layout/screen/control三部
【MongoDB学习笔记五】MongoDB概述 bit1129 mongodb
MongoDB是面向文档的NoSQL数据库，尽量业界还对MongoDB存在一些质疑的声音，比如性能尤其是查询性能、数据一致性的支持没有想象的那么好，但是MongoDB用户群确实已经够多。MongoDB的亮点不在于它的性能，而是它处理非结构化数据的能力以及内置对分布式的支持(复制、分片达到的高可用、高可伸缩)，同时它提供的近似于SQL的查询能力，也是在做NoSQL技术选型时，考虑的一个重要因素。Mo
spring/hibernate/struts2常见异常总结白糖_ Hibernate
Spring ①ClassNotFoundException: org.aspectj.weaver.reflect.ReflectionWorld$ReflectionWorldException 缺少aspectjweaver.jar，该jar包常用于spring aop中 ②java.lang.ClassNotFoundException: org.sprin
jquery easyui表单重置(reset)扩展思路 bozch form jquery easyui reset
在jquery easyui表单中尚未提供表单重置的功能，这就需要自己对其进行扩展。扩展的时候要考虑的控件有： combo,combobox,combogrid,combotree,datebox,datetimebox 需要对其添加reset方法，reset方法就是把初始化的值赋值给当前的组件，这就需要在组件的初始化时将值保存下来。在所有的reset方法添加完毕之后，就需要对fo
编程之美-烙饼排序 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; /* *《编程之美》的思路是：搜索+剪枝。有点像是写下棋程序：当前情况下，把所有可能的下一步都做一遍；在这每一遍操作里面，计算出如果按这一步走的话，能不能赢（得出最优结果）。 *《编程之美》上代码有很多错误，且每个变量的含义令人费解。因此我按我的理解写了以下代码： */
Struts1.X 源码分析之ActionForm赋值原理 chenbowen00 struts
struts1在处理请求参数之前，首先会根据配置文件action节点的name属性创建对应的ActionForm。如果配置了name属性，却找不到对应的ActionForm类也不会报错，只是不会处理本次请求的请求参数。如果找到了对应的ActionForm类，则先判断是否已经存在ActionForm的实例，如果不存在则创建实例，并将其存放在对应的作用域中。作用域由配置文件action节点的s
[空天防御与经济]在获得充足的外部资源之前,太空投资需有限度 comsci 资源
这里有一个常识性的问题: 地球的资源,人类的资金是有限的,而太空是无限的..... 就算全人类联合起来,要在太空中修建大型空间站,也不一定能够成功,因为资源和资金,技术有客观的限制.... &
ORACLE临时表—ON COMMIT PRESERVE ROWS daizj oracle 临时表
ORACLE临时表转临时表：像普通表一样，有结构，但是对数据的管理上不一样，临时表存储事务或会话的中间结果集，临时表中保存的数据只对当前会话可见，所有会话都看不到其他会话的数据，即使其他会话提交了，也看不到。临时表不存在并发行为，因为他们对于当前会话都是独立的。创建临时表时，ORACLE只创建了表的结构（在数据字典中定义），并没有初始化内存空间，当某一会话使用临时表时，ORALCE会
基于Nginx XSendfile+SpringMVC进行文件下载 denger 应用服务器 Web nginx 网络应用 lighttpd
在平常我们实现文件下载通常是通过普通 read-write方式，如下代码所示。 @RequestMapping("/courseware/{id}") public void download(@PathVariable("id") String courseID, HttpServletResp
scanf接受char类型的字符 dcj3sjt126com c
/* 2013年3月11日22:35:54 目的：学习char只接受一个字符 */ # include <stdio.h> int main(void) { int i; char ch; scanf("%d", &i); printf("i = %d\n", i); scanf("%
学编程的价值 dcj3sjt126com 编程
发一个人会编程, 想想以后可以教儿女, 是多么美好的事啊, 不管儿女将来从事什么样的职业, 教一教, 对他思维的开拓大有帮助像这位朋友学习: http://blog.sina.com.cn/s/articlelist_2584320772_0_1.html VirtualGS教程 (By @林泰前): 几十年的老程序员，资深的
二维数组（矩阵）对角线输出飞天奔月二维数组
今天在BBS里面看到这样的面试题目, 1，二维数组（N*N），沿对角线方向，从右上角打印到左下角如N=4： 4*4二维数组 { 1 2 3 4 } { 5 6 7 8 } { 9 10 11 12 } {13 14 15 16 } 打印顺序 4 3 8 2 7 12 1 6 11 16 5 10 15 9 14 13 要
Ehcache（08）——可阻塞的Cache——BlockingCache 234390216 并发 ehcache BlockingCache 阻塞
可阻塞的Cache—BlockingCache 在上一节我们提到了显示使用Ehcache锁的问题，其实我们还可以隐式的来使用Ehcache的锁，那就是通过BlockingCache。BlockingCache是Ehcache的一个封装类，可以让我们对Ehcache进行并发操作。其内部的锁机制是使用的net.
mysqldiff对数据库间进行差异比较 jackyrong mysqld
mysqldiff该工具是官方mysql-utilities工具集的一个脚本，可以用来对比不同数据库之间的表结构，或者同个数据库间的表结构如果在windows下，直接下载mysql-utilities安装就可以了，然后运行后，会跑到命令行下： 1）基本用法 mysqldiff --server1=admin:12345
spring data jpa 方法中可用的关键字 lawrence.li java spring
spring data jpa 支持以方法名进行查询/删除/统计。查询的关键字为find 删除的关键字为delete/remove (>=1.7.x) 统计的关键字为count (>=1.7.x) 修改需要使用@Modifying注解 @Modifying @Query("update User u set u.firstna
Spring的ModelAndView类 nicegege spring
项目中controller的方法跳转的到ModelAndView类，一直很好奇spring怎么实现的？ /* * Copyright 2002-2010 the original author or authors. * * Licensed under the Apache License, Version 2.0 (the "License"); * yo
搭建 CentOS 6 服务器(13) - rsync、Amanda rensanning centos
（一）rsync Server端 # yum install rsync # vi /etc/xinetd.d/rsync service rsync { disable = no flags = IPv6 socket_type = stream wait
Learn Nodejs 02 toknowme nodejs
（1）npm是什么 npm is the package manager for node 官方网站：https://www.npmjs.com/ npm上有很多优秀的nodejs包，来解决常见的一些问题，比如用node-mysql，就可以方便通过nodejs链接到mysql，进行数据库的操作在开发过程往往会需要用到其他的包，使用npm就可以下载这些包来供程序调用 &nb
Spring MVC 拦截器 xp9802 spring mvc
Controller层的拦截器继承于HandlerInterceptorAdapter HandlerInterceptorAdapter.java 1 public abstract class HandlerInterceptorAdapter implements HandlerIntercep