姚circle

spark day06 + day07 + day08

1.spark SQL 基本信息

1.什么是sparksql

2.strucrured data

3.sparksql特征

4.概述

1.sparksql性能比spark rdd高

2.Spark SQL including

3.Datasets and DataFrames

2. 开发DF

1.idea开发sparksql

2.交互式开发sparksql

3.SparkSQL进行数据分析

方式

1.api方式

2.sql方式

案例

4.创建dataframe

三种方式

1.existing RDD

1.反射方法

2.编程方法

2. data sources【外部数据源】

1.text文件的读写

2.json的读写

1.普通json【规范】

2.嵌套json【规范】

1.api

2.sql

3.CSV文件

4.jdbc

3.sparksql整合hive

1.生产环境

2.代码开发

1.spark SQL 基本信息

1.什么是sparksql
- Spark SQL is·Apache Spark's module for working withstructured· data
  sparksql主要处理结构化数据
- Spark SQL是Spark用来处理结构化数据的一个模块
  它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用
2.strucrured data
- 半结构化数据
  - csv、json、orc、parq
- 非结构化数据
在spark中，spark SQL模块不仅仅是sql、dataframe
3.sparksql特征
- 1.sparksql dataframe、api 同sparkcore
- 2.Sparksql = sql + datafram api 处理【结构化数据】
- 3.Uniform data access【外部数据源】
  - SparkSQL 能够处理多种不同的数据源
- 4.Hive integration【整合Hive】
  - SparkSQL访问hive的元数据库·即可·sparksql查询hive里面的数据
- 注意
  - 1.Sparksql不仅仅是sql
  - hive on spark vs spark on hive
    - hive on spark：hive查询引擎是mr
    - spark on hive：sparksql 去hive查
4.概述
- 1.sparksql性能比spark rdd高
  - 1..more information about the structure of.boththe data. [schema)
  - 2.sparksgl架构有关
    - sparksql底层跑的是Sparkcore rdd只是spark框架底层给我们做了优化
  - sparkcoore：编程模型
  - sparksql：rdd【数据集】 + schema[字段字段类型] => table
- 2.Spark SQL including
- 3.Datasets and DataFrames
  - Datasets
    - 1.Dataset也是一个分布式数据集
    - 2.比rdd多出的优势:
      - 1.强类型。
      - 2.算子 ds也可以使用算子
      - 3.optimized executionengine，执行性能·高sparksgl架构·catelyst)
      - 4.Spark1.6·之后诞生的
    - 3.DatasetAPI: scalajava进行开发
  - DataFrame
    - 1.DataFrame也是一个dataset
      A DataFrame is aDataset organizedintonamed·columns
    - 2.DataFrame:
      structured data files, tables in·Hive, external databases, or existing ·RDDs
    - 3.DataFrame is represented by a Dataset of Rows
      - DataFrame=Dataset[Row]
      - Row=>·一行数据·仅仅包含·named·columns
      - DataFrame => table
  - sparkcore => rdd数据集
  - sparksql => df 数据集【数据集 + 额外的信息[schema]】
    rdd + scheam => table
  - Sparksql
    - 编程模型
      - DataFarm ：schemaRDD变过来的
      - DataSet ：DataFrame变过来的

2. 开发DF

1.idea开发sparksql

1.引入依赖



   org.apache.spark
   spark-sql_2.12
   3.2.1

2.引用代码

val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()

3.封装

2.交互式开发sparksql

1.进入spark

2.导入数据（数据原带）

spark.read.json("file:///home/hadoop/app/spark/examples/src/main/resources/people.json")

3.查看：df.show

3.SparkSQL进行数据分析

方式
- 1.sql方式【好维护】（idea api+sql 或者 hive sql文件）
- 2.api方式【不好维护】（一般用户开发平台、工具）
1.api方式
- 1.加载df某个字段
  - select(col: String, cols: String*)：
    - select("字段名字")
      - df.select("age").show
      - df.select("age","name").show
    - select($"字段名字") + 隐士转换 import spark.implicits._
      - idea中
        import spark.implicits._ //隐式转换 df.select($"name")
      - df.select("age").show
      - df.select($"age",$"name").show
  - select(cols: Column*)：
    - idea中
```
import org.apache.spark.sql.functions._

df.select(col("age"))
```
    - df.select(col("age")).show
2.sql方式
- 1.创建test表：df.createOrReplaceTempView("test")
- 2.查询表格数据：spark.sql("select* from test").show
- 3.查询表格多少条数据：spark.sql("select count(1) as cont from test").show

案例

需求：sparksql 去取json数据做需求分析
- 1、table中数据条数
- 2.table中所有人薪资总和

数据

{"name":"tom","salary":3000}
{"name":"Andy","salary":5200 }
{"name": "Justion","salary":6600 }
{"name": "Bertin","salary": 4300}
{"name": "leader","salary":60000 }

代码

object SparkSQL01 {
  def main(args: Array[String]): Unit = {

    val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()
    val df: DataFrame = spark.read.json("file:///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\emp.json")

    println("表格展示")
    df.show()

    println("表中数据条")
    //println(df.count)
    df.groupBy().count().show()
    df.groupBy().count().select("count").show()    //api

    println("薪资总和")
    df.select("name","salary").groupBy().sum("salary").show
    df.groupBy().sum("salary").select("sum(salary)"  ).show()    //api

    spark.stop()
  }

4.创建dataframe

三种方式
- 1.existing RDD 【从已知RDD中构建】
- 2.from a Hive table
- 3. from Spark data sources.

1.existing RDD

1.反射方法

Info代码

  case class Info(uid:String,name:String,age:Int)

  def main(args: Array[String]): Unit = {
    val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()
    import spark.implicits._
    val sc = spark.sparkContext
    val inputRDD: RDD[String] = sc.textFile("file:///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\info.txt")

    val inputDF: DataFrame = inputRDD.map(line => {
      val splits = line.split(",")
      val uid = splits(0)
      val name = splits(1)
      val age = splits(2).toInt
      Info(uid, name, age)
    }).toDF()

    inputDF.show(5,false)
    inputDF.printSchema()         //查看数据类型
  
    spark.stop()
  }

col 代码

  case class Info(uid:String,name:String,age:Int)
  def main(args: Array[String]): Unit = {
    val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()
    import spark.implicits._
    val sc = spark.sparkContext
    val inputRDD: RDD[String] = sc.textFile("file:///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\info.txt")

    val inputDF2: DataFrame = inputRDD.map(line => {
      val splits = line.split(",")
      val uid = splits(0)
      val name = splits(1)
      val age = splits(2).toInt
      (uid, name, age)
    }).toDF("uid","name","age")

    inputDF2.show(5,false)
    inputDF2.printSchema()

    spark.stop()
  }

数据

uid01,zhangsan,18

uid02,lili,20

uid03,tiantian,18

uid04,luoyudai,21

uid05,tom,25

2.编程方法

过程
- 1.RDD[Row]
  （Create an RDD of Rows from the original RDD;）
- 2.schema
  （Create the schema represented by a StructType matching the structure of Rows in the RDD created in Step 1.）
- 3.creatrDataFrame => df
  （Apply the schema to the RDD of Rows via createDataFrame method provided by SparkSession.）

代码

  def main(args: Array[String]): Unit = {
    val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()
    val sc = spark.sparkContext
    val inputRDD: RDD[String] = sc.textFile("file///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\info.txt")

    //构建ROW
    val rowRDD: RDD[Row] = inputRDD.map(line => {
      val splits = line.split(",")
      val uid = splits(0)
      val name = splits(1)
      val age = splits(2).toInt
      Row(uid, name, age)
    })

    //构建schema
    val scheama = StructType(Array(
      StructField("uid",StringType),
      StructField("name",StringType),
      StructField("age",IntegerType),
    ))
    val inputDF: DataFrame = spark.createDataFrame(rowRDD, scheama)

    inputDF.show(10,false)
    inputDF.printSchema()

   spark.stop()
  }

rdd、df、ds转变【面试题】
- 把rdd转变成df、ds
  - 转变df：toDF
  - 转变ds：toDS
- 把df、ds转变成rdd
  - .rdd
  - 举例：val rdd: RDD[Row] = inputDF2.rdd
- df转变成ds
  - df.as[数据类型] => ds
  - 举例：val df: Dataset[Info] = inputDF2.as[Info]

2. data sources【外部数据源】

原理：Spark SQL 支持通过 DataFrame 接口对各种数据源进行操作。可以使用关系转换对数据帧进行操作，也可以用于创建临时表。，将数据帧注册为临时视图允许您对其数据运行 SQL 查询。
重点
- 1.读数据 api
  - text文件：spark.read.format("text").load(paths : _*)
    例：val df: DataFrame = spark.read.text(str) 【返回的是DF类型】
  - json文件：spark.read.format("json").load(paths : _*)
    例：val ds: Dataset[String] = spark.read.textFile(path)
- 2.写数据 api
  - text文件：df.write.mode(SaveMode.Overwrite)format("text").save(path)
    例：data.select("uid").write.text("file:///D:\\software\\untitled3\\data\out")
  - json文件：df.write.mode(SaveMode.Append)format("json").save(path)
  - 数据写出方式mode：
    - 1.覆盖 overwrite
    - 2.追加 append

1.text文件的读写

官网：spark.apache.org/docs/latest/sql-data-sources-text.html

1.读数据

  def text(spark: SparkSession, path: String) = {
    val df: DataFrame = spark.read.text(path)   
     /**
     * ds格式
     * val ds: Dataset[String] = spark.read.textFile(path)
     */  
    df.show(2,false)
    df.printSchema()
  }

  def main(args: Array[String]): Unit = {
    val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()
    import spark.implicits._

    //text  df
     text(spark,"file:///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\info.txt")

    spark.stop()
  }

本身是不带有schema信息【字段 value string 】

2.解析数据

text文件加载进来之后需要解析数据

代码

  def text(spark: SparkSession, str: String) = {
    import spark.implicits._         //隐式转换
    val df: DataFrame = spark.read.text(str)
    //数据解析
    val data: DataFrame = df.map(row => {
      val line = row.getString(0)
      val splits = line.split(",")
      val uid = splits(0)
      val name = splits(1)
      val age = splits(2)
      (uid, name, age)

    }).toDF("uid", "name", "age")
    data.show(false)
    data.printSchema()

    //写出数据
    data.select("uid").write.text("file:///D:\\iccn\\software\\xxl\\untitled3\\
    untitled5\\Data\\out\\out_text")

  }

对比：

3.写出数据
- 局限：仅仅支持一列输出不支持多列输出
- 代码
```
data.select("uid").write.text("file:///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\out\\out_text")
```
- 使用sparksql 支持text多列输出
  - 1.自定义外部数据源【有难度】
    - unit中 FileUtils类报错【视频2】
  - 2.df 转变成rdd方式进行输出【常用手段】

2.json的读写

1.普通json【规范】

数据

{"city_id" : 1, "city_name" : "BEIJING" ,"area" : "NC"}
{"city_id" : 2, "city_name" : "SHANGHAI" ,"area" : "EC"}
{"city_id" : 3, "city_name" : "NANJING" ,"area" : "EC"}
{"city_id" : 4, "city_name" : "GUANGZHOU" ,"area" : "SC"}
{"city_id" : 5, "city_name" : "SANYA" ,"area" : "SC"}
{"city_id" : 6, "city_name" : "WUHAN" ,"area" : "CC"}
{"city_id" : 7, "city_name" : "CHANGSHA" ,"area" : "CC"}
{"city_id" : 8, "city_name" : "XIAN" ,"area" : "NW"}
{"city_id" : 9, "city_name" : "CHENGDU" ,"area" : "SW"}
{"city_id" : 1, "city_name" : "HAERBIN" ,"area" : "NE"}

1.读数据

  def json(spark: SparkSession, path: String) = {
     val input: DataFrame = spark.read.format("json").load(path)
    input.show()
    input.printSchema()
  }

  def main(args: Array[String]): Unit = {
    val spark: SparkSession = SparkSession.builder().appName("SparkSQL01").master("local[2]").getOrCreate()
    import spark.implicits._

  json(spark,"file:///D:\\iccn\\software\\xxl\\untitled3\\untitled5\\Data\\city_info.json")

    spark.stop()

  }

json格式无需解析数据

2.写数据

写出数据

  def json(spark: SparkSession, path: String) = {
     val input: DataFrame = spark.read.format("json").load(path)
    input.show()
    input.printSchema()

    input.createOrReplaceTempView("city_info")
    spark.sql(
      """
        |select count(1) as cnt from city_info
        |""".stripMargin).write.mode(SaveMode.Overwrite).format("json").save("hdfs://bigdata13:9000/out")
  }

报错原因：权限原因

|权限问题解决方法
|修改hdfs上的权限
|把代码部署到linux上
|更改windows的机器名称变成hadoop
|正常drwxr-xr-x
|更改之后777
|hdfs路径写法：hdfs://机器名:端口/文件路径
|端口默认是9000
|文件路径是hdfs上的
|机器名是主节点的
|"""

解决方法：[hadoop@bigdata13 ~]$ hdfs dfs -chmod 777 /out

修改后hdfs中

2.嵌套json【规范】

数据

{"store":{"fruit":[{"weight":6,"type":"apple"},{"weight":9,"type":"pear"}],"bicycle":{"price":19.95,"color":"red"}},"email":"amy@only_for_json_udf_test.net","owner":"amy"}

直接按照解决普通json方法得出结果
解析两种方式

1.api

1.struct：打点

//struct
jsonData = jsonData.withColumn("color",col("store.bicycle.color"))
jsonData = jsonData.withColumn("price",col("store.bicycle.price"))

2.array：expolde + struct：打点

//array
jsonData = jsonData.withColumn("fruit",explode(col("store.fruit")))
jsonData = jsonData.withColumn("type",col("fruit.type"))
jsonData = jsonData.withColumn("weight",col("fruit.weight"))

expolde将fruit分解为struct形式

整合

  def json02(spark: SparkSession, path: String) = {
    var jsonData: DataFrame = spark.read.format("json").load(path)
    jsonData.show()
    jsonData.printSchema()

    import org.apache.spark.sql.functions._
    //struct
    jsonData = jsonData.withColumn("color",col("store.bicycle.color"))
    jsonData = jsonData.withColumn("price",col("store.bicycle.price"))

    //array
    jsonData = jsonData.withColumn("fruit",explode(col("store.fruit")))
    jsonData = jsonData.withColumn("type",col("fruit.type"))
    jsonData = jsonData.withColumn("weight",col("fruit.weight"))

    //drop方法去除字段
    jsonData = jsonData.drop("store","fruit")

    jsonData.show()
    jsonData.printSchema()

  }

2.sql

1.struct：打点
2. array：expolde + struct：打点
- lateral view explode(store.fruit) as fruit

总和

  def json03(spark: SparkSession, path: String) = {
    val data: DataFrame = spark.read.format("json").load(path)
    data.show()
    data.printSchema()

    data.createOrReplaceTempView("store_json")
    val etl = spark.sql(
      """
        |select
        |email,
        |owner,
        |store.bicycle.color as color,
        |store.bicycle.price as price,
        |fruit.type as type,
        |fruit.weight as weight
        |from store_json
        |lateral view explode(store.fruit) as fruit
        |""".stripMargin)

    etl.show()
    etl.printSchema()
  }

3.不规范json （目前不用掌握）
- 通过udf函数解决

3.CSV文件

CSV格式
- 1.可以使用excel打开
- 2.默认字段之间的分割符 , [可以进行更改]

读数据( 默认分割符是",")

  def csv(spark: SparkSession, path: String) = {
    val data = spark.read.format("csv").load(path)
    data.show()
    data.printSchema()
  }

其他option（例 ; ）

val data = spark.read.option("sep",";").option("header","true").format("csv").load(path)

Property Name	Default	Scope	注释
sep	,	read/write
encoding	UTF-8	read/write	指定读取的csv文件的字符集utf-8
quote	"	read/write
quoteAll	false	read
escape	\	read/write
header	false	read/write	第一行作为table中的字段
inferSchema	false	read	类型推断功能

官网：spark.apache.org/docs/latest/sql-data-sources-csv.html

查询语句

data.createOrReplaceTempView("csv")
    spark.sql(
      """
        |select
        |city_id,city_name,area
        |from csv
        |where city_name = "BEIJING"
        |""".stripMargin).show()

//where lower(city_name) = "beijing" 【用小写查询数据】

写数据

data.write.mode(SaveMode.Overwrite).format("csv").save("http://bigdata13:9870/out/csv")

hdfs上

指定压缩格式 .option("compression","gzip")
```
data.write.option("compression","gzip").mode(SaveMode.Overwrite).format("csv").save("http://bigdata13:9870/out/csv")
```
解压：hdfs dfs -text /out/part-00000-e069775f-18e6-4aa1-bdaf-d712bd92f0fe-c000.csv.gz

4.jdbc

直接在数据库中读取数据

1.添加mysql驱动--pom依赖



   mysql
   mysql-connector-java
   5.1.49

2.读数据

def jdbc(spark: SparkSession) = {
  val data = spark.read.format("jdbc")
    .option("url", "jdbc:mysql://bigdata13/bigdata")
    .option("dbtable", "test")
    .option("user", "root")
    .option("password", "123456")
    .load()
  data.show()
  data.printSchema()
}

3.查询筛选
- 1.建表方式【一般不用与生产】
```
data.createOrReplaceTempView("test")
    spark.sql(
      """
        |select *
        |from test
        |where age = 20
        |""".stripMargin).show()
```
  缺点：直接表table 数据全部加载过来，再进行筛选性能不高
- 2.谓词下压【首选】
  先筛选再呈现

4.写数据

1.创建表
在数据库中建表

CREATE TABLE `test_b` (
  `id` int(3),
  `name` varchar(10)
)

2.写出代码

    data.createOrReplaceTempView("test_a")
    val rpt = spark.sql(
      """
        |select
        |id,name
        |from test_a
        |""".stripMargin)

    //写数据
    val url="jdbc:mysql://bigdata13:3306/bigdata"
    val table="test_b"
    val properties = new Properties()   //封装用户名和密码
    properties.setProperty("user", "root")
    properties.setProperty("password", "123456")

    rpt.write.mode(SaveMode.Append).jdbc(url,table,properties)
  }

4.代码总结

  def jdbc(spark: SparkSession) = {
    //筛选内容
    val inputsql=
      """
        |select
        |*
        |from test
        |where age = 20
      """.stripMargin
    //读数据
    val data: DataFrame = spark.read.format("jdbc")
      .option("url", "jdbc:mysql://bigdata13:3306/bigdata")
      .option("dbtable", s"($inputsql) as tmp")
      .option("user", "root")
      .option("password", "123456")
      .load()

    data.show()
    data.printSchema()

    data.createOrReplaceTempView("test_a")
    val rpt = spark.sql(
      """
        |select
        |id,name
        |from test_a
        |""".stripMargin)

    //写数据
    val url="jdbc:mysql://bigdata13:3306/bigdata"
    val table="test_b"
    val properties = new Properties()   //封装用户名和密码
    properties.setProperty("user", "root")
    properties.setProperty("password", "123456")

    rpt.write.mode(SaveMode.Append).jdbc(url,table,properties)

  }

3.sparksql整合hive

1.生产环境
- 1.将（hive-site.xml、core-site.xml 、hdfs-site.xml ）三个文件放置spark安装目录 conf文件下即可
  - 但：spark 跑yarn上配置了 hadoop配置文件路径的参数（spark-env文件）
    (core-site.xml hdfs-site.xml)是不需要再次配置在conf目录下
- 2.将hive-site.xml放置spark安装目录 conf文件下
  - 使用软连接：
    - 路径：/home/hadoop/app/spark/conf
    - [hadoop@bigdata13 conf]$ ln -s /home/hadoop/app/hive/conf/hive-site.xml ./hive-site.xml
2.代码开发

day06作业

数据

emp （empno,ename,job,mgr,hiredate,sal,comm,deptno）

7369,  SMITH ,  CLERK , 7902,  1980-12-17 , 800, null, 20
7499,  ALLEN ,  SALESMAN , 7698,  1981-02-20 , 1600, 300, 30
7521,  WARD ,  SALESMAN , 7698,  1981-02-22 , 1250, 500, 30
7566,  JONES ,  MANAGER , 7839,  1981-04-02 , 2975, null, 20
7654,  MARTIN ,  SALESMAN , 7698,  1981-09-28 , 1250, 1400, 30
7698,  BLAKE ,  MANAGER , 7839,  1981-05-01 , 2850, null, 30
7782,  CLARK ,  MANAGER , 7839,  1981-06-09 , 2450, null, 10
7788,  SCOTT ,  ANALYST , 7566,  1982-12-09 , 3000, null, 20
7839,  KING ,  PRESIDENT , null,  1981-11-17 , 5000, null, 10
7844,  TURNER ,  SALESMAN , 7698,  1981-09-08 , 1500, 0, 30
7876,  ADAMS ,  CLERK , 7788,  1983-01-12 , 1100, null, 20
7900,  JAMES ,  CLERK , 7698,  1981-12-03 , 950, null, 30
7902,  FORD ,  ANALYST , 7566,  1981-12-03 , 3000, null, 20
7934,  MILLER ,  CLERK , 7782,  1982-01-23 , 1300, null, 10

dept （deptno,dname ,loc）

10,  ACCOUNTING ,  NEW YORK 
20,  RESEARCH ,  DALLAS 
30,  SALES ,  CHICAGO 
40,  OPERATIONS ,  BOSTON

需求
- 1. 查询出部门编号为30的所有员工的编号和姓名
- 2.找出部门编号为10中所有经理，和部门编号为20中所有销售员的详细资料。
- 3.查询所有员工详细信息，用工资降序排序，如果工资相同使用入职日期升序排序
- 4.列出薪金大于1500的各种工作及从事此工作的员工人数。

你可能感兴趣的:(spark,spark,大数据,分布式)

为什么尽量避免使用 `IN` 和 `NOT IN`？数据库数据库性能优化后端
为什么尽量避免使用IN和NOTIN？前言在SQL查询中，IN和NOTIN是常用的关键字，用于筛选符合条件的数据。然而，尽管它们使用方便，但在某些情况下，使用它们可能会导致效率低下或查询结果不准确。本文将从效率和潜在问题两个角度，深入探讨为什么应尽量避免使用IN和NOTIN，并提供替代方案。一、效率问题1.NOTIN的性能瓶颈在SQL查询中，NOTIN往往会导致性能问题，尤其是在处理大数据集时。以下
Elasticsearch集群架构：构建高效、可扩展的搜索平台 detayun Elasticsearch elasticsearch 架构大数据
在当今大数据和云计算的时代，高效、实时的数据检索能力成为了企业核心竞争力的重要组成部分。Elasticsearch，作为一款基于Lucene构建的开源搜索引擎，以其强大的全文搜索能力、灵活的扩展性和丰富的功能特性，成为了众多企业首选的数据搜索和分析平台。本文将深入探讨Elasticsearch集群的架构设计，帮助您更好地理解和构建高效、可扩展的搜索解决方案。一、Elasticsearch简介Ela
随机森林（Random Forest）预测模型及其特征分析（Python和MATLAB实现）追蜻蜓追累了深度学习机器学习 python 随机森林大数据回归算法算法
##一、背景在大数据和机器学习的快速发展时代，数据的处理和分析变得尤为重要。随着多个领域积累了海量数据，传统的统计分析方法常常无法满足复杂问题的需求。在这种背景下，机器学习方法开始广泛应用。随机森林（RandomForest）作为一种强大的集成学习方法，因其高效性和较强的泛化能力而备受关注。随机森林最初由LeoBreiman在2001年提出，基于决策树这一基本分类模型。其基本思想是通过构建多个决策
大数据相关职位介绍之三（数据挖掘，数据安全，数据合规师，首席数据官，数据科学家）小Tomkk 大数据大数据数据挖掘首席数据官数据合规师数据安全数据科学家
大数据相关职位介绍之三（数据挖掘，数据安全，数据合规师，首席数据官，数据科学家）文章目录大数据相关职位介绍之三（数据挖掘，数据安全，数据合规师，首席数据官，数据科学家）1.数据挖掘工程师（DataMiningEngineer）2.数据安全工程师（DataSecurityEngineer）3.数据合规师（DataComplianceOfficer）4.首席数据官（CDO-ChiefDataOffic
鸿蒙系统未来发展方向月栖梧_teachjunkie harmonyos 华为职场发展
鸿蒙系统未来有以下几大发展方向：技术深化与优化内核性能提升：持续优化鸿蒙内核，进一步提高系统的运行速度、稳定性和资源利用率，降低功耗，以满足不断增长的多设备互联和复杂应用场景的需求24.分布式技术拓展：深化分布式软总线、分布式数据管理、分布式设备虚拟化等分布式技术，加强设备间的协同能力，实现更高效、更智能的设备互联和资源共享，使不同类型的设备能够无缝协作，为用户提供更加连贯一致的体验4.安全隐私保
技术速递｜测试和 .NET Aspire 入门微软Reactor .net 自动化
作者：AaronPowell-PrincipalCloudAdvocate排版：AlanWang自动化测试是软件开发的一个重要组成部分，有助于确保在早期发现漏洞并防止回归问题。在这篇博文中，我们将探讨如何开始在.NETAspire中进行测试，以便我们能够测试分布式应用程序中的各种场景。测试分布式应用程序分布式应用程序本质上很复杂，您需要确保数据库、缓存等组件可用且处于正确状态。然后您的应用程序可能
流媒体娱乐服务平台在AWS上使用Presto作为大数据的交互式查询引擎的具体流程和代码 weixin_30777913 aws 大数据 python 音视频
一家流媒体娱乐服务平台拥有庞大的用户群体和海量的数据。为了高效处理和分析这些数据，它选择了Presto作为其在AWSEMR上的大数据查询引擎。在AWSEMR上使用Presto取得了显著的成果和收获。这些成果不仅提升了数据查询效率，降低了运维成本，还促进了业务的创新与发展。实施过程：Presto集群部署：在AWSEMR上部署了Presto集群，该集群与HiveMetastore和AmazonS3集成
Python结合pyhdfs模块操作HDFS分布式文件系统唐僧不爱八戒 python hdfs 开发语言
使用python操作hdfs本身并不难，只不过是把对应的shell功能“翻译”成高级语言，我这里选用的是hdfs，下边的实例都是基于hdfs包进行的。1：安装由于我的是windows环境（linux其实也一样），只要有pip或者setup_install安装起来都是很方便的pipinstallhdfs2：Client——创建集群连接fromhdfsimport*client=Client("ht
Spark基本概念 javafanwk Spark 大数据 spark 架构大数据
Spark核心组件Driver将用户程序转化为作业（job）在Executor之间调度任务(task)跟踪Executor的执行情况通过UI展示查询运行情况ExecutorSparkExecutor是集群中工作节点（Worker）中的一个JVM进程，负责在Spark作业中运行具体任务（Task），任务彼此之间相互独立。负责运行组成Spark应用的任务，并将结果返回给驱动器进程它们通过自身的块管理器
Spark 基本概念 Buutoorr spark 大数据分布式 scala
#官网部分解释ClusterModeOverview-Spark3.3.0DocumentationApplication：指的是用户编写的Spark应用程序/代码,一个完整的main方法程序，包含了Driver功能代码和分布在集群中多个节点上运行的Executor代码,如main方法中有WordCount代码有哪些命令会产生一个Applicationspark/bin/pyspark【输入exi
算法基础——一致性黄雪超大数据基础 #算法基础大数据算法一致性
引入最早研究一致性的场景既不是大数据领域，也不是分布式系统，而是多路处理器。可以将多路处理器理解为单机计算机系统内部的分布式场景，它有多个执行单元，每一个执行单元都有自己的存储(缓存)，一个执行单元修改了自己存储中的一个数据后，这个数据在其他执行单元里面的副本就面临数据一致的问题。随着时代发展，互联网公司的快速发展，单机系统在计算和存储方面都开始面临瓶颈，分布式是一个必然的选择，但是这也进一步放大
大数据（一）MaxCompute 胖当当技术架构云计算 odps 学习大数据
一、引言作者后面会使用MaxCompute，所以在进行学习研究，总会有一些疑问产生，这里讲讲作者的疑问和思路二、介绍MaxCompute（原名ODPS-OpenDataProcessingService）是阿里云提供的大数据处理平台，专门用于批量数据存储和大规模并行计算。它广泛应用于数据分析和处理任务，为企业级数据处理提供高效的解决方案。下面是MaxCompute的一些主要功能和应用场景：大规模数
Spark基础【RDD依赖关系--源码解析】 OneTenTwo76 Spark spark scala 大数据
文章目录一RDD依赖关系1RDD血缘关系2RDD依赖关系3RDD阶段划分4RDD任务划分一RDD依赖关系1RDD血缘关系相邻两个RDD之间的关系，称之为依赖关系，多个连续的依赖关系称之为血缘关系RDD只支持粗粒度转换，即在大量记录上执行的单个操作。将创建RDD的一系列Lineage（血统）记录下来，以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为，当该RDD的部分分区数
猫眼大数据开发面试题及参考答案大模型大数据攻城狮数据仓库大数据数据开发窗口函数 hive外部表维度建模数仓分层
Java基本数据类型有哪些？包装类型又是什么？Java的基本数据类型是Java语言中最基础的数据类型，它们用于存储简单的值。Java的基本数据类型主要分为以下几类：整型byte：占1个字节，取值范围是-128到127，通常用于节省内存的场景，比如处理文件或网络数据时，存储一些小的整数值。short：占2个字节，取值范围是-32768到32767，使用场景相对较少，但在某些需要节省内存且数值范围不大
Hive重点面试题 Major Tom _ hive hadoop 数据仓库
文章目录Hive面试重点题目及答案1.Hive的优缺点及使用场景2.Hive与数据仓库的区别3.Hive的基本架构与元数据存储4.Hive内外部表的区别及适用场景5.Hive数据倾斜原因与解决方法6.HiveMapReduce的底层实现与优化方式7.Hive窗口函数的使用场景8.Hive分区与分桶的区别9.Hive的存储格式10.Hive计算引擎（MapReduce,Tez,Spark）的对比Hi
go分布式锁 alsarkc redis 分布式数据库 golang
go-redis配置packageconfigimport("context""fmt""github.com/redis/go-redis/v9")varCtx=context.Background()varRdb*redis.Clientfuncinit(){Rdb=redis.NewClient(&redis.Options{Addr:"localhost:6379",//Redis服务器地
基于Java的智能家居设计：探讨Java在智能家居大数据处理中的角色杭州大厂Java程序媛计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
基于Java的智能家居设计：探讨Java在智能家居大数据处理中的角色关键词：智能家居,Java,大数据处理,机器学习,物联网1.背景介绍1.1问题由来随着物联网技术的发展，智能家居已经从一个概念转变为现实。通过连接各种家庭设备，智能家居系统能够实现自动化控制、远程监控、个性化服务等功能。然而，这些功能背后隐藏着一个庞大的数据处理和管理系统，即大数据处理系统。这些系统需要高效、可靠的计算平台，而Ja
大数据相关职位介绍之二（数据治理，数据库管理员，数据资产管理师，数据质量专员）小Tomkk 大数据大数据数据治理数据库管理员数据资产管理师数据质量专员
大数据相关职位介绍之二（数据治理，数据库管理员，数据资产管理师，数据质量专员）文章目录大数据相关职位介绍之二（数据治理，数据库管理员，数据资产管理师，数据质量专员）数据治理工程师/专家（DataGovernanceEngineer/Expert）1.元数据管理师（MetadataManager）2.主数据管理师（MasterDataManager）数据库管理员（DBA-DatabaseAdmini
三十四、领域驱动设计DDD（DDD 与微服务架构结合）伯牙碎琴架构架构微服务运维
在现代企业应用中，领域驱动设计（DDD）与微服务架构的结合被认为是应对复杂业务系统和大规模分布式系统的有效方法。两者的结合既能发挥DDD在业务建模和复杂业务管理中的优势，也能利用微服务架构的灵活性和可扩展性，帮助企业更好地应对技术和业务的双重需求。以下是两者结合的详细分析：1.DDD与微服务架构的契合点限界上下文（BoundedContext）与微服务的契合：在DDD中，限界上下文定义了业务模型的
华为余承东鸿蒙系统随时可以上线,华为发布鸿蒙系统，余承东称随时可替换安卓... 温列来华为余承东鸿蒙系统随时可以上线
8月9日，在2019华为全球开发者大会上，备受用户关注的鸿蒙系统正式亮相。鸿蒙有四大特点：分布架构、天生流畅、内核安全、生态共享。华为消费者业务CEO余承东在发布会现场表示，这是基于微内核的全场景分布式OS系统，这也是世界第一个基于微内核的OS。得益于微内核架构，鸿蒙OS可以灵活适配全场景丰富终端形态，涵盖了GB级别、MB级别、KB级别的设备终端。在华为看来，目前在国际上众多巨头企业致力于发展新O
k8s网络架构图_kubernetes搭建高可用集群架构图沈千越 k8s网络架构图
LoadBalancer一般使用HaProxy。如果你在其他云平台上搭建，可以利用云平台上的负载均衡器：例如aws采用elb;aliyun...参考：Kubernetes采用主从分布式架构，包括MasterNode(主节点)、WorkerNode(从节点或工作节点)，以及客户端命令行工具kubectl和其它附加项。MasterNode：主控节点，对集群进行调度管理。由APIServer、Sched
分布式架构中的事务管理：需要了解的常见解决方案四七伵 Java 面试宝典分布式架构后端分布式事务
前言在现代互联网应用中，分布式架构越来越常见。随着系统规模的扩大，越来越多的业务和数据被分布到不同的服务和数据库中。虽然分布式架构带来了诸多优势，但也引入了一个新的问题：分布式事务。一、什么是分布式事务？在单体应用中，事务管理通常比较简单，操作仅涉及单一数据库。只要保证ACID（原子性、一致性、隔离性、持久性）特性，数据的一致性和可靠性就能得到保证。但在分布式系统中，事务跨多个服务或数据库，这就带
基于Stackelberg博弈的光伏用户群优化定价模型(Matlab代码实现）然哥爱编程 matlab
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3文献来源4Matlab代码、数据、文章下载1概述文献来源：摘要：在由多主体组成的光伏用户群中,用户间存在光伏电量共享。然而,在现有的分布式光伏上网政策下,用户间的共享水平很低。为了提高用户间光伏电量共享水平,根据用户的用电特性,构建了光伏用
分布式之消息中间件 CatalpaFlat 分布式消息队列
分布式之消息中间件目录*1.消息中间件概述*2.消息中间件使用场景*3.消息中间件原理*4.消息中间件传递模式 *4.1点对点模式（PTP） *4.2发布-订阅模型（Pub/Sub）1.消息中间件概述消息中间件利用高效可靠的消息传递机制进行平台无关的数据交流，并基于数据通信来进行分布式系统的集成。通过提供消息传递和消息排队模型，它可以在分布式环境下扩展进程间的通信。消息中间件就是用在消息队
HarmonyOS开发：生命周期详解三掌柜666 HarmonyOS开发 harmonyos 华为
目录前言生命周期的概念HarmonyOS生命周期最后前言随着移动端操作系统的多样化发展，HarmonyOS作为华为推出的一款面向全场景的分布式操作系统，受到了业内外的广泛关注。其实HarmonyOS的设计和开发模式，与传统的移动端操作系统有着显著的区别，特别是在应用的生命周期管理上，它引入了新的设计理念来适应多种设备和使用场景。对于开发者而言，深入理解HarmonyOS的生命周期对于开发高效、稳定
Oracle 分区在什么情况下使用？思维导图代码示例（java 架构) 用心去追梦 oracle java 架构
Oracle分区的适用场景Oracle分区（Partitioning）是一种强大的数据管理工具，适用于特定类型的数据库工作负载和数据结构。以下是一些适合使用分区的情况：1.大型表优化超大数据量：当表包含数百万甚至数十亿行时，分区可以帮助提高查询性能。频繁更新：对于经常被插入、更新或删除的数据，分区可以减少锁定范围，提高并发性。2.数据仓库历史数据分析：在数据仓库中，通常会存储多年的历史数据。通过按
Hive 分区和分桶总结 Stray_Lambs 大数据 hive
目录分区和分桶总结1、分区1、分区介绍2、分区表的操作3、动态分区2、分桶表1、分桶表介绍2、分桶表的操作3、分区表和分桶表的区别参考分区和分桶总结1、分区1、分区介绍由于数据量过于庞大，使用分区，可以并行的进行处理数据，有点类似于Hadoop当中的切片操作，将数据分开，然后并行去处理，避免去全表扫描。分区表在生产环境当中用的非常多。分区表实际上就是对应一个在HDFS(或者是其他分布式文件系统)文
基于Stackelberg博弈的光伏用户群优化定价模型(Matlab代码实现）砌墙_2301 matlab
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3文献来源4Matlab代码、数据、文章下载1概述文献来源：摘要：在由多主体组成的光伏用户群中,用户间存在光伏电量共享。然而,在现有的分布式光伏上网政策下,用户间的共享水平很低。为了提高用户间光伏电量共享水平,根据用户的用电特性,构建了光伏用
【爬虫】JS逆向解决蝉妈妈加密参数data 秋无之地爬虫JS逆向 python 爬虫 js逆向
⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️作者：秋无之地简介：CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作，主要擅长领域有：爬虫、后端、大数据开发、数据分析等。欢迎小伙伴们点赞、收藏⭐️、留言、关注，关注必回关目录一、先打开目标网站，打开F12调试模式二、通过刷新页面定位接口，并找到接口上的加密参数data三、打开启动器（Initiator）
Java RabbitMQ 的作用是什么? 使用场景有哪些？有哪些优缺点? 学习资源网 java-rabbitmq java rabbitmq
JavaRabbitMQ的作用是什么?使用场景有哪些？有哪些优缺点?RabbitMQ是一个开源的消息队列系统，用于在分布式系统中传递消息。它实现了AMQP（AdvancedMessageQueuingProtocol）协议，为应用提供了可靠的消息传递机制。以下是RabbitMQ的作用、使用场景以及优缺点：作用：消息队列：RabbitMQ提供了消息队列的功能，允许应用程序之间异步地传递消息。解耦：R
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D