Wzideng

第1章 SparkSQL 概述

1.1 SparkSQL 是什么

Spark SQL 是 Spark 用于结构化数据(structured data)处理的 Spark 模块。

SparkSQL是Apache Spark中的一个模块，用于处理结构化数据。它提供了一个用于处理关系型数据的高级接口，并允许在Spark中执行SQL查询、操作DataFrame和DataSet等数据结构。

SparkSQL的主要功能包括：

DataFrame和DataSet：SparkSQL引入了DataFrame和DataSet这两种数据结构，它们是以RDD为基础构建的，提供了更高级的API操作结构化数据。DataFrame是分布式数据集，类似于关系型数据库中的表，而DataSet是类型化的DataFrame，支持更丰富的类型操作。
SQL查询：SparkSQL允许通过标准的SQL查询语言来操作DataFrame和DataSet。用户可以使用SQL查询语句进行数据过滤、投影、聚合等操作。
分布式计算：SparkSQL是构建在Spark的分布式计算引擎之上的，可以处理大规模数据集，并利用集群的并行处理能力进行高效的数据处理。
内存计算：SparkSQL利用Spark的内存计算特性，将部分数据加载到内存中进行计算，减少磁盘IO，提高计算效率。
Catalyst优化器：SparkSQL引入了Catalyst优化器，它是一个可扩展的查询优化框架，用于优化查询计划。Catalyst优化器可以通过一系列的优化规则和转换来优化查询性能。
Hive兼容性：SparkSQL兼容Hive，可以直接运行Hive的查询。通过Hive兼容性，用户可以在不迁移数据的情况下将现有的Hive查询迁移到Spark中运行。
数据源集成：SparkSQL支持连接多种数据源，包括Hive、JSON、Parquet、Avro等，以及其他外部数据源。这使得SparkSQL能够与不同类型的数据进行交互。
用户自定义函数（UDF）：SparkSQL允许用户定义自己的UDF，以便进行自定义的数据处理和计算操作。
惰性执行：SparkSQL采用了惰性执行的策略，也就是说，它不会立即执行查询操作，而是等到需要得到最终结果时才进行实际计算，这样可以优化查询计划，提高计算性能。

总的来说，SparkSQL提供了一个功能强大的数据处理和查询引擎，结合了SQL查询、DataFrame和DataSet等数据结构，并充分利用Spark的分布式计算能力，适用于大规模数据处理和复杂查询任务。它是Apache Spark中重要的组成部分，为用户提供了更加高效和灵活的数据分析和查询功能。

1.2 Hive and SparkSQL

SparkSQL 的前身是 Shark，给熟悉 RDBMS 但又不理解 MapReduce 的技术人员提供快速上手的工具。

Hive 是早期唯一运行在 Hadoop 上的 SQL-on-Hadoop 工具。但是 MapReduce 计算过程中大量的中间磁盘落地过程消耗了大量的 I/O，降低的运行效率，为了提高 SQL-on-Hadoop的效率，大量的 SQL-on-Hadoop 工具开始产生，其中表现较为突出的是：
⚫ Drill

Apache Drill是一个开源的分布式SQL查询引擎，它允许用户在大规模数据集上执行SQL查询，无论数据是结构化的还是半结构化的。Drill旨在提供一个高性能、低延迟的查询引擎，可以直接查询多种数据源，包括Hadoop分布式文件系统（HDFS）、NoSQL数据库、关系型数据库、云存储等。

以下是Apache Drill的主要特点和功能：

分布式查询：Drill是构建在Apache Drill的分布式计算引擎之上的，可以运行在多台机器上，利用集群的并行处理能力来执行大规模的数据查询任务。
SQL兼容性：Drill支持标准的SQL查询语言，用户可以使用标准的SQL语法来查询数据，这使得使用Drill非常方便和灵活。
查询多种数据源：Drill可以直接查询多种数据源，无需预定义模式或元数据，支持查询Hadoop的HDFS、NoSQL数据库（如MongoDB、HBase等）、关系型数据库（如MySQL、PostgreSQL等）、云存储（如Amazon S3、Azure Blob Storage等）等。
半结构化数据支持：Drill可以查询半结构化数据，如JSON、Parquet、Avro等格式，这使得处理复杂的数据变得更加容易。
高性能：Drill采用了分布式执行和列式存储的技术，以及查询优化器来提高查询性能和执行效率。
智能优化：Drill利用智能优化器来选择合适的执行计划，以提高查询的性能和吞吐量。
动态模式发现：Drill可以在查询时动态发现数据的模式，无需预先定义模式或元数据，这使得查询非结构化或变化频繁的数据变得更加方便。
容错性：Drill具有容错性，支持失败恢复和故障转移，保证查询的可靠性。

总的来说，Apache Drill是一个强大的分布式SQL查询引擎，具有高性能、低延迟、查询多种数据源等特点，使得在大规模数据集上进行SQL查询变得更加方便和高效。它是一个非常有价值的工具，特别适用于需要在多种数据源中进行复杂查询和分析的场景。

⚫ Impala

Impala是由Cloudera开发的开源分布式SQL查询引擎，旨在实现高性能、低延迟的SQL查询，可以直接查询Hadoop分布式文件系统（HDFS）和HBase等存储系统中的数据。Impala是基于Google的Dremel论文所提出的技术概念，它允许用户通过标准的SQL语句来查询和分析大规模数据集，而无需将数据转换为其他格式或进行复杂的数据迁移。

以下是Impala的主要特点和功能：

分布式查询：Impala是构建在Hadoop分布式计算平台之上的，它能够在大规模数据集上并行执行查询任务，利用集群的计算资源来提高查询性能。
SQL兼容性：Impala支持标准的SQL查询语言，用户可以使用熟悉的SQL语法来查询和分析数据，从而降低了学习成本。
高性能：Impala采用了MPP（Massively Parallel Processing）架构，利用并行计算和内存计算技术来提高查询性能和响应速度。对于大规模数据集的复杂查询，Impala能够实现低延迟的查询结果。
与Hive兼容：Impala兼容Hive的元数据和表定义，可以与Hive和Hue等工具无缝集成，从而简化了数据处理和查询流程。
支持复杂数据类型：Impala支持复杂的数据类型，如数组、结构体、嵌套的数据等，使得对半结构化数据的查询变得更加灵活和方便。
支持多种文件格式：Impala支持多种数据文件格式，包括Parquet、Avro、ORC等，从而能够直接查询这些文件格式中的数据，无需进行额外的数据转换。
容错性：Impala具有容错性，支持故障转移和自动恢复，确保查询任务的可靠性。

总的来说，Impala是一个高性能、低延迟的分布式SQL查询引擎，适用于对大规模数据集进行复杂查询和分析的场景。它与Hadoop生态系统紧密集成，可以直接查询HDFS和HBase等存储系统中的数据，为用户提供了一个强大且方便的数据处理和查询工具。

⚫ Shark

Shark是一个由UC Berkeley AMP Lab开发的开源项目，它是在Apache Spark之上构建的分布式数据仓库系统。Shark的目标是提供一个高性能、低延迟的数据仓库系统，能够执行复杂的SQL查询和数据分析任务，并与Hive兼容。

Shark的主要特点和功能包括：

分布式SQL查询：Shark支持通过标准的SQL查询语言来执行数据查询和分析任务。它允许用户使用SQL语句对大规模数据集进行查询、过滤、聚合等操作。
基于Spark：Shark是构建在Apache Spark之上的，利用了Spark的内存计算和分布式计算能力，可以在大规模数据集上执行高性能的查询。
支持Hive：Shark兼容Hive的元数据和表定义，可以与Hive生态系统无缝集成，使得用户可以在Shark中运行现有的Hive查询。
高性能：Shark采用了列式存储和查询优化器，通过优化查询计划和并行执行，实现了高性能和低延迟的数据查询。
多种数据格式支持：Shark支持多种数据文件格式，包括Parquet、Avro、ORC等，可以直接查询这些格式中的数据。
用户自定义函数（UDF）：Shark允许用户定义自己的UDF，以便进行自定义的数据处理和计算操作。
容错性：Shark具有容错性，支持故障转移和自动恢复，保证查询任务的可靠性。

需要注意的是，Shark在较早的版本中是基于Hive的一个改进版本，后来随着Spark SQL的出现，Spark SQL逐渐取代了Shark。目前，Spark SQL已经成为Apache Spark的正式组件，并且提供了更加丰富和强大的功能，因此建议使用Spark SQL来代替Shark进行数据仓库和SQL查询的任务。

其中 Shark 是伯克利实验室 Spark 生态环境的组件之一，是基于 Hive 所开发的工具，它修改了下图所示的右下角的内存管理、物理计划、执行三个模块，并使之能运行在 Spark 引擎上。

Shark 的出现，使得 SQL-on-Hadoop 的性能比 Hive 有了 10-100 倍的提高。

但是，随着 Spark 的发展，对于野心勃勃的 Spark 团队来说，Shark 对于 Hive 的太多依赖（如采用 Hive 的语法解析器、查询优化器等等），制约了 Spark 的 One Stack Rule Them All的既定方针，制约了 Spark 各个组件的相互集成，所以提出了 SparkSQL 项目。
SparkSQL抛弃原有 Shark 的代码，汲取了 Shark 的一些优点，如内存列存储（In-Memory Columnar Storage）、Hive兼容性等，重新开发了SparkSQL代码；由于摆脱了对Hive的依赖性，SparkSQL无论在数据兼容、性能优化、组件扩展方面都得到了极大的方便，真可谓“退一步，海阔天空”。

➢ 数据兼容方面 SparkSQL 不但兼容 Hive，还可以从 RDD、parquet 文件、JSON 文件中获取数据，未来版本甚至支持获取 RDBMS 数据以及 cassandra 等 NOSQL 数据；

➢ 性能优化方面除了采取 In-Memory Columnar Storage、byte-code generation 等优化技术外、将会引进 Cost Model 对查询进行动态评估、获取最佳物理计划等等；

➢ 组件扩展方面无论是 SQL 的语法解析器、分析器还是优化器都可以重新定义，进行扩展。

2014 年 6 月 1 日 Shark 项目和 SparkSQL 项目的主持人 Reynold Xin 宣布：停止对 Shark 的开发，团队将所有资源放 SparkSQL 项目上，至此，Shark 的发展画上了句话，但也因此发展出两个支线：SparkSQL 和 Hive on Spark。

Spark SQL

Spark SQL是Apache Spark中的一个模块，用于处理结构化数据。它提供了一个用于处理关系型数据的高级接口，并允许在Spark中执行SQL查询、操作DataFrame和DataSet等数据结构。

Spark SQL的主要功能包括：

DataFrame和DataSet：Spark SQL引入了DataFrame和DataSet两种数据结构，它们是以RDD为基础构建的，提供了更高级的API操作结构化数据。DataFrame是分布式数据集，类似于关系型数据库中的表，而DataSet是类型化的DataFrame，支持更丰富的类型操作。
SQL查询：Spark SQL允许通过标准的SQL查询语言来操作DataFrame和DataSet。用户可以使用SQL查询语句进行数据过滤、投影、聚合等操作。
数据源集成：Spark SQL支持连接多种数据源，包括Hive、JSON、Parquet、Avro等，以及其他外部数据源。这使得Spark SQL能够与不同类型的数据进行交互。
Catalyst优化器：Spark SQL引入了Catalyst优化器，它是一个可扩展的查询优化框架，用于优化查询计划。Catalyst优化器可以通过一系列的优化规则和转换来优化查询性能。
Hive兼容性：Spark SQL兼容Hive，可以直接运行Hive的查询。通过Hive兼容性，用户可以在不迁移数据的情况下将现有的Hive查询迁移到Spark中运行。
用户自定义函数（UDF）：Spark SQL允许用户定义自己的UDF，以便进行自定义的数据处理和计算操作。

Spark SQL提供了更高级的API和查询语言，使得在Spark上处理结构化数据更加方便和灵活。它与Spark的其他模块（如Spark Core和Spark Streaming）紧密集成，可以与它们无缝地协作，为分布式数据处理和分析提供了强大的功能。

Hive on Spark

Hive on Spark是将Hive与Apache Spark结合使用的一种方式，它是Hive和Spark的集成，旨在将Hive的数据仓库功能和Spark的分布式计算能力相结合，从而在大规模数据处理和查询中提供更好的性能和灵活性。

在Hive on Spark中，Hive作为数据仓库系统用于管理和查询结构化数据，而Spark用于执行实际的计算任务。Hive on Spark的主要目标是加速Hive查询，提高查询性能和扩展性，并支持更复杂的数据分析操作。

Hive on Spark的特点和优势包括：

加速查询性能：通过使用Spark的分布式计算引擎，Hive on Spark可以在大规模数据集上加速查询的执行。Spark的内存计算和数据并行处理能力可以显著提高查询性能。
内存计算：Hive on Spark可以利用Spark的内存计算特性，将部分数据加载到内存中进行计算，减少磁盘IO，进而提高计算效率。
动态分区和动态分桶：Hive on Spark支持动态分区和动态分桶，可以根据数据的特点和查询需求自动优化数据的存储和查询方式。
Hive UDF和UDAF支持：Hive on Spark支持Hive的用户自定义函数（UDF）和用户自定义聚合函数（UDAF），用户可以在Spark上运行自己定义的复杂计算逻辑。
资源管理：Hive on Spark可以利用Spark的资源管理器来管理执行任务的资源，确保作业的公平性和高效性。
Hive和Spark的无缝集成：Hive on Spark与Hive的原生语法和功能无缝集成，用户可以继续使用熟悉的Hive语法和API，而无需修改现有的查询和脚本。

需要注意的是，Hive on Spark并不是Hive的替代品，而是Hive的一个加强版。用户可以根据具体的场景和需求选择使用Hive on Spark还是原生Hive。对于大规模数据处理和复杂查询任务，特别是需要利用Spark的分布式计算能力时，Hive on Spark是一个非常有价值的选择。

其中 SparkSQL 作为 Spark 生态的一员继续发展，而不再受限于 Hive，只是兼容 Hive；而Hive on Spark 是一个 Hive 的发展计划，该计划将 Spark 作为 Hive 的底层引擎之一，也就是说，Hive 将不再受限于一个引擎，可以采用 Map-Reduce、Tez、Spark 等引擎。
对于开发人员来讲，SparkSQL 可以简化 RDD 的开发，提高开发效率，且执行效率非常快，所以实际工作中，基本上采用的就是 SparkSQL。Spark SQL 为了简化 RDD 的开发，提高开发效率，提供了 2 个编程抽象，类似 Spark Core 中的 RDD。

➢ DataFrame

DataFrame是Spark SQL中的一个核心概念，是一个分布式的数据集合，类似于关系型数据库中的表格或Pandas中的DataFrame。它是由行和列组成的二维数据结构，支持结构化数据的处理和查询。

DataFrame的特点和优势包括：

分布式计算：DataFrame是构建在Spark的分布式计算引擎之上的，它能够处理大规模数据集，并利用集群的并行处理能力进行高效的数据处理。
结构化数据：DataFrame是一种结构化数据集，每一列都有特定的数据类型，类似于关系型数据库中的表格。这使得DataFrame能够更好地适应结构化数据的处理需求。
延迟执行：Spark的DataFrame采用了惰性执行的策略，也就是说，它不会立即执行查询操作，而是等到需要得到最终结果时才进行实际计算，这样可以优化查询计划，提高计算性能。
API丰富：Spark提供了丰富的DataFrame API，支持多种数据操作和转换，包括过滤、映射、聚合、连接等，以及SQL查询操作，使得数据处理更加方便和灵活。
数据源支持：DataFrame支持多种数据源，包括Hive、JSON、Parquet、Avro等，以及其他外部数据源，这样可以方便地与不同类型的数据进行交互。
用户自定义函数（UDF）：DataFrame允许用户定义自己的UDF，以便进行自定义的数据处理和计算操作。
可优化性：通过使用Catalyst优化器，DataFrame可以在执行查询之前进行优化，优化查询计划，提高性能。

使用DataFrame，可以更方便地处理和分析结构化数据，它是Spark SQL中进行高级数据操作的核心工具。同时，由于DataFrame是构建在Spark分布式计算引擎之上的，因此也能够处理大规模数据，并充分利用集群的计算资源，提供高性能的数据处理能力。

➢ DataSet

DataSet是Spark SQL中的一个数据集合，是DataFrame的类型化版本。DataSet是在Spark 1.6版本中引入的，它结合了DataFrame的结构化数据处理能力和RDD的强类型特性，提供了更加强大和类型安全的数据操作。

DataSet的特点和优势包括：

强类型：DataSet是类型化的，它允许用户在编译时就指定数据类型，从而在编译时就能发现类型错误，提高了代码的健壮性和可维护性。相比之下，DataFrame是无类型的，只有在运行时才能发现类型错误。
类型安全：由于DataSet是类型化的，它可以在编译时捕获类型错误，避免了运行时类型转换错误，减少了bug的可能性。
API一致性：DataSet的API与DataFrame的API是一致的，大部分DataFrame的操作在DataSet中都可以使用。这使得从DataFrame迁移到DataSet变得更加容易。
查询优化：与DataFrame一样，DataSet也支持Catalyst优化器，可以优化查询计划，提高查询性能。
分布式计算：DataSet是构建在Spark的分布式计算引擎之上的，可以处理大规模数据集，并利用集群的并行处理能力进行高效的数据处理。
数据源支持：DataSet支持多种数据源，包括Hive、JSON、Parquet、Avro等，以及其他外部数据源，这样可以方便地与不同类型的数据进行交互。
用户自定义函数（UDF）：DataSet允许用户定义自己的UDF，以便进行自定义的数据处理和计算操作。
数据序列化：DataSet的数据在内存中以二进制格式进行序列化，从而减少了内存占用，提高了内存使用效率。

总的来说，DataSet是Spark SQL中更加强大和类型安全的数据结构，适用于那些需要更严格类型检查的应用场景。对于需要更加灵活和动态的数据处理，以及与其他非结构化数据源进行交互的场景，DataFrame可能更适合。

1.3 SparkSQL 特点

Spark SQL是Apache Spark中用于处理结构化数据的模块，它提供了一个用于处理关系型数据的高级接口，并允许在Spark中执行SQL查询、操作DataFrame和DataSet等数据结构。以下是Spark SQL的主要特点：

结构化数据处理：Spark SQL支持结构化数据的处理，可以通过DataFrame和DataSet这两种数据结构来处理和查询数据。这使得在Spark上处理结构化数据更加方便和灵活。
SQL查询：Spark SQL允许通过标准的SQL查询语言来操作DataFrame和DataSet。用户可以使用SQL查询语句进行数据过滤、投影、聚合等操作，从而更加方便地进行数据分析和查询。
分布式计算：Spark SQL是构建在Spark的分布式计算引擎之上的，可以处理大规模数据集，并利用集群的并行处理能力进行高效的数据处理。
内存计算：Spark SQL利用Spark的内存计算特性，将部分数据加载到内存中进行计算，减少磁盘IO，进而提高计算效率。
Catalyst优化器：Spark SQL引入了Catalyst优化器，它是一个可扩展的查询优化框架，用于优化查询计划。Catalyst优化器可以通过一系列的优化规则和转换来优化查询性能。
Hive兼容性：Spark SQL兼容Hive，可以直接运行Hive的查询。通过Hive兼容性，用户可以在不迁移数据的情况下将现有的Hive查询迁移到Spark中运行。
数据源集成：Spark SQL支持连接多种数据源，包括Hive、JSON、Parquet、Avro等，以及其他外部数据源。这使得Spark SQL能够与不同类型的数据进行交互。
用户自定义函数（UDF）：Spark SQL允许用户定义自己的UDF，以便进行自定义的数据处理和计算操作。
惰性执行：Spark SQL采用了惰性执行的策略，也就是说，它不会立即执行查询操作，而是等到需要得到最终结果时才进行实际计算，这样可以优化查询计划，提高计算性能。

总的来说，Spark SQL提供了一个功能强大的数据处理和查询引擎，结合了SQL查询、DataFrame和DataSet等数据结构，并充分利用Spark的分布式计算能力，适用于大规模数据处理和复杂查询任务。它是Apache Spark中重要的组成部分，为用户提供了更加高效和灵活的数据分析和查询功能。

1.3.1 易整合

无缝的整合了 SQL 查询和 Spark 编程

1.3.2 统一的数据访问

使用相同的方式连接不同的数据源

1.3.3 兼容 Hive

在已有的仓库上直接运行 SQL 或者 HiveQL

1.3.4 标准数据连接

通过 JDBC 或者 ODBC 来连接

1.4 DataFrame 是什么

在 Spark 中，DataFrame 是一种以 RDD 为基础的分布式数据集，类似于传统数据库中的二维表格。DataFrame 与 RDD 的主要区别在于，前者带有 schema 元信息，即 DataFrame所表示的二维表数据集的每一列都带有名称和类型。这使得 Spark SQL 得以洞察更多的结构信息，从而对藏于 DataFrame 背后的数据源以及作用于 DataFrame 之上的变换进行了针对性的优化，最终达到大幅提升运行时效率的目标。反观 RDD，由于无从得知所存数据元素的具体内部结构，Spark Core 只能在 stage 层面进行简单、通用的流水线优化。
同时，与 Hive 类似，DataFrame 也支持嵌套数据类型（struct、array 和 map）。从 API 易用性的角度上看，DataFrame API 提供的是一套高层的关系操作，比函数式的 RDD API 要更加友好，门槛更低。

上图直观地体现了 DataFrame 和 RDD 的区别。

左侧的 RDD[Person]虽然以 Person 为类型参数，但 Spark 框架本身不了解 Person 类的内部结构。而右侧的 DataFrame 却提供了详细的结构信息，使得 Spark SQL 可以清楚地知道该数据集中包含哪些列，每列的名称和类型各是什么。DataFrame 是为数据提供了 Schema 的视图。可以把它当做数据库中的一张表来对待DataFrame 也是懒执行的，但性能上比 RDD 要高，
主要原因：优化的执行计划，即查询计划通过 Spark catalyst optimiser 进行优化。比如下面一个例子:
为了说明查询优化，我们来看上图展示的人口数据分析的示例。图中构造了两个DataFrame，将它们 join 之后又做了一次 filter 操作。如果原封不动地执行这个执行计划，最终的执行效率是不高的。因为 join 是一个代价较大的操作，也可能会产生一个较大的数据集。如果我们能将 filter 下推到 join 下方，先对 DataFrame 进行过滤，再 join 过滤后的较小的结果集，便可以有效缩短执行时间。而 Spark SQL 的查询优化器正是这样做的。简而言之，逻辑查询计划优化就是一个利用基于关系代数的等价变换，将高成本的操作替换为低成本操作的过程。

1.5 DataSet 是什么

DataSet 是分布式数据集合。DataSet 是 Spark 1.6 中添加的一个新抽象，是 DataFrame的一个扩展。它提供了 RDD 的优势（强类型，使用强大的 lambda 函数的能力）以及 Spark SQL 优化执行引擎的优点。DataSet 也可以使用功能性的转换（操作 map，flatMap，filter等等）。

➢ DataSet 是 DataFrame API 的一个扩展，是 SparkSQL 最新的数据抽象

➢ 用户友好的 API 风格，既具有类型安全检查也具有 DataFrame 的查询优化特性；

➢ 用样例类来对 DataSet 中定义数据的结构信息，样例类中每个属性的名称直接映射到DataSet 中的字段名称；

➢ DataSet 是强类型的。比如可以有 DataSet[Car]，DataSet[Person]。

➢ DataFrame 是 DataSet 的特列，DataFrame=DataSet[Row] ，所以可以通过 as 方法将DataFrame 转换为 DataSet。Row 是一个类型，跟 Car、Person 这些的类型一样，所有的表结构信息都用 Row 来表示。获取数据时需要指定顺序。

你可能感兴趣的:(#,spark,SQL,大数据,spark,hive)

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
鲲鹏 ARM 架构麒麟 Lylin v10 安装 Nginx (离线) 焚木灵 arm开发架构 nginx 服务器
最近做一个银行的项目，银行的服务器是鲲鹏ARM架构的服务器，并且是麒麟v10的系统，这里记录一下在无法访问外网安装Nginx的方法。其他文章：鲲鹏ARM架构麒麟Lylinv10安装Mysql8.3(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Node和NVM(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Pm2(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装P
【Golang】 Golang 的 GORM 库中的 Rows 函数不爱洗脚的小滕 golang 开发语言后端
文章目录前言一、Rows函数解释二、代码实现三、总结前言在使用Go语言进行数据库操作时，GORM（GoObject-RelationalMapping）库是一个常用的工具。它提供了一种简洁和强大的方式来处理数据库操作。本文将介绍GORM库中的Rows函数，这是一个用于执行原生SQL查询并返回结果的函数。一、Rows函数解释在GORM库中，Rows函数用于执行原生SQL查询并返回*sql.Rows结
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
MySQL事务隔离级别和MVCC 简书徐小耳
MySQL事务隔离级别和MVCC参考：https://mp.weixin.qq.com/s/Jeg8656gGtkPteYWrG5_Nw1.MVCC只对读已提交和可重复的读有效果，而未提交读和串行则无意义。2.每条记录都会有trx_id(事务修改记录的id）和roll_pointer是一个指针指向旧版本的undo日志链表（row_id不是必必要的，如果有主键存在就不需要了）3.版本链的头结点就是记
【Death Note】网吧战神之7天爆肝渗透测试死亡笔记_sqlmap在默认情况下除了使用 char() 函数防止出现单引号 2401_84561374 程序员笔记
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！特殊服务端口2181zookeeper服务未授权访问
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
CentOS7 安装MySQL5.7.44 不要Null了 java centos mysql
1.下载mysql安装包，我放在百度网盘里(下方链接)链接：https://pan.baidu.com/s/1_Mn1XW_1mWdTV4mhnLG66A提取码：s31n2.首先看看以前是否安装过mysqlrpm-qa|grep-imysql如果已经安装过mysql会提示卸载mysqlrpm-emysql-…3.使用FinallShell或者Xftp进行上传放到/usr/local/mysql，没
非关系型数据库天秤-white nosql
一、为什么要用Nosql1.单机MySQL的时代。一个基本的网站访问量一般不会太大，单个数据库完全足够。那时候更多使用的静态网页html，服务器根本没有太大压力。这时候网站的瓶颈是什么？-数据量如果太大，一个机器放不下。-数据量太大需要建立数据的索引（B+Tree），一个服务器内存放不下。-访问量读写混合，一个服务器承受不了。2.memcached缓存+MySQL+垂直拆分（读写分离）。网站80%
JAVA基础灵静志远位运算加载 Date 字符串池覆盖
一、类的初始化顺序 1 （静态变量，静态代码块）-->（变量，初始化块）--> 构造器同一括号里的，根据它们在程序中的顺序来决定。上面所述是同一类中。如果是继承的情况，那就在父类到子类交替初始化。二、String 1 String a = "abc"; JAVA虚拟机首先在字符串池中查找是否已经存在了值为"abc"的对象，根
keepalived实现redis主从高可用 bylijinnan redis
方案说明两台机器（称为A和B），以统一的VIP对外提供服务 1.正常情况下，A和B都启动，B会把A的数据同步过来（B is slave of A） 2.当A挂了后，VIP漂移到B；B的keepalived 通知redis 执行：slaveof no one，由B提供服务 3.当A起来后，VIP不切换，仍在B上面；而A的keepalived 通知redis 执行slaveof B，开始
java文件操作大全 0624chenhong java
最近在博客园看到一篇比较全面的文件操作文章，转过来留着。 http://www.cnblogs.com/zhuocheng/archive/2011/12/12/2285290.html 转自http://blog.sina.com.cn/s/blog_4a9f789a0100ik3p.html 一.获得控制台用户输入的信息 &nbs
android学习任务不懂事的小屁孩工作
任务完成情况搞清楚带箭头的pupupwindows和不带的使用已完成熟练使用pupupwindows和alertdialog，并搞清楚两者的区别已完成熟练使用android的线程handler,并敲示例代码进行中了解游戏2048的流程，并完成其代码工作进行中-差几个actionbar 研究一下android的动画效果，写一个实例已完成复习fragem
zoom.js 换个号韩国红果果 oom
它的基于bootstrap 的 https://raw.github.com/twbs/bootstrap/master/js/transition.js transition.js模块引用顺序 <link rel="stylesheet" href="style/zoom.css"> <script src=&q
详解Oracle云操作系统Solaris 11.2 蓝儿唯美 Solaris
当Oracle发布Solaris 11时，它将自己的操作系统称为第一个面向云的操作系统。Oracle在发布Solaris 11.2时继续它以云为中心的基调。但是，这些说法没有告诉我们为什么Solaris是配得上云的。幸好，我们不需要等太久。Solaris11.2有4个重要的技术可以在一个有效的云实现中发挥重要作用：OpenStack、内核域、统一存档（UA）和弹性虚拟交换（EVS）。
spring学习——springmvc（一） a-john springMVC
Spring MVC基于模型-视图-控制器（Model-View-Controller，MVC）实现，能够帮助我们构建像Spring框架那样灵活和松耦合的Web应用程序。 1，跟踪Spring MVC的请求请求的第一站是Spring的DispatcherServlet。与大多数基于Java的Web框架一样，Spring MVC所有的请求都会通过一个前端控制器Servlet。前
hdu4342 History repeat itself-------多校联合五 aijuans 数论
水题就不多说什么了。 #include<iostream>#include<cstdlib>#include<stdio.h>#define ll __int64using namespace std;int main(){ int t; ll n; scanf("%d",&t); while(t--)
EJB和javabean的区别 asia007 bean ejb
EJB不是一般的JavaBean,EJB是企业级JavaBean,EJB一共分为3种,实体Bean,消息Bean,会话Bean,书写EJB是需要遵循一定的规范的,具体规范你可以参考相关的资料.另外,要运行EJB,你需要相应的EJB容器,比如Weblogic,Jboss等,而JavaBean不需要,只需要安装Tomcat就可以了 1.EJB用于服务端应用开发, 而JavaBeans
Struts的action和Result总结百合不是茶 struts Action配置 Result配置
一:Action的配置详解: 下面是一个Struts中一个空的Struts.xml的配置文件 <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC &quo
如何带好自已的团队 bijian1013 项目管理团队管理团队
在网上看到博客" 怎么才能让团队成员好好干活"的评论，觉得写的比较好。原文如下：我做团队管理有几年了吧，我和你分享一下我认为带好团队的几点： 1.诚信对团队内成员，无论是技术研究、交流、问题探讨，要尽可能的保持一种诚信的态度，用心去做好，你的团队会感觉得到。 2.努力提
Java代码混淆工具 sunjing ProGuard
Open Source Obfuscators ProGuard http://java-source.net/open-source/obfuscators/proguardProGuard is a free Java class file shrinker and obfuscator. It can detect and remove unused classes, fields, m
【Redis三】基于Redis sentinel的自动failover主从复制 bit1129 redis
在第二篇中使用2.8.17搭建了主从复制，但是它存在Master单点问题，为了解决这个问题，Redis从2.6开始引入sentinel，用于监控和管理Redis的主从复制环境，进行自动failover，即Master挂了后，sentinel自动从从服务器选出一个Master使主从复制集群仍然可以工作，如果Master醒来再次加入集群，只能以从服务器的形式工作。什么是Sentine
使用代理实现Hibernate Dao层自动事务白糖_ DAO spring AOP 框架 Hibernate
都说spring利用AOP实现自动事务处理机制非常好，但在只有hibernate这个框架情况下，我们开启session、管理事务就往往很麻烦。 public void save(Object obj){ Session session = this.getSession(); Transaction tran = session.beginTransaction(); try
maven3实战读书笔记 braveCS maven3
Maven简介是什么？ Is a software project management and comprehension tool.项目管理工具是基于POM概念(工程对象模型) [设计重复、编码重复、文档重复、构建重复，maven最大化消除了构建的重复] [与XP：简单、交流与反馈；测试驱动开发、十分钟构建、持续集成、富有信息的工作区] 功能：
编程之美-子数组的最大乘积 bylijinnan 编程之美
public class MaxProduct { /** * 编程之美子数组的最大乘积 * 题目: 给定一个长度为N的整数数组，只允许使用乘法，不能用除法，计算任意N-1个数的组合中乘积中最大的一组，并写出算法的时间复杂度。 * 以下程序对应书上两种方法，求得“乘积中最大的一组”的乘积——都是有溢出的可能的。 * 但按题目的意思，是要求得这个子数组，而不
读书笔记-2 chengxuyuancsdn 读书笔记
1、反射 2、oracle年-月-日时-分-秒 3、oracle创建有参、无参函数 4、oracle行转列 5、Struts2拦截器 6、Filter过滤器(web.xml) 1、反射 (1)检查类的结构在java.lang.reflect包里有3个类Field,Method,Constructor分别用于描述类的域、方法和构造器。 2、oracle年月日时分秒 s
[求学与房地产]慎重选择IT培训学校 comsci it
关于培训学校的教学和教师的问题,我们就不讨论了,我主要关心的是这个问题培训学校的教学楼和宿舍的环境和稳定性问题我们大家都知道，房子是一个比较昂贵的东西，特别是那种能够当教室的房子... &nb
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系 daizj oracle rman filesperset PARALLELISM
RMAN配置中通道(CHANNEL)相关参数 PARALLELISM 、FILESPERSET的关系转 PARALLELISM --- 我们还可以通过parallelism参数来指定同时"自动"创建多少个通道： RMAN > configure device type disk parallelism 3 ; 表示启动三个通道，可以加快备份恢复的速度。
简单排序:冒泡排序 dieslrae 冒泡排序
public void bubbleSort(int[] array){ for(int i=1;i<array.length;i++){ for(int k=0;k<array.length-i;k++){ if(array[k] > array[k+1]){
初二上学期难记单词三 dcj3sjt126com sciet
concert 音乐会 tonight 今晚 famous 有名的；著名的 song 歌曲 thousand 千 accident 事故；灾难 careless 粗心的，大意的 break 折断；断裂；破碎 heart 心（脏） happen 偶尔发生，碰巧 tourist 旅游者；观光者 science （自然）科学 marry 结婚 subject 题目；
I.安装Memcahce 1. 安装依赖包libevent Memcache需要安装libevent,所以安装前可能需要执行 Shell代码收藏代码 dcj3sjt126com redis
wget http://download.redis.io/redis-stable.tar.gz tar xvzf redis-stable.tar.gz cd redis-stable make 前面3步应该没有问题，主要的问题是执行make的时候，出现了异常。异常一： make[2]: cc: Command not found 异常原因：没有安装g
并发容器 shuizhaosi888 并发容器
通过并发容器来改善同步容器的性能，同步容器将所有对容器状态的访问都串行化，来实现线程安全，这种方式严重降低并发性，当多个线程访问时，吞吐量严重降低。并发容器ConcurrentHashMap 替代同步基于散列的Map，通过Lock控制。 &nb
Spring Security（12）——Remember-Me功能 234390216 Spring Security Remember Me 记住我
Remember-Me功能目录 1.1 概述 1.2 基于简单加密token的方法 1.3 基于持久化token的方法 1.4 Remember-Me相关接口和实现
位运算焦志广位运算
一、位运算符Ｃ语言提供了六种位运算符： & 按位与 | 按位或 ^ 按位异或 ~ 取反 << 左移 >> 右移 1. 按位与运算按位与运算符"&"是双目运算符。其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时，结果位才为1 ，否则为0。参与运算的数以补码方式出现。例如：9&am
nodejs 数据库连接 mongodb mysql liguangsong mongodb mysql node 数据库连接
1.mysql 连接 package.json中dependencies加入 "mysql":"~2.7.0" 执行 npm install 在config 下创建文件 database.js
java动态编译 olive6615 java HotSpot jvm 动态编译
在HotSpot虚拟机中，有两个技术是至关重要的，即动态编译(Dynamic compilation)和Profiling。 HotSpot是如何动态编译Javad的bytecode呢？Java bytecode是以解释方式被load到虚拟机的。HotSpot里有一个运行监视器，即Profile Monitor,专门监视
Storm0.9.5的集群部署配置优化 roadrunners 优化 storm.yaml
nimbus结点配置（storm.yaml）信息： # Licensed to the Apache Software Foundation (ASF) under one # or more contributor license agreements. See the NOTICE file # distributed with this work for additional inf
101个MySQL 的调节和优化的提示 tomcat_oracle mysql
　1. 拥有足够的物理内存来把整个InnoDB文件加载到内存中——在内存中访问文件时的速度要比在硬盘中访问时快的多。　　2. 不惜一切代价避免使用Swap交换分区 – 交换时是从硬盘读取的，它的速度很慢。　　3. 使用电池供电的RAM（注：RAM即随机存储器）。　　4. 使用高级的RAID（注：Redundant Arrays of Inexpensive Disks，即磁盘阵列
zoj 3829 Known Notation(贪心) 阿尔萨斯 ZOJ
题目链接：zoj 3829 Known Notation 题目大意：给定一个不完整的后缀表达式，要求有2种不同操作，用尽量少的操作使得表达式完整。解题思路：贪心，数字的个数要要保证比∗的个数多1，不够的话优先补在开头是最优的。然后遍历一遍字符串，碰到数字+1，碰到∗-1,保证数字的个数大于等1，如果不够减的话，可以和最后面的一个数字交换位置（用栈维护十分方便），因为添加和交换代价都是1