Waldocsdn

安装和使用分布式HDFS系统在CentOS 8上进行文件上传操作

文章目录

实验目的和背景
- 实验目的
- 实验背景
实验过程
- 步骤1：安装Java
- 步骤2：下载hadoop-3.3.1.tar.gz
- 步骤3：创建一个普通用户来运行Hadoop
Hadoop 概念
- Hadoop 整体设计
- HDFS
- HDFS 的节点
- - 命名节点 (NameNode)
  - 数据节点 (DataNode)
  - 副命名节点 (Secondary NameNode)
- MapReduce
- - 大数据处理
- MapReduce 概念
HDFS系统的常用命令和操作
HDFS系统的性能测试和优化方法
分布式HDFS系统面临哪些挑战和问题？
HDFS系统与其他分布式文件系统的比较
HDFS系统在大数据处理中的应用案例

实验目的和背景

实验目的

本实验的目的在于掌握在CentOS 8操作系统中安装和配置分布式Hadoop文件系统（HDFS）的基本技能，同时学习如何在HDFS系统上创建目录以及上传文件。通过实践这一过程，可以理解和体验大数据存储和处理的基本环境和步骤。

Hadoop分布式文件系统（HDFS）是一个可扩展且可靠的数据存储系统，专门设计用于存储和处理大量数据的需求。HDFS在大数据处理、机器学习和数据分析等领域有广泛的应用。通过本次实验，能够对HDFS的实际应用和操作有更深入的理解，掌握其核心技能，这对于未来大数据领域的学习和工作非常重要。

实验背景

在大数据时代，数据量日益增长，传统的数据存储系统已经难以满足需求。Hadoop分布式文件系统（HDFS）的出现，解决了这一问题。HDFS能够提供高吞吐量的数据访问，非常适合运行在商用硬件上。它的优点在于可以存储大量数据，处理能力强，且具有良好的扩展性。

HDFS是Apache Hadoop的一个重要组成部分，它为用户提供了一个分布式的文件存储系统。在HDFS中，数据被分割成块，然后被分布在集群的多个节点上。这样做的好处是可以有效地处理大规模的数据集，同时提供了数据冗余保护机制，以防止数据丢失。

CentOS是一个开源的Linux发行版，广泛应用于服务器和数据中心环境。由于其稳定性和安全性，CentOS成为了部署HDFS的理想选择。

在本次实验中，选择CentOS 8作为操作系统，以学习和实践如何在此环境中安装和配置HDFS。完成HDFS的配置后，将在HDFS系统上创建一个名为"count"的目录，并上传一个txt文件到该目录。这个过程将使我熟悉HDFS的基本操作和管理，包括文件上传和目录创建。

总的来说，通过这次实验，我将获得在实际环境中操作和管理HDFS的经验，这对于掌握大数据技术和理解分布式存储系统的工作原理至关重要。

实验过程

如何在CentOS8上面安装分布式HDFS系统，在HDFS系统上创建一个目录count，并上传一个txt文件该目录

步骤1：安装Java

以root用户登录CentOS 8

Hadoop运行需要Java环境，所以首先要在系统上安装Java。在命令行中输入以下命令：

sudo yum install java-1.8.0-openjdk

接下来，检查Java是否已经成功安装：

java -version

使用以下命令找出Java的安装路径，用于配置JAVA_HOME环境变量：

readlink -f $(which java)

步骤2：下载hadoop-3.3.1.tar.gz

在阿里云镜像站下载hadoop-3.3.1.tar.gz放于默认普通用户 “waldocentos” 的 “下载” 目录下：

步骤3：创建一个普通用户来运行Hadoop

以root用户登录CrentOS 8

创建一个普通用户来运行Hadoop，通常我们使用的用户名是"hadoop"。如果直接启动HDFS会报错。

首先，创建一个新用户：
```
adduser hadoop
```
然后为新用户设置密码：
```
passwd hadoop
```
将用户 “waldocentos” 的 “下载” 目录中的 “hadoop-3.3.1.tar.gz” 文件移动到用户 “hadoop” 的根目录：
```
sudo mv /home/waldocentos/下载/hadoop-3.3.1.tar.gz /home/hadoop/
```
这将会将 “hadoop-3.3.1.tar.gz” 文件从 “/home/waldocentos/Downloads” 目录移动到 “/home/hadoop” 目录下。使用 sudo 命令以管理员权限运行此命令，以确保您具有足够的权限来访问这些目录。
切换到新创建的hadoop用户：
```
su - hadoop
```
现在处于hadoop用户的主目录下，我这里是 /home/hadoop。
解压Hadoop：

解压文件，并在在hadoop用户的主目录下创建一个名为 “hadoop” 的目录，其中包含Hadoop的所有文件。
```
tar xvf hadoop-3.3.1.tar.gz
mv hadoop-3.3.1 hadoop
```

编辑你的 .bashrc 文件来设置环境变量。你可以使用 nano、vi 或你喜欢的任何文本编辑器：

nano .bashrc

在文件的末尾，添加以下行：

export HADOOP_HOME=/home/hadoop/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-2.el8_5.aarch64/jre

保存并关闭文件。然后，运行以下命令来应用新的环境变量：

source .bashrc

配置Hadoop。首先，编辑 hadoop-env.sh 文件：
```
nano $HADOOP_HOME/etc/hadoop/hadoop-env.sh
```
找到 export JAVA_HOME= 这一行，然后将其替换为：
```
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.312.b07-2.el8_5.aarch64/jre
```
保存并关闭文件。
设置SSH公钥和私钥，以便 “hadoop” 用户可以无密码登录到localhost：
```
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys
```
然后测试是否可以无密码登录：
```
ssh localhost
```
成功无密码登录到localhost。
初始化HDFS：
```
hdfs namenode -format
```
这将初始化Hadoop的名字节点，这是在首次启动Hadoop之前必须进行的步骤。
启动Hadoop：

启动Hadoop的分布式文件系统（DFS）和YARN资源管理器
```
start-dfs.sh
start-yarn.sh
```
检查Hadoop是否正常运行

使用以下命令查看正在运行的Java进程：
```
jps
```
在HDFS中创建一个新的目录"count"：

创建一个名为"count"的新目录。
```
hdfs dfs -mkdir ~/count
```
更改HDFS的~/count目录的权限，使hadoop用户具有写入权限
```
hdfs dfs -chmod 777 ~/count
```

上传txt文件到HDFS的"~/count"目录

hdfs dfs -put /home/hadoop/分布式第三次作业.txt ~/count

查看上传的文件：

cd count/
ls
vim 分布式第三次作业.txt

Hadoop 概念

Hadoop 整体设计

Hadoop 框架是用于计算机集群大数据处理的框架，所以它必须是一个可以部署在多台计算机上的软件。部署了 Hadoop 软件的主机之间通过套接字 (网络) 进行通讯。

Hadoop 主要包含 HDFS 和 MapReduce 两大组件，HDFS 负责分布储存数据，MapReduce 负责对数据进行映射、规约处理，并汇总处理结果。

Hadoop 框架最根本的原理就是利用大量的计算机同时运算来加快大量数据的处理速度。例如，一个搜索引擎公司要从上万亿条没有进行规约的数据中筛选和归纳热门词汇就需要组织大量的计算机组成集群来处理这些信息。如果使用传统数据库来处理这些信息的话，那将会花费很长的时间和很大的处理空间来处理数据，这个量级对于任何单计算机来说都变得难以实现，主要难度在于组织大量的硬件并高速地集成为一个计算机，即使成功实现也会产生昂贵的维护成本。

Hadoop 可以在多达几千台廉价的量产计算机上运行，并把它们组织为一个计算机集群。

一个 Hadoop 集群可以高效地储存数据、分配处理任务，这样会有很多好处。首先可以降低计算机的建造和维护成本，其次，一旦任何一个计算机出现了硬件故障，不会对整个计算机系统造成致命的影响，因为面向应用层开发的集群框架本身就必须假定计算机会出故障。

HDFS

Hadoop Distributed File System，Hadoop 分布式文件系统，简称 HDFS。

HDFS 用于在集群中储存文件，它所使用的核心思想是 Google 的 GFS 思想，可以存储很大的文件。

在服务器集群中，文件存储往往被要求高效而稳定，HDFS同时实现了这两个优点。

HDFS 高效的存储是通过计算机集群独立处理请求实现的。因为用户 (一半是后端程序) 在发出数据存储请求时，往往响应服务器正在处理其他请求，这是导致服务效率缓慢的主要原因。但如果响应服务器直接分配一个数据服务器给用户，然后用户直接与数据服务器交互，效率会快很多。

数据存储的稳定性往往通过"多存几份"的方式实现，HDFS 也使用了这种方式。HDFS 的存储单位是块 (Block) ，一个文件可能会被分为多个块储存在物理存储器中。因此 HDFS 往往会按照设定者的要求把数据块复制 n 份并存储在不同的数据节点 (储存数据的服务器) 上，如果一个数据节点发生故障数据也不会丢失。

HDFS 的节点

HDFS 运行在许多不同的计算机上，有的计算机专门用于存储数据，有的计算机专门用于指挥其它计算机储存数据。这里所提到的"计算机"我们可以称之为集群中的节点。

命名节点 (NameNode)

命名节点 (NameNode) 是用于指挥其它节点存储的节点。任何一个"文件系统"(File System, FS) 都需要具备根据文件路径映射到文件的功能，命名节点就是用于储存这些映射信息并提供映射服务的计算机，在整个 HDFS 系统中扮演"管理员"的角色，因此一个 HDFS 集群中只有一个命名节点。

数据节点 (DataNode)

数据节点 (DataNode) 使用来储存数据块的节点。当一个文件被命名节点承认并分块之后将会被储存到被分配的数据节点中去。数据节点具有储存数据、读写数据的功能，其中存储的数据块比较类似于硬盘中的"扇区"概念，是 HDFS 存储的基本单位。

副命名节点 (Secondary NameNode)

副命名节点 (Secondary NameNode) 别名"次命名节点"，是命名节点的"秘书"。这个形容很贴切，因为它并不能代替命名节点的工作，无论命名节点是否有能力继续工作。它主要负责分摊命名节点的压力、备份命名节点的状态并执行一些管理工作，如果命名节点要求它这样做的话。如果命名节点坏掉了，它也可以提供备份数据以恢复命名节点。副命名节点可以有多个。

MapReduce

MapReduce 的含义就像它的名字一样浅显：Map 和 Reduce (映射和规约) 。

大数据处理

大量数据的处理是一个典型的"道理简单，实施复杂"的事情。之所以"实施复杂"，主要是大量的数据使用传统方法处理时会导致硬件资源 (主要是内存) 不足。

现在有一段文字 (真实环境下这个字符串可能长达 1 PB 甚至更多) ，我们执行一个简单的"数字符"统计，即统计出这段文字中所有出现过的字符出现的数量：

AABABCABCDABCDE

统计之后的结果应该是：

字符	出现次数
A	5
B	4
C	3
D	2
E	1

统计的过程实际上很简单，就是每读取一个字符就要检查表中是否已经有相同的字符，如果没有就添加一条记录并将记录值设置为 1 ，如果有的话就直接将记录值增加 1。

但是如果我们将这里的统计对象由"字符"变成"词"，那么样本容量就瞬间变得非常大，以至于一台计算机可能难以统计数十亿用户一年来用过的"词"。

在这种情况下我们依然有办法完成这项工作——我们先把样本分成一段段能够令单台计算机处理的规模，然后一段段地进行统计，每执行完一次统计就对映射统计结果进行规约处理，即将统计结果合并到一个更庞大的数据结果中去，最终就可以完成大规模的数据规约。

在以上的案例中，第一阶段的整理工作就是"映射"，把数据进行分类和整理，到这里为止，我们可以得到一个相比于源数据小很多的结果。第二阶段的工作往往由集群来完成，整理完数据之后，我们需要将这些数据进行总体的归纳，毕竟有可能多个节点的映射结果出现重叠分类。这个过程中映射的结果将会进一步缩略成可获取的统计结果。

MapReduce 概念

我在 IBM 的网站上找到了一篇 MapReduce 文章，地址：https://www.ibm.com/analytics/hadoop/mapreduce 。现在我改编其中的一个 MapReduce 的处理案例来介绍 MapReduce 的原理细节以及相关概念。

这是一个非常简单的 MapReduce 示例。无论需要分析多少数据，关键原则都是相同的。

假设有 5 个文件，每个文件包含两列，分别记录一个城市的名称以及该城市在不同测量日期记录的相应温度。城市名称是键 (Key) ，温度是值 (Value) 。例如：(厦门，20)。现在我们要在所有数据中找到每个城市的最高温度 (请注意，每个文件中可能出现相同的城市)。

使用 MapReduce 框架，我们可以将其分解为 5 个映射任务，其中每个任务负责处理五个文件中的一个。每个映射任务会检查文件中的每条数据并返回该文件中每个城市的最高温度。

例如，对于以下数据：

城市	温度
厦门	12
上海	34
厦门	20
上海	15
北京	14
北京	16
厦门	24

上述数据的一个映射任务产生的结果如下所示：

城市	最高温度
厦门	24
上海	34
北京	16

假设其他四个映射器任务产生以下结果：

城市	最高温度
厦门	17
杭州	25
上海	29
北京	36
厦门	30
杭州	17
上海	31
北京	35
厦门	18
杭州	17
上海	17
北京	27
厦门	28
杭州	18
上海	14
北京	27

所有这 5 个结果将被输入到 Reduce 任务中，该任务组合输入结果并输出每个城市的单个值，产生如下的最终结果：

城市	最高温度
厦门	30
上海	34
北京	36
杭州	25

打个比方，你可以把 MapReduce 想象成人口普查，人口普查局会把若干个调查员派到每个城市。每个城市的每个人口普查人员都将统计该市的部分人口数量，然后将结果汇总返回首都。在首都，每个城市的统计结果将被规约到单个计数(各个城市的人口)，然后就可以确定国家的总人口。这种人到城市的映射是并行的，然后合并结果(Reduce)。这比派一个人以连续的方式清点全国中的每一个人效率高得多。

HDFS系统的常用命令和操作

Hadoop分布式文件系统（HDFS）有一系列命令行接口，用于与文件系统进行交互。以下是一些常用的HDFS命令和操作：

创建目录：使用mkdir命令来创建目录：
```
hdfs dfs -mkdir /user/hadoop/dirname
```
查看文件和目录列表：使用ls命令来查看文件和目录列表：
```
hdfs dfs -ls /user/hadoop
```

上传文件：使用put或copyFromLocal命令将本地文件上传到HDFS：

hdfs dfs -put localfile /user/hadoop/dirname

或

hdfs dfs -copyFromLocal localfile /user/hadoop/dirname

下载文件：使用get或copyToLocal命令将HDFS文件下载到本地：

hdfs dfs -get /user/hadoop/dirname/localfile

或

hdfs dfs -copyToLocal /user/hadoop/dirname/localfile

删除文件或目录：使用rm命令删除文件，使用rmdir命令删除空目录，使用-rm -r命令删除目录及其内容：
```
hdfs dfs -rm /user/hadoop/dirname/filename
hdfs dfs -rmdir /user/hadoop/dirname
hdfs dfs -rm -r /user/hadoop/dirname
```
查看文件内容：使用cat命令查看文件内容：
```
hdfs dfs -cat /user/hadoop/dirname/filename
```
移动或重命名文件和目录：使用mv命令移动或重命名文件和目录：
```
hdfs dfs -mv /user/hadoop/dirname/filename /user/hadoop/dirname/newfilename
```
查看文件系统的空间使用情况：使用df命令查看文件系统的空间使用情况：
```
hdfs dfs -df
```

以上是一些基本的HDFS命令，实际上，HDFS提供了许多其他的命令和选项，可以通过查阅Hadoop的官方文档或使用hdfs dfs -help命令来了解更多信息。

HDFS系统的性能测试和优化方法

为了获得更好的HDFS系统性能，我们需要进行性能测试和优化。以下是一些常见的HDFS系统性能测试和优化方法：

带宽测试

带宽测试是评估HDFS系统性能的一种方法，它可以测试文件上传和下载的速度。可以使用hadoop jar命令运行测试，例如：
```
hadoop jar hadoop-mapreduce-client-jobclient-2.7.1-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 100MB
```
这个命令将在HDFS系统上写入10个100MB的文件，并记录文件写入时间和带宽。测试完成后，可以查看测试结果并分析优化空间。
内存管理

HDFS系统中的内存管理也是影响性能的重要因素之一。可以通过配置参数来管理内存使用，例如：
- dfs.namenode.java.opts：控制NameNode使用的内存大小。
- dfs.datanode.java.opts：控制DataNode使用的内存大小。
- dfs.block.size：控制块大小，即每个文件块的大小。
通过适当的配置这些参数，可以优化内存使用，提高系统性能。
硬件优化

硬件优化也是提高HDFS系统性能的重要手段之一。可以使用更快的磁盘、更高带宽的网络、更快的CPU等硬件设备来提高系统性能。
数据分布优化

在大规模数据处理中，数据的分布方式也会影响系统性能。例如，如果数据分布不均匀，会导致某些节点的负载过重，从而降低系统性能。因此，需要通过数据分布优化来提高系统性能。
故障恢复优化

HDFS系统中的故障恢复也会影响系统性能。例如，如果在数据节点故障时需要重新复制数据，会降低系统性能。因此，需要通过优化故障恢复机制来提高系统性能。

综上所述，HDFS系统的性能测试和优化需要考虑多个方面，包括带宽、内存、硬件、数据分布和故障恢复等。通过优化这些方面，可以提高HDFS系统的性能，为大数据处理应用提供更好的支持。

分布式HDFS系统面临哪些挑战和问题？

分布式HDFS系统作为大数据处理的核心组件之一，在实际应用中面临着一些挑战和问题。以下是一些常见的挑战和问题：

高并发读写：由于大数据处理的数据量很大，因此HDFS系统需要支持高并发读写操作。这会给系统带来很大的压力，需要系统具备较高的性能和可扩展性。
数据安全性：随着大数据应用的不断增加，数据安全性问题也变得越来越重要。分布式HDFS系统需要具备一定的安全性保障机制，例如数据加密、权限控制等。
数据一致性：由于HDFS系统是分布式的，因此在数据写入和读取过程中可能会出现数据一致性问题。系统需要采取一些措施来保证数据的一致性，例如分布式锁、分布式事务等。
硬件故障：分布式HDFS系统包括多个节点，由于硬件故障、网络故障等原因，节点可能会出现故障。系统需要具备高可用性，可以在节点故障时自动切换到备用节点。
负载均衡：在分布式HDFS系统中，不同节点上的数据负载可能会不均衡。系统需要具备一定的负载均衡机制，以保证各节点负载均衡，提高整个系统的性能和可靠性。
大规模数据处理：随着大数据应用场景的扩展，HDFS系统需要处理越来越大规模的数据，这将对系统的性能和可扩展性提出更高的要求。

针对这些挑战和问题，HDFS系统的开发者们正在不断地进行研究和改进，以提高系统的性能和可靠性，为大数据处理应用提供更好的支持。

HDFS系统与其他分布式文件系统的比较

Hadoop分布式文件系统（HDFS）是大数据处理中常用的分布式文件系统，它与其他分布式文件系统（如Google的GFS，Facebook的Haystack，及开源的Ceph等）在设计理念和功能特性上有一些区别。以下是对这些系统的一些比较：

HDFS vs GFS（Google文件系统）：
- 设计目标：GFS和HDFS的设计目标非常相似，主要是为了处理大规模数据集，并能在廉价的商用硬件上运行。但是GFS主要是为Google内部使用，而HDFS作为Apache Hadoop的一部分，是开源的，可以被广泛使用。
- 体系结构：GFS和HDFS的体系结构类似，都采用了主/从结构。在HDFS中，NameNode负责元数据管理，DataNodes负责数据存储和检索。在GFS中，Master负责元数据管理，Chunkserver负责数据存储和检索。
- 数据冗余：GFS和HDFS都通过复制（Replication）实现数据冗余，以提高数据的可靠性和可用性。但是HDFS提供了更灵活的复制策略，例如，可以根据数据的重要性和访问频率设置不同的复制因子。
HDFS vs Haystack（Facebook）：
- 设计目标：Haystack是Facebook设计的一种特殊的分布式文件系统，主要用于存储和检索大量的图片数据。与HDFS相比，Haystack更关注存储密度和读取性能。
- 体系结构：Haystack的体系结构与HDFS不同，它没有明显的主/从结构。在Haystack中，所有的服务器都是等价的，每个服务器都可以处理读写请求。这种设计可以减少元数据的管理开销，提高存储密度和读取性能。
- 数据冗余：与HDFS和GFS一样，Haystack也使用复制来实现数据冗余。但是由于Haystack的设计特点，它的复制策略和HDFS有所不同，更关注数据的均匀分布和负载均衡。
HDFS vs Ceph：
- 设计目标：Ceph是一种开源的分布式文件系统，设计目标是提供高性能、高可靠性和高扩展性的存储服务。与HDFS相比，Ceph不仅可以处理大规模数据集，还支持POSIX兼容的文件系统接口，可以用于更广泛的应用场景。
- 体系结构：Ceph的体系结构与HDFS也不同，它使用了一种名为CRUSH的算法，实现了分布式的元数据管理。在Ceph中，没有专门的元数据服务器，所有的服务器都可以处理元数据和数据的读写请求，这种设计可以避免元数据的瓶颈，提高系统的可扩展性。
- 数据冗余：Ceph使用了一种名为Erasure Coding的技术，除了复制外，还可以通过编码来实现数据冗余。与复制相比，Erasure Coding可以提供同样级别的数据保护，但是存储开销更低。而HDFS虽然也支持Erasure Coding，但其主要还是以数据复制为主。
- 一致性模型：Ceph支持强一致性模型，即在任何时刻，所有的客户端都可以看到相同的数据。而HDFS则支持最终一致性模型，即在数据更新后，可能需要一段时间，所有的客户端才能看到相同的数据。强一致性模型可以简化应用程序的设计，但是可能会牺牲一些性能。
总的来说，HDFS、GFS、Haystack和Ceph等分布式文件系统各有优势，适用于不同的应用场景。HDFS作为Apache Hadoop的一部分，其优势在于处理大规模数据集，特别是在数据分析和机器学习等大数据处理场景中。

HDFS系统在大数据处理中的应用案例

Hadoop分布式文件系统（HDFS）在大数据处理中有许多应用案例，下面是一些具体的例子：

Facebook：Facebook是全球最大的社交媒体平台，它每天都会产生和处理海量的数据。这些数据包括用户信息、好友关系、用户行为、图片和视频等。Facebook使用HDFS作为其数据存储和处理的基础设施，以支持对这些数据的实时分析和挖掘。
雅虎：雅虎是早期使用Hadoop和HDFS的公司之一。雅虎使用HDFS来存储和处理其搜索引擎和广告系统产生的大量数据。通过在HDFS上对数据进行分析，雅虎能够改善其搜索引擎的性能，提高广告的定向精度。
LinkedIn：LinkedIn是全球最大的专业社交网络平台，它使用HDFS来存储和处理用户的职业信息、联系人关系和用户行为等数据。通过在HDFS上对这些数据进行分析，LinkedIn能够为用户提供更精确的职业发展建议和更合适的职位推荐。
Netflix：Netflix是全球最大的视频流媒体服务提供商，它每天都需要处理大量的视频内容、用户行为和服务质量等数据。Netflix使用HDFS作为其数据平台的一部分，通过对HDFS中的数据进行分析，Netflix能够提供更好的个性化推荐，改善用户体验，同时优化其网络性能和服务质量。
Twitter：Twitter是全球最大的微博社交平台，它每天都会产生大量的微博、用户行为和社交网络等数据。Twitter使用HDFS来存储和处理这些数据，通过对这些数据的实时分析，Twitter能够发现热点事件，监控公众舆情，同时为用户提供更好的内容推荐。

以上只是HDFS在大数据处理中的一些应用案例，实际上，HDFS已经被广泛应用于电子商务、金融、医疗、科研等许多领域。在这些领域中，HDFS都发挥着重要的角色，帮助企业和组织更好地存储和处理大数据，从而实现数据驱动的决策和优化。

你可能感兴趣的:(【Linux】,#,———Linux相关环境搭建,hdfs,hadoop,分布式)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Kafka是如何保证数据的安全性、可靠性和分区的喜欢猪猪 kafka 分布式
Kafka作为一个高性能、可扩展的分布式流处理平台，通过多种机制来确保数据的安全性、可靠性和分区的有效管理。以下是关于Kafka如何保证数据安全性、可靠性和分区的详细解析：一、数据安全性SSL/TLS加密：Kafka支持SSL/TLS协议，通过配置SSL证书和密钥来加密数据传输，确保数据在传输过程中不会被窃取或篡改。这一机制有效防止了中间人攻击，保护了数据的安全性。SASL认证：Kafka支持多种
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
华为云分布式缓存服务DCS 8月新特性发布华为云PaaS服务小智华为云分布式缓存
分布式缓存服务（DistributedCacheService，简称DCS）是华为云提供的一款兼容Redis的高速内存数据处理引擎，为您提供即开即用、安全可靠、弹性扩容、便捷管理的在线分布式缓存能力，满足用户高并发及数据快速访问的业务诉求。此次为大家带来DCS8月的特性更新内容，一起来看看吧！
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要