weixin_30319153

CentOS6安装各种大数据软件第十章：Spark集群安装和部署

1. Spark安装包的下载

下载Spark安装包地址:http://spark.apache.org/downloads.html

注:本次学习过程中我们选用比较新的spark版本spark2.2.0

上述方式获取Spark安装包的方式是使用官方编译好的安装包来进行安装的.官方一般只提供有限的几个匹配hadoop版本的编译包.所以,如果将来你需要特意匹配你自己的hadoop版本,这个时候就需要你自己去编译spark源码。一般情况下不建议自己编译源码，使用官方提供的即可。

2. Spark集群安装和部署

2.1. 上传安装包并进行解压

#解压安装包
tar -zxvf spark-2.2.0-bin-hadoop2.7.tgz -C /export/servers/
#对解压后的文件夹进行重命名
mv spark-2.2.0-bin-hadoop2.7/ spark-2.2.0

2.2. 修改spark-env.sh

在/export/servers/spark-2.2.0/conf配置文件目录下进行配置文件的修改

# 步骤一：将spark-env.sh.template这个文件重新命名为spark-env.sh
mv spark-env.sh.template spark-env.sh

# 步骤二：修改spark-env.sh这个配置文件,新增如下配置内容即可：
#设置JAVA_HOME目录
export JAVA_HOME=/export/servers/jdk1.8.0_144
#设置SCALA_HOME目录
export SCALA_HOME=/export/servers/scala-2.11.8
#设置SPARK主机的地址
export SPARK_MASTER_HOST=node01.ouyang.com
#设置SPARK主机的端口地址
export SPARK_MASTER_PORT=7077
#设置worker节点的内存大小
export SPARK_WORKER_MEMORY=1g
#设置HDFS文件系统的配置文件的位置
export HADOOP_CONF_DIR=/export/servers/hadoop-2.7.4/etc/hadoop

2.3. 修改slaves配置文件

# 步骤一：将slaves.template这个文件重新命名为slaves：
mv slaves.template slaves

# 步骤二：修改slaves配置文件中的内容,在里面添加worker节点的地址
# 配置从节点的地址
spark-node02.ouyang.com
spark-node03.ouyang.com

2.4. 配置Spark环境变量

打开/etc/profile，在该文件中添加如下内容：

#配置Spark环境变量
export SPARK_HOME=/opt/modules/spark-2.2.0
export PATH=$SPARK_HOME/bin:$PATH
export SPARK_HOME PATH

2.5. 将spark安装目录发送到其他服务器

使用scp命令,将spark的安装目录拷贝只远程其他节点

#拷贝spark安装目录道node02机器上
scp -r spark-2.2.0/ spark-node02.ouyang.com:$PWD
#拷贝spark安装目录到node03机器上
scp -r spark-2.2.0/ spark-node03. ouyang.com:$PWD
#拷贝/etc/profile至node02机器上
scp /etc/profile spark-node02. ouyang.com:/etc/
#拷贝/etc/profile至node03机器上
scp /etc/profile spark-node03. ouyang.com:/etc/

注:在每一台机器上使用source /etc/profile 让配置生效

2.6. Spark启动和停止

启动spark命令：在spark的跟目录下，执行如下命令

./sbin/start-all.sh

停止spark命令：

./sbin/stop-all.sh

2.7. 验证Spark集群是否启动成功

2.7.1. 使用jps命令查看进程

在各个节点使用jps命令进行查看，如果在节点1有master进程,在节点2和节点3上有worker进程,说明Spark集群启动成功。

2.7.2. 访问Spark集群的WEB UI界面,查看各个节点状态

访问地址：http://node01.ouyang.com:8080/#/login

界面如下：

2.7.3. 使用spark-shell测试spark集群是否启动成功

在任意一个节点上的Spark安装目录执行如下命令： ./bin/spark-shell

启动成功之后,界面如下:

2.8. Spark的注意事项

如果spark-env.sh配置文件中配置了SPARK_HADOOP_CONF这个配置选项,在使用spark-shell进行验证spark集群是否启动成功的时候,需要提前开启HDFS文件系统

3. Spark的高可用部署

3.1. Spark架构原理图

3.2. 高可用部署方案说明

Spark Standalone集群是Mater-Slaves架构的集群模式,和大部分的Master-Slaves 结构集群一样，存在着 Master 单点故障的问题。如何解决这个单点故障的问题，Spark 提供了两种方案：

第一种：基于文件系统的单点恢复；

第二种：基于zookeeper的Standby Master(Standby Masters with Zookeeper)

我们一般使用第二种方案，Spark HA高可用集群部署使用起来很简单,首先需要搭建一个Zookeeper集群,然后启动Zookeeper集群,最后在不同的节点上启动Master即可。

3.3. 修改spark-env.sh配置文件

在spark-env.sh配置文件中,注释掉单点主机Master地址,然后添加Spark HA高可用部署的地址

#设置SPARK主机的地址 注释掉此项
#export SPARK_MASTER_HOST=spark-node01.ouyang.com
#添加Spark高可用HA部署
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=spark-node01.ouyang.com:2181,spark-node02.ouyang.com:2181,spark-node03.ouyang.com:2181 -Dspark.deploy.zookeeper.dir=/spark"

参数说明：

spark.deploy.recoveryMode：恢复模式(Master重新启动的模式),主要有三种:1) zookeeper 2) FileSystem 3) NONE
spark.deploy.zookeeper.url：zookeeper的Server地址
spark.deploy.zookeeper.dir：保存Spark集群元数据的文件,目录.包括Worker,Driver和Application

3.4. 将配置文件发送至远程节点

在节点的spark安装目录下的conf目录执行如下命令

#将spark-env.sh拷贝至节点02机器上
scp spark-env.sh spark-node02.ouyang.com:$PWD
#将spark-env.sh拷贝至节点03机器上
scp spark-env.sh spark-node03.ouyang.com:$PWD

3.5. 验证Spark HA高可用

在普通模式下启动spark集群,只需要在主机上面执行start-all.sh就可以了.在高可用模式下启动Spark集群,首先需要在任意一台节点上启动start-all.sh命令.然后在另外一台节点上单独启动master.命令start-master.sh在节点一执行命令如下：

./sbin/start-all.sh

在节点二执行命令如下：

./sbin/start-master.sh

访问节点一和节点二的WEB UI界面：http://node01.ouyang.com:8080

会发现节点一的master是alive状态，节点二是standby状态。

此时手动杀死节点一的master，过1~2分钟，会发现节点二的master会变成aliver状态，节点一会显示不能连接。

4. Spark高可用一键启动脚本

# 启动脚本
ssh node01.ouyang.com "source /etc/profile;nohup sh ${SPARK_HOME}/sbin/start-all.sh  >/dev/null 2>&1 &"
sleep 3
ssh node02.ouyang.com "source /etc/profile;nohup sh ${SPARK_HOME}/sbin/start-master.sh  >/dev/null 2>&1 &"
# 停止脚本
ssh node01.ouyang.com "source /etc/profile;nohup sh ${SPARK_HOME}/sbin/stop-all.sh  >/dev/null 2>&1 &"
ssh node02.ouyang.com "source /etc/profile;nohup sh ${SPARK_HOME}/sbin/stop-master.sh  >/dev/null 2>&1 &"

5. Spark集群的运行模式

5.1. spark几种运行模式介绍

local（在开发环境中，进行快速测试的）
Standalone（在生成环境中，如果没有使用yarn，就用这个）
Yarn（生产环境中经常使用）
Mesos（很少用）

5.2. Spark Standalone运行模式配置及测试

5.2.1. Spark Standalone运行模式的依赖应用

- 修改log4j.properties

- 安装Hadoop

- 安装Spark Standalone

5.2.2. 配置spark-env.sh文件中关于Standalone选项

5.2.3. Standalone模式启动

sbin/start-all.sh

5.3. spark集群运行

客户端运行：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --deploy-mode client --master spark://spark-node04.ouyang.com:7077 --executor-memory 1G --total-executor-cores 2 examples/jars/spark-examples_2.11-2.2.0.jar 10

集群运行：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --deploy-mode cluster --master spark://spark-node11.ouyang.com:7077 --executor-memory 1G --total-executor-cores 2 examples/jars/spark-examples_2.11-2.2.0.jar 10

在Yarn上运行：

./bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode cluster --executor-memory 6G --num-executors 4 examples/jars/spark-examples_2.11-2.2.0.jar 10

6. Spark SQL与hive集成(spark-shell)

6.1. 需要配置的项目

6.1.1. 拷贝hive的配置文件hive-site.xml到spark的conf目录,记得检查hive-site.xml中metastore的url的配置：　　

#再spark的conf目录下的hive-site.xml文件中添加如下内容
<property>
 　　<name>hive.metastore.urisname>
 　　<value>thrift://node01.ouyang.com:9083value>
property>
# 再将spark的conf目录下的该文件发送到其他的spark节点。
scp hive-site.xml node02.ouyang.com:$PWD

6.1.2. 拷贝hive中MySQL的jar包到spark的jars目录下：　　

cp /export/servers/hive/lib/mysql-connector-java-5.1.37.jar /export/servers/spark-2.2.0/jars/
# 并将该jar包发送到其他的节点上：
scp mysql-connector-java-5.1.37.jar node02.ouyang.com:$PWD

6.1.3. 检查spark-env.sh文件中hadoop的配置项：

在spark的conf目录下的spark-evn.sh文件中是否有下述配置：

即要spark能访问hdfs集群。

6.2. 需要启动的服务

#启动mysql服务（hive依赖于hdfs和mysql，表的元数据存储在mysql中，具体数据存储在hdfs中）
service mysqld restart
#在hive的bin目录下启动hive的metastore服务（在spark的hive-site.xml添加的服务）
bin/hive --service metastore

6.3. 可以在hive中创建一张测试表

create table if not exists test(userid string,username string) row format delimited fields terminated by ' ' stored as textfile ;
--加载数据
load data local inpath '/opt/datas/student.txt' into table test;

6.4. 使用spark-shell操作hive中的表

#启动spar-shell服务（在spark的bin目录下，执行如下命令）
./spark-shell
#执行spark sql语句，对hive中的表进行查询
spark.sql("select * from student").show()

6.5. 将hive中的表通过spark sql导入的MySQL中

// 在spark-shell中，查询到hive表的数据，并将数据写入到一个DataFarme中
val df = spark.sql("select * from student")

// 将这个DateFarme的数据写入的MySQL中
df.write.format("jdbc").option("url", "jdbc:mysql://node01.ouyang.com:3306/test").option("dbtable", "test1").option("user", "root").option("password", "root").save()

将数据写入的MySQL的test数据库，并重新创建一个test1表来存储。

没有报错表示执行成功。

7. Spark SQL与Hive集成(spark sql)

7.1. spark-sql cli简介

7.2. 启动spark-sql

在spark的bin目录下，执行如下命令：
./spark-sql

7.3. 操作spark-sql

此时，可以跟操作MySQL数据库一样来操作hive中的表
#显示所有的表
show tables;
#显示所有的库
show databases;
#查询test
select * from test;

8. Spark SQL之ThriftServer和beeline使用

8.1. 概述

当对Spark SQL和Hive进行集成后，在spark的bin目录下启动spark sql服务，此时进行操作，虽然是直接使用sql语句，就可以通过spark sql操作hive中的数据，但会有很多的日志，此时可以启动一个服务，可以对数据进行友好显示。

参照官网:http://spark.apache.org/docs/2.2.0/sql-programming-guide.html#running-the-thrift-jdbcodbc-server

8.2. 启动thriftserver

在spark的sbin目录下执行如下命令：

./start-thriftserver.sh

启动之后可以通过访问4040端口查看到启动的spark job，如下图所示：

8.3. 连接beeline

在spark的bin目录下执行如下命令：

./beeline

连接上beeline后执行如下命令：

!connect jdbc:hive2://node01.ouyang.com:10000

输入hive的用户名和密码即可连接

9. Saprk SQL与HBase集成

#上传如下jar包到spark的jars目录下（所有spark的节点的该目录下都要上传）：

此时，即可以在spark-sql中查询到hive中的数据存储在hbase中的表了。

转载于:https://www.cnblogs.com/yangshibiao/p/10635583.html

容器革命：Docker 技术深度解析与未来趋势小红花大酒店 Docker 技术探秘 docker 容器运维
容器革命：Docker技术深度解析与未来趋势一、容器化技术的颠覆性价值在云计算与微服务架构蓬勃发展的今天，Docker作为容器化技术的代表，正深刻改变着软件交付的范式。传统虚拟机（VM）需要为每个应用实例配备完整的操作系统，导致资源浪费和启动延迟（分钟级）。而Docker通过操作系统级虚拟化，将应用及其依赖打包成轻量级容器，实现了秒级启动和MB级资源占用。这种技术突破使得开发团队能够以标准化方式构
2025 API 开发管理工具 Apipost 与 Apifox 全维度对比
在当今数字化转型的浪潮下，API开发与管理对于各类项目的成功实施至关重要。Apipost和Apifox两款API开发管理工具，各自有着独特的功能特性。本文将从多个维度对它们进行深入对比，为研发、测试人员提供全面的参考。一、API设计在大型企业级项目中，API设计的复杂性和定制性要求极高。以金融行业为例，不同法人行的业务规则差异巨大，从账户管理到交易处理，每个环节都需要精确且个性化的API设计。Ap
Golang基础笔记九之方法与接口后端go方法接口类型判断
本文首发于公众号：Hunter后端原文链接：Golang基础笔记九之方法与接口本篇笔记介绍Golang里方法和接口，以下是本篇笔记目录：方法接口用结构体实现类的功能1、方法首先介绍一下方法。方法是与特定类型关联的函数，我们在实现一个函数前，绑定一个类型，就实现了这个类型的方法。比如我们想实现一个结构体的方法，可以如下操作：typePersonstruct{ Namestring Age int
如何在YashanDB中实现数据分区管理数据库
在现代数据库系统中，随着数据量的持续增长以及业务需求的不断演变，如何高效、灵活地管理数据成为了重要的技术挑战。数据分区管理作为应对大规模数据存储的有效策略，能够显著提升数据库的性能和可管理性。数据分区技术通过将大型表拆分成smallermanageableunits（即分区），为查询、更新和维护提供了更高效的操作机制。本文将深入探讨如何在YashanDB数据库中实现有效的数据分区管理。分区管理的核
如何在YashanDB中实现数据趋势预测数据库
数据趋势预测已成为数据驱动决策中的一个重要方面。在面临海量数据时，如何精确而高效地提取潜在趋势，对于企业的战略规划具有重要意义。YashanDB作为一款高性能的数据库产品，提供多种存储和查询优化功能，使得实现数据趋势预测成为可能。特别是在数据存储结构和多版本并发控制（MVCC）等特性下，趋势预测的场景应用可以得到有效支持。数据分析基础在进行数据趋势预测之前，首先必须了解基础的数据分析过程。Yash
如何在YashanDB中实现与区块链的集成数据库
在当前的数字化时代，数据的安全性和完整性至关重要。随着区块链技术的兴起，企业对于如何将这项新兴技术与传统数据库（如YashanDB）相结合，已成为一个亟待解决的问题。区块链提供的数据不可篡改性使其成为加密金融、供应链管理以及智能合约等领域的重要组件。因此，如何实现YashanDB与区块链的无缝集成，便成为技术团队的重要任务。核心技术点YashanDB的事务和一致性管理YashanDB支持事务的AC
如何在YashanDB中实现自动化备份？数据库
引言在现代数据库管理系统中，数据的安全性和可恢复性越来越受到重视。尤其是在数据可能因人为失误、硬件故障或网络问题而丢失的情况下，自动化备份解决方案显得尤为重要。YashanDB作为一款高性能的关系型数据库，支持多种备份策略以确保数据的安全性和一致性。本文将深入探讨YashanDB的备份机制、支持的备份类型及如何实现自动化备份策略的具体步骤，旨在帮助数据库管理员和技术人员有效管理其数据备份工作。Ya
程序员在线接单微风粼粼 eclipse java tomcat jvm dubbo python 后端
十年Java全栈工程师在线接单Java程序代做，兼职接单，系统代做，二次开发，网站开发部署，项目合作，商业项目承包全栈开发，支持定制各种管理系统、小程序商用或个人使用等项目都接服务二:Java调试安装，idea，eclipse，项目运行，开发环境配置，工具安装，代码讲解，代码调试，代码运行，代码部署，项目调试，项目部署运行，javaweb，ssm，springboot,vue，项目设计，小程序功能
一、Docker：一场颠覆应用部署与运维的容器革命 IvanCodes Docker教程 docker 容器
作者：IvanCodes日期：2025年7月3日专栏：Docker教程在现代软件开发的世界里，Docker已经从一个新奇的工具演变成了一项基础性技术。它彻底改变了我们构建、打包、分发和运行应用程序的方式。无论你是开发者、运维工程师还是技术爱好者，理解Docker都是一项不可或缺的技能。本文将带你回顾Docker的发展历史，探索它能解决的实际问题，并清晰地解析其核心名词概念。一、Docker的“前世
如何在YashanDB中实施高效的存储管理？数据库
引言在现代数据库管理系统中，存储管理是至关重要的组成部分。它不仅影响数据的读取和写入速度，还直接关系到系统资源的利用率和整体性能。在YashanDB中，有效的存储管理能够显著提高数据库的性能和可用性。本文将深入探讨YashanDB的存储结构和管理机制，提供实用的技术分析和建议，以实现高效的存储管理。YashanDB的存储架构物理存储结构YashanDB的物理存储结构是对数据在底层磁盘上的存储方式进
如何在YashanDB中实施高效的数据清洗数据库
在现代数据管理中，高效的数据清洗已经成为确保数据质量和一致性的关键步骤。在面对大量数据的处理时，数据库系统常常遭遇性能瓶颈和数据一致性问题，尤其是在大规模应用场景中。YashanDB作为一个灵活的数据库解决方案，提供了多种功能强大的数据清洗工具，能够有效提升数据处理效率，帮助用户更好地维护和使用数据。本文旨在探讨如何在YashanDB中实施高效的数据清洗，涵盖核心技术、最佳实践以及具体实施建议。核
如何在YashanDB中实现多级缓存策略数据库
随着大数据时代的到来，数据存储和访问的效率要求越来越高。数据库技术在面对海量数据、高并发访问时，性能瓶颈逐渐凸显，尤其是响应时间和系统吞吐量成为开发者和DBA关注的重点。为了解决这些问题，缓存策略被引入作为一种有效的解决方案。然而，不同类型的缓存（如内存缓存、磁盘缓存等）之间需要协调工作，以达到最佳性能。在此背景下，YashanDB作为一个云原生数据库，支持多级缓存策略，为数据访问提供了灵活的加速
Python训练营打卡 Day53 yunvwugua__ python自学打卡 python 开发语言
对抗生成网络知识点回顾：对抗生成网络的思想：关注损失从何而来生成器、判别器nn.sequential容器：适合于按顺序运算的情况，简化前向传播写法leakyReLU介绍：避免relu的神经元失活现象对抗生成网络（GAN）知识点回顾对抗生成网络的思想思想：就像在餐厅中，有一个厨师（生成器）负责制作假菜，一个评论家（判别器）负责区分真菜和假菜。厨师的目标是制作出评论家无法区分的假菜，而评论家的目标是找
赋能运营团队：盘点9款值得投资的数字化运营管理解决方案运维观点
在现代企业运营中，选择合适的管理工具对提升团队效率和项目成功至关重要。以下为您推荐9款优秀的运营管理工具，帮助您优化工作流程。TrelloTrello是一款基于看板方法的项目管理工具，以其简洁直观的界面深受用户喜爱。该工具采用卡片式设计，用户可以创建不同的看板来管理各类项目，每个看板包含多个列表，列表中可添加任务卡片。Trello支持团队协作，成员可以在卡片上添加评论、附件和截止日期。其强大的集成
thinkphp5.0项目配置多MySQL数据库连接 thinkphp5mysql
公司项目需要连接2个MySQL数据库背景介绍:公司项目是基于fastadmin1.4.0.20230711开发的,里面用到的thinkphp版本是5.0.25,项目涉及到小程序端和设备端,之前做的是两个项目,但是部署在同一台服务器上,分别对应两个数据库,之前两个项目之间的交互是通过互相调用对方接口的方式实现的,优化的时候就想通过在一个项目中连接两个MySQL数据库的方式,避免互相调用带来的性能开销
Docker - Docker容器中安装Redis 那年夏天丶 Linux Docker docker 容器运维
前言：前面我介绍了如何在centOS环境下安装mysql和docker，Docker-阿里云服务安装Docker-CSDN博客，Docker-Docker容器中安装Mysql-CSDN博客下面我在介绍一下如何安装redis。一丶.通过docker拉取需要安装的Redis版本通过docker拉取需要安装的redis版本如：dockerpullredis:7.0直接拉取最新版本：dockerpullr
Elasticsearch 查询统计 A 字段全部为空的 B 字段（qbit）
前言本文对Elasticsearch7.17适用问题是有两个字符串字段app_id和owner，怎么查询app_id全部为空字符串的owner有哪些？查询DSL语句{"size":0,"aggs":{"owners":{"terms":{"field":"owner",//取决于owner字段的基数"size":10000},"aggs":{"non_empty_app_id_docs":{"fi
vue拖拽组件自定义指令，解决拖拽和点击事件冲突问题，解决拖拽组件在iframe上面延迟卡顿问题 weixin_51565477 vue.js javascript 前端
1.自定义指令directives:{drag(el,data,vnode){constoDiv=eloDiv.onmousedown=e=>{//获取ifream，解决拖拽组件在ifream上面卡顿-根据ifreampointerEventsletiframDiv=document.getElementById("screenProjection")if(iframDiv){console.lo
【CMake】CMake简介及使用示例晴雨日记 CMake c++
CMake简介CMake是一个跨平台的开源构建系统生成器，用于管理软件构建过程。它不直接编译代码，而是根据CMakeLists.txt文件生成标准构建文件（如Makefile、VisualStudio项目等），再调用底层工具（如gcc、MSVC）编译。核心优势：跨平台：支持Windows、Linux、macOS可扩展：支持C/C++/CUDA/Fortran等多种语言模块化：提供find_pack
Kubernetes：容器编排技术从入门到精通 IYA1738
本文还有配套的精品资源，点击获取简介：Kubernetes（K8s）是一个开源的容器编排系统，由CNCF维护，用于自动化容器化应用的部署、扩展和管理。本资料将深入探讨K8s的核心组件、架构以及如何优化Java应用的部署和运行。学习K8s将涵盖Master节点和Worker节点的功能、Pod管理、服务抽象、存储管理、资源组织、Java应用优化以及高级特性等内容。通过实践操作，加深对K8s的理解，提升
231转序和321转序的姿态角与四元数的变换关系(文末附VC++代码和Matlab验证代码) 小亨GNC颐园 matlab VC++运载火箭 321转序 231转序导弹导航初始化
近程战术导弹的转序一般采用231的顺序，先偏航、后俯仰、再滚转。远程导弹、运载火箭、某些垂直发射拦截导弹的初制导段会采用321的转序，先俯仰、后偏航、再滚转。这两种转下的姿态角与四元数的转换关系如下：321转序//--------惯性坐标系到箭体系的四元数--------------------//doublesic_T=sin(Theta_T_rad/2.0);余下的VC++代码和Matlab代
华为OD机试 2025B卷 - 货币单位转换(C++&Python&JAVA&JS&C语言) YOLO大师华为od c++python 华为OD机试华为OD机试2025B卷华为OD2025B卷华为OD机考2025B卷
2025B卷目录点击查看：华为OD机试2025B卷真题题库目录｜机考题库+算法考点详解2025B卷100分题型题目描述记账本上记录了若干条多国货币金额，需要转换成人民币分（fen），汇总后输出。每行记录一条金额，金额带有货币单位，格式为数字+单位，可能是单独元，或者单独分，或者元与分的组合。要求将这些货币全部换算成人民币分（fen）后进行汇总，汇总结果仅保留整数，小数部分舍弃。元和分的换算关系都是
5.31.15 使用图像到图像转换和 YOLO 技术对先前的乳房 X 光检查结果中的异常进行早期检测和分类托比-马奎尔深度学习基础知识 YOLO
在本研究中，我们研究了基于You-Only-Look-Once(YOLO)架构的端到端融合模型的有效性，该模型可同时检测和分类数字乳房X光检查中的可疑乳腺病变。包括四类病例：肿块、钙化、结构扭曲和正常，这些病例来自包含413个病例的私人数字乳房X光检查数据库。对于所有病例，先前的乳房X光检查（通常是1年前扫描的）均报告为正常，而当前的乳房X光检查被诊断为癌变（经活检证实）或健康。方法：建议将基于Y
Springboot项目快速部署（三）：Idea插件docker工具，结合Docker-Compose集群部署码专人L Java spring boot intellij-idea docker
文章目录一、实现目的二、实现过程第一步第二步一、实现目的本文主要讲解如何通过docker-compose进行单服务器部署多服务场景的快速处理，按之前文章讲解的内容，我们如果需要部署多个服务的话，且需要运行多次docker插件，且每次运行时都需要调整不同的端口，避免端口冲突，如果一台服务器部署了45个服务的时候，那就会导致发版流程变的异常繁琐，这时候我们就可以通过docker-compose的sca
C++编程语言入门指南 jdlxx_dongfangxing c++
一、C++语言概述C++是由丹麦计算机科学家BjarneStroustrup于1979年在贝尔实验室开发的一种静态类型、编译式、通用型编程语言。最初被称为"CwithClasses"(带类的C)，1983年更名为C++。它既具有高级语言的抽象特性，又保留了底层硬件操作能力，被广泛应用于系统软件、应用软件、驱动程序、嵌入式软件、高性能服务器和客户端应用以及娱乐软件等开发领域。作为C语言的超集，C++
C++二分查找入门指南
一、二分法概述二分查找（BinarySearch）是一种在‌有序数组‌中查找特定元素的高效算法。它的基本思想是通过不断将搜索范围减半来快速定位目标元素，时间复杂度为O(logn)，远优于线性查找的O(n)。二分法不仅用于查找，还广泛应用于求解各种数学和计算问题，如求方程的近似解、寻找最优解等。在计算机科学中，二分查找是最基础且最重要的算法之一，几乎所有程序员都需要熟练掌握。二、二分查找的基本原理二
Kubernetes (K8s) 详解：从入门到进阶半夏一 1024程序员节
Kubernetes(K8s)详解：从入门到进阶什么是Kubernetes？Kubernetes，通常简称为K8s，是一个开源的容器编排平台，用于自动化部署、扩展和管理容器化应用。它最初由Google开发，现在由CNCF（云原生计算基金会）维护。Kubernetes可以帮助开发人员和运维人员简化应用程序的管理，尤其是在云环境中。核心概念在深入Kubernetes的架构和使用之前，我们需要了解一些核
vue项目中借助vue-print-nb插件实现打印 cx&lavender vue.js npm
需求：打印页面部分内容插件原理：创建iframe，获取要打印的内容添加到iframe中，调用print()方法打印使用：一、安装插件npminstallvue-print-nb--save二、页面上导入并注册//导入插件importPrintfrom"vue-print-nb";exportdefault{//注册指令directives:{Print,},}三、提供容器并添加id四、给按钮添加v
七牛云前端面试题及参考答案（上）大模型大数据攻城狮前端 vue组件 reactjs 前端面经防抖节流 fiber
目录基本数据类型有哪些？typeofnull的结果是什么？null和undefined的区别是什么？let关键字的特点有哪些？this指向的规则是什么？箭头函数中this指向哪里？如何实现JavaScript的深拷贝和浅拷贝？数组去重的常见方法（手写代码）数组扁平化（手写，不能使用flat(Infinity)）forEach和map方法的区别是什么？闭包的应用场景：实现链式加法add(1)(2)(
【备战秋招】详解synchronized 来个offer8 备战秋招 java 开发语言 synchronized 秋招后端
底层原理synchronized是jvm层面的内置锁，又被成为监视器锁。使用synchronized之后，会在编译之后在同步的代码块前后加上monitorenter和monitorexit字节码指令，依赖操作系统底层互斥锁实现。执行monitorenter指令时会尝试获取对象锁，如果对象没有被锁定或者已经获得了锁，锁的计数器+1。此时其他竞争锁的线程则会进入等待队列中。执行monitorexit指
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

CentOS6安装各种大数据软件 第十章：Spark集群安装和部署

相关文章链接

1. Spark安装包的下载

2. Spark集群安装和部署

2.1. 上传安装包并进行解压

2.2. 修改spark-env.sh

2.3. 修改slaves配置文件

2.4. 配置Spark环境变量

2.5. 将spark安装目录发送到其他服务器

2.6. Spark启动和停止

2.7. 验证Spark集群是否启动成功

2.7.1. 使用jps命令查看进程

2.7.2. 访问Spark集群的WEB UI界面,查看各个节点状态

2.7.3. 使用spark-shell测试spark集群是否启动成功

2.8. Spark的注意事项

3. Spark的高可用部署

3.1. Spark架构原理图

3.2. 高可用部署方案说明

3.3. 修改spark-env.sh配置文件

3.4. 将配置文件发送至远程节点

3.5. 验证Spark HA高可用

4. Spark高可用一键启动脚本

5. Spark集群的运行模式

5.1. spark几种运行模式介绍

5.2. Spark Standalone运行模式配置及测试

5.2.1. Spark Standalone运行模式的依赖应用

5.2.2. 配置spark-env.sh文件中关于Standalone选项

5.2.3. Standalone模式启动

5.3. spark集群运行

6. Spark SQL与hive集成(spark-shell)

6.1. 需要配置的项目

6.1.1. 拷贝hive的配置文件hive-site.xml到spark的conf目录,记得检查hive-site.xml中metastore的url的配置：

6.1.2. 拷贝hive中MySQL的jar包到spark的jars目录下：

6.1.3. 检查spark-env.sh文件中hadoop的配置项：

6.2. 需要启动的服务

6.3. 可以在hive中创建一张测试表

6.4. 使用spark-shell操作hive中的表

6.5. 将hive中的表通过spark sql导入的MySQL中

7. Spark SQL与Hive集成(spark sql)

7.1. spark-sql cli简介

7.2. 启动spark-sql

7.3. 操作spark-sql

8. Spark SQL之ThriftServer和beeline使用

8.1. 概述

8.2. 启动thriftserver

8.3. 连接beeline

9. Saprk SQL与HBase集成

你可能感兴趣的:(CentOS6安装各种大数据软件 第十章：Spark集群安装和部署)

CentOS6安装各种大数据软件第十章：Spark集群安装和部署

6.1.1. 拷贝hive的配置文件hive-site.xml到spark的conf目录,记得检查hive-site.xml中metastore的url的配置：　　

6.1.2. 拷贝hive中MySQL的jar包到spark的jars目录下：　　

你可能感兴趣的:(CentOS6安装各种大数据软件第十章：Spark集群安装和部署)