k21325

奔跑在Docker上的Spark

原文：http://www.cnblogs.com/jasonfreak/p/5391190.html

1 为什么要在Docker上搭建Spark集群

他：为什么要在Docker上搭建Spark集群啊？

我：因为……我行啊！

　　MR和Spark都提供了local模式，即在单机上模拟多计算节点来执行任务。但是，像我这等手贱的新手，怎么会满足于“模拟”？很容易想到在单机上运行多个虚拟机作为计算节点，可是考虑到PC的资源有限，即使能将集群运行起来，再做其他的工作已经是超负荷了。Docker是一种相比虚拟机更加轻量级的虚拟化解决方案，所以在Docker上搭建Spark集群具有可行性。

2 网络拓扑

　　搭建一个有意义的小规模集群，我选择了3台服务器作为Spark计算节点（Worker）。集群中光有计算节点还不够，这3台服务器同时也作为分布式文件系统（HDFS）的数据节点（DataNode）。指定了哪些服务器用来计算，哪些用来存储之后，我们还需要指定来管理计算和存储的主节点。一个简单方案：我们可以让cloud1作为管理计算节点的主节点（Master），同时它也作为管理数据节点的主节点（NameNode）。

　　很容易看到简单方案不够完美：首先，要是cloud1作为NameNode宕机，整个分布式文件系统则无法工作。此时，我们应当采用基于HA的HDFS方案：由多个NameNode共同管理DataNode，但是只有一个NameNode处于活动（Active）状态，当活动的NameNode无法工作时，则需要其他NameNode候补。这里至少涉及2个关键技术：

如何共享NameNode的信息（EditLog）？NameNode存储的信息包括但不限于：数据在各DataNode上如何存储，哪些DataNode是可用的。所以，当活动的NameNode无法工作时，应当将这些信息传递给下一个被选中的NameNode。与其传递，不如所有的NameNode共享这些信息。这些信息将被分布式地存储在JournalNode上。在本集群中，我们使用所有3台服务器都作为JournalNode。cloud1和cloud2作为NameNode。
如何确保只有一个NameNode是活动的？当活动的NameNode无法工作时，如何确定下一个活动的Namenode？Zookeeper可以解决这两个问题，在本集群中，3台服务器都作为Zkserver节点。

　　再者，选用cloud1作为Master来管理计算（standalone）的方式对资源的利用率不比Yarn方式。所以，在本集群中选用cloud1做为ResourceManager，3台服务器都作为NodeManager）。

　　改进后的集群描述如下：

节点	Zkserver	NameNode	JournalNode	ResourceManager	NodeManager	Master	Worker
cloud1	√	√	√	√	√	√	√
cloud2	√	√	√	×	√	×	√
cloud3	√	×	√	×	√	×	√

3 Docker安装及配置

　　Docker有Windows/Mac/Linux版本。起初我处于对Docker的误解选择了Windows版本，Docker的核心程序必须运行在Linux上，故Windows版本的Docker实际上是利用VirtualBox运行着一个精简的Linux，然后在此Linux上运行Docker，最后在Docker上运行安装好应用的镜像。好家伙，盗梦空间！最终，我选择在CentOS上安装Linux版本的Docker。关于Docker，我们需要理解一个重要的概念：容器（Container）。容器是镜像运行的场所，可以在多个容器中运行同一个镜像。

　　Docker安装好之后，我们启动Docker服务：

1 systemctl start docker.service

　　我们可以拉一个Ubuntu镜像，基于该镜像我们搭建Spark集群：

1 docker pull ubuntu

　　下载好镜像到本地后，我们可以查看镜像：

1 docker images

　　使用run命令，创建一个容器来运行镜像：

1 docker run -it ubuntu

　　使用ps命令查看容器：

1 docker ps -a

　　使用commit命令来将容器提交为一个镜像：

1 docker commit <container id|name>

　　使用tag命令来为一个镜像打标签：

1 docker tag <mirror id> <tag>

　　使用start命令来启动一个容器：

1 docker start -a <container id|name>

　　在掌握了以上操作后，在Docker上搭建Spark集群的技术路线如下：

4 ssh安装及配置　

　　试想一下如何启动集群？手动去每个节点启动相应的服务？这显然是不合理的。HDFS，Yarn，Spark都支持单命令启动全部节点。在某个节点上执行的命令是如何发送至其他节点的呢？ssh服务帮助实现这一功能。关于ssh我们需要知道其分为服务端和客户端，服务端默认监听22号端口，客户端可与服务端建立连接，从而实现命令的传输。

　　docker服务启动后，可以看到宿主机上多了一块虚拟网卡（docker0），在我的机器中为172.17.0.1。启动容器后，容器的IP从172.17.0.2开始分配。我们不妨为集群分配IP地址如下：

域名	IP
cloud1	172.17.0.2
cloud2	172.17.0.3
cloud3	172.17.0.4

　　关闭所有容器后，新建一个容器，命名为cloud1:

1 #新建容器时需要指定这个容器的域名以及hosts文件
2 #参数：
3 #name：容器名称
4 #h：域名
5 #add-host：/etc/hosts文件中的域名与IP的映射
6 docker --name cloud1 -h cloud1 --add-host cloud1:172.17.0.2 --add-host cloud2:172.17.0.3 --add-host cloud3:172.17.0.4 -it ubuntu

　　在容器cloud1中通过apt工具来安装ssh：

1 apt-get install ssh

　　往~/.bashrc中加入ssh服务启动命令：

1 /usr/sbin/sshd

　　客户端不能任意地与服务端建立连接，或通过密码，或通过密钥认证。在这里我们使用密钥认证，生成客户端的私钥和公钥：

1 #私钥（~/.ssh/id_rsa）由客户端持有
2 #公钥（~/.ssh/id_rsa.pub）交给服务端
3 #已认证的公钥（~/.ssh/authorized_keys）由服务端持有，只有已认证公钥的客户端才能连接至服务端
4 #参数：
5 #t：加密方式
6 #P：密码    
7 ssh-keygen -t rsa -P ""

　　根据技术路线，由cloud1容器提交的镜像将生成cloud2容器和cloud3容器。要实现cloud1对cloud2和cloud3的ssh密钥认证连接，其实只要实现cloud1对本身的连接就可以了：

1 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

　　测试是否能连接成功：

1 ssh root@cloud1

5 基础环境安装

　　Java与Scala版本需要与其他软件的版本相匹配：

软件	版本
Java	1.8.0_77
Scala	2.10.6
Zookeeper	3.4.8
Hadoop	2.6.4
Spark	1.6.1

　　Java与Scala安装包下载后，均解压在/usr目录下。在~/.bashrc中添加环境变量:

1 export JAVA_HOME=/usr/jdk1.8.0_77
2 export PATH=$PATH:$JAVA_HOME/bin
3 export SCALA_HOME=/usr/scala-2.10.6
4 export PATH=$PATH:$SCALA_HOME/bin

6 Zookeeper安装及配置

　　Zookeeper安装包下载后，解压在/usr目录下。在~/.bashrc中添加环境变量:

1 export ZOOKEEPER_HOME=/usr/zookeeper-3.4.8
2 export PATH=$PATH:$ZOOKEEPER_HOME/bin

　　生成Zookeeper配置文件：

1 cp /usr/zookeeper-3.4.8/conf/zoo_sample.cfg /usr/zookeeper-3.4.8/conf/zoo.cfg

　　修改Zookeeper配置文件：

1 #数据存储目录修改为：
2 dataDir=/root/zookeeper/tmp
3 #在最后添加Zkserver配置信息：
4 server.1=cloud1:2888:3888
5 server.2=cloud2:2888:3888
6 server.3=cloud3:2888:3888

　　设置当前Zkserver信息：

1 #~/zookeeper/tmp/myid文件中保存的数字代表本机的Zkserver编号
2 #在此设置cloud1为编号为1的Zkserver，之后生成cloud2和cloud3之后还需要分别修改此文件
3 echo 1 > ~/zookeeper/tmp/myid

7 Hadoop安装及配置

　　Hadoop安装包下载后，解压在/usr目录下。在~/.bashrc中添加环境变量:

1 export HADOOP_HOME=/usr/hadoop-2.6.4
2 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

　　修改Hadoop启动配置文件（/usr/hadoop-2.6.4/etc/hadoop/hadoop-env.sh）：

1 #修改JAVA_HOME
2 export JAVA_HOME=/usr/jdk1.8.0_77

　　修改核心配置文件（/usr/hadoop-2.6.4/etc/hadoop/core-site.xml）：

参数	说明
fs.defaultFS	默认的文件系统
hadoop.tmp.dir	临时文件目录
ha.zookeeper.quorum	Zkserver信息

 1 <property>
 2     <name>fs.defaultFS</name>
 3     <value>hdfs://ns1</value>
 4 </property>
 5 <property>
 6     <name>hadoop.tmp.dir</name>
 7     <value>/root/hadoop/tmp</value>
 8 </property>
 9 <property>
10     <name>ha.zookeeper.quorum</name> 
11     <value>cloud1:2181,cloud2:2181,cloud3:2181</value>
12 </property>

　　修改HDFS配置文件（/usr/hadoop-2.6.4/etc/hadoop/hdfs-site.xml）：

参数	说明
dfs.nameservices	名称服务，在基于HA的HDFS中，用名称服务来表示当前活动的NameNode
dfs.ha.namenodes.<nameservie>	配置名称服务下有哪些NameNode
dfs.namenode.rpc-address.<nameservice>.<namenode>	配置NameNode远程调用地址
dfs.namenode.http-address.<nameservice>.<namenode>	配置NameNode浏览器访问地址
dfs.namenode.shared.edits.dir	配置名称服务对应的JournalNode
dfs.journalnode.edits.dir	JournalNode存储数据的路径

 1 <property>
 2     <name>dfs.nameservices</name>
 3     <value>ns1</value>
 4 </property>
 5 <property>
 6     <name>dfs.ha.namenodes.ns1</name>
 7     <value>nn1,nn2</value>
 8 </property>
 9 <property>
10     <name>dfs.namenode.rpc-address.ns1.nn1</name>
11     <value>cloud1:9000</value>
12 </property>
13 <property>
14     <name>dfs.namenode.http-address.ns1.nn1</name>
15     <value>cloud1:50070</value>
16 </property>
17 <property>
18     <name>dfs.namenode.rpc-address.ns1.nn2</name>
19     <value>cloud2:9000</value>
20 </property>
21 <property>
22     <name>dfs.namenode.http-address.ns1.nn2</name>
23     <value>cloud2:50070</value>
24 </property>
25 <property>
26     <name>dfs.namenode.shared.edits.dir</name> 
27     <value>qjournal://cloud1:8485;cloud2:8485;cloud3:8485/ns1</value>
28 </property>
29 <property>
30     <name>dfs.journalnode.edits.dir</name>
31     <value>/root/hadoop/journal</value>
32 </property>
33 <property>
34     <name>dfs.ha.automatic-failover.enabled</name>
35     <value>true</value>
36 </property>
37 <property>
38     <name>dfs.client.failover.proxy.provider.ns1</name>
39     <value>
40     org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
41     </value>
42 </property>
43 <property>
44     <name>dfs.ha.fencing.methods</name>
45     <value>
46     sshfence
47     shell(/bin/true)
48     </value>
49 </property>
50 <property>
51     <name>dfs.ha.fencing.ssh.private-key-files</name>
52     <value>/root/.ssh/id_rsa</value>
53 </property>
54 <property>
55     <name>dfs.ha.fencing.ssh.connect-timeout</name>
56     <value>30000</value>
57 </property>

　　修改Yarn的配置文件（/usr/hadoop-2.6.4/etc/hadoop/yarn-site.xml）：

参数	说明
yarn.resourcemanager.hostname	RescourceManager的地址，NodeManager的地址在slaves文件中定义

1 <property>
2     <name>yarn.resourcemanager.hostname</name>
3     <value>cloud1</value>
4 </property>
5 <property> 
6     <name>yarn.nodemanager.aux-services</name> 
7     <value>mapreduce_shuffle</value> 
8 </property>

　　修改指定DataNode和NodeManager的配置文件（/usr/hadoop-2.6.4/etc/hadoop/slaves）:

1 cloud1
2 cloud2
3 cloud3

8 Spark安装及配置

　　Spark安装包下载后，解压在/usr目录下。在~/.bashrc中添加环境变量:

1 export SPARK_HOME=/usr/spark-1.6.1-bin-hadoop2.6
2 export PATH=$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH

　　Spark启动配置文件：

1 cp /usr/spark-1.6.1-bin-hadoop2.6/conf/spark-env.sh.template /usr/spark-1.6.1-bin-hadoop2.6/conf/spark-env.sh

　　修改Spark启动配置文件（/usr/spark-1.6.1-bin-hadoop2.6/conf/spark-env.sh）：

参数	说明
SPARK_MASTER_IP	Master的地址，Worker的地址在slaves文件中定义

 1 export SPARK_MASTER_IP=cloud1
 2 export SPARK_WORKER_MEMORY=128m 
 3 export JAVA_HOME=/usr/jdk1.8.0_77 4 export SCALA_HOME=/usr/scala-2.10.6 5 export SPARK_HOME=/usr/spark-1.6.1-hadoop2.6 6 export HADOOP_CONF_DIR=/usr/hadoop-2.6.4/etc/hadoop 7 export SPARK_LIBRARY_PATH=$$SPARK_HOME/lib 
 8 export SCALA_LIBRARY_PATH=$SPARK_LIBRARY_PATH 
 9 export SPARK_WORKER_CORES=1 
10 export SPARK_WORKER_INSTANCES=1 
11 export SPARK_MASTER_PORT=7077

　　修改指定Worker的配置文件（/usr/spark-1.6.1-bin-hadoop2.6/conf/slaves）：

1 cloud1
2 cloud2
3 cloud3

9 集群部署

　　在宿主机上提交cloud1容器为新的镜像，并打其标签为Spark：

1 #提交cloud1容器，命令返回新镜像的编号
2 docker commit cloud1
3 #为新镜像打标签为Spark
4 docker tag <mirror id> Spark

　　基于Spark镜像创建cloud2和cloud3容器：

1 docker --name cloud2 -h cloud2 --add-host cloud1:172.17.0.2 --add-host cloud2:172.17.0.3 --add-host cloud3:172.17.0.4 -it Spark
2 docker --name cloud3 -h cloud3 --add-host cloud1:172.17.0.2 --add-host cloud2:172.17.0.3 --add-host cloud3:172.17.0.4 -it Spark

　　还记得之前提到的cloud2和cloud3的当前Zkserver还未配置吗？分别在cloud2和cloud3容器中修改Zookeeper配置：

1 #在cloud2执行
2 echo 2 > ~/zookeeper/tmp/myid
3 #在cloud3执行
4 echo 3 > ~/zookeeper/tmp/myid

　　在所有节点启动Zkserver（Zkserver并不是用ssh启动的，呵呵）：

1 zkServer.sh start

　　在所有节点查看Zkserver运行状态：

1 #显示连接不到Zkserver的错误，可稍后查看
2 #Master表示主Zkserver，Follower表示从Zkserver
3 Zkserver.sh status

　　初始化其中一个NameNode，就选cloud1吧：

1 #格式化zkfc
2 hdfs zkfc -formatZK
3 #格式化NameNode
4 hdfs namenode -format

　　在cloud1启动HDFS，Yarn，Spark：

1 #启动NameNode，DataNode，zkfc，JournalNode
2 start-dfs.sh
3 #启动ResouceManager，NodeManager
4 start-yarn.sh
5 #启动Master，Worker
6 start-all.sh

　　使用jps命令查看各节点服务运行情况：

1 jps

　　还可以登录web管理台来查看运行状况：

服务	地址
HDFS	cloud1:50070
Yarn	cloud1:8088
Spark	cloud1:8080

10 总结

环境搭建切不可知其然，但不知其所以然
明确自己的需求是什么，不可能一开始就弄懂所有配置项，掌握一个最小的知识集就好

11 参考资料

在Docker中从头部署自己的Spark集群
Docker (软件)
HDFS-HA的配置-----自动Failover
Spark:Yarn-cluster和Yarn-client区别与联系
Installation On CentOS

ECharts：数据可视化的魔法师，偶尔也会“皮”一下 Python私教 Web 使用Vue3进行前端开发 Vue 信息可视化 echarts 前端
在数据爆炸的时代，如何从海量数据中提取有价值的信息，并将其清晰易懂地呈现出来，成为了各行各业面临的共同挑战。数据可视化作为一种有效的信息传递手段，应运而生，并逐渐成为数据分析领域不可或缺的一部分。而在众多数据可视化工具中，ECharts凭借其强大的功能、灵活的配置和丰富的图表类型，脱颖而出，成为了众多开发者的首选利器。一、ECharts：数据可视化的利器ECharts是一个由百度开源的可视化图表库
掌握 SQLAlchemy 的一对一关系：6 个独立案例详解 Python私教 python FastAPI 数据库 jvm java 开发语言
在数据库设计中，一对一关系是一种常见的关系类型。例如，一个用户（User）可能对应一个用户详情（UserProfile），而一个用户详情只属于一个用户。SQLAlchemy提供了强大的工具来定义和操作这种关系。本文将通过6个独立的案例，详细讲解如何使用SQLAlchemy实现一对一关系，并覆盖各种常见的使用场景。每个案例都是完整的、可独立运行的脚本，方便你直接测试和学习。案例1：定义一对一关系并插
虚拟DOM 是三好 web补充 javascript 前端开发语言
一、DOM1、DOM的基本概念DOM将网页的结构表示为一个树形结构，其中每个元素、属性和文本都被表示为树中的一个节点。文档节点（DocumentNode）：树的根节点，代表整个HTML文档。元素节点（ElementNode）：代表HTML元素，例如、、等。属性节点（AttributeNode）：代表HTML元素的属性，例如id、class、href等。文本节点（TextNode）：代表HTML元素
第9章空闲任务与阻塞延时的实现--总结 LS·Cui freeRtos c语言物联网
整理野火《FreeRTOS内核实现与应用开发实战指南》—基于野火STM32全系列（M3/4/7）开发板文章目录第9章空闲任务与阻塞延时的实现9.1实现空闲任务9.1.1定义空闲任务的栈9.1.2定义空闲任务的任务控制块9.1.3创建空闲任务9.2实现阻塞延时9.2.1vTaskDelay()函数9.2.2修改vTaskSwitchContext()函数9.3SysTick中断服务函数9.3.1xT
智能手机混战谁能成为最后的王者？ nvxiaot 手机 htc iphone 三星 meego windows phone
智能手机混战谁能成为最后的王者？近几年来，智能手机随着价格的下降和性能/功能的增强，日益的加入到我们的生活当中，2010年第四季度，全球市场消费电子厂商记录出货1009亿部智能手机，远比出货为9210万台的PC高出很多，智能手机销量已经远超个人电脑来到我们的生活当中。当今最热门的智能手机生产厂商：HTC三星、摩托罗拉、诺基亚、索尼爱立信、LG，苹果，在这场智能手机的混战中谁才能成为最后的王者？以下
java版在线评标竞标邀标评审专家招标公告发布招投标系统源码 m0_72864708 java
功能描述1、门户管理：所有用户可在门户页面查看所有的公告信息及相关的通知信息。主要板块包含：招标公告、非招标公告、系统通知、政策法规。2、立项管理：企业用户可对需要采购的项目进行立项申请，并提交审批，查看所有的立项信息。主要功能包含：招标立项申请、非招标立项申请、采购立项管理。3、采购项目管理：可对项目采购过程全流程管理，包含功能有：评审人员的选取/抽取、基准价维护、供应商缴费审核、投标过程记录查
一定有人在首次使用DBeaver 时遇到oracle.jdbc.OracleDriver的问题七分seven oracle jar 数据库
问题：oracle.jdbc.OracleDriver；Can'tcreatedriverinstanceErrorcreatingdriver'Oracle'instance.Mostlikelyrequiredjarfilesaremissing.Youshouldconfigurejarsindriversettings.Reason:can'tloaddriverclass'oracle.
刚安装好postman接口测试工具，打开后白屏，怎么办？七分seven postman 测试工具
问题：postman刚安装好，打开出现白屏，或是一直加载的状态。解决方案：postman软件刚装好后，此时应该会提示你账号登录。此时，咱不要登录，直接将软件关闭，重新打开。重新打开时，不要登录，直接进入即可正常使用。很多同志出现白屏的原因，可能是掉进账号登录的坑里。postman基本的功能不登录也能正常使用。总结：解决首次打开postman白屏的关键在于不要去登录！！！
打开pycharm 报错：if you already have a 32-bit JDK installed,define a JAVE_HOME variable in 七分seven pycharm ide python
打开pycharm报错：ifyoualreadyhavea32-bitJDKinstalled,defineaJAVE_HOMEvariablein.......解决方案：1.检查当前的pycharm执行文件可能是32位的，而当前电脑的系统确实64位的。所以只需要找到或重新下载64位的pycharm执行文件即可解决。2.如果电脑是32位的系统，也需要注意jdk需要配置32位的环境变量。jdk的环境
快猫视频模板源码定制开发苹果CMS 可打包成双端APP 希希分享快猫视频模板源码
苹果CMS快猫视频网站模板源码，可用于开发双端APP，后台支持自定义参数，包括会员升级页面、视频、演员、专题、收藏和会员系统等完整模块。还可以直接指定某个分类下的视频为免费专区，具备完善的卡密支付体系，无需人工管理和挂码。该模板提供三种播放界面，分别适用于未注册会员、普通注册会员和VIP会员，每个界面的提示内容都不同。模板适用于PC和WAP，并且可以轻松打包成APP。除了网站LOGO和自定义广告等
Java程序设计（二十四）：基于SSM框架的基于的快递代取系统的设计与实现人工智能_SYBH 2025年java程序设计 java python 开发语言 spring boot spring 后端
引言随着电子商务的发展，越来越多的高校学生通过网购获取日常所需物品，快递服务也逐渐成为大学生活中不可或缺的一部分。然而，繁忙的学习与生活让部分学生无法及时领取自己的快递，因此基于高校校园的快递代取服务应运而生。本文将详细介绍如何基于SSM（Spring、SpringMVC、MyBatis）技术栈设计并实现一个高校快递代取系统，解决高校学生快递代取问题。通过该系统，管理员、代取人和发布者三类用户可以
Windows Server 2022 中文版、英文版下载 (2024 年 12 月更新) windows-server
WindowsServer2022中文版、英文版下载(2024年12月更新)WindowsServer2022x64,Version21H2(updatedDec2024)请访问原文链接：https://sysin.org/blog/windows-server-2022/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgWindowsServer2022采用先进的多层安全机制、A
电脑访问京东云私有云盘，电脑如何访问京东云私有云盘 windows-server
服务器远程连接是指通过网络技术，在远程位置控制和访问服务器。通过远程连接，用户可以在任何地方登录到自己的服务器，进行各种操作，如安装软件、运行程序、管理文件等，就像直接在服务器前操作一样。今天小编给大家讲解电脑如何访问京东云私有云盘。要使用电脑访问京东云私有云盘，您可以按照以下步骤进行操作：1.登录京东云控制台：打开京东云官方网站，输入您的账号和密码进行登录。2.访问私有云盘：登录后，在控制台的导
服务行业的数据管理实践：TapData Cloud 如何助力连锁酒店物业的全球化运营优化数据库
使用TapData，化繁为简，摆脱手动搭建、维护数据管道的诸多烦扰，轻量替代OGG,Kettle等同步工具，以及基于Kafka的ETL解决方案，「CDC+流处理+数据集成」组合拳，加速仓内数据流转，帮助企业将真正具有业务价值的数据作用到实处，将“实时数仓”方法论落进现实。TapData持续迭代产品能力，优化用户体验的同时，也在不断探索各行各业数据需求的底层逻辑，力求为行业用户提供更加简洁、更具针对
DRG／DIP医保结算中的偏差病例 DIPDRG分组器团队 dip 大数据
低倍率病例什么是低倍率？1、《国家医疗保障疾病诊断相关分组（CHS-DRG）分组与付费技术规范》中规定低倍率病例入组后住院费用一般低于该DRG病组支付标准30％。2、DIP低倍率病例入组后住院费用一般低于该DIP病种次均费用50％。低倍率病例产生的主要原因一是入组错误，即主要诊断选择错误、其他诊断或手术操作错填等，导致错误入组；二是治疗不充分，即患者由于病情过重出现死亡或者自身意愿提前自动出院，整
医疗机构关于DIP/DRG信息化建设 DIPDRG分组器团队数据库
推进DIP/DRG支付方式改革是一项系统性工程，牵一发而动全身。作为河北省DIP试点医院，河北医科大学第二医院将信息化与创新性管理理念融合，用好支付工具做好精细化管理，积极应对改革。■改革背景国家医疗保障局制定的《DRG/DIP支付方式改革三年行动计划》指出，为加快建立管用高效的医保支付机制，将分期分批加快推进改革进程：从2022到2024年，全面完成DRG/DIP付费方式改革任务，推动医保高质量
国际网络专线怎么开通？蓝讯小刘网络
在全球化日益加速的今天，企业越来越需要稳定、高效的网络来支撑他们的跨国业务。国际网络专线，作为外贸企业、出海企业等拓展全球业务的关键基础设施，其重要性不言而喻。那么，企业如何才能开通国际网络专线呢？本文将详细解析开通流程，帮助您的企业顺利搭建起通往国际市场的桥梁。一、选择服务商开通国际网络专线的第一步，是选择一个可靠的服务商。服务商不仅提供物理的网络连接，更应具备专业知识和技术支持，确保您的企业网
如何应对访问国外服务器缓慢的问题？SDWAN组网是性价比之选蓝讯小刘服务器运维
在全球化日益加深的今天，企业经常需要访问国外的服务器以进行远程办公、跨国业务处理、数据传输和视频会议等。然而，不少企业在使用中遇到了访问速度缓慢的问题。本文将介绍几种有效的解决方案，帮助提高访问效率。首先，我们来分析一下访问缓慢的原因：1.政策限制：为了维护国家网络的安全与稳定，我国对部分国外网站和服务器有一定的访问限制。2.技术障碍：国内与国际互联网的网络架构和协议存在差异，这可能导致数据传输不
企业如何安全合规地访问海外网站蓝讯小刘安全
国际专线、SD-WAN线路与VPN的利弊与风险在全球化背景下，中国的外贸企业以及海外公司分支机构、科研研发机构等，都需要频繁访问海外网站以开展正常业务。然而，企业访问海外网站的技术方式存在一定的合规风险。本文将概述三种访问海外网站的技术方式：国际专线、SD-WAN线路和VPN，并分析其利弊与风险。1.国际专线：这是一种合法合规的访问海外网站的方式，由国内三大通讯运营商授权或授权代理机构开通。虽然费
TikTok海外直播网络专线费用解析：跨境电商的网络新选择蓝讯小刘网络
在全球化的大潮中，跨境电商成为了连接不同国家和地区经济的重要桥梁。而要实现高效的跨境电商运营，稳定、高速的网络连接是必不可少的。TikTok海外直播网络专线即SD-WAN国际专线（就是土豆和马铃薯的区别），以其独特的优势，正逐渐成为跨境电商企业的首选网络解决方案。本文将深入解析SD-WAN国际专线的费用构成，并探讨其对全球跨境电商的影响。一、SD-WAN技术：跨境电商的网络新动力SD-WAN，即软
国际宽带专线多少钱一年？蓝讯小刘网络安全运维
国际宽带专线通常是外商投资企业、外贸出口企业，跨境电商等有国际联网需要和需求的企业业务，通常来说，三大运营商只针对一些国企、事业单位受理，由于资费较贵，所以通常不会像中小企业提供国际联网服务。行业现状：目前，市面上可以提供跨境专线国际联网服务的比比皆是，市场十分混乱，也导致了这个市场价格鱼龙混杂，服务质量、能力也是不同，所以有关部门也在整治和查处扰乱市场的行为，想办法规范通信市场。市场准入：目前，
【AI+可视化工具】实现流程图快速生成 Unity青子问题解决（软件疑难杂症）深度学习 Mermaid
代码绘制流程图的工具有很多，以下是一些常用的工具：Mermaid：Mermaid是一个基于Markdown的图表语言，可以生成各种类型的图表，包括流程图、时序图、甘特图等。Mermaid可以使用JavaScript或TypeScript进行编写，可以通过Node.js运行。Graphviz：Graphviz是一个开源的图形可视化工具，可以生成各种类型的图表，包括流程图、时序图、网络拓扑图等。Gra
【自动化】使用PlayWright+代理IP实现多环境隔离青塬科技 Python
Playwright是由微软公司2020年初发布的新一代自动化测试工具，相较于目前最常用的Selenium，它仅用一个API即可自动执行Chromium、Firefox、WebKit等主流浏览器自动化操作。对各种开发语言也有非常好的支持。常用的NodeJs、Java、python都有支持，且有丰富的文档参考。Python环境下的安装使用1、安装依赖库pipinstallplaywright2、安装
ESP32-C3入门教程 WiFi篇⑦——基于SoftAP 的 WiFi 智能配网小康师兄 ESP32-C3入门教程物联网 esp32 WiFi配网 SoftAP WiFi
文章目录一、前言二、WiFi配网方式三、功能简述四、源码实现一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读二、WiFi配网方式WiFi配网即：用户通过App/小程序/网页等途径将WiFi的SSID和密码等信息发送给ESP32，方式有
【趣学SQL】第三章：数据处理与管理 3.2 分区表与分区索引——给数据库做“分舱救灾“的硬核指南精通代码大仙数据库 sql
第三章：数据处理与管理3.2分区表与分区索引——给数据库做"分舱救灾"的硬核指南欢迎来到「数据库装修大队」！今天我们将化身"数据空间规划师"，用一家年订单量破亿的外卖平台崩溃案例，教你如何像整理衣柜一样优雅管理海量数据。3.2.1分区表的概念——当数据库变成"春运火车站"血泪案例：某外卖平台未做分区，导致：查询3个月前的订单需要扫描20亿行数据促销活动时数据库IOPS飙到10万+（相当于春运期间所
如何修改Chromium内核|浏览器指纹伪装|Puppeteer指纹|Playwright指纹- Chromium内核修改与浏览器指纹伪装方法-anti-fingerprint指纹浏览器如何搭建环境药尘韩立前端 javascript 开发语言 python 自动化 ai
Chromium内核是许多现代浏览器的基础，如Chrome和Edge。在进行网络爬取、自动化测试或数据挖掘等任务时，使用Puppeteer或Playwright等工具时，浏览器指纹的重要性不言而喻。本文将介绍如何修改Chromium内核以及浏览器指纹伪装的方法，以构建一个抗指纹的浏览环境。首先，了解如何修改Chromium内核是至关重要的。您可以从Chromium源代码仓库中获取最新的代码，并根据
用文字“画出”流程图：用 AI+Mermaid.js 构建出你心中的可视化世界敏编程流程图 javascript mermaid
Mermaid介绍首先，什么是Mermaid?Mermaid.js是一款开源流程图/序列图的文本制作工具，它允许你使用简单的文本语法来创建各种类型的图表。无论你是开发者、学生还是普通用户，Mermaid.js都能帮助你将复杂的信息以直观、易懂的方式呈现出来。在AI技术的加持下，Mermaid现已支持把用户内容自动转成对应的文本语法，从而达到自动生成流程图的目地。这不仅提高了工作效率，还使非专业用户
账号IP属地：依据手机号还是网络环境？ hgdlip 网络 ip 网络 tcp/ip 服务器
在数字化生活中，账号的IP属地信息往往成为我们关注的一个焦点。无论是出于安全考虑，还是为了满足某些特定服务的需求，了解账号IP属地的确定方式都显得尤为重要。那么，账号IP属地根据手机号还是网络来确定的呢？本文将深入探讨这一问题。一、IP地址与账号属地显示的基本原理IP地址，即互联网协议地址，是互联网中用于唯一标识网络设备的数字标签。每当我们的设备（如手机、电脑）连接到互联网时，都会被分配一个或多个
网络传输中的三张表，MAC地址表、ARP缓存表以及路由表 h490516509 网络编程
一：MAC地址表详解说到MAC地址表，就不得不说一下交换机的工作原理了，因为交换机是根据MAC地址表转发数据帧的。在交换机中有一张记录着局域网主机MAC地址与交换机接口的对应关系的表，交换机就是根据这张表负责将数据帧传输到指定的主机上的。交换机的工作原理交换机在接收到数据帧以后，首先、会记录数据帧中的源MAC地址和对应的接口到MAC表中，接着、会检查自己的MAC表中是否有数据帧中目标MAC地址的信
并发控制-文件锁 gophp高并发
在以往的项目中，遇到高并发大流量需求做并发控制的时候一般都使用redis分布式锁或者mysql加锁处理高并发情况。最近遇到一个php项目，没有安装redis,由于某种原因也不考虑使用mysql加锁控制并发，所以采用文件锁的方式控制并发，整理了下代码php版本classFileLock{/**@varstring锁名称唯一性*/privatestring$key;/**@varstring锁文件*/
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

奔跑在Docker上的Spark

原文：http://www.cnblogs.com/jasonfreak/p/5391190.html

目录

1 为什么要在Docker上搭建Spark集群

2 网络拓扑

3 Docker安装及配置

4 ssh安装及配置

5 基础环境安装

6 Zookeeper安装及配置

7 Hadoop安装及配置

8 Spark安装及配置

9 集群部署

10 总结

11 参考资料

你可能感兴趣的:(奔跑在Docker上的Spark)

4 ssh安装及配置