魔笛Love

Hadoop-HA高可用集群部署

Hadoop HA

HA 概述

(1)所谓 HA(High Availablity),即高可用(7*24 小时不中断服务)。

(2)实现高可用最关键的策略是消除单点故障。HA 严格来说应该分成各个组件的 HA机制:HDFS 的 HA 和 YARN 的 HA。

(3)NameNode 主要在以下两个方面影响 HDFS 集群

➢ NameNode 机器发生意外,如宕机,集群将无法使用,直到管理员重启

➢ NameNode 机器需要升级,包括软件、硬件升级,此时集群也将无法使用

HDFS HA 功能通过配置多个 NameNodes(Active/Standby)实现在集群中对 NameNode 的热备来解决上述问题。如果出现故障,如机器崩溃或机器需要升级维护,这时可通过此种方式将 NameNode 很快的切换到另外一台机器。

HDFS-HA 集群搭建

当前 HDFS 集群的规划

naenode206	naenode120	naenode101
NameNode		SecondaryNameNode
DataNode	DataNode	DataNode

HA 的主要目的是消除 namenode 的单点故障,需要将 hdfs 集群规划成以下模样

naenode206	naenode120	naenode101
NameNode	NameNode	NameNode
DataNode	DataNode	DataNode

HDFS-HA 核心问题

1)怎么保证三台 namenode 的数据一致

a.Fsimage:让一台 nn 生成数据,让其他机器 nn 同步

b.Edits:需要引进新的模块 JournalNode 来保证 edtis 的文件的数据一致性

2)怎么让同时只有一台 nn 是 active,其他所有是 standby 的

a.手动分配

b.自动分配

3)2nn 在 ha 架构中并不存在,定期合并 fsimage 和 edtis 的活谁来干

由 standby 的 nn 来干

4)如果 nn 真的发生了问题,怎么让其他的 nn 上位干活

a.手动故障转移

b.自动故障转移

HDFS-HA 手动模式

规划集群

naenode206	naenode120	naenode101
NameNode	NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode

配置 HDFS-HA 集群

1)官方地址:http://hadoop.apache.org/

2)将hadoop目录解压放到目录/home/nae/opt/module下，并将用户组权限设置为nae，如果之前目录下有data和log目录需要将其删除

3)配置 core-site.xml


<property>
    <name>fs.defaultFSname>
    <value>hdfs://myclustervalue>
property>

<property>
    <name>hadoop.tmp.dirname>
    <value>/home/nae/opt/module/hadoop-3.1.3/datavalue>
property>

4)配置 hdfs-site.xml


<property>
    <name>dfs.namenode.name.dirname>
    <value>file://${hadoop.tmp.dir}/namevalue>
property>

<property>
    <name>dfs.datanode.data.dirname>
    <value>file://${hadoop.tmp.dir}/datavalue>
property>

<property>
    <name>dfs.journalnode.edits.dirname>
    <value>${hadoop.tmp.dir}/jnvalue>
property>

<property>
    <name>dfs.nameservicesname>
    <value>myclustervalue>
property>

<property>
    <name>dfs.ha.namenodes.myclustername>
    <value>nn206,nn120,nn101value>
property>

<property>
    <name>dfs.namenode.rpc-address.mycluster.nn206name>
    <value>naenode206:8020value>
property>
<property>
    <name>dfs.namenode.rpc-address.mycluster.nn120name>
    <value>naenode120:8020value>
property>
<property>
    <name>dfs.namenode.rpc-address.mycluster.nn101name>
    <value>naenode101:8020value>
property>

<property>
    <name>dfs.namenode.http-address.mycluster.nn206name>
    <value>naenode206:9870value>
property>
<property>
    <name>dfs.namenode.http-address.mycluster.nn120name>
    <value>naenode120:9870value>
property>
<property>
    <name>dfs.namenode.http-address.mycluster.nn101name>
    <value>naenode101:9870value>
property>

<property>
    <name>dfs.namenode.shared.edits.dirname>
    <value>qjournal://naenode206:8485;naenode120:8485;naenode101:8485/myclustervalue>
property>

<property>
    <name>dfs.client.failover.proxy.provider.myclustername>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvidervalue>
property>

<property>
    <name>dfs.ha.fencing.methodsname>
    <value>sshfencevalue>
property>

<property>
    <name>dfs.ha.fencing.ssh.private-key-filesname>
    <value>/home/nae/.ssh/id_rsavalue>
property>

5)分发配置好的 hadoop 环境到其他节点

启动 HDFS-HA 集群

1)将 HADOOP_HOME 环境变量更改到 HA 目录(三台机器)

sudo vim /etc/profile.d/my_env.sh

## 将 HADOOP_HOME 部分改为如下
#HADOOP_HOME
export HADOOP_HOME=/opt/ha/hadoop-3.1.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

去三台机器上 source 环境变量

source /etc/profile

2)在各个 JournalNode 节点上,输入以下命令启动 journalnode 服务

hdfs --daemon start journalnode

3)在[nn206]上,对其进行格式化,并启动

hdfs namenode -format
hdfs --daemon start namenode

4)在[nn120]和[nn101]上,同步 nn1 的元数据信息

hdfs namenode -bootstrapStandby

5)启动[nn120]和[nn101]

hdfs --daemon start namenode

6)查看是否为Active

hdfs haadmin -getServiceState nn206
## 此时所有的节点均为standby

7)在所有节点上,启动 datanode

hdfs --daemon start datanode

9)将[nn206]切换为 Active，手动模式下，进行Active的提升，需要所有的nn节点都启动，这样是为了防止出现脑裂

hdfs haadmin -transitionToActive nn206

10)查看是否 Active

hdfs haadmin -getServiceState nn206
## 此时nn206成为Active

HDFS-HA 自动模式

HDFS-HA 自动故障转移工作机制

自动故障转移为 HDFS 部署增加了两个新组件:ZooKeeper 和 ZKFailoverController(ZKFC)进程,如图所示。ZooKeeper 是维护少量协调数据,通知客户端这些数据的改变和监视客户端故障的高可用服务。

HDFS-HA故障转移机制

在这里插入图片描述

HDFS-HA 自动故障转移的集群规划

naenode206	naenode120	naenode101
NameNode	NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
Zookeeper	Zookeeper	Zookeeper
ZKFC	ZKFC	ZKFC

配置 HDFS-HA 自动故障转移

1)具体配置

(1)在 core-site.xml 中配置


<property>
    <name>fs.defaultFSname>
    <value>hdfs://myclustervalue>
property>

<property>
    <name>hadoop.tmp.dirname>
    <value>/home/nae/opt/module/hadoop-3.1.3/datavalue>
property>

<property>
    <name>ha.zookeeper.quorumname>
    <value>naenode206:2181,naenode120:2181,naenode101:2181value>
property>

(2)在 hdfs-site.xml 中配置


<property>
    <name>dfs.ha.automatic-failover.enabledname>
    <value>truevalue>
property>

<property>
    <name>dfs.namenode.name.dirname>
    <value>file://${hadoop.tmp.dir}/namevalue>
property>

<property>
    <name>dfs.datanode.data.dirname>
    <value>file://${hadoop.tmp.dir}/datavalue>
property>

<property>
    <name>dfs.journalnode.edits.dirname>
    <value>${hadoop.tmp.dir}/jnvalue>
property>

<property>
    <name>dfs.nameservicesname>
    <value>myclustervalue>
property>

<property>
    <name>dfs.ha.namenodes.myclustername>
    <value>nn206,nn120,nn101value>
property>

<property>
    <name>dfs.namenode.rpc-address.mycluster.nn206name>
    <value>naenode206:8020value>
property>
<property>
    <name>dfs.namenode.rpc-address.mycluster.nn120name>
    <value>naenode120:8020value>
property>
<property>
    <name>dfs.namenode.rpc-address.mycluster.nn101name>
    <value>naenode101:8020value>
property>

<property>
    <name>dfs.namenode.http-address.mycluster.nn206name>
    <value>naenode206:9870value>
property>
<property>
    <name>dfs.namenode.http-address.mycluster.nn120name>
    <value>naenode120:9870value>
property>
<property>
    <name>dfs.namenode.http-address.mycluster.nn101name>
    <value>naenode101:9870value>
property>

<property>
    <name>dfs.namenode.shared.edits.dirname>
    <value>qjournal://naenode206:8485;naenode120:8485;naenode101:8485/myclustervalue>
property>

<property>
    <name>dfs.client.failover.proxy.provider.myclustername>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvidervalue>
property>

<property>
    <name>dfs.ha.fencing.methodsname>
    <value>sshfencevalue>
property>

<property>
    <name>dfs.ha.fencing.ssh.private-key-filesname>
    <value>/home/nae/.ssh/id_rsavalue>
property>

(3)修改后分发配置文件

2)启动

(1)在[nn206]上,对其进行格式化,并启动

hdfs namenode -format
hdfs --daemon start namenode

(2)在[nn120]和[nn101]上,同步 nn206 的元数据信息

hdfs namenode -bootstrapStandby

(3)启动Zookeeper,然后再初始化 HA 在 Zookeeper 中状态:

hdfs zkfc -formatZK

(4)启动 HDFS 服务:

start-dfs.sh

(5)可以去 zkCli.sh 客户端查看 Namenode 选举锁节点内容:

[zk: localhost:2181(CONNECTED) 0] get -s /hadoop-ha/mycluster/ActiveStandbyElectorLock

        myclusternn206
naenode206 �>(�>
cZxid = 0xa00d0c05a
ctime = Tue Jan 25 15:29:11 CST 2022
mZxid = 0xa00d0c05a
mtime = Tue Jan 25 15:29:11 CST 2022
pZxid = 0xa00d0c05a
cversion = 0
dataVersion = 0
aclVersion = 0
ephemeralOwner = 0x7800000b2e040016
dataLength = 36
numChildren = 0

此时naenode206为active节点，而其他节点为standby

3)验证

将 Active NameNode 进程 kill,查看网页端三台 Namenode 的状态变化，可以看到自动进行了故障转移。

并且所有的读写操作必须在active节点进行，不能在standby节点操作。因此需要进行上传时需要的active节点操作，或者使用以下语句

hadoop fs -put README.txt hdfs://mycluster/

解决 NN 连接不上 JN 的问题

自动故障转移配置好以后,然后使用 start-dfs.sh 群起脚本启动 hdfs 集群,有可能会遇到 NameNode 起来一会后,进程自动关闭的问题。查看 NameNode 日志,报错信息如下:

2020-08-17 10:11:40,658 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: hadoop104/192.168.6.104:8485. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
2020-08-17 10:11:40,659 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: hadoop102/192.168.6.102:8485. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
2020-08-17 10:11:40,659 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: hadoop103/192.168.6.103:8485. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

查看报错日志,可分析出报错原因是因为 NameNode 连接不上 JournalNode,而利用 jps 命令查看到三台 JN 都已经正常启动,为什么 NN 还是无法正常连接到 JN 呢?这是因为 start-dfs.sh 群起脚本默认的启动顺序是先启动 NN,再启动 DN,然后再启动 JN,并且默认的 rpc 连接参数是重试次数为 10,每次重试的间隔是 1s,也就是说启动完 NN以后的 10s 中内,JN 还启动不起来,NN 就会报错了。

core-default.xml 里面有两个参数如下:


<property>
    <name>ipc.client.connect.max.retriesname>
    <value>10value>
property>

<property>
    <name>ipc.client.connect.retry.intervalname>
    <value>1000value>
property>

解决方案:遇到上述问题后,可以稍等片刻,等 JN 成功启动后,手动启动下三台

hdfs --daemon start namenode

也可以在 core-site.xml 里面适当调大上面的两个参数:


<property>
    <name>ipc.client.connect.max.retriesname>
    <value>20value>
property>

<property>
    <name>ipc.client.connect.retry.intervalname>
    <value>5000value>
property>

YARN-HA 配置

YARN-HA 工作机制

1)官方文档:http://hadoop.apache.org/docs/r3.1.3/hadoop-yarn/hadoop-yarn-site/ResourceManagerHA.html

2)YARN-HA 工作机制

配置 YARN-HA 集群

规划集群

naenode206	naenode120	naenode101
ResourceManager	ResourceManager	ResourceManager
NodeManager	NodeManager	NodeManager
Zookeeper	Zookeeper	Zookeeper

核心问题

a .如果当前 active rm 挂了,其他 rm 怎么将其他 standby rm 上位

核心原理跟 hdfs 一样,利用了 zk 的临时节点

b. 当前 rm 上有很多的计算程序在等待运行,其他的 rm 怎么将这些程序接手过来接着跑

rm 会将当前的所有计算程序的状态存储在 zk 中,其他 rm 上位后会去读取,然后接

具体配置

yarn-site.xml

<property>
    <name>yarn.nodemanager.aux-servicesname>
    <value>mapreduce_shufflevalue>
property>

<property>
    <name>yarn.resourcemanager.ha.enabledname>
    <value>truevalue>
property>

<property>
    <name>yarn.resourcemanager.cluster-idname>
    <value>cluster-yarn1value>
property>


<property>
    <name>yarn.resourcemanager.ha.rm-idsname>
    <value>rm206,rm120,rm101value>
property>


<property>
    <name>yarn.resourcemanager.hostname.rm206name>
    <value>naenode206value>
property>

<property>
    <name>yarn.resourcemanager.webapp.address.rm206name>
    <value>naenode206:8088value>
property>

<property>
    <name>yarn.resourcemanager.address.rm206name>
    <value>naenode206:8032value>
property>

<property>
    <name>yarn.resourcemanager.scheduler.address.rm206name>
    <value>naenode206:8030value>
property>

<property>
    <name>yarn.resourcemanager.resource-tracker.address.rm206name>
    <value>naenode206:8031value>
property>


<property>
    <name>yarn.resourcemanager.hostname.rm120name>
    <value>naenode120value>
property>
<property>
    <name>yarn.resourcemanager.webapp.address.rm120name>
    <value>naenode120:8088value>
property>
<property>
    <name>yarn.resourcemanager.address.rm120name>
    <value>naenode120:8032value>
property>
<property>
    <name>yarn.resourcemanager.scheduler.address.rm120name>
    <value>naenode120:8030value>
property>
<property>
    <name>yarn.resourcemanager.resource-tracker.address.rm120name>
    <value>naenode120:8031value>
property>

<property>
    <name>yarn.resourcemanager.hostname.rm101name>
    <value>naenode101value>
property>
<property>
    <name>yarn.resourcemanager.webapp.address.rm101name>
    <value>naenode101:8088value>
property>
<property>
    <name>yarn.resourcemanager.address.rm101name>
    <value>naenode101:8032value>
property>
<property>
    <name>yarn.resourcemanager.scheduler.address.rm101name>
    <value>naenode101:8030value>
property>
<property>
    <name>yarn.resourcemanager.resource-tracker.address.rm101name>
    <value>naenode101:8031value>
property>


<property>
    <name>yarn.resourcemanager.zk-addressname>
    <value>naenode206:2181,naenode120:2181,naenode101:2181value>
property>

<property>
    <name>yarn.resourcemanager.recovery.enabledname>
    <value>truevalue>
property>

<property>
    <name>yarn.resourcemanager.store.classname>
    <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStorevalue>
property>

<property>
    <name>yarn.nodemanager.env-whitelistname>
    <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOMEvalue>
property>



<property>
    <name>yarn.log.server.urlname>
    <value>http://naenode206:19888/jobhistory/logsvalue>
property>


<property>
    <name>yarn.log-aggregation-enablename>
    <value>truevalue>
property>

<property>
    <name>yarn.log-aggregation.retain-secondsname>
    <value>604800value>
property>


<property>
    <name>yarn.nodemanager.local-dirsname>
    <value>file:///home/nae/opt/module/hadoop-3.2.2/yarnData/nmvalue>
property>

同步更新其他节点的配置信息,分发配置文件

启动 YARN

执行启动脚本

start-yarn.sh

查看服务状态

yarn rmadmin -getServiceState rm206

通过浏览器去访问的话所有standby节点会自动跳转到active节点。

Hadoop-HA 最终集群

naenode206	naenode120	naenode101
NameNode	NameNode	NameNode
JournalNode	JournalNode	JournalNode
DataNode	DataNode	DataNode
Zookeeper	Zookeeper	Zookeeper
ZKFC	ZKFC	ZKFC
ResourceManager	ResourceManager	ResourceManager
NodeManager	NodeManager	NodeManager

spring-boot+spring-cloud数据库报错小记 DoUbLE_tree
使用环境srping-boot:2.1.1.RELEASEspring-cloud:Finchley.SR2报错提示Description:Thebean'dataSource',definedinBeanDefinitiondefinedinclasspathresource[org/springframework/boot/autoconfigure/jdbc/DataSourceConfig
YOLO V8+Python训练手写数字识别 yuanpan YOLO python 开发语言
以下是针对Windows11+Python环境的详细步骤说明，从数据集整理到模型训练，全部适配YOLOv8流程。1.数据集整理（MNIST→YOLO格式）1.1下载MNIST数据集MNIST数据集可通过Python直接下载（无需手动下载）：python复制fromtorchvision.datasetsimportMNISTimportos#自动下载MNIST数据集（图片和标签）train_dat
Unity面试——lua(三)
简述Lua有哪8个类型?简述用途?nil空——可以表示无效值，全局变量（默认赋值为nil），赋值nil，使其被删除number整数table表——string字符userdata自定义function函数bool布尔thread线程If语句if(布尔表达式1)then–[在布尔表达式1为true时执行该语句块--]elseif(布尔表达式2)then–[在布尔表达式2为true时执行该语句块--]
grafana10.x报错 Failed to upgrade legacy queries Datasource x was not found 每天靠近一点点 grafana
问题grafana从6.x升级到10.x后，导入json文件后报错，数据源x查询不到，grafana不显示数据；TemplatingFailedtoupgradelegacyqueriesDatasourcexwasnotfound解决方法可能grafana升级后数据源找不到，在面板上重新选择数据源保存后，点击Inspect中的PanelJSON文件，查看更新后数据源的uid，在导入的json文件
【漫谈C语言和嵌入式002】嵌入式中的大小端 Seraphina_Lily 漫谈C语言和嵌入式 c语言开发语言
在计算机科学中，"端序"（Endianness）是指多字节数据类型（如整数或浮点数）在内存中的存储方式。主要分为两种：大端模式（Big-Endian）和小端模式（Little-Endian）。大端模式(Big-Endian)在大端模式中，多字节数据类型的最高有效字节（MSB）被存储在最低的内存地址上，而最低有效字节（LSB）则被存储在最高的内存地址上。这种存储方式与人类通常读数的方式一致，因此有时
小程序源码：全新超火的微信小说小程序源码-自带采集带安装教程-多玩法安装简单哔咔app下载入口微信小程序源码教程小程序源码小程序微信微信小程序
下面给大家带来一款最近超火的一款微信小说小程序源码本套源码自带采集,拿到手的时候没有安装教程不过小编在测试的时候给大家把安装教程给补上了安装教程:PHP选择5.6以上的版本上传我们的后端解压伪静态选择thinkphp修改数据库链接文件config/database.php然后我们导入数据库后台点击小程序把你的小程序该设置的设置就可以了小说的话就点击数据采集然后采集就可以了小程序首页轮播推荐和首页分
uniapp写好的弹窗组件 A了LONE uni-app 前端
效果图view部分点击打开弹窗确认退款是否确认申请退款？取消确定js部分data(){return{miniShowModal:false,//默认隐藏弹框}},methods:{//点击按钮弹出弹框miniToMdel(){this.miniShowModal=true;},//点击确定按钮时关闭弹框confirm(){this.closeOn()},//点击蒙版时关闭按钮miniHideMod
uniapp--腾讯地图路线轨迹回放前端志茗 uni-app json 前端微信小程序小程序
腾讯地图路线轨迹回放返回路线轨迹手动选择目的地开始驾车路线规划显示小车轨迹模拟运行//引入SDK核心类，地图组件importQQMapWXfrom'../components/qqmap-wx-jssdk1.2/qqmap-wx-jssdk.js'exportdefault{data(){return{qqmapsdk:{},//腾讯地图小程序的SDKtext:'路线轨迹，带小车图标',//滚动通
Uniapp之自定义图片预览会功夫的李白 #uniapp uni-app 前端 javascript 图片预览
场景在一些场景，uniapp的原生图片预览无法满足要求，比如自定义图片预览元素。另外原生的图片预览无法阻止截屏问题。示例exportdefault{data(){return{allDownload:false}},onBackPress(){//返回时判断是否关闭图片预览，否则关闭并阻止返回if(this.$refs.preImgPopup.isOpen()){this.$refs.preImg
hadoop 集群问题处理一切顺势而行 hadoop 大数据分布式
1.1.JournalNode的作用在HDFSHA配置中，为了实现两个NameNode之间的状态同步和故障自动切换，Hadoop使用了一组JournalNode来管理共享的编辑日志。具体来说，JournalNode的主要职责包括：共享编辑日志：JournalNode节点组成了一个分布式系统，用于存储HDFS的编辑日志（EditLogs）。这两个日志文件记录了对HDFS所做的所有更改，如文件创建、删
sqoop从mysql导数据到hdfs，出现java.lang.ClassNotFoundException: Class QueryResult not found 无级程序员大数据 sqoop mysql hdfs
运行sqoop从postgresql/mysql导入数据到hdfs,结果出现如下错误：2025-07-1816:59:13,624INFOorm.CompilationManager:HADOOP_MAPRED_HOMEis/opt/datasophon/hadoop-3.3.3Note:/opt/sqoop/bin/QueryResult.javausesoroverridesadeprecat
datasophon下dolphinscheduler执行脚本出错无级程序员大数据 hive 硬件架构 hadoop
执行hive脚本出错：错误消息：FAILED:RuntimeExceptionErrorloadinghooks(hive.exec.post.hooks):java.lang.ClassNotFoundException:org.apache.atlas.hive.hook.HiveHookatjava.net.URLClassLoader.findClass(URLClassLoader.ja
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
【可信数据空间】 flyair_China 安全
分阶段设计可信数据空间（TrustedDataSpace,TDS）方案，覆盖数据处理、存储、加密及AI工作流全生命周期。一、预备阶段（Preliminary）目标：定义数据空间治理框架组织对齐设立TDS治理委员会（含安全官、数据科学家、合规专家），制定《可信数据共享宪章》：数据主权原则：所有权、使用权、存储权分离（GDPR/CCPA合规）最小授权机制：基于用途的访问控制（Purpose-based
可信数据空间（Trusted Data Space）核心能力及行业赋能分析小赖同学啊 test Technology Precious 算法
可信数据空间（TrustedDataSpace）作为新一代数据共享基础设施，通过技术创新和治理框架的结合，为多行业提供安全、可控的数据流通能力。以下是其核心能力及行业赋能分析：一、可信数据空间的六大核心能力能力维度技术实现关键价值数据主权保障基于区块链的分布式身份（DID）属性基加密（ABE）数据所有者保持控制权，实现"数据可用不可见"安全共享计算联邦学习（FL）多方安全计算（MPC）可信执行环境
spring中spring-boot-configuration-processor的使用七七&556 面试学习路线阿里巴巴 spring java 后端
spring-boot-configuration-processor是SpringBoot提供的注解处理器，用于在编译阶段生成配置元数据文件（spring-configuration-metadata.json），从而优化开发体验。以下是其核心功能和使用指南：一、核心功能IDE智能提示为自定义的配置类（使用@ConfigurationProperties）生成元数据，使得在application
工业物联网中的时序数据库应用
1.引言工业物联网（IndustrialInternetofThings,IIoT）通过传感器、边缘计算和云计算等技术，实现设备数据的实时采集、存储与分析，以提高生产效率、预测设备故障并优化资源管理。然而，IIoT环境通常涉及高频、海量、多源异构的时序数据，传统数据库（如MySQL、Oracle）难以满足其高吞吐写入、低延迟查询和高效存储的需求。时序数据库（Time-SeriesDatabase,
时序数据库：数据库领域的未来之星数据库管理艺术数据库专家之路大数据AI人工智能 MCP&Agent SQL实战数据库时序数据库 ai
时序数据库：数据库领域的未来之星关键词：时序数据库、时间序列数据、物联网、大数据分析、数据库优化、TSDB、实时数据处理摘要：本文深入探讨了时序数据库(TimeSeriesDatabase,TSDB)这一新兴数据库技术。我们将从基本概念入手，分析时序数据库的核心原理和架构设计，详细讲解其特有的数据模型和存储机制。通过实际代码示例展示如何使用主流时序数据库处理时间序列数据，并探讨其在物联网、金融科技
可信数据空间：概念、架构与应用实践小赖同学啊 test Technology Precious 架构
可信数据空间：概念、架构与应用实践一、可信数据空间的核心定义可信数据空间（TrustedDataSpace）是一种基于技术架构与制度设计的安全数据共享生态，通过构建“数据可用不可见、可控可追溯”的流通环境，解决数据要素市场化过程中的隐私保护、主权确认、流通合规等核心问题。其本质是通过密码学、区块链、智能合约等技术组合，实现数据在不同主体间的可信交互，同时保障数据所有者的权益与安全。二、核心技术要素
RDS Proxy提高数据库可扩展性可用性GenAI taibaili2023 AWS
亚马逊云科技-RDSProxy改善数据库可扩展性GenAI关键字:[yt,AmazonRDSProxy,DatabaseScalability,RdsProxy,ConnectionPooling,SeamlessFailover,IamAuthentication]本文字数:400,阅读完需:2分钟导读演讲者介绍了”亚马逊云科技-RDSProxy改善数据库可扩展性GenAI”。在演讲中,他阐释了
aws rds mysql 连接_使用 Amazon RDS 代理连接到 Amazon RDS MySQL 数据库实例或 Aurora MySQL 数据库集群... 仁安同学 aws rds mysql 连接
如何使用AmazonRDS代理连接到我的AmazonRDSMySQL数据库实例或AuroraMySQL数据库集群？上次更新时间：2020年9月21日如何使用AmazonRDS代理连接到运行MySQL的AmazonRelationalDatabaseService(AmazonRDS)数据库实例或AmazonAurora数据库集群？简短描述您可以使用AmazonRDS代理来管理与应用程序之间的连接。
遥感云平台-GEE下载Landsat8/9影像数据（python）
内容介绍上期文章介绍如何在网页端导出Landsat8/9数据，本期主要介绍如何在本地GEE-python端导出数据以及出图。环境配置：Vscode+Jupyternotebook+gee+geemap+python3.10#导出所需要的包，注意提前安装ee和geemapimporteeimportosimportnumpyasnpimportgeemapfromgeemap.datasetsimp
深入理解Mysql索引底层数据结构与算法桑翔
一.索引的本质索引是帮助MySQL高效获取数据的排好序的数据结构二.索引数据结构1.二叉树2.红黑树3.Hash表4.B-Tree1.叶节点具有相同的深度,叶节点的指针为空2.所有索引元素不重复3.节点中的数据索引从左到右递增排序B-Tree5.B+Tree1.非叶子节点不存储data,可以放更多的索引2.叶子节点包含所有索引字段3.叶子节点用指针连接,提高区间访问的性能(体现在做范围查询的时候)
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
图片base64转存本地url 石小菜图片 php
//图片base64转存本地urlfunctionbase64_to_local_url(){$base64="data:image/jpeg;base64,/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC4zNDL/2
PyTorch笔记6----------神经网络案例 HuashuiMu花水木 PyTorch笔记 pytorch 笔记
1.回归网络波士顿房价预测模型搭建波士顿房价数据集下载链接：百度网盘请输入提取码提取码:5279导入所需包importtorchimportnumpyasnpimportre读取数据ff=open('housing.data').readlines()data=[]foriteminff:out=re.sub(r"\s{2,}","",item).strip()#通过正则表达式去除所有空格data
【laravel+redis】分布式锁的实现起灵人 php laravel redis laravel redis php
laravel官方支持“原子锁”，并且说“要使用这个功能，应用必须使用memcached、dynamodb、redis、database或array缓存驱动作为应用默认的缓存驱动，此外，所有服务器必须和同一台中央缓存服务器进行通信”。前半句不多解释，后半句也强调了laravel的原子锁不负责在集群架构中保障故障转移期间的数据安全性。我贴一下laravel的源码看一下它是怎样用redis实现的分布式
2018-06-28 tree 便利显示 lazyTai
image.png//rendertree.jsconstpaddingLeft={paddingLeft:10}functionrenderChildren(data,datasource,props){returnMap(data,item=>{return{renderChildren(datasource[item.key],datasource,props)}})}//rendertre
后台管理系统登录思路大鼻子的四色鸳鸯笔记
一般来说我们不管是做后台管理，还是做普通项目，必不可少的其实就是登录。那么登录又是怎么实现的呢？废话不多说，上代码。首先我们把登录接口封装在一个文件里，如果这个接口有必备的参数，我们就得传参，然后在登录页引入调用。其次就是我们在登录页写登录框信息，这时候就需要接收接口必备的参数，那具体怎么接呢？先在data里设置两个放置参数的空数组。然后在登录信息框中外围prop接收，然后在信息框上v-model
hive底层原理 sql执行过程_Hive原理总结（完整版）
目录课程大纲(HIVE增强)31.Hive基本概念41.1Hive简介41.1.1什么是Hive41.1.2为什么使用Hive41.1.3Hive的特点41.2Hive架构51.2.1架构图51.2.2基本组成51.2.3各组件的基本功能51.3Hive与Hadoop的关系61.4Hive与传统数据库对比61.5Hive的数据存储62.Hive基本操作72.1DDL操作72.1.1创建表72.1.
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交

Hadoop-HA高可用集群部署

Hadoop HA

HA 概述

HDFS-HA 集群搭建

HDFS-HA 核心问题

HDFS-HA 手动模式

规划集群

配置 HDFS-HA 集群

启动 HDFS-HA 集群

HDFS-HA 自动模式

HDFS-HA 自动故障转移工作机制

HDFS-HA 自动故障转移的集群规划

配置 HDFS-HA 自动故障转移

解决 NN 连接不上 JN 的问题

YARN-HA 配置

YARN-HA 工作机制

配置 YARN-HA 集群

规划集群

具体配置

启动 YARN

Hadoop-HA 最终集群

你可能感兴趣的:(hadoop,hdfs,big,data)