weixin_33827965

Hadoop高可用原理及环境搭建

一、说明

　　本次配置基于上一篇博客《Hadoop完全分布式搭建全过程》做补充，基于完全分布式做高可用搭建。。。。。。

二、原理

　　产生背景：Hadoop 1.0中HDFS和MapReduce在高可用、扩展性等方面存在问题

　　　　HDFS存在的问题
　　　　　　NameNode单点故障，难以应用于在线场景 HA
　　　　　　NameNode压力过大，且内存受限，影扩展性 F

　　　　MapReduce存在的问题
　　　　JobTracker访问压力大，影响系统扩展性
　　　　难以支持除MapReduce之外的计算框架，比如Spark、Storm等

　　　　Hadoop2.0模块：Hadoop 2.x由HDFS、MapReduce和YARN三个分支构成

　　　　　　HDFS：NN Federation（联邦）、HA；
　　　　　　2.X:只支持2个节点HA，3.0实现了一主多备
　　　　　　MapReduce：运行在YARN上的MR；
　　　　　　离线计算，基于磁盘I/O计算
　　　　　　YARN：资源管理系统

　　　　对于单点故障，Hadoop2.X中实现主备模式，有两个NameNode节点，去除Hadoop1.X中的SecondaryNameNode节点，用actived和standby状态区分主备机，也就是有两台NameNode主机，一台对　　外提供服务(actived)，另一台处于待命状态（standby），当一个NameNode所在的服务器宕机时，可以在数据不丢失的情况下，手工或者自动切换到另一个NameNode提供服务，两个NameNode节点有　　下面几点需要说明：

　　　　　　1、任务分工：active状态的NameNode负责所有的客户端操作，standby状态的NameNode处于从属地位，维护着数据状态，随时准备切换。

　　　　　　2、数据同步：两台NameNode元数据同步策略，官网提供了两种同步策略NFS(Network File System)和QJM(Quorum Journal Manager)，一般采用QJM方式，原因及QJM方式文章后面补充

　　　　　　3、健康检测：Hadoop2.X中使用zookeeper中ZKFC（zookeeper failover controller）对两台NameNode进行健康检测，ZKFC对应NameNode节点会在zookeeper中抢占锁(向zookeeper创建一个　　　　　　　　　　　　节点，如果已经被创建，说明对方已经抢占锁，自己只能是standby状态)来决定自己处于actived状态还是standby状态

　　　　对于内存受限，Hadoop2.X中采用federation(联邦)机制，对NameNode水平扩展，支持多个NameNode，每个NameNode独立管理内部元数据，NameNode之间互不影响；举个例子：NameNode存　　储的都是人的元数据信息，NameNode1存储老人元数据，NameNode2存储中年人元数据，NameNode3存储儿童元数据。。。。。。联邦机制有以下两点特点：

　　　　　　1、相互独立：NameNode之间相互独立，不存在元数据交叉，各自维护自己的空间目录树，NameNode1挂机不能被NameNode2替代

　　　　　　2、存储共享：各个NameNode共用同一个DataNode集群，存储共享，DataNode向每个NameNode汇报信息

　　联邦机制的三大价值：

　　　　　　1、命名空间的扩展：多台NameNode，不同的命名空间，随着集群使用时间的加长,HDFS上存放的数据也将会越来越多.这个时候如果还是将所有的数据都往一个NameNode上存放,这个文件系统　　　　　　　　　　　　　　　　会显得非常的庞大.这时候我们可以进行横向扩展,把一些大的目录分离出去.使得每个NameNode下的数据看起来更加的精简.

　　　　　　2、性能的提升：这个也很好理解.当NameNode所持有的数据量达到了一个非常大规模的量级的时候(比如超过1亿个文件),这个时候NameNode的处理效率可能就会有影响,它可能比较容易的会陷　　　　　　　　　　　　　　入一个繁忙的状态.而整个集群将会受限于一个单点NameNode的处理效率,从而影响集群整体的吞吐量.这个时候多NameNode机制显然可以减轻很多这部分的压力.

　　　　　　3、资源的隔离：通过多个命名空间,我们可以将关键数据文件目录移到不同的NameNode上,以此不让这些关键数据的读写操作受到其他普通文件读写操作的影响.也就是说这些NameNode将会只处　　　　　　　　　　　　　　理特定的关键的任务所发来的请求,而屏蔽了其他普通任务的文件读写请求,以此做到了资源的隔离

　　　　对于联邦机制和HA，目前联邦机制企业中并不多见，需求还不普遍，可能未来会向这个方向靠近，具体配置就不说明了，针对HA有以下需要具体说明一下，实现HadoopHA技术难点是什么？无非就　　是两点：主备NameNode数据同步，和NameNode脑裂控制

　　　　上面说了Hadoop2.x中实现HA中数据同步，namenode数据分三种：内存镜像、磁盘镜像fsimage，操作日志edits.为什么使用的是QJM方式，接下来会介绍一下QJM运行原理，介绍QJM之前首先说明为什么不用官网上的另一种方式NFS

In order for the Standby node to keep its state synchronized with the Active node, the current implementation requires that the two nodes both have access to a directory on a shared storage device (eg an NFS mount from a NAS). This restriction will likely be relaxed in future versions.

When any namespace modification is performed by the Active node, it durably logs a record of the modification to an edit log file stored in the shared directory. The Standby node is constantly watching this directory for edits, and as it sees the edits, it applies them to its own namespace. In the event of a failover, the Standby will ensure that it has read all of the edits from the shared storage before promoting itself to the Active state. This ensures that the namespace state is fully synchronized before a failover occurs.

　　　　摘抄自官网一段描述：大意就是让两个NameNode都可以访问同一个共享存储设备目录，actived节点做任何修改更新操作都把操作日志持久化到共享存储设备，standby状态的节点不断监测日志的变　　化，自己做同步操作，这样确保两个NameNode之间操作一致达到数据的最终一致性，通过描述，很明显能看出NFS方式弊端：远程文件管理器本身就可能存在单点故障的问题，服务器可能过载导致停止　　服务，另外还需要挂载文件夹，硬件设备必须支持NAS，定制隔离脚本，部署麻烦bug多...........接下来看看QJM方式怎么做的

In order for the Standby node to keep its state synchronized with the Active node, both nodes communicate with a group of separate daemons called "JournalNodes" (JNs). When any namespace modification is performed by the Active node, it durably logs a record of the modification to a majority of these JNs. The Standby node is capable of reading the edits from the JNs, and is constantly watching them for changes to the edit log. As the Standby Node sees the edits, it applies them to its own namespace. In the event of a failover, the Standby will ensure that it has read all of the edits from the JounalNodes before promoting itself to the Active state. This ensures that the namespace state is fully synchronized before a failover occurs.

　　　　同样摘抄自官网：大致原理和NFS原理差不多，都只能实现数据的最终一致性，但是QJM(Quorum Journal Manager)方式实现的中间件是：journalnode（JN），JournalNode属于轻量级的进程，可　　以与其他NameNode或者DataNode并行在一个节点，每个JournalNode对外有一个简易的RPC接口，以供NameNode读写EditLog到JN本地磁盘。当写EditLog时，NameNode会同时向所有JournalNode并　　行写文件，只要有N/2+1结点写成功则认为此次写操作成功，遵循Paxos协议。

　　对于NameNode的主备切换机制，Hadoop依赖于zookeeper的选主机制，整个切换过程是由ZKFC来控制的，具体又可分为HealthMonitor、ZKFailoverController和ActiveStandbyElector三个组件。

- ZKFailoverController: 是HealthMontior和ActiveStandbyElector的母体，执行具体的切换操作
- HealthMonitor: 监控NameNode健康状态，若状态异常会触发回调ZKFailoverController进行自动主备切换
- ActiveStandbyElector: 通知ZK执行主备选举，若ZK完成变更，会回调ZKFailoverController相应方法进行主备状态切换

　　在故障切换期间，ZooKeeper主要是发挥什么作用呢，有以下几点：

- 失败保护：集群中每一个NameNode都会在ZooKeeper维护一个持久的session,机器一旦挂掉，session就会过期，故障迁移就会触发
- Active NameNode选择：ZooKeeper有一个选择ActiveNN的机制，一旦现有的ANN宕机，其他NameNode可以向ZooKeeper申请排他成为下一个Active节点
- 防脑裂： ZK本身是强一致和高可用的，可以用它来保证同一时刻只有一个活动节点

　　归纳起来主要是两块：元数据同步和主备选举。元数据同步依赖于QJM共享存储，主备选举依赖于ZKFC和Zookeeper。

三、配置

　　*)规划

                NN        DN        ZKFC        ZK        JN
node211        *                    *            *
node212        *        *            *            *        *
node213                    *                        *        *
node214                    *                        *        *

*)基础设施

　　　　　　先停掉之前的完全分布式程序
               *stop-dfs.sh

               网络
               ssh免密钥：手动输入命令启动程序太麻烦，所以用脚本控制程序启动，但是需要登录各个主机时的用户名和密码，在这里设置免密钥就可以直接登录

　　　　除了之前设置node211对其他主机免密之外，这里需要设置两台NameNode之间的相互免密，因为ZKFC会监测对方状态

　　node212:
                        cd ~/.ssh
                        scp ./id_dsa.pub  root@node211:`pwd`/node212.pub

　　node211:
                        cd ~/.ssh
                        cat node212.pub >> authorized_keys

　　　　接下来就是修改配置文件了：hdfs-site.xml


	
		dfs.nameservices
		manzi
	
	
	
		dfs.ha.namenodes.manzi
		nn1,nn2
	
	
	
		dfs.namenode.rpc-address.manzi.nn1
		node211:8020
	
	
	
		dfs.namenode.rpc-address.manzi.nn2
		node212:8020
	
	
	
		dfs.namenode.http-address.manzi.nn1
		node211:50070
	
	
	
		dfs.namenode.http-address.manzi.nn2
		node212:50070
	
	
	
		dfs.namenode.shared.edits.dir
		qjournal://node214:8485;node212:8485;node213:8485/manzi
		
	
	
		dfs.client.failover.proxy.provider.manzi
		org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
			
	
	
		dfs.ha.fencing.methods
		sshfence
	
	
	
		dfs.ha.fencing.ssh.private-key-files
		/root/.ssh/id_dsa
		
	
	
		dfs.journalnode.edits.dir
		/var/journal/data
		
	
	
		dfs.ha.automatic-failover.enabled
		true

　　core-site.xml：


	
		fs.defaultFS
		hdfs://manzi
	
	
	
		ha.zookeeper.quorum
		node211:2181,node212:2181,node213:2181
	
	
	
		hadoop.tmp.dir
		/var/manzi/hadoop/

mapred-site.xml


		mapreduce.framework.name
		yarn

yarn-site.xml


        yarn.nodemanager.aux-services
        mapreduce_shuffle
    
	
		yarn.resourcemanager.ha.enabled
		true
	
	
		yarn.resourcemanager.cluster-id
		cluster1
	
	
		yarn.resourcemanager.ha.rm-ids
		rm1,rm2
	
	
		yarn.resourcemanager.hostname.rm1
		node213
	
	
		yarn.resourcemanager.hostname.rm2
		node214
	
	
		yarn.resourcemanager.zk-address
		node211:2181,node212:2181,node213:2181

　　接下来安装zookeeper，tar -xf命令解压到/opt/manzi/(自定义)目录下，

　　编辑zookeeper配置文件：

cd /opt/manzi/zookeeper/conf
						cp zoo_sample.cfg zoo.cfg
						vi zoo.cfg
						server.1=node211:2888:3888
						server.2=node212:2888:3888
						server.3=node213:2888:3888

　　创建myid文件，目录根据配置文件决定：/var/manzi/zookeeper/

mkdir -p /var/manzi/zookeeper	
					cd /var/manzi/zookeeper
						
						echo 1 >> myid

　　复制zookeeper到其他zookeeper节点：

cd /var/manzi/
						scp -r ./zookeeper/ node212:`pwd`
						scp -r ./zookeeper/ node213:`pwd`
cd /opt/manzi/ 
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　scp -r ./zookeeper/ node212:`pwd`

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　scp -r ./zookeeper/ node213:`pwd`

　　在node212和node213分别操作：

cd /var/manzi/zookeeper
						echo 2 > myid        --node212
                                                echo 3 > myid        --node213

　　编辑配置文件：

/etc/profile
						export JAVA_HOME=/usr/java/default
						export HADOOP_HOME=/opt/manzi/hadoop
						export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
						export ZOOKEEPER_HOME=/opt/manzi/zookeeper
						export PATH=$PATH:$ZOOKEEPER_HOME/bin

　复制profile文件

/etc
						scp profile node212:`pwd`
						scp profile node213:`pwd`
						scp profile node214:`pwd`
统一执行：source /etc/profile

　复制Hadoop配置文件：　

cd /opt/manzi/hadoop/etc/hadoop
						
						scp ./*.xml node213:`pwd`
						scp ./*.xml node212:`pwd`
						scp ./*.xml node214:`pwd`

　　启动journalnode：

node212,node213,node214
						hadoop-daemon.sh start journalnode

　　hdfs格式化并启动主NameNode：

node211
						hdfs namenode -format
						hadoop-daemon.sh start namenode

　　备NameNode同步数据：

node212
						hdfs namenode -bootstrapStandby

　　格式化ZKFC并启动hdfs：

node211
						hdfs zkfc -formatZK
						start-dfs.sh

转载于:https://www.cnblogs.com/zmanzi/p/10821161.html

融云 IM 干货丨获取会话列表或者历史消息报 25101 的错误？融云im即时通讯
出现获取会话列表或者历史消息报25101错误，主要有以下几种原因及解决方法：融云平台1、SDK版本过低：如果未执行撤回动作却出现25101报错，这是低版本SDK的已知问题，建议升级至最新SDK。2、未开通单群聊云存储服务：出现25101报错还可能是由于未开通单群聊云存储服务。可到开发者后台-IM商用版开通该服务，服务开通后30分钟左右生效。其他平台若以上平台的解决方法均不适用，建议检查以下通用方面
Python学习day14 BBS功能和聊天室 weixin_30725467 json 数据库前端 ViewUI
Createdon2017年5月15日@author:louts第1课作业讲解及装饰器使用28minutesdefcheck(func):defrec(request,*args,**kargs):returnfunc(request,*args,**kargs)returnrec@checkdefindex(request,):printrequest第2课自定义装饰器扩展使用18minutes
如何使用Visual Studio Code调试PHP CLI应用和Web应用
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
openwrt下oaf插件编译安装，实现上网行为监控月光技术杂谈 OpenWRT openwrt 健康上网上网管控青少年模式健康使用屏幕 Open App Filter 路由器
文章目录入门级APP青少年模式设备屏幕使用时间电脑浏览器使用时间限制Surpal介绍安装使用进阶级专业级旁路由方案openwrt路由器固件编译OAF(OpenAppFilter）安装编译带有oaf的固件固件烧写设备上电启动应用特征库设置黑白名单及应用访问限制骨灰级ref守护孩子视力，用科技“锁”住屏幕时间的秘籍马上又要寒假，除了说教，如何利用一些技术手段统计和限制孩子电子屏幕使用时间，做到健康上网
JavaWeb合集17-拦截器（Interceptor）和过滤器（Filter）永恒之月℡ JavaWeb合集 1024程序员节 java javaweb 过滤器拦截器
十七、拦截器和过滤器在JavaWeb开发中，拦截器（Interceptor）和过滤器（Filter）都是用于在请求处理前后执行某些操作的机制。虽然它们的功能相似，但在实现方式、使用场景和灵活性方面有一些重要的区别。1、拦截器和过滤器的区别及选择1.1拦截器定义：拦截器是Spring框架提供的一个机制，用于在请求处理前后执行某些操作。它基于AOP（面向切面编程）的思想。作用：通常用于处理与业务逻辑相
Go 语言的slice是如何扩容的? go
Go语言中的slice是一种灵活、动态的视图，是对底层数组的抽象。当对slice进行追加元素等操作导致其长度超过容量时，就会发生扩容。一、扩容的基本原理当slice需要扩容时，Go语言会根据当前的容量来确定新的容量。一般来说，新的容量通常是原容量的2倍。例如，如果一个slice的容量是10，那么在扩容后，新的容量会变成20。这种扩容策略使得slice的容量能够快速增长，以满足不断添加元素的需求。但
HTTP 安全：HTTPS 原理与配置计算机毕设定制辅导-无忧学长 #HTTP http 安全 https
一、引言在当今数字化时代，网络安全至关重要。我们日常上网离不开HTTP协议，但它存在安全隐患。HTTP以明文传输数据，信息易被窃取、篡改，身份也难以验证，像账号密码、交易信息等敏感内容在传输时毫无保障。为解决这些问题，HTTPS应运而生。它在HTTP基础上加入SSL/TLS协议，实现加密传输、身份认证和数据完整性保护，极大提升了网络通信的安全性。无论是电商购物、网上银行转账，还是登录各类账号，HT
C++ 游戏开发周盛欢 c++开发语言
嘿，小伙伴们，想不想自己动手开发个游戏呀？今天就来带大家用C++开发游戏，保证通俗易懂，就算你是0基础也能跟上。一、为啥用C++开发游戏C++可厉害了，它运行速度快得跟闪电似的，能让你的游戏画面流畅得跟丝滑巧克力一样。而且它功能强大，啥复杂的游戏逻辑都能搞定，像那些大型的3D游戏，很多都是用C++开发的呢。二、开发环境搭建先得有个好用的开发工具，推荐用VisualStudio（VS）。去官网（ht
随机森林分类算法原理与实验分析 ningaiiii 机器学习与深度学习随机森林分类算法
随机森林分类算法原理与实验分析1.引言随机森林（RandomForest）是一种集成学习方法，它通过构建多个决策树并结合它们的预测结果来进行分类。你可以把它想象成一个“团队决策”的过程：团队中的每个成员（决策树）都独立发表意见，最后通过投票决定最终结果。这种方法不仅提高了模型的准确性，还增强了模型的稳定性和鲁棒性。随机森林的主要特点是通过随机选择样本和特征来构建多个决策树，从而避免单棵决策树可能产
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
集群间hive数仓迁移 one code database
方式一：(此方法需要建库建表)第一步：建库建表在原集群hive上查看迁移表的建表语句及所在库，然后在新集群hive上建库建表；showcreatetabletb_name;createdatabasedb_name;createtabletb_name.....第二步：转移数据文件到新集群；在旧集群中下载数据到本地hadoopfs-get/user/hive/warehouse/dc_ods.db
深入理解Python生成器与协程：原理、实践与最佳应用场景20240919 Narutolxy 技术干货分享 Python笔记 python 网络
深入理解Python生成器与协程：原理、实践与最佳应用场景引言在Python编程中，生成器和协程是两个核心概念，它们能够帮助开发者编写高效、可维护的代码。生成器提供了一种延迟计算的机制，节省内存并提高性能；协程则允许程序在多个任务之间高效切换，实现并发操作。然而，要充分利用它们的优势，需要深入理解其工作原理。本文将详细解析生成器和协程的工作机制，探讨它们之间的关系，并通过实际应用场景和最佳实践，帮
微博文本挖掘并生成词云图（亲身经历~超级小白教程）吟游诗人理智鱼技能 python visual studio pycharm 爬虫数据挖掘数据可视化
在参与正大杯市场调研大赛的准备过程中，我被分配到了文本挖掘及后续可视化的工作任务，其中就包括爬取微博博文内容数据、以及将内容可视化（生成云图）接下来我将以生成词云图为目标，介绍实现方法以及煮波的一些心路历程。一、微博数据爬取（另外介绍）二、生成词云图从微博爬取的数据会以csv的格式存放在项目文件中，目前我采用的方法是将csv文件转为excel，再对excel中的文本进行词频统计，从而生成词云图，将
Kotlin函数类型探索：T.()-＞Unit的扩展函数、无参函数()-＞Unit与类型参数函数(T)-＞Unit 真想骂* kotlin python 前端
在Kotlin编程语言的丰富特性中，函数类型扮演着至关重要的角色。它们不仅定义了代码的行为，还通过灵活的类型系统促进了代码的重用和模块化。本文将深入探讨Kotlin中的三种核心函数类型：T.()->Unit的扩展函数、无参函数()->Unit以及类型参数函数(T)->Unit，揭示它们的独特之处及在编程实践中的应用。一、T.()->Unit：扩展函数的魅力扩展函数是Kotlin的一项强大特性，它允
Golang：报错no required module provides package github.com/xx的解决方法凭君语未可 Golang 常见问题 golang github 开发语言
报错问题重现可能的原因及解决方法1.未初始化Go模块解决方法：2.没有添加依赖解决方法：3.网络问题解决方法：4.依赖版本问题解决方法：5.包未发布或路径拼写错误解决方法：6.`gomodtidy`未运行解决方法：7.代码中未使用依赖解决方法：8.`vendor`模式导致依赖无法找到解决方法：实际报错原因及分析解决方法问题重现在运行以下代码时：packagemainimport("context"
OCR字符识别--WeChatocr 鲁鲁在川 ocr
导入库，及定义微信OCR地址fromwechat_ocr.ocr_managerimportOcrManager,OCR_MAX_TASK_IDimportthreadingwechat_ocr_dir=r"./ocr/WeChatOCR/7079/extracted"#OCR的地址，可以用everythin工具查找一下地址这个地址是电脑用户安装APP的地址---C:\Users\xxxx\App
Hive中没有超级管理员，如何进行权限控制二进制_博客大数据 hive hadoop 数据仓库
Hive中没有超级管理员，任何用户都可以进行Grant/Revoke操作开发实现自己的权限控制类，确保某个用户为超级用户比如任何用户都可以grant权限给别的用户。grantselectontabletest2touserhadoop;如何开发一个超级管理员：创建一个项目，导入mavanjar包，然后开始编写hook类importcom.google.common.base.Joiner;impo
[python]通过whl文件安装torchvision和torchaudio及国内whl文件下载地址汇总萌萌哒240 环境配置 python 开发语言
要通过.whl文件安装torchvision和torchaudio，你需要先确保你已经安装了与这些库兼容的PyTorch版本。以下是一个详细的步骤指南，帮助你通过.whl文件安装这些库。1.安装PyTorch首先，确保你已经安装了PyTorch。你可以从PyTorch的官方网站获取适合你系统的安装命令例如，如果你使用的是CUDA11.3和Python3.8，你可以使用以下命令安装PyTorch：p
vant组件库的按需导入导出 ordinary90 VUE 前端全栈开发 vue.js 前端
vant是一个基于Vue的移动端UI组件库，它提供了丰富的组件和样式，可以帮助我们快速构建移动端应用。在使用vant组件库时，可以通过按需导入导出的方式来减小打包体积，提高应用的性能。按需导入导出的原理是根据需要只加载使用到的组件和样式，而不是将整个组件库都打包到应用中。下面是一个使用vant组件库实现按需导入导出的详细解析和代码实例。安装vant组件库首先，在命令行中使用npm或者yarn安装v
重生之我在异世界学编程之算法与数据结构：算法复杂度介绍篇就爱学编程数据结构与算法算法数据结构排序算法
大家好，这里是小编的博客频道小编的博客：就爱学编程很高兴在CSDN这个大家庭与大家相识，希望能在这里与大家共同进步，共同收获更好的自己！！！本文目录引言正文一时间复杂度1.常数时间复杂度O(1)2.线性时间复杂度O(n)3.对数时间复杂度O(logn)4.平方时间复杂度O(n^2)5.指数时间复杂度O(2^n)二空间复杂度（1）空间复杂度的定义与重要性（2）常见的空间复杂度类型及介绍1.常数空间复
使用神经网络拟合6项参数 Andrew_Xzw 神经网络人工智能深度学习开发语言机器学习 python
使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3.定义train脚本3.1loss和optimizer3.2train3.3predict1.数据预处理1.1添加参数解析为了方便管理模型和训练等参数，统一用参数解析。defparse_a
TiDB Drems 凉兮分布式
架构原理及安装部署第一天：学习任务【PCTA备考指南1/16】TiDB架构原理及安装部署：https://asktug.com/t/topic/34500第二天：学习任务【PCTA备考指南2/16】TiDB使用管理手册：https://asktug.com/t/topic/34505第三天：学习任务【PCTA备考指南3/16】TiDB管理工具：https://asktug.com/t/topic/
线程池创建及参数设置运筹帷幄小红花 java 开发语言后端
一、创建线程池以及线程池的各种参数分析：//不指定最大线程数，默认是Int的最大值ExecutorServiceexecutorService=Executors.newCachedThreadPool();executorService.submit(()->{System.out.println("新建线程池对象，执行第一个默认线程");});executorService.shutdown(
如何快速在Windows 10 + Anaconda 3 中使用Mxnet及gluon qianchess mxnet使用 mxnet win10 anaconda gluon 人工智能
如何快速在Windows10+Anaconda3中使用Mxnet及gluon网络上Mxnet的安装以及使用方法很多，自从其作者之一李沐推出了基于Mxnet的深度学习课程之后，我也尝试着去使用了一下Mxnet。首先第一步就是在自己的系统中安装Mxnet及其相关组建。现在的Mxnet常常会跟其虚拟环境Gluon结合在一起，所以下文就一起阐述一下，顺便记录一下自己踩的坑。注意本文的大部分内容都可以在官网
2.TIDB整体架构胡晗- tidb
与传统的单机数据库相比，TiDB具有以下优势：纯分布式架构，拥有良好的扩展性，支持弹性的扩缩容支持SQL，对外暴露MySQL的网络协议，并兼容大多数MySQL的语法，在大多数场景下可以直接替换MySQL默认支持高可用，在少数副本失效的情况下，数据库本身能够自动进行数据修复和故障转移，对业务透明支持ACID事务，对于一些有强一致需求的场景友好，例如：银行转账具有丰富的工具链生态，覆盖数据迁移、同步、
2024年03月质量管理体系基础答案及解析喵呜CCAA CCAA国家注册审核员算法大数据
一、单选题1、提高绩效的活动称为（）。A、创新B、改进C、持续改进D、纠正措施解析：【喵呜刷题小喵解析】：提高绩效的活动通常指的是对现有工作流程、方法或结果进行改进，以提高效率、效果或满足更高的需求。因此，选项B“改进”最符合题意。其他选项如“创新”虽然可能涉及提高绩效，但通常更侧重于引入全新的方法或流程；选项“持续改进”虽然也涉及改进，但通常更强调持续、长期的过程；选项“纠正措施”则更侧重于纠正
做SOL交易机器人拆解步骤，其实没有那么复杂。白马区块Crypto100 web3 区块链 SOL机器人智能合约 Solana
做SOL交易机器人拆解步骤，其实并没有那么复杂，对于有一定技术基础的人来说，完全可以按部就班地进行。在踏入这个领域之前，许多人可能会因为听到“机器人拆解”这样的词汇而感到心生畏惧，担心其中涉及的技术门槛过高，难以逾越。然而，事实并非如此。只要我们掌握了正确的方法和步骤，就能够逐步揭开SOL交易机器人的神秘面纱，了解其内在的工作原理和构造。接下来，本文将为大家详细介绍SOL交易机器人的拆解步骤，帮助
ubuntu18.04安装grpc及使用grpc时遇到的问题总结烟酒僧_
#安装pkg-configsudoapt-getinstallpkg-config#安装依赖文件sudoapt-getinstallautoconfautomakelibtoolmakeg++unzipsudoapt-getinstalllibgflags-devlibgtest-devsudoapt-getinstallclanglibc++-dev克隆grpc源码gitclonehttps:/
IDLark 开源项目使用教程缪阔孝Ruler
IDLark开源项目使用教程idlark项目地址:https://gitcode.com/gh_mirrors/id/idlark1.项目的目录结构及介绍IDLark项目的目录结构如下：idlark/├──LEGAL.md├──LICENSE├──README.md├──poetry.lock├──pyproject.toml└──idlark/└──__init__.py目录结构介绍LEGAL.
Java ‘URL(java. lang. String)‘ 自版本 20 起已弃用空灵宫（Ethereal Palace） Java java 开发语言
在Java20及更高版本中，不推荐直接使用newURL(Stringspec)构造方法。官方建议通过更加安全和明确的方式来创建URL。下面示例给出两种常见替代方案：使用URI转化为URL，或使用多参数构造方法。原始写法（已弃用）publicclassUrlDemo{publicstaticvoidmain(String[]args){try{//自Java20起已弃用URLurl=newURL("
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

Hadoop高可用原理及环境搭建

你可能感兴趣的:(Hadoop高可用原理及环境搭建)