~chun

HDFS概述

文章目录

一、HDFS概述
- 1. 什么是HDFS
- 2. HDFS基本架构
- 3. 搭建[HDFS]
- 4. 安装hadoop
- 5. hadoop配置文件的配置 etc/hadoop
- 6. namenode的格式化
- 7. 启动hadoop守护进程
- 8. 测试验证安装成果
- 9. Hadoop HDFS运行过程中的错误分析#
- 10、HDFS的client访问
- 11.指定 Hadoop的启停脚本
二、NameNode的持久化（persistent）
- 1. FSImage和EditsLog
- 2、安全模式（safe mode)
- 3、SecondaryNameNode作用
- 4、HANameNode集群（高可用）
- 5、 hdfs写文件的步骤
- 6、 hdfs读取文件步骤
- 7、hadoop的shuffle过程
- 8、HANameNode集群的搭建

一、HDFS概述

1. 什么是HDFS

   HDFS 全称是Hadoop Distributed File System hadoop分布式（cluser）文件存储系统.

2. HDFS基本架构

1、hadoop1体系 64M一个快（少）
hadoop2体系 128M一个块（默认）
8TB （3TB/3TB/2TB）n=X/128 个快
提高数据读写效率（利于并行读取数据）

2、冗余存储 (24TB 动态扩充 ，保证数据安全)
3、校验和（确定块是否完整 是否损坏）
	原理：实现思想（加密算法MD5 不可逆）
	         可对二进制加密，128M加密----> 32个字符串（16进制0F） 
	         元不变（加密结果也不会改变）
	         datanode 定期检查块 （向nameNode汇报块是否损坏）。

NameNode 的持久化？：

3. 搭建[HDFS]

/opt/models   原始文件
/opt/install  安装文件放置的位置

1. linux服务器的基本配置
   设置ip,关闭防火墙，关闭selinux,配置主机名，主机与ip映射
2. 安装jdk 1.7+ 
   rpm -ivh jdk-7u71-linux-x64.rpm  默认安装位置 /usr
   环境变量的配置
       vi /etc/profile   环境变量 linux 所有用户生效
       
       vi ~/.bash_profile 环境变量 当前用户生效
       vi ~/.bashrc
        JAVA_HOME=/usr/java/jdk1.7.0_71
        CLASSPATH=.
        PATH=$JAVA_HOME/bin:$PATH:$HOME/bin

        export JAVA_HOME
        export CLASSPATH
        export PATH
        
        source .bash_profile

4. 安装hadoop

   tar -zxvf hadoop-2.5.2.tar.gz -C /opt/install

5. hadoop配置文件的配置 etc/hadoop

   1.1 hadoop-env.sh
       export JAVA_HOME=/usr/java/jdk1.7.0_71
   1.2 core-site.xml
       
        		
           fs.defaultFS
           hdfs://hadoop.baizhiedu.com:8020
        
       
        
	       hadoop.tmp.dir
	       /opt/install/hadoop-2.5.2/data/tmp
         
   1.3 hdfs-site.xml
       
        		
          dfs.replication
          1
        
   1.4 mapred-site.xml
       
           	 	        		
              mapreduce.framework.name
              yarn
           
   1.5 yarn-site.xml
       
           yarn.nodemanager.aux-services
           mapreduce_shuffle
       
   1.6 slaves
       hadoop2.baizhiedu.com

6. namenode的格式化

【第一次搭建hdfs集群时需要使用】
      目的作用：格式化hdfs系统，并且生成存储数据块的目录
      bin/hdfs namenode -format

7. 启动hadoop守护进程

      sbin/hadoop-daemon.sh start namenode
      sbin/hadoop-daemon.sh start datanode
      sbin/yarn-daemon.sh start resourcemanager
      sbin/yarn-daemon.sh start nodemanager
      
      sbin/hadoop-daemon.sh stop namenode
      sbin/hadoop-daemon.sh stop datanode
      sbin/yarn-daemon.sh stop resourcemanager
      sbin/yarn-daemon.sh stop nodemanager

8. 测试验证安装成果

ps -ef | grep java
      jps 查看相关4个进程
      通过网络进行访问测试
           浏览器 http://hadoop2.baizhiedu.com:50070 hdfs
                 http://hadoop2.baizhiedu.com:8088  yarn

9. Hadoop HDFS运行过程中的错误分析#

   1. 查看日志
      tail -nxxx 文件名
      $HADOOP_HOME/logs 
      [hadoop-用户名-namenode-主机名.log]
      hadoop-root-namenode-hadoop2.baizhiedu.com.log
      hadoop-root-datanode-hadoop2.baizhiedu.com.log
      yarn-root-resourcemanager-hadoop2.baizhiedu.com.log
      yarn-root-nodemanager-hadoop2.baizhiedu.com.log

10、HDFS的client访问

1. 查看目录结构
   bin/hdfs dfs -ls 路径
   bin/hdfs dfs -ls /
2. 创建文件夹
   bin/hdfs dfs -mkdir /suns
   bin/hdfs dfs -mkdir -p /liuh/xiaojr
3. 本地上传文件到hdfs中
   bin/hdfs dfs -put /root/hdfs/data /suns
   bin/hdfs dfs -put local_path hdfs_path
4. 查看文件内容
   bin/hdfs dfs -text /suns/data
   bin/hdfs dfs -cat /suns/data
5. 删除
   bin/hdfs dfs -rm /suns/data
   注意事项：可以修改垃圾桶的存活时间
   core-site.xml
   	
		   fs.trash.interval
		   10
    
    垃圾桶的位置:/user/root/.Trash/190522010000/suns/data
    hdfs：有权限：
    hdfs-site.xml
    
		   dfs.permissions.enabled
		   false
    
6. 删除非空文件夹 
   bin/hdfs dfs -rmr /suns
7. 从hdfs下载文件到本地
   bin/hdfs dfs -get hdfs_path local_path
8. cp mv

11.指定 Hadoop的启停脚本


shell脚本 当前目录执行方式  ./hadoop-start.sh
         绝对路径执行shell /opt/install/hadoo-2.5.2/hadoop-start.sh

linux  hadoop-start.sh
       sbin/hadoop-daemon.sh start namenode
       sbin/hadoop-daemon.sh start datanode
       sbin/yarn-daemon.sh start resourcemanager
       sbin/yarn-daemon.sh start nodemanager
    
       hadoop-stop.sh
       sbin/hadoop-daemon.sh stop namenode
       sbin/hadoop-daemon.sh stop datanode
       sbin/yarn-daemon.sh stop resourcemanager
       sbin/yarn-daemon.sh stop nodemanager
 sbin/yarn-daemon.sh start nodemanager
    
       hadoop-stop.sh
       sbin/hadoop-daemon.sh stop namenode
       sbin/hadoop-daemon.sh stop datanode
       sbin/yarn-daemon.sh stop resourcemanager
       sbin/yarn-daemon.sh stop nodemanager

二、NameNode的持久化（persistent）

NameNode在运行时，元数据放置在内存中。
	如果内存出现问题，则元数据丢失。
	为了保证元数据安全，NameNode有对应的持久化机制，把元数据持久化到硬盘存储。

1. FSImage和EditsLog

1、FSImage（文件系统镜像二进制）
  存储某一个时间点（checkPoint）的NameNode镜像数据
  默认存储位置  /opt/install/hadoop-2.5.2/data/tmp/dfs/name
   dfs.namenode.name.dir
   
 2、EditsLog 
   可编辑日志二进制 记录（检查点以后的所有写操作）
   默认存储位置 dfs.namenode.edits.dir

3、 定制FSImage和EditsLog的存储位置
   ~~~markdown
   hdfs-site.xml
   
       dfs.namenode.name.dir
       file:///xxx/xxxx
   
   
       dfs.namenode.edits.dir
       file:///xxx/xxxx

2、安全模式（safe mode)

  每一次启动namenode时，hdfs都需要进行FSImage和EditsLog的整合，
在这个过程中，不允许用户做写操作，把这个过程称之为安全模式（safe mode),默认30秒
 （1）. safe mode相关命令
      bin/hdfs dfsadmin -safemode [enter leave get] 
 （2）. HDFS集群启动是，完成流程
      HDFS集群启动 过程 （安全模式）
      1，整合 FSImage和EditsLog 生成新的EditsLog 和 FSImage,由新EditsLog接收用户写操作命令
      2, DataNode都需NameNode主动汇报健康情况（心跳）3秒
      3, 汇报块列表  通过校验和 检查块是否可用，并定期1小时汇报。

3、SecondaryNameNode作用

自定义SecondaryNameNode 拉取数据的周期
hdfs-site.xml
	dfs.namenode.checkpoint.period   3600秒
	dfs.namenode.checkpoint.txns     1000000

secondaryNameNode启动方式：
	sbin/start-dfs.sh
 	sbin/hadoop-daemon.sh start secondarynamenode

定制secondaryNameNode 启动的节点
	hdfs-site.xml
	dfs.namenode.secondary.http-address    0.0.0.0:50090
	dfs.namenode.secondary.https-address   0.0.0.0:50091

4、HANameNode集群（高可用）


zookeeper：选主过程
   1 ,2,3,4,5,按编号依次启动:
	 服务器1启动，给自己投票，发投票信息，由于其它机器还没有启动所以它收
不到反馈信息，服务器1的状态一直属于Looking(选举状态)。
     服务器2启动，给自己投票，同时与之前启动的服务器1交换结果，由于服务器2的编号大
所以服务器2胜出，但此时投票数没有大于半数，所以两个服务器的状态依然是LOOKING。
	服务器3启动，给自己投票，同时与之前启动的服务器1,2交换信息，由于服务器3
的编号最大所以服务器3胜出，此时投票数正好大于半数，所以服务器3成为领导者，服务器1,2成为小弟。
服务器4启动，给自己投票，同时与之前启动的服务器1,2,3交换信息，尽管服务器4的编号大，但之前服务器3已经胜出，所以服务器4只能成为小弟。
      服务器5启动，后面的逻辑同服务器4成为小弟。	
      
	LOOKING，竞选状态。
	FOLLOWING，随从状态，同步leader状态，参与投票。
	OBSERVING，观察状态,同步leader状态，不参与投票。
	LEADING，领导者状态。

zookeeper 集群高可靠 （奇数台）
  作用：
   1、选主namenode（投票）active/standby
   2、管理EdisLog（QJN），将EdisLog同步给Standby（NameNode）

standyBy(Namenode)
	作用：
	  1、从zookerper上拉取edisLog 进行整合成 FSImage 替换原有的FSImage
	  2、接受dataNode 的元数据信息。
	  3、当activeNameNode 宕机时，全权接管 activeNameNode的所有功能，对外进行服务

5、 hdfs写文件的步骤

	(1)client向NameNode申请上传…/xxx.txt文件
	(2)NN向client响应可以上传文件
	(3)Client向NameNode申请DataNode
	(4)NN向Client返回DN1,DN2,DN3
	(5)Client向DN1,DN2,DN3申请建立文件传输通道
	(6)DN3,DN2,DN1依次响应连接

6、 hdfs读取文件步骤

	(1)client向NN请求下载…/xxx.txt文件
	(2)NN向client返回文件的元数据
	(3)Client向DN1请求访问读数据blk_1
	(4)DN1向Client传输数据
	(5)Client向DN2请求访问读数据blk_2
	(6)DN2向Client传输数据

7、hadoop的shuffle过程

	（1）、Map的输出会先写到内存缓冲区中
	（2）、达到 阀值（100M）/0.8产生溢写
	（3）、产生临时文件，写到本地磁盘
	（4）、多个file1 临时文件  marge排序合并（按分区、排序） ，个数为分区个数。
		   存在本地linux服务器端。

		（1）、reduce 通过 http 找nodemanager 
		（2）、主动拉去数据到 内存 环形缓冲区（分组排序 group sort）
		（3）、产生溢写——多个临时文件
		（4）、临时文件merge汇总（分组 、排序）交给——reduce

8、HANameNode集群的搭建

1. zookeeper集群
   1.1 解压缩
       tar -zxvf zookeeper-xxx-tar.gz -C /opt/install
   1.2 创建数据文件夹
       mdkir  zookeeper_home/data
   1.3 conf目录修改zookeeper的配置文件
       修改zoo_sample.cfg 为 zoo.cfg
       mv zoo_sample.cfg zoo.cfg
       编辑内容
       dataDir=/opt/install/zookeeper-3.4.5/data

       server.0=hadoop2.baizhiedu.com:2888:3888
       server.1=hadoop3.baizhiedu.com:2888:3888
       server.2=hadoop4.baizhiedu.com:2888:3888
   1.4 zookeeper_home/data
       myid文件    0          hadoop2.baizhiedu.com
       myid文件    1          hadoop3.baizhiedu.com
       myid文件    2          hadoop4.baizhiedu.com
   1.5 scp -r 命令 同步集群中所有节点 并 修改对应的myid文件
   1.6 主节点 ssh 其他节点
   1.7 启动zk服务
       bin/zkServer.sh start | stop | restart
       bin/zkServer.sh status 查看集群状态 【必须集群完整启动完成】
       
       bin/zkCli.sh [leader]

2. HA-HDFS集群
   删除 data/tmp 
   2.1 core-site.xml
          		
			fs.defaultFS
			hdfs://ns
		
	    
			hadoop.tmp.dir
			/opt/install/hadoop-2.5.2/data/tmp
	   
	   
		  ha.zookeeper.quorum
	      hadoop2.baizhiedu.com:2181,hadoop3.baizhiedu.com:2181,hadoop4.baizhiedu.com:2181
	  
   2.2 hdfs-site.xml 
       	
		   dfs.permissions.enabled
		   false
		
		
	  
	  
		  dfs.nameservices
		  ns
	  
	  
	  
		  dfs.ha.namenodes.ns
		  nn1,nn2
	  
  
	  
		  dfs.namenode.rpc-address.ns.nn1
		  hadoop2.baizhiedu.com:8020
	  
	  
	  
		  dfs.namenode.http-address.ns.nn1
		  hadoop2.baizhiedu.com:50070
	  
  
	  
		  dfs.namenode.rpc-address.ns.nn2
		  hadoop3.baizhiedu.com:8020
	  
	  
	  
		  dfs.namenode.http-address.ns.nn2
		  hadoop3.baizhiedu.com:50070
	  

	
	
		dfs.namenode.shared.edits.dir
		qjournal://hadoop2.baizhiedu.com:8485;hadoop3.baizhiedu.com:8485;hadoop4.baizhiedu.com:8485/ns
	

	
		dfs.journalnode.edits.dir
		/opt/install/hadoop-2.5.2/journal
	
	
	
		dfs.ha.automatic-failover.enabled
		true
	
    
	
		dfs.client.failover.proxy.provider.ns
		org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider
	
	
	
		dfs.ha.fencing.methods
		sshfence
	
	
	
		dfs.ha.fencing.ssh.private-key-files
		/root/.ssh/id_rsa
	
	
   2.3 yarn-env.sh添加如下内容
   export JAVA_HOME=/usr/java/jdk1.7.0_71

    首先启动各个节点的Zookeeper，在各个节点上执行以下命令：
    bin/zkServer.sh start

    在某一个namenode节点执行如下命令，创建命名空间
    bin/hdfs zkfc -formatZK

    在每个journalnode节点用如下命令启动journalnode
    sbin/hadoop-daemon.sh start journalnode

    在主namenode节点格式化namenode和journalnode目录
    bin/hdfs namenode -format ns

    在主namenode节点启动namenode进程
    sbin/hadoop-daemon.sh start namenode

    在备namenode节点执行第一行命令，这个是把备namenode节点的目录格式化并把元数据从主namenode节点copy过来，并且这个命令不会把journalnode目录再格式化了！然后用第二个命令启动备namenode进程！

    bin/hdfs namenode -bootstrapStandby
    sbin/hadoop-daemon.sh start namenode

    在两个namenode节点都执行以下命令
    sbin/hadoop-daemon.sh start zkfc

    在所有datanode节点都执行以下命令启动datanode
    sbin/hadoop-daemon.sh start datanode

    日常启停命令
    sbin/start-dfs.sh
    sbin/stop-dfs.sh

你可能感兴趣的:(数据)

2024论文AIGC降重避雷指南：这些“坑”千万别踩！ LL06210721 AIGC 人工智能
政策背景：“2024年知网/维普新增AIGC检测模块，高校严查AI生成内容。据公开数据，某985院校硕士论文初检AIGC率超标比例达35%。”常见误区分析：误区1：直接复制AI生成的口语化结论→被算法标记“非学术表达”；误区2：虚构参考文献→查重率飙升+学术诚信风险；误区3：忽略图表公式规范性→格式问题被导师驳回。合规建议：表达优化：使用专业工具替换AI生成的松散句式（例：将“总而言之”改为“综上
学习Flink：一场大数据世界的奇妙冒险狮歌~资深攻城狮大数据
学习Flink：一场大数据世界的奇妙冒险嘿，朋友们！今天咱们来聊聊怎么学习Flink这个在大数据界超火的玩意儿相信很多小伙伴都听说过它，但不知道从哪儿开始下手，别愁，听我慢慢唠唠~一、学习Flink前的“装备”准备想象一下，你要去攀登一座高峰学习Flink也得先做好准备工作呀。首先，你得熟悉一门编程语言，Java或者Scala比较好。Java就像是你出门的常用交通工具大家都比较熟悉，找资料、学教程
基于hive的电信离线用户的行为分析系统赵谨言论文经验分享毕业设计
标题:基于hive的电信离线用户的行为分析系统内容:1.摘要随着电信行业的快速发展，用户行为数据呈现出海量、复杂的特点。为了深入了解用户行为模式，提升电信服务质量和精准营销能力，本研究旨在构建基于Hive的电信离线用户行为分析系统。通过收集电信用户的通话记录、上网行为、短信使用等多源数据，利用Hive数据仓库工具进行数据存储和处理，采用数据挖掘和机器学习算法对用户行为进行分析。实验结果表明，该系统
基于STM32的智能家居蓝牙系统（论文+源码）云山工作室 stm32 智能家居嵌入式硬件
1总体方案设计本次基于STM32的智能家居蓝牙系统，其系统总体架构如图2.1所示，采用STM32f103单片机作为控制器，通过DHT11传感器实现温湿度检测，MQ-2烟雾传感器实现烟雾检测，光敏电阻实现光照检测，同时将数据通过HC-05蓝牙模块上传到手机APP，用户可以通过手机APP实现对LED灯的开关控制，以及设定温度的报警阈值，如果温度太高会启动风扇进行降温，并将检测的参数通过OLED1286
MySQL 与 Redis 的数据一致性问题 m0_74824823 面试学习路线阿里巴巴 mysql redis 数据库
读数据的逻辑基本一致问题1:一致性有哪些?MySQL与Redis的数据一致性方案有哪些?先写MySQL还是先写Redis?缓存数据是更新还是清除?强一致还是最终一致?问题:如果mysql写成功了,但是Redis写(删除)失败了怎么办?重试机制的幂等问题如何解决?方案1:先更新MySQL再清除Redis方案2:双删策略方案3:监听MySQL的binlog日志删除问题:热key失效问题思路1:让热ke
瑞萨微控制器 R5F100FEAFP#10 适用于各种嵌入式应用提供样品测试+数据资料常备现货 li15817260414 云计算电视盒子物联网智能家居
瑞萨电子的R5F100FEAFP#10是一款基于RL78/G13系列的16位微控制器，适用于各种嵌入式应用。其主要参数如下：核心处理器：RL78，16位架构，最高工作频率32MHz。存储器：程序存储器：64KB闪存。数据存储器：4KBRAM。EEPROM：4KB。I/O端口：提供31个通用输入/输出引脚。外设功能：通信接口：支持CSI、I2C、LIN总线、UART/USART等多种通信方式。模数转
拉货搬家小程序开发中保障用户隐私和数据安全的方法 ALLSectorSorft 服务器数据库网络微信小程序小程序
拉货搬家小程序开发中保障用户隐私和数据安全的方法在开发拉货搬家类小程序时，保障用户隐私和数据安全需通过多维度技术手段和管理措施协同实现。以下是系统化的解决方案框架及实施要点：一、数据全生命周期加密保护1.存储层加密采用AES256算法对用户身份信息、订单轨迹、支付凭证等敏感字段加密存储，结合盐值（Salt）增强密码学安全性。敏感数据（如身份证号）建议脱敏后存储，例如仅保留部分字段并用哈希值关联业务
Scala---Array（集合、序列）请叫我小飞机 scala java 开发语言
Scala：Array（集合、序列）数组是一种可变的、可索引的数据集合。在Scala中用Array[T]的形式来表示Java中的数组形式T[]。valnumbers=Array(1,2,3,4)//声明一个数组对象valfirst=numbers(0)//读取第一个元素numbers(3)=100//替换第四个元素为100valbiggerNumbers=numbers.map(_*2)//所有元
深度学习分类回归（衣帽数据集）何仙鸟深度学习分类回归
一、步骤1加载数据集fashion_minst2搭建classNeuralNetwork模型3设置损失函数，优化器4编写评估函数5编写训练函数6开始训练7绘制损失，准确率曲线二、代码导包，打印版本号：importmatplotlibasmplimportmatplotlib.pyplotasplt%matplotlibinlineimportnumpyasnpimportsklearnimport
从数据中挖掘洞见：初探数据挖掘的艺术与科学 Echo_Wish 大数据数据挖掘人工智能
从数据中挖掘洞见：初探数据挖掘的艺术与科学在当今信息爆炸的时代，我们每天都被海量数据所包围。这些数据不仅记录了我们每天的生活轨迹，还蕴含着无数潜在的模式和洞见。作为大数据领域的自媒体创作者，我笔名Echo_Wish，在这篇文章中，我将带领大家初探数据挖掘的奥秘，揭示如何从数据中寻找隐藏的模式。什么是数据挖掘？数据挖掘（DataMining），顾名思义，就是从大量数据中“挖掘”出有价值的信息和模式。
STM32串口数据接收 --环形缓冲区 IT_阿水 STM32 串口通信 stm32 单片机
STM32串口数据接收--环形缓冲区环形缓冲区简介在单片机中串口通信是我们使用最频繁的，使用串口通信就会用到串口的数据接收与发送，环形缓冲区方式接收数据可以更好的保证数据丢帧率第。在通信程序中，经常使用环形缓冲器作为数据结构来存放通信中发送和接收的数据。环形缓冲区是一个先进先出的循环缓冲区，可以向通信程序提供对缓冲区的互斥访问。环形缓冲区的一个有用特性是：当一个数据元素被用掉后，其余数
Python使用mysql-connector连接数据库巴啦啦拉粑粑 Python mysql 数据库 python
1.mysql-connector和MySQLdb的区别mysql-connector和MySQLdb都是python连接数据库的包，二者区别如下：mysql-connector是一个Python模块，它在Python中重新实现MySQL协议，它比较慢，但不需要C库，因此更便携。MySQLdb是一个C模块，它使用MySQL客户端库中的MySQL协议实现相链接，它更快，但是需要C库才能工作。这里选择
2020年“磐云杯”网络空间安全技能竞赛全国拉赛 Beluga 中职网络空间安全赛题安全 linux 网络网络空间安全中科磐云
2020年“磐云杯”网络空间安全技能竞赛全国拉赛一、竞赛阶段竞赛阶段任务阶段竞赛任务竞赛时间分值第一阶段单兵模式系统渗透测试任务1Wireshark数据包分析100分钟100任务2系统漏洞扫描与利用100任务3服务漏洞扫描于测试100任务4Web渗透测试100任务5Windows操作系统渗透测试100任务6Linux操作系统渗透测试100任务7主机存活扫描渗透测试100备战阶段攻防对抗准备工作20
2019年全国职业院校技能大赛中职组“网络空间安全”正式赛卷 ——（flag答案） Beluga 安全服务器网络中科磐云技能竞赛
2019年全国职业院校技能大赛中职组“网络空间安全”正式赛卷任务1.Wireshark数据包分析（100分）1.使用Wireshark查看并分析PYsystem20191桌面下的capture4.pcap数据包文件，找出黑客获取到的可成功登录目标服务器FTP的账号密码，并将黑客获取到的账号密码作为Flag值（用户名与密码之间以英文逗号分隔，例如：root,toor）提交；（9分）答案：
Connector for Python ZHIHAN__
PythonMySQL-mysql-connector驱动MySQL是最流行的关系型数据库管理系统，如果你不不熟悉MySQL，可以阅读MySQL教程。介绍使用mysql-connector来连接使用MySQL，mysql-connector是MySQL官方提供的驱动器。我们可以使用pip命令来安装mysql-connector：python-mpipinstallmysql-connector使用
狂赞！海量数据迁移方案，免费送给你无意摘花 java 经验积累 mysql 数据迁移
一、背景在创业初期，为了快速把项目搭建运行起来，往往不会过多地去考虑系统是否可以支持未来更大的数据吞吐量，所以往往不会分表或分库。可当项目真正运行了一年两年之后，会发现原来的单表已经存储不了更多的数据了，或者查询性能受到影响，此时就要考虑分库或分表了。一般涉及到分库分表，数据迁移是必须要做的一个工作。那么接下来，笔者就以自己亲身实践过的一次数据迁移经验为依据，向大家介绍一下，当数据量过亿时，进行数
MySQL的主从同步 m0_74536424 Linux学习笔记 mysql linux 运维数据库
MySQL的主从同步1.MySQL中从同步原理简介MySQL主从同步是一种数据库复制技术，它可以将一台MySQL数据库（称为主服务器）的数据复制到另一台或多台MySQL数据库（称为从服务器）。主从同步可以用于以下目的：主服务器将所有数据变更记录到二进制日志（binlog）中。从服务器连接到主服务器，并从主服务器的二进制日志中获取数据变更信息。从服务器将获取到的数据变更信息应用到自己的数据库中，从而
Linux文件类型和根目录结构 m0_74536424 Linux学习笔记 linux 运维服务器
Linux文件类型和根目录结构1.文件类型字符文件类型说明~普通文件类似于Windows的记事本d目录文件类似于windows文件夹c字符设备文件串行端口设备，顺序读写，键盘b块设备文件可供存储的接口设备，随机读写，硬盘p管道文件用于进程间的通信s套接字文件通常用于网络上的通信。可以启动一个程序来监听客户端的要求，客户端可以通过套接字来进行数据通信l符号链接又叫软链接，和原来文件不是同一个文件例如
【Linux】【网络】UDP打洞--＞不同子网下的客户端和服务器通信（成功版）钟离墨笺 Linux 网络服务器 linux
【Linux】【网络】UDP打洞–＞不同子网下的客户端和服务器通信（成功版）根据上个文章的分析问题可能出现在代码逻辑上面我这里重新查找资料怀疑：1NAT映射可能需要多次数据包的发送才能建立。2NAT映射保存时间太短，并且NAT可能会在短时间内改变这些映射，需要一直保持映射。有些NAT设备会因为短时间内没有数据而回收端口映射，导致服务器提供的IP:Port失效。保活机制：双方定期发送保活包以防NAT
Scala 中的数据类型转换规则闯闯桑 scala 大数据算法
在Scala中，数据类型转换是将一个类型的值转换为另一个类型的过程。Scala提供了多种数据类型转换的方式，包括自动类型转换（隐式转换）和显式类型转换。以下是Scala中数据类型转换的规则和方法的详细介绍：1.自动类型转换（隐式转换）Scala支持在某些情况下自动进行类型转换，这种转换通常是安全的，不会导致数据丢失。自动类型转换的规则如下：1.1数值类型的自动转换Scala支持从低精度数值类型向高
如何使用BeautifulSoup轻松解析网页内容？字节王德发 python beautifulsoup
在当今这个信息爆炸的时代，网络上有大量的数据等待我们去挖掘。如何从网页中提取我们需要的信息呢？使用Python的BeautifulSoup库，能够让这一过程变得简单而高效！接下来，我将带你走进BeautifulSoup的世界，教你如何进行网页解析。BeautifulSoup是什么？BeautifulSoup是一个Python库，专门用于从HTML和XML文件中提取数据。它能够将复杂的网页结构转化为
常用的分布式 ID 设计方案梦城忆分布式
文章目录1.UUID2.数据库自增ID3.雪花算法4.Redis生成ID5.美团Leaf1.UUID原理：UUID是由数字和字母组成的128位标识符，通过特定算法随机生成，包括时间戳、计算机网卡地址等信息。常见的版本有版本1（基于时间戳和MAC地址）、版本4（纯随机数）等。优点：生成简单，本地生成，不需要依赖额外的组件或服务，能有效减少网络开销。全球唯一，基本能保证在任何场景下不会重复。缺点：长度
Spring使用JWT进行登录验证 PXM的算法星球 Java后端 spring java 后端
前情提要：由于这学期课设需要使用SSM技术栈，导致一些好用的登录框架无法适配，所以改用手写JWT进行登录验证JWT简介JSONWebToken(JWT)是一种用于在网络应用环境中进行用户身份验证和信息交换的开放标准。它通过将数据以JSON格式进行编码，使得信息在不同的系统和应用之间得以安全传递。JWT的主要特点是结构简洁且安全性高，广泛应用于单点登录（SSO）、API授权和用户身份认证。JWT由三
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响 24K不怕分布式分布式ID Snowfake
浅谈常用的分布式ID的设计方案以及Snowfake是否受冬令时切换影响分布式ID定义典型实现方案基于数据库自增序列的实现UUID方案Redis方案Snowflake方案Snowfake是否受冬令时切换影响分布式ID定义全局唯一：区别于单点系统的唯一，全局是要求分布式系统内唯一。有序性：通常都要保证生成的ID是有序递增的。例如，在数据库存储场景中，有序ID便于确定数据位置，往往更加高效。典型实现方案
提高SQL查询性能的7个法宝傻儿哥 ORACLE sql 数据库报表 sql server sybase 存储
【IT168专稿】每个数据库平台上的SQL开发人员都是在困难中求得生存，我们总是一次又一次犯同样的错误，这是因为数据库领域还相对不成熟，是的，每个数据库厂商都在做着各种不同的努力，但作为开发人员仍然要克服各种问题，无论是在SQLServer，Oracle，DB2，Sybase，MySQL数据库，还是其它关系数据库平台上编写SQL代码，并发性、资源管理、空间管理和SQL运行速度总是困扰着开发人员。遗
腾讯云数据库 TencentDB for PostgreSQL常见问题的解答上云使者腾讯云知识分享腾讯云数据库 postgresql mysql sql
本页面提供关于云数据库PostgreSQL的一些常见问题的解答，如果您在使用过程中遇到问题，您也可以在文章中评论提问来寻求帮助。更多参阅腾讯云官方文档。腾讯云数据库TencentDBforPostgreSQL强大的计算性能、空间地理信息处理能力，面向企业复杂SQL处理的OLTP场景云数据库PostgreSQL简介腾讯云数据库PostgreSQL（TencentDBforPostgreSQL，云AP
Manus：中国AI创新力，开启通用智能体的新时代 YuKeeHgg Manus 人工智能 Manus
更多精彩内容可点击「华彬智融知识数据库」免费解锁～2025年3月6日，中国科技领域迎来里程碑式突破——由Monica.im团队研发的全球首款通用AI智能体产品“Manus”正式上线。这款被业界誉为“聪明实习生”的AI助手，凭借其自主执行复杂任务的能力，一夜之间引爆全球科技圈，推动A股AI相关板块大涨，软件ETF单日涨幅超3%。Manus的诞生不仅刷新了AI技术应用的高度，更标志着中国团队在智能体（
9.1 shell文本处理 Qiu_SaMa Linux Shell的学习 linux vim
通常shell脚本最大的用途就在于解析和显示文本文件中的数据，比如日志文件和错误文件。Linux环境包含了两个非常有用的工具：sed和gawk，两者都能够在shell脚本中处理文本数据。1.sed编辑器sed编辑器被称为流编辑器（streameditor），和普通的交互式文本编辑器恰好相反。在交互式文本编辑器中（如vim），可以用键盘命令来交互式地插入、删除或替换数据中的文本。流编辑器则会在编辑器
Stable Diffusion模型Pony系列模型深度解析 Liudef06 Stable Diffusion 人工智能人工智能作画 stable diffusion AI作画
StableDiffusion模型Pony系列模型深度解析一、技术架构与核心特性基于SDXL的深度优化Pony系列模型以SDXL为基础框架，通过针对二次元/动漫风格的微调，强化了在该领域的生成能力，同时保留了对写实场景的兼容性‌。其训练数据特别侧重于人物结构、动态姿势和风格化渲染，尤其在处理复杂肢体动作（如手部细节）方面表现出色‌。训练策略：采用混合精度训练（fp16/bf16）和分层权重调整技术
如何实现对用户密码的加密燃星cro java 数据库后端安全
摘要算法：同样的明文，经过同样的摘要算法，得到的结果是一样的验证方法：验证经过摘要算法处理后的结果，如果密文一样那么就认为明文是一样的//数据库存储的一定是密文，用户输入的是明文；把用户输入的明文经过MD5处理后和数据库的内容进行对比，结果一样就认为密码正确网站解密MD5的原理是将一些较常见的密码经过MD5处理后的结果存储下来之后再与我们输入的需要解密的MD5数据进行比对达成的盐值salt明文+s
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY NODEXY@2014.8.12 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他