真.电脑人

Hyper-v虚拟机Hadoop集群搭建

大数据

Hadoop简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。(海量数据存储)

HDFS为海量的数据提供了存储，而MapReduce**分布式计算**则为海量的数据提供了计算

总结：用Java开发

HDFS–解决大数据存储问题

MapReduce–解决大数据计算问题

HDFS 全称 Hadoop Distributed File System 中文 Hadoop分布式文件系统。

作用：解决海量数据存储问题。

突破单体服务器的存储能力。

HDFS架构分析

# 核心概念1

1. `DataNode`：Slave节点，专门用来存储数据块(Block)的廉价服务器。
	1. 管理存储数据文件切分后的block(128MB)，存放硬盘上。廉价机器。
	2. 从机（slave）,定期向namenode发送心跳(3s)，告知datanode(ip 磁盘容量)
	3. 接收数据datablock上传下载的客户端请求。
2. `NameNode`：Master节点，管理从节点，并接受客户端访问
	主节点  master
     1. 基于内存存储管理hdfs中文件的元数据(文件描述信息)---保存内存中
         (文件名 路径 大小 时间 权限 用户 组 )
     2. 管理hdfs集群中所有的datanode信息
               dn1 192.168.199.11 硬盘空间(数据存储负载均衡)
               [文件名1-blk1 路径 大小  时间]
               dn2 192.168.199.12 硬盘空间
               dn3 192.168.199.13 硬盘空间
               目的：掌握datanode健康状况，了解磁盘容量，数据分布的负载均衡。
      				均衡使用datanode的磁盘空间。
     				集合多个datanode服务器的网络带宽，提高数据传输速度。
     3. 管理dn中block的checksum。
     		NameNode存储了文件拆分后的block分布信息：
   			block0--[ip1,ip2]--起始位置--大小--checksum
  			block1--所在dn的ip--起始位置--大小--checksum
     4. 接受客户端的访问。
3. `Block`：文件切分后的数据块
		大小默认128MB
     	原因：现有服务器机房局域网网络带宽千兆带宽==125MB/s
     	说明：block过大：导致单个block网络传输速度过慢，无法利用多个datanode网络传输的带宽。
     		 block过小：block个数过多，导致namenode内存过度占用，导致不足。
4. `Client`：
	java或者命令行工具，用来访问HDFS中的数据的。

# 重要概念2

1. `replication` 副本
	 每个block在hdfs的datanode会存储多份。默认replication=3，每个block有3份。
     原因：防止单体datanode宕机损坏导致数据丢失。
     实战参数：一般block的replication就是3个。
2. `checksum` 校验和,类似指纹数字签名。
    作用：datanode定期向namenode汇报文件的checksum，由namenode判断文件是否完整。

搭建HDFS单体架构

软件准备

Hadoop: http://archive.apache.org/dist/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.tar.gz

官网：http://hadoop.apache.org/docs/r2.9.2/

安装步骤

1.准备虚拟机


  1. 设置hostname
  	hostnamectl set-hostname hadoop10
  2. 配置hosts(linux+windows)----域名映射
    vim /etc/hosts
    ----------以下是文件信息------------
    192.168.199.8 hadoop10
  3. 关闭防火墙
  	systemctl stop firewalld
  	systemctl disable firewalld ----禁止防火墙启动
  4. 安装jdk1.8。
  	[root@hadoop10 modules]# tar zxvf jdk-8u221-linux-x64.tar.gzc -C /opt/installs/
    [root@hadoop10 installs]# mv jdk1.8.0_171/ jdk1.8       -----改名
  5. 配置jdk环境变量。
  	 [root@hadoop10 installs]# vim /etc/profile
       # JAVA
      # JAVA_HOME
      export JAVA_HOME=/opt/installs/jdk1.8/
      # PATH
      export PATH=$PATH:/opt/installs/jdk1.8/bin/
      # CLASSPATH
      export classpath=.
      
      	加载配置：source /etc/profile
   		验证 ：java -version
[root@hadoop10 installs]# java -version
java version "1.8.0_221"
Java(TM) SE Runtime Environment (build 1.8.0_221-b11)
Java HotSpot(TM) 64-Bit Server VM (build 25.221-b11, mixed mode)

2. 安装hadoop

1.解压
	[root@hadoop10 module]# tar zxvf hadoop-2.9.2.tar.gz -C /opt/install/
	[root@hadoop10 installs]# mv hadoop-2.9.2/ hadoop2.9.2
2.配置环境变量
	vim /etc/profile
	-------------以下是环境变量-------------
	# 配置HADOOP_HOME
	export HADOOP_HOME=/opt/installs/hadoop2.8.3
	# 配置PATH
	export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
3.生效配置信息(重新执行profile中的指令，加载配置信息)
	source /etc/profile

3. 初始化配置文件

--文件路径  /opt/installs/hadoop2.9.2/etc/hadoop/
   hadoop-env.sh
   core-site.xml
   hdfs-site.xml
   slaves

# 1:hadoop-env.sh
    # jdk安装目录
    export JAVA_HOME=/opt/installs/jdk1.8
# 2:core-site.xml
	# 配置hdfs入口
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://hadoop10:9000</value>
	</property>
	# 配置 数据保存位置（在hadoop目录下新建data目录）
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/opt/installs/hadoop2.9.2/data</value>
	</property>
# 3:hdfs-site.xml
	# 配置副本个数
	<property>
		<name>dfs.replication</name>
		<value>3</value>
	</property>
# 4:slaves
  	# 配置从机datanode的ip
  	  hadoop10
  	  hadoop11
  	  hadoop12

HDFS完全分布式集群搭建

Hyper-v虚拟机克隆

克隆两个虚拟机，克隆前需要关闭虚拟机。

导出

# 选中虚拟机
# 导出
# 选择文件夹

导入

# 选中虚拟机右键
# 导入
	选择导出时的文件夹
# 新建文件夹放入虚拟磁盘

修改IP和hostname

# 修改IP
vim /etc/sysconfig/network-scripts/ifcfg-ens
# 修改hostname
# 查看主机名
hostname
[当前用户@主机名 ~]#
# 设置主机名
hostnamectl set-hostname 主机名

重启网卡
```
systemctl restart network
```

免密登录

开启多窗口命令同时执行

#  免密登录(在NameNode节点)
1. 生成秘钥   ssh-keygen 直接回车
[root@hadoop11 hadoop]# ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa):
/root/.ssh/id_rsa already exists.
Overwrite (y/n)? y
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:4nlM7ptcpn0vzIINjFPw0+Bw0rrAScFc3PHOpkuWl8c root@hadoop11
The key's randomart image is:
+---[RSA 2048]----+
|   o.+.o..       |
|    + = =.       |
|   o . O o.      |
|    + . =o.      |
|     ..=S.+      |
|     .+*o+ o     |
|      o.O+=oE    |
|       *.Oo.=    |
|        B..o o.  |
+----[SHA256]-----+

2. 发送公钥到集群所有节点 hadoop11 hadoop12 hadoop13
[root@hadoop11 hadoop]# ssh-copy-id hadoop11
[root@hadoop11 hadoop]# ssh-copy-id hadoop12
[root@hadoop11 hadoop]# ssh-copy-id hadoop13
3. 验证免密登录效果
ssh root@hadoop13

# 免密登录设置
    0：ip hostname hosts的设置要在免密登录设置之前。
	1. 生成一对秘钥(私钥+公钥)
		ssh-keygen
	2. 将公钥拷贝到被免密登录的机器上。
		ssh-copy-id root@ip
   3. 将 hosts 文件保持三台服务器一致

启动集群

#   初始化HDFS
	1. 删除hadoop的data文件夹
	2. 格式化集群
	   在namenode节点执行格式化。
	   hdfs namenode -format

# start-x启动的原理。
start-dfs.sh和stop-dfs.sh
  会`远程登录`到NN和DN对应的节点执行hadoop-deamon.sh start namenode 或者hadoop-deamon.sh start datanode命令启动对应节点的服务。

#  启动hadoop集群
	1. 在namenode节点，执行start-dfs.sh
# 启动hdfs
start-dfs.sh
# 关闭hdfs
stop-dfs.sh

#  测试验证

# 查看hdfs进程
[root@hadoop10 install]# jps
2225 NameNode  # master namenode主机
4245 Jps
2509 SecondaryNameNode 
2350 DataNode	# slave datanode从机

# 查看hdfsWeb服务
1. 查看namenode的web服务
	http://hadoop10:50070
2. 查看datanode的Web服务
	http://hadoop10:50075

补充

#日志监控
`	#namenode启动日志`
		hadoop-用户名-namenode-主机名.log
`	#datanode启动日志`
		hadoop-用户名-datanode-主机名.log

#搭建故障处理

# 查找问题
	# 查看hdfs启动执行日志。
	# namenode启动日志
	tail -f /opt/installs/hadoop2.9.2/logs/hadoop-用户名-namenode-主机hostname.log
	# datanode启动日志
	tail -f /opt/installs/hadoop2.9.2/logs/hadoop-用户名-datanode-主机hostname.log

# 解决问题
	1. 关闭启动的hdfs程序(NN DN)。
	2. 修改错误的配置文件。
	3. 重新格式化hdfs集群。
		① 删除data文件夹下的所有内容。
		② 重新执行namenode的格式化
			hdfs namenode -format

知识补充

# 启动失败如何处理
  场景： 格式化或者启动hadoop失败。
  说明：
  		hadoop/data文件夹
  		作用： 保存datanode和namenode持久化的数据。
  		时机：
  			1. 格式化hdfs namenode -format 会初始化该目录下的文件。
  			2. hdfs运行期间产生的数据，会操作该目录中的数据。
  必要操作：删除格式化或者启动数据保存的文件目录。

# web界面
   NameNode的web管理器地址：http://ip:50070.

# 启动过程日志监控(查看错误)

# 监控namenode启动日志
	/hadoop2.9.2/logs/hadoop-用户名-namenode-主机名.log
# 监控datanode启动日志
    /hadoop2.9.2/logs/hadoop-用户名-datanode-主机名.log

你可能感兴趣的:(hadoop,大数据,分布式)

java cap理论_架构设计之「 CAP 定理」 Can Li java cap理论
点击上方“Java知音”，选择“置顶公众号”技术文章第一时间送达！作者：奎哥来源：不止思考在计算机领域，如果是初入行就算了，如果是多年的老码农还不懂CAP定理，那就真的说不过去了。CAP可是每一名技术架构师都必须掌握的基础原则啊。现在只要是稍微大一点的互联网项目都是采用分布式结构了，一个系统可能有多个节点组成，每个节点都可能需要维护一份数据。那么如何维护各个节点之间的状态，如何保障各个节点之间数据
SpringCloud分布式中怎么使用open-feign来相互调用微服务(前提是服务都要注册到注册中心【zookeeper,或者nocas】) JISOOLUO 实用的示例网关 java 接口 spring
1、引入open-feignorg.springframework.cloudspring-cloud-starter-openfeign
python 分布式集群_Python搭建Spark分布式集群环境小国阁下 python 分布式集群
前言ApacheSpark是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。Spark最大的特点就是快，可比HadoopMapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群，而是使用三台电脑来搭建一个小型分布式集群环境安装。本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群，同样适用于搭建Spark1.6.2
spark集群完全分布式搭建。。，。，。分布式 spark 大数据
1.spark的运行架构（主从模式）主节点：master-----资源管理调度和任务的分配---------类似yarn从节点：worker-----执行具体的计算任务整体运行架构：编写spark运行程序用户将应用程序提交给spark集群驱动其会创建对应的编程入口（sparkcontext/sparksession）主节点复制资源管理调度和任务分配从节点执行计算任务（多个计算任务：每个计算任务会分
【Python】RocketMQ 基础使用 Encarta1993 Python rocketmq
目录1.介绍2.实践2.1.启动消费者2.2.启动生产者1.介绍RocketMQ是一个开源的分布式消息传递系统，最初由阿里巴巴集团开发并于2012年开源。它旨在解决高可靠性、高吞吐量、低延迟和可伸缩性等大规模分布式系统下的消息通信需求。RocketMQ的设计目标是提供一种灵活、可靠、高性能的消息传递解决方案，适用于各种场景，包括在线消息通信、日志处理、流式处理、事件驱动架构等。下面是对Rocket
Hadoop错误: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 学习总结星月情缘02 ETL技术 Hadoop hdfs租约 hadoop错误
错误总结分享:使用了hadoop挺长时间了，多数人应该很熟悉它的特点了吧，但是今天突然遇到个错误，从来没见过，一时自己也想不到是什么原因，就在网上查了一些资料，得到了解决的办法，再次分享一下。过程:使用kettle数据清洗工具在进行同步任务的过程中，最后数据是被加载到hdfs的，这里用shell脚本实现，hdfsdfs-put-r/hdfs的目录。结果程序执行到这一步的时候报错了。错误描述就是文章
【硬刚大数据】2021年从零到大数据专家之Hbase八股文王知无(import_bigdata)
欢迎关注博客主页：https://blog.csdn.net/u013411339欢迎点赞、收藏、留言，欢迎留言交流！本文由【王知无】原创，首发于CSDN博客！本文首发CSDN论坛，未经过官方和本人允许，严禁转载！本文是对《【硬刚大数据之学习路线篇】2021年从零到大数据专家的学习指南(全面升级版)》的面试部分补充。硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)
Apache STORM工作原理详解 Neil Parker apache storm java
ApacheStorm是一个分布式实时计算系统，允许用户在集群上运行流式数据处理应用程序。它的核心原理是将流式数据分割成多个小块，每个小块都会被分配给不同的计算节点进行处理，并且处理结果会被发送到下一个节点，直到达到最终结果。以下是ApacheStorm的工作原理：Nimbus是整个集群的控管核心，负责topology的提交、运行状态监控、任务重新分配等工作。zk就是一个管理者，监控者。总体描述：
史上最强！Spring Boot 3.3 高效批量插入万级数据的多种方案 m0_74825074 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot3.3多种方式实现高效批量插入万级数据，史上最强！在大数据处理场景下，如何高效地将大量数据插入数据库是一个重要课题。本文基于SpringBoot3.3及MyBatis-Plus，介绍几种高效的批量插入数据的方法，包括：使用JDBC批处理使用自定义SQL批处理单条插入（for循环）拼接SQL语句插入MyBatis-Plus的saveBatch方法循环插入+开启批处理模式每种方式都
Spring Boot 整合 Apollo 配置中心实战疯狂的键盘侠 spring boot java apollo spring boot java
SpringBoot整合Apollo配置中心实战一、Apollo简介二、环境准备三、项目整合步骤四、配置使用示例五、常见问题及解决在分布式系统开发中，配置管理至关重要。Apollo作为携程开源的一款可靠的配置中心，能高效地集中管理应用配置，实现实时更新推送，助力开发者轻松应对复杂多变的配置场景。本文将带你一步步完成SpringBoot项目与Apollo配置中心的整合，让你的应用配置管理如鱼得水。一
多租户架构未提供足够的租户安全培训和教育图幻未来网络安全
多租户架构下租户安全培训与教育的需求分析与解决方案引言随着云计算和大数据技术的飞速发展，多租户架构已成为企业数字化转型的重要基石。多租户架构允许一个应用程序实例为多个租户提供服务，从而降低了企业的运营成本。然而，这种架构也带来了一系列的安全挑战。为了解决这些问题，企业需要加强对租户的安全培训和教育，确保租户了解如何在使用多租户架构时保护自己的数据和应用程序。本文将探讨多租户架构下的租户安全培训和教
3步搞定：java分布式WebSocket与消息队列的奇妙邂逅？墨瑾轩一起学学Java【一】分布式 websocket 网络协议 java
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，亲爱的开发者们！今天我们要聊的是那个让分布式系统心跳加速的热门话题——如何用消息队列轻松实现分布式WebSocket。别急，我会一步步带你走进这个奇妙的世界，让你轻松掌握这门技艺。准备好了吗？让我们开始这场技术盛宴吧！引言在这个信息爆炸的时代，WebSoc
一文了解大数据概论程序员
一.大数据概论1.1大数据概念大数据（bigdata）：指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。主要解决，海量数据的存储和海量数据的分析计算问题。按顺序给出数据存储单位：bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。1Byte=8bit
HBase-2.5.10 伪分布式环境搭建【Mac】凡许真 hbase 伪分布式 zk mac
文章目录前言一、搭建单节点Zookeeper1.解压zookeeper2.配置环境变量3.修改配置文件4.启动zk二、搭建伪分布式Hbase1.解压hbase2.配置环境变量3.修改配置4.启动HBase前言搭建hbase伪分布式环境提示：以下是本篇文章正文内容，下面案例仅供参考一、搭建单节点Zookeeper1.解压zookeeper版本：3.8.02.配置环境变量vi~/.bash_profi
Hadoop3.3.4伪分布式环境搭建凡许真分布式 hadoop 伪分布式 hadoop3.3.4
文章目录前言一、准备1.下载Hadoop2.配置环境变量3.配置免密二、Hadoop配置1.hadoop-env.sh2.hdfs-site.xml3.core-site.xml4.mapred-site.xml5.yarn-site.xml三、格式化四、启动五、访问web页面前言hadoop学习——伪分布式环境——普通用户搭建一、准备1.下载Hadoop2.配置环境变量vi~/.bash_pro
Hadoop HA 格式化NameNode 顺序凡许真 hadoop 大数据分布式 HA
文章目录前言一、启动JournalNode二、格式化NameNode1.执行格式化命令2.启动namenode3.执行格式化命令4.启动namenode其他前言记录搭建HadoopHA架构时格式化namenode问题一、启动JournalNode分别启动JournalNode，命令如下hadoop-daemon.shstartjournalnode二、格式化NameNode1.执行格式化命令找其中
【热门主题】000045 分布式数据库：技术演进与应用探索宝码香车热门主题数据库
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录【热门主题】000045分布式数据库：技术演进与应用探索一、分布式数据库概述（一）定义与原理（二）发展历程二、数据一致性实现方法（一）传统方法与挑战（二）多种实现方案三、架构设计（一）MySQL常见架构1.搭建步骤2.复制原理3.优缺点（二）
【热门主题】000059 分布式数据库：技术演进与未来展望宝码香车热门主题数据库
前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏+关注哦目录【热门主题】000059分布式数据库：技术演进与未来展望一、分布式数据库概述二、发展历程（一）传统单机数据库的局限（二）互联网时代的挑战与探索（三）分布式数据库的崛起三、核心技术（一）数据复制（二）数据分区（三）分布式事务四、架构类型（一）分
Redis部署方式全解析：优缺点大对比恩爸编程 redis redis 数据库缓存 redis部署方式对比 redis部署介绍 redis有几种部署方式 redis怎样部署
Redis部署方式全解析：优缺点大对比一、引言Redis作为一款高性能的内存数据库，在分布式系统、缓存、消息队列等众多场景中都有着广泛的应用。选择合适的Redis部署方式，对于系统的性能、可用性、可扩展性以及成本等方面都有着至关重要的影响。本文将详细介绍Redis的几种常见部署方式，并对它们的优缺点进行全面对比。二、单机部署2.1原理单机部署是Redis最基础的部署方式，即将Redis服务安装在一
金融行业关系型数据库信创技术路线选型实践总结罗伯特之技术屋人工智能与智能系统专栏金融数据库
【摘要】数据库信创改造是当前金融领域信息化建设的迫切需求和难点之一。本文重点分析关系型数据库的国产化技术路线，从金融行业数据库国产化发展现状入手，分析了国产化集中式数据库与分布式数据库的特性对比，作者结合选型实践，重点介绍了基于PostgreSQL系列的国产集中式数据库实现和应用场景。该总结内容实用，虽立足于金融行业，其他行业用户也可以对照业务特点，撷取共性部分进行参考。1背景当前，随着数字化技术
云计算技术深度解析与代码使用案例我的运维人生云计算运维开发技术共享
云计算技术深度解析与代码使用案例引言随着信息技术的飞速发展，云计算作为一种革命性的技术，正在逐步改变我们的生活和工作方式。云计算不仅提供了前所未有的计算能力和存储资源，还以其灵活性和可扩展性，成为现代企业数字化转型的重要支撑。本文将深入探讨云计算的核心技术、应用场景，并通过一个具体的代码使用案例，展示如何在云计算平台上实现一个基本的应用程序。云计算技术特点云计算是网格计算、分布式计算、并行计算、效
java获取本地文件和远程文件的方式码至终章 java 开发语言 servlet
问题背景：我们项目开发的时候，经常会读取文件，如果文件在本服务器，则直接用newFile()读取即可，但是有时候需要远程读取文件，比如读取分布式存储服务器的内容或者是别人家的图片资源，这个时候newFile就无法满足要求了。下面提供列出获取远程文件和本地文件的方式1、获取远程文件如图片路径为https://kk360.com/user/20230622/gm/30293817365.jpgimpo
中国BI步入增长大周期，腾讯云ChatBI加速AI+BI融合大数据在线 AI 云静思园人工智能腾讯云大数据 ChatBI AI+BI
过去十年，大数据技术的快速发展，让数据消费前进一大步，数据价值得到一定程度的挖掘与释放，真正开启了“用数”的大时代。但数据分析繁杂的技术栈、复杂的处理过程以及程式化的交互方式，让“数据消费”的门槛始终降不下来，一定程度制约着企业迈向“用好数”的新阶段。如今，随着大模型和生成式AI的迅猛发展，数据消费正迎来一场巨大变革。大模型与数据分析天然的融合属性，使得商业智能（以下简称：BI）迎来全面重塑，BI
深度剖析分布式数据库：突破数据存储与管理的界限 Darryl大数据数据库大数据分布式
“”"深度剖析分布式数据库：突破数据存储与管理的界限在当今这个数字化浪潮汹涌澎湃、势不可挡的时代背景之下，数据量正以一种令人惊叹的指数级增长态势不断攀升。传统的数据库在面对海量数据的处理以及高并发读写等复杂场景时，逐渐开始显得力不从心、捉襟见肘。而分布式数据库则恰似一场及时雨，在这样的关键时刻顺势而生，为现代企业的数字化转型成功开辟出一片崭新的天地。此时此刻，让我们一同深入地探究分布式数据库这一神
乐学智伴：基于人工智能与大数据的学生个性化学习辅助平台 IT源码大师人工智能大数据学习
详细描述：1.引言：教育科技的时代背景在信息化和数字化的浪潮下，教育领域正经历着深刻的变革。传统的教学模式以教师为中心，难以满足学生个性化学习的需求。随着人工智能、大数据和云计算等技术的快速发展，教育科技（EdTech）为个性化学习提供了全新的解决方案。通过智能化工具和数据分析，学生可以根据自身的学习特点和进度，制定个性化的学习计划，从而提高学习效率和效果。“乐学智伴”是一款基于人工智能与大数据技
Python开发FastAPI从入门到精通赵梓宇 Python权威教程合集 fastapi python 前端
想用Python写API快到飞起？FastAPI就是你的“代码瑞士军刀”！这本书不讲玄学，只教真功夫——从零搭建高性能API，到微服务、分布式事务、熔断限流，连异步编程都能玩成魔法！小白也能变大神：路由、依赖注入、数据库集成手把手教学；老鸟直呼内行：服务网格、Saga模式、K8s部署实战全覆盖。附赠三个硬核项目：任务管理、在线商城、实时聊天系统，代码跑起来比老裁缝织毛衣还丝滑！别说我没提醒你：翻开
Hive存储系统全面测试报告蚂蚁质量软件测试测试用例功能测试
引言在大数据时代，数据存储和处理技术的重要性日益凸显。ApacheHive作为一个基于Hadoop的数据仓库工具，因其能够提供类SQL查询功能（HiveQL）而广受欢迎。Hive的设计初衷是为了简化大数据集的查询和管理，它允许用户通过简单的SQL语句来操作存储在Hadoop分布式文件系统（HDFS）上的大规模数据集。然而，随着数据量的激增和业务需求的多样化，Hive存储系统的功能、性能和安全性面临
企业数字化转型AI能力中台（总体架构、系统功能）建设方案公众号：优享智库数字化转型数据治理主数据数据仓库人工智能架构
**企业数字化转型AI能力中台建设方案**一、建设背景与目标随着大数据、云计算、人工智能等技术的快速发展，企业正面临着数字化转型的重要机遇。为了提升企业的智能化水平，加快业务创新，建设AI能力中台成为企业的迫切需求。本方案旨在为企业打造一套功能完善的AI能力中台，实现数据采集与整合、算法模型管理、智能分析与可视化等核心功能，推动企业在各个业务领域实现智能化升级和创新。二、总体架构设计AI能力中台采
「SpringCloudAlibaba系列」分布式限流框架Sentinel基本引用｜我有一头小花驴分布式 sentinel
分布式限流框架Sentinel基本引用Sentinel的基本引用使用Sentinel的核心库实现限流，主要分以下几个步骤：定义资源定义限流规则校验规则是否生效Sentinel实现限流引入Sentinel核心库com.alibaba.cspsentinel-core1.8.2复制代码定义普通业务方法privatestaticvoiddoLimiting(){try(Entrylimiting=Sph
rate-limit 一款 java 开源渐进式分布式限流框架使用介绍老马啸西风动手写框架 java 开源 spring
项目简介rate-limit是一个为java设计的渐进式限流工具。目的是为了深入学习和使用限流，后续将会持续迭代。特性渐进式实现支持独立于spring使用支持整合spring支持整合spring-boot内置多种限流策略快速开始需求jdk1.7maven3.x+maven导入com.github.houbbrate-limit-core1.1.0入门例子方法定义@RateLimit限流注解放在方法
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他