月望曦

大数据技术原理与应用第二篇大数据存储与管理（一）笔记

第三章分布式文件系统HDFS

一、分布式文件系统

1.1 计算机集群基本架构

1.2 分布式文件系统结构

二、 HDFS

2.1 HDFS特点

2.2 HDFS的体系结构

2.3 HDFS的存储原理

第四章、分布式数据库HBase

一、HBase和Hadoop

1.1 HBase与Hadoop生态的关系

1.2 Hbase和HDFS

二、 Hbase特点

2.1 HBase与传统关系数据库

2.2 HBase数据模型

2.3 Hbase视图

三、 HBase实现原理

3.1 HBase功能组件

3.2 Region的定位

3.3 HBase运行机制

第三章分布式文件系统HDFS

一、分布式文件系统

分布式文件系统：是一种通过网络实现文件在多台主机上进行分布式存储的文件系统

HDFS：针对谷歌GFS的开源实现

1.1 计算机集群基本架构

集群中的计算机节点放在机架上，每个机架可以存放8~64个节点，同一个机架上不同节点之间通过网络互连，不同机架间采取另一级网络或交换机互连。

【机架上有多台服务器，机架内通过网络互连，机架间通过交换机或局域网互连】

1.2 分布式文件系统结构

存储思想：

OS中文件系统会将磁盘空间划分为512B的磁盘块，存储时将文件分块，且每块是磁盘块的整数倍。而分布式文件系统也采用了分块，且块很大【HDFS每块为64MB】，与OS文件系统不同的是，如果一个文件小于一个数据块，其不会占用整个块的存储空间。

物理结构：

分布式文件系统将计算机集群的节点分为名称节点【主节点】和数据节点【从节点】。

节点

功能

说明

名称节点

1、负责文件和目录的创建、删除和重命名等

2、管理数据节点和文件块的映射关系

客户端只有访问名称节点才能找到数据块的存储位置，进而进行读取

数据节点

1、负责数据的存储和读取

存储时：由名称节点分配存储位置，然后客户端，直接将数据写入相应的数据节点

读取时：客户端从名称节点获得数据节点和文件块的映射关系，直接到相应位置访问文件块

预防措施

采用多副本存储，文件块被复制为多个副本，存储到不同的节点上，且同一文件块的副本分布到不同的机架上。

遇到节点故障时，可以快速调用副本，而不用重启整个计算过程。

适用范围范围

分布式文件系统是针对大规模数据存储而设计，主要用于处理大规模文件【TB级】，处理小规模文件时，不仅没有优势，而且会严重影响系统的扩展和性能

二、 HDFS

2.1 HDFS特点

优势

兼容廉价的硬件设备：快速检测硬件故障和自动恢复机制，硬件出错也能实现数据的完整性。

实现流数据读写：顺序、大量、快速、连续到达的数据序列，不可随机读写。

支持大数据集：GB，TB支持简单的文件模型：一次写入，多次读取

强大的跨平台兼容性：支持JVM即可用。

局限

不适合低延迟数据访问：大规模数据批处理，流式数据读取，高吞吐率，高延迟。

无法高效存储大量小文件：存储问题：名称节点内存保存文件的元数据【信息】，大量小文件会增加名称节点空间且检索效率低。处理问题：MapReduce处理小文件，产生大量Map线程，开销太大。

不支持多用户写入及任意修改文件：一个文件只能有一个写入者，且只有追加操作，不随机写操作。

2.2 HDFS的体系结构

结构	功能	说明	特点
名称节点	HDFS中，选择性能较好的机器作为唯一的名称节点，负责管理分布式文件系统的命名空间，保存了两个核心数据结构：FsImage和EditLog。名称节点记录了块所在数据节点的位置信息，但并非持久化存储，而是在每次启动时，加载FsImage，并逐步执行EditLog。同时创建新FsImage和新空的EditLog。根据客户端发送的文件名返回文件数据块对应的数据节点位置信息。	FsImage用于维护文件系统树和树中所有文件和目录的元数据 EditLog中记录了所有针对文件的创建删除重命名等操作运行过程中，操作并不会直接写入fsImage，而是写入EditLog。	名称节点在启动时会进入安全模式，此期间只对外提供读操作，无法进行写操作。启动结束后，进入正常状态，对外提供读写操作。在整个访问过程中，名称节点不参与数据的传输，使得每个文件的数据能在不同数据节点上实现并发访问。保证了数据不会脱了名称节点的同时，减轻了中心服务器的复返，简化管理。
第二名称节点	完成EditLog和FsImage的合并操作，减小EditLog大小。作为名称节点的检查点，保存元数据信息	为了防止EditLog文件过大，导致名称节点启动缓慢，长期处于安全模式，采用第二名称节点。每隔一段时间，第二名称节点和名称节点进行通信，完成合并E和F的操作，同时创建新F执行原E后替换原F，创建新E记录合并期间操作并替换原E。名称节点发生故障时，可从第二名称节点进行系统恢复	在合并期间，名称节点产生故障丢失的元数据无法被恢复。所以第二名称节点只是检查点，无法做到热备份
数据节点	负责文件的存储和读取，根据客户端和名称节点的调度进行数据的存储和检索，定时向名称节点发送心跳和存储数据块的列表信息，死机节点不会被分配IO请求		数据节点的文件保存在本地Linux系统，
命名空间	HDFS使用传统的分级文件体系，支持创建删除目录和文件，支持重命名、转移文件。 HDFS不支持磁盘配额、文件访问权限、软硬连接等功能	HDFS命名空间包括目录、文件和块命名空间管理是只命名空间支持对HDFS中的文件目录块做类似文件系统的创建、修改等基本操作	整个HDFS集群只有一个命名空间，由唯一的名称节点对其管理
通信协议			HDFS的所有通信协议都建立在TCP/IP基础上。

HDFS体系结构的局限性

1、命名空间的限制：名称节点保存在内存中，其容纳文件数量收到内存大小的限制

2、性能瓶颈：整个文件系统的吞吐量受限于单个名称节点的吞吐量

3、可用性：一旦名称节点故障，整个集群将不可用

4、隔离问题：唯一的名称节点无法对不同应用程序进行隔离

2.3 HDFS的存储原理

方法	说明	特点
冗余存储	HDFS使用多副本方式进行冗余存储，一个数据块的多个副本会被分布到不同数据节点上。	1、加快数据传输速度，多客户端从不同副本并发读取文件 2、容易检查出数据错误，多副本检错 3、可靠性强，不容易造成数据丢失
数据存取	数据存放：默认三个副本，两个在同一机架的不同节点，一个在另一个机架数据读取：HDFS提供API返回数据节点所在机架，客户端读取数据时，优先读取同一机架上的副本，或随机选择其它机架副本。数据复制：流水线复制。	流水线复制：客户端向HDFS中写入文件时，首先将文件写入本地，然后按HDFS给文件分块。每一块都向名称节点发起写请求，名称节点返回一个数据节点列表。然后客户端向列表内节点1写入4KB【假设】数据，并将列表传给节点1，节点1向节点2发送连接请求，将4KB数据和列表发送给节点2，以此类推。当文件写完时，数据复制也同时完成
数据错误与恢复	名称节点出错：法一：将名称节点的元数据信息同步到远程挂载的网络文件系统。法二：第二名称节点。数据节点出错：法一：定期发送心跳。法二：节点导致副本数量少于冗余银子，生成新副本数据出错：MD5和SHA-1校验。创建文件时，会摘录信息写入同级下隐藏文件中，用作校验。名称节点会定期检查并重新复制出错数据块。	硬件出错是常态名称节点出错：结合法一二，当名称节点发生死机时，首先到网络文件系统获取备份元数据，放到第二名称节点进行恢复，然后使用第二名称节点作为名称节点。。数据节点出错：HDFS与其它分布式FS最大区别是可以调整备份数据位置。

第四章、分布式数据库HBase

HBase：针对谷歌BigTable的开源实现，是一个高可靠，高性能，面向列，可伸缩的分布式数据库，主要用来存储非结构化和半结构化的松散数据。

BugTable：一个支持大规模海量数据、分布式并发数据处理效率极高、易于扩展且支持动态伸缩，适用于廉价设备，适合读操作不适合写操作的分布式存储系统

一、HBase和Hadoop

1.1 HBase与Hadoop生态的关系

Hadoop生态	与HBase的功能
Zookeeper	作为协同服务，为HBase提供了稳定服务和failover【失败恢复机制】
Pig和Hive	为HBase提供了高层语言支持，使得在HBase上进行数据统计处理变的非常简单
Sqoop	为HBase提供了方便的RDBMS（关系型数据库）数据导入功能，使得传统数据库数据向HBase中迁移变的非常方便。
HDFS	为HBase提供了高可靠性的底层存储支持，提供海量数据存储能力
Hadoop MapReduce	为HBase提供了高性能的计算能力

1.2 Hbase和HDFS

HBase本质是一个高并发的分布式数据库，其底层文件系统可以是任何分布式文件系统，在HDFS基础上提供了随机写入功能。。

HDFS的视角看，HBase就是它的客户端。

HBase本身并不存储文件，它只规定文件格式以及文件内容，管理的是数据本身，实际文件存储由HDFS实现，管理的是记载着这些数据的文件。

HBase不提供机制保证存储数据的高可靠，数据的高可靠性由HDFS的多副本机制保证。

HBase-HDFS体系是典型的计算存储分离架构。

Hadoop 已有 HDFS 和 MapReduce，为什么需要 HBase?

HDFS面向批量访问模式，不是随机访问模式

Hadoop可以很好地解决大规模数据的离线批量处理问题，但是，受限于Hadoop MapReduce编程框架的高延迟数据处理机制，使得Hadoop无法满足大规模数据实时处理应用的需求

传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题(分库分表也不能很好解决)

传统关系数据库在数据结构变化时一般需要停机维护;空列浪费存储空间

二、 Hbase特点

2.1 HBase与传统关系数据库

方面	传统关系数据库	HBase
数据类型	采用关系模型，具有丰富的数据类型和存储方式	采用更简单的数据模型，将所有数据【结构化/非结构化】存储为未解释的字符串，由用户编写程序解析字符串成为不同类型。
数据操作	提供设计多表连接的增删查改操作	只提供单表增删查清空等操作，无法改，只能追加
存储模式	基于行模式存储，元组被连续存储在磁盘页中，读取数据时顺序查扫描，然后筛选所需属性。【无论查找几个属性都会查找整行后筛选，容易浪费磁盘空间和内存带宽】	基于列存储，每个列族由几个文件保存，不同列族的文件是分离的。可以降低I/O开销，支持大量用户并发查询【不需要处理无关列/属性】；同一个列族的数据会被一起压缩，相似度高的数据会得到更高的压缩比。
数据索引	可针对不同列构建复杂的多个索引，提高访问性能	只有一个索引--行键，因设计巧妙，查询时系统不会慢下来，且在Hadoop框架下，MapReduce可以快速高效生成索引表
可伸缩性	横向扩展困难，纵向扩展优先	分布式数据库横向扩展灵活，轻易增加减少硬件实现性能伸缩
数据维护	更新时会替换旧值，旧值不复存在	更新操作生成新版本，仍保留旧版本

2.2 HBase数据模型

HBase实际上是一个稀疏【有些列/列族的内容为空】、多维、持久化存储的映射表。采用行键，列族，列限定符和时间戳进行索引，每个值都是未解释的字节数组byte[]。

表：HBase采用表来组织数据，表由行和列组成，列划分为若干个列族。用户在表中存储数据，每一行都有一个可排序的行键和任意多的列。

行：每个表都由若干行组成，每个行由行键来标识。

列族：一个表被分组成许多“列族” 的集合，它是基本的访问控制单元。一个列族中可以包含任意多个列，同一个列族里面的数据存储在一起。

列限定符：列族里的数据通过列限定符（或列）来定位。列支持动态扩展，可以很轻松地添加一个列，无需预先定义列的数量以及类型。

单元格：通过行、列族和列限定符确定一个“单元格”，单元格中存储的数据没有数据类型，总被视为字节数组。

时间戳：每个单元格都保存着同一份数据的多个版本，采用时间戳进行索引。

数据坐标：【行键、列族、列限定符和时间戳】

2.3 Hbase视图

概念视图来看，HBase中每个表是有许多行组成的，可通过四维坐标查找单元格的数据。

物理视图来看，在物理存储层面，采用基于列的存储方式，属于同一个列族的数据保存在一起，不同列族分别存放，与列族一起存放的还有时间戳和行键。空列不会被存储，被请求时返回null。

三、 HBase实现原理

3.1 HBase功能组件

功能组件	功能	特点
库函数	连接到每个客户端
Master主服务器	Master服务器负责管理和维护HBase分区信息【一个表被分为哪些Region，每个Region被存放到哪个Region服务器上】，同时也负责维护Region服务器列表。 Master还处理模式变化，如表和列族的创建。	客户端并不是直接从Master获取数据，而是获取Region存储位置信息后，直接从Region读取数据。 HBase客户端并不依赖于Master而是使用ZooKeeper来获取Region位置信息，所以Master负担很小
许多的Region服务器	Region服务器负责存储和维护分配给自己的Region，处理来自客户端的读写请求	当表中的行增加到一定阈值时会被等分成两个Region，Master将Region分配到不同的服务器上，一个Region服务器可维护约1~1000个Region

3.2 Region的定位

三级寻址结构：

层次	名称	作用
第一层	Zookeeper文件	记录了-ROOT-表的位置信息
第二层	-ROOT-表	记录了.META.表的Region位置信息 -ROOT-表只能有一个Region。通过-ROOT-表，就可以访问.META.表中的数据
第三层	.META.表	记录了用户数据表的Region位置信息，.META.表可以有多个Region，保存了HBase中所有用户数据表的Region位置信息

3.3 HBase运行机制

结构	功能
客户端	包含访问HBase的接口，并在缓存中维护着已访问过的Region位置信息，用来加快后续数据访问过程。
Zookeeper服务器	可帮助选举出一个Master作为集群的总管，并保证在任何时刻总有唯一一个Master在运行，就避免了Master的“单点失效”问题。
Master服务器	主服务器Master主要负责表和Region的管理工作：管理用户对表的增加、删除、修改、查询等操作实现不同Region服务器之间的负载均衡在Region分裂或合并后，负责重新调整Region的分布对发生故障失效的Region服务器上的Region进行迁移
Region服务器	HBase中最核心的模块，负责维护分配给自己的Region，并响应用户的读写请求。用户读写数据过程：用户写入数据时，被分配到相应Region服务器去执行用户数据首先被写入到MemStore和HLog中只有当操作写入HLog之后，commit()调用才会将其返回给客户端当用户读取数据时，Region服务器会首先访问MemStore缓存，如找不到，再去磁盘上面的StoreFile中寻找缓存的刷新：系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中，清空缓存，并在HLog里面写入一个标记。每次刷写都生成一个新的StoreFile文件，因此，每个Store包含多个StoreFile文件。每个Region服务器都有一个自己的HLog 文件，每次启动都检查该文件，确认最近一次执行缓存刷新操作之后是否发生新的写入操作；如果发现更新，则先写入MemStore，再刷写到StoreFile，最后删除旧的HLog文件，开始为用户提供服务。 StoreFile的合并：每次刷写都生成一个新的StoreFile，数量太多，影响查找速度调用Store.compact()把多个合并成一个合并操作比较耗费资源，只有数量达到一个阈值才启动合并
Store	多个StoreFile合并成一个单个StoreFile过大时，又触发分裂操作，1个父Region被分裂成两个子Region
HLog	分布式环境必须要考虑系统出错。HBase采用HLog保证系统恢复。 HBase系统为每个Region服务器配置了一个HLog文件，它是一种预写（Write Ahead Log）。用户更新数据必须首先写入日志后，才能写入MemStore缓存，并且，直到MemStore缓存内容对应的日志已经写入磁盘，该缓存内容才能被刷写到磁盘。 Zookeeper会实时监测每个Region服务器的状态，当某个Region服务器发生故障时，Zookeeper会通知Master。Master首先会处理该故障Region服务器上面遗留的HLog文件，这个遗留的HLog文件中包含了来自多个Region对象的日志记录。

你可能感兴趣的:(java,大数据,网络)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p

大数据技术原理与应用 第二篇 大数据存储与管理（一） 笔记

第三章 分布式文件系统HDFS

一、分布式文件系统

1.1 计算机集群基本架构

1.2 分布式文件系统结构

二 、 HDFS

2.1 HDFS特点

2.2 HDFS的体系结构

2.3 HDFS的存储原理

第四章、 分布式数据库HBase

一、HBase和Hadoop

1.1 HBase与Hadoop生态的关系

1.2 Hbase和HDFS

二、 Hbase特点

2.1 HBase与传统关系数据库

2.2 HBase数据模型

2.3 Hbase视图

三、 HBase实现原理

3.1 HBase功能组件

3.2 Region的定位

3.3 HBase运行机制

你可能感兴趣的:(java,大数据,网络)

大数据技术原理与应用第二篇大数据存储与管理（一）笔记

第三章分布式文件系统HDFS

二、 HDFS

第四章、分布式数据库HBase