E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HDFS深入浅出
MR实战:统计总分与平均分
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到
HDFS
指定目录(二)实现步骤1、创建Maven项目2、添加相关依赖3、创建日志属性文件4、创建成绩映射器类
howard2005
·
2023-12-29 10:42
Hadoop分布式入门
mr
成绩统计
MR实战:分科汇总求月考平均分
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据1、在虚拟机上创建文本文件2、上传文件到
HDFS
指定目录(二)实现步骤1、创建Maven项目2、添加相关依赖3、创建日志属性文件4、创建学生实体类
howard2005
·
2023-12-29 10:42
Hadoop分布式入门
mr
分科汇总求月考平均分
datax
DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、SQLServer、Oracle、PostgreSQL、
HDFS
、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能
jerry-89
·
2023-12-29 09:24
DorisDB
database
Hadoop用户权限管理及
hdfs
权限管理
1.创建用户student1,所属分组为studentschown-Rstudent1:students/home/hadoop/hadoop-2.7.6root用户将hadoop的相关操作权限授予student12.修改Hadoop目录的权限chmod-R755/home/hadoop/hadoop-2.7.63.hadoopfs-mkdir/user/student1_home在hadoop上
临界爵迹
·
2023-12-29 09:35
大数据
hadoop
2021-08-25继续热爱生活
我想起来易中天教授在《百家讲坛》节目上讲《品三国》,真的令我佩服,因为讲的内容
深入浅出
,并且充满趣味。
清秋里晨
·
2023-12-29 08:17
中原焦点团队网络初级29期华雪莲持续分享第2天2021.7.29
我是一个心理学纯小白,但是刘老师的讲课内容
深入浅出
,我觉得知识点还是很容易理解的,我理解到最关键的是通过种种设计训练我们做到真正内化于心、形成思维方式,从而在实践中能够潜移默化地应用。
坐看云起xl
·
2023-12-29 07:46
On writing写作这回事
我原来是要把它当成一本工具书来看的,但是真本书的有趣程度、引述的内容、
深入浅出
的描写完全超出了我对它的预期。前面近1/3的内容是斯蒂芬•金的回忆录,你可
胡红梅River
·
2023-12-29 04:39
Spark 集群搭建
yarn-site.xmlspark-env.sh官网求π(PI)案例启动spark-shell通过浏览器查看显示查看Spark的网页信息展示搭建前准备下载地址:Indexof/dist/spark(apache.org)配置好hadoop环境,
hdfs
撕得失败的标签
·
2023-12-29 00:42
大数据技术
spark
大数据
分布式
hadoop
yarn
hdfs
Hive的DataBase数据定义操作语言
1,官网提供的创建数据库格式CREATE(DATABASE|SCHEMA)[IFNOTEXISTS]database_name[COMMENTdatabase_comment][LOCATION
hdfs
_path
BABA_777
·
2023-12-28 23:43
巧妙实现四大实时功能 | Linkis与Hudi结合的数据湖构建实践
近段时间,我们也调研和实现了hudi作为我们数据湖落地的方案,他帮助我们解决了在
hdfs
上进行实时upsert的问题,让我们能够完成诸如实时ETL,实时对账等项目。hudi作为一个数据湖的实
康月牙
·
2023-12-28 20:02
数据分析入门自学计划制定--20180520
首先说一下数据分析入门:根据某公司数据分析岗位的招聘信息以及自身情况制定以下学习计划:1、
深入浅出
数据分析:重点了解数据分析的流程、应用场景、以及书中提到的若干数据分析工具,无需纠结分析模型的实现。
先生买多花吧
·
2023-12-28 19:30
【
HDFS
联邦(1)】ViewFs与联邦理论知识详解
路径使用逻辑三.新世界–联邦与ViewFs1.HowTheClustersLook2.使用ViewFs为每个集群创建全局的Namespace2.路径使用逻辑3.路径使用最佳实践(ing)本文主要想讨论
HDFS
ViewFs
roman_日积跬步-终至千里
·
2023-12-28 19:12
hadoop
实战
hdfs
npm
hadoop
大数据处理各组件概念及作用
;1.2FTP集群:文件传输工具;1.3Kafka集群:消息队列,未避免消息堵塞而将消息由Kafka统一管理,进行消息的接收和发布;1.4爬虫服务器:依据需求定时定向抓取页面数据;二、数据存储:2.1
HDFS
p1i2n3g4
·
2023-12-28 17:11
大数据
kafka
分布式
大数据
深入浅出
:分布式、CAP 和 BASE 理论(荣耀典藏版)
今天将带大家
深入浅出
地探讨这些概念,帮助大家更好地理解分布式系统的奥秘。目录一、什么是分布式系统二、CAP理论2.1、C-一致性(Cons
海棠Flower未眠
·
2023-12-28 16:04
#
面试突击
分布式/微服务系统
分布式
netty源码分析笔记
netty源码分析之揭开reactor线程的面纱(三)[4].netty源码分析之揭开reactor线程的面纱(一)[5].netty源码分析之pipeline(二)[6].Netty中的装饰者模式[7].
深入浅出
抬头挺胸才算活着
·
2023-12-28 15:42
【
HDFS
联邦(2)】
HDFS
Router-based Federation官网解读:
HDFS
RouterFederation的架构、各组件基本原理
文章目录一.介绍二、
HDFS
Router-basedFederation架构1.示例说明2.Router2.1.Federatedinterface2.2.Routerheartbeat2.3.NameNodeheartbeat2.4
roman_日积跬步-终至千里
·
2023-12-28 15:41
hadoop
实战
hdfs
架构
hadoop
【HBase】——安装部署
1规划&前提Zookeeper、
HDFS
正常部署规划如下2解压并重命名cd/opt/software/tar-zxvfhbase-2.4.11-bin.tar.gz-C/opt/module/cd/opt
那时的样子_
·
2023-12-28 14:59
hbase
数据库
大数据
关于netty kafka
hdfs
hbase性能调研记录
1.netty调研记录项目中准备用netty框架来实现socket接口,对于netty的性能做了个初步调研,大致过程如下:1.1调用socket接口的客户端为了让客户端快速发送数据,我们已经提前将需要传输的数据通过java的ObjectInputStream写数据到了一个文件,主要是节省客户端接口的编码,然后让客户端不断循环发送数据一段时间(比如20分钟,时间是可以指定),客户端代码如下:impo
aperise
·
2023-12-28 13:09
学习总结
netty
kafka
hadoop
netty
kafka
hdfs
hbase
调研
速度
HDFS
基于动态代理的客户端运行逻辑
RetryDecisionRetryInfo几种常见的RetryPolicy实现和使用场景FailoverOnNetworkExceptionRetryTryOnceThenFailRetryForeverRetryLimited
HDFS
小昌昌的博客
·
2023-12-28 13:39
大数据架构
实现
hadoop
open-source
hdfs
hadoop
大数据
HDFS
短路读的实现(全网最全面深入讲解)
文章目录前言1.知识准备1.1关于域套接字(DomainSocket)什么是DomainSocketDomainSocket通信在ShortCircuitRead中做了什么DomainSocket在Hadoop上的基本实现1.2关于内存映射(MMAP)什么是MMAPMMAP在ShortCircuit中的作用是什么1.3关于共享内存(SharedMemory)什么是共享内存共享内存在Hadoop短路
小昌昌的博客
·
2023-12-28 13:38
大数据架构
实现
hadoop
java
短路读
hdfs
ShortCircuit
hadoop
域套接字
Domain
Socket
mmap
springboot远程连接
HDFS
-hadoop3.0
一.hadoop前置环境:hadoop3.0+CDH6.1这里默认已经在linux环境配置好;如何安装hodoop不在本次范围内;注意:此时集群没有开启Kerberos认证我的环境:win10+IDEA2019.3+jdk8二.准备环境:1.获取fs.defaultFS链接在core-site.xml里面这个等下配置在application.propties里面2.下载winutilshttps:
尚云峰
·
2023-12-28 13:33
spring
boot
springboot
hadoop
HDFS
java.net.UnknownHostException: hadoop
或者直接在node节点上面执行:
hdfs
dfs-mkdir/test时报错:mkdir:java.net.UnknownHostException:mkdir:mkdir:java.net.UnknownHostException
綠竹清水之福荫
·
2023-12-28 13:33
hadoop
mycluster
hadoopha
hadoopclu
hadoop面试问题
1当前你们公司使用的Hadoop版本是什么Hadoopcdh-5.7.6/hadoop-2.6.02
HDFS
常见的数据压缩格式有哪些,介绍其中一种详细的实现方式Gzip优点是压缩率高,速度快。
code学习社
·
2023-12-28 13:31
【Hadoop】RPC在client端的源码解析
最近在看《Hadoop2.X
HDFS
源码剖析》这本书(其实看了挺久的,但是进度比较慢),要看懂hadoop源码真的是需要一定的代码和框架的基础,用到的东西还真是蛮多的,真的厉害,哎,我太菜了~我们会用hadoop
lsr40
·
2023-12-28 13:01
hadoop
HDFS
2.x之RPC流程分析
HDFS
2.x之RPC流程分析1概述Hadoop提供了一个统一的RPC机制来处理client-namenode,namenode-dataname,client-dataname之间的通信。
can007
·
2023-12-28 13:59
Hadoop
Java大杂烩
hadoop2.0
HDFS
Hadoop
RPC
HDFS
客户端UnknownHostException事故解析
文章目录前言事故现场问题分析是否是整个域名解析服务当时都出问题了是否是出问题的pods本身的域名解析有问题异常发生的全部过程域名的解析是什么时候发生的,怎么发生的域名解析的详细流程重试发生在什么地方为什么重试会无效Bugfix代码详解关于StandardHostResolver和QualifiedHostResolver关于InetAddress关于InetSocketAddress相关文章前言我
小昌昌的博客
·
2023-12-28 12:55
大数据架构
实现
hadoop
open-source
hdfs
hadoop
大数据
听自然摄影与摄影自然黄驿伦老师的学术讲座有感
本来觉得自然摄影就是拍照,拍大自然,植物风景,很简单,很浅显的事情,可是听到老师
深入浅出
,生动细致的讲解以后,彻底改变了我的这种观点,老师围绕摄影的过程,结合自己的亲身经历,通过讲解自己的摄影作品,给我们讲述了从开始筹划拍摄的主题
目标是一个更努力的自己
·
2023-12-28 12:07
Pandas数据分析02——各类文件的读取和导出
参考书目:《
深入浅出
Pandas:利用Python进行数据处理与分析》pandas真的很强大,几乎什么格式的数据都能读取,什么csv,excel,spss,stata,json,html......连剪贴板的数据都能读
阡之尘埃
·
2023-12-28 12:36
pandas数据分析
pandas
数据分析
数据挖掘
python
Hadoop之
HDFS
详细教程
1、
HDFS
概述Hadoop分布式系统框架中,首要的基础功能就是文件系统,在Hadoop中使用FileSystem这个抽象类来表示我们的文件系统,这个抽象类下面有很多子实现类,究竟使用哪一种,需要看我们具体的实现类
白鸽呀
·
2023-12-28 11:29
大数据
hadoop
hdfs
大数据
Hive DDL语法
MySQL大部分都相同一、数据库操作1.1、创建数据库CREATEDATABASE[IFNOTEXISTS]databasename[COMMENTdatabase_comment][LOCATION
hdfs
path
有人看我吗
·
2023-12-28 11:28
大数据
hive
hadoop
数据仓库
mysqldump
mysqldump
深入浅出
https://juejin.im/post/6844903653183062030mysqldumpmysqldump是用于转存储mysql数据库的实用程序。
认知自我
·
2023-12-28 10:59
Hive实战:统计总分与平均分
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据文件1、在虚拟机上创建文本文件2、将文本文件上传到
HDFS
指定目录(二)实现步骤1、启动HiveMetastore服务2、启动Hive客户端3、
howard2005
·
2023-12-28 10:16
数仓技术Hive入门
hive
总分
平均分
跟着地名去旅行
这些点评老师用丰厚、渊博的知识为大家讲解地名所涉及的历史和文化,他们
深入浅出
的话语,让我们
全新娜
·
2023-12-28 10:10
Hive
Hive概述由于MapReduce开发难度大,学习成本高,
Hdfs
文件没有字段名、没有数据类型,不方便进行数据的有效管理。因此使用MapReduce框架开发,项目周期长,成本高。
之古
·
2023-12-28 02:58
【JavaScript】原型对象 => 原型链的
深入浅出
解读
文章目录先知概念:原型prototype隐式原型__proto__原型链先知概念:在了解原型与原型链之前,我们应该要先明确以下几个概念:1.在JS中所有的普通对象都是通过new一个函数来创建的。2.在JS中所有的函数本质上也是一个对象,它是通过newFunction产生的。诠释:【1】我们平时所写的leta={};,其实本质上相当于leta=newObject();我们所简写的{}算是一个语法糖,
旧梦星轨
·
2023-12-28 02:40
JS
高阶
javascript
前端
开发语言
原型模式
Hadoop集成对象存储和
HDFS
磁盘文件存储
1.1版本说明组件版本是否必须其他事项Hadoop3.3.0+是hadoop3.3.0之后原生支持国内主要对象存储Hive3.1.3否实测没有Hive也可以使用sparksql,使用hive更好的管理
HDFS
tuoluzhe8521
·
2023-12-28 02:38
Hadoop
hadoop
hdfs
大数据
阿里云
EMR集群迁移自建Hadoop(元数据及
HDFS
数据)
1.背景老集群采用的腾讯emr集群,使用过程中磁盘扩容成本费用高且开源组件兼容性存在问题,因此决定采用自建hadoop集群,需要将emr的元数据和
hdfs
基础数据迁移过来。
tuoluzhe8521
·
2023-12-28 02:37
Hadoop
hadoop
hdfs
大数据
HDFS
_DELEGATION_TOKEN 还原及解决方案
HDFS
_DELEGATION_TOKEN这个BUG在很多文章中都出现着,讲了很多原理,但是只给出了官方引用地扯,完全没有给出如何解决,我们线上的业务就有着这样的问题,7天一到马上出现这问题了,官方明明说这个
大猪大猪
·
2023-12-28 00:39
深入浅出
Runtime (五) Runtime的实际应用之一,字典转模型
引言在我们开发中,经常使用数据模型,模型分为:本地缓存模型、网络下载模型、以及一些临时存储模型,其中网络数据模型需要工程师将服务器的数据序列化,在网络模型赋值的时候,我们所要做的方式有两种:自己设计数据模型,将网络中的数据,手动一一对应的形式赋值给自己定义的模型优点:1.设计的模型根据自己的代码架构来实现2.在迭代过程当中会更顺畅、更清楚业务逻辑、方便修改、更加灵活缺点:1.开发周期会变慢2.每次
物非0人非
·
2023-12-27 23:33
Hive 部署
Hive构建在ApacheHadoop之上,并通过
hdfs
支持S3,adls,gs等存储。Hive允许用户使用SQL读取、写入和管理PB级数据。官网地址二、架构Hive中主要包
有人看我吗
·
2023-12-27 23:54
hive
hadoop
数据仓库
Hive实战:词频统计
文章目录一、实战概述二、提出任务三、完成任务(一)准备数据文件1、在虚拟机上创建文本文件2、将文本文件上传到
HDFS
指定目录(二)实现步骤1、启动HiveMetastore服务2、启动Hive客户端3、
howard2005
·
2023-12-27 23:24
数仓技术Hive入门
hive
hadoop
Hadoop集群shell常用命令
sbin/start-dfs.shsbin/start-yarn.sh3.常用命令3.1查看指定目录下内容
hdfs
dfs–ls[文件目录]
hdfs
dfs-ls-R///显式目录结构hado
Youngmon
·
2023-12-27 21:10
深入浅出
Java虚拟机
文章目录总体图类装载子系统一、类的加载过程一、加载二、链接三、初始化二、类的加载器运行时数据区一、程序计数器(ProgramCounter)二、虚拟机栈(JavaStack)三、本地方法栈(NativeMethodStack)四、堆内存(DirectMemory)五、方法区(MethodArea)执行引擎区域一、Java执行引擎二、本地方法接口JNI总体图这个架构可以分成三层看:最上层:javac
冂阿吉
·
2023-12-27 19:39
jvm
大数据库分析
ElasticSearch和impala首先,对于两个数据库作出说明,有hive查询比较慢,hbase会针对于列的查询不太友好,所以CDH推出了impala搜索引擎,都是基于
HDFS
的。
靈08_1024
·
2023-12-27 19:00
大数据面试题-1
一、map-reduce原理map过程:1.1读取
HDFS
中的文件。每一行解析成一个。每一个键值对调用一次map函数。1.2覆盖map(),接收1.1产生的,进行处理,转换为新的输出。
edwin1993
·
2023-12-27 19:29
【hive】hive的调优经验
一、hive自己进行优化对union这样的命令进行了优化二、数据本地化率
hdfs
数据本地化率对hive性能产生影响在数据大小一定的情况下,500个128M的文件和2个30G的文件跑hive任务,性能是有差异的
kiraraLou
·
2023-12-27 18:49
hive
hive
hadoop
big
data
深入浅出
:Swagger annotations (注解)在API文档中的应用
Swagger提供的注解集是其框架中定义API规范和文档的重要工具。这些注解在代码里标注重要部分,为Swagger的解析工作铺路,进而生成详尽的API文档。开发者编写的注释能够被转换成直观的文档,并展现API端点、参数和响应等信息。这不仅提升了开发人员对API运作的理解与沟通,也使得测试和集成过程更加顺畅。Swagger注解的实际应用场景Swagger注解在多个方面都非常有益,尤其适用于以下情况:
LiamHong_
·
2023-12-27 15:52
学习方法
后端
改行学it
java
HBase基础知识(六):HBase 对接 Hive
1.HBase与Hive的对比1.Hive(1)数据仓库Hive的本质其实就相当于将
HDFS
中已经存储的文件在Mysql中做了一个双射关系,以方便使用HQL去管理查询。
依晴无旧
·
2023-12-27 14:49
大数据
hbase
hive
数据库
Spark与Hadoop的关系和区别
它包括两个核心组件:Hadoop分布式文件系统(
HDFS
):用于存储大规模数据的分布式文件系统。H
晓之以理的喵~~
·
2023-12-27 12:13
Spark
spark
hadoop
大数据
Hadoop生产集群各种维护命令
1.
HDFS
运维1.1
HDFS
集群操作命令#
HDFS
集群启停start-dfs.shstop-dfs.sh#获取
HDFS
集群信息
hdfs
dfsadmin-report#namenode和datanode
tuoluzhe8521
·
2023-12-27 12:12
hadoop相关
hadoop
大数据
分布式
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他