E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP学习之路
黑猴子的家:API 操作 HDFS 文件夹删除
1、Code->GitHubhttps://github.com/liufengji/
hadoop
_hdfs.git2、Code@TestpublicvoiddeleteAtHDFS()throwsException
黑猴子的家
·
2024-02-02 00:29
Java接收solr动态域_Solr和Spring Data Solr
Solr可以和
Hadoop
(http://www.yiibai.com/
hadoop
/)一起使用。由于
Hadoop
处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。
weixin_39897015
·
2024-02-01 22:27
Java接收solr动态域
Revit
学习之路
01_Revit基础
序言:此分类记录自己的Revit
学习之路
。初学者难免一叶障目,不见泰山,欢迎一起交流学习!Revit介绍Revit专为建筑信息模型(BIM)构建的一款建模软件。
bachixunyanpu8626
·
2024-02-01 21:58
安装配置hive
[root@
hadoop
00~]#wget-chttps://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.7/apache-hive-2.3.7-
m0_69595107
·
2024-02-01 19:28
Hadoop
hive
hadoop
数据仓库
database
大数据
安装配置sqoop
一、了解Sqoop1、Sqoop产生的原因A.多数使用
hadoop
技术的处理大数据业务的企业,有大量的数据存储在关系型数据中。
m0_69595107
·
2024-02-01 19:27
Hadoop
sqoop
hadoop
分布式
apache
centos
大数据
Hadoop
-3.1.3(四)读写流程详解
读文件流程客户端向namenode发起OpenFile请求,目的是获取要下载文件的输入流。namenode收到请求会后会检查路径的合法性,以及客户端的权限。客户端发起OpenFile的同时,还会掉用GetBlockLocation。当第一次的检验通过之后,namenode会将文件的块信息(元数据)封装到输入流,交给客户端。3.4.客户端用输入流,根据元数据信息去找指定的datanode读取文件块(
_大叔_
·
2024-02-01 19:38
Kafka运维相关知识
它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于
hadoop
的批处理系统、低延迟的实时系统、storm/spark流式处理引擎。
全脂主妇
·
2024-02-01 17:31
消息组件
kafka
分布式
近日总结与反思
等这周稳定下来,要准备我的继续
学习之路
,一是英语(启蒙和新概念),一是国学,晚上要看家庭教育和写日记。对于我的孩子的教育,我已经跟孩子们开会介绍了我正在做的事情并对他们寄予
岫華
·
2024-02-01 16:13
开源大数据集群部署(八)Ranger编译部署
简单说明如下:在pom.xml中更改对应
hadoop
集群组件版本。ranger2编译前提条件是python3和mvn已安装完成。
云掣YUNCHE
·
2024-02-01 16:57
开源大数据集群部署
开源
大数据
Golang
学习之路
一环境搭建
Golang
学习之路
一环境搭建前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。
beyond阿亮
·
2024-02-01 15:19
golang
golang
Golang
学习之路
一开山篇
Golang
学习之路
一开山篇初识Golang我第一次接触Golang是在2016年,当时在深圳工作,项目需要用Golang,当时在犹豫要不要学还是走,毕竟Java开发搞了很多年了,说放弃还是有难度的,其实也不是放弃
beyond阿亮
·
2024-02-01 15:49
golang
golang
大数据开发流程图
1、大数据流程图2、大数据各个环节主要技术2.1、数据处理主要技术Sqoop:(发音:skup)作为一款开源的离线数据传输工具,主要用于
Hadoop
(Hive)与传统数据库(MySql,PostgreSQL
xyzkenan
·
2024-02-01 14:30
大数据开发
大数据
大数据开发流程
Cloudera Manager 安装 Kafka 并简单使用
Kafka的目的是通过
Hadoop
的并行加载机制来统一线上和离线的消息处理,也是为了通过集群机来提供实时的消费。
大数据AI
·
2024-02-01 13:25
大数据从入门到精通
cloudera
kafka
大数据
大数据之Spark
Spark介绍什么是Spark专为大规模数据处理而设计的快速通用的计算引擎类
Hadoop
MapReduce的通用并行计算框架拥有
Hadoop
MapReduce所具有的优点但不同于MapReduce的是Job
进击的-小胖子
·
2024-02-01 12:37
大数据
spark
big
data
scala
大数据
实时大数据
大数据之Spark:Spark大厂面试真题
2.
hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.
hadoop
和spark的相同点和不同点?5.RDD持久化原理?checkpoint检查点机制?
浊酒南街
·
2024-02-01 12:35
大数据系列三
spark
big
data
面试
大数据之 Spark 与
Hadoop
MapReduce 对比
ApacheSpark和Apache
Hadoop
MapReduce是两个广泛用于大数据处理的开源框架,它们在设计目标、性能表现和功能特性上有显著的不同点:执行模型:MapReduce(MR):基于批处理模式
转身成为了码农
·
2024-02-01 12:30
大数据
spark
hadoop
大数据之 Spark Shuffle 和
Hadoop
MapReduce Shuffle的区别
SparkShuffle和
Hadoop
MapReduceShuffle是分布式计算框架中处理中间结果的关键阶段,它们的主要区别在于设计原理、执行效率和资源利用率:
Hadoop
MapReduceShuffleSort-based
转身成为了码农
·
2024-02-01 12:30
大数据
spark
hadoop
spark处理速度为什么比MapReduce快?
官网的这张图下边有一行字:Logisticregressionin
Hadoop
andSpark迭代场景下spark的处理速度大致是
hadoop
的100倍。️
CoreDao
·
2024-02-01 12:29
Spark
spark
hadoop
大数据
mapreduce
阿Q的Linux运维
学习之路
(day6-2)-Linux文件管理-拷贝、移动命令
拷贝命令cpLinux的拷贝命令就好像我们Windows系统里面的复制粘贴一样语法格式:cp[OPTION]…SOURCE…DIRECTORY命令:cp选项:-v:详细显示命令执行的操作-r:递归处理目录与子目录-p:保留源文件或目录的属性参数:路径例:[root@localhost~#cpfile/tmp/将当前目录下的file文件拷贝至/tmp/目录下[root@localhost~]#cpf
叫我阿Q_
·
2024-02-01 11:39
Hadoop
-MapReduce-源码跟读-ReduceTask阶段篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、Reducer类我们先看下我们写的reduce所继承的
隔着天花板看星星
·
2024-02-01 09:54
hadoop
mapreduce
Hadoop
3.x基础(2)- HDFS
来源:B站尚硅谷目录HDFS概述HDFS产出背景及定义HDFS优缺点HDFS组成架构HDFS文件块大小(面试重点)HDFS的Shell操作(开发重点)基本语法命令大全常用命令实操准备工作上传下载HDFS直接操作HDFS的API操作HDFS的API案例实操HDFS文件上传(测试参数优先级)HDFS文件下载HDFS文件更名和移动HDFS删除文件和目录HDFS文件详情查看HDFS文件和文件夹判断HDFS
魅美
·
2024-02-01 09:22
大数据基础
大数据
hadoop
Hadoop
已死,AI 吞噬世界!
【CSDN编者按】你用上GPT-4了吗?在数据领域,AI正逐步重塑数据处理和分析的各个环节,从ETL、数据治理到数据分析和消费方式均会发生根本性变化。Kyligence联合创始人&CEO,Apache顶级开源项目ApacheKylin的创建者韩卿(Luke.han)将用这篇文章来分享他在AI冲击开源领域之后引发的深度思考,其中涵盖了开源项目的商业化路径、技术变迁对行业格局的影响、AI对数据分析和业
CSDN资讯
·
2024-02-01 09:50
hadoop
人工智能
大数据
分布式
报错:ERROR: org.apache.
hadoop
.hbase.PleaseHoldException: Master is initializing解决方案
错误如图:解决方案:1.输入cd/opt/zookeeper/bin进入zookeeper文件的bin目录下2.输入./zkCli.sh进入客户端3.删除hbase,输入rmr/hbase4.关闭hbase输入stop-hbase.sh如果未能退出,就使用kill-9进程号强制删除5.重新启动start-hbase.sh此时已经可以正常运行6.如果以上操作还是不成功删除hbase在hdfs的存储路
:)คิดถึง
·
2024-02-01 09:35
错误处理
hbase
关于
Hadoop
进行namenode格式化时ERROR conf.Configuration: error parsing conf xxx.xml错误的问题
关于
Hadoop
进行namenode格式化时ERRORconf.Configuration:errorparsingconfxxx.xml错误的问题在配置完core-default.xml,mapred-site.xml
平江路的鱼
·
2024-02-01 09:34
大数据
hadoop
Linux
格式化
错误
大数据
《成长边界》
1:最好的
学习之路
“道阻且长”,不仅进度缓慢,而且在眼下也可能表现不佳,而这些困难正是为了让人在之后表现得更好2:经济学家认为,那些让学生们短期痛苦但是长远获益的教授,正是通过“建立联系”的提问方式实现了
艳子姐姐
·
2024-02-01 08:23
Centos慢慢长大(一)
2、原材料准备2.1我将在虚拟机中开始我的Centos
学习之路
,我选择的虚拟机软件如图1所示图2.1这个软件网上有
上官义飞
·
2024-02-01 07:43
centos
linux
运维
服务器
大数据 - Spark系列《二》- 关于Spark在Idea中的一些常用配置
上一篇:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客目录1.Idea中配置LiveTemplates来快速生成代码片段2.Idea中配置文件模板自定义初始代码
王哪跑nn
·
2024-02-01 07:53
spark
Idea日常操作
大数据
spark
intellij-idea
大数据 - Spark系列《一》- 从
Hadoop
到Spark:大数据计算引擎的演进
目录1.1
Hadoop
回顾1.2spark简介1.3Spark特性1.通用性2.简洁灵活3.多语言1.4SparkCore编程体验1.4.1spark开发工程搭建1.开发语言选择:2.依赖管理工具:1.4.2Spark
王哪跑nn
·
2024-02-01 07:43
spark
大数据
spark
hadoop
HBase介绍
GFS是GoogleFileSystem,开源实现是HDFS(
Hadoop
FileSystem)。MapReduce计算框架的开源实现是
Hadoop
MapReduce。
M.Rambo
·
2024-02-01 06:09
hbase
数据库
大数据
分布式
java
2019/2/20Hbase单节点安装
hbase(hbase-2.0.0-bin.tar.gz)解压过程即为安装过程解压=》为了让hbase的存放路径指定ns这个组名(防止出先不认识“ns”的错误)[root@zhiyou01~]#cp/usr/
hadoop
阳光正好微风不燥_c509
·
2024-02-01 05:39
zookeeper集群群起脚本
所以要写个脚本,我的主机名是有规律的
hadoop
101;
hadoop
102;
hadoop
103所以创建脚本的过程如下:到/usr/local/bin目录下touch一个文件,这里我叫zkstartUtil.sh
小北觅
·
2024-02-01 05:01
Hadoop
大数据技术原理与应用
Hadoop
大数据技术原理与应用大数据概述定义特征大量,多样,高速,价值研究意义应用场景医疗,金融,零售
Hadoop
概述历史优势扩容能力强,成本低,高效率,可靠性,高容错
Hadoop
生态分布式存储系统(
kk8_
·
2024-02-01 04:33
hadoop
大数据
hdfs
[绝对要收藏]配置
hadoop
完全分布式环境
##环境:
hadoop
-2.7.2,jdk1.8.0_144,CentOS-7-x86_64-Minimal-2009.iso1先创建一个主机2修改id,hostname,hosts3关闭防火墙4连接xshell5
Java小白中的菜鸟
·
2024-02-01 03:04
centos7
hadoop
分布式
hdfs
Sqoop数据迁移工具
概述ApacheSqoop(SQL-to-
Hadoop
)项目旨在协助RDBMS与
Hadoop
之间进行高效的大数据交流。
小希 fighting
·
2024-02-01 03:55
sqoop
hadoop
hive
分布式
大数据
数据库
sql
Hadoop
生产调优 (七) --------- MapReduce 与 Yarn 生产经验
目录一、MapReduce生产经验1.MapReduce跑的慢的原因2.MapReduce常用调优参数3.MapReduce数据倾斜问题二、Yarn生产经验1.常用的调优参数2.三种调度器的使用一、MapReduce生产经验1.MapReduce跑的慢的原因MapReduce程序效率的瓶颈在于两点:计算机性能CPU、内存、磁盘、网络I/O操作优化数据倾斜Map运行时间太长,导致Reduce等待过久
在森林中麋了鹿
·
2024-02-01 03:17
Hadoop
mapreduce
hadoop
大数据
windows 下面Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.
hadoop
.io.nativei...
本地运行,注意两点,配置本地的
hadoop
环境变量,注意
hadoop
版本是windows版本,在本地跑的时候遇到Exceptioninthread"main"java.lang.UnsatisfiedLinkError
smartjiang
·
2024-02-01 02:20
大数据高频面试题一:hive和Oracle的区别
Hive和Oracle数据库最大的区别在于存储和计算方面:Hive存储在hdfs上(
Hadoop
分布式文件系统容错性高),Oracle将数保存在本地文件系统中。
半亩书田
·
2024-02-01 02:47
面试题
hive
hadoop
大数据
解决There are 0 datanode(s) running and no node(s) are excluded in this operation.
出现上述问题可能是格式化两次
hadoop
,导致没有datanode解决方法1:重启linux,再使用start-dfs.sh和start-yarn.sh重启一下
hadoop
解决办法2:找到
hadoop
安装目录下
有一束阳光叫温暖
·
2024-01-31 23:56
APUE
学习之路
(进程间通信IPC)
进程间通信(IPC)分为PIPE(管道)、Socket(套接字)和XSI(SystemV)。XSI又分为msg(消息队列)、sem(信号量数组)和shm(共享内存)。这些手段都是用于进程间通讯的,只有进程间通讯才需要借助第三方机制,线程之间的通讯是不需要借助第三方机制的,因为线程之间的地址空间是共享的。文章目录管道XSI消息队列(msg)信号量共享存储管道管道分为命名管道(FIFO)和匿名管道(P
天连水尾水连天
·
2024-01-31 22:34
APUE
linux
c语言
UE4
学习之路
【一】制作一个第三人称游戏角色
UE4
学习之路
这个系列是我学习到UE4引擎的使用及相关开发技术之后,为了巩固自己学到的知识以及记录学习过程开创的学习记录系列博文,后期将不再赘述。
IceinCloud
·
2024-01-31 21:07
UE4
UE4
游戏开发
Java基础-多线程(3)
如
hadoop
分布式集群。所以并发编程的目标是充分的利用处理器的每一个核,以达到最高的处理性能。36.线程和进程的区别?简而言之,进程是程序运行和资源分配的基本
C乖
·
2024-01-31 16:51
我的新媒体学习日记
转眼快2个月过去了,我的新媒体
学习之路
也刚刚结束了一个节点,开启了另一个重要的旅程。
漫生杂谈
·
2024-01-31 16:24
数据湖技术Iceberg0.12预研文档
trino(presto)本次预研使用组件如下:名称版本描述flink1.12.1通过parcel包部署于cdh6.3.2中cdh6.3.2开源版本hive2.3.7包含cdh中(更换jar升级替换)
hadoop
3.0.0cdh
我去探险了
·
2024-01-31 15:36
数据湖技术
hive
kafka
big
data
Ambari2.7.3 和HDP3.1.0搭建
Hadoop
集群
一、环境及软件准备1、集群规划
hadoop
01/192.168.0.151
hadoop
02/192.168.0.152
hadoop
03/192.168.0.153
hadoop
04/192.168.0.154
hadoop
05
大道至简非简
·
2024-01-31 13:04
Hadoop
Windows10上用idea进行
hadoop
客户端远程操作
1.idea上访问
Hadoop
客户端的uri地址要和core-site.xml中fs.defaultFS的参数一致2.执行自定义的程序之前,要启动
Hadoop
,否则会报错:Causedby:java.net.ConnectException
大数据新新菜鸟
·
2024-01-31 12:41
hadoop
intellij-idea
大数据
IDEA中
Hadoop
的环境配置
没有配置
Hadoop
Home:在Windows下解压一份
Hadoop
安装包
Hadoop
使用log4j进行日志输出,明显没有配置log4j再次运行,显示了作业的运行情况
hhhhhhhhhhhnb
·
2024-01-31 12:36
intellij-idea
java
intellij
idea
hadoop
linux
Intelj IDEA 配置
Hadoop
远程调试环境
远程
hadoop
版本:
Hadoop
3.0.0+cdh6.3.2一、设置本地
hadoop
环境1、下载
hadoop
下载
hadoop
-3.0.0.tar.gz,并解压到D:\BigData\并重命名为
hadoop
跟着大数据和AI去旅行
·
2024-01-31 12:34
大数据从入门到精通
hadoop
intellij
idea
读书感悟
在堂姐的鼓励下,一开始我每天能坚持读一小章,后来读着读着学习力被完全拨动,有时能连续读一两个小时,就这样我开启了我的经典
学习之路
。
六月溪
·
2024-01-31 09:26
java进阶
1.大数据史上最全Flink面试题,高薪必备,大数据面试宝典史上最全
Hadoop
面试题:尼恩大数据面试宝典专题1史上最全HBase面试题,高薪必备,架构必备史上最全Hive面试题,高薪必备,架构必备绝密
don't_know
·
2024-01-31 09:44
java
企业级大数据安全架构(七)服务安全
认证机制,目前直接对接kerberos使用较多,这里我们使用FreeIPA来集成kerberosFreeIPA官网下载地址:https://www.freeipa.org/page/Downloads
Hadoop
云掣YUNCHE
·
2024-01-31 08:08
企业级大数据安全架构
安全
大数据
安全架构
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他