E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HADOOP学习之路
企业级大数据安全架构(六)数据授权和审计管理
作者:楼高本节详细介绍企业级大数据架构中的第六部分,数据授权和审计管理1.Ranger简介ApacheRanger是一款被设计成全面掌管
Hadoop
生态系统的数据安全管理框架,为
Hadoop
生态系统众多组件提供一个统一的数据授权和管理界面
云掣YUNCHE
·
2024-01-27 07:30
企业级大数据安全架构
大数据
安全架构
安全
1分钟了解基于
Hadoop
的数据仓库工具Hive(附超实用示例)
Hive功能Hive是基于
Hadoop
构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在
Hadoop
分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL
yuyuyuyo
·
2024-01-27 05:53
Linux
学习之路
(七)---三种文件服务器搭建
服务器ftpvsftpd服务器安装:sudoapt-getinstallvsftpd配置配置文件/etc/vsftpd.conf配置打开写入开关匿名开关匿名写入开关打开umask码开关不必须重启服务:sudoservicevsftpdrestart客户端登陆实名登陆连接:ftp[服务器的ip]输入用户名/密码:这里的用户名是服务器自己的用户名密码文件的上传和下载put[filename]:上传文件
o_30ca
·
2024-01-27 04:36
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki5
·
2024-01-27 03:24
实时分析海量新数据的难点 和解决方案
解决方案:使用分布式计算和存储技术,如
Hadoop
、Spark、Kafka等,将数据分散存储在多个节点上,同时进行分布式计算和处理,以实现数据的实时处理和分析。2.数据质量的保障:海量新
云台095
·
2024-01-27 03:40
大数据的应用
大数据
[AIGC 大数据基础] 浅谈hdfs
HDFS(
Hadoop
DistributedFileSystem)是Apache
Hadoop
生态系统的一部分,是一个分布式文件系统。
程序员三木
·
2024-01-27 01:00
大后端
大数据
AIGC
hdfs
idea上搭建pyspark开发环境
1环境版本说明python版本:Anaconda3.6.5spark版本:spark-2.4.8-bin-
hadoop
2.7idea版本:2019.32环境变量配置2.1python环境变量配置将python.exe
jackyan163
·
2024-01-27 00:06
【我们这样做网师】No.7路在脚下,你要耐心你要走
这次自我分析为之后的
学习之路
奠定了良好的基础,“思想上比较懒惰,行动力不太强,
于杰雄
·
2024-01-26 22:23
八.压缩和存储
8.1
Hadoop
源码编译支持Snappy压缩(了解)8.1.1资源准备1)CentOS联网配置CentOS能连接外网。
临时_01e2
·
2024-01-26 21:13
大数据开发必备工具——
Hadoop
及整体架构介绍
Hadoop
是一个由Apache软件基金会开发的开源Java软件框架,专为大数据处理设计,支持在大量计算机组成的集群上进行数据存储和分布式计算。
love6a6
·
2024-01-26 21:03
大数据
hadoop
架构
hadoop
-MR
1.MR执行原理1.MAP阶段在这里插入图片描述2.Reducer在这里插入图片描述3.shuffle阶段在这里插入图片描述2.实操1.导入maven配置org.apache.
hadoop
hadoop
-mapreduce-client-common2.7.1org.apache.
hadoop
hadoop
-mapreduce-client-core2.7.12
炽热_3a57
·
2024-01-26 19:06
Hadoop
3.1.1 HDFS 集群部署
Hadoop
3.1.1HDFS集群部署依赖服务系统优化查看ZooKeeper集群状态创建路径配置/etc/profile配置$
HADOOP
_HOME/etc/
hadoop
/
hadoop
-env.sh配置
JP.Hu
·
2024-01-26 19:37
Hadoop
hadoop
hdfs
大数据
hadoop
安装遇到的一些障碍
一.start-dfs.sh(开启不成功)原因:1.dadoop文件所属者与执行时登陆者不一致(权限不足)报错:WARNING:
HADOOP
_SECURE_DN_USERhasbeenreplacedbyHDFS_DATANODE_SECURE_USER.Usingvalueof
HADOOP
_SECURE_DN_USER.Startingnamenodeson
GetIdea
·
2024-01-26 18:30
指导手册05:MapReduce编程入门
指导手册05:MapReduce编程入门Part1:使用Eclipse创建MapReduce工程操作系统:Centos6.8,
hadoop
2.6.4情景描述:因为
Hadoop
本身就是由Java开发的,所以通常也选用
weixin_30655219
·
2024-01-26 17:56
大数据
Spark3学习笔记
文章目录一、Spark基础1、Spark概述1.1Spark简介1.2SparkVS
Hadoop
1.3Spark特点1.4Spark入门Demo2、Spark运行模式2.1概述2.2Local模式2.3Standalone
魅Lemon
·
2024-01-26 15:38
大数据
spark
Apache 辅助系统工具
一丶ApacheSqoop1.Sqoop的介绍:Sqoop的工作机制是将导入或者导出的命令翻译成MapReduce实现,Sqoop可以理解为:SQL到
Hadoop
或者
Hadoop
到SQL2.Sqoop的安装配置文件修改
月初,
·
2024-01-26 11:16
apache
centos同步服务器时间
不同步互联网查看所有节点ntpd服务状态sudosystemctlstatusntpdsudosystemctlstartntpdsudosystemctlis-enabledntpd查询自己的网段ipaddr修改
hadoop
102
热爱技术的小陈
·
2024-01-26 10:39
服务器
Java
大数据
服务器
centos
linux
Hadoop
3.x源码解析
文章目录一、RPC通信原理解析1、概要2、代码demo二、NameNode启动源码解析1、概述2、启动9870端口服务3、加载镜像文件和编辑日志4、初始化NN的RPC服务端5、NN启动资源检查6、NN对心跳超时判断7、安全模式三、DataNode启动源码解析1、概述2、初始化DataXceiverServer3、初始化HTTP服务4、初始化DN的RPC服务端5、DN向NN注册6、向NN发送心跳四、
魅Lemon
·
2024-01-26 09:54
大数据
hadoop
Hadoop
3.x学习笔记
文章目录一、
Hadoop
入门1、
Hadoop
概述1.1简介1.2
hadoop
优势1.3
hadoop
组成1.4大数据技术生态体系2、环境准备(重点)2.1模板机配置2.2模板创建3、本地运行模式(官方WordCount
魅Lemon
·
2024-01-26 09:24
大数据
hadoop
林浩然与
Hadoop
的奇幻数据之旅
林浩然与
Hadoop
的奇幻数据之旅LinHaoranandtheEnchantingDataJourneywith
Hadoop
在一个名为“比特村”的地方,住着一位名叫林浩然的程序员大侠。
howard2005
·
2024-01-26 09:20
大数据基础
hadoop
大数据
Hadoop
YARN 在快手的应用实践与技术演进之路
yarn的背景yarn大家都比较熟悉了,是从
Hadoop
1.0分离到2.0的比较重要的特性,把原来的jobtracker集中式调度变成yarn的二级调度,解决集群扩展性的问题。
yoku酱
·
2024-01-26 08:32
通过养猪给女朋友讲解
Hadoop
(一)
六、规章整治奈何桥程序员老王,阎王爷,黑白无常,牛头马面,孟婆。“铃铃铃~”刚躺下的老王又被电话吵醒了,老王接起电话,习惯性地说:“老板,又是哪个系统挂了啊。”“我不是你老板,我是阎王爷”电话那头传来沧桑的声音。“阎王爷,我上有老,下有小,我知道我这么加班不对,但我都是为了生计啊,恳请阎王爷再宽限我几年吧,我把房贷还完就下去报道。”老王哽咽地说着。“这次找你不是想结束你在人间的进程,只是想让你来地
程序员峰哥
·
2024-01-26 05:55
Flink1.13集成
Hadoop
3.x以上版本
文章目录背景说明出现问题问题分析问题解决解决展示参考资料背景说明在搭建Flink的HA高可用集群后,打不开webUI界面出现问题打开log日志查看org.apache.flink.core.fs.UnsupportedFileSystemSchemeException:Couldnotfindafilesystemimplementationforscheme'hdfs'.Theschemeisn
未来影子
·
2024-01-26 04:22
Flink
hadoop
hdfs
flink
flink1.13.0 环境搭建
#flink部署1.standalone模式2.yarn模式session-cluster模式job-cluster模式3.k8s模式注:yarn模式需要依赖
hadoop
环境,搭建请参考:https:/
AinUser
·
2024-01-26 04:50
flink
hadoop
flink
yarn
k8s
standalone
橘子皮的实习周记——第一周总结
一周小总结:目前入职上班时间一周,主要内容是对一个项目进行一些基础的添加操作(用领导A的话来说,就是熟悉一下业务),我最头疼的就是使用kafkahbase
hadoop
这些技术,对MySQL内的数据进行一个同步
程序员橘子皮
·
2024-01-26 03:35
java
Flink1.13.x+iceberg环境搭建
1.安装
hadoop
tar-zxvf
hadoop
-2.10.1.tar.gz配置JDK和
Hadoop
环境变量vi/etc/profileexportJAVA_HOME=/usr/lib/jvm/java
姚贤贤
·
2024-01-26 02:22
大数据
flink
hive
hadoop
iceberg
1.13
HDFS操作
文章目录主要内容1.编程实现以下指定功能,并利用
Hadoop
提供的Shell命令完成相同任务:一.shell命令行实现1.向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,则由用户来指定是追加到原有文件末尾还是覆盖原有的文件
K要努力
·
2024-01-26 02:43
算法与数据结构
hdfs
hadoop
大数据
eclipse
Hbase伪分布式的安装和配置
一、版本信息和环境1、版本信息:jdk1.8.0_112
hadoop
-2.6.0zookeeper-3.4.6hbase-1.2.6.12、环境
hadoop
+zookeeper+hbase,
hadoop
lukeyan
·
2024-01-26 00:41
大数据技术之Spark
1.2Sparkand
Hadoop
Hadoop
的MapReduce是大家广为熟知的计算框架,那为什么咱们还要学习新的计算框架Spark呢,这里简单说一下Spark和
Hadoop
的关系。
严同学正在努力
·
2024-01-25 21:38
大数据
spark
hadoop
apache
kafka
大数据开发之Spark(完整版)
第1章:Spark概述1.1什么是spark回顾:
hadoop
主要解决,海量数据的存储和海量数据的分析计算。spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-25 21:05
大数据
spark
分布式
弹性分布式数据集
hadoop
Hadoop
on Yarn 提交job失败:java.net.ConnectException:Connection refused
报错:INFOorg.apache.
hadoop
.service.AbstractService:ServiceNodeManagerfailedinstateSTARTED;cause:org.apache.
hadoop
.yarn.exceptions.YarnRuntimeException
Anthons
·
2024-01-25 20:58
sqoop之hive数据仓库和oracle数据库数据转换
sqoop(发音:skup)是一款开源的工具,主要用于在
Hadoop
(Hive)与传统的数据库(mysql、oracle)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres
Summer_1981
·
2024-01-25 20:37
spakr 提交任务
当前集群支持3中集群管理Standalone(spak框架自身拥有能力)ApacheMesos
Hadoop
YARNKubernetes使用/spark-submit脚本提交任务,脚本后面可以接参数.
新鲜氧气
·
2024-01-25 19:55
大数据
#
scala
#
spark
scala
spark
大数据
hadoop
问题集
1.org.apache.
hadoop
.yarn.exceptions.InvalidAuxServiceException:TheauxService:mapreduce_shuffledoesnotexistyarn
Pure_Eyes
·
2024-01-25 17:18
hadoop
大数据
分布式
记高三学生兆天的塔牌
学习之路
去年七月中,初次见到兆天,是在办公室里。Luna在我进入办公室前拉住了我,说:“有个高三的理科孩子,除了英语外,各科的成绩都很好,你和他聊聊,做个英语学习的动员和计划!”在这句话的交待下,我接收了个新高三学生。高三学习的紧张,时间规划到分钟,而且自主安排的时间不多,大体的学习时间都是学校安排好的了。还有不足一年的时间,要想高考成绩有个明显的提升,其实我心里也不是很有底。好在去年有个艺术生,因为哈哈
Marvin_渊
·
2024-01-25 15:02
大数据分析组件Hive-集合数据结构
Hive的数据结构前言一、array数组类型二、map键值对集合类型三、struct结构体类型前言Hive是一个基于
Hadoop
的数据仓库基础设施,用于处理大规模分布式数据集。
Aimyon_36
·
2024-01-25 15:15
Hive
数据分析
hive
数据结构
[AIGC 大数据基础]hive浅谈
Hive作为一个基于
Hadoop
的数据仓库基础设施,为用户提供了类SQL的查询语言和丰富的功能,使得处理大规模数据变得更加简单和高效。
程序员三木
·
2024-01-25 14:17
大后端
大数据
AIGC
hive
学心理学有哪些“出路”?-心理专业的学习及就业方向
VX关注「iMe心理」,一起踏上Psy
学习之路
~~近几年心理学已经慢慢褪去神秘的面纱,大众对这个领域逐渐有了清晰的认知。“心理”不再是读心术的代名词,这两个字也在逐渐成为热词。
iMe心理
·
2024-01-25 14:26
hadoop
集群部署
hadoop
简介
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构,是一个存储系统+计算框架的软件框架,主要解决海量数据存储与计算的问题,是大数据技术中的基石。
Cat God 007
·
2024-01-25 12:45
笔记
大数据
大数据
hdfs
Hadoop
集群的部署,安装和管理(头歌)
示例集群信息以下表格为本教程所用示例集群节点信息:我们准备了三台虚拟服务器,连接方式如下:第一步我们需要在evassh服务器初始化虚拟服务器:cd/optwrapdockerulimit-funlimiteddockerload-iubuntu16-ssh.tardocker-composeup-d注意:请不要在各个虚拟服务器之间进行ssh登录,这种操作会导致无法保存配置数据。正确方法是:在虚拟服
小坏蛋儿&
·
2024-01-25 12:14
大数据
hadoop
服务器
linux
shopee的AI
学习之路
——GPTs通过AdInteli 广告变现
GPTs|AdInteli广告变现一、什么是AdInteliAdIntelli是一个旨在为生成GPTs接入广告并实现变现的平台。它连接了全球最大的广告联盟,允许广告商进行竞价,确保展示最有价值的广告。AdIntelli采用AI驱动的收入生成技术,优化广告选择。该平台通过将广告融入GPT对话中,创造个性化体验,并可能提高用户对广告的参与度。使用AdIntelli非常简单,无需编码经验,仅需5分钟即可
shopeeai
·
2024-01-25 12:43
人工智能
学习
GPTs
ChatGPT
hadoop
集群规划部署
一、集群规划三台硬件资源,部署
hadoop
版本,
hadoop
-3.3.5,部署后配置文件。
Hadoop
配置文件分两类:默认配置文件和自定义配置文件。
Snower_2022
·
2024-01-25 12:43
hadoop
hadoop
java
大数据
Hbase集群安装部署
安装好对应版本的
hadoop
集群,并启动安装好对应版本的zookeeper集群,并启动HBase集群安装部署下载安装包并上传到node01服务器安装包下载地址:http://archive.cloudera.com
我还不够强
·
2024-01-25 12:02
借力 CodeArts Snap,助我打开“结果倒推过程“的新思路
重拾Python的
学习之路
我之前学过一段时间的Python,因为工作中一直用不上,所以后面就荒废了。现在,智能化编程是一个趋势,所以我想着干脆重拾一下Python,强化一下自身的技能树。
叶一一yyy
·
2024-01-25 11:41
华为snap
python
设计说服力(一):你是一个会讲故事的设计师吗?
我觉得这是一个现阶段具有指导意义的思考,弄清楚怎样的设计具有说服力,意味着设计师能更好回应质疑,坚定自己的设计
学习之路
;也
冬江花月夜
·
2024-01-25 11:08
详解Linux运维工程师高级篇(大数据安全方向).
hadoop
安全目录:kerberos(已发布)elasticsearch(已发布)http://blog.51cto.com/chenhao6/2113873knoxoozierangerapachesentry
weixin_30588729
·
2024-01-25 10:14
运维
操作系统
java
一篇文章教你快速学会Kafka参数调优实战
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全:书单导航页(点击右侧极客侠栈即可打开个人博客):极客侠栈①【Java】
学习之路
吐血整理技术书从入门到进阶最全
数据结构大师
·
2024-01-25 10:03
大数据
Hadoop
/Hive学习笔记一(基础概念)
大数据
Hadoop
/Hive学习笔记一(基础概念)一,概念介绍:大数据:大数据一般用来描述一种数量庞大,复杂的数据集,传统数据处理应用程序难以应对。
lucky_myj
·
2024-01-25 09:46
大数据
hadoop
Hadoop
-HDFS写流程(从命令行到完成)
一、简单回顾下HDFS的架构如果不了解HDFS的可以看下我写的一篇博客,这里先贴下官网架构图:二、源码分析源码中写的肯定是最真实的,下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4
隔着天花板看星星
·
2024-01-25 09:23
hadoop
hdfs
大数据
Hadoop
-HDFS高可用
原理参考官网介绍:Apache
Hadoop
3.3.6–HDFSHighAvailabilityUsingtheQuorumJournalManager二、背景在
Hadoop
2.0.0之前,NameNode
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他