E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop基础配置
从零开始了解大数据(五):YARN篇
目录前言一、
Hadoop
YARN介绍二、
Hadoop
YARN架构与组件1.ResourceManager(RM)2.NodeManager(NM)3.ApplicationMaster三、程序提交YARN
橘子-青衫
·
2024-01-04 02:20
大数据
从零开始了解大数据
大数据
hadoop
分布式
从零开始了解大数据(七):总结
系列文章目录从零开始了解大数据(一):数据分析入门篇-CSDN博客从零开始了解大数据(二):
Hadoop
篇-CSDN博客从零开始了解大数据(三):HDFS分布式文件系统篇-CSDN博客从零开始了解大数据
橘子-青衫
·
2024-01-04 02:19
从零开始了解大数据
大数据
大数据
hadoop
hive
big
data
hdfs
数据仓库
MapReduce计算模型、数据流和控制流,
Hadoop
流的工作原理
1、Job在
Hadoop
中,每个MapReduce任务都被初始化为一个Job。每个Job又可以分为两个阶段:Map阶段和Reduce阶段。这两个阶段分别用两个函数来
南宫凝忆
·
2024-01-04 01:47
Hadoop
mapreduce
大数据
big
data
VirtualBox6.0 搭建Ubuntu18.04集群环境
image.png2、下载Ubuntu18.04镜像应为计划搭建
hadoop
集群,所以用server版本。
大道至简非简
·
2024-01-04 00:54
eNSP——MSTP+VRRP
ps:虽然这个实验看起来很复杂,实际上配置很简单,就是有点繁琐:)MSTP+VRRP综合实验S1配置
基础配置
[S1]intg0/0/1[S1-GigabitEthernet0/0/1]plt[S1-GigabitEthernet0
一只努力的蛙
·
2024-01-03 23:25
华为eNSP
网络
eNSP——vlan原理和
基础配置
vlan不是协议,是一个技术,虚拟局域网技术,基于802.1q协议。vlan(虚拟局域网),将一个物理的局域网在逻辑上划分成多个广播域的技术。目录冲突域和广播域vlan帧格式以太网帧格式以太网帧封装vlan帧格式(在以太网帧中插入802.1q标签)端口类型access端口trunk端口hybrid端口hybrid端口实验交换机S1配置交换机S2配置冲突域和广播域冲突域:一个Hub是一个冲突域交换机
一只努力的蛙
·
2024-01-03 23:54
华为eNSP
网络
nvidia jetson nano&zed配置相关问题
1、更换镜像源,安装中文输入法Jetsonnano
基础配置
(更换源、安装中文输入法等)_jetson换源-CSDN博客2、输入法没有候选框killallfcitx-qimpanelsudoapt-getremovefcitx-ui-qimpanel3
Happy_Cabbage
·
2024-01-03 23:47
ZED2
计算机视觉
人工智能
Spark相关知识点(期末复习集锦)
一、Spark简介Spark,拥有
hadoop
MR所具有的优点,但不同于MR的是job中监测结果可以保存在内存中,从而不再需要读写HDFS,因此spark能够更好的适用于数据挖掘与机器学习等需要迭代的mr
夜をむかえる
·
2024-01-03 22:49
spark
大数据
分布式
Spark向Hbase中写数据报异常:org.apache.
hadoop
.hbase.client.RetriesExhaustedWithDetailsException: Failed 5
解决:将第二行代码中的表名写全,并指定在哪个名称空间valtable:Table=con.getTable(TableName.valueOf("info:tb_order"))
夺命大翻斗
·
2024-01-03 22:12
spark
hbase
apache
关于Cloudera
Hadoop
的安装(CentOS)- 官文标注(待完成)
CDH5andClouderaManager5RequirementsandSupportedVersionsInanenterprisedatahub,ClouderaManagerandCDHinteractwithseveralproductssuchasApacheAccumulo,ApacheImpala(incubating),Hue,ClouderaSearch,andClouder
DazzlingTiger
·
2024-01-03 21:15
Hadoop
Linux
hadoop
cloudera
安装
hive基本概念原理与底层架构
hive是一个数据仓库基础工具在
hadoop
中用来处理结构化的数据,它架构在
hadoop
之上,总归为大数据,并使得查询和分析方便,提供简单的sql查询功能,可以讲sql语句转换成mapreduce任务进行
byway_lyn
·
2024-01-03 20:22
大数据
Hadoop
入门学习线路图
Hadoop
是系统学习大数据的必会知识之一,
Hadoop
里面包括几个组件HDFS、MapReduce和YARN,HDFS是存储数据的地方就像我们电脑的硬盘一样文件都存储在这个上面,MapReduce是对数据进行处理计算的
千_锋小小千
·
2024-01-03 19:12
Hadoop
写文件时datanode发生故障的处理过程
学习
Hadoop
写文件的流程时,看《
Hadoop
权威指南》中文版,在datenode发生故障时的处理那里,真的是看不懂。于是找来英文原版进行翻阅,终于有种看明白的感觉了。
小北觅
·
2024-01-03 18:03
【Spark精讲】RDD缓存源码分析
以
Hadoop
RDD为例overridedefcompute(split:Partition,context:TaskC
话数Science
·
2024-01-03 18:08
Spark
Spark精讲
大数据
spark
大数据
我的大数据之路:2023年度总结
2023年度最值得骄傲的事从0到1搭建了离线数仓体系,针对
Hadoop
生态组件的原理和特性有了深入的理解。
话数Science
·
2024-01-03 18:07
大数据
面试
大数据
面试
spark
Flink-Paimon 案例
Flink-Paimon案例1、下载FlinkJar包并解压tar-xzfflink-*.tgz2、下载PaimonJar包放进Flink的lib中cppaimon-flink-*.jar/lib/3、如果运行在
Hadoop
猫猫爱吃小鱼粮
·
2024-01-03 16:49
flink
大数据
开源大数据集群部署(一)集群实施规划
主机操作系统要求软件信息参数配置8C16G操作系统版本CentOSLinuxrelease7.8.2003(Core)java版本javaversion“1.8.0_281”
hadoop
版本
hadoop
3.2.4
云掣YUNCHE
·
2024-01-03 15:42
开源大数据集群部署
开源
大数据
2018年最强干货!年薪80万+的大数据开发【教程】都在这儿!
技术层面来说,大数据使用的
Hadoop
(在分布式服务器集群上存储海量数据并运行分布式分析应用的一种方法)需要JAVASE基础,即使你没有学过JAVAEE上手
Hadoop
也是可以的。
yoku酱
·
2024-01-03 13:36
【HBase】——Java API
1环境1.1依赖org.apache.hbasehbase-client2.4.111.2配置文件hbase-site.xmlhbase.zookeeper.quorum
hadoop
102:2181,
hadoop
103
那时的样子_
·
2024-01-03 12:47
hbase
java
数据库
大数据实时项目必备技能二:kafka有话说
导读:Kafka是由LinkedIn开发并开源的分布式消息系统,因其分布式及高吞吐率而被广泛使用,现已与Cloudera
Hadoop
,ApacheStorm,ApacheSpark集成。
栀子花_ef39
·
2024-01-03 11:05
数字化转型必备:数睿通 2.0 数据中台升级详解
资源评价)数据集市完善,打通审批流程修复数据生产由于DruidSQLUtils不支持Doris导致无法建表的问题优化贴源数据模块,改为读取数据库的元数据,与同步的数据做关联匹配此外,数据生产模块很多朋友对于
Hadoop
小螺旋丸
·
2024-01-03 10:51
hadoop
git
数据仓库
大数据
新年快乐—数睿通2.0数据中台全新功能模块发布
FlinkSql作业开发调度中心运维中心资源中心配置中心其他模块结语引言离上次发文已经有接近三个月了,这三个月主要在开发数睿通的数据生产模块,同时优化了一下数据集成,目前已经基本开发完毕了,集成了Flink,
Hadoop
小螺旋丸
·
2024-01-03 10:43
大数据
springcloud
java
数据库
大数据
云计算
Hive自定义函数支持国密SM4解密
当前项目背景需要使用到国密SM4对加密后的数据进行解密,Hive是不支持的,尝试了华为DWS数仓,华为只支持在DWS中的SM4加密解密,不支持外部加密数据DWS解密新建Maven工程只需要将引用的第三方依赖打到jar包中,
hadoop
4935同学
·
2024-01-03 08:03
Hive
Java
hive
hadoop
数据仓库
计算机毕业设计吊打导师
hadoop
+spark+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计
流程:1.Python爬虫采集中华健康网约10万医生数据,最终存入mysql数据库;2.使用pandas+numpy/
hadoop
+mapreduce对mysql中的医生数据进行数据分析,使用高德地图解析地理位置
计算机毕业设计大神
·
2024-01-03 07:53
纠删码ReedSolomon
随着大数据技术的发展,HDFS作为
Hadoop
的核心模块之一得到了广泛的应用。为了数据的可靠性,HDFS通过多副本机制来保证。
旅僧
·
2024-01-03 07:14
#
大数据计算基础
大数据
分布式
算法
Clojure 实战(4):编写
Hadoop
MapReduce 脚本
Hadoop
简介众所周知,我们已经进入了大数据时代,每天都有PB级的数据需要处理、分析,从中提取出有用的信息。
Hadoop
就是这一时代背景下的产物。
张吉Jerry
·
2024-01-03 07:35
大数据
hadoop
clojure
react-封装Echarts
基础配置
项
基于上一篇文章做出的补充(react-封装Echarts组件-CSDN博客)针对Echarts配置项做的封装处理,项目中多次用到一个类型的图表时可封装节省多余代码,可以根据自己项目需求做出修改/****@paramtypeechart的类型*@returnsmap地图配置*@returnscake饼图配置*@returnsradarChart雷达图配置*@returnscolumnChart柱状图
阳光下的小蒙
·
2024-01-03 06:43
react.js
echarts
javascript
CCNP课程实验-05-Comprehensive_Experiment
目录实验条件网络拓朴
基础配置
实现IGP需求:1.根据拓扑所示,配置OSPF和EIGRP2.在R3上增加一个网段:33.33.33.0/24(用Loopback1模拟)宣告进EIGRP,并在R3上将EIGRP
烈火蜓蜻
·
2024-01-03 06:09
网络
CCNP课程
OSPF
BGP
EIGRP
IPv6
CCNP课程实验-02-EIGRP_CFG
目录实验条件网络拓朴需求:
基础配置
需求实验1.R4/R5/R6通过二层交换机连接,按照实验拓扑图来宣告路由器接口到相应的EIGRP进程,没有具体说明的可任意宣告,要求关闭自动汇总。
烈火蜓蜻
·
2024-01-03 06:07
网络
智能路由器
CCNP课程
EIGRP
python操作hdfs及hbase
创建目录client.makedirs("/tmp/ct/test51")默认权限755,用户名:dr.who可以创建多层级目录(类似mkdir-p)如果存在权限不足,可以通过命令行对上层目录权限进行修改:
hadoop
dfs-chmod-R777
佛系小懒
·
2024-01-03 04:26
使用Datax将Hive中的表迁移到MySQL
无法上传(2)解压datax压缩包sudotar-zxvfdatax.tar.gz-C/usr/local(解压到的目录,可自己设置)(3)修改文件夹名称 mvdatax.tar datax(4)给
hadoop
孤城暮雨@
·
2024-01-03 04:17
数据迁移
hive
mysql
hadoop
数据库
Azkaban+Spark资源调度
前提条件:各节点之间的免密、登录启动
Hadoop
集群、Spark、Azkaban、Hive免密登录操作ssh-keygen-trsaslave01执行:scp~/.ssh/id_rsa.pub
hadoop
孤城暮雨@
·
2024-01-03 04:46
spark
大数据
分布式
【Spring Boot】Spring Boot 配置文件详解(application.yml、application-dev.yml、application-test.yml )
一、application.yml
基础配置
是SpringBoot中用于配置应用程序属性的主要配置文件之一。这个文件通常用于配置应用程序的一般性属性,包括数据库连接、日志级别、端口号等。
heartfluttering
·
2024-01-03 04:07
java开发
spring
boot
后端
java
Nginx 重定向和反向代理配置深度解析
基础配置
:HTTP重定向强制HTTP跳转到HTTPS对于安全性要求较高的网站,通常需要将HTTP流量重定向到HTTPS。
嘴角上扬c
·
2024-01-03 01:47
经验累积
nginx
运维
java
计算机毕业设计大数据类题目
序号题目题目要求(该课题的研究目的、所实现的主要功能等)1基于
Hadoop
的大数据宠物商城推荐系统收集大量有关宠物产品和用户购买行为的数据,并使用
hadoop
进行数据处理和存储,以构建一个个性化的宠物产品推荐系统
程序源码123
·
2024-01-03 00:14
任务书
开题报告
论文
课程设计
大数据
java
spring
boot
旅游
后端
数据库
hive多分隔符外表支持
CREATEEXTERNALTABLEtext_mid1(idSTRING,nameSTRING)ROWFORMATSERDE'org.apache.
hadoop
.hive.contrib.
甲乙寄几
·
2024-01-02 19:31
hive
hadoop
数据仓库
CCNP课程实验-03-Route_Path_Control_CFG
目录实验条件网络拓朴需求
基础配置
需求实现1.A---F所有区用Loopback模拟,地址格式为:XX.XX.XX.XX/32,其中X为路由器编号。根据拓扑宣告进对应协议。
烈火蜓蜻
·
2024-01-02 14:58
网络
CISCO
智能路由器
CCNP课程
Hbase介绍以及Hive优势
因为HBase基于
Hadoop
的HDFS完成分布式存储,以及MapReduce完成分布式并行计算,所以它的一些特点与
Hadoop
相同,依靠横向扩展,通过不断增加性价比高的商业服务器来增加计算和存储能力。
毛毛虫同学
·
2024-01-02 14:38
10.
Hadoop
框架下MapReduce中的map个数如何控制
一个job的map阶段并行度由客户端在提交job时决定客户端对map阶段并行度的规划基本逻辑为:一、将待处理的文件进行逻辑切片(根据处理数据文件的大小,划分多个split),然后每一个split分配一个maptask并行处理实例二、具体切片规划是由FileInputFormat实现类的getSplits()方法完成切分规则如下:1.简单地按照文件的内容长度进行切片2.切片大小默认是datanode
__元昊__
·
2024-01-02 13:45
Spark内容分享(二十三):Spark on K8s 在茄子科技的实践
4.EMR类产品的缺陷5.传统
Hadoop
生态,三大组件的前世今生6.SparkonK8s的优势SparkonK8s原理介绍1.Spark的集群部署模式2.Sparkonk8s如何运行3.Spark的dynamicAllocation
之乎者也·
·
2024-01-02 11:30
Spark
内容分享
大数据(Hadoop)内容分享
spark
kubernetes
科技
Spark内容分享(二十二):eBay最佳实践:Spark SQL优化之物化视图
的实现验证部分重写部分物化视图应用场景及收益应用场景:物化视图重写普通视图应用场景:物化视图重定义表结构物化视图应用收益总结及后续计划背景Carmel是eBay内部基于ApacheSpark打造的一款SQL-on-
Hadoop
之乎者也·
·
2024-01-02 11:00
Spark
内容分享
大数据(Hadoop)内容分享
spark
sql
大数据
Spark内容分享(二十一):字节跳动 Spark 支持万卡模型推理实践
-资源匹配未来展望背景介绍随着云原生的发展,Kubernetes由于其强大的生态构建能力和影响力,使得包括大数据、AI在内越来越多类型的负载应用开始向Kubernetes迁移,字节内部探索Spark从
Hadoop
之乎者也·
·
2024-01-02 11:59
Spark
内容分享
大数据(Hadoop)内容分享
spark
大数据
分布式
hadoop
环境搭建
一、平台环境CentOS6.5二、软件版本
hadoop
-2.8.1下载地址jdk-8u45-linux-x64下载地址apache-maven-3.3.9软件下载三、内容目录前置内容1.1jdk安装和配置
熊_看不见
·
2024-01-02 10:00
小肥柴的
Hadoop
之旅
小肥柴的
Hadoop
之旅(目录)(第0章)导航0-0-1写博客的初衷0-0-2参考资料和书籍0-0-3完工部分传送门导航0-0-1写博客的初衷从门外汉边学边上课,到入门的菜鸡,对如何正确的学习
Hadoop
卷毛迷你猪
·
2024-01-02 10:30
Hadoop
hadoop
大数据
分布式
【
Hadoop
】如何启动和关闭
Hadoop
集群
启动
Hadoop
集群关闭
Hadoop
集群启动
Hadoop
集群参考官方文档Apache
Hadoop
3.3.6–
Hadoop
ClusterSetup要启动
Hadoop
集群,需要同时启动HDFS和YARN集群
不怕娜
·
2024-01-02 10:29
hadoop
大数据
分布式
【
Hadoop
】集群配置之主要配置文件(
hadoop
-env.sh、yarn-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml...)
Hadoop
配置文件模板core-site.xml
hadoop
-env.shhdfs-site.xmlyarn-env-shyarn-site.xmlmapred-site.xmlslaves
Hadoop
不怕娜
·
2024-01-02 10:27
hadoop
xml
hdfs
大数据学习入门到实战教程,精心整理万字长文入门,老奶奶看了都说学会了
换个角度说,大数据是:1、有海量的数据2、有对海量数据进行挖掘的需求3、有对海量数据进行挖掘的软件工具(
hadoop
、spark、storm、flink、tez
悦悦学Python
·
2024-01-02 08:59
Hive(二)之bash群起脚本
集群的启动启动HDFS启动namenode$/opt/modules/cdh/
hadoop
-2.5.0-cdh5.3.6/sbin/
hadoop
-daemon.shstartnamenode2.启动datanode
DarrenmondZhang
·
2024-01-02 07:45
大数据 -
Hadoop
系列《三》- HDFS(分布式文件系统)概述
5.1hdfs的概念HDFS分布式文件系统,全称为:
Hadoop
DistributedFileSystem。
王哪跑nn
·
2024-01-02 06:06
大数据
大数据
hadoop
hdfs
Hadoop
运维--Zookeeper--安装配置
一、服务规划服务器IP地址软件服务备注master192.168.71.130zookeeperQuorumPeerMainfollowerslave1192.168.71.129zookeeperQuorumPeerMainleaderslave2192.168.71.132zookeeperQuorumPeerMainfollower二、ZooKeeper安装配置下载地址:https://zo
无剑_君
·
2024-01-02 06:39
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他