E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop分布式部署
大数据处理为何选择Spark,而不是
Hadoop
Spark的各个组件2.
Hadoop
Had
嘿嘿海海
·
2024-02-13 14:00
hadoop
分布式集群安装与原理
对很多人来说,学习大数据都止步于集群搭建,即使是那些工作过很多年的JAVA程序员也不例外,我们分享一套能让您轻松完成集群搭建的方法,包括
Hadoop
的源码编译、企业级环境安装与配置和常用大数据组件的基本原理
海牛大数据_青牛老师
·
2024-02-13 12:44
小猿圈之
Hadoop
优化
Hadoop
框架是现在最主流的的框架之一,越来越多的人去学习,那么你对
hadoop
的理解是什么?
hadoop
一定要会优化,那怎么优化呢,小猿圈今天说一下,感兴趣的朋友可以看看小猿圈写的这篇文章。
小猿圈加加
·
2024-02-13 05:38
Java从入门到精通
JavaSE,掌握Java语言本身、Java核心开发技术以及Java标准库的使用;2、如果继续学习JavaEE,那么Spring框架、数据库开发、分布式架构就是需要学习的;3、如果要学习大数据开发,那么
Hadoop
nightluo
·
2024-02-13 01:52
基础学习
java
开发语言
Datax ETL工具源码研究
Kittle优点:与大数据
Hadoop
结合比较好,功能比较齐全,强大,支持数据库,文件数据读写,界面拖拽方式操作;缺点:
Spring1985
·
2024-02-13 01:57
2018-07-19 sqoop
sqoop:数据从传统数据库到到
hadoop
的导入,导出安装:1.解压2.修改配置文件cdSQOOP_HOME/conf$mvsqoop-env-template.shsqoop-env.sh打开sqoop-env.sh
江江江123
·
2024-02-12 20:10
【解决方案】pyspark 初次连接mongo 时报错Class not found exception:com.mongodb.spark.sql.DefaultSource
=spark.read.format("com.mongodb.spark.sql.DefaultSource").load() File"/home/cisco/spark-2.4.1-bin-
hadoop
2
能白话的程序员♫
·
2024-02-12 19:33
Spark
spark
Hadoop
分布式系统架构-MapReduce-02
1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算,彼此间几乎没有依赖关系。Reduce负责“合”,即对map阶段的结果进行全局汇总。MapRedu
一直上上签X
·
2024-02-12 16:41
(一)Docker 在线部署和离线部署
环境:CentOS7.31.在线部署[root@
hadoop
004~]#yuminstall-yhttpd[root@
hadoop
004~]#servicehttpdstartRedirectingto
白面葫芦娃92
·
2024-02-12 15:51
zk01
zookeeper基础ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是
Hadoop
和Hbase的重要组件。提供的功能包括:命名服务、配置管理、集群管理、分布式锁、队列管理。
矮肥
·
2024-02-12 11:41
2018-11-16
hadoop
3.1完全
分布式部署
Hadoop
3.1.0完全分布式集群部署,三台服务器部署结构如下github配置文件源码地址Pdsh使用方法http://kumu-linux.github.io/blog/2013/06/19/pdsh
Albert陈凯
·
2024-02-12 08:20
hadoop
-YARN
Apache
Hadoop
YARN百度百科:https://baike.baidu.com/item/yarn/16075826?
weixin_33736649
·
2024-02-12 07:44
大数据
Hadoop
-MapReduce-Yarn集群搭建
通过官网搭建:
hadoop
.apache.org/docs/r2.6.5/
hadoop
-project-dist/
hadoop
-common/SingleCluster.ht
qq_2368521029
·
2024-02-12 07:44
搭建
Hadoop
-3.1.3 HA 集群
本文目录1.集群部署分布规划2.Zookeepr集群安装3.HDFS-HAⅠ.配置core-site.xmlⅡ.配置hdfs-site.xmlⅢ.配置分发4.YARN-HAⅠ.配置yarn-site.xmlⅡ.配置分发4.启动前的配置5.启动HA集群Ⅰ.单独启动Ⅱ.脚本方式启动HA集群6.HA集群测试
扛麻袋的少年
·
2024-02-12 07:43
#
Hadoop
hadoop
hdfs
大数据
Hadoop
-HA高可用集群部署
Hadoop
HAHA概述(1)所谓HA(HighAvailablity),即高可用(7*24小时不中断服务)。(2)实现高可用最关键的策略是消除单点故障。
魔笛Love
·
2024-02-12 07:13
hadoop
hdfs
big
data
Hadoop
-Yarn-ResourceManagerHA
一、介绍在
Hadoop
2.4之前,ResourceManager是YARN集群中的单点故障ResourceManagerHA是通过Active/Standby体系结构实现的,在任何时候其中一个RM都是活动的
隔着天花板看星星
·
2024-02-12 07:42
hadoop
大数据
分布式
Hadoop
:认识MapReduce
MapReduce是一个用于处理大数据集的编程模型和算法框架。其优势在于能够处理大量的数据,通过并行化来加速计算过程。它适用于那些可以分解为多个独立子任务的计算密集型作业,如文本处理、数据分析和大规模数据集的聚合等。然而,MapReduce也有其局限性,比如对于需要快速迭代的任务或者实时数据处理,MapReduce可能不是最佳选择。总的来说,MapReduce是大数据技术中的一个重要概念,它在Ha
爱写代码的July
·
2024-02-12 06:41
大数据与云计算
hadoop
mapreduce
大数据
org.apache.
hadoop
.fs.ChecksumException: Checksum error: file:/root/test.txt at 0
上传文件到集群遇到以下异常:org.apache.
hadoop
.fs.ChecksumException:Checksumerror:file:/root/test.txtat0[root@master
橙汁啤酒厂
·
2024-02-12 05:24
hadoop
大数据
-bash: export: =‘: 不是有效的标识符 -bash: export:
:/opt/
hadoop
-2.7.3//bin:/opt/jdk1.8.0_131
橙汁啤酒厂
·
2024-02-12 05:24
linux操作时遇到的相关问题
bash
开发语言
HBase集群部署
1.HBase安装相关版本:
Hadoop
:2.7.3hbase:1.3.1hbase相关版本下载安装HBase需要安装hbase-1.3.1-bin.tar.gz软件包,下载并解压到/opt目录下2.HBase
橙汁啤酒厂
·
2024-02-12 05:23
大数据
hbase
数据库
大数据
hadoop
Hadoop
运行环境搭建
模板虚拟机环境准备1)准备一台模板虚拟机
hadoop
100,虚拟机配置要求如下:模板虚拟机:内存4G,硬盘50G,安装必要环境,为安装
hadoop
做准备[root@
hadoop
100~]#yuminstall-yepel-release
nucty
·
2024-02-11 18:53
大数据
hadoop
大数据
HBase知识点总结
一、HBase基础HBase是一种建立在
Hadoop
文件系统之上的分布式、可扩展、支持海量数据存储的NoSQL数据库。HBase是BigTable的开源Java版本。
·
2024-02-11 17:17
hbase大数据数据库
离线数仓(一)【数仓概念、需求架构】
前言今天开始学习数仓的内容,之前花费一年半的时间已经学完了
Hadoop
、Hive、Zookeeper、Spark、HBase、Flume、Sqoop、Kafka、Flink等基础组件。
让线程再跑一会
·
2024-02-11 11:58
离线数仓
大数据
Hive与ClickHouse的区别
Hive是
Hadoop
生态系统中事实上的数据仓库标准。Hive是建立在
Hadoop
生态中的数据仓库中间件,其本身并不提供存储与计算能力。
晓之以理的喵~~
·
2024-02-11 08:18
Hadoop
大数据
hive
hive
clickhouse
hadoop
Hadoop
(三)通过C#/python实现
Hadoop
MapReduce
MapReduce
Hadoop
中将数据切分成块存在HDFS不同的DataNode中,如果想汇总,按照常规想法就是,移动数据到统计程序:先把数据读取到一个程序中,再进行汇总。
dotNET跨平台
·
2024-02-11 08:17
hadoop
mapreduce
spark
大数据
python
flink启动找不到yarn-session.sh命令
主要还是因为自己当初安装flink的几种模式时,是分开复制安装,导致自己以为配置了环境变量,还有一个需要注意:yarn-sisson.sh是flink/bin/的命令,并不是
hadoop
的yarn的命令
故乡的花又开了吗
·
2024-02-11 07:57
flink
flink
MapReduce的uber运行模式
背景在有些情况下,运行于
Hadoop
集群上的一些mapreduce作业本身的数据量并不是很大,如果此时的任务分片很多,那么为每个map任务或者reduce任务频繁创建Container,势必会增加
Hadoop
盗梦者_56f2
·
2024-02-11 01:42
C#系列-C#访问
hadoop
API(9)
在C#中访问
Hadoop
通常涉及到与
Hadoop
分布式文件系统(HDFS)进行交互,以及可能执行MapReduce作业或其他
Hadoop
生态系统组件(如HBase或Hive)。
管理大亨
·
2024-02-10 22:27
C#系列
c#
hadoop
开发语言
hadoop
-HDFS
1.详情1.架构图在这里插入图片描述2.读写的流程图在这里插入图片描述2.操作1.使用MAVEN集成对应的jar包org.apache.
hadoop
hadoop
-common2.7.1org.apache.
hadoop
hadoop
-hdfs2.7.12
炽热_3a57
·
2024-02-10 22:45
大数据毕业设计django+vue.js+scrapy租房推荐系统 租房大屏可视化 租房爬虫
hadoop
spark 58同城租房爬虫 房源推荐系统 计算机毕业设计
博主介绍:✌全网粉丝100W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌由于篇幅限制,想要获取完整文章或者源码,或者代做,可以给我留言或者找我聊天。感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人。文章包含:项目选题+项目展示图片(必看)计算机毕业设计吊
B站计算机毕业设计超人
·
2024-02-10 20:52
大数据毕业设计
大数据
课程设计
scrapy
hadoop
大数据毕业设计
计算机毕业设计
爬虫
Hive安装部署
pwd=6666通过XFTP将安装包上传到
hadoop
102的/opt/software目录下安装部署1、解压hive-3.1.3.tar.gz到/opt/module/目录下面进入安装包所在目录cd/
在下区区俗物
·
2024-02-10 20:30
hive
hadoop
数据仓库
CentOS7虚拟机 enss33没有ip地址
参考链接:CentOS7虚拟机enss33没有ip地址的解决方法_ens33没有ip地址_weixin_45307968的博客-CSDN博客在搭建
Hadoop
集群时,需要修改ip地址,但是当我查看时发现并没有显示
我想吃新疆炒米粉!
·
2024-02-10 18:31
tcp/ip
hadoop
网络协议
如何设计一个高并发系统?
并且,单体的应用,有单点的风险,如果它挂了,那服务就不可用了因此,设计一个高并发系统,我们可以采用
分布式部署
的方式,部署多台服务器,使用负载均衡的方式把流量分流开,让每个服务器都承担
低吟不作语
·
2024-02-10 15:20
学习笔记
系统架构
计算机毕业设计PyFlink+
Hadoop
+Hive民宿数据分析可视化大屏 民宿推荐系统 民宿爬虫 民宿大数据 知识图谱 机器学习 大数据毕业设计
流程1.selenium自动化爬虫框架采集民宿数据约10万条存入.csv文件作为数据集;2.使用pandas+numpy或MapReduce对数据进行数据清洗,生成最终的.csv文件并上传到hdfs;3.使用hive数仓技术建表建库,导入.csv数据集;4.离线分析采用hive_sql完成,实时分析利用Flink之Scala、FlinkSQL完成;5.统计指标使用sqoop导入mysql数据库;6
计算机毕业设计大神
·
2024-02-10 10:56
Hadoop
fs命令
目录前言命令及含义fs-lsfs-rmvfs-mkvfs-getfs-putfs-metatest;前言调用文件系统(FS)Shell命令应使用bin/
hadoop
fs的形式。
November丶Chopin
·
2024-02-10 08:02
专栏02-大数据与数据分析
hadoop
大数据
分布式
HDFS常用命令
HDFS常用命令hdfs命令最常用的就是:hdfsdfs-[linux的命令]通过查看
Hadoop
的命令与hdfs的命令并不相同,且不存在包含关系。仅仅是
hadoop
fs与hdfsdfs可以等价。
昱东i
·
2024-02-10 06:30
hadoop
linux
大数据
hadoop
could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running
学习使用
Hadoop
-3.2.2APIIDEA中使用Java向hdfs写入文件时出现如下错误:couldonlybereplicatedto0nodesinsteadofminReplication(=
昱东i
·
2024-02-10 06:30
hadoop
hadoop
hdfs
big
data
Hbase安装配置(含分布式ZooKeeper)
CentOS6.0192.168.255.128=》server01192.168.255.130=》server02192.168.255.131=》server03/etc/hosts文件中有这些IP和域名的映射关系配置server01在
hadoop
聊码
·
2024-02-10 04:17
新人数据技术如何快速提升
对于数据平台和工具而言,一般情况下都是在
Hadoop
生态下做开发,但对于一些有特殊要求的团队,Spark和Flink已经得
晓阳的数据小站
·
2024-02-09 23:46
数据开发
数据
java大数据
hadoop
2.9.2 hive操作
1、创建常规数据库表(1)创建表createtablet_stu2(idint,namestring,hobbymap)rowformatdelimitedfieldsterminatedby','collectionitemsterminatedby'-'mapkeysterminatedby':';(2)创建文件student.txt1,zhangsan,唱歌:非常喜欢-跳舞:喜欢-游泳:一般
crud-boy
·
2024-02-09 21:24
java大数据
大数据
hive
hadoop
java大数据
hadoop
2.9.2 Flume安装&操作
1、flume安装(1)解压缩tar-xzvfapache-flume-1.9.0-bin.tar.gzrm-rfapache-flume-1.9.0-bin.tar.gzmv./apache-flume-1.9.0-bin//usr/local/flume(2)配置cd/usr/local/flume/confcp./flume-env.sh.template./flume-env.shvifl
crud-boy
·
2024-02-09 21:54
java大数据
大数据
flume
业务模块化打造单体和
分布式部署
同步支持方案
追求的是一个既可以单体部署,又可以进行
分布式部署
的架构方式。我们需要同时满足云上SaaS部署(流量偏大)和私有部署(流量小,看重服务器成本)。当然这种架构方式我们也是经过好几次的
dotNET跨平台
·
2024-02-09 20:48
数据中台 pdf_数据中台到底怎么建设,有人把他说清楚了
本人断断续续从事数据仓库约有五六年经验,在移动公司前三年是负责数据仓库项目实施,后四年开发搞大数据平台,见证了从传统数据仓库转型到大数据平台的全历程,见证了大数据平台从0到1的全部过程,包括第一个MPP数据集市、第一个
Hadoop
weixin_39699121
·
2024-02-09 18:59
数据中台
pdf
编程随笔-ElasticSearch知识导图(1):全景
但我最初了解ES却是从NoSQL数据库开始,在使用、研究了ES一段时间后,我发现这是一个优秀的
分布式部署
软件,不仅是一个全文搜索引擎、还是一个分布式存储系统、一个分布式数据库。
weixin_33868027
·
2024-02-09 18:58
数据库
大数据
json
Zookeeper原理架构
首先,Zookeeper是Apache的一个java项目,属于
Hadoop
系统,扮演管理员的角色。然后看到官网那些专有名词,实在理解不了。
白纸糊
·
2024-02-09 17:53
nginx安装以及启动
一、简介Nginx("enginex")是一款是由俄罗斯的程序设计师IgorSysoev所开发高性能的Web和反向代理服务器,也是一个IMAP/POP3/SMTP代理服务器.nginx可用于
分布式部署
,
一个摸鱼AI喵
·
2024-02-09 13:36
大数据
Hadoop
生态圈技术之浅析PageRank计算原理
二、计算环境——
Hadoop
-2.5.2——四台主机——两台NN的HA——两台RM的HA——离线计算框架MapReduce三、计算原理(1)思考
A尚学堂Nancy老师
·
2024-02-09 10:23
macos安装local模式spark
文章目录配置说明安装
hadoop
安装Spark测试安装成功配置说明Scala-3.18+Spark-3.5.0
Hadoop
-3.3.6安装
hadoop
从这里下载相应版本的
hadoop
下载后解压,配置系统环境变量
SparklingTheo
·
2024-02-09 08:52
大数据-linux
macos
spark
大数据
SQL条件判断语句嵌套window子句的应用【易错点】--HiveSql面试题25
目录0需求分析1数据准备3数据分析4小结0需求分析需求:表如下user_idgood_namegoods_typerk1
hadoop
1011hive1221sqoop2631hbase1041spark1351flink2661kafka1471oozie108
莫叫石榴姐
·
2024-02-09 06:00
SQLBOY1000题
sql
HiveSql面试题
sql
HiveSQL——条件判断语句嵌套windows子句的应用
0需求分析需求:表如下user_idgood_namegoods_typerk1
hadoop
1011hive1221sqoop2631hbase1041spark1351flink2661kafka1471oozie108
爱吃辣条byte
·
2024-02-09 06:58
#
HIve
SQL
大数据
数据仓库
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他