E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习积累
(六)SparkSQL读写本地外部数据源
third-party数据源的package,spark把包加载进来就可以使用了csv格式在spark2.0版本之后是内置的,2.0之前属于第三方数据源一、读取本地外部数据源1.直接读取一个json文件[
hadoop
白面葫芦娃92
·
2024-01-01 11:58
安装
Hadoop
:
Hadoop
的单机模式、伪分布式模式——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项
前言
Hadoop
包括三种安装模式:单机模式:只在一台机器上运行,存储是采用本地文件系统,没有采用分布式文件系统HDFS;伪分布式模式:存储采用分布式文件系统HDFS,但是,HDFS的名称节点和数据节点都在同一台机器上
Stitch .
·
2024-01-01 10:09
我的大学笔记
Hadoop
分布式
大数据
hadoop
笔记
linux
mysql
hive
【2023
Hadoop
大数据技术应用期末复习】填空题题型整理
大数据的4V特征包含()()()()答案:大量、多样、高速、价值
Hadoop
三大组件包含()()()答案:HDFS、MapReduce、Yarn
Hadoop
2.x版本中的HDFS是由()()()组成答案
Lacszer
·
2024-01-01 10:23
大数据
【2023
Hadoop
大数据技术应用期末复习】选择题题型整理
文章目录单选题多选题单选题创建虚拟机的过程中,网络类型建议选择?A.使用桥接网络B.使用网络地址转换(NAT)C.使用仅主机模式网路D.不适用网路连接答案:B使用什么命令对jdk压缩包解压?A.tar-zxvfjdk-8u141-linux-x64.tar.gzB.zip-zxvfjdk-8u141-linux-x64.tar.gzC.uzipjdk-8u141-linux-x64.tar.gzD
Lacszer
·
2024-01-01 09:51
大数据
计算机毕业设计
hadoop
+spark+hive知识图谱酒店推荐系统 酒店数据分析可视化大屏 酒店爬虫 高德地图API 酒店预测系统 大数据毕业设计
流程:1.Python爬取去哪儿网全站旅游数据约10万+,存入mysql;2.使用pandas+numpy/
hadoop
+mapreduce对mysql中旅游数据进行数据清洗,使用高德API计算地理信息
计算机毕业设计大神
·
2024-01-01 06:52
Flink 内容分享(二十八):深度解析 Flink 是如何管理好内存的?
最着名的例子是Apache
Hadoop
,还有较新的框架,如ApacheSpark、ApacheDrill、ApacheFlink。基于JVM的数据
之乎者也·
·
2024-01-01 05:23
Flink
内容分享
大数据(Hadoop)内容分享
flink
大数据
Flink 内容分享(二十七):
Hadoop
vs Spark vs Flink——大数据框架比较
大数据开发离不开各种框架,我们通过学习Apache
Hadoop
、Spark和Flink之间的特征比较,可以从侧面了解要学习的内容。
之乎者也·
·
2024-01-01 05:52
Flink
内容分享
大数据(Hadoop)内容分享
大数据
flink
hadoop
集群时间同步
配置时间同步具体实操:时间服务器配置(必须root用户)(1)检查ntp是否安装[root@
hadoop
102桌面]#rpm-qa|grepntpntp-4.2.6p5-10.el6.centos.x86
Map_Reduce
·
2024-01-01 04:31
java.io.FileNotFoundException:
HADOOP
_HOME and
hadoop
.home.dir are unset.
问题描述如下:image.png问题原因:其原因是需要在windows本地搭建
Hadoop
环境,下载winutils文件,并将
hadoop
-2.8.4包内的bin文件替换,将下载文件中
hadoop
.dll
Sql强
·
2024-01-01 04:35
spark(三):spark的数据读取和保存
方法将RDD保存为一个文件2、JSON格式文件,大多是每行一条记录这里需要注意是每一行是一个JSON记录还是跨行的,如果是跨行的那么就要解析整个文件3、CSV文件4、SequenceFile基于键值对的
hadoop
_NeutronStar
·
2024-01-01 04:12
使用Docker安装
Hadoop
和spark
使用docker配置安装
hadoop
和spark分别安装
hadoop
和spark镜像安装
hadoop
镜像选择的docker镜像地址,这个镜像提供的
hadoop
版本比较新,且安装的是jdk8,可以支持安装最新版本的
zealscott
·
2024-01-01 01:26
大数据 -
Hadoop
系列《二》-
Hadoop
组成
目录3.1
hadoop
组成3.1HDFS架构概述1.NameNode(nn):编辑2.DataNode(dn):3.SecondaryNameNode(2nn):3.2YARN架构概述3.3MapReduce
王哪跑nn
·
2023-12-31 22:50
大数据
大数据
hadoop
分布式
大数据的核心工作
以数据为生活赋能大数据软件生态(数据存储,数据计算,数据传输)1.大数据的核心工作存储:妥善保存海量待处理数据计算:完成海量数据的价值挖掘传输:协助各个环节的数据传输2.大数据软件生态存储:Apache
Hadoop
HDFS
PGl63
·
2023-12-31 22:42
hadoop
数据库
数据库架构
vwmare 15“无权输入许可证密钥...”与出现新问题
hadoop
集群无法启动
文章最后更新于2022.5.27,2:18am,希望对你有帮助“您无权输入许可证密钥…”与解决方法备份了虚拟机的所有文件,重置了电脑后,再把虚拟机的所有文件移动回原来的位置(文件路径不变),原本以为这样不会出现任何问题的。结果当打开输入密钥的时候,出现这个问题一开始以为是没有**“以管理员身份运行”导致无法输入密钥,但后来以管理员身份运行后也不行**>_<没办法,上网看看怎么解决呗上网查百度、CS
m0_67392409
·
2023-12-31 21:57
面试
学习路线
阿里巴巴
hadoop
大数据
linux
搜索引擎
云原生
安装与部署
Hadoop
一、前置安装准备1、机器2、java3、创建
hadoop
用户二、安装
Hadoop
三、环境配置1、workers2、
hadoop
-env.sh3、core-site.xml4、hdfs-site.xml5
mapyking
·
2023-12-31 20:48
大数据-Hadoop
hadoop
大数据
分布式
VitulBox中Ubuntu虚拟机安装JAVA环境——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项
提示:以下操作是在虚拟机
hadoop
用户下操作的,并为安装java环境作准备一、更新APT为了确保
Hadoop
安装过程顺利进行,建议用
hadoop
用户登录Linux系统后打开一个终端,执行下面命令更新APT
Stitch .
·
2023-12-31 20:41
我的大学笔记
Linux
ubuntu
java
笔记
大数据
linux
Oracle VirtualBox中Linux系统基本使用方法——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项
前言小北的这篇博客介绍的是关于用VirtualBox中下载好的ubuntu系统中,为搭建
Hadoop
平台所做的命令操作准备,希望能帮助不会的人有指引作用。
Stitch .
·
2023-12-31 16:18
我的大学笔记
Linux
笔记
linux
大数据
ubuntu
专为初学者设计:Nutch库Java下载器入门指南
基于
Hadoop
的分布式系统,Nutch支持大规模网络爬取,并提供各种插件,包括链接分析、语言检测和内容过滤等功能。
亿牛云爬虫专家
·
2023-12-31 15:52
java
代理IP
爬虫代理
java
开发语言
Nutch
下载器
爬虫代理
代理IP
多线程
sqoop的导入命令详解
sqoop的背景sqoop是一个配合大数据
hadoop
做数据底层的导入导出操作,需要配合hive及分布式文件系统(hdfs或blob)一起使用,在大数据ETL应用领域,sqoop占据主流。
夜空痕
·
2023-12-31 13:55
java hbase 配置文件_Hbase入门(二)——安装与配置
一、先决条件1、JDK和
Hadoop
一样,Hbase需要JDK1.6或者更高的版本,所以请安装好JDK并配置环境变量。
weixin_39804329
·
2023-12-31 10:30
java
hbase
配置文件
linux实战[1] -- linux搭建java开发环境
文章目录1.环境介绍2.安装Java3.安装MySQL4.安装tomcat5.安装maven6.安装
Hadoop
7.配置git1.环境介绍环境使用的是VMware15CentOSLinuxrelease8.4.2105
天下一般
·
2023-12-31 10:25
后台
环境的配置与软件的使用
mysql
运维
大数据开发【3】 --
hadoop
的云集群配置
关于伪分布式的:请看伪分布式搭建文章目录1.配置yarn2.各个主机配置3.集群的配置4.一些问题5.强烈推荐的参考文章1.配置yarn配置yarn-env.sh,对于3版本的就不用配置了,因为已经默认从
hadoop
-env.sh
天下一般
·
2023-12-31 10:25
后台
大数据
使用Java API对HDFS进行如下操作:文件的创建、上传、下载以及删除等操作
packageorg.apache.
hadoop
.examples;importjava.io.FileInputStream;publicc
马龙强_
·
2023-12-31 09:50
java
hdfs
hadoop
Hive集群出现报错信息解决办法
报错信息:hive>showdatabases;FAILED:HiveExceptionjava.lang.RuntimeException:Unabletoinstantiateorg.apache.
hadoop
.hive.ql.metadata.SessionHiveMetaStoreClient
马龙强_
·
2023-12-31 09:47
hive
hadoop
数据仓库
Zookeeper集群搭建
系列文章目录Ubuntu常见基本问题
Hadoop
3.1.3安装(单机、伪分布)
Hadoop
集群搭建HBase2.2.2安装(单机、伪分布)Zookeeper集群搭建HBase集群搭建Spark安装和编程实践
WE-ubytt
·
2023-12-31 08:53
大数据处理与应用
zookeeper
hadoop
大数据
大数据-
Hadoop
入门
目录2.1
hadoop
的简介1.概述2.什么是分布式?
王哪跑nn
·
2023-12-31 07:33
大数据
大数据
hadoop
分布式
解锁大数据世界的钥匙——
Hadoop
HDFS安装与使用指南
目录1、前言2、
Hadoop
HDFS简介3、
Hadoop
HDFS安装与配置4、
Hadoop
HDFS使用5、结语1、前言大数据存储与处理是当今数据科学领域中最重要的任务之一。
凛鼕将至
·
2023-12-31 07:25
hadoop
hdfs
大数据
ubuntu下编译
Hadoop
Ubuntu下编译
Hadoop
-2.9.2系统环境系统:ubuntu-18.10-desktop-amd64maven:ApacheMaven3.6.0jdk:jdk_1.8.0_201ProtocolBuffer
janlle
·
2023-12-31 06:44
往hdfs中上传文件
这个在
hadoop
的帮助文档里面,里面有一部分东西是网页式的内容。最后是利用了curl的命令实现了这个命令。
VChao
·
2023-12-31 06:23
修改某目录的权限拥有者-----Linux
1、修改权限//例如用户名:
hadoop
密码:pw目录:/home/
hadoop
/booksudochown
hadoop
:pw/home/
hadoop
/book2、查看修改情况cd~//查看当前目录下的所有文件的详细情况
chubby_乌托邦
·
2023-12-31 06:35
Vmware虚拟机无法联通主机解决方法二
昨天在遇到了VMware虚拟机无法联通主机,导致我在CentOS-7搭建的伪
Hadoop
3服务,无法访问管理平台,使用将网络编辑器修改为“桥接”模式解决。
在奋斗的大道
·
2023-12-31 05:45
深蓝计划
系统运维
VMware
Vmware 虚拟机无法联通主机
问题描述:今天使用VmwareWorkstation创建CentOS-7虚拟机,基于CentOS-7搭建
Hadoop
3伪分布式版本,CentOS-7测试
Hadoop
3服务正常启动,通过主机连接
Hadoop
3
在奋斗的大道
·
2023-12-31 05:14
VMware
虚拟机操作
系统运维
深蓝计划
linux
运维
服务器
MapReduce基础介绍
一.MapReduce1.MapReduce定义Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于
hadoop
的数据分析应用”的核心框架。
Movle
·
2023-12-31 01:41
mail 465邮件发送案例(含有不带附件和带附件log文件发送)
_144511.png选择开启SMTP服务记录你的授权码2019-08-24_144500.png二、停止服务servicesendmailstopchkconfigsendmailoff[root@
hadoop
001
吃货大米饭
·
2023-12-30 22:55
【图文详解】HBase 数据模型及其架构原理
HBase简介https://hbase.apache.org/HBase,
Hadoop
Database,是一个高可靠性、高性能、面向列存储、可伸缩、实时读写的分布式开源NoSQL数据库。
禅与计算机程序设计艺术
·
2023-12-30 21:40
第一次投稿失败
我不能把时间都浪费在低落上,我应该找出不足,继续
学习积累
,争取早日投稿
王弋檬
·
2023-12-30 20:15
全链路拓扑大屏
基于AIOps理念研发的新一代运维监控大屏,全盘展示IT运行状态,减轻运维人员的重复性工作量,提高IT系统排错速度,加速运维知识
学习积累
。
益达_glmsb
·
2023-12-30 19:57
【大数据入门核心技术-
Hadoop
】(六)
Hadoop
3.2.1高可用集群搭建
目录一、
Hadoop
部署的三种方式1、Standalonemode(独立模式)2、Pseudo-Distributedmode(伪分布式模式)3、Clustermode(集群模式)二、准备工作1、先完成
forest_long
·
2023-12-30 18:49
大数据技术入门到21天通关
hadoop
大数据
hdfs
zookeeper
hive
java大数据和javaee哪个好,java与大数据之间的关系
Sourcecodedownload:本文相关源码大数据是目前互联网流行的技术语言,处理大数据的编程语言比较有优势的也很多,比如java、python、go、R语言、
Hadoop
等等,按道理来说每种编程语言都可以处理大数据
chatgpt001
·
2023-12-30 17:14
java
CDH5到CDH6都更新了些什么?
CDH6是基于
Hadoop
3同时包含大量其他组件的大版本更新的发布版本,许多用户考虑到未来CDH的版本主要是基于CDH6,而CDH5会慢慢的停止更新,所以考
ClouderaHadoop
·
2023-12-30 14:18
ClickHouse基础知识(六):ClickHouse的副本配置
1.副本写入流程2.配置步骤➢启动zookeeper集群➢在
hadoop
101的/etc/clickhouse-server/config.d目录下创建一个名为metrika.xml的配置文件,内容如下
依晴无旧
·
2023-12-30 09:07
大数据
clickhouse
Hadoop
开发环境搭建
文章目录第1关:配置开发环境-JavaJDK的配置第2关:配置开发环境-
Hadoop
安装与伪分布式集群搭建
hadoop
-env.sh配置yarn-env.sh配置core-site.xml配置hdfs-site.xml
柔雾
·
2023-12-30 09:42
hadoop
大数据
分布式
大数据背后的绿色收割:基于
Hadoop
的农产品价格信息智能分析
大数据背后的绿色收割:基于
Hadoop
的农产品价格信息智能分析引言正文1.数据获取与准备2.数据清洗与处理3.
Hadoop
数据分析引擎的运用4.MySQL数据库的集成5.创新性的可视化6.结论与展望结语引言随着信息技术的不断发展
爱欲无极
·
2023-12-30 09:01
大数据
Spark
Hadoop
大数据
hadoop
分布式
Hadoop
之Yarn 详细教程
1、yarn的基本介绍和产生背景YARN是
Hadoop
2引入的通用的资源管理和任务调度的平台,可以在YARN上运行MapReduce、Tez、Spark等多种计算框架,只要计算框架实现了YARN所定义的接口
白鸽呀
·
2023-12-30 08:57
大数据
hadoop
java
eclipse
springboot整合
hadoop
遇错
错误一:Causedby:java.io.FileNotFoundException:
HADOOP
_HOMEand
hadoop
.home.dirareunset.解决:下载:https://github.com
S梦天涯S
·
2023-12-30 08:50
hadoop
java
大数据
大数据竞赛MR培训与题型
MapReduce编程模板1.自定义Mapper类继承类并重写map方法:importorg.apache.
hadoop
.io.IntWritable;importorg.apache.
hadoop
.io.LongWritable
背帆
·
2023-12-30 08:52
大数据
大数据
mr
hadoop
Hadoop
分布式集群搭建(三台虚拟机)
一.准备工作搭建好VMwareWorkstationPro(我这里装的版本是16)二.新建虚拟机
hadoop
01搭建
hadoop
集群需要三台虚拟机1.新建虚拟机——>自定义(高级)2.不用改动,点击下一步
# Ling
·
2023-12-30 07:00
hadoop
大数据
分布式
IDEA使用HDFS的JavaApi
1.准备工作1.1创建测试类创建测试类,并定义基本变量publicclassHDFSJAVAAPI{//定义后续会用到的基本变量publicfinalStringHDFS_PATH="hdfs://
hadoop
00
向之 所欣
·
2023-12-30 07:59
Hadoop
intellij-idea
hdfs
java
Hadoop
完全分布式搭建 - 第二章 CentOS集群安装配置
CentOS7.6.1080一些其他博主的参考+原创一、准备工作将安装好的CentOS7克隆多两台出来关闭防火墙:systemctlstopfirewalld.service禁用防火墙:systemctldisablefirewalld.service查看防火墙状态firewall-cmd--state重启reboot二、实现三台机器ssh免密登录前提:确保三台机的名称与IP1.修改IP(设置为手
Dehan.Dan
·
2023-12-30 07:29
CentOS系统部署
Hadoop
完全分布式集群
查看当前使用的CentOS版本及JDK、
Hadoop
版本,结果如下截图:
Hadoop
全分布部署与伪分布的单机部分完全相同,唯有
hadoop
的文件配置略有不同,本文建立在伪分布部署的基础上重新修改配置文件
ScriptFlying
·
2023-12-30 07:28
Hadoop平台
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他