E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
hadoop
学习:mapreduce的wordcount时候,继承mapper没有对应的mapreduce的包
踩坑描述:在学习
hadoop
的时候使用
hadoop
下的mapreduce,却发现没有mapreduce。
超爱慢
·
2023-08-29 06:05
hadoop
学习
mapreduce
研究生定向培养学徒对象及说明
3.具备大数据人工智能技术基础,如Python、PyTorch、
Hadoop
、Spark中的
泰迪智能科技
·
2023-08-29 06:36
学生学徒
大数据
hadoop
国内镜像 极速下载
文章目录国内镜像汇总-极速下载【JavaPub版】lucene国内镜像https://mirrors.cloud.tencent.com/apache/
hadoop
/common/国内镜像汇总-极速下载
JavaPub-rodert
·
2023-08-29 06:57
国内镜像
hadoop
大数据
分布式
[小记】Hbase报错:Connection refused: no further information: localhost/127.0.0.1:16000
我用的是CentOS7,总结了网上的很多教程,大概步骤如下:1、修改主机名为
hadoop
1,vim/etc/hostname把原有的localhost。。。这个替换成
hadoop
1然后重启虚拟机。
小李不背锅
·
2023-08-29 05:53
大数据
hbase
hadoop
big
data
【
Hadoop
】DataNode 详解
博主"开着拖拉机回家"带您GotoNewWorld.✨个人主页——开着拖拉机回家_Linux,Java基础学习,大数据运维-CSDN博客✨希望本文能够给您带来一定的帮助文章粗浅,敬请批评指正!感谢点赞和关注,每天进步一点点!加油!目录一、DataNode简介二、DataNode工作机制三、DataNode文件结构四、HDFS中的chunk、packet和block五、心跳机制一、DataNode简
开着拖拉机回家
·
2023-08-29 04:11
#
【====
HDFS&YARN
====】
hadoop
datanode
block
chunk
packet
心跳机制
datanode存储
一百三十九、Kettle——Linux安装Kettle8.2
-8.2.0.0-342前提:Linux已经安装好jdk三、安装步骤(一)打开安装包所在地[root@hurys22~]#cd/opt/install/[root@hurys22install]#ls
hadoop
天地风雷水火山泽
·
2023-08-29 02:22
Kettle
linux
kettle
分布式系统和大数据处理架构的设计与实现
作者:禅与计算机程序设计艺术1.简介Apache
Hadoop
(TM)是由Apache基金会推出的开源分布式文件系统(
Hadoop
DistributedFileSystem),它是一个基于Java开发的一个框架
禅与计算机程序设计艺术
·
2023-08-29 02:44
大数据AI人工智能
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
利用pyspark实现spark编程之数据去重及筛选
SparkContextfrompysparkimportSparkContextsc=SparkContext('local','remdup')#加载两个文件A和Blines1=sc.textFile("/usr/local/
hadoop
该吃吃该喝喝
·
2023-08-29 02:43
pyspark
python
spark
hadoop
Hive将Json字符串数组转为Json对象数组
packagecom.cn.bigdata.hive.func;importcom.google.common.collect.Lists;importorg.apache.commons.lang3.StringUtils;importorg.apache.
hadoop
.hive.ql.exec
csdn-延
·
2023-08-29 02:08
大数据
hive
hive
json
java
数据研发人员必备工具
欢迎加入互联网技术交流群:5471478891、
Hadoop
套件和朋友们
Hadoop
在过去的几年里,几乎成为大数据的代名词。这是数据科学家的兵器库中的主要支撑。
啄木指北
·
2023-08-29 01:25
工具
hadoop
数据
软件
系统
shell学习笔记(详细整理)
二.Shell解析器(1)Linux提供的Shell解析器有:[root@
hadoop
101~]$cat/etc/shells/b
数据知道
·
2023-08-29 00:49
学习
笔记
shell
Hadoop
学习(一) MAC OS下安装
Hadoop
开发环境
在MACOS下安装和配置
Hadoop
开发环境相当简单。
禅大师
·
2023-08-29 00:28
分布式数据存储建设方法论——从HDFS架构优化与实践分析
HDFS(
Hadoop
DistributedFileSystem)就是
禅与计算机程序设计艺术
·
2023-08-29 00:44
Java
编程实践
Python
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
配置Hbase
配置Hbase_2.0.51.配置Hbase1.配置Phoenix1.配置HbaseZookeeper正常部署
Hadoop
正常部署HBase的解压1)解压Hbase到指定目录tar-zxvfhbase-
program chef
·
2023-08-28 21:29
#
数据仓库
hbase
数据库
大数据
配置DataX
配置DataX_3.0.01.配置DataX2.DataX案例1.配置DataX1)下载DataX安装包并上传到
hadoop
102的/opt/software下载地址:http://datax-opensource.oss-cn-hangzhou.aliyuncs.com
program chef
·
2023-08-28 21:28
#
数据仓库
分布式
Hudi 快速体验使用(含操作详细步骤及截图)
文章目录Hudi快速体验使用启动spark-shell添加jar包模拟产生Trip乘车数据插入数据利用sqarkSQL查询参考资料:Hudi快速体验使用本示例要完成下面的流程:需要提前安装好
hadoop
半岛铁子_
·
2023-08-28 19:09
spark
大数据
Hudi
spark
big
data
hudi
大数据
Hadoop
完全分布式安装,全网最详细!
大数据系统开发一、CentOS7系统安装1、新建虚拟机2、编辑虚拟机参数3、安装操作系统3.1开启虚拟机3.2选择installCentOS7白色字体显示,通过键盘的上下键进行选择然后回车;3.3选择语言3.4套件选择;磁盘位置;KDUMP禁用3.4.1选择最小化安装3.4.2安装目标位置不需要任何操作,直接点完成3.4.3KDUMP禁用3.5开始安装3.6设置一个root密码和创建一个账号3.6
正好.
·
2023-08-28 12:23
hadoop
分布式
大数据
大数据
hadoop
组件下载、windows环境搭建、官方文档查看详细步骤
hadoop
组件下载路径
hadoop
下载路径:http://
hadoop
.apache.org/第一步:进入官网后点击Download第二步:点击Apachereleasearchive(意思是:Apache
ryan_spark
·
2023-08-28 12:53
大数据
hadoop
windows上
Hadoop
的安装和使用
Hadoop
的安装和使用(windows)下载
hadoop
在windows上运行的软件winutils由于
Hadoop
不直接支持Windows系统,需要使用工具集winutils进行支持。
瑾寰
·
2023-08-28 12:52
hadoop
windows
大数据
windows下
hadoop
的部署和使用
本教程在windows10环境下安装配置
hadoop
+hbase+spark。一、下载压缩包:1、JavaJDK,1.8以上。
落叶1210
·
2023-08-28 12:22
大数据
scala及spark
大数据
hadoop
Hadoop
环境安装
Hadoop
环境安装1.最小化安装2.固定ip地址[root@master~]#vim/etc/sysconfig/network-scripts/ifcfg-eno16777736BOOTPROTO=
qq_42722387
·
2023-08-28 12:22
hadoop
linux
hdfs
【开发环境】安装
Hadoop
运行环境 ( 下载
Hadoop
| 解压
Hadoop
| 设置
Hadoop
环境变量 | 配置
Hadoop
环境脚本 | 安装 winutils )
文章目录一、下载
Hadoop
二、解压
Hadoop
三、设置
Hadoop
环境变量四、配置
Hadoop
环境脚本五、安装winutils六、重启电脑七、验证
Hadoop
安装效果一、下载
Hadoop
Hadoop
发布版本在
韩曙亮
·
2023-08-28 12:20
开发环境
hadoop
大数据
分布式
如何精通大数据开发技术
熟悉各种大数据技术栈,如
Hadoop
、Spark、Kafka、Hive等。掌握编程语言和工具:掌握至少一门编程语言,如Java、Python或Scala,并熟悉相关的开发工具和框架。
岁月的眸
·
2023-08-28 10:03
大数据
7 集群基本测试
1.上传小文件到集群在
hadoop
路径下执行命令创建一个文件夹用于存放即将上传的文件:[atguigu@
hadoop
102~]$
hadoop
fs-mkdir/input上传:[atguigu@
hadoop
102
hadoop
水无痕simon
·
2023-08-28 09:54
Hadoop
hadoop
大数据
2
hadoop
的目录
1.目录结构:其中比较的重要的路径有:hdfs,mapred,yarn(1)bin目录:存放对
Hadoop
相关服务(hdfs,yarn,mapred)进行操作的脚本(2)etc目录:
Hadoop
的配置文件目录
水无痕simon
·
2023-08-28 09:24
Hadoop
hadoop
大数据
分布式
6 ssh面密登录
1.首先进入自己的家目录,执行命令[atguigu@
hadoop
102.ssh]$ssh-keygen-trsa然后敲(三个回车),就会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)2.
水无痕simon
·
2023-08-28 09:24
Hadoop
ssh
网络
服务器
Hadoop
阅读前请看一下:我是一个热衷于记录的人,每次写博客会反复研读,尽量不断提升博客质量。文章设置为仅粉丝可见,是因为写博客确实花了不少精力。希望互相进步谢谢!!文章目录阅读前请看一下:我是一个热衷于记录的人,每次写博客会反复研读,尽量不断提升博客质量。文章设置为仅粉丝可见,是因为写博客确实花了不少精力。希望互相进步谢谢!!1、课程简介2、概论2.1、大数据的概念2.2、大数据的特点2.3、大数据的应用
一只菜得不行的鸟
·
2023-08-28 09:53
hadoop
大数据
分布式
4
hadoop
集群配置案例
3)配置集群(1)核心配置文件,core-site.xmlcd$
HADOOP
_HOME/etc/
hadoop
vimcore-site.xml文件内容如下:fs.defaultFShdfs://
hadoop
102
水无痕simon
·
2023-08-28 09:48
Hadoop
hadoop
eclipse
大数据
5 群起集群
1.在启动集群之前,先配置workers,有几个节点就配置几个[atguigu@
hadoop
102
hadoop
]$vim/opt/module/
hadoop
-3.1.3/etc/
hadoop
/workers
水无痕simon
·
2023-08-28 09:06
Hadoop
hadoop
喝擂茶
擂茶,擂即
研磨
的意思,这是福建、广东、湖南等地客家人的一种饮品。它入口香浓,有点象浓浓的菜粥。虽然已过去八九年了,那次喝擂茶的情形还历历在目呢!
东风满树花
·
2023-08-28 08:20
线上问诊:业务数据采集
系列文章目录线上问诊:业务数据采集线上问诊:数仓数据同步文章目录系列文章目录前言一、环境安装1.DataX二、全量同步1.DataX配置文件生成2.启动
hadoop
测试一下。
超哥--
·
2023-08-28 07:33
线上问诊
数据仓库
hadoop
- 节点的服役和退役(HDFS)
1.首先需要克隆一台主机现在我这里已经有五台虚拟机,要克隆的目标主机为CentOS7-1810_04:当前状态启动集群后webUI如下:把要克隆的目标虚拟机关机,在VMware上选中目标主机->右键->管理->克隆:右键->管理->克隆然后下一步,选择克隆自:虚拟机中的当前状态:克隆自虚拟机中的当前状态继续下一步,克隆方法选择:创建完整克隆:创建完整克隆继续下一步,修改虚拟机名称和位置:修改虚拟机
静水流深ylyang
·
2023-08-28 07:34
0201hdfs集群部署-
hadoop
-大数据学习
文章目录1前言2集群规划3
hadoop
安装包上传与安装3.1上传解压4
hadoop
配置5从节点同步和环境变量配置6创建用户7集群启动8问题集8.1InvalidURIforNameNodeaddress
gaog2zh
·
2023-08-28 06:31
#
Hadoop
大数据
hadoop
hdfs
大数据框架-
Hadoop
大数据框架-
Hadoop
1.什么是大数据大数据是指由传统数据处理工具难以处理的规模极大、结构复杂或速度极快的数据集合。
学习才能变得强大
·
2023-08-28 06:02
大数据
大数据
hadoop
hdfs
配置Flink
1.3分发安装目录1.4启动集群、访问WebUI2.Standalone运行模式3.YARN运行模式4.K8S运行模式1.Flink集群搭建1.1解压安装包链接:下载Flink安装包解压文件[gpb@
hadoop
102software
program chef
·
2023-08-28 06:18
#
数据仓库
flink
大数据
Windows下编译
Hadoop
-2.9.2
Windows下编译
Hadoop
-2.9.2系统环境系统:Windows1010.0_x64maven:ApacheMaven3.6.0jdk:jdk_1.8.0_201ProtocolBuffer:portoc
janlle
·
2023-08-28 05:02
VMware中ZooKeeper的伪分布式安装+配置+启动方法(Ubuntu18.04)
zookeeper6、查看进程7、验证,查看节点的leader和follower环境:VMwareWorkstation16Pro、Ubuntu18.04、javaversion“1.8.0_301”、
Hadoop
跳舞的皮埃尔
·
2023-08-28 05:43
Hadoop
Linux
笔记
zookeeper
分布式
hadoop
Netty连接处理那些事
编者注:Netty是Java领域有名的开源网络库,特点是高性能和高扩展性,因此很多流行的框架都是基于它来构建的,比如我们熟知的Dubbo、Rocketmq、
Hadoop
等,针对高性能RPC,一般都是基于
luoxn28
·
2023-08-28 04:01
Linux部署Nginx
#安装依赖[root@
hadoop
~]#yum-yinstallgcczlibzlib-develpcre-developensslopenssl-devel#下载安装包[root@
hadoop
~]#su-
hadoop
guaren2009
·
2023-08-28 01:37
2019-03-21
4大数据课程
hadoop
-day01:03、04
小白修仙之路
·
2023-08-28 00:18
contOS7 Spark StandAlone HA 环境搭建
1.确定环境是否安装好搭建环境之前先确定自己的环境是否做好1.jdk1.8版本2.HDFSMapReduce
Hadoop
3.2.1+3.zookeeper4.python环境3.8+点击直接查看1,23,4
大白菜程序猿
·
2023-08-27 23:11
linux
spark
大数据
spark
big
data
hadoop
Spark Local环境搭建及测试
【大数据学习记录篇】-持续更新中~篇一:Linux系统下配置java环境篇二:
hadoop
伪分布式搭建(超详细)篇三:
hadoop
完全分布式集群搭建(超详细)-大数据集群搭建文章目录1.SparkLocal
beixi@
·
2023-08-27 23:10
大数据技术学习
spark
大数据
hadoop
运维
分布式
Spark on Yarn集群模式搭建及测试
在Yarn集群模式下搭建Spark环境可以充分利用
Hadoop
的资源管理和调度能力。本文
beixi@
·
2023-08-27 23:10
大数据技术学习
spark
大数据
分布式
运维
服务器
linux
Spark3.2教程(九)CentOS7下Spark Standalone分布式搭建
local模式适合程序的开发测试Standalone模式适合小规模数据onYarn适合大数据量大,并且可能依赖于其他计算引擎,如MapReduce,这样可以更好的和
Hadoop
集成因为Spark本质上是一个计算引擎
Java朱老师
·
2023-08-27 23:09
Spark
spark
分布式
linux
Spark Standalone环境搭建及测试
【大数据学习记录篇】-持续更新中~篇一:Linux系统下配置java环境篇二:
hadoop
伪分布式搭建(超详细)篇三:
hadoop
完全分布式集群搭建(超详细)-大数据集群搭建篇四:SparkLocal环境搭建及测试文章目录
beixi@
·
2023-08-27 23:08
大数据技术学习
spark
大数据
分布式
运维
服务器
linux
会长大,但不会离开
图片发自App生活就像水母
研磨
成的粉末,某一刻你下定决心冲服下去,它有毒,会致幻,整个世界就变了样子。
弥望木星
·
2023-08-27 22:27
知乎 HBase 实践
前言HBase是一个基于
Hadoop
面向列的非关系型分布式数据库(NoSQL),设计概念来源于谷歌的BigTable模型,面向实时读写、随机访问大规模数据集的场景,是一个高可靠性、高性能、高伸缩的分布式存储系统
java菜
·
2023-08-27 21:03
在Windows10上利用wsl安装docker、
hadoop
以及运行WordCount
第一步以管理员打开WindowsPowerShell第二步安装wsl以及Ubuntuwsl--installwsl--install-dUbuntu第三步安装Docker官网网址https://docs.docker.com/desktop/install/windows-install/可以看到,官网说了安装dockerforwindows前需要有wsl2backend3.1证实docker可以
mxy990811
·
2023-08-27 21:09
大数据存储
大数据
docker
大数据日常运维命令
1、HDFSNameNode/usr/local/fql
hadoop
/
hadoop
/sbin/
hadoop
-daemon.shstartnamenode/usr/local/fql
hadoop
/
hadoop
bigdata-余建新
·
2023-08-27 19:20
Hadoop
大数据
运维
Hive原理剖析
一、简介Hive是建立在
Hadoop
上的数据仓库框架,提供大数据平台批处理计算能力,能够对结构化/半结构化数据进行批量分析汇总完成数据计算。
Hello.Reader
·
2023-08-27 18:33
hive
hadoop
数据仓库
上一页
109
110
111
112
113
114
115
116
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他