E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop详细配置
Log4j.xml配置说明
以下是Log4j2的
详细配置
说明:配置文件名称和存放位置:Log4j2的配置文件名可以是任意有效的文件名,但通常以.xml、.json或.yaml结尾。
军伟@
·
2023-12-16 19:54
杂类
log4j
xml
单元测试
黑猴子的家:hive-start.sh
[alex@
hadoop
102~]$cd/usr/local/bin/[alex@
hadoop
102bin]$sudotouchhive-start.sh[alex@
hadoop
102bin]$sudochownalex
黑猴子的家
·
2023-12-16 19:10
Sqoop安装与配置-shell脚本一键安装配置
Sqoop是一个用于在Apache
Hadoop
和结构化数据存储(如关系数据库)之间传输数据的工具。
大数据魔法师
·
2023-12-16 18:31
大数据
sqoop
hadoop
hive
Presto------分布式SQL查询引擎
Apache
Hadoop
-MapReduce优点:统一、通用、简单的编程模型,分而治之思想处理海量数据。
小希 fighting
·
2023-12-16 18:40
分布式
数据库
Caused by: java.net.ConnectException: 拒绝连接:
hadoop
104/192.168.124.130:4142
项目场景:
hadoop
102接收消息,自定义拦截器,包含hello的发往
hadoop
103,不包含的发往
hadoop
104报错原因:原因1:应该先开启接收方(服务端),
hadoop
103,
hadoop
104
挽风821
·
2023-12-16 18:54
大数据
flume
hadoop
3.3完全分布式(最简)
环境准备3台CentOS7(本例使用VMware替代)jdk8
Hadoop
3.3虚拟机基础准备网络适配器选用NAT模式(针对VMware)设置静态IP,对应关系如下名称地址
hadoop
01192.168.138.201
hadoop
02192.168.138.202
hadoop
03192.168.138.203
qq_44770531
·
2023-12-16 17:34
分布式
linux
hadoop
Zookeeper特性与节点数据类型
1.什么是Zookeeper它是一个分布式协调框架,是Apache
Hadoop
的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等
逍遥白亦
·
2023-12-16 16:14
ssh: Could not resolve hostname node: Name or service not known
搭建
Hadoop
完全分布式的实现免密登录未找到主机其他两台确可以最后发现是/etc/hosts文件忘记配置主机IP映射了然后就可以自由登录了微信搜索公众号“大数据花院”可以复制题目发送查题哦
禾火r
·
2023-12-16 16:47
大数据
ssh
hadoop
JDK21+
HADOOP
3.2.2+Windows安装步骤
哈哈哈最近转战大数据这块了,分享一下
hadoop
3.2.2的安装步骤借鉴了不少大佬的文章,如有雷同,都是大佬们的1.JDK安装我选择的是JDK21以下是下载网址和截图,这个没有太多的,一般下载最新的就可以
倩雯Memory
·
2023-12-16 15:36
windows
hadoop
Sqoop基础理论与常用命令详解(超详细)
文章目录前言一、Sqoop概述1.Sqoop简介2.Sqoop架构(1)SqoopClient(2)SqoopServer(3)Connector(4)Metastore(5)
Hadoop
/HDFS3.
大数据魔法师
·
2023-12-16 15:57
大数据
sqoop
hadoop
hive
《PySpark大数据分析实战》-10.独立集群模式的代码运行
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-16 14:49
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-08.宽窄依赖和阶段划分
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-16 14:19
PySpark大数据分析实战
数据分析
数据挖掘
《PySpark大数据分析实战》-09.Spark独立集群安装
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-16 14:49
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《PySpark大数据分析实战》-05.PySpark库介绍
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-16 14:05
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Mapreduce小试牛刀(1)
1.与hdfs一样,mapreduce基于
hadoop
框架,所以我们首先要启动
hadoop
服务器-----------------------------------------------------
printcsr
·
2023-12-16 12:51
mapreduce
Mapreduce小试牛刀(2)--java api
1.同hdfs的javaapi,我们首先要在IDE中建立一个maven项目pom.xml中配置如下:org.apache.
hadoop
hadoop
-mapreduce-client-common3.3.4org.apache.
hadoop
hadoop
-mapreduce-client-jobclient3.3.4org.apache.
hadoop
hadoop
-client3.3.4org.slf4
printcsr
·
2023-12-16 12:51
学习
Hdfs java API
1.在主机上启动
hadoop
sbin/start-all.sh这里有一个小窍门,可以在本机上打开8088端口查看三台机器的连接状态,以及可以打开50070端口,查看hdfs文件状况。
printcsr
·
2023-12-16 12:21
学习
hadoop
-yarn简介及常用命令详解(超详细)
文章目录前言一、YARN概述1.YARN简介2.YARN架构(1)ResourceManager(资源管理器)(2)NodeManager(节点管理器)(3)ApplicationMaster(应用程序管理器)3.YARN特点(1)分布式资源管理(2)多框架支持(3)灵活的资源调度(4)高可靠性和容错性(5)可扩展性(6)安全性二、YARN命令介绍1.YARN命令简介2.yarnapplicati
大数据魔法师
·
2023-12-16 12:46
hadoop
大数据
分布式
hadoop
3.3.4安装及启动
1.虚拟机的安装此处我选择的是VMware,激活码可以百度搜索,安装过程比较缓慢,需要耐心等待---------------------------------------------------------------------------------------------------------------------------------2.创建新的虚拟机点击创建虚拟机,如果已经创建,
printcsr
·
2023-12-16 12:45
学习
kafka常用命令
/bin/kafka-console-producer.sh--broker-listdn02.
hadoop
.cn:6667,dn03.
hadoop
.cn:6667,dn04.
hadoop
.cn:6667
wind_103
·
2023-12-16 12:23
ElasticSearch与HBase的分布式存储设计
本文内容覆盖如今两大非结构化数据库之间的区别详情介绍从各个角度详细对比1.官方定位HBase是
Hadoop
数据库,是一个分布式、可扩展的大数据存储。
不学会Ⅳ
·
2023-12-16 09:32
分布式
elasticsearch
hbase
Hive建表语句
CREATEDATABASEIFNOTexistsmyhivebook2COMMENT'数据库测试';--创建数据库并指定路径CREATEDATABASEIFNOTexistsmyhivebook3LOCATION'/
hadoop
xinxinyydss
·
2023-12-16 08:58
hive
hadoop
数据仓库
Kafka快速实战与基本原理详解
Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeeper协调的分布式消息系统,它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于
hadoop
Memory_2020
·
2023-12-16 06:08
中间件
kafka
分布式
华为大数据开发者教程知识点提纲
一、线下处理1.离线处理方案数据支持:HDFS调度:YARN收入:Flume,sqoop,loader处理:Mapreduce,SparkSql,spark,hive(,Flink)2.
Hadoop
Namenode
qq_1418269732
·
2023-12-16 06:08
大数据
初识大数据应用,一文掌握大数据知识文集(1)
06、请列出正常工作的
hadoop
集群中
hadoop
都需要启动哪些进程,他们的作用分别是什么?07、KafkaUtils.cr
普修罗双战士
·
2023-12-16 06:22
大数据专栏
大数据
数据分析
数据仓库
数据挖掘
database
数据库开发
阿里云
ERROR sqoop.Sqoop: Got exception running Sqoop: java.lang.RuntimeException: java.lang.RuntimeExcepti...
CONVERT_TO_NULL','EXCEPTION'or'ROUND'.Thevalue'convertToNull'isnotacceptable.解决:--connectjdbc:mysql://
hadoop
00
weixin_30695195
·
2023-12-16 05:47
java
大数据
数据库
使用sqoop操作HDFS与MySQL之间的数据互传
一,数据从HDFS中导出至MySQL中1)开启
Hadoop
、mysql进程start-all.sh/etc/init.d/mysqldstart/etc/init.d/mysqldstatus2)将学生数据
冬瓜的编程笔记
·
2023-12-16 05:44
大数据
sqoop
hdfs
mysql
Win10 IDEA连接虚拟机中的
Hadoop
集群(进来保你成)
目录引言:环境:前提:实现:测试结语:问题引言:分布式课程要求使用IDE(IDEA、Eclipse)来编写程序直接对
Hadoop
集群进行文件操作,目前关于IDEA连接
Hadoop
集群的教程,良莠不齐,根据多个教程完成了
小小小秃头
·
2023-12-16 05:24
intellij-idea
hadoop
eclipse
【
Hadoop
-Cos】存储对象Cos通过Java-SDK获取目录结构
com.qcloudcos_api5.6.133packagegaei.cn.x5l.x5lhive2cos.utils;importcom.qcloud.cos.COSClient;importcom.qcloud.cos.ClientConfig;importcom.qcloud.cos.auth.BasicCOSCredentials;importcom.qcloud.cos.auth.CO
bmyyyyyy
·
2023-12-16 05:45
Hadoop
hadoop
大数据
分布式
【
Hadoop
-Distcp】通过Distcp的方式进行两个HDFS集群间的数据迁移
【
Hadoop
-Distcp】通过Distcp的方式进行两个HDFS集群间的数据迁移1)Distcp工具简介及参数说明2)Shell脚本1)Distcp工具简介及参数说明【
Hadoop
-Distcp】工具简介及参数说明
bmyyyyyy
·
2023-12-16 05:45
Hadoop
hadoop
hdfs
【
Hadoop
-Yarn】Yarn的常用命令
【
Hadoop
-Yarn】Yarn的常用命令1)查看任务列表2)杀死任务3)查看日志4)根据Application状态过滤任务5)查询Container日志6)查看尝试运行的任务7)yarncontainer
bmyyyyyy
·
2023-12-16 05:15
Hadoop
hadoop
大数据
分布式
【
Hadoop
-CosDistcp-Distcp】通过命令方式将Cos中的数据迁移至HDFS,再将HDFS数据迁移至S3
【
Hadoop
-CosDistcp-Distcp】通过命令方式将Cos中的数据迁移至HDFS,再将HDFS数据迁移至S31)Shell脚本2)参数说明1)Shell脚本注意:此Shell脚本内置了按照sample_date
bmyyyyyy
·
2023-12-16 05:15
Hadoop
hadoop
hdfs
大数据
【
Hadoop
-Distcp】工具简介及参数说明
【
Hadoop
-Distcp】工具简介及参数说明1)概述2)适合的场景及其有点3)参数说明1)概述Distcp(分布式拷贝)是用于大规模集群内部和集群之间拷贝的工具。
bmyyyyyy
·
2023-12-16 05:15
Hadoop
hadoop
大数据
分布式
【
Hadoop
-Distcp】通过Distcp的方式迁移Hive中的数据至存储对象
【
Hadoop
-Distcp】通过Distcp的方式迁移Hive中的数据至存储对象1)了解Distcp1.1.Distcp的应用场景1.2.Distcp的底层原理2)使用Distcp4)S3可视化App
bmyyyyyy
·
2023-12-16 05:14
Hadoop
hadoop
hive
大数据
【
Hadoop
-OBS-Hive】利用华为云存储对象 OBS 作为两个集群的中间栈 load 文件到 Hive
【
Hadoop
-OBS-Hive】利用华为云存储对象OBS作为两个集群的中间栈load文件到Hive1)压缩文件2)上传文件到OBS存储对象3)crontab定时压缩上传4)从obs上拉取下来文件后解压缩
bmyyyyyy
·
2023-12-16 04:04
Hadoop
hadoop
hive
华为云
Spark编程实验一:Spark和
Hadoop
的安装使用
一、目的与要求1、掌握在Linux虚拟机中安装
Hadoop
和Spark的方法;2、熟悉HDFS的基本使用方法;3、掌握使用Spark访问本地文件和HDFS文件的方法。
Francek Chen
·
2023-12-16 04:32
Spark编程基础
spark
hadoop
大数据
启动YARN并运行MapReduce程序
之前已经搭建好了
Hadoop
集群,接下来在集群上启动YARN。
Manfestain
·
2023-12-16 03:38
FinallShell连接Ubuntu报错:java.net.ConnectException: Connection refused: connect 无法连接
服务的问题:#安装OpenSSH服务器和客户端sudoaptinstallopenssh-serveropenssh-client-y一定一定确保安装了上述ssh服务,可通过以下命令检查并对应返回值应该如下:
hadoop
m0_73815626
·
2023-12-16 03:13
ubuntu
服务器
linux
Anaconda+PyCharm创建环境及超
详细配置
指南,看这一篇就够了
文章目录前言为什么是PythonAnaconda介绍Anaconda安装Anaconda新建环境Anaconda包安装pipcondaAnaconda环境复制本地环境复制非本地环境复制pip安装包的非本地同步Conda其它常用命令PyCharm介绍PyCharm下载和安装PyCharm工程建立:使用condaPython入门全套学习资料附带源码:全套软件安装包整套零基础入门视频+课件笔记实战案例1
Python资源
·
2023-12-16 02:34
编程
程序员
Python
pycharm
ide
python
十六、YARN和MapReduce配置
1、部署前提(1)配置前提已经配置好
Hadoop
集群。
弦之森
·
2023-12-16 01:55
Hadoop
mapreduce
大数据
hadoop
hdfs
YARN
基于
Hadoop
平台的音乐推荐系统的设计与实现
收藏关注不迷路文章目录摘要一、相关技术和基本理论2.1相关技术2.1.1
Hadoop
集群2.1.2SpringBoot框架2.1.3Vue框架2.2开发环境和技术框架2.2.1技术框架2.2.2开发环境
QQ2743785109
·
2023-12-16 01:36
spark
python
java
hadoop
大数据
分布式
基于
Hadoop
毕业生就业择业数据分析的设计与实现
收藏关注不迷路文章目录摘要一、需求分析二、系统设计4.1系统总体功能设计三、系统实现四、结论摘要 本系统结合计算机系统的结构、概念、模型、原理、方法,在计算机各种优势的情况下,采用JAVA语言,结合SpringBoot框架与Vue框架以及MYSQL数据库设计并实现的。本毕业生就业择业数据分析主要包括系统生源质量指数管理、年份管理、学院管理、生源质量指数、就业率指数、就业状态指数等多个模块。它帮助
QQ2743785109
·
2023-12-16 01:36
java
hadoop
hadoop
数据分析
大数据
基于
Hadoop
的视频日志分析系统设计与实现
视频日志的收集和存储模2.1.2视频日志的处理模块2.1.3用户行为分析模块2.1.4用户行为分析模块2.2数据收集二、实验结果分析3.1数据采集3.2数据存储三、系统实现四、结论摘要 本文设计并实现了一种基于
Hadoop
QQ2743785109
·
2023-12-16 01:36
hadoop
java
hadoop
eclipse
大数据
单节点
hadoop
搭建
下载
Hadoop
-bin.*.tar.gz解压文件,配置
HADOOP
_HOME编辑文件etc/
hadoop
/
hadoop
-env.sh配置JAVA_HOME配置etc/
hadoop
/core-site.xml
曾阿伦
·
2023-12-16 00:04
hadoop
hadoop
大数据
分布式
flink yarn-session 启动失败retrying connect to server 0.0.0.0/0.0.0.0:8032
yarn-session.sh,会向resourcemanager的端口8032发起请求:但是一直无法请求到8032端口,触发重试机制会不断尝试备注:此问题出现时,我的环境ambari部署的HA高可用
hadoop
dogplays
·
2023-12-16 00:01
flink
hue的安装和
hadoop
集群整合
一、Hue概述HUE(
Hadoop
UserExperience)是一个开源的Apache
Hadoop
UI系统,由ClouderaDesktop演化而来,最后Cloudera公司将其贡献给Apache基金会的
五块兰州拉面
·
2023-12-16 00:15
#
hue
大数据
Hue安装部署
1Hue简介1.1Hue介绍Hue是一个开源的Apache
Hadoop
UI系统,最早是由ClouderaDesktop演化而来,由Cloudera贡献给开源社区,它是基于PythonWeb框架Django
chenlouzhen1603
·
2023-12-16 00:43
数据库
git
java
Spark+Kafka构建实时分析Dashboard案例
目录一、环境准备Ubuntu安装
Hadoop
安装Spark安装Kafka安装Python安装Python依赖库安装vscode安装Python工程目录结构二、数据处理和Python操作Kafka数据集数据预处理运行三
Hay Ha!
·
2023-12-15 22:40
python
大数据
分布式
kafka
spark
kafka学习笔记--安装部署、简单操作
教程(从入门到调优,深入全面)文章目录1安装部署1.1集群规划1.2集群部署2命令行操作2.1主题2.2生产者2.3消费者2.4消费者组1安装部署1.1集群规划这里采用的是三节点的kafka集群,名称为
hadoop
向着百万年薪努力的小赵
·
2023-12-15 22:54
#
Kafka学习--入门到调优
kafka
学习
笔记
大数据学习(一)-------- HDFS
已经有了很多框架方便使用,常用的有
hadoop
,storm,spark,flink等,辅助框架hive,kafka,es,sqoop,flume等。常见应用推荐系统,用户画像等。
大数据流动
·
2023-12-15 21:01
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他