E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习积累
clickhouse基础介绍
clickhouse可以做用户行为分析,流批一体,clickhouse没有走
hadoop
生态,采用L
大大大大肉包
·
2023-11-19 18:56
clickhouse
clickhouse
数据库
2️⃣Zookeeper(动物管理员)
容错率低)的服务的软件,封装了大量复杂关键的技术(服务),将简单的接口(API)暴露,高效的使用Zookeeper,稳定性非常高在大数据生态圈,Zookeeper(动物管理员)是一个非常重要的基础技术,
Hadoop
WovJf
·
2023-11-19 17:40
zookeeper
分布式
云原生
4️⃣Hive
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
WovJf
·
2023-11-19 17:39
hive
数据仓库
Spark数据倾斜
1.什么是数据倾斜对
Hadoop
SparkFlink这
WovJf
·
2023-11-19 17:04
Spark
spark
大数据
分布式
大数据课程结构
1、第一阶段javaSE基础阶段-张一峰2、第二阶段-JavaWeb+数据库阶段-张3、第三阶段-大数据分布式架构-张一峰4、第四阶段-大数据
Hadoop
实战-张一峰5、第五阶段-大数据spark实战-
张一峰
·
2023-11-19 16:31
大数据
大数据
云计算课程设计基于
hadoop
的词频统计设计
云计算课程设计基于
hadoop
的词频统计设计实验报告http://链接:https://pan.baidu.com/s/1ujUAg4q1sZZwmyeeKrNirg提取码:maq7
安啦yy
·
2023-11-19 16:59
hadoop
big
data
hdfs
Hadoop
集群进行map词频统计
一、首先新建虚拟机二、配置静态IP1、首先查看虚拟网络编辑器查看起始IP2.1、修改静态IP输入指令:vi/etc/sysconfig/network-scripts/ifcfg-ens33修改BOOTPROTO=static增加IPADDR、NETWASK、GATEWAY、DNS12.2、输入指令:vi/etc/sysconfig/network增加以下两条2.3、输入指令:vi/etc/hos
陈信宇是大聪明
·
2023-11-19 16:29
hadoop
大数据
big
data
Hadoop
词频统计
这里写自定义目录标题前提制作JAR包启动
Hadoop
将wordfile1.txt上传到HDFS重新上传文件进行词频统计和注意事项HDFS常用命令前提1.安装了Linux系统,并且安装了
Hadoop
下的两个组件
weixin_49670340
·
2023-11-19 16:29
hadoop
Hadoop
第五章:词频统计
系列文章目录
Hadoop
第一章:环境搭建
Hadoop
第二章:集群搭建(上)
Hadoop
第二章:集群搭建(中)
Hadoop
第二章:集群搭建(下)
Hadoop
第三章:Shell命令
Hadoop
第四章:Client
超哥--
·
2023-11-19 16:29
hadoop
hadoop
大数据
分布式
HDFS 使用
Hadoop
中自带的词频统计程序,对数据集进行词频统计
实验题目:词频统计假设HDFS上有两个文件wordfile1.txt和wordfile2.txt(其他文件也行),运行
Hadoop
中自带的词频统计程序,对数据集进行词频统计。
码猿小菜鸡
·
2023-11-19 16:28
大数据
人工智能
hadoop
big
data
词频统计
hdfs
Hadoop
自带WordCount进行词频统计(mapreduce)
Hadoop
自带WordCount进行词频统计准备:安装好的
Hadoop
需要统计词频txt文件(用jieba分过词的链接:pycharm分词jieba结巴分词输出txt.step1启动
Hadoop
cd/
摸仙小蓝是人机
·
2023-11-19 16:57
wordcount
词频
hadoop
mapreduce
Hadoop
经典案例:词频统计
环境搭建参考:http://www.ityouknow.com/
hadoop
/2017/07/24/
hadoop
-cluster-setup.html词频代码参考:https://blog.csdn.net
AnotherBUPT
·
2023-11-19 16:55
大数据
hadoop
BUPT
eclipse连接
Hadoop
并实现词频统计(大数据分析)
1、简介Eclipse是一个集成开发环境(IDE),包含一个基工作区和定制环境的可扩展插件系统。大部分使用Java编写,Eclipse可以用来开发应用程序。通过各种插件,Eclipse也可以用于其他编程语言开发应用程序:Ada、ABAP、C、C++、COBOL、Fortran、Haskell、JavaScript、Lasso、Natural、Perl、PHP、Prolog、Python、Ruby、
小坏蛋儿&
·
2023-11-19 16:20
java
hadoop
eclipse
在
Hadoop
中进行简单的词频统计
在
Hadoop
中进行简单的词频统计1.建立WCMapper代码如下:importjava.io.IOException;importorg.apache.
hadoop
.io.LongWritable;importorg.apache.
hadoop
.io.Text
CB_creayblack
·
2023-11-19 16:20
hadoop
hadoop
java
大数据
mapreduce
Hadoop
调用MapReduce进行词频统计
Hadoop
调用MapReduce进行词频统计博客目录一.案例1.实验目的2.分析步骤二.前置准备1.传输文本文件2.环境搭建(1)使用VirtualBox虚拟机软件安装Ubuntu(2)在Ubuntu
MidnightFancy
·
2023-11-19 16:17
大数据
hadoop
ubuntu
mapreduce
eclipse
hdfs
Hadoop
学习总结(MapRdeuce的词频统计)
词频统计一、MapRdeuce的词频统计的过程二、编程过程1、Mapper组件WordcountMapper.javapackagecom.itcast.mrdemo;importorg.apache.
hadoop
.io.IntWritable
Qinqin.J
·
2023-11-19 16:12
学习
【
hadoop
】windows上
hadoop
测试环境的搭建步骤
一、下载
hadoop
安装包:点击下载解压。
七镜
·
2023-11-19 15:44
Hive插入数据警告:Hive-on-MR is deprecated in Hive 2 and may not be available in the future versions
Hive插入表数据持续等待警告问题解决1、问题描述2、原因分析3、问题解决1、问题描述启动
Hadoop
,使用hiveserver2启动Hive的JDBC服务并使用IDE连接到Hive,创建表成功,但是INSERT
对许
·
2023-11-19 14:42
#
Hadoop生态圈
#
Hive
#
数据湖仓
hive
mr
hadoop
3.Apache Hive 查询报错 FAILED: org.apache.
hadoop
.hive.ql.exec.mr.MapredLocalTask
版本CDH6.2.0Hive2.1.1-cdh6.2.0一、问题执行查询视图的sql报错:FAILED:ExecutionError,returncode3fromorg.apache.
hadoop
.hive.ql.exec.mr.MapredLocalTask
终回首
·
2023-11-19 14:18
大数据
#
Apache
Hive
hive
大数据
2023-Hive调优最全指南
本文基本涵盖以下内容:一、基于
Hadoop
的数据仓库Hive基础知识二、HiveSQL语法三、Hive性能优化四、Hive性能优化之数据倾斜专题五、HiveSQL优化十二板斧六、Hive面试题(一)七、
000X000
·
2023-11-19 13:43
数据仓库
性能测试和优化
HIVE
hive
hadoop
大数据
Hive调优最全指南
Hive 调优指南
Hive调优指南ApacheHive是一个基于
Hadoop
的数据仓库解决方案,用于查询和分析大量的结构化数据。为了提高Hive查询性能和效率,本文将介绍一些Hive调优的策略和方法。
小泽长不胖
·
2023-11-19 13:41
大数据
hive
hadoop
大数据
数仓开发面试题之
Hadoop
相关
提纲MapReduce原理,map数、reduce数的参数说一下mapjoin与reducejoinhivesql怎么优spark和hive的区别数据倾斜几种解决方式数据如何清洗说一下udf、udtf、udaf,集成的类、接口,怎么写hive文件存储格式,对比内外表区别hive执行的job数是怎么确定的cube、groupingsets、grouping__idorderby、sortby、dis
话数Science
·
2023-11-19 13:39
面试
大数据
hadoop
大数据
Hive 学习历程
Hive学习历程使用Hive时需要打开
Hadoop
集群以及hiveserver这里可以使用脚本来打开[
hadoop
@node02~]$all.shstart[
hadoop
@node02~]$hvservice.shstart
jasondde
·
2023-11-19 12:06
hive
学习
数据库
【大数据项目】基于大数据可视化的互联网设备可视化平台
SpringBoot项目案例推荐天码编程-SSM项目案例推荐天码编程-Python项目案例推荐天码编程-小程序项目案例推荐天码编程-大数据项目案例推荐文末获取源码项目名基于大数据可视化的互联网设备可视化平台技术栈
Hadoop
天码编程
·
2023-11-19 12:32
[Python项目]
[大数据可视化项目]
大数据
信息可视化
大数据之
hadoop
-hdfs知识通俗详解
NameNodeDataNode元数据持久化安全模式HDFS中的SNNSecondaryNameNode(SNN)Block的副本放置策略HDFS写流程HDFS读流程总结疑问分布式文件系统那么多,为什么
hadoop
shw12357
·
2023-11-19 10:27
hadoop
大数据之路-
Hadoop
-概述(2)
Hadoop
集群首先,区分下集群和分布式的概念。分布式结构就是将一个完整的系统,按照业务功能,拆分成一个个独立的子系统。
胡萝卜土豆
·
2023-11-19 10:27
大数据
hadoop
big
data
云计算
05-
Hadoop
01之HDFS
一、
Hadoop
介绍
Hadoop
分为三部分:Common、HDFS、Yarn、MapReduce(有点过时了)
Hadoop
生态圈:除了
hadoop
技术以外,还有hive、zookeeper、flume、
YuPangZa
·
2023-11-19 10:54
大数据
hdfs
hadoop
大数据
大数据基础设施Apache
Hadoop
简介
一、项目起源在数据量很大的情况下,单机的处理能力无法胜任,必须采用分布式集群的方式进行处理,而用分布式集群的方式处理数据,实现的复杂度呈级数增加。早在2003年的时候,Google就已经面对大于600亿的搜索量。但是数据的大规模处理技术还处在彷徨阶段。当时每个公司或者个人可能都有自己的一套工具处理数据。却没有提炼抽象出一个系统的方法。在海量数据处理的需求下,一个通用的分布式数据处理技术框架应运而生
chenhjia
·
2023-11-19 10:10
大数据
mapreduce
hadoop
hdfs
yarn
Hadoop
大数据学习线路图-单篇
入门知识对于我们新手入门学习
hadoop
的朋友来说,首先了解一下云计算和云计算技术是有必要的。
doers123
·
2023-11-19 10:06
hadoop
hadoop
大数据基础设施搭建 -
Hadoop
文章目录一、下载安装包二、上传压缩包三、解压压缩包四、配置环境变量五、测试
Hadoop
5.1测试
hadoop
命令5.2测试wordcount案例5.2.1创建wordcount输入文本信息5.2.2执行程序
m0_46218511
·
2023-11-19 10:33
大数据基础设施搭建
大数据
hadoop
Redis学习笔记
RDBMS、Tomcat、HTML、Linux、JDBC、SVN解决扩展性问题:Struts、Spring、SpringMVC、Hibernate、MyBatis解决性能问题:NoSQL、Java线程、
Hadoop
以我牛马为核
·
2023-11-19 10:40
学习笔记
redis
学习
笔记
Hadoop
编程——第三章:(3)Linux常用命令
概述命令属于死东西,属于多用多会,不用就忘的知识,孰能生巧;Tab键可以实现自动补全和提示,要合理使用;history命令可以显示历史执行记录,或者使用方向键来切换前后执行过的命令常用Linux命令包括:文件和目录管理命令磁盘空间命令文件压缩备份命令查看系统信息命令管理用户和权限的命令网络操作命令一、文件和目录管理命令pwd该命令的英文解释为printworkingdirectory(打印工作目录
罗伊女士
·
2023-11-19 09:26
Hadoop
Linux
linux
hadoop
服务器
工作流调度工具Airflow1.8搭建及使用
编写目的最近工作任务需要把原来使用Kettle的ETL流程迁移到
Hadoop
平台上,就需要找一个替代Kettle工作流部分的工具。
weixin_34195142
·
2023-11-19 09:44
数据库
shell
python
浅析图数据库 Nebula Graph 数据导入工具——Spark Writer
SparkWriter从
Hadoop
说起近年来随着大数据的兴起,分布式计算引擎层出不穷。
Hadoop
是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用。
NebulaGraph
·
2023-11-19 09:22
大数据开发:kafka集群搭建步骤示例
基于
Hadoop
的大数据技术生态当中,kafka在日志采集这个环节,提供重要的支持。今天的大数据开发学习分享,我们主要来讲讲在
Hadoop
集群上如何搭建和配置kafka集群。
成都加米谷大数据
·
2023-11-19 08:53
大数据实战平台环境搭建
大数据实战平台环境搭建一、创建
Hadoop
用户二、更新apt和安装Vim编辑器三、安装SSH和配置SSH无密码登录四、安装Java五、安装单机
Hadoop
六、
Hadoop
伪分布式安装七、HDFS常用命令八
ZShiJ
·
2023-11-19 08:13
虚拟机
hadoop
java
大数据
2023.11.18 -自用
hadoop
高可用环境搭建命令
启动
hadoop
高可用环境#1.先恢复快照到高可用环境#2.三台服务器启动zookeeper服务[root@node1~]#zkServer.shstart[root@node2~]#zkServer.shstart
白白的wj
·
2023-11-19 08:42
hadoop
大数据
分布式
2023.11.18
Hadoop
之 YARN
1.简介Apache
Hadoop
YARN(YetAnotherResourceNegotiator,另一种资源协调者)是一种新的
Hadoop
资源管理器,它是一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度
白白的wj
·
2023-11-19 08:41
database
hadoop
hive
sql
big
data
yarn
2023.11.18 -
hadoop
之zookeeper分布式协调服务
1.zookeeper简介ZooKeeper概念:Zookeeper是一个分布式协调服务的开源框架。本质上是一个分布式的小文件存储系统ZooKeeper作用:主要用来解决分布式集群中应用系统的一致性问题。ZooKeeper结构:采用树形层次结构,没有目录与文件之分,ZooKeeper树中的每个节点被称为—Znode。且树中的每个节点可以拥有子节点2.启动和配置环境变量在远程工具里发送三条命令[ro
白白的wj
·
2023-11-19 08:41
hadoop
zookeeper
大数据
分布式
sql
数据仓库
hive
2023.11.17
hadoop
之HDFS进阶
目录HDFS的机制元数据简介元数据存储流程:namenode生成了多个edits文件和一个fsimage文件edits和fsimage文件SecondaryNameNode辅助NameNode的方式:HDFS的存储原理写入数据原理:发送写入请求,获取主节点同意,开始写入,写入完成读取数据原理:发送读取请求,获取主节点同意,开始读取,读取完成HDFS安全机制HDFS归档机制HDFS垃圾桶机制分布式存
白白的wj
·
2023-11-19 08:35
hdfs
hadoop
大数据
sql
database
hive
redis 笔记
笔记概述技术分类解决功能性的问题:Java,Jsp,Tomcat,Html,RDMS,Linux解决扩展性的问题:Spring,SpringMVC,Mybatis解决性能的问题:NoSQL,Java线程,
Hadoop
nosql
jie_1024
·
2023-11-19 07:56
java
redis
基于
Hadoop
的绿色出行交通路线规划系统设计与实现开题报告
学院名称年级专业班级学生学号学生姓名指导教师工号指导教师姓名任务书题目最终题目基于
Hadoop
的绿色出行交通路线规划系统设计与实现本课题的总体设计目标:随着经济发展,交通需求不断增长,交通拥堵问题已经成为世界各国城市发展面临的重要问题
程序源码123
·
2023-11-19 07:46
开题报告
任务书
论文
hadoop
大数据
分布式
信息可视化
服务器
数据库
数据分析
ClickHouse的分片和副本
DataReplication|ClickHouseDocs1.1副本写入流程1.2配置步骤(1)启动zookeeper集群(2)在
hadoop
102的/etc/clickhouse-server/config.d
shangjg3
·
2023-11-19 05:27
ClickHouse
clickhouse
大数据
数据仓库
shell脚本写法(以zookeeper启动终止脚本为例)
1.在/bin目录下建立想要的脚本文件,以zookeeper为例[qurui@
hadoop
102~]$cd/bin#进入目录[qurui@
hadoop
102~]$sudovimzk.sh#打开文件,sudo
枫锦旧曾谙
·
2023-11-19 05:32
大数据
大数据
hadoop
zookeeper
《大数据时代》读书笔记
介绍了随之而来的
hadoop
大数据处理技术,同时通过各行业的例子说明了当今时代,数据增速超过以往任何一个时代,海量数据将会最终产生质变,改变这
Lucia夏天呀
·
2023-11-19 05:44
zookeeper简单应用&分布式锁实现
zookeeper的客户端原生客户端的使用Curatorzk简单的分布式锁实现Zookeeper的作用ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
Life journey
·
2023-11-19 04:06
框架专题
个人日记
zookeeper
分布式
HDFS架构
目录一,HDFS简介二、HDFS架构三、HDFS的工作机制一,HDFS简介①HDFS概念:
Hadoop
DistributedFileSystem,是
Hadoop
项⽬的核⼼⼦项⽬,是分布式计算中数据存储管理的基础
cx330上的猫
·
2023-11-19 04:29
hdfs
hadoop
架构
大数据之数据迁移sqoop的安装
1、sqoop的简介Sqoop是一种用于在Apache
Hadoop
和结构化数据存储(如关系型数据库)之间进行快速有效数据转移的工具。
bigdata从入门到放弃
·
2023-11-19 03:09
数据仓库
sqoop
hadoop
大数据
sqoop
hadoop
hive
数据库
数据仓库
数据分析
linux的免密登录
Hadoop
是一种分布式计算平台,由多台计算机组成的集群协同工作,实现数据存储、处理和分析等任务。在
Hadoop
集群中,对于不同节点之间的通信,需要进行身份验证和安全加密,以确保数据传输的安全性。
bigdata从入门到放弃
·
2023-11-19 03:38
hadoop
linux
linux
大数据
运维
密码学
hadoop
linux中
hadoop
伪分布搭建
1、什么是
hadoop
?
Hadoop
是一个开源的分布式数据处理框架,旨在处理大规模数据集并能够在普通硬件集群上实现高性能和可靠性。
bigdata从入门到放弃
·
2023-11-19 03:38
hadoop
linux
hadoop
运维
大数据
big
data
上一页
50
51
52
53
54
55
56
57
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他