E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
#wordcount
MapReduce
wordcount
案例测试代码
pom.xml导包:org.apache.hadoophadoop-common2.7.5org.apache.hadoophadoop-client2.7.5org.apache.hadoophadoop-hdfs2.7.5org.apache.hadoophadoop-mapreduce-client-core2.7.5junitjunitRELEASEjunitjunitRELEASEorg
桑丘紫言
·
2023-04-16 17:38
大数据
MapReduce学习2-1:以官方
wordcount
实例为例的MapReduce程序学习
1实例演示与源码jar包反编译1.1
wordcount
实例运行测试1.2jar包反编译2hadoop的序列化类型2.1hadoop序列化类型解析2.1hadoop序列化类型解析常用序列化类型及其与Java
愿你被这个世界温暖相待
·
2023-04-16 17:07
#
MapReduce基础
mapreduce
hadoop
jar
big
data
java
MapReduce经典案例--
WordCount
代码(实测可以运行)
MapReduce经典案例--
WordCount
代码一.MapReduce工作的三阶段1.Map阶段map阶段将要处理的任务切分成一个个的MapTask,每个MapTask各自计算自己负责计算的内容,也就是将计算分布式
夜空Sora
·
2023-04-16 17:37
java大数据处理
hadoop
大数据
分布式
mapreduce
java
MapReduce经典案例
wordcount
DriverpackageMapReducer.
wordcount
;importorg.apache.hadoop.fs.Path;importorg.apache.hadoop.io.IntWritable
郝大侠001
·
2023-04-16 17:36
大数据基础
大数据基础
Hadoop MapReduce测试word count功能
在hadoop的mapreduce目录下自带有一个hadoop-mapreduce-examples-2.7.5.jar(官方已经为我们写好了用java实现
wordcount
的jar)可以用来测试
wordcount
QYHuiiQ
·
2023-04-16 17:04
大数据之Hadoop
hadoop
MapReduce之
WordCount
案例实操
目录前期准备:本机测试:mapper阶段:Reduce阶段:Driver类:集群测试:前期准备:因为MapReduce中案例比较多,所以需要单独创建一个工程准备工作创建工程后先改maven仓库的地址(创建工程后默认为idea自带的仓库**提示在你打开别的项目后,在你重新打开本项目的时候,maven会改回idea的maven)让后在项目的src/main/resources目录下,新建一个文件,命名
小唐同学(๑><๑)
·
2023-04-16 17:02
Hadoop
maven
java
mapreduce
(大数据开发随笔9)Hadoop 3.3.x分布式环境部署——全分布式模式
索引完全分布式模式守护进程布局集群搭建准备总纲配置文件格式化集群启动集群集群控制命令集群启停进程查看启动日志查看集群常见问题案例演示:
WordCount
完全分布式模式分布式文件系统中,HDFS相关的守护进程也分布在不同的机器上
脑汁
·
2023-04-16 13:58
hadoop
大数据
分布式
Spark 案例实操(Spark Streaming之
WordCount
)
SparkStreaming是什么SparkStreaming用于流式数据的处理。SparkStreaming支持的数据输入源很多,例如:Kafka、Flume、Twitter、ZeroMQ和简单的TCP套接字等等。数据输入后可以用Spark的高度抽象原语如:map、reduce、join、window等进行运算。而结果也能保存在很多地方,如HDFS,数据库等。和Spark基于RDD的概念很相似,
好好踢球啦
·
2023-04-15 00:29
spark
big
data
大数据
SparkStreaming
WordCount
入门案例
packagecom.lqs.sparkstreamingimportorg.apache.spark.SparkConfimportorg.apache.spark.streaming.dstream.{DStream,ReceiverInputDStream}importorg.apache.spark.streaming.{Seconds,StreamingContext}/***@Auth
小雏菊的成长
·
2023-04-15 00:29
大数据开发相关技术学习笔记
spark
big
data
后端
大数据
SparkStreaming入门+
WordCount
案例
SparkStreaming入门+
WordCount
案例1.SparkStreaming概述1.1离线和实时的概念1.2批量和流式的概念1.3SparkStreaming是什么1.4SparkStreaming
布莱恩特888
·
2023-04-15 00:28
Spark
streaming
spark
1.Spark Streaming基础—Spark Streaming架构图、背压机制、
WordCount
案例实操、
WordCount
解析
本文目录如下:第1章SparkStreaming概述1.1SparkStreaming是什么1.2SparkStreaming架构1.2.1架构图1.2.2背压机制第2章Dstream入门2.1
WordCount
页川叶川
·
2023-04-15 00:50
Spark
Streaming学习笔记
spark
big
data
scala
第七课 大数据技术之Spark-SparkStreaming
Spark-SparkStreaming文章目录第七课大数据技术之Spark-SparkStreaming第一节SparkStreaming概述1.1SparkStreaming介绍1.2SparkStreaming架构1.3
WordCount
道教儒佛电磁波
·
2023-04-15 00:49
spark
Flink入门
WordCount
无界流处理实现
新建类:packagetest.yh;importorg.apache.flink.api.common.typeinfo.Types;importorg.apache.flink.api.java.tuple.Tuple2;importorg.apache.flink.streaming.api.datastream.DataStreamSource;importorg.apache.flink
QYHuiiQ
·
2023-04-14 04:27
大数据之Flink
flink
大数据
Flink入门
WordCount
有界流处理实现
前面的其他配置参考上一篇批处理中的配置,这里就只记录下类部分。新建类:packagetest.yh;importorg.apache.flink.api.common.typeinfo.Types;importorg.apache.flink.api.java.tuple.Tuple2;importorg.apache.flink.streaming.api.datastream.DataStre
QYHuiiQ
·
2023-04-14 04:56
大数据之Flink
flink
java
大数据
Linux下打包运行MR程序
1.编写MR程序;[用find命令找到hadoop官方自带的
WordCount
.java]2.编译xx.java源文件【javac
WordCount
.java】3.打包jar【jar-cvf
WordCount
.jar
一叶知秋秋秋秋秋秋
·
2023-04-13 22:48
hadoop单机版安装
文章目录1.将安装包hadoop-3.1.3.tar.gz上次至linux中2.进行解压操作3.修改目录名称4.配置环境变量5.使用官方提供的jar包实现
wordcount
案例1.将安装包hadoop-
三月枫火
·
2023-04-13 04:37
Linux
大数据
hadoop
大数据
mapreduce
spark-submit 错误: ava.lang.ClassNotFoundException:
WordCount
在eclipse上编了个简单Scala程序,code如下packagespark.
wordcount
importorg.apache.spark.SparkContextimportorg.apache.spark.SparkContext
飞鸿踏雪Ben归来
·
2023-04-13 04:56
Spark
eclipse
scala
spark
提交Hadoop作业失败,报错Connection refused
如下,[root@sparkmasterexamples]#hadoopjarmy
wordcount
.jar
WordCount
/root/input/.
飞鸿踏雪Ben归来
·
2023-04-13 04:55
hadoop
使用minicluster给hadoop程序做单元测试(windows环境)
使用maven管理依赖的话,入门的HelloWorld级的程序,
WordCount
,需要的依赖有:junithadoop-commonhadoop-mapreduce-client-jobclienthadoop-miniclus
cdarling
·
2023-04-12 17:08
如何看jar包里的代码
以hadoop-mapreduce的
wordcount
为例,效果杠杠的
wowYuXuan808
·
2023-04-12 15:15
Hadoop系列之MR入门代码
一、MR程序基本思路以经典的
wordcount
为例,新建一个words文本:hi,mynameisjustinhello,thisisacathowoldareyouriamfinethankyouhi
wujustin
·
2023-04-12 05:44
Scala编程题
Flink-Scala编程1、求出1-100之间的奇数之和2、定义一个int类型变量接收一个大于100的三位数,求出100到该数字之间满足如下要求的数字之和:3、编写
wordcount
程序(附idea中
向着太阳,向着光
·
2023-04-12 05:55
spark
Scala
scala
10.大数据学习之旅——hive2
举个
wordcount
的入门例子,它的map阶段就是形成(“aaa”,1)的形式,然后在reduce阶段进行value相加,得出“aaa”出现的次数。
零零天
·
2023-04-11 19:18
大数据学习之旅
大数据
大数据
hive
sqoop
大数据周会-本周学习内容总结07
01【hadoop】1.1【编写集群分发脚本xsync】1.2【集群部署规划】1.3【Hadoop集群启停脚本】02【HDFS】2.1【HDFS的API操作】03【MapReduce】3.1【P077-
WordCount
延锋L
·
2023-04-11 19:44
大数据
学习
大数据
hadoop
hdfs
MapReduce
flink 1.10.1 java版本sql OverWindow示例(每事件出结果)
本文的基础环境可以参考flink1.10.1java版本
wordcount
演示(nc+socket)overwindow的处理方式是每接收到一条数据,都进行一次计算输出。
程序猿(攻城狮)
·
2023-04-11 09:01
大数据技术
java
flink
sql
Windows 安装配置 PySpark 开发环境(详细步骤+原理分析)
Python开发Spark的环境配置详细步骤1.1Windows配置python环境变量1.2Windows配置spark环境变量1.3Python中安装py4j1.4Python中安装PySpark模块
WordCount
D0glrq
·
2023-04-11 03:23
windows
python
开发语言
【多线程与高并发(锁)】2、什么时候需要加锁
1、多线程操作共享变量可能导致的问题首先,看下面的代码:objectLockDemo{var
wordCount
=10defadd
WordCount
(count:Int):Unit={
wordCount
+
syb18810107241
·
2023-04-10 02:52
多线程与高并发
Scala
锁
SparkSQL、DSL、sparkSQL与rdd相互转换
目录一、导入环境依赖二、
WordCount
三、读取各种格式的文件1、csv:文本格式2、json格式3、jdbc连接数据库4、parquet压缩文件四、DSL一、导入环境依赖org.apache.sparkspark-sql
宇文心亘
·
2023-04-10 01:49
spark
四、实战过程
1、将java文件编译成class:2、将class打成jar包【jar-cvf*****.jar*.class】3、执行【hadoopfs-putinput/*input_
wordcount
/】:将input
骑猴摘月亮
·
2023-04-09 15:53
spark第三章:工程化代码
系列文章目录spark第一章:环境安装spark第二章:sparkcore实例spark第三章:工程化代码文章目录系列文章目录前言一、三层架构二、拆分
WordCount
1.三层拆分2.代码抽取总结前言我们上一次博客
超哥--
·
2023-04-09 13:47
spark
spark
大数据
scala
spark第二章:sparkcore实例
系列文章目录spark第一章:环境安装spark第二章:sparkcore实例文章目录系列文章目录前言一、idea创建项目二、编写实例1.
WordCount
2.RDD实例3.Spark实例总结前言上次我们搭建了环境
超哥--
·
2023-04-09 13:16
spark
spark
scala
大数据
sparkStreaming:实时流数据详解
目录一、概述二、
wordCount
示例三、初始化StreamingContext四、DStreams(离散数据流)五、输入DStream和接收器BasicsourcesFileStreamsCustomReceivers
小五家的二哈
·
2023-04-09 12:11
大数据
spark
streaming
Mapreduce:概述 + 实例:
WordCount
+ yarn
MapReduce采用的是“分而治之”的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个从节点共同完成,然后通过整合各个节点的中间结果,得到最终结果。简单来说,MapReduce就是”任务的分解与结果的汇总“。1.MapReduce的工作原理在分布式计算中,MapReduce框架负责处理了并行编程里分布式存储、工作调度,负载均衡、容错处理以及网络通信等复杂问题,现在我们把处理过程高度抽象
xjfy.h
·
2023-04-09 05:15
MapReduce
WordCount
代码和编码规范详细说明
来源:https://www.cnblogs.com/qingyunzong/p/8573001.html1.
WordCount
代码自带的
wordCount
程序执行本地执行hadoopjarhadoop-mapreduce-examples
abcdggggggg
·
2023-04-09 05:42
大数据
Hadoop
大数据
hadoop
mapreduce
wordcount
mr
wordcount
Hadoop MapReduce各阶段执行过程以及Python代码实现简单的
WordCount
程序
视频资料:黑马程序员大数据Hadoop入门视频教程,适合零基础自学的大数据Hadoop教程文章目录Map阶段执行过程Reduce阶段执行过程Python代码实现MapReduce的
WordCount
实例
VenYy
·
2023-04-09 05:09
大数据平台
hadoop
mapreduce
python
spark1.6
WordCount
排序取Top 10
对于这个话题的帖子,网上一大堆,大多也就是相互copy,转载。本文当然不会落入俗套,网上通用的实体,不仅本身存在一定的问题,更是不能在生产上运行。废话不多说,先列举网上最多的一种实现:valdataRDD=sparkContext.textFile("data")dataRDD.flatMap(_.split(",")).map((_,1L)).reduceByKey((a,b)=>a+b).so
凡尔Issac
·
2023-04-09 02:49
大数据-学习实践-4MapReduce
)文章目录大数据-学习实践-4MapReduce1知识点2具体内容2.1MapReduce介绍2.2分布式计算介绍、原理2.2.1MapReduce原理剖析2.2.2Map2.2.3Reduce2.3
WordCount
yxyibb
·
2023-04-08 19:48
大数据
大数据
学习
hadoop
VirtualBox下安装3台Ubuntu虚拟机,并搭建Hadoop
beginner_Lee完成时间:2011-5-2312:15版本:v2.0摘要:本文介绍了在VirtualBox下安装3台Ubuntu虚拟机,并搭建Hadoop环境的基本步骤,最后运行了Hadoop自带example中的
wordcount
phucqu
·
2023-04-08 11:15
hadoop
ubuntu
虚拟机
input
terminal
output
【Scala】集合
Listlist运算符可变ListBufferSet集合不可变Set可变mutable.SetMap集合可变Map元组操作通用操作衍生集合操作计算函数排序sortedsortBysortWith计算高级函数实例
WordCount
岱宗夫如何、
·
2023-04-08 07:23
scala
大数据
大数据体系知识学习(二):
WordCount
案例实现及错误总结
文章目录1.当前环境2.相关信息2.1相关文件2.2相关流程3.运行代码4.运行结果5.运行错误情况5.1py4j.protocol.Py4JJavaError5.2JAVA_HOMEisnotset1.当前环境pyspark:版本号为3.1.2JAVA_JDK:版本号为1.8.0_333Hadoop:版本号为3.3.02.相关信息2.1相关文件words.txt如下helloworldhello
ZZY_dl
·
2023-04-08 00:39
大数据相关知识
大数据
学习
hadoop
spark第六章:SparkStreaming基本操作
:工程化代码spark第四章:SparkSQL基本操作spark第五章:SparkSQL实例spark第六章:SparkStreaming基本操作文章目录系列文章目录前言一、添加pom二、简单实例1.
WordCount
2
超哥--
·
2023-04-07 20:31
spark
spark
scala
大数据
大数据技术之Spark(五)——RDD持久化
一、什么是RDD持久化以
wordCount
为例,我们希望实现两个功能,最后一步不需要聚合操作,将mapRDD的结果放在不同的组中。
five小点心
·
2023-04-07 19:46
#
spark
spark
大数据
scala
Spark累加器与广播变量
,想要使用foreach来实现reduce的操作,结果发现结果为0valconf:SparkConf=newSparkConf().setMaster("local[*]").setAppName("
wordcount
Xsqone
·
2023-04-07 19:10
spark
大数据
C#第一次作业,C#或者java代码总行数、代码行数、代码空格行数、注释行数的统计
usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Text;usingSystem.Threading.Tasks;namespace
WordCount
Forms
nieshuangyan
·
2023-04-07 04:49
c#课程作业
代码
Flink从入门到精通之-05 DataStream API
Flink从入门到精通之-05DataStreamAPI我们在第2章介绍Flink快速上手时,曾编写过一个简单的词频统计(
WordCount
)程序,相信读者已经对Flink的编程方式有了基本的认识。
潘小磊
·
2023-04-06 19:36
#
flink
flink
java
jvm
mapreduce概念和案例(尚硅谷学习笔记)
目录MapReduce概念概述优点和缺点可编程组件
Wordcount
案例需求分析代码实现Combiner案例实现需求分析代码实现自定义序列化概述自定义序列化步骤手机号及总流量案例patition分区概述自定义分区手机号区分省市输出案例代码实现
JeremyHeria
·
2023-04-06 15:24
#
hadoop
mapreduce
big
data
hadoop
java
大数据
Pyspark 基础知识
文章目录1.PySpark简介2.PySpark应用程序2.1PySpark实现
WordCount
3.PySpark执行原理1.PySpark简介PySpark是Spark官方提供的一个Python类库
不忘初欣丶
·
2023-04-06 14:59
spark
spark
大数据
分布式
Spark基础学习笔记:Spark RDD案例分析
文章目录一、案例分析:SparkRDD实现单词计数(一)案例概述(二)实现步骤1、新建Maven管理的Spark项目2、添加Scala和Spark依赖3、创建
WordCount
对象4、上传Spark应用程序到
潘潘.tel
·
2023-04-06 14:37
spark
学习
spark学习2:spark运行基本架构
能够找到每个RDD的父RDD3.executorexecutor是驻守在各个工作节点中的一个进程,负责生成线程来执行分配给该工作节点的任务4.application程序员编写的一整个代码文件,比如一个
wordcount
hzp666
·
2023-04-05 19:37
spark
spark
大数据
[spark streaming] 状态管理 updateStateByKey&mapWithState
前言SparkStreaming7*24小时不间断的运行,有时需要管理一些状态,比如
wordCount
,每个batch的数据不是独立的而是需要累加的,这时就需要sparkStreaming来维护一些状态
达微
·
2023-04-05 10:23
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他