E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习
Hadoop学习
之-Parquet
ApacheParquet关于Parquet1.Parquet的特点2.Parquet数据类型2-1.基本数据类型2-2.Parquet的逻辑类型2-3.嵌套编码3.Parquet文件格式4.Parquet的配置5.Parquet文件的读写5-1.Parquet文件的基本操作5-2.Parquet文件基于Avro的操作。5-3.投影schema关于Parquet传统的,关系型数据的列式存储比较容易
leonardy
·
2020-07-27 16:51
Hadoop
Hadoop
Eco
Parquet
hadoop学习
笔记---mapreduce的InputFormat
最近看了mapreduce的InputFormat总结一下!!!看一下InputFormat的用法PublicabstractclassInputFormat{publicabstractListgetSplit(JobContextcontext)throwsIOException,InterruptedException;publicabstractRecordReaderCreatRecor
HelpMe1991
·
2020-07-27 15:20
Hadoop学习
笔记0004——eclipse安装hadoop插件
Hadoop学习
笔记0004——eclipse安装hadoop插件1、下载hadoop-1.2.1.tar.gz,解压到win7下hadoop-1.2.1;2、如果hadoop-1.2.1中没有hadoop-eclipse-plugin
拾毅者
·
2020-07-15 17:06
Hadoop
Hadoop学习
笔记0005——centos下运行Hadoop实例
前提:*确保Hadoop安装成功*1、复制Hadoop自带的源码实例cp/usr/hadoop/src/examples/org/apache/hadoop/examples/WordCount.java/usr/hadoop/test2、创建一个classes文件夹,方便编译mkdirclasses3、编译WordCount.java文件javac-classpath/usr/hadoop/ha
拾毅者
·
2020-07-15 17:34
Hadoop
Hadoop学习
笔记0001——Hadoop安装配置
Hadoop配置主要事项1、保证Master和Slave能够ping通;2、配置/etc/hosts文件;3、能够ssh无密码切换各台主机;4、安装sun公司的jdk,在/etc/profile中设置好环境变量;5、下载Hadoop,安装、配置、搭建Hadoop集群;1.Hadoop简介Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Had
拾毅者
·
2020-07-15 13:57
Hadoop
开发人员学Linux(1):VirtualBox中安装CentOS7过程记录
自2011年以来,一直在学习一些有关Linux下的知识,包括Mono+XSP运行ASP.NET程序,搭建
Hadoop学习
环境、Nginx测试环境等。在虚拟机软件方面先后尝
周公
·
2020-07-15 12:19
Linux&Open
Source
工具及系统
开发人员学Linux
Hadoop学习
笔记(MR程序的几种提交运行模式)
本地模型运行在windows的eclipse里面直接运行main方法,就会将job提交给本地执行器localjobrunner执行----输入输出数据可以放在本地路径下(c:/wc/srcdata/)----输入输出数据也可以放在hdfs中(hdfs://weekend110:9000/wc/srcdata)在linux的eclipse里面直接运行main方法,但是不要添加yarn相关的配置,也会
Seo_sir
·
2020-07-15 10:04
Hadoop学习
笔记(五)—— 搭建Hadoop HA集群
文章目录三台虚拟机的集群节点规划搭建环境准备搭建HadoopHA集群配置core-site.xml文件配置hdfs-site.xml文件配置mapred-site.xml文件配置yarn-site.xml文件配置slaves文件配置hadoop-env.sh文件分发目录初次启动HadoopHA集群步骤效果验证问题三台虚拟机的集群节点规划服务器NameNodeDataNodeResourceMana
JCManZZ
·
2020-07-15 08:50
Hadoop
Hadoop学习
(一)初识hadoop
前段时间读完了谷歌的三大论文,现在开始正式学习hadoop,今天就先整理一下hadoop的一些基本要点。一.从起源开始聊起hadoop的起源也就是谷歌著名的三大论文,或者可以说是谷歌三大论文的开源实现。Hadoop的核心组件有三个:HDFS,HadoopMapReduce,HBase,分别是谷歌的GFS,GoogleMapReduce和BigTable的开源实现。另外,有趣的是,Hadoop名字不
沼泽鱼97
·
2020-07-15 06:56
视频教程-CM&CDH大数据运维官方课程-Hadoop
任大勇¥198.00立即订阅订阅后:请点击此处观看视频课程视频教程-CM&CDH大数据运维官方课程-
Hadoop学习
有效期:永
weixin_33379282
·
2020-07-15 04:14
视频教程-Hadoop大数据零基础入门课程-Hadoop
张伟洋¥19.00立即订阅订阅后:请点击此处观看视频课程视频教程-Hadoop大数据零基础入门课程-
Hadoop学习
有效期:永久观看学习时长:397分钟学习计划:7天难度:低「口碑讲师带队学习,让你的问题
学院导师-张伟洋
·
2020-07-15 04:41
Hadoop学习
之TextInputFormat分片逻辑探究
期望顺着上一篇文章《
Hadoop学习
之第一个MapReduce程序》中遗留的分片疑惑,探究TextInputFormat的分片逻辑。
superXX07
·
2020-07-15 03:27
Hadoop伪分布模式操作
摘要:本文介绍Hadoop伪分布模式操作,适合于
Hadoop学习
、开发和调试。关键词:Hadoop伪分布式文件配置启动Hadoop支持三种模式操作,分别是单机模式操作、伪分布模式操作和全分布模式操作。
陆勤
·
2020-07-15 02:29
Hadoop
视频教程:hadoop基础及演练 hadoop视频教程 hadoop从入门到精通的学习
最新在学习hadoop、storm大数据相关技术,发现网上hadoop、storm相关学习视频少之又少,更可恶的是不少机构使用段海涛老师Hadoop视频进行商业买卖,气愤至急,我这里整理了传智播客段海涛老师的
hadoop
zhangyangffffff
·
2020-07-15 01:33
【
Hadoop学习
之MapReduce】_18MR之InputFormat数据输入
文章目录一、切片与MapTask并行度决定机制二、Job提交流程源码三、FileInputFormat切片机制(一)FileInputFormat切片机制(二)FileInputFormat切片源码解析(input.getSplits(job))(三)案例分析(四)FileInputFormat切片大小的参数配置四、CombineTextInputFormat切片机制五、CombineTextIn
easy_sir
·
2020-07-14 20:59
Hadoop学习笔记
【分享】初学hadoop的心路历程
Hadoop学习
两步走:linux学习、
hadoop学习
。在接触hadoop之前我有java基础,为此我的计划是首先学习Linux,然后学习hadoop生态系统,为此学习hadoop第一步
大数据观察者
·
2020-07-14 18:59
项目实例:KNN预测电影网站用户性别(
Hadoop学习
笔记三)
通过学习《Hadoop大数据开发基础》这本书,整理了一下书本上的项目案例。让自己再梳理一下流程,也希望能给有需要的人提供一定的帮助,写的不好的希望大家提出来,一起进步。1学习目标理解KNN算法的原理。掌握以MapReduce编程实现KNN算法。掌握以MapReduce编程实现KNN分类器评价。2认识KNN算法2.1KNN算法简介KNN算法,全称是KNearestNeighbor算法,即K最近邻分类
Mecury_
·
2020-07-14 18:23
学习笔记
大数据
Hadoop学习
(10)-Sqoop
Sqoop文章目录Sqoop一、Sqoop简介二、Sqoop安装及环境配置三、Sqoop命令RDBMS到HDFSRDBMS到HiveHIVE/HDFS到RDBMS(导出数据)四、脚本打包一、Sqoop简介ApacheSqoop™是一种旨在有效地在ApacheHadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具。Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。二、
Loong1996
·
2020-07-14 18:48
大数据
hadoop学习
hadoop学习
学习内容地址:https://www.bilibili.com/video/av23858681?
Mr`Tan
·
2020-07-14 18:21
Cygwin
Hadoop学习
笔记—20.网站日志分析项目案例(一)项目介绍
Hadoop学习
笔记—20.网站日志分析项目案例(一)项目介绍网站日志分析项目案例(一)项目介绍:当前页面网站日志分析项目案例(二)数据清洗:http://www.cnblogs.com/edisonchou
layne_liang
·
2020-07-14 16:33
Hadoop
Hadoop学习
笔记—20.网站日志分析项目案例(二)数据清洗
Hadoop学习
笔记—20.网站日志分析项目案例(二)数据清洗网站日志分析项目案例(一)项目介绍:http://www.cnblogs.com/edisonchou/p/4449082.html网站日志分析项目案例
layne_liang
·
2020-07-14 16:33
Hadoop
hadoop学习
网站
http://hadoop.apache.org/docs/r2.7.3/hadoop-project-dist/hadoop-common/ClusterSetup.htmlbin/hdfsnamenode-format如果出现 Unsupportedmajor.minorversion51.0则需要在etc/hadoop_env.sh中exportJAVA_HOME=xxxxxjava7目录j
皮子2
·
2020-07-14 16:24
分布式
hadoop学习
-mahout-Bayes分类算法示例程序
最近在看《hadoop实战》(陆嘉恒),在练习运行贝叶斯分类算法的示例程序的时候老是报错。完美体现了:”书本里永远少一个环节“的真理。。。。首先在运行贝叶斯算法程序之前,运行环境要求:1、安装maven(书中没提到的)2、安装mahout3、安装hadoop关于2,3的安装方式可以参考书本里或者网上的方法。下面说说安装maven过程,网上很多是直接下载tar包,然后解压出来。http://apac
我非英雄
·
2020-07-14 15:39
Hadoop
hadoop学习
过程(一)
内容提示:——双系统安装(Ubuntu)——Hadoop伪分布式安装——Ubuntu下eclipse的下载安装与配置——eclipse中Maven插件的下载安装与配置——eclipse中hadoop插件的下载安装与配置——HDFSbash命令——HDFSJavaAPI基本编程注:Ubuntu安装与卸载mysql,jdk,eclipse,tomcat,workbench参考链接:https://bl
lln_lln
·
2020-07-14 14:08
大数据hadoop
C#
Hadoop学习
笔记(七)—C#的云计算框架借鉴(下)
在上篇里,我们主要讨论了,这个系统怎样处理大数据的“读”操作,当然还有一些细节没有讲述。下篇,我们将主要讲述,“写”操作是如何被处理的。我们都知道,如果只有“读”,那几乎是不用做任何数据同步的,也不会有并发安全问题,之所以,会产生这样那样的问题,会导致缓存和数据库的数据不一致,其实根源就在于“写”操作的存在。下面,让我们看一看,当系统需要写一条数据的时候,又会发生怎样的事情?同样,我们还是以fri
直男250
·
2020-07-14 08:00
C#
Hadoop云计算
初探与思考(备忘)
hadoop相关(以期为单位)
学习Hadoop不错的系列文章1)
Hadoop学习
总结(1)HDFS简介地址:http://forfuture1978.iteye.com/blog/615033(2)HDFS读写过程解析地址:http
this_heart_add_add
·
2020-07-14 07:54
毕设进度
快速学习hadoop只有这些基础可不行
趁着学校放假的时间,写了一些
hadoop学习
分享的文章。刚开始写的几篇稍微有点乱,其中有一篇就是在说学习hadoop需要什么样基础的。所谓的难不会,会不难,必然也是建立你
adnb34g
·
2020-07-14 07:39
hadoop
hadoop学习
笔记之hadoop伪分布集群搭建(二)
本次hadoop伪分布搭建环境:Windows10_64位+VMware9.0+Centos6.4(32位)默认以上环境已经配置好,下面开始进行hadoop伪分布集群安装......============================================================内容如下:一、给主机服务器(Centos6.4)配置IP地址二、安装jdk,并配置环境变量三、安装
YF_Li123
·
2020-07-14 06:52
hadoop学习笔记
hadoop学习
篇-ubuntu安装
开始记录学习hadoop特此记录,后续会持续更新立此贴!!!我采用的是vmware-workstation-full1413,虚拟化工具,可以按自己的喜好选择虚拟化工具百度云提取地址:https://pan.baidu.com/s/1usazk0KxGUdliLxyI0ymTg提取密码:md3olinux选择的版本是:ubuntu-18.04.2-desktop-amd64百度云地址:https:
H90P0820
·
2020-07-14 04:30
hadoop
ubuntu
vmware
hadoop
Hadoop学习
笔记(1)——单机版搭建
Hadoop是一个分布式计算框架,适用于离线的海量信息批处理,大文件日志分析等,可以在大量廉价硬件设备组成的集群上运行应用程序,并未应用程序提供一组稳定可靠的接口,旨在构建一个具有高可靠性和良好扩展性的分布式系统。Hadoop的核心是HDFS(HadoopDistributedFileSystem),Mapreduce和Hbase,他们分别是Google云计算核心技术GFS,Mapreduce和B
steve涛
·
2020-07-14 02:25
Hadoop
个人
hadoop学习
总结:Hadoop集群+HBase集群+Zookeeper集群+chukwa监控(包括单机、伪分布、完全分布安装操作)
环境介绍:虚拟机四个:hadoop-marsterhadoop-salve1hadoop-salve2hadoop-salve3===========================1.Hadoop===========================================================================================Linux下创建伪分
阳小良
·
2020-07-14 01:11
hadoop
原博文链接
hadoop学习
总结http://924389979.iteye.com/admin/blogs/2081960关于hadoop完全分布式集群搭建http://924389979.iteye.com/admin
龙少侠
·
2020-07-13 23:10
Hadoop学习
之路(七)Hadoop集群shell常用命令
Hadoop常用命令启动HDFS集群[hadoop@hadoop1~]$start-dfs.shStartingnamenodeson[hadoop1]hadoop1:startingnamenode,loggingto/home/hadoop/apps/hadoop-2.7.5/logs/hadoop-hadoop-namenode-hadoop1.outhadoop2:startingdata
weixin_34186950
·
2020-07-13 18:24
Hadoop学习
(二) Hadoop配置文件参数详解
Hadoop运行模式分为安全模式和非安全模式,在这里,我将讲述非安全模式下,主要配置文件的重要参数功能及作用,本文所使用的Hadoop版本为2.6.4。etc/hadoop/core-site.xml参数属性值解释fs.defaultFSNameNodeURIhdfs://host:port/io.file.buffer.size131072SequenceFiles文件中.读写缓存size设定范
weixin_34186931
·
2020-07-13 18:52
hadoop学习
笔记(三)——MapTask和ReduceTask
MapTask和ReduceTask我们知道每一个Task都对应着一个jvm的执行,但是每一个Task都是在Child进程中执行的!我们来看一下Child类的主方法(源代码)publicstaticvoidmain(String[]args)throwsThrowable{LOG.debug("Childstarting");finalJobConfdefaultConf=newJobConf()
iteye_7298
·
2020-07-13 06:42
hadoop
hadoop
MapTask
ReduceTask
hadoop学习
心得之安装01 hadoop安装
下载hadoop安装包http://www.apache.org/dyn/closer.cgi/hadoop/core/下载最新的将hadoop安装包hadoop-0.20.1.tar.gz解压到D:\hadoop\接下来,需要修改hadoop的配置文件,它们位于conf子目录下,分别是hadoop-env.sh、core-site.xml、hdfs-site.xml和mapred-site.xm
iteye_12579
·
2020-07-13 05:29
hadoop
Hadoop学习
(三)Hadoop Shell常用命令
我用已经搭建好的Hadoop集群做命令的展示,首先要在hadoop路径下的bin目录下进行查看Hadoop文件./hadoopfs-ls/Found3itemsdrwxr-xr-x-hadoopsupergroup02019-04-1816:41/hbase001drwxrwx----hadoopsupergroup02019-04-0216:39/tmpdrwxr-xr-x-hadoopsupe
cuibin1991
·
2020-07-13 03:35
Hadoop
hadoop学习
(三)----hadoop2.x完全分布式环境搭建
今天我们来完成hadoop2.x的完全分布式环境搭建,话说学习本来是一件很快乐的事情,可是一到了搭环境就怎么都让人快乐不起来啊,搭环境的时间比学习的时间还多。都是泪。话不多说,走起。1准备工作开工之前先说一下我们的机器环境:一共是4台主机,主机1,2,3都是从master克隆过来的:主机名IP用户hadoopmaster192.168.131.128hadoophadoopslaver1192.1
a2225791
·
2020-07-13 02:51
hadoop学习
-海量日志分析(提取KPI指标)
1、Web日志分析从Web日志中,我们可以获取网站各类页面的PV值(PageView,页面访问量),访问IP;或者是用户停留时间最长的页面等等,更复杂的,可以分析用户行为特征。在Web日志中,每条日志都代表用户的一次访问行为,以下面的一条日志为例子:60.208.6.156--[18/Sep/2013:06:49:48+0000]"GET/wp-content/uploads/2013/07/rc
文宇肃然
·
2020-07-12 15:11
hadoop解决方案
Hadoop学习
笔记——安装Hadoop
sudomv/home/common/下载/hadoop-2.7.2.tar.gz/usr/localsudotar-xzvfhadoop-2.7.2.tar.gzsudomvhadoop-2.7.2hadoop#改个名在etc/profile文件中添加exportHADOOP_HOME=/usr/local/hadoopexportPATH=.:$PATH:$JAVA_HOME/bin:$HAD
weixin_34238642
·
2020-07-12 09:54
二十六、
Hadoop学习
笔记————Hadoop Yarn的简介复习
1.介绍YARN(YetAnotherResourceNegotiator)是一个通用的资源管理平台,可为各类计算框架提供资源的管理和调度。之前有提到过,Yarn主要是为了减轻Hadoop1中JobTracker的负担,对其进行了解耦。现在通常都会使用HadoopYarn,因为其稳定性更加优秀,YARN是对MapreduceV1重构得到的,有时候也称为MapReduceV2。2.YARN体系架构首
weixin_30627381
·
2020-07-12 06:12
Hadoop学习
笔记——WordCount
1.在IDEA下新建工程,选择fromMevanGroupId:WordCountArtifactId:com.hadoop.1stProjectname:WordCount2.pom.xml文件4.0.0WordCountcom.hadoop.1st1.0-SNAPSHOTapachehttp://maven.apache.orgorg.apache.hadoophadoop-core1.2.1
weixin_30502965
·
2020-07-12 06:46
二、
Hadoop学习
笔记————架构学习
1.成百上千台服务器组成集群,需要时刻检测服务器是否故障2.用流读取数据更加高效快速3.存储节点具有运算功能,省略了服务器之间来回传数据的网络带宽限制4.一次写入,多次访问,不修改数据5.多平台namenode:master,负责总体调度,处理协调请求等(一个集群只能有一个namenode,但是可以多个集群组成一个更大的集群,这时就有多个namenode,这时的namenode有两种状态,一种叫a
weixin_30300225
·
2020-07-12 05:54
hadoop学习
笔记——NO.6_MapReduce_1
hadoop学习
笔记——NO.6_MapReduce_11.MapReduce原理篇(1)MapReduce是一个分布式运算程序的编程框架,是用户开发”基于hadoop的数据分析应用”的核心框架。
蔡茂昌
·
2020-07-12 04:05
hadoop学习笔记
hadoop学习
笔记——NO.5_HADOOP分布式文件系统HDFS
Hadoop分布式文件系统HDFSHDFS前言设计思想分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析在大数据系统中作用为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务重点概念:文件切块,副本存放,元数据HDFS的概念和特性首先,它是一个文件系统,用于存储文件,通过统一的命名空间——目录树来定位文件。其
蔡茂昌
·
2020-07-12 04:04
hadoop学习笔记
Hadoop学习
笔记——哪些场景适用,哪些不适用。
Hadoop不是万能的,有些场景适用,有些不适用。Hadoop设计的目的主要包括下面几个方面,也就是所谓的适用场景:1:超大文件可以是几百M,几百T这个级别的文件。2:流式数据访问Hadoop适用于一次写入,多次读取的场景,也就是数据复制进去之后,长时间在这些数据上进行分析。3:商业硬件也就是说大街上到处都能买到的那种硬件,这样的硬件故障率较高,所以要有很好的容错机制。接下来说说不适用的场景:1:
spark____
·
2020-07-11 23:48
Hadoop
Hadoop学习
笔记——01
Hadoop提供了一个稳定的共享存储和分析系统。存储由HDFS实现,分析由MapReduce实现。虽然Hadoop还有其他功能,但这些是它的核心所在。Hadoop思想来源于Google的三篇论文:(1)Google-File-System(提取码:q6o2)(2)Google-MapReduce(提取码:76hk)(3)Google-Bigtable(提取码:6rtp)Hadoop的子项目:(1)
封号剑客张
·
2020-07-11 19:25
大数据
hadoop学习
笔记(五)MapReduce常见实例二:排序(一次排序、二次排序、倒排索引)
目录一次排序MapReduce的默认排序规则Map、Reduce任务中Shuffle和排序的过程流程分析任务描述代码执行结果二次排序任务描述过程分析代码执行结果倒排索引任务描述设计思路代码执行过程执行结果一次排序熟悉MapReduce的人都知道,排序是MapReduce的天然特性!在数据达到reducer之前,MapReduce框架已经对这些数据按键排序了。MapReduce的默认排序规则它是按照
晴是有风
·
2020-07-11 17:01
hadoop
Hadoop学习
笔记——集群搭建
学习视频:https://www.bilibili.com/video/BV164411Z7cR安装:VMware:https://www.cnblogs.com/nongzihong/p/10475753.htmlCentOS安装:https://blog.csdn.net/babyxue/article/details/80970526Xshell官方下载连接:https://www.nets
管妖妖
·
2020-07-11 09:00
大数据
Eclipse下
Hadoop学习
笔记——MapReduce过程及相关类使用学习
为了分析MapReduce实际过程,不重写map和reduce方法,查看Reducer输出结果,分析和学习相关类;开发环境Eclipse,Ubuntu10.04,Hadoop1.1.2完全分布模式,其中hadoop1.1.2的Eclipse插件可以在我的资源中下载;输入文件为一个.txt文件。packageorg.cqut.hadoop;importjava.io.IOException;impo
Benboerba_
·
2020-07-10 22:51
Java
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他