E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop&HDFS
Big Data 导论&
Hadoop&HDFS
BIGDATA课程笔记导论大数据的四大特征大量化、快速化、多样化、价值化大数据分析的三个特征全样而非抽样、效率而非精确、相关而非因果大数据处理模型:批处理:以“静止数据”为出发点,处理逻辑进来,算完后价值出去流数据:不动的是逻辑,“动态数据”进来,计算完后价值留下,原始数据加入“静止数据”,或索性丢弃其中批处理包括MapReduce模型大数据技术和工具NoSQL,notonlysql,模式自由、简
Tcoder-l3est
·
2022-12-01 11:15
课程学习
bigdata
hdfs
hadoop
mapreduce
kettle入门(三) 之kettle连接
hadoop&hdfs
图文详解
1引言:项目最近要引入大数据技术,使用其处理加工日上网话单数据,需要kettle把源系统的文本数据load到hadoop环境中2准备工作:1首先要了解支持hadoop的Kettle版本情况,由于kettle资料网上较少,所以最好去官网找,官网的url:http://wiki.pentaho.com/display/BAD/Configuring+Pentaho+for+your+Hadoop+Di
果木
·
2020-07-15 10:55
etl
ETL工具kettle入门
hadoop离线(
Hadoop&HDFS
)
hadoop离线(
Hadoop&HDFS
)hadoop狭义hadoopapache软件java语言是大数据的处理平台HDFS(hadoop分布式文件系统):大数据的分布式存储MapReduce(分布式计算框架
思故乡
·
2020-06-29 14:00
大数据离线
Hadoop&HDFS
知识点整理
创作之初最近抽时间看了下Hadoop权威指南一书,对原理有了更深刻的理解,顺便整理了一些重要的知识点,工作或面试中能用得上,需要的请收藏点赞。知识点整理1.尽量在计算节点上存储数据,以实现数据的本地快速访问,数据本地化特性是hadoop数据处理的核心。2.hadoop为每个分片构建一个map任务,小文件会导致大量的map任务。一个合理的分片大小趋向于HDFS的一个块的大小,默认是128MB。3.m
追风dylan
·
2020-06-23 17:47
分布式存储
Hadoop
hadoop
hdfs
kettle入门(三) 之kettle连接
hadoop&hdfs
图文详解
目录(?)[-]引言准备工作首先其次试验运行首先配置工作然后开发脚本工作备注 1引言: 项目最近要引入大数据技术,使用其处理加工日上网话单数据,需要kettle把源系统的文本数据load到hadoop环境中 2准备工作: 1首先 要了解支持hadoop的Kettle版本情况,由于kettle资料网上较少,所以最好去官网找,官网的url: http://wiki.pentaho.com/
lixuguang
·
2015-05-11 18:00
hadoop
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他