E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据
SQL on Hadoop技术分析(一)
对SQL(尤其是PL/SQL)的支持一直是
Hadoop大数据
平台在替代旧数据时代亟待解决的问题。
jiezhu2007
·
2020-08-02 13:33
hadoop技术专栏
HDFS、YARN、MapReduce原理--读书笔记
hadoop大数据
工程师/hadoop工程师目的:高效的存储、处理这些海量、多种类、高速流动的数据hadoop来源google03~06年的三篇论文hadoop利用分而治之的朴素思想为大数据处理提供了一整套新的解决方案
BBlue-Sky
·
2020-08-01 14:11
云计算
Hadoop大数据
框架研究(5)——ArcGIS Enterprise(Linux)之GeoAnalyticsServer的集群环境部署
近期对hadoop生态的大数据框架进行了实际的部署测试,并结合ArcGIS平台的矢量大数据分析产品进行空间数据挖掘分析。本系列博客将进行详细的梳理、归纳和总结,以便相互交流学习。ArcGISEnterprise(V10.5)作为新一代ArcGIS服务器端产品,包含了Datastore、Server、Portal、WebAdaptor四个基本组件。其部署模式可以根据不用的应用场景、机器环境灵活配置。
gisxy
·
2020-08-01 12:53
Hadoop
ArcGIS
Hadoop大数据
面试--Hadoop篇
本篇大部分内容参考网上,其中性能部分参考:http://blog.cloudera.com/blog/2009/12/7-tips-for-improving-mapreduce-performance/、http://www.idryman.org/blog/2014/03/05/hadoop-performance-tuning-best-practices/原理篇:1.Hadoop2.X的各
fansy1990
·
2020-08-01 12:39
hadoop
hadoop
mapreduce
Hadoop是什么,主要由哪几个项目组成?
1
Hadoop大数据
处理的意义Hadoop得以在大数据处理应用中广泛应用得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势。
人工智能爱好者
·
2020-08-01 10:58
大数据
Hadoop大数据
框架学习(配置启动篇)
Hadoop大数据
框架学习(配置启动篇)大数据的特点:Volume(大量):数据量到达PB,EB级别Velocity(高速):要求处理海量数据效率高速度快Variety(多样):数据的样化。
不谈的抹布吸
·
2020-08-01 09:28
Hadoop
大数据
hadoop
大数据、云计算该如何学习?
大数据之Linux+大数据开发篇【大数据开发学习资料领取方式】:加入大数据技术学习交流群458345782,点击加入群聊,私信管理员即可免费领取阶段一、大数据、云计算-
Hadoop大数据
开发技术课程一、
yyyyyyyyyooi
·
2020-08-01 08:24
大数据
2015年传智播客各学科学费价格表
学科班别优惠价原价备注Java学院Java基础与加强班2000元2500元JavaEE+
Hadoop大数据
就业班15980元16980元JavaEE+
Hadoop大数据
冲刺班12000元12980元JavaEE
传智老沙
·
2020-07-31 18:02
传智播客
SSM实战系列之商城系统(前端+后台)《一》项目需求分析
也是作为本人实习阶段在做
Hadoop大数据
的同时,巩固一下javaweb的开发经验。当然,如果你跟着我一起做,那么掌握了这些内容之后,相信是能比较明显地提高你的开发适应能力。
csdnzoutao
·
2020-07-30 23:54
SSM框架
SSM框架实战专题
SSM实战系列之商城系统(前端+后台)《二》数据表结构设计
也是作为本人实习阶段在做
Hadoop大数据
的同时,巩固一下javaweb的开发经验。当然,如果你跟着我一起做,那么掌握了这些内容之后,相信是能比较明显地提高你的开发适应能力。
csdnzoutao
·
2020-07-30 23:54
SSM框架
SSM框架实战专题
深入对比Java与
Hadoop大数据
序列化机制Avro
Java有自己提供的序列化机制,而我们的Hadoop也提供了自己的序列化机制,二者究竟有什么差异呢?为什么Hadoop要重新设计自己的序列化体系?序列化大数据对象的过程,Writable接口底层源码实现。首先我们先了解一下什么是序列化,为什么需要序列化?1、序列化机制Serialization序列化Serialization,是将结构化对象转换为字节流以便通过网络传输或写入持久存储的过程。中文也有
weixin_33705053
·
2020-07-30 17:01
Hadoop大数据
分析技术以及未来发展趋势
2014是一个IT风云变幻莫测的一年,传统的行业都积极走向了互联网,从MWC大会闭幕我们可以看出未来互联网比拼的再也不是硬件而是“软”实力了。来自多个渠道的信息显示,阿里巴巴集团近期正与携程旅行网洽谈投资入股事宜。如果合作交易最终达成,将标识着在线旅游业也进入了百度、阿里巴巴、腾讯(BAT)三巨头阵营划分下的寡头竞争时代。BAT各自都在整合自己的产业链,未来大数据处理直接带动整个行业,目前整个IT
北风IT
·
2020-07-30 17:32
大数据
Hadoop大数据
Hadoop大数据发展趋势
Hadoop大数据分析技术
Hadoop大数据未来发展趋势
Cloudera Navigator介绍
Hadoop大数据
平台拥有存储与分析任何种类和规模数据的能力,并且将其开放给更多用户和分析工具。
ClouderaHadoop
·
2020-07-30 14:36
Hadoop
大数据
Cloudera
基于
Hadoop大数据
分析应用场景与实战
基于
Hadoop大数据
分析应用场景与实战本期看点为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了Hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品
LinkedKeeper
·
2020-07-30 03:46
Hadoop大数据
学习线路图
hadoop学习路线云计算,是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机和其他设备,主要是基于互联网的相关服务地增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。狭义云计算指IT基础设施的交付和使用模式,指通过网络以按需、易
大数据的未来
·
2020-07-30 01:21
大数据
DK
hadoop大数据
平台基础框架的简单介绍
DK
hadoop大数据
平台基础框架的简单介绍大数据作为当下最为热门的事件之一,其实已经不算是很新鲜的事情了。如果是三五年前在讨论大数据,那可能会给人一种很新鲜的感觉。
本宫没空8
·
2020-07-29 12:30
Hadoop大数据
之RAID
------------摘自《百度百科--RAID词条》磁盘阵列(RedundantArraysofIndependentDisks,RAID),有“独立磁盘构成的具有冗余能力的阵列”之意。原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列是由很多价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据
weixin_34226182
·
2020-07-28 19:03
Nosql 理解篇+实战篇 一 了解nosql
在
hadoop大数据
集群运用中所处的位置及作用;NoSQL常用的几种数据库NoSQL名称阐议:1)是“NotOnlySQL”的缩写,不仅仅是sql,它不一定遵循传统数据库的一些基本要求,比如说遵循SQL
FmZero
·
2020-07-28 14:00
企业级
Hadoop大数据
平台实战(1)——基础知识说明
#1hadoop定义Hadoop是一个由Apache基金会所开发的分布式系统基础架构用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFSHDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上而且它提供高吞吐量(highthroug
AmourHai
·
2020-07-28 07:39
Linux运维进阶
Hadoop新手学习指导
对于我们新手入门学习
hadoop大数据
存储的朋友来说,首先了解一下云计算和云计算技术是有必要的。
阡语陌路_lucine
·
2020-07-28 03:23
Hadoop
hadoop大数据
平台手动搭建-hue
1.解压tar-zxvf/opt/hue-3.9.0-cdh5.8.0.tar.gz2.编译安装makeapssmakeinstall3.修改hue.ini#Hueconfigurationfile#===================================##Forcompletedocumentationaboutthecontentsofthisfile,run#$/build/
iteye_12854
·
2020-07-28 00:15
hue
Hadoop大数据
存算分离需要什么样的存储?
据IDC预测,到2021年,至少50%的全球GDP将由数字化驱动。面对海量数据,企业亟需通过更加现代化、敏捷、高性能的IT基础设施来推进业务持续发展。当今世界,只有很少的数据得到了分析,还有巨大的待开发潜能,在高达3000亿美元的以数据为驱动的市场中,中国在人工智能、物联网和5G等技术方面已经逐渐成熟,为中国数字经济蓬勃发展奠定了基础,而那些尚未被充分利用的数据,就是新商业价值的关键元素。01.数
IT资讯科技
·
2020-07-27 18:28
大数据hadoop学习
CDH6.2.1CM6.2.1版本部署操作文档
CDH基于Apache许可证开源协议,提供了包括批处理、交互式SQL、交互式查询和基于角色的访问控制一站式
Hadoop大数据
解决方案。CDH优势:灵活—存储任意类型数据,同时可以利
cyg521
·
2020-07-15 22:46
hadoop
Ubuntu18.04+Docker+Hadoop+Spark分布式集群搭建
我的联系方式:630056108文章目录Docker上的
Hadoop大数据
平台搭建与测试1.简介与原理1.1Docker介绍1.1.1容器1.1.1.1容器历史1.1.1.2容器原理1.1.2Docker1.1.2.1Docker
lvxiangyu11
·
2020-07-15 14:17
Hadoop大数据
实验
实验1本次实验的报告存放在课程文件夹里,需要注意的是:1.本次我的用户并没有在/home目录下生成对应的用户目录,原因是我按照书上的操作手册,少了-d/home/user这一句(PPT中有)2.我安装的是1.2.1版本,最新版为2.6.0,如果用最新版安装端口会有所变化,比如50030变成了80803.对于单机和伪分布式的区别,我似乎还不是非常清楚4.对于linux下的eclipse安装,以及Th
yueshuangfei
·
2020-07-15 11:46
Hadoop
hadoop
基于虚拟机搭建
Hadoop大数据
平台集群
当前大数据发展越来越快,技术要求也越来越高,岗位需求也越来越多,Hadoop作为大数据技术的基础,会搭建
Hadoop大数据
平台对于从业人员成为了一个基本的能力,以下介绍两台虚拟机搭建hadoop集群。
传道授业解惑者
·
2020-07-15 10:07
大数据
Linux_CentOS7系统安装
1、在虚拟机中安装CentOS启动一个virtualbox虚拟机管理软件(vmware,我早些年,发现不太稳定,主要是当时搭建一个
hadoop大数据
的集群,发现每次休眠以后再重启,集群就挂掉了)virtualbox
张聪聪
·
2020-07-15 10:06
linux
Hadoop完全分布式集群配置文件
本文代码出自《
Hadoop大数据
开发基础》第二章,把几个修改量大的文件代码给贴出来,便于给同样使用这本书的人复制,因为纯手敲很累还容易出错。
落叶阳光
·
2020-07-15 10:53
大数据
Hadoop大数据
平台数据迁移方案(跨集群)
1、准备大数据平台迁移工作 由于公司项目业务需求,需要将两个项目的大数据平台进行迁移,业务数据进行跨平台平移。前提(大数据平台之间网络互通)第一种方案(Linux原生远程Shell命令拷贝)①将Hive数据通过MR写到其他Linux文件夹中:hive>insertoverwritelocaldirectory'/usr/test'select*fromtest;上述是通过MR任务计算!②通过
wunanliu
·
2020-07-15 06:30
大数据
国内实用的
Hadoop大数据
采集处理技术及方案有哪些?武汉大数据平台如何选择?...
大数据的发展伴随着互联网技术的进步,数据量的增大、数据源的增多,大数据在互联网时代针对数据类别特别大的数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。大数据技术的意义不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提是要采集大量有价值的数据。大数据采集分为:系统日志采集、网络数据采集、数据库数据采集…………等等。大数据采集处理
weixin_34326558
·
2020-07-15 05:25
零基础搭建
Hadoop大数据
处理-环境
由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMwareWorkstation为准,安装CentOS7,具体的安装此处不作过多介绍,只作需要用到的知识介绍。VMware的安装,装好一个虚拟机后利用复制虚拟机的方式创建后面几个虚拟机,省时省力,需要注意的是需要修改每个虚拟机的IP与主机名。所有虚拟机采用NAT模式上网,而且要保证与物理主机的IP互相能
weixin_34265814
·
2020-07-15 05:10
视频教程-
Hadoop大数据
零基础入门课程-Hadoop
Hadoop大数据
零基础入门课程软件架构师,大数据培训讲师。拥有顶尖公司百度、阿里的多年工作经验。精通大数据开发、javaweb网站建设、信息系统项目建设等。百度阅读《Hadoop实操指南》作者。
学院导师-张伟洋
·
2020-07-15 04:41
Hive 快速入门
Hive目前已经成为
Hadoop大数据
离线分析的标准工具,Hive入门比较容易,但是深入还是有些困难。本次分享目的是带领大家快速入门Hive,侧重于实用应用,并有一些原理和优化的内容。
GitChat的博客
·
2020-07-15 02:52
Hadoop大数据
分析实验(一)——HDFS基本操作
[实验目的]熟悉HDFS的相关基本概念;熟悉HDFS的基本操作。[实验原理]HDFS的全称为Hadoop分布式文件系统(HadoopDistributedFileSystem),是Hadoop的文件系统。HDFS对用户来说就如同单块磁盘,它其实是运行在Linux文件系统之上。其优点还包括:高容错性:可以处理磁盘损坏和机器宕机等等;能够存储大文件:文件大小可以达到TB甚至PB级别,远超单块磁盘的最大
小谷围最靓的仔
·
2020-07-14 20:50
Hadoop大数据分析实验
企业级
Hadoop大数据
平台实战(3)——Hadoop分布式的实现
#1搭建实验环境实验环境:rhel7.5主机信息作用server5(172.25.8.5)Namenode(master)server6(172.25.8.6)Datanode(slave)server7(172.25.8.7)Datanode(slave)真机(172.25.8.250)测试Hadoop篇章的第二篇实现了单机版的hadoop分布式文件系统,接下来在多个节点上实现;hadoop的分
AmourHai
·
2020-07-14 19:00
Linux运维进阶
企业级
Hadoop大数据
平台实战(2)——Hadoop单机版和伪分布式的实现
1.基础知识Hadoop的架构核心,Hadoop主要有两个层次,即:加工/计算层(MapReduce)和存储层(Hadoop分布式文件系统)除了上面提到的两个核心组件,Hadoop的框架还包括以下两个模块:Hadoop通用:这是Java库和其他Hadoop组件所需的实用工具HadoopYARN:这是作业调度和集群资源管理的框架HadoopStreaming是一个实用程序,它允许用户使用任何可执行文
AmourHai
·
2020-07-14 19:00
Linux运维进阶
企业级
Hadoop大数据
平台实战(4)——搭建hdfs和yarn模块
搭建环境实验环境:RHEL7.5selinuxandiptablesisdisabledHadoop、jdk、zookeeper程序使用nfs共享同步配置文件软件版本:hadoop-3.2.1.tar.gzjdk-8u181-linux-x64.tar.gz#将server5和server9调成2G内存,并且是namenode客户端:server6/7/8/主机信息作用server5(172.25
AmourHai
·
2020-07-14 19:27
Linux运维进阶
项目实例:KNN预测电影网站用户性别(Hadoop学习笔记三)
通过学习《
Hadoop大数据
开发基础》这本书,整理了一下书本上的项目案例。让自己再梳理一下流程,也希望能给有需要的人提供一定的帮助,写的不好的希望大家提出来,一起进步。1学习目标理解KNN算法的原理。
Mecury_
·
2020-07-14 18:23
学习笔记
Hadoop大数据
常用组件简介
文章目录1.分布式文件系统(HDFS)1)NameNode2)SecondaryNode2.资源管理调度框架Yarn1)ResourceManager2)ApplicationMaster3)NodeManager4)Container3.分布式协调服务ZooKeeper4.数据仓库工具Hive1)HiveServer25.分布式计算框架Spark1)SparkSQL2)SparkStreamin
花花呼呼
·
2020-07-14 13:34
大数据
Hadoop视频教程汇总
一慕课网1.
Hadoop大数据
平台架构与实践--基础篇(已学习)链接:https://www.imooc.com/learn/3912.Hadoop进阶(已学习)链接:https://www.imooc.com
cakincheng
·
2020-07-14 08:35
Hadoop
Hadoop大数据
平台环境搭建
我们此处使用的是VM虚拟机,centOS6.5的系统,初学者建议装中文版的系统,方便查看,我这边也是先装中文版的系统,本文章主要讲解如何在搭建大数据平台之前要对虚拟机进行环境配置工作,我会在重要的步骤截图上传,方便大家学习讨论,同时,对于一些拓展知识我会进行注释解释,一些其他相关知识也会在文章末尾写出来的,以下便具体的讲解如何进行配置一、系统环境准备工作:1、把网卡IP设置成静态(NAT模式)①*
Sparkcsdn
·
2020-07-14 06:23
Hadoop
【
Hadoop大数据
平台组件搭建系列】——Hadoop完全分布式搭建(基于CentOS7.4)史上最简单的Hadoop完全分布式搭建 一站式解决!!!
文章目录简介安装JDK配置SSH免密登录详情戳此篇————》》》[Linux中实现Hadoop各节点间的SSH免密登录](https://blog.csdn.net/Dchanong_/article/details/104299679)安装Hadoop完全分布式解压安装包,并重命名修改环境变量,刷新环境变量修改配置文件hadoop-env.shyarn-env.shcore-site.xmlhd
变秃,才能变强
·
2020-07-14 04:59
#
【Hadoop】
机器学习导论——大数据项目架构
以电信日志分析为例一、项目名称:电信日志分析系统二、项目描述:电信日志分析系统是以电信用户上网所产生的数据进行分析和统计计算,数据主要来源于用户的上网产生的访问日志和安全日志,通过
Hadoop大数据
平台完成日志的入库
DAN_L
·
2020-07-14 04:11
【Hadoop】
Hadoop大数据
架构及关键组件
Hadoop大数据
架构及关键组件1.Hadoop生态系统1.1架构大数据生态的主要组件及其关系大数据生态大数据架构1.HDFS(Hadoop分布式文件系统):2.MapReduce(分布式计算框架):3
游骑小兵
·
2020-07-14 03:36
Hadoop
大数据
Hadoop
Spark
Yarn
Flink
大数据环境搭建之HBase伪分布式环境搭建步骤详解
安装模式安装配置解压安装包配置文件hbase-env.shhbase-site.xml配置环境变量启动伪分布式启动本机服务Web访问界面HBase简介HBase是面向列的分布式数据库,能够快速检索大规模数据集,是
Hadoop
Darren.P
·
2020-07-14 03:30
大数据环境
HBASE
hadoop大数据
环境部署--linux centos虚拟机
需要版本:jdk:jdk-7u79-linux-x64.tar.gzhadoop:hadoop-2.5.0-cdh5.3.6.tar.gz1.创建hadoop用户useradd-mhadoop-Groot-s/bin/bash2.赋予hadoop用户最高权限chmod777hadoop--记得给hadoop设置密码passwdhadoophadoop3.切换hadoop用户suhadoop4.查看
苏末了
·
2020-07-14 03:41
大数据
hadoop
Hadoop大数据
生态系统及常用组件简介
经过多年信息化建设,我们已经进入一个神奇的“大数据”时代,无论是在通讯社交过程中使用的微信、QQ、电话、短信,还是吃喝玩乐时的用到的团购、电商、移动支付,都不断产生海量信息数据,数据和我们的工作生活密不可分、须臾难离。什么是大数据什么是大数据,多大算大,100G算大么?如果是用来存储1080P的高清电影,也就是几部影片的容量。但是如果100G都是文本数据,比如云智慧透视宝后端kafka里的数据,抽
weixin_34138255
·
2020-07-14 03:05
Hadoop大数据
平台搭建与环境配置
Hadoop完全分布式平台搭建:集群机器三台机器:一个作为master,另外两个作为slave1。分别执行ifconfig命令获取每台机器的IP地址2。执行sudovim/etc/hostname修改主机名,主机修改为master,另外两个分别修改为slave1,slave2。当然这只是为了方便,其实也可以不用修改3。三台机器分别执行sudovim/etc/hosts修改host文件4。如果三台主
baidu_38371925
·
2020-07-14 01:58
大数据
hadoop大数据
01---hadoop 的安装配置
hadoop集群搭建01--hadoop的安装配置三台机器Centos7192.168.2.37计算机名称master192.168.2.38计算机名称slave1192.168.2.39计算机名称slave2版本zookeeper-3.4.13Hadoop-2.7.7Hbase-2.1.0apache-hive-2.1.1jdk1.8注:hadoop集群最少需要三台机,因为hdfs副本数最少为3
saga_gallon
·
2020-07-13 13:28
hadoop
+hbase
集群
数据仓库和
Hadoop大数据
平台有什么差别?
广义上来说,
Hadoop大数据
平台也可以看做是新一代的数据仓库系统,它也具有很多现代数据仓库的特征,也被企业所广泛使用。
linghujing
·
2020-07-13 12:10
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他