E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据平台搭建
【无中生有】---16---大数据系统搭建
目标构建大批量数据的存储集群实现大批量数据的分布式快速查询提供基于大数据的模型离线或者在线分析抽取实现方案基于hadoop的
大数据平台搭建
地址hadoop的安装目前已经极为简易化,以上地址的安装过程比较古老
无人境域
·
2020-06-30 03:24
分布式系统手记
分布式系统构建手册
ambari
大数据平台搭建
的安装(全)
本篇主要说明离线安装的流程,如需查看在线安装的可以看以前博文https://blog.csdn.net/xiaozou_it/article/details/82911160一、安装前的一些准备(离、在线皆需先完成)1、推荐四台虚拟机器(本文以centos为例)2、虚拟机能使用网络(可查看):https://blog.csdn.net/xiaozou_it/article/details/8296
xiaozou_it
·
2020-06-30 01:40
大数据
Linux
大数据&ETL&kettle学习积累
Sqoop同步数据命令HBASE知识积累大数据Hive的学习积累HDFS的学习积累impala-shellNotConnected的问题Azkaban介绍与使用Hive、Impala和Hbase的区别CDH
大数据平台搭建
大宇进阶之路
·
2020-06-29 19:22
大数据
ETL
基于Contos7.X+CDH6.2.0
大数据平台搭建
(上)
目录一、CDH6.2.0官网介绍二、CDH6.2.0安装前环境的部署三、CDH6.2.0安装一、CDH6.2官网介绍:CDH(Cloudera'sDistribution,includingApacheHadoop).是Haoop众多分支中的一种大数据,简称CDH,基于最稳定版本的ApacheHadoop,有许多补丁、向后移植和更新,Cloudera公司以多种不同的形式进行发布。包括源码和二进制t
潘永青
·
2020-06-27 09:53
大数据开发
大数据平台搭建
(一)
前言安装大数据平台,为毕设做准备软件OracleVMVirtualBox6.0.14hadoop2.8JDK1.8centOS(CentOS-7-x86_64-Minimal-1804.iso)虚拟机网络配置1.宿主机和虚拟机连通且能上外网(1)管理-》主机网络管理器配置(2)在宿主机的网络和Internet-》网络连接可看到生成一个以太网6(3)设置虚拟机的网卡ip地址网卡1网卡2vi/etc/
灬青春不留白灬
·
2020-06-27 05:55
Java
大数据
hadoop
大数据平台搭建
(三):hive 介绍和安装配置
前言 集群我们已经弄好了,本章开始搭建hive。1.hive介绍 1.Hive是什么? 官方解释:Hive是基于Hadoop的数据仓库解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。 简单来说,Hive就是在Hadoop上架了一层SQL接口,可以将SQL翻译成MapReduce去Hadoop上
闹闹的BaBa
·
2020-06-27 03:38
大数据平台搭建
(二):hadoop HA 集群搭建
前言 本章搭建zookeeper集群和hadoop集群1.hadoop版本的选择 1.目前而言,不收费的Hadoop版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)、Cloudera版本(Cloudera’sDistributionIncludingApacheHadoop,简称CDH)、Hortonworks版本(Hortonwo
闹闹的BaBa
·
2020-06-27 03:38
大数据平台搭建
(四):hive中的表及UDF
前言 本章介绍hive内部表、外部表、分区表和UDF等。1.hive表介绍 1.Hive虽说是数据仓库,其实可以认为就是一个mysql数据库,hive中的表名对应的是hdfs上的文件目录名,表内容就是对应目录下的文件。 2.hive表的hdfs路径 在hive-site.xml中,由参数hive.metastore.warehouse.dir指定,我的是/hivedata
闹闹的BaBa
·
2020-06-27 03:38
在虚拟机中搭建CDH版本的大数据平台
闲话少说,此教程针对
大数据平台搭建
的研究,并有一定的Linux命令基础,或者搭建过apache版本的hadoop。
我的快乐hiahia
·
2020-06-26 17:15
大数据
大数据平台搭建
------CDH单机部署
从17年十一月入职起,到中间经历了毕业、春节、转正。在工作岗位上学到了很多很多的东西,非常有幸遇到这么一群人生导师,早就想把工作中趟过的坑,总结的文档,开个博客记录起来,一来可以给其他人参考,二来也是自己的一个复习吧。可是拖延症作祟,这事,一直耽搁,争取以后每周至少总结两篇。加油,未来的路很长!----------------------------------------------------
春梦了却了无痕
·
2020-06-26 11:20
平台搭建
hadoop
大数据平台搭建
大数据平台搭建
大数据平台搭建
虚拟机环境准备修改ip,映射IP地址ssh无密码通信同步时间关闭防火墙安装jdkhadoop平台正式搭建安装hadoop安装kafka安装spark
大数据平台搭建
zookeeper
@~~~~小飞
·
2020-06-25 12:53
hadoop
大数据平台搭建
------CDH单机部署
转载https://blog.csdn.net/sinat_32176947/article/details/79591449?utm_source=blogxgwz3一、部署前的准备1、检查jdk是否安装:参考jdk安装配置文档(jdk7或jdk8,所有节点都要一致)2、兼容性建议:CentOS6.8+CDH5.11.x(x>1)+mysql5.x+jdk1.7u80***CDH5.13以上包含
qq_31102103
·
2020-06-25 05:56
大数据
CenOS7下CM&CDH
大数据平台搭建
目录一、CM&CDH简介(***了解***)1.ApacheHadoop不足之处2.CDH是什么?3.CDH的优点?4.CDH版本介绍(***了解***)5.CDH版本下载地址6.CDH支持的安装方式7.ClouderaManager(CM)介绍8.为什么要学习CM?9.CM&CDH版本下载二、CM&CDH安装1.软件环境2.安装准备3.CM安装4.CM启动&CDH安装一、CM&CDH简介(***
韦晓阳
·
2020-06-25 00:59
运维
大数据
CDH
如何搭建大数据分析平台
最热门的大数据技术:hadoop
大数据平台搭建
:①通过Kafka作为统一采集平台的消息管理层,灵活的对接、适配各种数据源采集(如集成flume),提供灵活、可配置的数据采集能力。
qq_16313575
·
2020-06-24 23:23
大数据
大数据平台搭建
(4)
注意:因为博客中美元符号有特殊含义,所以将美元符号替换为&12.安装hbasea.上传:将hbase-1.3.1-bin.tar.gz压缩包上传到/user/local路径下b.解压:将上传的hadoop包解压缩到当前的目录下(tar-zxvfhbase-1.3.1-bin.tar.gz)c.修改hbase-env.shexportJAVA_HOME=/usr/java/jdk1.8exportH
程序员QQ
·
2020-06-24 11:24
大数据云平台搭建
linux
大数据平台搭建
(1)
注意:因为博客中美元符号有特殊含义,所以将美元符号替换为&涉及技术:JDk1.8+zookeeper-3.4.10+hadoop-2.7.3.tar.gz+hbase-1.3.1+scala-2.11.8.tgz+spark-2.1.0-bin-hadoop2.7+apache-hive-2.3.2-bin.tar.gz+mysql-5.7.20-linux-glibc2.12-x86_64.ta
程序员QQ
·
2020-06-24 11:23
大数据云平台搭建
linux
大数据平台搭建
(3)
注意:因为博客中美元符号有特殊含义,所以将美元符号替换为&i.配置hdfs-site.xmldfs.namenode.name.dirfile:/usr/local/hadoop-2.7.3/dfs/namedfs.datanode.data.dirfile:/usr/local/hadoop-2.7.3/dfs/datadfs.replication3dfs.webhdfs.enabledtru
程序员QQ
·
2020-06-24 11:23
大数据云平台搭建
linux
kylin
大数据平台搭建
文档
文章目录前期准备包下载按顺序安装一.Hadoop二.Zookeeper三.Hbase四.Hive五.Sqoop六.Kylin七.SparkKylin查询案例启动模式PS:将鼠标悬浮于对应图片上查看配置文件路径,全文同前期准备/etc/sudoers配置管理用户root权限关闭防火墙/etc/hosts配置ip与主机名将其余节点的公钥拷贝到仓库文件并授权,scp分发到各节点,配置各节点直接ssh免密
Goofiness
·
2020-06-22 19:47
架构
先电
大数据平台搭建
项目1安装配置JDK安装Tomcat安装配置Eclipse安装配置MySQLServer安装Navicat构建Hadoop开发平台项目2安装虚拟机(master和slave1)启动虚拟机(master和slave1)安装启动MobaXterm配置主机名设置ntpd自动启动# master # yum -y install ntp # vi /etc/ntp.conf 注释或者删除以下四行
大尧酱
·
2020-06-22 11:09
全国职业院校技能大赛云计算技术与应用大赛国赛题库答案(2)
文章目录
大数据平台搭建
大数据平台运维
大数据平台搭建
1.配置masterNode的主机名为:master;slaver1Node的主机名为:slaver1。
Destiny__0991
·
2020-06-21 19:18
先电云计算
先电版
大数据平台搭建
问题之down机问题
在部署hadoop集群过程中,每当安装进行大约百分之70左右,master节点会出现崩掉现象,自动关机,然后无法启动实例。经查/var/log/libvirt/qemu/下相关云主机日志文件。解决步骤:1,查看节点内存使用率,控制节点内存紧缺,计算节点内存充足。2,测试,发现web上创建云主机优先分配资源在控制节点上,但控制节点资源不足3,手动调度云主机使用计算节点资源命令:novaboot--f
wrnxrbb
·
2020-06-21 14:23
小型
大数据平台搭建
目录前言一、搭建环境1.1集群规划二、集群的相关配置2.1新建用户hadoop2.2更改主机名2.3主机和IP做相关映射2.4SSH免密码登录2.5时间配置2.6整体安装目录安排三、HadoopHA环境搭建3.1JDK配置3.2安装配置Zookeeper集群3.3安装配置hadoopHA集群四、Hive+MySQL的安装与配置4.1Hive的安装部署4.2MySQL数据库安装配置4.3修改hive
weixin_34113237
·
2020-06-21 11:43
大数据平台搭建
(一):虚拟机环境配置
前言 最近看了些hadoop相关的资料,然后想自己从零开始搭建一个大数据平台。大数据平台架构 1.概念性的东西还是不想多啰嗦,先上一张网上找的平台架构图,上图的目的是为了大家对整个平台架构有个宏观的认识,这个很重要,如果盲目的零碎的去研究效果很差。 2.目标当然是整合图中所有框架和组件,但是时间可能有限,机器也有限(本机搭建)。所以,我的计划是先从最主要的hadoop入手,然后再
闹闹的BaBa
·
2020-06-21 08:58
大数据平台搭建
------CM 和CDH安装
一、安装说明CM是由cloudera公司提供的大数据组件自动部署和监控管理工具,相应的和CDH是cloudera公司在开源的hadoop社区版的基础上做了商业化的封装的大数据平台。采用离线安装模式,虽然在线安装比较简单,但是速度感人,原因大家都懂,这里我使用的各软件版本信息为:操作系统:CentOS6.8CDH版本:5.7.1:CDH-5.7.1-1.cdh5.7.1.p0.11-el5.parc
春梦了却了无痕
·
2020-06-21 07:33
平台搭建
CM+CDH构建企业大数据平台系列(一)
带着种种疑问让我们开启真正的企业级
大数据平台搭建
之旅。
大数据研习社
·
2020-06-21 00:33
Hadoop
先电云计算大赛
大数据平台搭建
该操作是在虚拟机的基础上进行搭建,用CRT连接。该操作需要两个节点,分别是master和slave1节点。我并没有展示使用CRT进行常规操作,比如说:挂载镜像那个地方,这是因为是虚拟机所有可以,如果在服务器上就不能使用,而是进行常规操作。镜像:XianDian-BigData-v2.2CentOS-7-x86_64-DVD-1511.isoIP可自行设置配置主机名【master】#hostname
自学小蔡
·
2020-06-20 20:15
云计算
丁香园2017运营和市场岗位招聘啦
在过去的半年,我们的产品战略规划已经清晰,研发体系逐步完善,医疗
大数据平台搭建
成型;我们饥渴的需要更多优秀人才加入我们,尤其是产品运营和市场推广人才,在互联网医疗领域加速奔跑,向一流互联网公司的目标前进
范凯
·
2020-04-09 05:15
hadoop 命令操作hdfs 目录权限 管理
image.png由于公司的
大数据平台搭建
的比较简陋,还要让之前根本没有接触过hadoop平台的开发算法人员使用,他们的错误操
Helen_Cat
·
2020-03-29 23:30
CentOS7 ambri2.6.1.5+hdp2.6.4.0
大数据平台搭建
CentOS7ambari前言本文是讲如何在centos7(64位)安装ambari+hdp,如果在装有原生hadoop等集群的机器上安装,需要先将集群服务停掉,然后将不需要的环境变量注释掉即可,如果不注释掉,后面虽然可以安装成功,但是在启动某些服务的时候可能会有异常,比如最后提到的hive启动异常。本文适合系统:RedHat7、CentOS7、OracleLinux7(都是64位)注意:cent
弓昭
·
2020-03-20 09:20
实时Lamda
大数据平台搭建
Flume+Kafka+HDFS+SparkStreaming
整体架构图image.png一、python模拟生成日志importrandomimporttimeiplist=[101,198,65,177,98,21,34,61,19,11,112,114]urllist=['baidu.com','google.com','sougou.com','360.com','yahoo.com','yisou.com']mobile=['xiaomi','vi
lbship
·
2020-02-08 07:55
大数据平台搭建
(纯文字版)
安装虚拟机环境下载VMware并安装、破解在VMWare官网上http://www.vmware.com/,选择VMwareworkstation12pro版本安装。创建虚拟机在Ubuntu的官网https://www.ubuntu.com/上下载,ubuntu-14.04.4-desktop-amd64.iso,该版本为稳定的维护的版本。安装VMWareTools①启动Ubuntu系统,进入到桌
圈圈_勿忘初心
·
2019-12-07 01:15
惠州市软件开发、app定制、游戏开发、管理系统、直播app系统、商城系统
惠州市狸拉网络科技有限公司致力于为中国企业提供高品质的互联网解决方案服务,服务涵盖:APP软件开发、网站建设、电商平台搭建、
大数据平台搭建
、以及行业解决方案服务,根据客户的实际情况,我们提供三种合作模式
一丝苦恼
·
2019-10-20 02:00
大数据平台搭建
(Spark)安装(七)
下载地址:http://spark.apache.org/downloads.html下载压缩包,上传到/usr/local,解压缩重命名mvspark-2.4.3-bin-hadoop2.7spark-2.4.3cdspark-2.4.3/confmvspark-env.sh.templatespark-env.shvispark-env.sh在spark-env.sh文件的末尾,添加:expo
海涛高软
·
2019-10-15 16:53
大数据
大数据平台搭建
(Hive)安装(五)
hive下载地址:http://hive.apache.org/搭建参考:https://blog.csdn.net/qq_15267341/article/details/89817841注意:hive只是hadoop的一个客户端工具,因此不用每台机子上都要装本地安装包上传到/usr/lcoal解压重命名文件为hivecd/usr/local/hive/conf修改hive-env.sh.tem
海涛高软
·
2019-10-14 10:14
Ambari2.5.2+HDP2.6.2+添加自定义组件Redis5.0.3
文章目录1.环境准备2.自定义服务2.1创建服务文件夹2.2把ambari-redis框架拷贝到REDIS目录2.3下载redis的rpm包2.4重启ambari服务1.环境准备ambari
大数据平台搭建
@TangXin
·
2019-05-16 11:22
Ambari
Ambari2.5.2+HDP2.6.2+Centos7.3离线
大数据平台搭建
文章目录1.介绍1.1Ambari1.2HDP1.3HDP-UTILS2.准备工作2.1Ambari-HDP版本介绍2.2搭建环境准备2.2.1软件要求2.2.2软件下载2.3集群节点规划准备3.搭建虚拟机3.1搭建yum.hdp虚拟机3.2配置yum.hdp虚拟机3.2.1配置静态IP3.2.2防火墙设置3.2.3设置hostname3.2.4设置阿里开源镜像yum源3.2.5安装时间同步服务(
@TangXin
·
2019-05-14 13:17
环境搭建
大数据平台搭建
(一) - Ubuntu 18.04中Hadoop组件的版本与安装顺序
简介目前在学习大数据的基础知识,希望能与机器学习与数据挖掘进行更好的融合。最近花费了一段时间,在自己的虚拟机中安装了Ubuntu18.04并搭建了Hadoop伪分布式平台。在平台中安装了几个核心的组件。这篇文章主要记录一下安装的版本与顺序,希望能给也需要安装的人提供一些建议。后续会陆续将搭建的过程一步步写出来留作知识积累。环境介绍主机环境:Windows10虚拟软件:VMWare15虚拟机环境:U
Orange_Spotty_Cat
·
2019-03-15 11:14
大数据
大数据平台搭建
本次在服务器上安装2台虚拟机分别是sky174sky175利用clouderamanager安装CDH都是离线的环境项目所需的安装文件CentOS-7-x86_64-DVD-1708mysql-5.6.41-linux-glibc2.12-x86_64.tar.gzjdk-7u80-linux-x64.tar.gzCm5.13.1Cdh5.13.1cloudera-manager-centos7-
dssj_fh
·
2018-10-25 00:49
linux系统环境
mysql
cloudera
manager
CDH
大数据平台搭建
:Hadoop-3.x + Spark-2.x + Hive-2.x + Hbase-1.4 + Phoenix-4.14 + Cassandra + ES + Accumulo-1.9
换了新笔记本,做个笔记。一,软件准备(自取所需)Java-1.8Scala-2.11Hadoop-3.1.1Spark-2.3.2Hive-2.3.4phoenix二,SSH免密码登录(即使是当地的单机也需要SSH,否则格式化的hadoop的存储系统时无权限,导致失败:本地主机:@localhost:权限被拒绝(公钥,密码)开始)公共密钥生成命令(在客户端下依次执行,所有选项按回车即可)(1)$s
Raini.闭雨哲
·
2018-10-24 18:24
spark
hadoop
CDH
大数据平台搭建
Hadoop是apache旗下的一套开源软件平台,主要对海量数据进行分布式处理。本次部署,计划使用5台服务器,服务器磁盘规划如下:分区挂载完成以后,使用root用户执行对目录/data授权。每台服务器都执行此命令。chmod777-R/data一、基础运行平台部署包说明平台大数据部署包共提供cm5,cdh,Redhat三个程序部署包。其中cm5为管理控制台,是必装包;cdh为基础运行平台的主程序包
风之沙城
·
2018-09-25 14:46
大数据
Hadoop集群
大数据平台搭建
阅读目录一、Hadoop集群环境搭建配置二、Hadoop集群环境安装三、Hadoop集群完全分布式坏境搭建回到顶部一、Hadoop集群环境搭建配置1、前言Hadoop的搭建分为三种形式:单机模式、伪分布模式、完全分布模式,只要掌握了完全分布模式,也就是集群模式的搭建,剩下的两种模式自然而然就会用了,一般前两种模式一般用在开发或测试环境下,Hadoop最大的优势就是分布式集群计算,所以在生产环境下都
上善亦若水
·
2018-09-16 01:02
hadoop
机器学习实践心得:数据平台设计与搭建
下文将基于本人所负责的个推
大数据平台搭建
工作,与大家分享个推数据平台架构方面的经验以及踩过的一些坑。
ERIIISED
·
2018-07-17 17:47
机器学习
深度学习
人工智能
人工智能
Cloudera Manager
大数据平台搭建
在企业里快速搭建大数据平台除了Ambria外还可以用ClouderaManager,这两种工具相对于纯手工搭建确实便捷很多,但是有利也有弊,相对于新手来说就不便于掌握内部原理,不好排错等,而纯手工搭建,出错较多,不容易成功。一.规划:192.168.3.201server/agentmysql192.168.3.202agentnamenode192.168.3.203agentnamenode(
hzlocean
·
2018-06-13 11:25
CM
Hadoop
Ambari
大数据平台搭建
利器-杨帅-专题视频课程
Ambari
大数据平台搭建
利器—119人已学习课程介绍Ambari是由HortonWorks开发的一个Hadoop相关的项目,这款软件具有集群自动化安装、中心化管理、集群监控、报警等功能,使得安装集群从几天的时间缩短在几小时以内
djt_20180507
·
2018-06-07 16:31
视频教程
大数据平台搭建
- cdh5.11.1 - hbase集群搭建
一、简介HBase是一种构建在HDFS之上的分布式、面向列的存储系统。在需要实时读写、随机访问超大规模数据集时,可以使用HBase。尽管已经有许多数据存储和访问的策略和实现方法,但事实上大多数解决方案,特别是一些关系类型的,在构建时并没有考虑超大规模和分布式的特点。许多商家通过复制和分区的方法来扩充数据库使其突破单个节点的界限,但这些功能通常都是事后增加的,安装和维护都和复杂。同时,也会影响RDB
nicekk
·
2018-05-16 22:00
大数据平台搭建
- cdh5.11.1 - oozie安装
一、简介oozie是hadoop平台开源的工作流调度引擎,用来管理hadoop作业,属于web应用程序,由oozieserver和oozieclient构成。oozieserver运行与tomcat容器中oozie的工作流必须是一个有向无环图,当用户需要执行多个关联的MapReduce作业时,只需要把作业写进workflow.xml中,再提交到oozie,oozie便可以托管服务,按照预先的配置有
nicekk
·
2018-05-15 22:00
大数据平台搭建
- Mysql在linux上的安装
一、简介MySQL是一个关系型数据库系统,由瑞典MySQLAB公司开发,目前属于Oracle旗下产品。MySQL是最流行的关系型数据库管理系统之一,在WEB应用方面,MySQL是最好的RDBMS(RelationalDatabaseManagementSystem,关系数据库管理系统)应用软件。大数据组件中,hive需要使用mysql作为metastore的存储的地方,hue也需要使用mysql存
nicekk
·
2018-05-14 21:00
大数据平台搭建
- cdh5.11.1 - spark源码编译及集群搭建
一、spark简介ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎,Spark是一种与hadoop相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使Spark在某些工作负载方面表现得更加优越,换句话说,Spark启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。二、spark编译为什么cdh提供了spark已经编译好的包,还要自
nicekk
·
2018-05-14 21:00
大数据平台搭建
- cdh5.11.1 - hue安装及集成其他组件
一、简介hue是一个开源的apachehadoopui系统,由cloudeardesktop演化而来,最后cloudera公司将其贡献给了apache基金会的hadoop社区,它基于python框架django实现的。通过使用hue,我们可以使用可视化的界面在web浏览器上与hadoop集群交互来分析处理数据,例如操作hdfs上的数据,运行MapReduceJob,查看HBase中的数据二、安装(
nicekk
·
2018-05-12 14:00
大数据平台搭建
- cdh5.11.1 - hive客户端安装
一、简介hive是基于hadoop的一种数据仓库工具,可以将结构化的文件映射成为数据库的一张表,并提供简单sql查询功能,底层实现是转化为MapReduce任务计算。二、安装(1)下载从cdh下载页下载http://archive.cloudera.com/cdh5/cdh/5/hive-1.1.0-cdh5.11.1.tar.gz下载好后上传至服务器的/home/hadoop/software,
nicekk
·
2018-05-12 13:00
上一页
1
2
3
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他