E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop学习篇
大数据平台比较-CDH、HDP、CDP
Apache
Hadoop
与CDH、HDP的比较一、
Hadoop
版本综述不收费的
Hadoop
版本主要有三个(均是国外厂商),分别是:Apache(最原始的版本,所有发行版均基于这个版本进行改进)Cloudera
Sql强
·
2024-01-09 07:24
头歌:旅游网站之数据分析
关统计每个城市的宾馆平均价格packagecom.processdata;importjava.io.IOException;importjava.util.Scanner;importorg.apache.
hadoop
.conf.Configuration
爱吃肉的白熊
·
2024-01-09 07:32
Educoder
java
旅游
hive的基本操作
最近新学了hive,想通过写文章的方式对所学知识进行巩固,同时希望可以帮助到大家Hive是基于
Hadoop
的一个数据仓库工具1.创建数据库(创建方法是和Mysql一样的)createdatabase数据库名字
暴打小赵
·
2024-01-09 06:49
hive
hive
数据库
mysql
实验6 熟悉Hive的基本操作
一、实验目的(1)理解Hive作为数据仓库在
Hadoop
体系结构中的角色。(2)熟练使用常用的HiveQL。
Z.Q.Feng
·
2024-01-09 06:47
实验报告
大数据技术与原理
实验报告
hive
大数据
1.2
Hadoop
概述
小肥柴的
Hadoop
之旅1.2
Hadoop
概述目录1.2
Hadoop
概述1.2.1回归问题1.2.2Google的三篇论文1.2.3
Hadoop
的诞生过程1.2.4
Hadoop
特点简介参考文献和资料)目录
卷毛迷你猪
·
2024-01-09 06:47
Hadoop
大数据
hadoop
分布式
hive基本操作与应用
1、通过
hadoop
上的hive完成WordCount启动
hadoop
2、Hdfs上创建文件夹/3、上传文件至hdfs4、启动Hive5、创建原始文档表6、导入文件内容到表docs并查看7、用HQL进行词频统计
weixin_34416649
·
2024-01-09 06:16
大数据
物理机搭建hive
一、修改
Hadoop
配置修改core-site.xml配置yarn-site.xml分发文件,然后重启集群二、Hive解压安装上传文件添加hive环境便量,source生效启动高可用集群,启动hive三
DIY……
·
2024-01-09 06:45
hive
hadoop
数据仓库
数仓分层结构
--日志数据--格式:JSON--业务数据--历史数据--格式:--全量--Datax:TSV--增量--Maxwell:JSON--汇总数据--希望用最少的资源存储最多的数据--压缩:--gzip:
Hadoop
Young_IT
·
2024-01-09 06:40
大数据开发
大数据技术
大数据
数据仓库
大数据开发-某外包公司
varchar和char区别4.说下数据库的事务5.spark的部署模式有哪些6.数据库和数据仓库的区别7.内部表和外部表的区别8.说下数据中台、数据仓库和数据湖的区别9.说下公司的建模模型10.说下
hadoop
劝学-大数据
·
2024-01-09 06:10
个人面试真题记录
大数据
hadoop
集群搭建、spark集群搭建、pyspark搭建(linux+window)
1、前言本文记录学习过程中
Hadoop
、zookeeper、spark集群搭建,主要为pyspark库服务(具体为window上pyspark环境和pyspark库,linux上spark框架、pyspark
Lfx_come on
·
2024-01-09 06:02
hadoop
linux
spark
python
学习学习再学习
day8默默耕耘共读打卡
学习篇
很高兴今天是最后一天打卡,为坚持到最后一天的自己鼓掌,怎么忽然感觉有点不舍呢!
48c93eb524c8
·
2024-01-09 04:17
『HDFS』伪分布式
Hadoop
集群
博客引流本文是『
Hadoop
』MapReduce处理日志log(单机版)的旭文,maybe还有后续在搭建环境的时候发现很难搜到合适的教程,所以这篇应该会有一定受众伪分布式就是假分布式,假在哪里,假就假在他只有一台机器而不是多台机器来完成一个任务
gunjianpan
·
2024-01-09 04:31
ROS中接收消息并保存数据,rosbag和rqt_plot的使用
参考的博客:ROS总结——录制和回放数据ROS
学习篇
(七)rostopic消息记录、回放、转.txtROS相关:使用rospy编写ros程序并使用rosbag存储数据//这个
lovelybreeze
·
2024-01-08 21:02
rosbag
rqt_plot
ros消息接收和保存
Hadoop
3.3.5云服务器安装教程-单机/伪分布式配置
系列文章目录华为云服务器试用领取领取的试用云服务器在哪
Hadoop
3.3.5云服务器安装教程-单机/伪分布式配置文章目录系列文章目录创建
hadoop
用户更新apt安装SSH、配置SSH无密码登陆安装Java
柔雾
·
2024-01-08 21:48
服务器
分布式
运维
2021-11-22 Zookeeper Shell脚本
/bin/bashcase$1in"start"){foriin
hadoop
102
hadoop
103
hadoop
104doecho----------zookeeper$i启动------------ssh
不爱吃奶昔(zsl0)
·
2024-01-08 19:12
#
Linux
linux
shell
zookeeper
hadoop
/etc/
hadoop
下没有mapred-site.xml,只有mapred.xml.template
默认情况下,/usr/local/
hadoop
/etc/
hadoop
/文件夹下有mapred.xml.template文件,我们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce
比特小怪兽
·
2024-01-08 19:34
hadoop
命令汇总
启动和关闭
hadoop
服务一键启动/停止start-hdf.shstop-hdf.sh单进程关闭启动hdfs--daemonstop/start/statusnamenode或者
hadoop
--daemonstop
你很棒滴
·
2024-01-08 19:17
hadoop
hdfs
大数据
HDFS常用命令(方便大家记忆版)
1.文件操作(1)列出HDFS下的文件/usr/local/
hadoop
$bin/
hadoop
dfs-ls(2)列出HDFS文件下名为in的文档中的文件/usr/local/
hadoop
$bin/
hadoop
dfs-lsin
姚兴泉
·
2024-01-08 18:01
Hidataplus-3.3.2.0-005公测版本基于openEuler release 22.03 (LTS-SP2)的测试
测试角色如下:
hadoop
、yarn、zookeeper、hive、impala。
杨航的技术博客
·
2024-01-08 16:35
hidataplus
大数据
给
Hadoop
初学者的一些建议
零基础学习
hadoop
,没有想象的那么困难,也没有想象的那么容易。从一开始什么都不懂,到能够搭建集群,开发。整个过程,只要有Linux基础,虚拟机化和java基础,其实
hadoop
并没有太大的困难。
丨程序之道丨
·
2024-01-08 15:29
准高三一定要知道的50件事,现在看正是时候!
学习篇
1.多读书,做好读书笔记,时刻翻看。2.上课认真听讲,下课多找老师提问。3.学会筛选资料,把下发的试卷分类,将不需要的扔掉。4.学会利用手机学习,如背单词、看新闻。恩,还有简单高中生。
风中有奇缘
·
2024-01-08 14:39
林宥嘉的寒假生活
一、
学习篇
作为一名小学生,虽然我们放假了,但学习仍然是首要任务。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App
微微上扬的小帅
·
2024-01-08 13:12
大数据技术期末复习第七章——MapReduce练习
A、Map函数将输入的元素转换成形式的键值对B、
Hadoop
框架是用Java实现的,MapReduce应用程序则一定要用Java来写C、不同的Map任务之间不能互相通信D、MapReduce框架采用了Master
锦鲤儿
·
2024-01-08 12:01
大数据
mapreduce
big
data
hadoop
Hadoop
学习之路(四)HDFS 读写流程详解
1.HDFS写操作1.1图解HDFS读过程hdfs写操作流程图.pngimage.png1.2数据写入过程详解1、使用HDFS提供的客户端Client,向远程的NameNode发起RPC请求;2、NameNode会检查要创建的文件是否已经存在,创建者是否有权限进行操作,成功则会为文件创建一个记录,否则会让客户端抛出异常;3、当客户端开始写入文件的时候,客户端会将文件切分为多个packets,并在内
shine_rainbow
·
2024-01-08 12:21
Win10环境下
Hadoop
(单节点伪分布式)的安装与配置--bug(yarn的8088端口打不开+)
Win10环境下
Hadoop
(单节点伪分布式)的安装与配置--bug(yarn的8088端口打不开+)一、本文思路【1】、配置java环境–JDK12(
Hadoop
的底层实现语言是java,
hadoop
老妹儿的
·
2024-01-08 11:19
实战Flink Java api消费kafka实时数据落盘HDFS
flink版本1.13kafka版本0.8
hadoop
版本3.1.42实验过程2.1启动服务程序为了完成Flink从Kafka消费数据
大数据程序终结者
·
2024-01-08 11:13
flink
java
kafka
JanusGraph简介
JanusGraph支持
Hadoop
框架,并能够利用
Hadoop
对图进行大批量的处理和分
娃娃学软件
·
2024-01-08 10:15
大数据 Yarn - 资源调度框架
Hadoop
主要是由三部分组成,除了前面我讲过的分布式文件系统HDFS、分布式计算框架MapReduce,还有一个是分布式集群资源调度框架Yarn。
善守的大龙猫
·
2024-01-08 10:48
大数据
大数据
Hadoop
、Pig、Hive、Storm、NOSQL 学习资源收集【Updating】 (转)
目录[-](一)
hadoop
相关安装部署(二)hive(三)pig(四)
hadoop
原理与编码(五)数据仓库与挖掘(六)Oozie工作流(七)HBase(八)flume(九)sqoop(十)ZooKeeper
我爱大海V5
·
2024-01-08 08:15
Hadoop
hadoop
《深入理解
Hadoop
(原书第2版)》——2.4
Hadoop
2.0
本节书摘来自华章计算机《深入理解
Hadoop
(原书第2版)》一书中的第2章,第2.4节,作者[美]萨米尔·瓦德卡(SameerWadkar),马杜·西德林埃(MadhuSiddalingaiah),杰森
weixin_34174322
·
2024-01-08 08:44
大数据
系统架构
人工智能
Flume基础知识(十):Flume 聚合实战
1)案例需求:
hadoop
100上的Flume-1监控文件/opt/module/group.log,
hadoop
101上的Flume-2监控某一个端口的数据流,Flume-1与Flume-2将数据发送给
依晴无旧
·
2024-01-08 08:23
大数据
flume
大数据
Hadoop
精选18道面试题(附回答思路)
1.简述
Hadoop
1和
Hadoop
2的架构异同HDFSHA(HighAvailablity)一旦Active节点出现故障,就可以立即切换到Standby节点,避免了单点故障问题。
Byyyi耀
·
2024-01-08 06:00
hadoop
大数据
分布式
Unrecognized option: -v Error: Could not create the Java Virtual Mac
yarn报错Unrecognizedoption:-vError:CouldnotcreatetheJavaVirtualMac这是因为jdk和
hadoop
或者是其他的在环境变量path中,因为yarn.cmd
꧁“杂货店”꧂
·
2024-01-08 04:39
笔记
java
javascript
yarn
Python入门
学习篇
(十六)——类属性和方法
1属性1.1公有属性1.1.1书写语法规则self.公有属性名#书写位置是在__init__方法里面#注意:公有属性名的前缀不能是__1.1.2调用语法规则对象名.公有属性名1.1.3示例代码classPerson():p_num=0#用于统计数量def__init__(self,name,age,sex,job):#self代表当前实例化对象self.name=nameself.age=ages
SSS4362
·
2024-01-08 03:07
python入门学习
python
入门学习
类属性
方法
Python入门
学习篇
(十七)——封装、继承、多态
1封装1.1理解属性和方法书写到类里面的操作即为封装封装可以理解成私有化属性和私有化方法1.2示例代码classPerson():p_num=0#用于统计数量def__init__(self,name,age,sex,job):#__name为私有化属性self.__name=nameself.age=ageself.sex=sexself.job=job#调用私有化属性的方法defget_nam
SSS4362
·
2024-01-08 03:37
python入门学习
python
入门学习
封装
继承
多态
Python入门
学习篇
(十五)——定义类&实例化对象
1类的理解类就是一个用于进行对象实例化的模板2定义类2.1语法规则class自定义类名():非基础属性#用于计数之类的数据构造方法(__init__)#通常在构造方法里面进行基础属性的初始化自定义私有方法#理解成类的功能自定义公有方法#注意:自定义类名需要遵循大驼峰命名规则,即从类的首个单词起,每个单词首字母大写,剩余其他部分均小写2.2实例代码classPerson():p_num=0#用于统计
SSS4362
·
2024-01-08 03:37
python入门学习
python
入门学习
定义类
实例化对象
F. linux:帮助命令help、man、info
[root@
hadoop
01udisk]#ls--help[root@
hadoop
01udisk]#manls[root@
hadoop
01udisk]#infols
小猪Harry
·
2024-01-08 00:40
25、Spark核心编程之RDD持久化详解
不使用RDD持久化的问题首先看一段代码JavaRDDlinesRDD=javaSparkContext.textFile("hdfs://
hadoop
-100:9000/testdate/1.txt")
ZFH__ZJ
·
2024-01-07 23:21
Hive元数据迁移及升级方案
Hive的架构和工作原理简介Hive是基于
Hadoop
之上的数仓,便于用户可以基于SQL(HiveQL)进行数据分析,其架构图如下:从上图可知,Hive主要用来将建立结构化数据库和后端分布式结构化文件的映射
云原生大数据
·
2024-01-07 22:49
大数据技术
hive
hadoop
数据仓库
驱动
学习篇
随记,不定时更新驱动相关知识,累积驱动开发相关经验一、知识点1.bios与vbios的区别BIOS(BasicInput/OutputSystem)和VBios(VideoBIOS)是计算机系统中的两个不同的组成部分,它们具有以下区别:功能不同:BIOS是计算机系统的基本输入/输出系统,负责启动计算机、初始化硬件设备和提供基本的操作系统功能。它包含了一些固化的程序和设置,用于管理计算机系统的硬件和
@宁兰
·
2024-01-07 20:10
驱动开发
linux
hadoop
调优
hadoop
调优1HDFS核心参数1.1NameNode内存生产配置1.1.1NameNode内存计算每个文件块大概占用150byte,如果一台服务器128G,能存储的文件块如下128(G)*1024(
健鑫.
·
2024-01-07 18:25
Hadoop
hadoop
hdfs
大数据
hadoop
调优(二)
hadoop
调优(二)1HDFS故障排除1.1NameNode故障处理NameNode进程挂了并且存储数据丢失了,如何恢复NameNode?
健鑫.
·
2024-01-07 18:25
Hadoop
hadoop
大数据
hdfs
熟悉HDFS常用操作
1.利用
Hadoop
提供的Shell命令完成下列任务(1)向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件。#检查文件是否存在.
cwn_
·
2024-01-07 17:11
大数据
hdfs
hadoop
大数据
linux
虚拟机
熟悉HBase常用操作
1.用
Hadoop
提供的HBaseShell命令完成以下任务(1)列出HBase所有表的相关信息,如表名、创建时间等。
cwn_
·
2024-01-07 17:11
大数据
hbase
数据库
大数据
惊心动魄的
Hadoop
-6小时350T数据恢复
Hadoop
在调整前,将
Hadoop
进行关闭.stop-all.sh进行关闭我们在第一步进行关闭的时候这里就出现问题。
胖琪的升级之路
·
2024-01-07 17:17
Hive入门
一、Hive概述1.1Hive简介Hive是基于
Hadoop
的一个数据仓库工具,它可以将结构化或半结构化的数据文件转化为一张数据库表,并提供简单的sql查询功能。
爱过java
·
2024-01-07 17:04
hive
linux下spark的python编辑_如何在Linux下构建Spark Python编程环境
火花编程环境Spark可以独立安装或与
Hadoop
一起使用.在安装Spark之前linux的python编程环境,首先请确保您的计算机上已安装Java8或更高版本.火花安装访问Spark下载页面,然后选择最新版本的
weixin_39543478
·
2024-01-07 13:10
linux下spark的python编辑_Linux下搭建Spark 的 Python 编程环境的方法
Spark编程环境Spark可以独立安装使用,也可以和
Hadoop
一起安装使用。在安装Spark之前,首先确保你的电脑上已经安装了Java8或者更高的版本。
weixin_39752800
·
2024-01-07 13:10
virtualbox的下载,打开.vdi文件并启动
Hadoop
系统
目录一、virtualbox的下载二、新建Ubuntu系统1、确定好镜像系统的位置2、新建虚拟系统三、
Hadoop
系统的启动1、启动
Hadoop
2、启动hbase3、启动spark4、启动hive5、
hadoop
汤汤upup
·
2024-01-07 13:08
hadoop
linux
大数据
Linux系统下Spark的下载与安装(pyspark运行示例)
最近需要完成数据课程的作业,因此实践了一下如何安装并配置好spark1、版本要求由于我想要将
hadoop
和spark一起使用,因此必须确定好spark的版本Spark和
Hadoop
版本对应关系如下:Spark
汤汤upup
·
2024-01-07 13:06
spark
大数据
分布式
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他