Hadoop学习篇第25页

大数据平台比较-CDH、HDP、CDP

ApacheHadoop与CDH、HDP的比较一、Hadoop版本综述不收费的Hadoop版本主要有三个（均是国外厂商），分别是：Apache（最原始的版本，所有发行版均基于这个版本进行改进）Cloudera

Sql强·2024-01-09 07:24

头歌：旅游网站之数据分析

关统计每个城市的宾馆平均价格packagecom.processdata;importjava.io.IOException;importjava.util.Scanner;importorg.apache.hadoop.conf.Configuration

爱吃肉的白熊·2024-01-09 07:32

hive的基本操作

最近新学了hive，想通过写文章的方式对所学知识进行巩固，同时希望可以帮助到大家Hive是基于Hadoop的一个数据仓库工具1.创建数据库（创建方法是和Mysql一样的）createdatabase数据库名字

暴打小赵·2024-01-09 06:49

实验6 熟悉Hive的基本操作

一、实验目的（1）理解Hive作为数据仓库在Hadoop体系结构中的角色。（2）熟练使用常用的HiveQL。

Z.Q.Feng·2024-01-09 06:47

1.2 Hadoop概述

小肥柴的Hadoop之旅1.2Hadoop概述目录1.2Hadoop概述1.2.1回归问题1.2.2Google的三篇论文1.2.3Hadoop的诞生过程1.2.4Hadoop特点简介参考文献和资料)目录

卷毛迷你猪·2024-01-09 06:47

hive基本操作与应用

1、通过hadoop上的hive完成WordCount启动hadoop2、Hdfs上创建文件夹/3、上传文件至hdfs4、启动Hive5、创建原始文档表6、导入文件内容到表docs并查看7、用HQL进行词频统计

weixin_34416649·2024-01-09 06:16

物理机搭建hive

一、修改Hadoop配置修改core-site.xml配置yarn-site.xml分发文件，然后重启集群二、Hive解压安装上传文件添加hive环境便量，source生效启动高可用集群，启动hive三

DIY……·2024-01-09 06:45

数仓分层结构

--日志数据--格式:JSON--业务数据--历史数据--格式:--全量--Datax:TSV--增量--Maxwell:JSON--汇总数据--希望用最少的资源存储最多的数据--压缩：--gzip：Hadoop

Young_IT·2024-01-09 06:40

大数据开发-某外包公司

varchar和char区别4.说下数据库的事务5.spark的部署模式有哪些6.数据库和数据仓库的区别7.内部表和外部表的区别8.说下数据中台、数据仓库和数据湖的区别9.说下公司的建模模型10.说下hadoop

劝学-大数据·2024-01-09 06:10

hadoop集群搭建、spark集群搭建、pyspark搭建（linux+window）

1、前言本文记录学习过程中Hadoop、zookeeper、spark集群搭建，主要为pyspark库服务（具体为window上pyspark环境和pyspark库，linux上spark框架、pyspark

Lfx_come on·2024-01-09 06:02

学习学习再学习

day8默默耕耘共读打卡学习篇很高兴今天是最后一天打卡，为坚持到最后一天的自己鼓掌，怎么忽然感觉有点不舍呢！

48c93eb524c8·2024-01-09 04:17

『HDFS』伪分布式Hadoop集群

博客引流本文是『Hadoop』MapReduce处理日志log(单机版)的旭文,maybe还有后续在搭建环境的时候发现很难搜到合适的教程，所以这篇应该会有一定受众伪分布式就是假分布式，假在哪里，假就假在他只有一台机器而不是多台机器来完成一个任务

gunjianpan·2024-01-09 04:31

ROS中接收消息并保存数据，rosbag和rqt_plot的使用

参考的博客：ROS总结——录制和回放数据ROS学习篇（七）rostopic消息记录、回放、转.txtROS相关：使用rospy编写ros程序并使用rosbag存储数据//这个

lovelybreeze·2024-01-08 21:02

Hadoop3.3.5云服务器安装教程-单机/伪分布式配置

系列文章目录华为云服务器试用领取领取的试用云服务器在哪Hadoop3.3.5云服务器安装教程-单机/伪分布式配置文章目录系列文章目录创建hadoop用户更新apt安装SSH、配置SSH无密码登陆安装Java

柔雾·2024-01-08 21:48

2021-11-22 Zookeeper Shell脚本

/bin/bashcase$1in"start"){foriinhadoop102hadoop103hadoop104doecho----------zookeeper$i启动------------ssh

不爱吃奶昔（zsl0）·2024-01-08 19:12

hadoop/etc/hadoop 下没有mapred-site.xml，只有mapred.xml.template

默认情况下，/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件，我们要复制该文件，并命名为mapred.xml，该文件用于指定MapReduce

比特小怪兽·2024-01-08 19:34

hadoop命令汇总

启动和关闭hadoop服务一键启动/停止start-hdf.shstop-hdf.sh单进程关闭启动hdfs--daemonstop/start/statusnamenode或者hadoop--daemonstop

你很棒滴·2024-01-08 19:17

HDFS常用命令（方便大家记忆版）

1.文件操作(1)列出HDFS下的文件/usr/local/hadoop$bin/hadoopdfs-ls(2)列出HDFS文件下名为in的文档中的文件/usr/local/hadoop$bin/hadoopdfs-lsin

姚兴泉·2024-01-08 18:01

Hidataplus-3.3.2.0-005公测版本基于openEuler release 22.03 (LTS-SP2)的测试

测试角色如下：hadoop、yarn、zookeeper、hive、impala。

杨航的技术博客·2024-01-08 16:35

给Hadoop初学者的一些建议

零基础学习hadoop,没有想象的那么困难，也没有想象的那么容易。从一开始什么都不懂，到能够搭建集群，开发。整个过程，只要有Linux基础，虚拟机化和java基础，其实hadoop并没有太大的困难。

丨程序之道丨·2024-01-08 15:29

准高三一定要知道的50件事，现在看正是时候！

学习篇1.多读书，做好读书笔记，时刻翻看。2.上课认真听讲，下课多找老师提问。3.学会筛选资料，把下发的试卷分类，将不需要的扔掉。4.学会利用手机学习，如背单词、看新闻。恩，还有简单高中生。

风中有奇缘·2024-01-08 14:39

林宥嘉的寒假生活

一、学习篇作为一名小学生，虽然我们放假了，但学习仍然是首要任务。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App

微微上扬的小帅·2024-01-08 13:12

大数据技术期末复习第七章——MapReduce练习

A、Map函数将输入的元素转换成形式的键值对B、Hadoop框架是用Java实现的，MapReduce应用程序则一定要用Java来写C、不同的Map任务之间不能互相通信D、MapReduce框架采用了Master

锦鲤儿·2024-01-08 12:01

Hadoop学习之路（四）HDFS 读写流程详解

1.HDFS写操作1.1图解HDFS读过程hdfs写操作流程图.pngimage.png1.2数据写入过程详解1、使用HDFS提供的客户端Client,向远程的NameNode发起RPC请求；2、NameNode会检查要创建的文件是否已经存在，创建者是否有权限进行操作，成功则会为文件创建一个记录，否则会让客户端抛出异常；3、当客户端开始写入文件的时候，客户端会将文件切分为多个packets，并在内

shine_rainbow·2024-01-08 12:21

Win10环境下Hadoop(单节点伪分布式)的安装与配置--bug(yarn的8088端口打不开+)

Win10环境下Hadoop(单节点伪分布式)的安装与配置--bug(yarn的8088端口打不开+)一、本文思路【1】、配置java环境–JDK12（Hadoop的底层实现语言是java,hadoop

老妹儿的·2024-01-08 11:19

实战Flink Java api消费kafka实时数据落盘HDFS

flink版本1.13kafka版本0.8hadoop版本3.1.42实验过程2.1启动服务程序为了完成Flink从Kafka消费数据

大数据程序终结者·2024-01-08 11:13

JanusGraph简介

JanusGraph支持Hadoop框架，并能够利用Hadoop对图进行大批量的处理和分

娃娃学软件·2024-01-08 10:15

大数据 Yarn - 资源调度框架

Hadoop主要是由三部分组成，除了前面我讲过的分布式文件系统HDFS、分布式计算框架MapReduce，还有一个是分布式集群资源调度框架Yarn。

善守的大龙猫·2024-01-08 10:48

Hadoop、Pig、Hive、Storm、NOSQL 学习资源收集【Updating】 (转)

我爱大海V5·2024-01-08 08:15

《深入理解Hadoop（原书第2版）》——2.4 Hadoop 2.0

本节书摘来自华章计算机《深入理解Hadoop（原书第2版）》一书中的第2章，第2.4节，作者[美]萨米尔·瓦德卡（SameerWadkar），马杜·西德林埃（MadhuSiddalingaiah），杰森

weixin_34174322·2024-01-08 08:44

Flume基础知识（十）：Flume 聚合实战

1）案例需求：hadoop100上的Flume-1监控文件/opt/module/group.log，hadoop101上的Flume-2监控某一个端口的数据流，Flume-1与Flume-2将数据发送给

依晴无旧·2024-01-08 08:23

Hadoop精选18道面试题(附回答思路)

1.简述Hadoop1和Hadoop2的架构异同HDFSHA(HighAvailablity)一旦Active节点出现故障，就可以立即切换到Standby节点，避免了单点故障问题。

Byyyi耀·2024-01-08 06:00

Unrecognized option: -v Error: Could not create the Java Virtual Mac

yarn报错Unrecognizedoption:-vError:CouldnotcreatetheJavaVirtualMac这是因为jdk和hadoop或者是其他的在环境变量path中，因为yarn.cmd

꧁“杂货店”꧂·2024-01-08 04:39

Python入门学习篇(十六)——类属性和方法

1属性1.1公有属性1.1.1书写语法规则self.公有属性名#书写位置是在__init__方法里面#注意:公有属性名的前缀不能是__1.1.2调用语法规则对象名.公有属性名1.1.3示例代码classPerson():p_num=0#用于统计数量def__init__(self,name,age,sex,job):#self代表当前实例化对象self.name=nameself.age=ages

SSS4362·2024-01-08 03:07

Python入门学习篇(十七)——封装、继承、多态

1封装1.1理解属性和方法书写到类里面的操作即为封装封装可以理解成私有化属性和私有化方法1.2示例代码classPerson():p_num=0#用于统计数量def__init__(self,name,age,sex,job):#__name为私有化属性self.__name=nameself.age=ageself.sex=sexself.job=job#调用私有化属性的方法defget_nam

SSS4362·2024-01-08 03:37

Python入门学习篇(十五)——定义类&实例化对象

1类的理解类就是一个用于进行对象实例化的模板2定义类2.1语法规则class自定义类名():非基础属性#用于计数之类的数据构造方法(__init__)#通常在构造方法里面进行基础属性的初始化自定义私有方法#理解成类的功能自定义公有方法#注意:自定义类名需要遵循大驼峰命名规则,即从类的首个单词起，每个单词首字母大写,剩余其他部分均小写2.2实例代码classPerson():p_num=0#用于统计

SSS4362·2024-01-08 03:37

F. linux：帮助命令help、man、info

[root@hadoop01udisk]#ls--help[root@hadoop01udisk]#manls[root@hadoop01udisk]#infols

小猪Harry·2024-01-08 00:40

25、Spark核心编程之RDD持久化详解

不使用RDD持久化的问题首先看一段代码JavaRDDlinesRDD=javaSparkContext.textFile("hdfs://hadoop-100:9000/testdate/1.txt")

ZFH__ZJ·2024-01-07 23:21

Hive元数据迁移及升级方案

Hive的架构和工作原理简介Hive是基于Hadoop之上的数仓，便于用户可以基于SQL（HiveQL）进行数据分析，其架构图如下:从上图可知，Hive主要用来将建立结构化数据库和后端分布式结构化文件的映射

云原生大数据·2024-01-07 22:49

驱动学习篇

@宁兰·2024-01-07 20:10

hadoop调优

hadoop调优1HDFS核心参数1.1NameNode内存生产配置1.1.1NameNode内存计算每个文件块大概占用150byte，如果一台服务器128G，能存储的文件块如下128(G)*1024(

健鑫.·2024-01-07 18:25

hadoop调优(二)

hadoop调优(二)1HDFS故障排除1.1NameNode故障处理NameNode进程挂了并且存储数据丢失了，如何恢复NameNode？

健鑫.·2024-01-07 18:25

熟悉HDFS常用操作

1.利用Hadoop提供的Shell命令完成下列任务（1）向HDFS中上传任意文本文件，如果指定的文件在HDFS中已经存在，由用户指定是追加到原有文件末尾还是覆盖原有的文件。#检查文件是否存在.

cwn_·2024-01-07 17:11

熟悉HBase常用操作

1.用Hadoop提供的HBaseShell命令完成以下任务（1）列出HBase所有表的相关信息，如表名、创建时间等。