E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
2023.11.17
hadoop
之HDFS进阶
目录HDFS的机制元数据简介元数据存储流程:namenode生成了多个edits文件和一个fsimage文件edits和fsimage文件SecondaryNameNode辅助NameNode的方式:HDFS的存储原理写入数据原理:发送写入请求,获取主节点同意,开始写入,写入完成读取数据原理:发送读取请求,获取主节点同意,开始读取,读取完成HDFS安全机制HDFS归档机制HDFS垃圾桶机制分布式存
白白的wj
·
2023-11-19 08:35
hdfs
hadoop
大数据
sql
database
hive
redis 笔记
笔记概述技术分类解决功能性的问题:Java,Jsp,Tomcat,Html,RDMS,Linux解决扩展性的问题:Spring,SpringMVC,Mybatis解决性能的问题:NoSQL,Java线程,
Hadoop
nosql
jie_1024
·
2023-11-19 07:56
java
redis
基于
Hadoop
的绿色出行交通路线规划系统设计与实现开题报告
学院名称年级专业班级学生学号学生姓名指导教师工号指导教师姓名任务书题目最终题目基于
Hadoop
的绿色出行交通路线规划系统设计与实现本课题的总体设计目标:随着经济发展,交通需求不断增长,交通拥堵问题已经成为世界各国城市发展面临的重要问题
程序源码123
·
2023-11-19 07:46
开题报告
任务书
论文
hadoop
大数据
分布式
信息可视化
服务器
数据库
数据分析
ClickHouse的分片和副本
DataReplication|ClickHouseDocs1.1副本写入流程1.2配置步骤(1)启动zookeeper集群(2)在
hadoop
102的/etc/clickhouse-server/config.d
shangjg3
·
2023-11-19 05:27
ClickHouse
clickhouse
大数据
数据仓库
shell脚本写法(以zookeeper启动终止脚本为例)
1.在/bin目录下建立想要的脚本文件,以zookeeper为例[qurui@
hadoop
102~]$cd/bin#进入目录[qurui@
hadoop
102~]$sudovimzk.sh#打开文件,sudo
枫锦旧曾谙
·
2023-11-19 05:32
大数据
大数据
hadoop
zookeeper
《大数据时代》读书笔记
介绍了随之而来的
hadoop
大数据处理技术,同时通过各行业的例子说明了当今时代,数据增速超过以往任何一个时代,海量数据将会最终产生质变,改变这
Lucia夏天呀
·
2023-11-19 05:44
zookeeper简单应用&分布式锁实现
zookeeper的客户端原生客户端的使用Curatorzk简单的分布式锁实现Zookeeper的作用ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
Life journey
·
2023-11-19 04:06
框架专题
个人日记
zookeeper
分布式
HDFS架构
目录一,HDFS简介二、HDFS架构三、HDFS的工作机制一,HDFS简介①HDFS概念:
Hadoop
DistributedFileSystem,是
Hadoop
项⽬的核⼼⼦项⽬,是分布式计算中数据存储管理的基础
cx330上的猫
·
2023-11-19 04:29
hdfs
hadoop
架构
大数据之数据迁移sqoop的安装
1、sqoop的简介Sqoop是一种用于在Apache
Hadoop
和结构化数据存储(如关系型数据库)之间进行快速有效数据转移的工具。
bigdata从入门到放弃
·
2023-11-19 03:09
数据仓库
sqoop
hadoop
大数据
sqoop
hadoop
hive
数据库
数据仓库
数据分析
linux的免密登录
Hadoop
是一种分布式计算平台,由多台计算机组成的集群协同工作,实现数据存储、处理和分析等任务。在
Hadoop
集群中,对于不同节点之间的通信,需要进行身份验证和安全加密,以确保数据传输的安全性。
bigdata从入门到放弃
·
2023-11-19 03:38
hadoop
linux
linux
大数据
运维
密码学
hadoop
linux中
hadoop
伪分布搭建
1、什么是
hadoop
?
Hadoop
是一个开源的分布式数据处理框架,旨在处理大规模数据集并能够在普通硬件集群上实现高性能和可靠性。
bigdata从入门到放弃
·
2023-11-19 03:38
hadoop
linux
hadoop
运维
大数据
big
data
Hadoop
面试题
Hadoop
要点1、
Hadoop
运行模式2、
Hadoop
的组成4、block份数和大小默认配置5、HDFS读写数据流程(★)6、节点距离和机架感知(副本存储节点选择)(☆)7、SecondaryNameNode8
果子哥丶
·
2023-11-19 02:45
#
Hadoop
大数据
hadoop
3️⃣
Hadoop
1.
Hadoop
1.1.
Hadoop
是什么?分布式系统基础架构。主要解决海量数据的存储和海量数据的分析计算问题。
Hadoop
生态圈。
WovJf
·
2023-11-19 02:42
hadoop
大数据
分布式
Hive的安装
-3.1.2-bin.tar.gz上传到linux的/opt/software目录下2)解压apache-hive-3.1.2-bin.tar.gz到/opt/module/目录下面[atguigu@
hadoop
102software
咱家不怕酸
·
2023-11-19 00:46
hive
CentOS6.5下安装Hive2.0.0详解及其报错解决办法
www.centoscn.com/image-text/install/2016/0504/7167.html本文环境如下:操作系统:CentOS6.564位Hive版本:2.0.0JDK版本:1.8.064位
Hadoop
fire-ang
·
2023-11-19 00:45
大数据开发
hive
CentOS7基于
Hadoop
2.7.3安装Hive 2.1.1
1.前言说明:安装hive前提是要先安装
hadoop
集群,并且hive只需要再
hadoop
的namenode节点集群里安装即可(需要再所有namenode上安装),可以不在datanode节点的机器上安装
李天泉
·
2023-11-19 00:14
Hive
大数据课程00——[基础篇]
大数据学习
入门
文章作者邮箱:
[email protected]
地址:广东惠州▲前置知识一、编程语言至少应该掌握一门编程语言,计算机专业的同学大多学的第一门编程语言是C语言,然后再学Java语言,对于零基础的同学,可直接学习Java语言,至少应该把JavaSE阶段学完!二、计算机基础如果你是计算机相关专业,相信你这些基础都已经会了,可以直接略过本节,往下看。但是如果你是零基础,还是需要先掌握下计算机行业必备知
伟雄
·
2023-11-19 00:44
大数据
学习
单例模式
Hadoop
学习笔记——入门基础
Hadoop
优势高可靠性:
Hadoop
底层维护多个数据副本,所以即使
Hadoop
某个计算元素或存储出现故障,也不会导致数据的丢失。
枫落@
·
2023-11-19 00:40
hadoop
学习
笔记
【学习笔记】大数据技术之
Hadoop
(入门)
大数据技术之
Hadoop
1.概念1.1
Hadoop
是什么?
在学习的王哈哈
·
2023-11-18 23:38
大数据
hadoop
big
data
学习
Spark学习——1.代表性大数据技术
1.代表性的大数据技术
Hadoop
SparkFlinkBeam主要计算模式如图1-11.1
Hadoop
Hadoop
的生态系统图如图1-2开源谷歌GFS,利用MapReduce分布式并行编程,MapReduce
楓尘林间
·
2023-11-18 23:37
Spark
Spark
大数据学习
使用Jupyter Notebook调试PySpark程序错误总结
项目场景:在Ubuntu16.04
hadoop
2.6.0spark2.3.1环境下简单调试一个PySpark程序,中间遇到的错误总结(发现版对应和基础配置很重要)注意:在前提安装配置好
hadoop
hiveanacondajupyternotebooksparkzookeeper
Keep Doing this
·
2023-11-18 23:52
spark
jupyter
python
spark
hadoop
学习笔记1了解流程大概
海量数据的存储hdfs海量数据的计算:mapreducehdfs概述namenode:元数据,存储在哪个节点,存储什么信息datanode:存储数据2nn:备份namenode的信息yarn概述负责集群资源的管理ResourceManger:服务器运行的老大nodemanger:单个服务器运行的老大MapReduce架构概述mapreduce将计算分为两个阶段:map阶段把任务分下去reduce阶
小美元
·
2023-11-18 20:06
hadoop
学习
大数据
服务搭建篇(六) 搭建基于Kafka + Zookeeper的集群
一.Zookeeper1.什么是ZookeeperZooKeeper是一个开源的分布式协调框架,是Apache
Hadoop
的一个子项目,主要用来解决分布式集群中应用系统的一致性问题。
lingering fear
·
2023-11-18 20:32
kafka
java-zookeeper
zookeeper
kafka_2.12-3.1.0集群安装配置(zookeeper-3.6.3)
2.12-3.1.0安装环境安装步骤1、下载安装包2、修改配置文件修改server.properties添加环境变量3、启动kafka安装kafka_2.12-3.1.0安装环境CentOS版本:7.9
Hadoop
Sofia_yaya
·
2023-11-18 20:52
kafka
zookeeper
hadoop
【Python大数据笔记_day10_Hive调优及
Hadoop
进阶】
hive调优hive官方配置url:ConfigurationProperties-ApacheHive-ApacheSoftwareFoundationhive命令和参数配置hive参数配置的意义:开发Hive应用/调优时,不可避免地需要设定Hive的参数。设定Hive的参数可以调优HQL代码的执行效率,或帮助定位问题。然而实践中经常遇到的一个问题是,为什么我设定的参数没有起作用?这是对hive
LKL1026
·
2023-11-18 19:33
Python大数据学习笔记
大数据
hadoop
hive
笔记
Flink原理与实现:详解Flink中的状态管理
硬刚大数据系列文章链接:2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之
Hadoop
/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021
王知无(import_bigdata)
·
2023-11-18 19:59
大数据成神之路
flink
big
data
spark
使用Docker快速部署
hadoop
测试集群
目录背景第一部分Docker镜像准备第二部分运行容器第三部分cloudera-manager管理第四部分组件使用测试第五部分总结参考文献及资料背景通常在个人笔记本上部署
Hadoop
测试集群(含生态圈各组件
数据科学和工程
·
2023-11-17 18:36
hadoop
Docker
hadoop
docker
大数据
hbase的学习逻辑_
Hadoop
学习笔记之十六——HBase框架学习(基础知识篇)
HBase是Apache
Hadoop
的数据库,能够对大型数据提供随机、实时的读写访问。HBase的目标是存储并处理大型的数据。
weixin_39574140
·
2023-11-17 16:02
hbase的学习逻辑
大数据开发学习笔记
前言:本文介绍了各个大数据开发框架及数据库的学习记录链接有什么问题欢迎大家留言或者私信交流~
Hadoop
hadoop
集群搭建+hive安装_
hadoop
集群安装hive-CSDN博客
Hadoop
基础入门
THE WHY
·
2023-11-17 16:01
大数据
大数据
学习
笔记
运行示例sparkPi计算圆周率(1.1)
1启动spark(1)启动
hadoop
启动成功master节点进程:Slave节点进程:(2)启动spark(注意路径)启动成功:Slave1和slave2的进程如下:2将sparkPi.scala添加进工程
探索者tl
·
2023-11-17 14:04
云计算
sparkPi
安装关系型数据库MySQL和大数据处理框架
Hadoop
1.简述
Hadoop
平台的起源、发展历史与应用现状。列举发展过程中重要的事件、主要版本、主要厂商;国内外
Hadoop
应用的典型案例。
weixin_30621919
·
2023-11-17 13:14
数据库
嵌入式
大数据
The specified database user/password combination is rejected: [ 08S01] Could not open client transpo
Thespecifieddatabaseuser/passwordcombinationisrejected:[08S01]CouldnotopenclienttransportwithJDBCUri:jdbc:hive2://
hadoop
102
挽风821
·
2023-11-17 13:33
大数据
数据库
hive
mysql怎么迁移到
hadoop
_Mysql 与
hadoop
数据同步(迁移),你需要知道 Sqoop
上篇文章Mysql到Hbase数据如何实时同步,强大的Streamsets告诉你我们说到了如何使用Streamsets来进行mysql到hbase的数据实时同步(迁移)。使用Streamsets的优点是部署简单,配置灵活,无需编写代码。认真阅读上篇文章的朋友会发现,Streamsets能够实时跟踪数据的变化,将数据同步更新到hbase中。但是对于历史数据(并且数据不改动的记录)的同步,文章中并没有
铑慇獬廌
·
2023-11-17 11:40
Python大数据之linux学习总结——day07_hive03
hive03分区表[练习]一级分区知识点:示例:多级分区知识点:示例:分区表知识点:示例:
hadoop
_hive文档分桶表[练习]重要参数基础分桶表:知识点:示例:分桶表排序:知识点:示例:随堂练习注意事项
笨小孩124
·
2023-11-17 09:46
hive
学习总结
python
大数据
linux
自定义output文件,并指定输出的文件路径以及文件名
有如下文件,需要将itstar输出到一个文件,其他的输出到另一个文件,并自定义输出文件路径与文件名1:定义FilterMap类packageOutputFormat;importorg.apache.
hadoop
.io.LongWritable
zhanglei_16
·
2023-11-17 07:51
hadoop
《网易-数据中台》学习笔记
《网易-数据中台》学习笔记1.大数据发展历程1.1数据仓库1.2
Hadoop
-数据湖1.3大数据平台1.4数据中台1.5Next:大数据+人工智能2.数据仓库2.1数据仓库建模2.1.1E-R模型2.1.2
杰克jk船长
·
2023-11-17 07:15
数据治理
学习
笔记
数据仓库
大数据
大数据毕业设计选题推荐-机房信息大数据平台-
Hadoop
-Spark-Hive
✨作者主页:IT研究室✨个人简介:曾从事计算机专业培训教学,擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。☑文末获取源码☑精彩专栏推荐⬇⬇⬇Java项目Python项目安卓项目微信小程序项目文章目录一、前言二、开发环境三、系统界面展示四、代码参考五、论文参考六、系统视频结语一、前言随着信息技术的飞速发展,机
IT研究室
·
2023-11-17 06:59
大数据项目
大数据
hadoop
课程设计
C && C++ && git && tcpip
aobai219/article/details/1596964C语言添加宏开关https://www.cnblogs.com/zht-blog/p/4036935.htmlPython+Spark2.0+
Hadoop
happylzs2008
·
2023-11-17 05:21
Nginx
98.8秒夺冠,解析腾讯云数智背后的架构与算法优化
在更早前,百度创造的纪录是716秒,
Hadoop
的记录是4222秒。\\在这次竞赛中,腾讯云数智分布式计算平台,夺得SortBenchmark大赛GraySort和MinuteSo
weixin_34187862
·
2023-11-17 04:31
大数据
运维
人工智能
大数据系列-
Hadoop
集群搭建(2)集群配置
上篇已经把
Hadoop
安装到各虚拟机(大数据系列-
Hadoop
集群搭建(1)),本篇通过认识
Hadoop
,规划虚拟机部署。
zhm6422107
·
2023-11-17 03:59
大数据
hadoop
big
data
hdfs
大数据平台搭建之hive本地模式安装
它建立在
Hadoop
上,并提供了类似于传统数据库的查询和分析功能。
bigdata从入门到放弃
·
2023-11-17 03:58
hive
大数据
hive
hadoop
linux
服务器
数据仓库
4
hadoop
HDFS集群搭建-伪分布式模式
hadoop
旧版网址:http://
hadoop
.apache.org/old/2.6.5版本ssh协议在免密登陆其他机器的时候,不会加载其他机器的环境变量。
没有女朋友的程序员
·
2023-11-17 03:28
大数据开发
大数据入门---1.大数据介绍
我们的
hadoop
就是在这样的场景下应运而生的1.
HADOOP
背景介绍1.1什么是
HADOOP
(1)
HADOOP
是apache旗下的一套开源软件平台(2)
HADOOP
提供的功能:利用服务器集群,根据用户的自定义业务逻辑
学无止境的大象
·
2023-11-17 03:57
#
大数据
hadoop
spark
hdfs
mapreduce
kafka
大数据之
hadoop
-hdfs完全分布式环境搭建(详细步骤真实可用)
1,服务器规划本次服务搭建是在原有伪分布式的基础上进行搭建,伪分布式的搭建,参照伪分布式搭建节点NNSNNDNnode01※––node02※※node03––※node04––※2,基础设施jps检查jdk1.8安装,检查网络是否正常,配置hostvim/etc/hosts10.0.0.11node0110.0.0.12node0210.0.0.13node0310.0.0.14node04[r
shw12357
·
2023-11-17 03:27
hadoop
大数据
大数据之
hadoop
-hdfs伪分布式环境搭建(详细步骤真实可用)
目录版本1,基础设施2,
Hadoop
的配置(应用的搭建过程)3,启动4,简单使用5,上传自定义块的大小版本centos7+jdk1.8+
hadoop
2.6.51,基础设施设置网络:vi/etc/sysconfig
shw12357
·
2023-11-17 03:56
hadoop
大数据-
hadoop
HA
大数据-
hadoop
HA大数据-
hadoop
HAHACAP原则Paxos算法Federation实操大数据-
hadoop
HAHA主从集群:结构相对简单,主与从协作主:单点,数据一致好掌握问题:单点故障,
Ybb_studyRecord
·
2023-11-17 03:26
大数据
大数据
hadoop
hdfs
HA
大数据分布式集群搭建(5)
下面我们来操作大数据中的重头戏
Hadoop
1.
HADOOP
背景介绍1.1什么是
HADOOP
1.
HADOOP
是apache旗下的一套开源软件平台2.
HADOOP
提供的功能:利用服务器集群,根据用户的自定义业务逻辑
KongX_B
·
2023-11-17 03:25
大数据
大数据
hadoop
分布式
集群
大数据-
hadoop
入门与部署
大数据-
hadoop
入门与部署大数据-
hadoop
入门与部署启蒙分治思想单机处理大数据问题集群分布式处理大数据的辩证
Hadoop
Hadoop
项目/生态
hadoop
-hdfs存储模型架构设计角色功能元数据持久化安全模式
Ybb_studyRecord
·
2023-11-17 03:25
大数据
hadoop
大数据
分布式
安装
大数据原生环境搭建笔记
搭建
Hadoop
分布式环境:1、安装jdk1.82、上传
Hadoop
环境包3、配置环境变量在/etc/profile配置文件中JAVA_HOME和
HADOOP
_HOME,代码如下:exportJAVA_HOME
qianzhina
·
2023-11-17 03:55
Hadoop分布式搭建
离线集群平台搭建-HDP
一.背景大数据相关的所有建设依托于大数据的基础设施.基础设施一定包含了集群平台的搭建.目前市场上常用的有三种方式做集群平台的搭建;第一种为使用原生的apache(
hadoop
,hive,spark)等相关大数据软件构建集群平台
会飞的boy
·
2023-11-17 03:53
ambari
hadoop
大数据
大数据
hadoop
centos
上一页
56
57
58
59
60
61
62
63
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他