E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs集群搭建
三,Hive的分桶详解
Hive分桶通俗点来说就是将表(或者分区,也就是
hdfs
上的目录而真正的数据是存储在该目录下的文件)中文件分成几个文件去存储。
__元昊__
·
2024-09-04 04:02
hive学习(五)
inpath'路径'[overwrite]intotable表名[partition(partcol1=val1,…)];特殊说明1)local:标识从本地加载数据到Hive表,若没有local的话从
HDFS
2301_79721847
·
2024-09-03 14:00
hive
学习
hadoop
hive学习记录
数据存储:Hive处理的数据存储在
HDFS
(HadoopDistributedFileSystem)上。执行引擎:Hive的
2302_80695227
·
2024-09-03 12:46
hive
学习
hadoop
基于分布式计算的电商系统设计与实现【系统设计、模型预测、大屏设计、海量数据、Hadoop集群】
Abstract1引言1.1研究背景1.2国内外研究现状1.3研究目的1.4研究意义2关键技术理论介绍2.1Hadoop相关组件介绍2.2分布式集群介绍2.3Pyecharts介绍2.4Flask框架3分布式
集群搭建
及数据准备
王小王-123
·
2024-09-03 04:54
hadoop
大数据
分布式
电商系统分析
分布式计算
Hadoop 中的大数据技术:调优篇(3)
HDFS
—故障排除NameNode故障处理需求NameNode进程崩溃且存储的数据丢失,如何恢复NameNode?
大数据深度洞察
·
2024-09-03 00:33
大数据
hadoop
分布式
经验笔记:Hadoop
Hadoop的核心是HadoopDistributedFileSystem(
HDFS
)和YARN(YetAnotherResourceNegotiator),这两个组件加上MapReduce编程模型,构成了
漆黑的莫莫
·
2024-09-02 03:54
随手笔记
笔记
hadoop
大数据
Ambari安装部署教程
前言之前尝试过使用Ambri安装
HDFS
集群,整个搭建的流程应该是记录的比较详细的,重新把资料整理了一下发布到博客,希望可以帮到有需要的人吧。
Aries_Chen_CSDN
·
2024-09-02 02:50
大数据
hadoop
ambari
/
hdfs
_to_mysql.sh: /bin/bash^M: 坏的解释器: 没有那个文件或目录
/
hdfs
_to_mysql.sh:/bin/bash^M:坏的解释器:没有那个文件或目录-bash:.
Alienware^
·
2024-09-01 23:28
错误积累
bash
mysql
hdfs
大数据毕业设计hadoop+spark+hive微博舆情情感分析 知识图谱微博推荐系统
Selenium自动化Python爬虫工具采集新浪微博评论、热搜、文章等约10万条存入.csv文件作为数据集;(二)使用pandas+numpy或MapReduce对数据进行数据清洗,生成最终的.csv文件并上传到
hdfs
qq_79856539
·
2024-09-01 11:16
javaweb
大数据
hadoop
课程设计
Hadoop技术栈
1.2hadoop的功能通常意义上,Hadoop是一个整体,其内部还会细分为三个功能组件,分别是:
HDFS
组件:
HDFS
是Hadoop内的
XingChen.
·
2024-08-31 16:48
分布式
hadoop
大数据
【Mysql】通过Keepalived搭建mysql双主高可用集群
VIP(虚拟ip)hadoop01192.168.10.200centos7_x865.7192.168.10.253hadoop03192.168.10.202centos7_x865.7二、mysql
集群搭建
两台节点
维运
·
2024-08-31 15:13
数据库
mysql
数据库
小白学习大数据测试之hadoop
hdfs
和MapReduce小实战
:新建一个文件test.txt,内容为HelloHadoopHelloxiaoqiangHellotestingbangHellohttp://xqtesting.sxl.cn将test.txt上传到
hdfs
大数据学习02
·
2024-08-30 11:39
虚拟机安装hadoop,hbase(单机伪集群模式)
就像当初做爬虫一样(虽然很简单),在数据爆发的现在,传统的数据库mysql,oracle显然在处理大数据量级的数据时显得力不从心,所以有些特定的业务需要引进能够处理大数据量的数据库,hadoop提供了分布式文件系统(
HDFS
流~星~雨
·
2024-08-29 21:31
大数据相关
hadoop
hbase
大数据
hive中的数据同步到hbase
关于hadoop,hive,hbase这三个技术栈我写了两篇博客简单的分享了我对这三个技术栈的一些看法,在我目前的认知里,hadoop提供
hdfs
这个组件来存储大数据量的数据(相比于mysql,oracle
流~星~雨
·
2024-08-29 21:31
大数据相关
hive
hbase
hadoop
HIVE 数据模型
type=hive集群状态管理:http://tdxy-bigdata-03:7180/cmf/home基于
HDFS
没有专门的数据
HFDYCYY
·
2024-08-29 19:47
大数据
HBase数据迁移实战
1.前期准备1.1确认集群使用的版本源HBase集群(以下称旧集群)和目的HBase集群(以下称新集群)的版本可能并不是一致的,特别是其底层所使用的
HDFS
版本信息。
网易数帆大数据
·
2024-08-29 16:25
大数据
HBase
网易云
Hbase离线迁移
假设是hbase集群,那么数据存储在
hdfs
上。1.关闭2个hbase2.使用distcp将
hdfs
上的hbase数据迁移到另一个【相同路径】的
hdfs
上。
我要用代码向我喜欢的女孩表白
·
2024-08-29 15:22
hbase
数据库
大数据
Openstack 与 Ceph
集群搭建
(下): Openstack部署
文章目录文章参考部署节点准备1.修改Host文件与hostname名称2.安装NTP软件3.网卡配置信息4.开启Docker共享挂载5.安装python虚拟环境6.安装kolla-ansible7.加载AnsiblegalaxyrequirementsOpenstack安装前预配置1.配置密码2.配置multinode文件3.修改全局配置文件Openstack正式安装1.启动bootstrap-s
范枝洲
·
2024-08-29 01:43
系统运维
openstack
ceph
Hdfs
的机架感知与副本放置策略
1.介绍Apachehadoop机架感知Hadoop分布式文件系统(
Hdfs
)作为ApacheHadoop生态系统的的核心组件之一,通过机架感知和副本放置策略来优化数据的可靠性,可用和性能.
Hdfs
的机架感知和副本放置策略是其设计的关键组成部分
sheansavage
·
2024-08-29 01:42
hdfs
hadoop
大数据
Hive 分区表 & 数据加载
1.Hive表数据的导入方式1.1本地上传至
hdfs
命令:
hdfs
dfs-put[文件名][
hdfs
绝对路径]例如:测试文件test_001.txt内容如下在
hdfs
绝对路径:/user/hive/warehouse
Wu_Candy
·
2024-08-28 18:22
大数据测试
hive
hadoop
hdfs
clickhouse
集群搭建
文章目录安装clickhouse修改集群配置文件启动clickhouse集群测试集群的可用性安装clickhouse本次用了4台服务器搭建clickhouse集群,使用rpm安装方式在4台服务器上安装clickhouse,步骤如下:sudoyuminstall-ycurlcurl-shttps://packagecloud.io/install/repositories/altinity/clic
颍天
·
2024-08-28 14:56
clickhouse
数据库
读写分离
集群搭建
目录一、配置读写分离集群1、环境说明2、数据准备3、配置主库GRP1_RWW_01配置dm.ini配置dmmal.ini配置dmarch.ini配置dmwatcher.ini启动主库设置OGUID修改数据库模式4、配置备库GRP1_RWW_02配置dm.ini配置dmmal.ini配置dmarch.ini配置dmwatcher.ini启动备库设置OGUID修改数据库模式5、配置备库GRP1_RWW
奥德彪的蕉
·
2024-08-28 11:41
达梦
数据库
服务器
oracle
sql
运维
SparkStreaming 如何保证消费Kafka的数据不丢失不重复
(1)一个Receiver效率低,需要开启多个线程,手动合并数据再进行处理,并且Receiver方式为确保零数据丢失,需要开启WAL(预写日志)保证数据安全,这将同步保存所有收到的Kafka数据到
HDFS
K. Bob
·
2024-08-28 10:02
Spark
Spark
打造扛得住的MySQL数据库架构视频教程-数据库结构优化 高可用架构设计
打造扛得住的MySQL数据库架构视频教程-数据库结构优化高可用架构设计30套数据库系列Mysql/SQLServer/Redis/Mongodb/Nosql精讲训练营项目实战,数据库设计,架构设计,性能管理,
集群搭建
cd137a460a79
·
2024-08-28 04:10
flink&paimon开发之一:创建catalog
开发环境IDEAFlink1.17.1Paimon0.5正式本地或
HDFS
存储参考链接paimonjavaAPIhttps://paimon.apache.org/docs/master/api/flink-api
leichangqing
·
2024-08-27 16:10
flink
大数据
paimon
Hive 数据迁移与备份
迁移类型同时迁移表及其数据(使用import和export)分步迁移表和数据迁移表(showcreatetable)迁移数据关联表和数据(msckrepair)迁移步骤将表和数据从Hive导出到
HDFS
linzeyu
·
2024-08-27 13:17
Hive
hive
big
data
hadoop
数据库基础:mysql主从
集群搭建
position:表示从file的哪个位置开始;binlog_do_db:表示同步哪一个库在后面的slave配置中,这三个结果都需要使用到。4.Slave(6.85)节点配置配置从库(1)修改my.cnf文件,在[mysqld]加入下面的内容:#服务的唯一编号server-id=2#开启mysqlbinlog功能log-bin=mysql-bin#binlog记录内容的方式,记录被操作的每一行bi
2401_84049040
·
2024-08-27 00:58
程序员
数据库
mysql
android
doris跨
hdfs
集群迁移数据
官网-数据备份步骤一,在dorisA集群执行:CREATEREPOSITORY`repotestall`WITHBROKER`broker_name`ONLOCATION"
hdfs
://xx.xx.xx.xx
州周
·
2024-08-27 00:27
hdfs
hadoop
大数据
基于Zookeeper搭建Kafka高可用集群
基于Zookeeper搭建Kafka高可用集群一、Zookeeper
集群搭建
为保证集群高可用,Zookeeper集群的节点数最好是奇数,最少有三个节点,所以这里搭建一个三个节点的集群。
数字游牧人0v0
·
2024-08-26 16:58
大数据BigData
kafka
java-zookeeper
zookeeper
大数据
zookeeper+KAFKA
集群搭建
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、集群管理等。因为Kafka集群是把状态信息保存在Zookeeper中的,并且Kafka的动态扩容是通过Zookeeper来实现的,所以需要优先搭建Zookeer
懵逼的运维弟弟
·
2024-08-26 16:28
Linux
zookeeper+KAFKA
集群搭建
Hadoop入门基础(五):Hadoop 常用 Shell 命令一网打尽,提升你的大数据技能!
1.2启动和停止Hadoop集群start-dfs.shstart-yarn.shstop-dfs.shstop-yarn.shstart-dfs.sh和stop-dfs.sh分别用于启动和停止
HDFS
william.zhang(张)
·
2024-08-25 15:52
大数据
Hadoop
容器
大数据
hadoop
分布式
HDFS
的编程
一、
HDFS
原理
HDFS
(HadoopDistributedFileSystem)是hadoop生态系统的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般,是最基础的一部分
卍king卐然
·
2024-08-25 07:02
hdfs
hadoop
大数据安全
web安全
经验分享
Redis
集群搭建
1.环境:centos6.7、redis-6.2.62.模式:5主+20丛+5备丛(即:1主-4从-1备丛)3.服务器环境检查及安装查看服务器是否安装了gccrpm-qgcc若没有安装,则进行gcc安装yuminstall-ygcc4.redis下载前往redis官网下载https://redis.io/downloadredis-6.2.6.tar.gz5.将redis-6.2.6.tar.gz
丿似锦
·
2024-08-24 21:00
数据库
redis
bootstrap
前端
Hadoop 的基本 shell 命令
Hadoop的基本shell命令主要用于与Hadoop分布式文件系统(
HDFS
)和MapReduce进行交互。
难以触及的高度
·
2024-08-24 14:22
hadoop
大数据
分布式
从零到一建设数据中台 - 关键技术汇总
一、数据中台关键技术汇总语言框架:Java、Maven、SpringBoot数据分布式采集:Flume、Sqoop、kettle数据分布式存储:Hadoop
HDFS
离线批处理计算:MapReduce、Spark
我码玄黄
·
2024-08-24 12:09
数据中台
数据挖掘
数据分析
大数据
达梦数据库DMDSC搭建
DMDSC目录前言DMDSC名词解析DMCSS控制节点(ControlNode)普通节点(NormalNode)DMCSS工作原理DMASMdmasvrmal搭建步骤准备共享盘初始化安装DM数据库软件
集群搭建
配置
大大大大大魔王丶
·
2024-08-23 20:21
数据库
Ubuntu下部署Hadoop集群+Hive(二)
Hadoop
集群搭建
准备环境hadoop-3.3.6.tar.gz,jdk-8u421-linux-x64.tar.gz根据自己的使用下载对的hadoop和jdk版本hadoop下载地址:ApacheHadoopJDK
岩屿
·
2024-08-23 14:46
hadoop
hive
大数据存储
曾经负责过一款底层存储系统的测试工作,最近看
hdfs
的文章发现,从架构上真心没啥特别大的区别。
龙哥vw
·
2024-08-22 02:32
Azkaban各种类型的Job编写
Linuxshell命令行任务gobblin:通用数据采集工具hadoopJava:运行hadoopMR任务java:原生java任务hive:支持执行hiveSQLpig:pig脚本任务spark:spark任务
hdfs
ToTeradata
__元昊__
·
2024-03-28 21:00
Linux(centos7)部署hive
前提环境:已部署完hadoop(
HDFS
、MapReduce、YARN)1、安装元数据服务MySQL切换root用户#更新密钥rpm--importhttps://repo.mysql.com/RPM-GPG-KEY-mysqL
灯下夜无眠
·
2024-03-28 12:44
Linux
linux
hive
运维
dbeaver
hive客户端
关于HDP的20道高级运维面试题
HDP(HortonworksDataPlatform)的主要组件包括Hadoop框架、
HDFS
、MapReduce、YARN以及Hadoop生态系统中的其他关键工具,如Spark、Flink、Hive
编织幻境的妖
·
2024-03-26 15:34
运维
【笔记】
HDFS
基础笔记
启动hadoop命令(未配环境变量):进入hadoop安装目录输入./sbin/start-dfs.sh已配环境变量:start-dfs.sh关闭hadoop命令:stop-dfs.sh启动完成后,可以通过命令jps来判断是否成功启动,若成功启动则会列出如下进程:"NameNode"、"DataNode"和"SecondaryNameNode"三种Shell命令方式:1.hadoopfs2.had
哇咔咔哇咔
·
2024-03-20 04:12
Hadoop
hdfs
笔记
hadoop
大数据
ubuntu
hive库表占用空间大小的命令
1、查每个hive表占用的空间大小
hdfs
dfs-du-h/user/hive/warehouse2、按占用空间大小降序排列
hdfs
dfs-du/user/hive/warehouse/ipms.db|
刀鋒偏冷
·
2024-03-15 13:13
hive
hadoop
数据仓库
opendronemap
集群搭建
需求OpenDroneMap(ODM)是一个开源项目,旨在利用无人机采集的图像数据生成地图、模型和其他地理空间数据。它主要解决以下问题:航空摄影数据处理:ODM可以处理无人机拍摄的大量航空图像数据,通过图像处理和计算机视觉技术生成高质量的地图和模型。地图制作与更新:利用ODM,用户可以快速、成本效益地生成地图,并及时更新地理空间数据,有助于城市规划、灾害监测等领域的应用。三维建模:ODM可以生成精
Robber2000
·
2024-03-15 09:08
云计算
容器
运维
云原生
Hbase
集群搭建
超详细教程
Hbase
集群搭建
前言详细步骤1、下载安装包2、解压3、修改配置文件3.1修改hbase-env.sh文件3.2修改hbase-site.xml3.3修改regionservers文件4、分发hbase
笑看风云路
·
2024-03-13 09:02
集群搭建系列
hbase
hbase
hadoop
大数据
HDFS
(一)
HDFS
简介及其基本概念
HDFS
(HadoopDistributedFileSystem)是hadoop生态系统的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般
weixin_51987187
·
2024-03-12 14:32
笔记
大数据
大数据开发(Hadoop面试真题-卷二)
2、请解释一下
HDFS
架构中NameNode和DataNode之间是如何通信的?3、请解释一下Hadoop的工作原理及其组成部分?4、
HDFS
读写流程是什么样子?
Key-Key
·
2024-03-12 02:15
大数据
hadoop
面试
区块链学习Day01
学习前的知识储备1.go语言(必须掌握)2.数据库基本操作3.基本算法4.Linux基本操作5.Linux
集群搭建
6.Web常识Pow工作量证明一、概念的介绍1.P2P区块链有一个前提,就是P2P,这并非是借贷平台
宝哥的菜鸟之路
·
2024-03-11 14:13
区块链
学习
大数据开发(Hadoop面试真题-卷九)
2、既然HBase底层数据是存储在
HDFS
上,为什么不直接使用
HDFS
,而还要用HBase?3、Sparkmapjoin的实现原理?4、Spark的stage如何划分?
Key-Key
·
2024-03-09 10:06
大数据
hadoop
面试
大数据开源框架技术汇总
目录系统平台(Hadoop、CDH、HDP)监控管理(CM、Hue、Ambari、Dr.Elephant、Ganglia、Zabbix、Eagle)文件系统(
HDFS
、GPFS、Ceph、Gluster
浪尖聊大数据-浪尖
·
2024-03-08 20:48
数据仓库
hive
flume
分布式
scipy
makefile
crm
lighttpd
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他