E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
集群搭建Hadoop
Hive SQL练习之影评案例
找的练习hive,内容非原创链接https://www.cnblogs.com/frankdeng/p/9309668.html一、建表,导入数据1、建表[root@master
hadoop
]#hiveLogginginitializedusingconfigurationinjar
软件手
·
2024-08-31 17:23
Hive
mysql
hive
hadoop
sql
大数据
hadoop
日志文件
路径:/opt/homebrew/Cellar/
hadoop
/3.4.0/libexec/logs从你提供的输出信息来看,你正在查看
Hadoop
的日志文件目录(logs目录)。
静听山水
·
2024-08-31 17:51
Spark
hadoop
hadoop
常用地址
java:"/opt/homebrew/Cellar/openjdk/22.0.1/libexec/openjdk.jdk/Contents/Home"
hadoop
:1】sbin:/opt/homebrew
静听山水
·
2024-08-31 16:49
Spark
hadoop
Hadoop
技术栈
1.什么是
hadoop
(分布式软件框架)他提供了分步式数据存储分布式数据计算分布式资源调度为一体的整体解决方案1.1
hadoop
的用处可以部署在1台乃至成千上万台服务器节点上协同工作。
XingChen.
·
2024-08-31 16:48
分布式
hadoop
大数据
【Mysql】通过Keepalived搭建mysql双主高可用集群
一、环境信息主机名ip操作系统mysql版本VIP(虚拟ip)
hadoop
01192.168.10.200centos7_x865.7192.168.10.253
hadoop
03192.168.10.202centos7
维运
·
2024-08-31 15:13
数据库
mysql
数据库
《
Hadoop
系列》Docker安装
Hadoop
文章目录Docker安装
Hadoop
1安装docker1.1添加docker到yum源1.2安装docker2安装
Hadoop
2.1使用docker自带的
hadoop
安装2.2免密操作2.2.1master
DATA数据猿
·
2024-08-31 12:16
Hadoop
Docker
docker
hadoop
docker安装
Hadoop
拉取镜像[root@ecs-e722~]#dockerpullregistry.cn-hangzhou.aliyuncs.com/
hadoop
_test/
hadoop
_baseUsingdefaulttag
悾说
·
2024-08-31 11:16
docker
hadoop
hadoop
docker
大数据
小白学习大数据测试之
hadoop
hdfs和MapReduce小实战
转发是对小编的最大支持在湿货|大数据测试之
hadoop
单机环境搭建(超级详细版)这个基础上,我们来运行一个官网的MapReducedemo程序来看看效果和处理过程。
大数据学习02
·
2024-08-30 11:39
虚拟机安装
hadoop
,hbase(单机伪集群模式)
虚拟机安装
Hadoop
,Hbase工作中遇到了大数据方面的一些技术栈,没有退路可言,只能去学习掌握它,就像当初做爬虫一样(虽然很简单),在数据爆发的现在,传统的数据库mysql,oracle显然在处理大数据量级的数据时显得力不从心
流~星~雨
·
2024-08-29 21:31
大数据相关
hadoop
hbase
大数据
hive中的数据同步到hbase
关于
hadoop
,hive,hbase这三个技术栈我写了两篇博客简单的分享了我对这三个技术栈的一些看法,在我目前的认知里,
hadoop
提供hdfs这个组件来存储大数据量的数据(相比于mysql,oracle
流~星~雨
·
2024-08-29 21:31
大数据相关
hive
hbase
hadoop
hbase ExportSnapshot迁移hbase表
在源集群上准备快照:snapshot'credit_dict','credit_dict_snapshot20221117'list_snapshots复制快照到目标集群:hbaseorg.apache.
hadoop
.hbase.snapshot.ExportSnapshot
Rjunxiang
·
2024-08-29 16:56
hbase
hbase
大数据
hadoop
Hbase离线迁移
hadoop
distcp-Dmapreduce.job.hdfs-servers.token-renewal.exclude="xx.xx.xx.xx"-i-strat
我要用代码向我喜欢的女孩表白
·
2024-08-29 15:22
hbase
数据库
大数据
Python知识点:如何使用HBase与HappyBase进行分布式存储
HBase是一个基于
Hadoop
的开源分布式数据库,可以处理非常大的表。HappyBase是一个Python库,它提供了一个友好的接口来与HBase交互。
杰哥在此
·
2024-08-29 15:51
Python系列
分布式
python
hbase
编程
面试
Spark-RDD迭代器管道计算
一、上下文《Spark-Task启动流程》中讲到我们提交Stage是传入的是这个Stage最后一个RDD,当Task中触发ShuffleWriter、返回Driver数据或者写入
Hadoop
文件系统时才触发这个
隔着天花板看星星
·
2024-08-29 07:24
spark
大数据
scala
关于这道填空题,你会如何回答?(附带学习链接)
小白的答案是:Java是铜牌,Linux是银牌,
Hadoop
是金牌,大数据是王牌。因为Java是学大数据的基础,有基础然后就可以学后续的;最后只有学好大数据这一王牌才能出去找一份比较好的工作。
csdn业界要闻
·
2024-08-29 05:09
Openstack 与 Ceph
集群搭建
(下): Openstack部署
文章目录文章参考部署节点准备1.修改Host文件与hostname名称2.安装NTP软件3.网卡配置信息4.开启Docker共享挂载5.安装python虚拟环境6.安装kolla-ansible7.加载AnsiblegalaxyrequirementsOpenstack安装前预配置1.配置密码2.配置multinode文件3.修改全局配置文件Openstack正式安装1.启动bootstrap-s
范枝洲
·
2024-08-29 01:43
系统运维
openstack
ceph
Hdfs的机架感知与副本放置策略
1.介绍Apache
hadoop
机架感知
Hadoop
分布式文件系统(Hdfs)作为Apache
Hadoop
生态系统的的核心组件之一,通过机架感知和副本放置策略来优化数据的可靠性,可用和性能.Hdfs的机架感知和副本放置策略是其设计的关键组成部分
sheansavage
·
2024-08-29 01:42
hdfs
hadoop
大数据
Java高级技术day75:Zookeeper与Dubbo
一、Zookeeper的介绍1.Zookeeper介绍:顾名思义zookeeper就是动物园管理员,他是用来管
hadoop
(大象)、Hive(蜜蜂)、pig(小猪)的管理员,ApacheHbase和ApacheSolr
开源oo柒
·
2024-08-28 20:54
clickhouse
集群搭建
文章目录安装clickhouse修改集群配置文件启动clickhouse集群测试集群的可用性安装clickhouse本次用了4台服务器搭建clickhouse集群,使用rpm安装方式在4台服务器上安装clickhouse,步骤如下:sudoyuminstall-ycurlcurl-shttps://packagecloud.io/install/repositories/altinity/clic
颍天
·
2024-08-28 14:56
clickhouse
数据库
读写分离
集群搭建
目录一、配置读写分离集群1、环境说明2、数据准备3、配置主库GRP1_RWW_01配置dm.ini配置dmmal.ini配置dmarch.ini配置dmwatcher.ini启动主库设置OGUID修改数据库模式4、配置备库GRP1_RWW_02配置dm.ini配置dmmal.ini配置dmarch.ini配置dmwatcher.ini启动备库设置OGUID修改数据库模式5、配置备库GRP1_RWW
奥德彪的蕉
·
2024-08-28 11:41
达梦
数据库
服务器
oracle
sql
运维
Spark on YARN
ApacheSpark和Apache
Hadoop
YARN是两个紧密相关的项目,它们经常一起使用来处理大规模数据集。
静听山水
·
2024-08-28 09:26
Spark
spark
大数据
分布式
打造扛得住的MySQL数据库架构视频教程-数据库结构优化 高可用架构设计
打造扛得住的MySQL数据库架构视频教程-数据库结构优化高可用架构设计30套数据库系列Mysql/SQLServer/Redis/Mongodb/Nosql精讲训练营项目实战,数据库设计,架构设计,性能管理,
集群搭建
cd137a460a79
·
2024-08-28 04:10
Ubuntu下部署
Hadoop
集群+Hive(三)
Hive部署准备环境apache-hive-4.0.0-bin.tar.gz、mysql-connector-j-8.1.0.jar如果是离线安装的话,使用mysql-8.0.34-1.el7.x86_64.rpm-bundle.tar,在线安装的话则不用;hive下载地址:Indexof/hive(apache.org)mysqlconnector下载地址:MySQL::DownloadConn
岩屿
·
2024-08-28 01:07
hadoop
ubuntu
hive
分享一个基于Spark的招聘数据可视化与分析系统
Hadoop
大数据源码(源码、调试、LW、开题、PPT)
作者:计算机源码社个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!学习资料、程序开发、技术解答、文档报告如需要源码,可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|基
计算机源码社
·
2024-08-27 20:05
大数据
大数据
spark
毕业设计项目
计算机毕业设计源码
计算机毕设论文
hadoop
计算机课程设计
Hadoop
:HA模式配置与实现
写的不到位的地方,欢迎评论指出不足之处一、检查系统环境1、HostName、Hosts、JDK、SSH、网络、防火墙、数据源二、集群角色分配表注:这只是实例服务器NameNodeNameNodeZookepperFailoverControllerDataNodeZookepperJournalNodeOneyes(NN2和其它节点免密)yesyesTwoyes(NN1和其它节点免密)yesyes
家道消乏
·
2024-08-27 08:14
Hadoop基础
hadoop
大数据
hdfs
大数据技术之Flume 企业开发案例——负载均衡和故障转移(6)
2)需求分析故障转移案例3)实现步骤准备工作在/opt/module/flume/job目录下创建group2文件夹[lzl@
hadoop
12job]$c
大数据深度洞察
·
2024-08-27 05:58
Flume
大数据
flume
负载均衡
数据库基础:mysql主从
集群搭建
position:表示从file的哪个位置开始;binlog_do_db:表示同步哪一个库在后面的slave配置中,这三个结果都需要使用到。4.Slave(6.85)节点配置配置从库(1)修改my.cnf文件,在[mysqld]加入下面的内容:#服务的唯一编号server-id=2#开启mysqlbinlog功能log-bin=mysql-bin#binlog记录内容的方式,记录被操作的每一行bi
2401_84049040
·
2024-08-27 00:58
程序员
数据库
mysql
android
基于Zookeeper搭建Kafka高可用集群
基于Zookeeper搭建Kafka高可用集群一、Zookeeper
集群搭建
为保证集群高可用,Zookeeper集群的节点数最好是奇数,最少有三个节点,所以这里搭建一个三个节点的集群。
数字游牧人0v0
·
2024-08-26 16:58
大数据BigData
kafka
java-zookeeper
zookeeper
大数据
zookeeper+KAFKA
集群搭建
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
懵逼的运维弟弟
·
2024-08-26 16:28
Linux
zookeeper+KAFKA
集群搭建
(十五)Flink 内存管理机制
在大数据领域,很多开源框架(
Hadoop
、Spark、Storm)都是基于JVM运行,但是JVM的内存管理机制往往存在着诸多类似OutOfMemoryError的问题,主要是因为创建大量的实例,超过JVM
springk
·
2024-08-26 16:27
Flink全景解析
flink
大数据
实时数据
flink
内存管理
内存管理机制
面试笔记8.24
正确答案:在我的项目中涉及大数据开发时,我通常会采用分布式的架构,比如使用
Hadoop
或者Spark等大数据处理框架。我会在集群中部署多台服务器,通过分布式计算和存储来处理大规模数据。
励志秃头码代码
·
2024-08-26 16:55
面试
职场和发展
在linux机器中安装配置
hadoop
1.首先我们要把
hadoop
包上传到我们的liunx机器中(运用外链软件上传如:Xshell+xftp)(用我们的外链软件连接成功后,进行
hadoop
包的上传)上传到我们想要的目录路径下,比如我的是上传到
BigData_C
·
2024-08-26 14:40
linux
hadoop
计算机毕业设计
Hadoop
+Spark知识图谱体育赛事推荐系统 体育赛事热度预测系统 体育赛事数据分析 体育赛事可视化 体育赛事大数据 机器学习 大数据毕业设计 大数据毕设 机器学习 人工智能
开发技术前端:vue.js、element-ui、echarts后端:springboot、mybatis大数据:spark、
hadoop
数据库:mysql关系型数据库、neo4j图数据库算法:协同过滤推荐算法
计算机毕业设计大全
·
2024-08-26 13:43
Kylin系列-入门
Kylin系列-入门ApacheKylin是一个开源的分布式分析引擎,提供
Hadoop
/Spark之上的SQL查询接口及多维分析(OLAP)能力,以支持超大规模数据。
Dingdangr
·
2024-08-26 13:34
kylin
Mac
Hadoop
Yarn日志聚合出错
Mac
Hadoop
Yarn日志聚合出错通过日志查看出现了下面的错误:java.lang.IllegalStateException:CannotcloseTFileinthemiddleofkey-valueinsertion.atorg.apache.
hadoop
.io.file.tfile.TFile
HHoao
·
2024-08-26 10:15
macos
hadoop
大数据
基于spark+
hadoop
+hive大数据分析的电影推荐系统的设计与实现
1.1开发环境二、系统介绍2.1图片展示三、部分代码设计3.1.部分代码如下:**总结****大家可以帮忙点赞、收藏、关注、评论啦****有问题评论区交流**一、开发介绍1.1开发环境技术栈:spark+
hadoop
毕设木哥
·
2024-08-26 06:26
spark
spark
hadoop
hive
spring
java
《
Hadoop
核心技术》作者翟周伟 :我与
Hadoop
的不解之缘
摘要:翟周伟,资深
Hadoop
技术专家,《
Hadoop
开源云计算平台》、《
Hadoop
核心技术》作者。
xytlwp
·
2024-08-25 21:27
翟周伟
hadoop
数据挖掘
自然语言处理
hadoop
翟周伟
数据挖掘
自然语言处理
Tair分布式缓存
为什么不能像操作分布式数据库或者
hadoop
那样,增加一个中央节点,让它去代理所有事情。所以就开发了这个tai
kingkyrie
·
2024-08-25 18:38
分布式
Hadoop
入门基础(五):
Hadoop
常用 Shell 命令一网打尽,提升你的大数据技能!
1.
Hadoop
基本命令1.1查看版本信息
hadoop
version用于检查
Hadoop
的版本信息以及编译信息。
william.zhang(张)
·
2024-08-25 15:52
大数据
Hadoop
容器
大数据
hadoop
分布式
HDFS的编程
一、HDFS原理HDFS(
Hadoop
DistributedFileSystem)是
hadoop
生态系统的一个重要组成部分,是
hadoop
中的的存储组件,在整个
Hadoop
中的地位非同一般,是最基础的一部分
卍king卐然
·
2024-08-25 07:02
hdfs
hadoop
大数据安全
web安全
经验分享
Hadoop
入门基础(二):
Hadoop
集群安装与部署详解(超详细教程)
NameNodemaster192.168.1.101DataNode1slave1192.168.1.102DataNode2slave2192.168.1.1032.软件要求操作系统:CentOS7或Ubuntu20.04JavaJDK:
Hadoop
william.zhang(张)
·
2024-08-25 06:57
hadoop
大数据
分布式
Redis
集群搭建
1.环境:centos6.7、redis-6.2.62.模式:5主+20丛+5备丛(即:1主-4从-1备丛)3.服务器环境检查及安装查看服务器是否安装了gccrpm-qgcc若没有安装,则进行gcc安装yuminstall-ygcc4.redis下载前往redis官网下载https://redis.io/downloadredis-6.2.6.tar.gz5.将redis-6.2.6.tar.gz
丿似锦
·
2024-08-24 21:00
数据库
redis
bootstrap
前端
Ubuntu下部署
Hadoop
集群+Hive(一)
配置主机Host在三台服务器上添加主机名与IP的映射,以方便在局域网内进行主机间的快速访问和后续的文件配置;配置方法:vi/etc/hosts为方便配置:我的三台主机取名为
Hadoop
Master、
Hadoop
Slave01
岩屿
·
2024-08-24 17:41
hadoop
ubuntu
hive
大数据
Hadoop
的基本 shell 命令
Hadoop
的基本shell命令主要用于与
Hadoop
分布式文件系统(HDFS)和MapReduce进行交互。
难以触及的高度
·
2024-08-24 14:22
hadoop
大数据
分布式
基于
Hadoop
的海量图像检索
基于
Hadoop
的海量图像检索“MassiveImageRetrievalBasedon
Hadoop
:AStudyinSoftwareEngineering”完整下载链接:基于
Hadoop
的海量图像检索文章目录基于
usp1994
·
2024-08-24 13:12
hadoop
eclipse
大数据
从零到一建设数据中台 - 关键技术汇总
一、数据中台关键技术汇总语言框架:Java、Maven、SpringBoot数据分布式采集:Flume、Sqoop、kettle数据分布式存储:
Hadoop
HDFS离线批处理计算:MapReduce、Spark
我码玄黄
·
2024-08-24 12:09
数据中台
数据挖掘
数据分析
大数据
Kylin的工作原理及使用分享
Kylin提供了一个
Hadoop
之上的SQL查询接口及多维分析(OLAP)能力,能够支持大规模数据,处理TB乃至PB级别的分析任务,并且能够在亚秒级查询巨大的Hive表。
丁爸
·
2024-08-24 07:01
大数据
kylin
阿里云服务器内存型r7、r8a、r8y实例区别及最新活动价格参考
在阿里云目前的活动中,属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格,相比于活动内的经济型e和通用算力型u1等实例规格来说,这些实例规格等性能更强,适用于数据分析与挖掘,
Hadoop
阿里云最新优惠和活动汇总
·
2024-08-23 22:23
达梦数据库DMDSC搭建
DMDSC目录前言DMDSC名词解析DMCSS控制节点(ControlNode)普通节点(NormalNode)DMCSS工作原理DMASMdmasvrmal搭建步骤准备共享盘初始化安装DM数据库软件
集群搭建
配置
大大大大大魔王丶
·
2024-08-23 20:21
数据库
Ubuntu下部署
Hadoop
集群+Hive(二)
Hadoop
集群搭建
准备环境
hadoop
-3.3.6.tar.gz,jdk-8u421-linux-x64.tar.gz根据自己的使用下载对的
hadoop
和jdk版本
hadoop
下载地址:Apache
Hadoop
JDK
岩屿
·
2024-08-23 14:46
hadoop
hive
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他