E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Ubuntu安装Hadoop
Hive 分区和分桶总结
分区介绍2、分区表的操作3、动态分区2、分桶表1、分桶表介绍2、分桶表的操作3、分区表和分桶表的区别参考分区和分桶总结1、分区1、分区介绍由于数据量过于庞大,使用分区,可以并行的进行处理数据,有点类似于
Hadoop
Stray_Lambs
·
2025-02-03 14:23
大数据
hive
HBase的原理
一、什么是HBaseHBase是一个分布式,版本化,面向列的数据库,依赖
Hadoop
和Zookeeper(1)HBase的优点提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统(2)HBase表的特性
会探索的小学生
·
2025-02-03 11:30
大数据
HBase
Hadoop
的基础操作_
hadoop
常用操作
####下载文件语法:
hadoop
fs-get
hadoop
fs-copyToLocal示例:将user/text.txt文件下载到本地/usr/local/下-copyToLocal:复制到本地[root
字节全栈_kYu
·
2025-02-03 07:28
hadoop
eclipse
大数据
kylin套_Apache Kylin(一)Kylin介绍
1.传统大数据分析的问题在基于
Hadoop
生态的传统大数据分析中,主要使用的技术是MPP(MassivelyParallelProcessing)大规模并行处理和列式存储。
weixin_39898011
·
2025-02-03 07:57
kylin套
linux的apache安装,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)Spark(可选)2.3.0+Kafka(可选)1.0.0
姜白的树洞
·
2025-02-03 07:26
linux的apache安装
kylin linux 安装教程,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+Hive:0.13-1.2.1+HBase:1.1+Spark2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2
社本
·
2025-02-03 07:26
kylin
linux
安装教程
Hadoop
---(6)Sqoop(数据传输)
6.SqoopSqoop是一个用于
hadoop
数据和结构化数据之间转换的工具。
Mr Cao
·
2025-02-02 15:27
sqoop
大数据
hbase无法建表:org.apache.
hadoop
.hbase.PleaseHoldException: Master is initializing
1.环境:cdh6.2.12.现象:hbaseshell进去后,list命令执行正常,执行建表语句后报错:ERROR:org.apache.
hadoop
.hbase.PleaseHoldException
magicchu
·
2025-02-02 09:18
CDH
HBASE
大数据
Hive 整合 Spark 全教程 (Hive on Spark)
hadoop
.proxyuser.luanhao.groups*
hadoop
.proxyuser.luanhao.groups*2)HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00
字节全栈_rJF
·
2025-02-02 02:56
hive
spark
hadoop
spark和python的区别_Spark入门(Python)
Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被实现为
Hadoop
之上的特殊系统。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
spark python入门_python pyspark入门篇
一.环境介绍:1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:spark-1.6.0-bin-
hadoop
2.6.tar.gz二.Setup1.解压spark
weixin_39686634
·
2025-02-01 23:12
spark
python入门
安装HBase-2.4.12 (
hadoop
3.3.1)
1.下载https://www.apache.org/dyn/closer.lua/hbase/2.4.12/hbase-2.4.12-bin.tar.gz节点角色配置节点MasterZooKeeperRegionServernode001yesyesyesnode002backupyesyesnode003noyesyes2.解压下载的文件,并切换到新创建的目录。(base)[root@node
不饿同学
·
2025-02-01 17:18
大数据
hbase
big
data
hadoop
Hadoop
--HA架构详解
为了解决上述问题,
Hadoop
给出了高容错,高可用的HA方案:一个HDFS集群至少存在两个nameNode,一个nameNode处在active(主)状态,其他nameNode处在standby(备
娘子,出来看上帝
·
2025-02-01 10:20
Hadoop
Hadoop
大数据
HA
Hadoop
HA 架构
为什么要用集群?企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过master,建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务(-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active对外,另外一台是
weixin_30569033
·
2025-02-01 09:49
shell
大数据
【PySide6拓展】
Ubuntu安装
Mosquitto MQTT服务器
文章目录【PySide6拓展】
Ubuntu安装
MosquittoMQTT服务器**什么是Mosquitto?
人才程序员
·
2025-02-01 08:38
杂谈
c语言
c++
qt
python3.11
ui
界面
pyside6
【
hadoop
学习之路】Hive HQL 语句实现查询
目录表数据表1students_data.txt表2course.txt实验步骤结论表数据表1students_data.txt21434,Sara,F,21,20,73,classC41443,Mary,M,19,30,90,classA43333,Dery,F,20,40,85,classB45454,Mary,F,22,10,91,classA14634,Henry,M,18,50,56,c
新世纪debug战士
·
2025-02-01 03:58
hadoop学习之路
hive
HDFS总结
基于前面的学习与配置,相信对于HDFS有了一定的了解HDFS概述1.什么是HDFS
Hadoop
DistributedFileSystem:分步式文件系统HDFS是
Hadoop
体系中数据存储管理的基础HDFS
ChenJieYaYa
·
2025-01-31 20:03
Hadoop
hdfs
hadoop
big
data
11 Spark面试真题
2.
hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.
hadoop
和spark的相同点和不同点?5.RDD持久化原理?6.checkpoint检查点机制?
TTXS123456789ABC
·
2025-01-31 16:26
#
Spark
spark
面试
大数据
云服务器wsl2,在Windows 10中启动WSL2 并安装Linux( Ubuntu 为例)并运行docker
本文内容:了解WSL和WSL2;案例:在Windows10上开启WSL2并安装Ubuntu;案例:体验在WSL2中的
Ubuntu安装
Docker并运行nginx;视频讲解:图文讲解:什么是WSL?
FromNowToNow
·
2025-01-31 15:13
云服务器wsl2
在WSL2的Ubuntu中安装和使用Docker/Podman
当网络环境不佳(例如在家里),要把WSL2的
Ubuntu安装
好Docker,并顺利拉取Docker/Podman镜像,并且运行的镜像实例也需要把网络问题搞定,我踩了5个坑,记录如下。
baiyu33
·
2025-01-31 14:40
ubuntu
docker
podman
【详细讲解】hive优化
1、开启本地模式大多数的
Hadoop
Job是需要
Hadoop
提供的完整的可扩展性来处理大数据集的。不过,有时Hive的输入数据量是非常小的。
songqq27
·
2025-01-31 06:56
大数据
hive
大数据毕业设计
hadoop
+spark+hive豆瓣图书数据分析可视化大屏 豆瓣图书爬虫 图书推荐系统
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统,它可以根据用户的历史行为和偏好,为用户提供个性化的书籍推荐。该系统采用Spark技术,可以实现大数据的实时处理,从而提高推荐系统的准确性和可靠性。此外,该系统还可以根据用户的习惯和偏好,提供更加个性化的书籍推荐,从而满足用户的需求。系统的使用者包含普通用户和管理员两类,普通用户是系统的主要服务对象,主流人群是经常查看
qq_79856539
·
2025-01-30 20:03
javaweb
java
大数据
hadoop
课程设计
Android车机DIY开发之学习篇(七)NDK交叉工具构建
Android车机DIY开发之学习篇(七)NDK交叉工具构建1.
ubuntu安装
GCCsudoapt-getupdatesudoapt-getinstallgccg++sudogcc--versionsudog
勿忘初心91
·
2025-01-30 19:26
车机DIY
学习
嵌入式硬件
arm开发
单片机
Ubuntu安装
VMware17
安装下载本文的附件,之后执行sudochmod+xVMware-Workstation-Full-17.5.2-23775571.x86_64.bundlesudo./VMware-Workstation-Full-17.5.2-23775571.x86_64.bundle安装注意事项:跳过账户登录的办法:断开网络可能出现的问题以及解决方案解决:BeforeyoucanrunVmware,seve
zzzhpzhpzzz
·
2025-01-30 14:42
ubuntu
linux
vmware
python 分布式集群_Python搭建Spark分布式集群环境
Spark最大的特点就是快,可比
Hadoop
MapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群,而是使用三台电脑来搭建一个小型分布式集群环境安装。
小国阁下
·
2025-01-30 05:32
python
分布式集群
Hadoop
错误: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 学习总结
错误总结分享:使用了
hadoop
挺长时间了,多数人应该很熟悉它的特点了吧,但是今天突然遇到个错误,从来没见过,一时自己也想不到是什么原因,就在网上查了一些资料,得到了解决的办法,再次分享一下。
星月情缘02
·
2025-01-30 03:45
ETL技术
Hadoop
hdfs租约
hadoop错误
Hadoop
3.3.4伪分布式环境搭建
文章目录前言一、准备1.下载
Hadoop
2.配置环境变量3.配置免密二、
Hadoop
配置1.
hadoop
-env.sh2.hdfs-site.xml3.core-site.xml4.mapred-site.xml5
凡许真
·
2025-01-29 21:28
分布式
hadoop
伪分布式
hadoop3.3.4
Hadoop
HA 格式化NameNode 顺序
文章目录前言一、启动JournalNode二、格式化NameNode1.执行格式化命令2.启动namenode3.执行格式化命令4.启动namenode其他前言记录搭建
Hadoop
HA架构时格式化namenode
凡许真
·
2025-01-29 21:58
hadoop
大数据
分布式
HA
Hive存储系统全面测试报告
ApacheHive作为一个基于
Hadoop
的数据仓库工具,因其能够提供类SQL查询功能(HiveQL)而广受欢迎。
蚂蚁质量
·
2025-01-29 13:27
软件测试
测试用例
功能测试
Liunx安装Docker容器化管理工具(记录篇)
一、移除主机原有Docker(以ubuntu为例,没有则忽略)二、
Ubuntu安装
与配置Docker管理工具三、Centos安装与配置Docker管理工具四、配置Docker镜像加速器五、批量清理Docker
smart_ljh
·
2025-01-29 00:50
工具
docker
容器
运维
编程工具
window10下编译
hadoop
报错:Failed to execute goal org.apache.maven.plugins:maven-antrun-plugin:1.7:
Windows10下build
hadoop
2.7.3报错:Failedtoexecutegoalorg.apache.maven.plugins:maven-antrun-plugin:1.7:[ERROR
huangxgc
·
2025-01-28 22:30
hadoop
hadoop
windows
记录一次nvm\node\npm安装,ubuntu18.04
前提:nvm安装教程如下:
Ubuntu安装
NVM及简单使用-CSDN博客一、443连接失败——大佬原文如下:ubuntu18.04安装nvm、node.js、npm-简书(jianshu.com)二、nodejs
imomsc_csdn
·
2025-01-28 22:29
npm
前端
node.js
图文详解 MapReduce on YARN
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系正文权威版本——《
Hadoop
权威指南第3版》1.作业提交MRrunJob从RM获取新的作业ID作业客户端检査作业的输出说明,计算输入分片并将作业资源
Shockang
·
2025-01-28 13:20
大数据技术体系
大数据
mapreduce
yarn
深入MapReduce——从MRv1到Yarn
在
Hadoop
1.0实现里,每一个MapReduce的任务并没有一个独立的master进程,而是直接让调度系统承担了所有的worker的master的角色,这就是
Hadoop
1.0里的JobTracker
黄雪超
·
2025-01-28 12:49
大数据基础
#
深入MapReduce
mapreduce
大数据
hadoop
Hadoop
学习笔记 --- YARN执行流程与工作原理
一、YARN简述首先介绍一下YARN在
Hadoop
2.0版本引进的资源管理系统,直接从MapReduceV1演化而来(由于引擎的功能缺陷);原因是将MapReduce1中的JobTracker的资源管理和作业调度两个功能分开
杨鑫newlfe
·
2025-01-28 07:42
数据仓库
大数据挖掘与大数据应用案例
YARN
Hadoop
大数据
资源调度
数据仓库
【深入浅出 Yarn 架构与实现】1-1 设计理念与基本架构
一、Yarn产生的背景
Hadoop
2之前是由HDFS和MR组成的,HDFS负责存储,MR负责计算。一)MRv1的问题耦合度高:MR中的jobTracker同时负责资源管理和作业控制两个功能,互相制约。
大数据王小皮
·
2025-01-28 07:12
深入浅出Yarn架构与实现
架构
hadoop
大数据
yarn
java
【YARN】yarn 基础知识整理——
hadoop
1.0与
hadoop
2.0区别、yarn总结
文章目录1.
hadoop
1.0和
hadoop
2.0区别1.1
hadoop
1.01.1.1HDFS1.1.2Mapreduce1.2
hadoop
2.01.2.1HDFS1.2.2Yarn/MapReduce22
时间的美景
·
2025-01-28 07:39
Hadoop
Yarn
hadoop
hadoop1
hadoop2
大数据
搭建
Hadoop
与Hive环境
当搭建
Hadoop
与Hive环境时,以下是每个步骤的详细操作说明:1.安装并配置CentOS7操作系统:-下载CentOS7ISO镜像文件,并通过虚拟机或物理机安装CentOS7操作系统。
达达玲玲
·
2025-01-28 05:28
hadoop
hive
大数据
大数据技术之MapReduce
一、MapReduce概述1、MapReduce简介MapReduce是一个分布式运算程序的编程框架,是基于
Hadoop
的数据分析计算的核心框架。
wespten
·
2025-01-27 20:21
Hadoop
Hive
Spark
大数据安全
大数据
mapreduce
hadoop
anaconda中pyspark_自学大数据——9 Anaconda安装与使用pyspark
一、解压安装包sudobashAnaconda3-2020.07-Linux-x86_64.shchown-R
hadoop
:
hadoop
/opt/anaconda/vi/etc/profileexportANACONDA_HOME
步六孤陆
·
2025-01-27 17:59
PySpark数据处理过程简析
作者:禅与计算机程序设计艺术1.简介PySpark是ApacheSpark的PythonAPI,可以用Python进行分布式数据处理,它在内存中利用了Apache
Hadoop
YARN资源调度框架对数据进行并行处理
AI天才研究院
·
2025-01-27 17:28
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
kafka开启kerberos
例如:注意有几台机器创建几个kadmin.local-q"addprinc-randkeyzookeeper/dshieldcdh01@
HADOOP
139.COM"kadmin.local-q"addprinc-rand
蘑菇丁
·
2025-01-27 16:55
debian
运维
ranger-kms安装
解压安装包[
hadoop
~]$cd/opt/ranger[
hadoop
@ranger]$tar-xzvfranger-2.1.0-kms.tar.gz[
hadoop
@xranger]$mvranger-
蘑菇丁
·
2025-01-27 16:55
eclipse
java
ide
ansible批量生产kerberos票据,并批量分发到所有其他主机脚本
-name:ConfigureKerberosfor
Hadoop
Usershosts:
hadoop
_serversbecome:nogather_facts:novars:kerberos_server
蘑菇丁
·
2025-01-27 16:50
ansible
hadoop
学习笔记
eclipse
java
ide
网络爬虫相关软件以及论文检索与推荐网站调研
Nutch的创始人是DougCutting,他同时也是Lucene、
Hadoop
和Avro开源项
Q7318
·
2025-01-27 14:04
网络爬虫
网络爬虫
搜索引擎
修改hdfs路径权限
三、解决shell执行以下命令,${hdfs_path}替换成目标表的文件路径/usr/local/service/
hadoop
/bin/hdfsdfs-chmod
chimchim66
·
2025-01-27 11:52
hdfs
hadoop
大数据
HDFS升级和回退
概述作为一个大型的分布式系统,
Hadoop
内部实现了一套升级机制,当在一个集群上升级
Hadoop
时,像其他的软件升级一样,可能会有新的bug或一些会影响现有应用的非兼容性变更出现;在任何有实际意义的HDFS
小森饭
·
2025-01-27 08:05
hdfs
hadoop
大数据
大数据平台建设整体架构设计方案
《大数据平台建设整体架构设计方案》关键词:大数据平台、分布式存储、分布式计算、数据仓库、数据湖、数据安全、数据质量管理、数据治理、数据挖掘、机器学习、图计算、自然语言处理、
Hadoop
、Spark、Flink
AI天才研究院
·
2025-01-27 02:55
ChatGPT
AI大模型企业级应用开发实战
大数据AI人工智能
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
The selected directory is not a valid Tomcat home
我这里是
Ubuntu安装
的tomcat,直接从压缩包解压安装的IDEA在配置TomcatHome的时候,其实路径是对的,我填的是/usr/local/tomcat/apach-tomcat-9.0.98
六件套是我
·
2025-01-27 02:52
tomcat
java
Ubuntu安装
docker
snapinstalldocker#version27.2.0,oraptinstallpodman-docker#version3.4.4+ds1-1ubuntu1.22.04.2aptinstalldocker.io#version24.0.7-0ubuntu2~22.04.1我应该安装哪一个,部署企业级应用?在部署企业级应用时,选择合适的容器化工具非常重要。以下是针对你提到的三种选项的分析和
张3蜂
·
2025-01-27 00:03
软件安装
部署
开源
linux
ubuntu
docker
eureka
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他