E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据库运维hdfs云存储
降本增效利器!趣头条Spark Remote Shuffle Service最佳实践
多个业务线依赖于大数据平台展开业务,大数据系统的高效和稳定成了公司业务发展的基石,在大数据的架构上我们使用了业界成熟的方案,存储构建在
HDFS
上、计算资源调度依赖Yarn、表元数据使用Hiv
阿里云技术
·
2024-02-05 09:29
大数据
spark
CDH添加新节点小记
免密,jdk,防火墙及时间同步安装配置CM子节点,创建parcels,后续安装的软件都会分发到该文件夹下启动当前节点的CM,转到CDH管理界面,可以看到节点已添加到主机列表中选择该节点,添加角色:例如:
hdfs
sx_1706
·
2024-02-05 09:59
大数据
大数据
大数据 - Spark系列《三》- 加载各种数据源创建RDD
中的一些常用配置-CSDN博客目录3.1加载文件(本地)1.加载本地文件路径使用textFile加载本地txt文件使用textFile加载本地json文件使用sequenceFile加载本地二进制文件
HDFS
王哪跑nn
·
2024-02-05 09:28
spark
大数据
spark
分布式
关于服务器解析A记录和CNAME记录的分析
问题来源最近搞了一个七牛云上传,然后需要配置融合cdn加速,也就是可以加速域名,中间有一部需要CNAME域名,也就是将七牛云提供的域名CNAME一下,查阅资料其实就是起一个别名,好访问而已.方便我们访问
云存储
ifanatic
·
2024-02-05 08:48
运维工具
服务器
github
运维
impala与kudu进行集成
概要Impala是一个开源的高效率的SQL查询引擎,用于查询存储在Hadoop分布式文件系统(
HDFS
)中的大规模数据集。它提供了一个类似于传统关系型数据库的SQL接口,允许用户使用SQL语言
shandongwill
·
2024-02-05 07:44
大数据
impala
kudu
impala与kudu集成
1.0 Hadoop 教程
其核心部件包括分布式文件系统(HadoopDFS,
HDFS
)和Ma
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
3.0 Hadoop 概念
Hadoop主要包含
HDFS
和MapReduce两大组件,
HDFS
负责分布储存数据,MapRed
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
大模型太给力了,
数据库运维
工作量直接减少 50%!
本文源自百度智能云
数据库运维
团队的实践,深入探讨了基于大模型构建「知识库智能问答系统」的设计过程和应用。全文包括了总体的技术方案选型、各个模块的设计实现、重点难点问题的突破、以及目前的落地场景应用等。
大数据和云计算技术
·
2024-02-05 06:59
数据库
运维
人工智能
大数据框架(分区,分桶,分片)
建议收藏目录Hive分区与分桶ES分片Kafka分区HBase分区Kudu分区HiveHive分区是按照数据表的某列或者某些列分为多区,在hive存储上是
hdfs
文件,也就是文件夹形式。
坨坨的大数据
·
2024-02-05 06:29
CDH5.X中使用Sqoop导数据报Cannot run program “mysqldump“: error=2, No such file or director
一、背景CHD5.16环境中,使用sqoop从MySQL中进行ETL导数据到
hdfs
过程中,报了如下错误:20/12/2213:58:48INFOmapreduce.Job:TaskId:attempt
江畔独步
·
2024-02-05 01:49
hadoop
【读红宝书(一)】背景知识
相反,MapReduce市场已经转变为
HDFS
市场,并且似乎准备成为关系型SQL市场。最近,
HDFS
领域出现了另一个值得讨论的重点,即“数据湖”。
三半俊秀
·
2024-02-04 23:41
Flink1.18.0集成Yarn-session模式部署
上次部署了Hadoop集群Hadoop3.3.6(
HDFS
、YARN、MapReduce)完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager
china-zhz
·
2024-02-04 21:34
flink
yarn
hadoop
大数据
Hadoop3.3.6(
HDFS
、YARN、MapReduce)完全分布式集群安装搭建
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、Hadoop部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件5、启动hadoop集群6、集群部署验证一、节点部署角色目录节点ipNNSNNDNRMNMHSnode1192.168.88.11√√node2192.168.88.12√√√√node3192
china-zhz
·
2024-02-04 21:33
hdfs
mapreduce
hadoop
yarn
hive小文件合并问题
背景Hivequery将运算好的数据写回
hdfs
(比如insertinto语句),有时候会产生大量的小文件,如果不采用CombineHiveInputFormat就对这些小文件进行操作的话会产生大量的maptask
DuLaGong
·
2024-02-04 20:16
(三)Hive的分桶详解
Hive分桶通俗点来说就是将表(或者分区,也就是
hdfs
上的目录而真正的数据是存储在该目录下的文件)中文件分成几个文件去存储。
小猪Harry
·
2024-02-04 19:20
HDFS
常用命令
HDFS
常用命令在
hdfs
文件系统上创建一个input文件夹bin/
hdfs
dfs-mkdir-p/user/anna/input将测试文件内容上传到文件系统上bin/
hdfs
dfs-putwc.input
须臾之北
·
2024-02-04 18:41
使用PHPStudy搭建Cloudreve网盘服务
、前言2、本地网站搭建2.1环境使用2.2支持组件选择2.3网页安装2.4测试和使用2.5问题解决3、本地网页发布3.1cpolar云端设置3.2cpolar本地设置4、公网访问测试5、结语1、前言自
云存储
概念兴起已经有段时间了
不会kao代码的小王
·
2024-02-04 18:04
windows
搜索引擎
网络
websocket
网络协议
MapReduce执行过程
1.JobClient:运行于clientnode,负责将MapReduce程序打成Jar包存储到
HDFS
,并把Jar包的路径提交到Jobtracker,由Jobtracker进行任务的分配和监控。
HenlyX
·
2024-02-04 15:12
Ranger-Yarn插件安装
登陆
hdfs
安装的用户,garrison/zdh1234(用户组hadoop),获取安装包解压安装scp/home/backup/ranger/ranger-0.6.0-yarn-plugin.tar.gz.tar–zxvfr
木木与呆呆
·
2024-02-04 10:22
Hive 主要内容一览
Hadoop使用
HDFS
进行存储,使
大数据左右手
·
2024-02-04 07:13
Hive
大数据
面试
大数据
天地伟业接入视频汇聚/
云存储
平台EasyCVR详细步骤
安防视频监控/视频集中存储/
云存储
/磁盘阵列EasyCVR平台可拓展性强、视频能力灵活、部署轻快,可支持的主流标准协议有国标GB28181、RTSP/Onvif、RTMP等,以及支持厂家私有协议与SDK
EasyCVR
·
2024-02-04 06:21
AI智能分析网关
EasyCVR
解决方案
音视频
openGauss学习笔记-212 openGauss
数据库运维
-日志参考
文章目录openGauss学习笔记-212openGauss
数据库运维
-日志参考212.1日志类型简介212.2系统日志212.3操作日志212.4审计日志212.5WAL日志212.6性能日志openGauss
superman超哥
·
2024-02-03 23:20
openGauss学习笔记
openGauss
国产数据库
开源数据库
数据库
RDBMS
2019-10-08 大数据开发进阶之路
市场需要的水平熟练掌握Linux、SQL与HiveSQL掌握Hadoop生态主流技术,如
HDFS
/MapRedunce/Yarn/HBase/Flume等掌握Spark生态核心技术,如Spark架构/RDD
红瓦李
·
2024-02-03 20:39
大数据环境搭建(一)-Hive
1hive介绍由Facebook开源的,用于解决海量结构化日志的数据统计的项目本质上是将HQL转化为MapReduce、Tez、Spark等程序Hive表的数据是
HDFS
上的目录和文件Hive元数据metastore
xfchn多多学习学习
·
2024-02-03 20:42
大数据
大数据
hive
hadoop
2023年好用免费图床推荐
为了方便传输和发布图片,图片
云存储
工具图床也越来越受欢迎。图片
云存储
工具也被称为图床,它能够将用户的图片上传到云端,然后通过链接在不同网站或其他平台上分享和获取。
久邦科技
·
2024-02-03 17:09
网络建设
图像处理
大数据面试题 ---阿善有用
大数据工程师面试题1.选择题1.1.下面哪个程序负责
HDFS
数据存储。
okbin1991
·
2024-02-03 15:21
大数据
hadoop
hdfs
java
分布式
# 用Sqoop将MySQL的表导入到
HDFS
中,表导入成功,但数据为空,报错:Unknown column ‘????‘ in ‘field list‘
用Sqoop将MySQL的表导入到
HDFS
中,报错:Unknowncolumn‘???’
Quan_Mu
·
2024-02-03 10:24
mysql
etl
sqoop
hdfs
2021的新年愿望
学完B2.使用marginnote3阅读文献和认真仔细做好Mendeley的文献管理,向某大佬2个账号的
云存储
前进。每周复盘自己的实验室的任务,培养良好的科研习惯。
Moran_MM
·
2024-02-03 09:08
2024-02-01(Hive)
2.Hive看似处理的是mysql的表,但实际上处理的是
HDFS
中的文本文件。
陈xr
·
2024-02-03 08:53
随记日志
hadoop
hadoop 50070 无法访问问题解决汇总
djt002hadoop]#vi/etc/selinux/config改为:SELINUX=disabled解决办法2:查看你的$HADOOP_HOME/etc/hadoop下的core-site.xml和
hdfs
-site.xml
無法複制
·
2024-02-03 08:13
linux
hadoop
Datax3.0+DataX-Web部署分布式可视化ETL系统
DataX致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源(即不同的数据库)间稳定高效的数据同步功能。
無法複制
·
2024-02-03 08:06
分布式
etl
数据仓库
ClickHouse基于数据分析常用函数
1.2调用函数1.3子查询二、GROUPBY子句(结合WITHROLLUP、CUBE、TOTALS)三、FORM语法3.1表函数3.1.1file3.1.2numbers3.1.3mysql3.1.4
hdfs
懒惰的小白521
·
2024-02-03 08:31
大数据
java
数据分析
clickhouse
sql
Hadoop:学习
HDFS
,看完这篇就够了!
HDFS
(HadoopDistributedFileSystem)是ApacheHadoop生态系统中的分布式文件系统,用于存储和处理大规模数据集。
爱写代码的July
·
2024-02-03 08:09
大数据与云计算
hadoop
学习
hdfs
大数据
云计算
Hadoop:
HDFS
学习巩固——基础习题及编程实战
一
HDFS
选择题1.对
HDFS
通信协议的理解错误的是?
爱写代码的July
·
2024-02-03 08:09
大数据与云计算
hadoop
hdfs
学习
【转】腾讯工作3年反思:为什么优秀员工不是你?
程序员共读今天以下文章来源于机智的程序员小熊,作者小熊爱编程机智的程序员小熊一个爱思考的程序员,专注于开发、运维、云技术、计算、网络、
云存储
、数据库、linux等编程知识,期待你的关注。
madrabbit1987
·
2024-02-03 03:02
工作经验
简易异步任务中心&批量导入技术处理方案
二、基本原理图1请求示意图异步任务中心共分三个模块:1)任务初始化,将目标导入文件上传至
云存储
后得到目标文件url按任务类型(如类目导入、商品导入等)入库任务表并返回前台提交成功,任务初始状态为"待处理
京东云技术团队
·
2024-02-03 02:28
后端
如何使用Cloudreve搭建私有云盘并发布公网访问无需购买域名服务器
、前言2、本地网站搭建2.1环境使用2.2支持组件选择2.3网页安装2.4测试和使用2.5问题解决3、本地网页发布3.1cpolar云端设置3.2cpolar本地设置4、公网访问测试5、结语1、前言自
云存储
概念兴起已经有段时间了
灰灰快醒醒
·
2024-02-03 01:34
服务器
运维
Hadoop生态圈-组件介绍
Hadoop的核心组件是
HDFS
、MapReduce。
苏尔伯特
·
2024-02-03 00:19
手把手教Hadoop环境搭建,学不会你咬我~
目录前置条件配置SSH免密登录Hadoop(
HDFS
)环境搭建Hadoop(YARN)环境搭建1、前置条件Hadoop的运行依赖JDK,需要预先安装,安装步骤见:1.1下载并解压在官网下载所需版本的JDK
程序IT圈
·
2024-02-02 23:11
hadoop
jdk
linux
centos
hdfs
单机搭建hadoop环境(包括
hdfs
、yarn、hive)
单机可以搭建伪分布式hadoop环境,用来测试和开发使用,hadoop包括:
hdfs
服务器yarn服务器,yarn的前提是
hdfs
服务器,在前面两个的基础上,课可以搭建hive服务器,不过hive不属于
howard_shooter
·
2024-02-02 23:39
大数据
hadoop
大数据
分布式
数据库运维
工作量直接减少 50%,基于大模型构建智能问答系统的技术分享
本文源自百度智能云
数据库运维
团队的实践,深入探讨了基于大模型构建「知识库智能问答系统」的设计过程和应用。全文包括了总体的技术方案选型、各个模块的设计实现、重点难点问题的突破、以及目前的落地场景应用等。
百度智能云技术站
·
2024-02-02 23:35
百度智能云数据库
人工智能
向量数据库
文心一言
百度
数据库
Flink 的架构与组件
Flink支持各种数据源和接口,如Kafka、
HDFS
、TCP流等,并可以将处理结果输出到各种数据接收器,如
HDFS
、Elasticsearch、Kafka等。
禅与计算机程序设计艺术
·
2024-02-02 20:06
flink
架构
大数据
云存储
安全的八大威胁与应对之道
云存储
是一个以数据存储和管理为核心的云应用系统,给企业组织提供了一种全新的数据信息存储模式。
知白守黑V
·
2024-02-02 18:34
云计算
云安全
安全运维
云存储
云安全
存储安全
网络安全
DDOS攻击
数据泄露
云平台安全
DataX介绍
一、介绍DataX是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、
HDFS
、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
有人看我吗
·
2024-02-02 18:03
大数据
datax
docker-学习-4
1.5.看卷的详细信息2.如何做多台宿主机里的多个容器之间的数据共享2.1.概念2.2.搭NFS服务器+实现多个容器之间的数据共享的详细步骤2.3.如果是多台机器,背后需要使用nfs、NAS、SAN、
云存储
等网络存储解决
不冤不乐
·
2024-02-02 18:28
docker学习
docker
学习
eureka
datax 学习记录
初识DataX是由阿里巴巴研发并开源的一个异构数据源离线同步工具,DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase
咳咳00
·
2024-02-02 17:58
学习
大数据
datax
datax避坑记录
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、
HDFS
、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS
佛祖保佑永不宕机
·
2024-02-02 17:28
数据库
数据库
Hadoop原理
Hadoop框架分布式文件存储-
HDFS
即Hadoop内提供分布式数据存储的文件系统分布式计算框架-MapReduce即Hadoop内提供的进行分布式计算的组件分布式资源调度-YARN即Hadoop内提供的进行分布式资源调度的组件
我走之後
·
2024-02-02 14:25
hadoop
大数据
分布式
实现Redis亿级存储的方案
在
hdfs
的帮助下离线存储千亿记录并不困难,然而DMP还需要提供毫秒级的实时查询。由于cookie这种id本
skyito88
·
2024-02-02 12:25
编程
php
Hive基本操作
在所有操作前先启动
hdfs
、yarn、historyserver。
明明德撩码
·
2024-02-02 11:19
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他