E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs导出数据
用户画像项目背景
1,用户画像项目介绍大数据平台简介数据仓库+用户画像+推荐系统(1)数据仓库:加快数据的分析和查询数据仓库分层:ODS层(映射
HDFS
的数据)—DW(数据仓库层)–APP(层)—BI(层)DW:DWD明细数据层
祈愿lucky
·
2024-01-26 13:20
大数据
spark
kafka
Flink1.13集成Hadoop3.x以上版本
org.apache.flink.core.fs.UnsupportedFileSystemSchemeException:Couldnotfindafilesystemimplementationforscheme'
hdfs
未来影子
·
2024-01-26 04:22
Flink
hadoop
hdfs
flink
HDFS
操作
文章目录主要内容1.编程实现以下指定功能,并利用Hadoop提供的Shell命令完成相同任务:一.shell命令行实现1.向
HDFS
中上传任意文本文件,如果指定的文件在
HDFS
中已经存在,则由用户来指定是追加到原有文件末尾还是覆盖原有的文件
K要努力
·
2024-01-26 02:43
算法与数据结构
hdfs
hadoop
大数据
eclipse
Pyspark 读 DataFrame 的使用与基本操作
一、安装基于mac操作系统安装jdkjdk下载地址安装pysparkpipinstallpyspark二、读取
HDFS
文件读json注意,如果是多行的json,需要用“multiLine”模式,否则会报错
苏学算法
·
2024-01-26 02:10
spark
sql
hadoop
spark
sql
pyspark
pyspark学习-RDD转换和动作
RDDsc.parallelize(param:list)#demosc.parallelize(['tom','jack','black'])#2.textFile方法:读取文件,创建RDD,参数为
hdfs
heiqizero
·
2024-01-26 02:39
spark
spark
python
使用CDH的api接口对cdh服务进行滚动重启
写了个py脚本实现此功能importtimeimportrequestsimportjsonimportsys#可操作的服务列表server_list=['
hdfs
','yarn','zookeeper
Mumunu-
·
2024-01-26 01:32
大数据
python
HDFS
的优缺点、写流架构、访问方式、可靠性策略新特性
HDFS
优点高容错性数据自动保存多个副本副本丢失后,自动恢复适合批处理移动计算而非数据数据位置暴露给计算框架适合大数据处理GB、TB、甚至PB级数据百万规模以上的文件数量10K+节点规模流式文件访问一次性写入
木迪_2a4e
·
2024-01-26 00:49
CDH浏览器安装流程
选择所有得主机列出所有得主机3然后根据自己安装得版本来进行选择选择对应版本4然后等待安装等待配置5出现问题根据提示进行操作进行相关设置(安装得时候,一般做了配置)6然后下一步,然后选择自定义安装,先安装最基本得几个组件:
HDFS
HbaseZooKeePerYARN7
PunkP
·
2024-01-25 23:41
大数据开发之Spark(spark streaming)
sparkstreaming支持的数据源很多,例如:kafka、flume、
hdfs
等。数据输入后可以用spark的高度抽象原语如:map、reduce、join、window等进行计算。
Key-Key
·
2024-01-25 21:07
大数据
spark
分布式
sqoop之hive数据仓库和oracle数据库数据转换
,主要用于在Hadoop(Hive)与传统的数据库(mysql、oracle)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的
HDFS
Summer_1981
·
2024-01-25 20:37
java打jar包添加第三方依赖
org.apache.maven.pluginsmaven-shade-plugin2.4.3packageshadeaddMain-Classtomanifestfilecom.shine.
Hdfs
APImergeMETA-INF
久生情123
·
2024-01-25 18:25
笔记
java
jar
开发语言
HDFS
高可用架构涉及常用功能整理
HDFS
高可用架构涉及常用功能整理1.
hdfs
的高可用系统架构和相关组件2.
hdfs
的核心参数2.1常规配置2.2特殊优化配置2.1.1NN优化2.1.2DN优化3.
hdfs
常用命令3.1常用基础命令3.2
李姓门徒
·
2024-01-25 16:31
大数据
Hdfs
hdfs
hadoop
大数据
python
导出数据
为parquet格式
importduckdbimportpandasaspdfromsqlalchemyimportcreate_engine#定义连接到您的MySQL或PostgreSQL数据库的参数db_type='mysql'#或'postgresql'user='your_username'password='your_password'host='your_host'port='your_port'data
国强_dev
·
2024-01-25 14:00
python
开发语言
hadoop集群部署
Hadoop的框架最核心的设计就是:
HDFS
和Ma
Cat God 007
·
2024-01-25 12:45
笔记
大数据
大数据
hdfs
hadoop集群规划部署
hadoop102hadoop103hadoop104
HDFS
NameNodeDataNodeDataNodeSecondaryNameNodeDataNodeYARNNodeManagerResourceManagerNodeManagerNodeM
Snower_2022
·
2024-01-25 12:43
hadoop
hadoop
java
大数据
linux clickhouse 安装
其中clickhouse-server是clickhouse服务,就是用来访问数据存储数据,clickhouse-client是用来通过命令访问数据、导入
导出数据
等。
那些乐趣
·
2024-01-25 11:01
linux
clickhouse
运维
如何在 MySQL / MariaDB 中导入
导出数据
,导入
导出数据
库文件、Excel、CSV
导出」2.MySQL/MariaDB数据库数据「导入」3.使用「卡拉云」一键导入导出MySQL/MariaDB数据4.先决条件一.导出MySQL或MariaDB数据库1.如何使用`mysqldump`
导出数据
蒋川_卡拉云
·
2024-01-25 10:45
卡拉云
数据库
mysql
mariadb
上万字详解Spark Core(建议收藏)
虽然MapReduce提供了对数据访问和计算的抽象,但是对于数据的复用就是简单的将中间数据写到一个稳定的文件系统中(例如
HDFS
),
废柴程序员
·
2024-01-25 09:06
Hadoop-
HDFS
写流程(从命令行到完成)
一、简单回顾下
HDFS
的架构如果不了解
HDFS
的可以看下我写的一篇博客,这里先贴下官网架构图:二、源码分析源码中写的肯定是最真实的,下面是hadoop官方源码下载地址,我下载的是hadoop-3.2.4
隔着天花板看星星
·
2024-01-25 09:23
hadoop
hdfs
大数据
Hadoop-
HDFS
高可用
一、说明在我的博客中已经包含了
HDFS
高可用的搭建,这里描述下它的原理。
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
Hadoop-
HDFS
读流程(从输入命令到回显)
一、简单回顾下
HDFS
的架构如果不了解
HDFS
的可以看下我写的一篇博客,这里先贴下官网架构图:二、静静的思考一会儿爱因斯坦说过:想象力比知识更重要。想象力推动世界,是知识进化的源泉。
隔着天花板看星星
·
2024-01-25 09:52
hadoop
hdfs
大数据
HBase学习五:运维排障之备份与恢复
HBase的所有文件都存储在
HDFS
上,因此只要使用Hadoop提供的文件复制工具distcp将HBASE目录复制到同一
HDFS
或者其他
HDFS
的另一个目录中,就可以完成对源HBase集群的备份工作copyTable
Studying!!!
·
2024-01-25 09:49
中间件
hbase
学习
运维
ORACLE数据导出工具
最近应公司要求
导出数据
为csv格式文件供业务人员存档查看,同时还需要按照指定分隔符导出其他文本格式,待数据迁移使用,就是根据指定的sql,按照指定的分隔符和文本格式
导出数据
。
Epoch-Elysian
·
2024-01-25 09:34
数据库
linux
oracle
数据库
大数据平台组件日常运维操作说明(Hadoop/Zookeeper/Kafa/ES/Mysql/Spark/Flume/Logstash/Tomcat)
Hadoop日常运维操作说明
hdfs
生产环境hadoop为30台服务器组成的集群,统一安装配置,版本号为2.7.7部署路径:/opt/hadoop启动用户:hadoop配置文件:/opt/hadoop/
love6a6
·
2024-01-25 07:12
大数据
java-zookeeper
运维
Hadoop
HDFS
实现原理图文详解
一、
HDFS
体系结构1.1
HDFS
简介Hadoop分布式文件系统(
HDFS
)是运行在通用硬件(commodityhardware)上的分布式文件系统(DistributedFileSystem)。
禅与计算机程序设计艺术
·
2024-01-25 07:49
大数据小白初探
HDFS
架构原理:带你揭秘背后的真相(一)
目录1.前言2.
HDFS
架构2.1架构定义2.2揭秘架构2.3
HDFS
核心结构3.
HDFS
的优缺点3.1
HDFS
的优点3.2
HDFS
的缺点4.
HDFS
的应用场景5.总结1.前言前面的文章写了一篇,大数据方面的基础知识
程序员阿奇
·
2024-01-24 19:38
Hadoop
大数据
hdfs
架构原理
EditLog
checkpoint
FsImage
小白初探架构模式—常用的设计模式
2.4主从架构的示例3.主从架构设计的延伸3.1主备模式3.2主从复制3.3集群分片3.4异地多活4.总结1.前言作为一个架构设计小白,我们通常用了很多种工具,比如Mysql、Redis、Kafka、
Hdfs
程序员阿奇
·
2024-01-24 19:03
Hadoop
java
主从架构
设计模式
集群分片
主从复制
部署Hadoop集群
在node1节点执行,以root身份1:在VMware虚拟机集群上部署
HDFS
集群1)准备好hadoop安装包;目前最新3.3.4;了解:2)上传解压hadoop①:上传hadoop到node1节点;②
%HelloWorld%
·
2024-01-24 13:27
java
开发语言
springboot
导出数据
到excel模板,使用hutool
导出数据
到指定excel,java写入数据到excel模板
最近遇到一个需求,需要从数据库查询数据,写入到对应的excel导入模板中。再把导出的数据进行修改,上传。我们项目用的是easyExcel,一顿百度搜索,不得其法。主要是要把数据填充到指定单元格中,跟平时用到的导出不一样。项目中也没有引入其它poi。后来忽然想起来,项目中集成的有hutool,可以用hutool的导入导出功能,先把excel导入模板读取出来,再给excel模板加工数据,最后再导出。然
成年人的苦衷
·
2024-01-24 12:57
java
java
【2024】基于PHP的外卖点餐系统设计(源码+文档+指导)
目录一、整体目录(示范):文档含项目技术介绍、E-R图、数据字典、项目功能介绍与截图等二、运行截图三、代码部分(示范):四、数据库表(示范):数据库表有注释,可以
导出数据
字典及更新数据库时间,欢迎交流学习五
java_python源码
·
2024-01-24 11:06
PHP
数据库
食堂点餐
外卖订餐
美食外卖
【2024】基于springboot公交线路查询系统(源码+文档+指导)
目录一、整体目录(示范):文档含项目技术介绍、E-R图、数据字典、项目功能介绍与截图等二、运行截图三、代码部分(示范):四、数据库表(示范):数据库表有注释,可以
导出数据
字典及更新数据库时间,欢迎交流学习五
java_python源码
·
2024-01-24 11:05
java
数据库
公交查询
【2024】基于springboot心理健康服务小程序(源码+文档+指导)
整体目录:文档含项目摘要、前言、技术介绍、可行性分析、流程图、结构图、ER属性图、数据库表结构信息、功能介绍、测试致谢等约1万字等二、运行截图三、代码部分(示范):四、数据库表(示范):数据库表有注释,可以
导出数据
字典及更新数据库时间
java_python源码
·
2024-01-24 11:02
小程序
APP
java
spring
boot
小程序
后端
心理咨询
心理健康服务
Hive 优化总结
Hive优化本质:
HDFS
+MapReduce问题原因:倾斜:分区:有的分区没有数据,有的分区数据堆积。(若按天分区,每一天数据差别大就叫倾斜。)
Byyyi耀
·
2024-01-24 10:25
hive
hadoop
数据仓库
Hive优化
IDEA报错:No hostname could be resolved for the IP address 127.0.0.1, using IP address as host name.
NohostnamecouldberesolvedfortheIPaddress127.0.0.1,usingIPaddressashostname.Localinputsplitassignment(suchasfor
HDFS
files
唯一2333
·
2024-01-24 09:09
flink
kafka
idea
hbase 总结
HBase什么是HBasehbase是一个基于java、开源、NoSql、非关系型、面向列的、构建与hadoop分布式文件系统(
HDFS
)上的、仿照谷歌的BigTable的论文开发的分布式数据库。
l靠近一点点l
·
2024-01-24 08:24
大数据
hbase
Hbase原理、基本概念、基本架构
概述HBase是一个构建在
HDFS
上的分布式列存储系统;HBase是基于GoogleBigTable模型开发的,典型的key/value系统;HBase是ApacheHadoop生态系统中的重要一员,主要用于海量结构化数据存储
wyl9527
·
2024-01-24 08:24
Hbase
hbase
存储系统
Hadoop集群(第12期)_HBase简介及安装
可以直接使用本地文件系统也可使用Hadoop的
HDFS
文件存储系统。为了提高数据
weixin_30451709
·
2024-01-24 08:23
大数据
数据库
人工智能
HBase学习
可以直接使用本地文件系统也可使用Hadoop的
HDFS
文件存储系统。为了提高数据
mm_bit
·
2024-01-24 08:20
HBase
大数据
数据库
HBase简易安装和简介
可以直接使用本地文件系统也可使用Hadoop的
HDFS
文件存储系统。为了提高数据
滑过的板砖
·
2024-01-24 08:49
Hbase
HBase学习五:运维排障之宕机恢复
RegionServer主要负责用户的读写服务,进程中包含很多缓存组件以及与
HDFS
交互的组件,实际生产线上往往会有非常大的压力,进而造成的软件层面故障会比较多。
Studying!!!
·
2024-01-24 07:27
中间件
hbase
学习
运维
记一次Flink通过Kafka写入MySQL的过程
->sink,即从source获取相应的数据来源,然后进行数据转换,将数据从比较乱的格式,转换成我们需要的格式,转换处理后,然后进行sink功能,也就是将数据写入的相应的数据库DB中或者写入Hive的
HDFS
梦痕长情
·
2024-01-24 07:17
flink
kafka
mysql
Hadoop中HBase命令行操作
采用的底层存储为
HDFS
。使用Hbase客户端操作,执行查看Hbase版本、状态、查看帮助命令。创建表、修改表、插入数据、删除数据、查询数据,清空表、退出Hbase命令行、停止
HDFS
服务。
m0_69595107
·
2024-01-24 06:05
Hadoop
hadoop
hbase
大数据
centos
Storm和hadoop对比及storm组件
stormhadoop实时流处理批处理无状态有状态使用zk协同的主从架构无主从zk架构每秒处理数万消息
HDFS
,MR数分钟,数小时不会主动停止终于完成的时候storm优点:跨语言,可伸缩,低延迟,秒级容错核心概念
smartjiang
·
2024-01-24 02:01
PowerDesigner
导出数据
库表到word文档
概述:利用PowerDesigner可以制作数据流程图、概念数据模型、物理数据模型,还可以为数据仓库制作结构模型,也能对团队设计模型进行控制,同时还可以创建一个数据库。不过我们用的最多的还是制作流程图、概念数据模型和物理数据模型,使用它可以分别从概念数据模型和物理数据模型两个层次对数据库进行设计。在这里,概念数据模型描述的是独立于数据库管理系统(DBMS)的实体定义和实体关系定义;物理数据模型是在
木白星枝
·
2024-01-23 17:28
杂杂杂
dbeaver批量
导出数据
到另一个数据库
一、背景在实际生产环境中我们通常往往需要进行数据迁移或者数据备份,接下来我将模拟生产环境进行数据迁移二、问题现状1、现在我有两个数据库一个数据库名为ceshi1另一个数据库名为ceshi22、现在我的ceshi1里面有两张表三条数据,我想把这两张表迁移到ceshi2中迁移后数据结构和大小不变ceshi1表如下:ceshi2表如下:我们可以清楚的看到ceshi2数据库一张表和一条数据都没有,而我们现
耳边私语着
·
2024-01-23 12:09
postgresql
数据库
Hadoop集群配置及测试
配置文件hadoop102hadoop103hadoop104
HDFS
NameNodeDataNodeDataNodeSecondaryNameNodeDataNodeYARNNod
YUuuuME_
·
2024-01-23 11:07
hadoop
大数据
分布式
Spark解析JSON文件,写入
hdfs
一、用Sparkcontext读入文件,map逐行用Gson解析,输出转成一个caseclass类,填充各字段,输出。解析JSON这里没有什么问题。RDD覆盖写的时候碰到了一些问题:1.直接saveAsTextFile没有覆盖true参数;2.转dataframe时,还得一个一个字段显化才能转成dataframe;3.write时,一开始打算写text,说字段里不能含有long和int,换成str
gegeyanxin
·
2024-01-23 09:42
spark
json
hdfs
Gson
rdd转Dataframe
Hadoop基本介绍
1、Hadoop的整体框架Hadoop由
HDFS
、MapReduce、HBase、Hive和ZooKeeper等成员组成,其中最基础最重要元素为底层用于存储集群中所有存储节点文件的文件系统
HDFS
(HadoopDistributedFileSystem
w蕾丝
·
2024-01-23 08:53
DATAX的架构和运行原理
一.概念DATAX呢就是把各个不同构的数据库进行同步的过程,具体有
hdfs
hiveOracle等等吧。二.架构1.设计原理显而易见从强连通图到星形图,大大的简化了工作量。
加林so cool
·
2024-01-23 08:37
架构
Sqoop数据导入到Hive表的最佳实践
Sqoop是一个开源工具,用于在Hadoop生态系统中的数据存储(如
HDFS
)和关系型数据库之间传输数据。它可以帮助数据工程师和分析师轻松地
晓之以理的喵~~
·
2024-01-23 07:35
sqoop
hive
sqoop
hadoop
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他