E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
研磨hadoop
sqoop导入导出工具的使用以及通过java代码连接linux,远程执行shell命令
1、sqoop是apache开源提供的一个数据导入导出的工具,从关系型数据库导入到hdfs,或者从hdfs导出到关系型数据库等等导入数据:MySQL,Oracle导入数据到
Hadoop
的HDFS、HIVE
喵喵秀拌酱
·
2023-12-04 21:20
笔记
数据库
mysql
hadoop
大数据
Spark读写Oracle性能深度调优
Spark作为一个分布式计算框架,可以很好的适用于
Hadoop
。那么Spark是否可以与关系型数据库较好的进行兼容呢?以Spark作为计算,以关系型数据库(例如Oracle)作为存储?
weixin_43370502
·
2023-12-04 21:16
spark
oracle
数据库
大数据的技术栈-逐步完善
目录1.
hadoop
a.HDFS分布式文件系统b.Yarn集群资源管理器c.MapReducesql引擎d.Impalasql引擎e.工具概观2.数据仓库知识a.Hive数据库1)HiveSql2)数据库结构
刘文钊1
·
2023-12-04 20:12
大数据
centos安装Python3之后yum不能使用异常
问题描述在centos上安装python3之后出现yum使用不了问题,使用yum会报如下信息:[root@
hadoop
101~]#yuminstallwgetFile"/usr/bin/yum",line30exceptKeyboardInterrupt
大数据魔法师
·
2023-12-04 20:04
错误解决方法
centos
linux
运维
头歌大数据作业二:搭建
Hadoop
环境及HDFS
课外作业二:搭建
Hadoop
环境及HDFS作业详情内容阿里云-云起实验室-《搭建
Hadoop
环境》-
Hadoop
-2.10.1伪分布式:1.截图本实验ECS的公网IP地址,并添加彩色框标注,如下图所示:
别叫哥喜羊羊
·
2023-12-04 15:42
hadoop
大数据
hdfs
(图文详细)云计算与大数据实训作业答案(之篇三HDFS和MapReduce实训 )
HDFS和MapReduce实训第1关:WordCount词频统计第2关:HDFS文件读写第3关:倒排索引第4关:网页排序——PageRank算法HDFS和MapReduce实训
Hadoop
是一个由Apache
Sunny蔬菜小柠
·
2023-12-04 15:11
云计算与大数据
云计算与大数据实训作业答案
大数据生态圈及分布式文件系统HDFS实践-part1
Hadoop
入门第一章大数据概述1.1大数据概念“人类正在从IT时代走向DT时代”。大数据(BigData):指的是传统数据处理应用软件不足以处理(存储和计算)它们的大而复杂的数据集。
落叶飘雪2014
·
2023-12-04 15:40
Hadoop
大数据
Hadoop
HDFS
大数据实训笔记3:hdfs
HDFS(
Hadoop
DistributedFileSystem)是一个文件系统,用于存储文件,通过目录树来定位文件。它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
Roslin_v
·
2023-12-04 15:39
hdfs
大数据
hadoop
Java操作Hdfs(分布式文件系统)完成文件上传、下载和删除
Java操作Hdfs(分布式文件系统)文件上传实现创建Maven项目,项目命名
Hadoop
_hdfs导入pom.xml依赖4.0.0
hadoop
hadoop
0.0.1-SNAPSHOT
hadoop
_learnorg.apache.
hadoop
hadoop
-client3.2.0
菜鸟小党
·
2023-12-04 15:39
hadoop
hdfs
java
hadoop
HDFS和MapReduce综合实训:构建大数据处理应用
摘要:本文将介绍如何使用
Hadoop
分布式文件系统(HDFS)和MapReduce框架来构建大数据处理应用。
IbtnLisp
·
2023-12-04 15:09
hdfs
mapreduce
hadoop
木糠杯
磨碎饼干如果有
研磨
机的话,可以把饼干放进
研磨
机中磨碎。使用
研磨
机前,请清洁
研磨
机。如果没有或者觉得麻烦,也可以用面杖把饼干碾碎。为了防止饼干乱溅,最好事先把饼干装进一个洁净结实的袋子里。
LYY_f01
·
2023-12-04 14:06
感恩日记第20篇 祝你一帆风顺
看着这香芋糕,想起了姐姐的婆婆也经常做这香芋糕,而且是纯工
研磨
的,每次去姐姐家,都能吃到她婆婆做的这糕点。我和她语言不通,她的本地音很重,我听不清楚,但我们能聊关于这个糕点的话题。君
007长期写作践行者佩佩玲珑
·
2023-12-04 13:01
HBASE命令行查看中文字符
问题记录中文显示的是编码字符不方便查看value=\xE5\xB8\xB8\xE5\xAE\x89\xE5\xAE\x891修改前中文显示:解决方法1、'列族:列名:toString’2、'列族:列名:c(org.apache.
hadoop
.hbase.util.Bytes
Link_999
·
2023-12-04 11:20
HBASE
hbase
数据库
大数据
HADOOP
::Fsimage和Edits解析
NameNode被格式化之后,将在/opt/module
hadoop
-3.1.3/data/tmp/dfs/name/curent目录中产生如下文件fsimage_0000000000000000000fsimage
星星失眠️
·
2023-12-04 09:15
大数据开发技术
hdfs
大数据
hadoop
Presto基础学习--学习笔记
1,Presto背景2011年,FaceBook的数据仓库存储在少量大型
hadoop
/hdfs集群,在这之前,FaceBook的科学家和分析师一直靠hive进行数据分析,但hive使用MR作为底层计算框架
祈愿lucky
·
2023-12-04 09:21
大数据
学习
笔记
大数据
基于
hadoop
下的Kafka分布式安装
简介Kafka是一种分布式流处理平台,它具有高吞吐量、可扩展性、可靠性、实时性和灵活性等优点。它能够支持每秒数百万条消息的传输,并且可以通过增加节点来增加吞吐量和存储容量。Kafka通过将数据复制到多个节点来实现数据冗余和高可用性,即使某个节点故障,也可以保证数据不会丢失。它能够快速地处理和传输数据,支持实时数据的处理和分析。此外,Kafka可以与各种不同的数据处理和分析工具集成,包括流处理、批处
necessary653
·
2023-12-04 08:37
分布式
kafka
hadoop
大数据
数据库
【大数据】区分 hdfs dfs -ls 与 hdfs dfs -ls /
[
hadoop
@
hadoop
001~]$hdfsdfs-
G皮T
·
2023-12-04 07:19
#
Hadoop
大数据
hdfs
hadoop
带你涨姿势,Hbase 概念原理扫盲 !
bainianminguo/p/12110077.html作者:bainianminguo一、Hbase简介1、什么是HbaseHbase的原型是google的BigTable论文,收到了该论文思想的启发,目前作为
hadoop
码农小光
·
2023-12-04 07:06
阅读 Flink 源码前必会的知识 - 命令行解析库 Apache Commons Cli
一、介绍一下ApacheCommonsCli,有一个感官的认识我们在使用一些开源项目时,会敲一些命令,有简单的,比如
hadoop
version;有复杂的,比如flinkrun…,hdfsdfs-ls,等等
KK架构
·
2023-12-04 06:22
Flink
flink
flink源码
命令行
解析
Apache
Commons
flink-connector-mysql-cdc_2.0.2
flink-cdc-connectors/master/content/connectors/mysql-cdc.html1、测试步骤:1)开启MySQLBinlog并重启MySQL2)启动HDFS集群[
hadoop
ykqidev
·
2023-12-04 06:49
flink
flink
mysql
java
Hadoop
——分布式存储HDFS
HDFS集群环境部署VMware虚拟机中部署一、https://
hadoop
.apache.org中下载安装包二、环境分配三、上传、解压确认服务器创建、固定IP、防火墙关闭、
Hadoop
用户创建、SSH
A尘埃
·
2023-12-04 06:13
hadoop
分布式
hdfs
Hadoop
——分布式计算MapReduce和资源调度Yarn
分布式计算MapReduceYARN架构YARN集群部署一、
Hadoop
安装目录下/etc/
hadoop
修改mapred-env配置文件,mapred-site.xml文件二、etc/
hadoop
文件内
A尘埃
·
2023-12-04 06:34
hadoop
mapreduce
eclipse
yarn
八、hdfs文件系统副本块数量的配置
1、配置方式2、实际操作演示(1)在
Hadoop
用户的根目录下创建text.txt文件(2)上传文件
hadoop
@node1:~$hdfsdfs-lshdfs://node1:8020/Found4itemsdrwxr-xr-x-
hadoop
supergroup02023
弦之森
·
2023-12-04 05:05
Hadoop
hdfs
hadoop
大数据
2023.12.3 分布式SQL查询引擎-Presto
目录1.Prosto简介==Apache
Hadoop
-MapReduce====ApacheHive==2.Presto的优缺点3.个人自用启动服务个人自用启动服务4.presto和hive的区别5.presto
白白的wj
·
2023-12-04 05:29
分布式
sql
数据库
hadoop
大数据
数据仓库
mapreduce
使用 Kettle 完成数据 ETL
先将数据集加载到
Hadoop
集群中,然后对数据进行清洗,最后加载到Hive中。
撕得失败的标签
·
2023-12-03 23:33
Hadoop
Kettle
数据仓库
Hadoop
Hive
大数据
ETL
产品迭代更新 | 阿列夫科技基于Linkis+DataSphere Studio的单机安装部署实战
作者:萧寒GitHubID:hx23840阿列夫科技原来的技术平台是基于
Hadoop
,Spark平台搭建的,为了充分的满足业务需求,做了大量接口封装。
微众开源
·
2023-12-03 23:12
开源
微众开源
大数据
科技
hadoop
大数据
Ubuntu安装
hadoop
并做单机测试
1.配置jdk见前文2.下载解压
hadoop
这里以2.7.7版本为例,将文件剪切到/usr/local里面并更改名字为
hadoop
方便后续配置#解压sudotar-zxvf
hadoop
-2.7.7.tar.gz
MA木易YA
·
2023-12-03 20:37
基于
hadoop
的商品推荐系统_推荐系统大规模特征工程与FEDB的Spark基于LLVM优化
今天给大家分享第四范式在推荐系统大规模特征工程与Spark基于LLVM优化方面的实践,主要包括以下四个主题。大规模推荐系统特征工程介绍SparkSQL与FESQL架构设计基于LLVM的Spark性能优化推荐系统与Spark优化总结大规模推荐系统特征工程介绍推荐系统在新闻推荐、搜索引擎、广告投放以及最新很火的短视频App中都有非常广阔的应用,可以说绝大部分互联网企业和传统企业都可以通过推荐系统来提升
weixin_39541212
·
2023-12-03 18:05
基于hadoop的商品推荐系统
大数据 python
hadoop
_大数据与
Hadoop
1.大数据简介1.1大数据的由来随着计算机技术的发展,互联网的普及,信息的积累已经到了一个非常庞大的地步,信息的增长也在不断的加快,随着互联网、物联网建设的加快,信息更是爆炸式增长,收集、检索、统计这些信息越发困难,必须使用新的技术来解决这些问题1.2什么是大数据xxxxxxxxxx【1】定义大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新处理模式才能具有更强的决策
weixin_39883129
·
2023-12-03 18:35
大数据
python
hadoop
[一起学Hive]之一–Hive概述,Hive是什么
1.Hive是什么Hive是基于
Hadoop
的数据仓库解决方案。由于
Hadoop
本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性。这是来自官方的解释。
antyzhu
·
2023-12-03 17:23
kafka到hbase API
{ConnectionInstance,HbaseUtil,PropertiesUtil}importorg.apache.
hadoop
.conf.Configurationimportorg.apache.
hadoop
.hbase
故里良田
·
2023-12-03 16:37
Hadoop
是什么,主要有哪些优势?
Hadoop
是一个能够对大量数据进行分布式处理的软件框架。但是
Hadoop
是以一种可靠、高效、可伸缩的方式进行处理的。
人工智能爱好者
·
2023-12-03 14:07
大数据
Hadoop介绍
Hadoop优势
Hadoop
1 ~
Hadoop
3 的发展史
Hadoop
简介
Hadoop
到目前为止发展已经余年了,版本经过了无数次的更新迭代,目前市面上已经把
Hadoop
分为
Hadoop
1、
Hadoop
2、
Hadoop
3三个版本。
大数据狂人
·
2023-12-03 14:34
hadoop
hadoop
介绍以及未来发展
大数据作为当今世界的重要商业行为,给无数商家和企业带来了无数的发展机遇和机会,这里介绍一下,因为sap也是需要进入大数据时代的,毕竟跟这互联网,sap有发展,如果单纯就是应用在企业中,会错失很多良机。比如sap服务的很多客户,卖苹果的一家单位,当时只是一家小作坊,但是后来通过sap达到了一定量级,然后做到了当地的巨无霸企业。大数据主要有如下几个特点:1.数据体量很大2.数据类型多样3.商业价值4.
Troc_wangpeng
·
2023-12-03 14:34
hadoop
大数据
分布式
大数据
Hadoop
技术的发展历史与未来前景
大数据概念火了又火,但是好多人对大数据的概念却一知半解,今天主要来细说下
Hadoop
:1.
Hadoop
是什么1)
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构2)主要解决,海量数据的存储和海量数据的分析问题
人工智能和大数据时代
·
2023-12-03 14:04
大数据
Hadoop
好程序员大数据教程分享之
Hadoop
优缺点
好程序员大数据教程分享之
Hadoop
优缺点,大数据成为时代主流,开启时代的大门,全球43亿部电话、20亿位互联网用户每秒都在不断地产生大量数据,人们发送短信给朋友、上传视频、用手机拍照、更新社交网站的信息
?Briella
·
2023-12-03 14:34
大数据
Hadoop
未来五年走向何方
相对于传统数据库和数据仓库技术,
Hadoop
的优势在于将数据分析和存储平民化。
IT时代周刊
·
2023-12-03 14:02
2019年5月
2019年3月
2018年11月
2018年6月
2018年12月
2019年4月
2017年3月
2016年5月
2017年2月
2016年4月
2014年9月
大数据
人工智能
编程语言
程序员
Hadoop
概述
一、什么是
Hadoop
二、
Hadoop
发展史1.
Hadoop
创始人为DougCutting,为了实现与谷歌类似的全文搜索功能,他在Lucene框架基础上进行优化升级,查询引擎和索引引擎。
勤奋的ls丶
·
2023-12-03 14:31
Hadoop
hadoop
mapreduce
big
data
大数据
大数据开发:HDFS Erasure Coding机制
提到大规模数据存储,
Hadoop
的分布式存储,作为主流的技术方案,实力也是得到市场认可的。
Hadoop
的分布式文件系统HDFS,其冗余备份机制,确保了数据存储的容错,但是同时也增加了冗余存储成本。
成都加米谷大数据
·
2023-12-03 14:29
昨日黄花
Hadoop
方兴未艾云原生——传统大数据平台的云原生化改造
本文6539字,阅读时间约20分钟以
Hadoop
为中心的大数据生态系统从2006年开源以来,一直是大部分公司构建大数据平台的选择,但这种传统选择随着人们深入地使用,出现越来越多的问题,比如:数据开发迭代速度不够快
LinkTime_Cloud
·
2023-12-03 14:28
大数据
分布式
编程语言
hadoop
kubernetes
Hadoop
的基本概念、架构、优点、缺陷、适应场景和未来发展方向
作者:禅与计算机程序设计艺术1.背景介绍
Hadoop
是一个由Apache基金会开发并开源的分布式计算框架,是一个为海量数据的分析而设计的工具。
禅与计算机程序设计艺术
·
2023-12-03 14:57
AI大模型应用实战
大数据AI人工智能
大数据
人工智能
语言模型
Java
Python
架构设计
大数据技术之Oozie
一个基于工作流引擎的开源框架,由Cloudera公司贡献给Apache,提供对
Hadoop
MapReduce、PigJobs的任务调度与协调。Oozie需要部署到JavaServlet容器中运行。
星川皆无恙
·
2023-12-03 13:00
大数据
系统运维
大数据
java
数据仓库
架构
sql
Hbase与Hive的区别与联系
参考了网上的一些资料,这两者的关联基本如下Hbase,是数据库,是基于
Hadoop
的一种NoSQL数据库,主要适用于海量明细数据(十亿、百亿)的随机实时查询,如交易清单、日志明细、轨迹行为等。
阿乐_822e
·
2023-12-03 12:13
Spark经典案例分享
Spark经典案例链接操作案例二次排序案例链接操作案例案例需求数据介绍代码如下:packagebase.charpter7importorg.apache.
hadoop
.conf.Configurationimportorg.apache.
hadoop
.fs
pblh123
·
2023-12-03 12:45
Spark
spark
一致性hash
应用领域(数据分布式存储)数据缓存集群(redis、memcache)
hadoop
ESearch分布式数据库演进产生的问题1.本地缓存image.png由于用户访问量的上升,DB的并发数增加,对数据库造成巨大压力
半数的年
·
2023-12-03 10:32
hive 分号(;)在数据处理中带来的问题
NoViableAltException(114@[])atorg.apache.
hadoop
.hive.ql.parse.HiveParser_IdentifiersParser.function(HiveParser_IdentifiersParser.java
hankl1990
·
2023-12-03 09:34
hive
hive
大数据
hadoop
hbase Master is initializing
问题如下:ERROR:org.apache.
hadoop
.hbase.PleaseHoldException:MasterisinitializingERROR:org.apache.
hadoop
.hbase.PleaseHoldException
Link_999
·
2023-12-03 09:39
HBASE
hbase
数据库
大数据
Hive SQL使用过程中的奇怪现象
hive是基于
Hadoop
的一个数据仓库工具,用来进行数据的ETL,这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
大数据技术与数仓
·
2023-12-03 08:07
基于
hadoop
下的hbase安装
就像Bigtable利用了Google文件系统(FileSystem)所提供的分布式数据存储一样,HBase在
Hadoop
之上提供了类似于Bigtable的能力。
necessary653
·
2023-12-03 05:45
hadoop
hbase
大数据
MMA安装及使用优化
1.背景公司自建的
Hadoop
集群,后期使用阿里的Maxcompute,就需要迁移数据到新环境中,阿里提供众多的迁移方案,在经过我们的实践后,最终选择了MMA,迁移数据Hive到Maxcompute。
选手一号位
·
2023-12-03 02:14
上一页
40
41
42
43
44
45
46
47
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他