E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据学习
spark 写入 mysql 报错
报错信息如下:"C:\ProgramFiles\Java\jdk1.8.0_291\bin\java.exe""-javaagent:D:\
Hadoop
ruanjian\IDEA\IntelliJIDEA2021.3.2
南城守护
·
2023-12-15 18:17
spark
mysql
android
物联网、大数据、云计算的区别与联系
Hadoop
、Spark海量数据云计算将计算资源虚拟化并按需卖给用户。方便计算资源的管理提高计算资源利用率。openstack、docker虚拟化二、相互关系粗略地看,可以认为物联网产生
weixin_30455067
·
2023-12-15 18:46
大数据基础知识
为了一场紧急考试,没有正经系统学习过大数据知识的我开始恶补概念涉及
Hadoop
、Hbase、Spark、Flink、Flume、Kafka、Sqoop、HDFS、Hive、Mapreduce、Impala
偶余杭
·
2023-12-15 17:22
HBase 高可用集群详细图文安装部署
目录一、HBase安装部署1.1Zookeeper正常部署1.2
Hadoop
正常部署1.3HBase安装1.4HBase的配置文件1.4.1hbase-env.sh1.4.2hbase-site.xml1.4.3regionservers1.4.4
Stars.Sky
·
2023-12-15 17:38
HBase
hbase
数据库
大数据
Hbase2.5.5分布式部署安装记录
环境准备1.1节点部署情况1.2安装说明2Hbase安装过程Step1:Step2:Step3:Step4:3WebUI检查状态并测试3.1WebUI3.2创建测试命名空间1环境准备1.1节点部署情况
Hadoop
11
程序终结者
·
2023-12-15 16:23
Hadoop生态
分布式
便捷搭建 Zookeeper 服务器的方法,好用,收藏~
由于ZooKeeper便捷的使用方式、卓越的性能和良好的稳定性,被广泛地应用于诸如
Hadoop
、HBase、Kafka和Dubbo等大型分布式系统中。整理了一份Java面试宝典完整版PDFZo
程序员白楠楠
·
2023-12-15 14:03
如何高效的阅读
Hadoop
源代码?
个人谈谈阅读
hadoop
源代码的经验。
丨程序之道丨
·
2023-12-15 14:54
kudu由来、架构、数据存储结构、注意事项
一、kudu背景介绍Kudu是Cloudera开源的新型列式存储系统,是Apache
Hadoop
生态圈的成员之一(incubating),专门为了对快速变化的数据进行快速的分析,填补了以往
Hadoop
存储层的空缺
AllenGd
·
2023-12-15 13:32
KUDU
kudu
计算机毕业设计Python+Spark知识图谱微博舆情预警系统 微博舆情分析 微博推荐系统 微博可视化 微博数据分析 微博大数据 微博爬虫 微博预测系统 大数据毕业设计 大数据毕业设计 机器学习
开发框架前端:vue.jselement-ui后端:springbootmybatis中间件:spark
hadoop
hiveflink数据库:mysql关系型数据库neo4j图数据库算法:协同过滤推荐算法
计算机毕业设计大神
·
2023-12-15 12:19
【基础知识】
Hadoop
生态系统
Hadoop
是一个开源的分布式计算框架,主要用于大数据的存储和处理,即一个包含多种组件的综合分布式系统,组件相互协作完成从数据存储到计算分析的完整功能。
偏振万花筒
·
2023-12-15 12:40
hadoop
大数据
分布式
Flink集群搭建
我安装的scala版本为2.11,所以要下载对应scala2.11版本的flink我使用的环境linux-CentOS7.9、Scala-2.11.6、jdk-1.8、flink-1.7.2-bin-
hadoop
27
NemoonFish
·
2023-12-15 12:20
flink集群搭建
flink
hadoop
-hdfs简介及常用命令详解(超详细)
文章目录前言一、HDFS概述1.HDFS简介2.HDFS架构3.HDFS文件操作二、HDFS命令介绍1.hdfs命令简介2.HDFS命令的基本语法3.常用的HDFS命令选项三、HDFS常用命令1.列出指定路径下的文件和目录。2.创建一个新的目录。3.将本地文件或目录上传到HDFS。4.从HDFS下载文件或目录到本地文件系统。5.删除HDFS中的文件或目录。6.移动文件或目录。7.显示文件的内容。8
大数据魔法师
·
2023-12-15 11:22
大数据
hadoop
hdfs
大数据
zookeeper集群安装
/opt/bigdatacd/opt/bigdata/zoo....cdconfcpzoo_sample.cfgzoo.cfgvizoo.cfgdatadir=/var/bigdata/
hadoop
/zkserver
新鲜氧气
·
2023-12-15 09:38
zookeeper
debian
linux
降低开放式创新的壁垒 | 赢在 Apache系列之一
序精英制、慈善机构、纯粹的个人志愿者、至今仍然是一个虚拟组织、拥有超过350个开源项目、有3255个提交者为Apache的项目做出了贡献......Apache的项目支撑了大半个互联网,
Hadoop
及其周边的软件项目构成了整个的大数据生态
开源社
·
2023-12-15 09:27
Yum仓库架构解析与搭建实践
1.Yum仓库搭建1.1本地Yum仓库图解1.2Linux本地仓库搭建配置本地光盘镜像仓库1)挂载[root@
hadoop
101~]#mount-tiso996/dev/cdrom/mnt2)查看[rooot
小孟多
·
2023-12-15 08:29
服务器
linux
运维
hadoop
使用内置包进行性能测试TestDFSIO、NNBench、MRBench、SliveTest
hadoop
使用内置包进行性能测试
hadoop
使用内置包进行性能测试
hadoop
使用内置包进行性能测试TestDFSIOread&writeNNBenchMRBenchSliveTestTestDFSIOread
何亚告
·
2023-12-15 07:51
菜鸟日常
hadoop
大数据
分布式
大数据技术13:HBase分布式列式数据库
一、
Hadoop
的局限HBase是一个构建在
Hadoop
文件系统之上的面向列的数据库管理系统。要想明白为什么产生HBase,就需要先了解一下
Hadoop
存在的限制?
Java架构何哥
·
2023-12-15 07:05
大数据治理
大数据
HBase列式数据库
Hbase表的数据结构
Hadoop
之 WordCount
一、软件环境我使用的软件版本如下:IntellijIdea2017.1Maven3.3.9
Hadoop
分布式环境二、创建maven工程打开Idea,file->new->Project,左侧面板选择maven
printf200
·
2023-12-15 07:13
《PySpark大数据分析实战》-07.Spark本地模式安装
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-15 07:31
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Flum--环境搭建实验
module/2.修改flum名字:mv/opt/module/apache-flume-1.9.0-bin/opt/module/flume3.将lib文件夹下的guava-11.0.2.jar删除以兼容
Hadoop
3.1.3r
芝士小熊饼干
·
2023-12-15 07:01
pycharm
ide
python
【Spark精讲】RDD特性之数据本地化
通过RDD的首选运行位置可以让RDD的某个分区的计算任务直接在指定的主机上运行,从而实现了移动计算而不是移动数据的目的,减少了网络传输的开销,如Spark中
Hadoop
RDD能够
话数Science
·
2023-12-15 07:58
Spark精讲
Spark
大数据
spark
大数据
Spark安装
本文搭建环境为:Mac+ParallelDesktop+CentOS7+JDK7+
Hadoop
2.6+Scala2.10.4+IDEA14.0.5————————————————————————————
weixin_30755393
·
2023-12-15 07:27
大数据
scala
java
新手入门:Spark 部署实战入门
Spark在整个大数据系统中处于中间偏上层的地位,如下图,对
hadoop
起到了补充作用:基本概念Fork/Join框架是Java7提供了的一个用于并行执行任务的框架,是一个把大任务分割成若干个小任务,
weixin_34256074
·
2023-12-15 07:27
scala
java
开发工具
【Hive】
一、Hive是什么Hive是一款建立在
Hadoop
之上的开源数据仓库系统,将
Hadoop
文件中的结构化、半结构化数据文件映射成一张数据库表,同时提供了一种类SQL语言(HQL),用于访问和分析存在
Hadoop
想当运维的程序猿
·
2023-12-15 07:23
hive
hadoop
数据仓库
Hadoop
集群部署实战指南
一、大数据简介1、为什么使用大数据技术?数据量越来越大数据分析的实时性越来越强数据结果的应用越来越广泛结论:我们需要使用大数据技术。2、大数据的定义大数据是收集、整理、处理大容量数据集,并从中获得结果的技术总称。二、大数据应用领域1)广告广告投放广告策略2)电信深度包检测流失分析
wespten
·
2023-12-15 07:53
Hadoop
Hive
Spark
大数据安全
hadoop
ambari
大数据
关于新手入门:Spark 部署实战入门
Spark在整个大数据系统中处于中间偏上层的地位,如下图,对
hadoop
起到了补充作用:基本概念Fork/Join框架是Java7提供了的一个用于并行执行任务的框架,是一个把大任务分割成若干个小任务,
IT资讯科技
·
2023-12-15 07:18
大数据
IT资讯
互联网科技
人工智能
大数据
程序员
编程语言
hadoop
Spark on Yarn 安装配置实验(3.1.1)
子任务二:SparkonYarn安装配置本任务需要使用root用户完成相关配置,已安装
Hadoop
及需要配置前置环境,具体要求如下:1、从宿主机/opt目录下将文件spark-3.1.1-bin-
hadoop
3.2
芝士小熊饼干
·
2023-12-15 07:44
spark
大数据
分布式
hadoop
Spark 单机搭建实战指南
在
Hadoop
的基础上,Spark优化了MapReduce计算模型,提高了数据处理速度,被广泛应用于大数据处理、机器学习、图计算等领域。本文将介绍如何在单台机器上搭建S
wcuuchina
·
2023-12-15 07:13
spark
spark
大数据
分布式
【
Hadoop
】
Hadoop
是一个开源的分布式离线数据处理框架,底层是用Java语言编写的,包含了HDFS、MapReduce、Yarn三大部分。
想当运维的程序猿
·
2023-12-15 07:43
hadoop
大数据
分布式
【
Hadoop
_06】MapReduce的概述与wc案例
1、MapReduce概述1.1MapReduce定义1.2MapReduce优点1.3MapReduce缺点1.4MapReduce核心思想1.5MapReduce进程1.6常用数据序列化类型1.7源码与MapReduce编程规范2、WordCount案例实操2.1本地测试2.2提交到集群测试1、MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,
温欣2030
·
2023-12-15 06:43
【大数据】
mapduce
【
Hadoop
_05】NN、2NN以及DataNode的工作机制
1、NameNode和SecondaryNameNode1.1NN和2NN工作机制1.2Fsimage和Edits解析1.3CheckPoint时间设置2、DataNode2.1DataNode工作机制2.2数据完整性2.3掉线时限参数设置1、NameNode和SecondaryNameNode1.1NN和2NN工作机制思考:NameNode中的元数据是存储在哪里的?首先,我们做个假设,如果存储在
温欣2030
·
2023-12-15 06:12
【大数据】
hadoop
java
大数据
《PySpark大数据分析实战》-03.了解Hive
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2023-12-15 06:42
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
Hadoop
集群搭建
https://www.zybuluo.com/DFFuture/note/6268991.查看hostname修改主机名sudogedit/etc/hostname重启reboot2.编辑hostsudogedit/etc/hosts删除127.0.1.1那一行,并添加:192.168.86.140ubuntu1192.168.86.143ubuntu2192.168.86.144ubuntu3
摩V羯座
·
2023-12-15 06:50
Hive安装步骤
目录1、安装前提:
hadoop
全分布2、卸载MariaDB数据库(1)设置防火墙服务开启不启动(2)查看linux自带的MariaDB数据库(3)卸载linux自带的MariaDB数据库3、安装mysql
chde2Wang
·
2023-12-15 06:17
hive
hadoop
数据仓库
大数据组件sqoop部署安装与测试练习
环境说明10.176.2.101master10.176.2.103zjx0310.176.2.105zjx05cent-os6.5zookeepercdh3.4.5
hadoop
apache2.7.7mysql5.17jdk1.8.191sqoop1.4.7
zwb_jianshu
·
2023-12-15 06:05
大数据篇|
Hadoop
发展史及介绍
文章目录一、
Hadoop
介绍1.1、
Hadoop
是什么二、
Hadoop
发展史2.1、创始人2.2、
Hadoop
发展历史/起源2.3、
Hadoop
三大发行版本2.3.1、Apache
Hadoop
2.3.2
五月天的尾巴
·
2023-12-15 03:56
大数据
大数据
hadoop发展史及介绍
【
Hadoop
_03】HDFS概述与Shell操作
1、集群配置(1)集群启动/停止方式总结(2)编写
Hadoop
集群常用脚本(3)常考面试题【1】常用端口号【2】常用配置-文件2、HDFS概述(1)HDFS产出背景及定义(2)HDFS优缺点(3)HDFS
温欣2030
·
2023-12-14 23:04
【大数据】
hadoop
hdfs
大数据
【Hive】——CLI客户端(bin/beeline,bin/hive)
HiveServer22bin/hive、bin/beeline区别3bin/hive客户端hive-site.xml配置远程MateStore地址XMLhive.metastore.uristhrift://
hadoop
102
那时的样子_
·
2023-12-14 23:26
hive
hadoop
数据仓库
【Hive】——概述
1什么是Hive2Hive优点3Hive和
Hadoop
的关系4映射信息记录5SQL语法解析、编译Hive能将一个文件映射成为一张表,文件和表之间的关系称为映射Hive的功能职责是将SQL语法解析编译成为
那时的样子_
·
2023-12-14 23:15
hive
hive
hadoop
大数据
【Hive】——安装部署
1MetaData(元数据)2MetaStore(元数据服务)3MetaStore配置方式3.1内嵌模式3.2本地模式3.3远程模式4安装前准备
hadoop
.proxyuser.root.hosts*
hadoop
.proxyuser.root.groups
那时的样子_
·
2023-12-14 23:15
hive
hadoop
数据仓库
hive-3.1.2环境安装实验
1.修改
hadoop
相关参数1-修改core-site.xml[bigdata@masterhive]$vim/opt/module/
hadoop
/etc/
hadoop
/core-site.xml
hadoop
.proxyuser.bigdata.hosts
芝士小熊饼干
·
2023-12-14 22:09
hive
hadoop
数据仓库
EMR Cluster Kylo Installation Guide
EMRInstallGuideUploadrequiredJarstotheS3EMRbucketyoucreatedabovehttp://central.maven.org/maven2/org/elasticsearch/elasticsearch-
hadoop
夜空最亮的9星
·
2023-12-14 22:55
kafka入门:简介、使用场景、设计原理、主要配置及集群搭建(转)
李克华云计算高级群:292870151195907286交流:
Hadoop
、NoSQL、分布式、lucene、solr、nutchkafka入门:简介、使用场景、设计原理、主要配置及集群搭建(转)问题导读
weixin_34185320
·
2023-12-14 22:18
运维
操作系统
系统架构
Ambari和ClouderManager分析对比
第一章导论运维过
hadoop
集群的人都应该清楚,
hadoop
生态从安装、配置到后期运维是一个非常艰辛的过程,一般来说安装
hadoop
可能就需要几天时间,运维一个小型集群同样需要几个人。
weixin_30481087
·
2023-12-14 20:42
ui
数据库
python
大数据存储技术(1)——
Hadoop
简介及安装配置
目录一、
Hadoop
简介(一)概念(二)
Hadoop
发展历史(三)
Hadoop
三大发行版本(四)
Hadoop
的优势二、
Hadoop
的组成(一)
Hadoop
1.x和
Hadoop
2.x的区别编辑(二)
Hadoop
Francek Chen
·
2023-12-14 19:08
大数据技术基础
Spark编程基础
大数据
hadoop
linux
Scala-初学
HIVE也可以使用
hadoop
配置的压缩方法对中间结果或最终数据进行压缩1importscala.io.Sourcescala>vallines=Source.fromFile(“/usr/local/
Logan_addoil
·
2023-12-14 19:07
大数据学习之旅
scala
开发语言
后端
大数据之旅-问题反思
2.
hadoop
1.0和
hadoop
2.0明显的差异如何理解?
Logan_addoil
·
2023-12-14 19:07
大数据学习之旅
大数据
【python】多任务编程
多任务编程有哪些编程提速的方法单线程串行:不加改造的程序多线程并发:利用CPU和IO可以同时执行的原理,让CPU不会干巴巴等待IO完成多CPU并行/多进程:利用多核CPU的能力,真正的并行执行任务多机器并行:
hadoop
小赵要加油
·
2023-12-14 19:33
python
python
开发语言
sqoop安装及测试(坑解决)
sqoop安装:下载sqoop-1.4.7.bin__
hadoop
-2.6.0.tar.gz(非sqoop-1.4.7.tar.gz)解压修改sqoop-env-template.sh文件名为sqoop-env.sh
Java页大数据
·
2023-12-14 16:27
sqoop
hadoop
大数据
基于
hadoop
-3.3.2安装hbase-2.4.11,报错:object is not an instance of declaring class(已处理)
基于
hadoop
-3.3.2安装hbase-2.4.11,报错:objectisnotaninstanceofdeclaringclass安装之前看了hbase官网,hbase-2.4.11和
hadoop
Java页大数据
·
2023-12-14 16:27
hadoop
hbase
hbase
hadoop
big
data
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他