E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop安装部署
HDFS的超级用户
一.解释原因HDFS(
Hadoop
DistributedFileSystem)和linux文件系统管理一样,也是存在权限控制的。
重剑DS
·
2024-02-14 21:41
大数据
hdfs
hadoop
大数据
DBA课程-day20-ELK第二天
ELK第一天知识回顾1.ELK各代表什么软件2.传统方式收集日志的弊端3.ELK收集日志的架构4.日志流转流程5.
安装部署
filebeat-input-->nginx日志-output-->ES-ES-
zwb_jianshu
·
2024-02-14 20:07
Hadoop
+Spark+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
学习总结 - swift适配器 为
Hadoop
的存储层增加对 OpenStack Swift 的支持
虽然文档内所涉及的版本有点旧,但内容很精彩,值得推荐背景在
Hadoop
中有一个抽象文件系统的概念,它有多个不同的子类实现,由DistributedFileSystem类代表的HDFS便是其中之一。
天地不仁以万物为刍狗
·
2024-02-14 07:37
分布式解决方案
C#
Hadoop
学习笔记
记录一下学习地址http://www.360doc.com/content/14/0607/22/3218170_384675141.shtml转载于:https://www.cnblogs.com/TF12138/p/4170558.html
第八个猴子
·
2024-02-14 07:37
大数据
hadoop
HDFS的API封装
Configuration类:该类的对象封装了客户端或者服务端的配置。FileSystem类:该类的对象是一个文件系统对象,可以用该队想的一些方法来对文件进行操作。FSDataInputStream和FSDataOutputStream:这两个类是HDFS中的输入输出流。基本流程:得到Configuration对象得到FileSystem对象进行文件操作(读写、删除、改名)所需引入的库import
Cynicism_Kevin
·
2024-02-14 07:37
大数据
java
hadoop
hdfs
Hive的小文件问题
Reduce的数量3.2已存在的小文件合并3.2.1方式一:insertoverwrite(推荐)3.2.2方式二:concatenate3.2.3方式三:使用hive的archive归档3.2.4方式四:
hadoop
getmerge
爱吃辣条byte
·
2024-02-14 06:11
#
Hive
hive
数据仓库
从
Hadoop
框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)
从
Hadoop
框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)前言几周前,当我最初听到,以致后来初次接触
Hadoop
与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣
Dimple七
·
2024-02-14 06:41
docker添加jar包_详解docker部署SpringBoot及替换jar包的方法
dockerkubernetesdashboard
安装部署
详细介绍和Docker如何使用link建立容器之间的连接。这篇文章主要介绍如何在docker上部署springboot项目。
Yuki酱酱
·
2024-02-14 04:02
docker添加jar包
大数据开发之Sqoop详细介绍
备注:测试环境CDH6.3.1Sqoop1.4.7一.Sqoop概述ApacheSqoop(SQL-to-
Hadoop
)项目旨在协助RDBMS与
Hadoop
之间进行高效的大数据交流。
只是甲
·
2024-02-14 01:17
Ubuntu16.04下HBase安装笔记
基础准备JDK
Hadoop
SSHServer下载HBasehttps://hbase.apache.org/tar-zxvfhbase-1.4.2-bin.tar.gzsudomvhbase-1.4.2
bluexiii
·
2024-02-13 22:48
利用 Docker 安装
Hadoop
集群并通过 Java API 访问 HDFS
前言最近刚好在学习
Hadoop
,在安装过程中遇到了一些小麻烦,正好将此次过程记录并分享出来,希望能对准备学习本块内容的读者们有所帮助。本次操作在Ubuntu中完成,如何安装Ubuntu本文不再赘述。
qq_33419925
·
2024-02-13 21:38
docker
hadoop
linux
java
大数据
hadoop
(十三)—自定义排序
这节课我们一起学习
Hadoop
的自定义排序,
Hadoop
是有一套默认的排序规则的,但是这往往不能满足我们多样化的需求,为了让排序更多样化,这就需要用到我们本节课所要学习的自定义排序功能。
文子轩
·
2024-02-13 20:13
YARN体系结构指南
1.简介
hadoop
-0.23引入的新体系结构将JobTracker的两个主要功能:资源管理和作业生命周期管理分为不同的组件。
盗梦者_56f2
·
2024-02-13 16:45
使用宝塔面板部署校园综合服务平台项目
本文档为校园综合服务平台服务端的
安装部署
教程,欢迎star小程序端下载地址:https://github.com/landalfYao/help.git后台服务端下载地址:https://github.com
Landalf_5154
·
2024-02-13 15:14
大数据处理为何选择Spark,而不是
Hadoop
Spark的各个组件2.
Hadoop
Had
嘿嘿海海
·
2024-02-13 14:00
hadoop
分布式集群安装与原理
对很多人来说,学习大数据都止步于集群搭建,即使是那些工作过很多年的JAVA程序员也不例外,我们分享一套能让您轻松完成集群搭建的方法,包括
Hadoop
的源码编译、企业级环境安装与配置和常用大数据组件的基本原理
海牛大数据_青牛老师
·
2024-02-13 12:44
《千锋逆战“记录蜕变、见证奇迹”学习分享活动》2020-03-11
#千锋逆战班,SZ201刘峻#在千锋“逆战”学习第31天今天学习了开源数据库MySQL第一张mysql部署,使用了中国科技大学开源软件镜像
安装部署
mysql5.7版本,第二章SQL语句中的的DDL语句。
Mask_o
·
2024-02-13 08:32
最全面的Docker
安装部署
,配置镜像加速
安装Docker卸载旧版首先如果系统中已经存在旧的Docker,则先卸载:yumremovedocker\docker-client\docker-client-latest\docker-common\docker-latest\docker-latest-logrotate\docker-logrotate\docker-engine配置Docker的yum仓库首先要安装一个yum工具yumi
元气满满的热码式
·
2024-02-13 07:04
docker
java
eureka
Python ocr自动标注数据集,Python ocr哪个速度最快
基于python实现OCR的五种方法1.pytesseract1.1简介1.2
安装部署
1.3应用举例2.PaddleOCR2.1简介2.2
安装部署
2.3应用举例3.easyocr3.1简介3.2
安装部署
a17348
·
2024-02-13 06:25
人工智能
小猿圈之
Hadoop
优化
Hadoop
框架是现在最主流的的框架之一,越来越多的人去学习,那么你对
hadoop
的理解是什么?
hadoop
一定要会优化,那怎么优化呢,小猿圈今天说一下,感兴趣的朋友可以看看小猿圈写的这篇文章。
小猿圈加加
·
2024-02-13 05:38
Java从入门到精通
JavaSE,掌握Java语言本身、Java核心开发技术以及Java标准库的使用;2、如果继续学习JavaEE,那么Spring框架、数据库开发、分布式架构就是需要学习的;3、如果要学习大数据开发,那么
Hadoop
nightluo
·
2024-02-13 01:52
基础学习
java
开发语言
【ES】--ES集成自定义分词库
单机)elasticsearch安装2、安装Elasticvue插件3、ik分词器插件4、ES集成自定义词库一、相关安装1、(window单机)elasticsearch安装Win10下下载ES组件,
安装部署
如下
DreamBoy_W.W.Y
·
2024-02-13 01:50
大数据/智能
elasticsearch
Datax ETL工具源码研究
Kittle优点:与大数据
Hadoop
结合比较好,功能比较齐全,强大,支持数据库,文件数据读写,界面拖拽方式操作;缺点:
Spring1985
·
2024-02-13 01:57
2018-07-19 sqoop
sqoop:数据从传统数据库到到
hadoop
的导入,导出安装:1.解压2.修改配置文件cdSQOOP_HOME/conf$mvsqoop-env-template.shsqoop-env.sh打开sqoop-env.sh
江江江123
·
2024-02-12 20:10
【解决方案】pyspark 初次连接mongo 时报错Class not found exception:com.mongodb.spark.sql.DefaultSource
=spark.read.format("com.mongodb.spark.sql.DefaultSource").load() File"/home/cisco/spark-2.4.1-bin-
hadoop
2
能白话的程序员♫
·
2024-02-12 19:33
Spark
spark
关于vue的一些小心得基本用法详解
二.vue的
安装部署
第一步:安装vue:打开cmd输入:npminstal
waterte
·
2024-02-12 19:15
Hadoop
分布式系统架构-MapReduce-02
1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算,彼此间几乎没有依赖关系。Reduce负责“合”,即对map阶段的结果进行全局汇总。MapRedu
一直上上签X
·
2024-02-12 16:41
(一)Docker 在线部署和离线部署
环境:CentOS7.31.在线部署[root@
hadoop
004~]#yuminstall-yhttpd[root@
hadoop
004~]#servicehttpdstartRedirectingto
白面葫芦娃92
·
2024-02-12 15:51
zk01
zookeeper基础ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是
Hadoop
和Hbase的重要组件。提供的功能包括:命名服务、配置管理、集群管理、分布式锁、队列管理。
矮肥
·
2024-02-12 11:41
2018-11-16
hadoop
3.1完全分布式部署
Hadoop
3.1.0完全分布式集群部署,三台服务器部署结构如下github配置文件源码地址Pdsh使用方法http://kumu-linux.github.io/blog/2013/06/19/pdsh
Albert陈凯
·
2024-02-12 08:20
hadoop
-YARN
Apache
Hadoop
YARN百度百科:https://baike.baidu.com/item/yarn/16075826?
weixin_33736649
·
2024-02-12 07:44
大数据
Hadoop
-MapReduce-Yarn集群搭建
通过官网搭建:
hadoop
.apache.org/docs/r2.6.5/
hadoop
-project-dist/
hadoop
-common/SingleCluster.ht
qq_2368521029
·
2024-02-12 07:44
搭建
Hadoop
-3.1.3 HA 集群
本文目录1.集群部署分布规划2.Zookeepr集群安装3.HDFS-HAⅠ.配置core-site.xmlⅡ.配置hdfs-site.xmlⅢ.配置分发4.YARN-HAⅠ.配置yarn-site.xmlⅡ.配置分发4.启动前的配置5.启动HA集群Ⅰ.单独启动Ⅱ.脚本方式启动HA集群6.HA集群测试
扛麻袋的少年
·
2024-02-12 07:43
#
Hadoop
hadoop
hdfs
大数据
Hadoop
-HA高可用集群部署
Hadoop
HAHA概述(1)所谓HA(HighAvailablity),即高可用(7*24小时不中断服务)。(2)实现高可用最关键的策略是消除单点故障。
魔笛Love
·
2024-02-12 07:13
hadoop
hdfs
big
data
Hadoop
-Yarn-ResourceManagerHA
一、介绍在
Hadoop
2.4之前,ResourceManager是YARN集群中的单点故障ResourceManagerHA是通过Active/Standby体系结构实现的,在任何时候其中一个RM都是活动的
隔着天花板看星星
·
2024-02-12 07:42
hadoop
大数据
分布式
Hadoop
:认识MapReduce
MapReduce是一个用于处理大数据集的编程模型和算法框架。其优势在于能够处理大量的数据,通过并行化来加速计算过程。它适用于那些可以分解为多个独立子任务的计算密集型作业,如文本处理、数据分析和大规模数据集的聚合等。然而,MapReduce也有其局限性,比如对于需要快速迭代的任务或者实时数据处理,MapReduce可能不是最佳选择。总的来说,MapReduce是大数据技术中的一个重要概念,它在Ha
爱写代码的July
·
2024-02-12 06:41
大数据与云计算
hadoop
mapreduce
大数据
git
安装部署
及使用指令
git的安装在Windows上安装Git从https://git-for-windows.github.io下载(网速慢的同学请移步国内镜像),然后按默认选项安装即可。安装完成后,在开始菜单里找到“Git”->“GitBash”,蹦出一个类似命令行窗口的东西,就说明Git安装成功!安装完成后,还需要最后一步设置,设置自己的用户名和邮箱,在命令行输入:$gitconfig--globaluser.n
中年程序员一枚
·
2024-02-12 05:56
环境搭建专栏
git
org.apache.
hadoop
.fs.ChecksumException: Checksum error: file:/root/test.txt at 0
上传文件到集群遇到以下异常:org.apache.
hadoop
.fs.ChecksumException:Checksumerror:file:/root/test.txtat0[root@master
橙汁啤酒厂
·
2024-02-12 05:24
hadoop
大数据
-bash: export: =‘: 不是有效的标识符 -bash: export:
:/opt/
hadoop
-2.7.3//bin:/opt/jdk1.8.0_131
橙汁啤酒厂
·
2024-02-12 05:24
linux操作时遇到的相关问题
bash
开发语言
HBase集群部署
1.HBase安装相关版本:
Hadoop
:2.7.3hbase:1.3.1hbase相关版本下载安装HBase需要安装hbase-1.3.1-bin.tar.gz软件包,下载并解压到/opt目录下2.HBase
橙汁啤酒厂
·
2024-02-12 05:23
大数据
hbase
数据库
大数据
hadoop
大数据--Flink--流处理(二)
一、flink单节点
安装部署
下载1)下载安装包[root@localhost~]#wgethttp://us.mirrors.quenda.co/apache/flink/flink-1.9.1/flink
无剑_君
·
2024-02-11 18:38
Hadoop
运行环境搭建
模板虚拟机环境准备1)准备一台模板虚拟机
hadoop
100,虚拟机配置要求如下:模板虚拟机:内存4G,硬盘50G,安装必要环境,为安装
hadoop
做准备[root@
hadoop
100~]#yuminstall-yepel-release
nucty
·
2024-02-11 18:53
大数据
hadoop
大数据
prometheus +pushgatewa +grafana的
安装部署
与测试
prometheus搭建教程主要概念prometheus主要功能是负责数据的手机存储,手机的来源是各种exporter。比如mysql有mysqlexporter,服务器性能指标的exporter等等。因此为了能够监控到某些东西,如主机的CPU使用率,我们需要使用到Exporter。Prometheus周期性的从Exporter暴露的HTTP服务地址(通常是/metrics)拉取监控样本数据。pr
dozenx
·
2024-02-11 18:50
太卷了!这个考试系统不愧是“卷王”!
安装部署
简单、支持20多种题型、
·
2024-02-11 18:30
HBase知识点总结
一、HBase基础HBase是一种建立在
Hadoop
文件系统之上的分布式、可扩展、支持海量数据存储的NoSQL数据库。HBase是BigTable的开源Java版本。
·
2024-02-11 17:17
hbase大数据数据库
linux
安装部署
k8s(kubernetes)和解决遇到的坑
先安装DockerCentos7离线安装Docker设置主机名称#查看Linux内核版本uname-r3.10.0-957.el7.x86_64#或者使用uname-a#设置主机名称为k8s-master,重新连接显示生效hostnamectl--staticset-hostnamek8s-master#查看主机名称hostname禁用SELinux#永久禁用SELinuxvim/etc/sysc
beyond阿亮
·
2024-02-11 13:22
离线数仓(一)【数仓概念、需求架构】
前言今天开始学习数仓的内容,之前花费一年半的时间已经学完了
Hadoop
、Hive、Zookeeper、Spark、HBase、Flume、Sqoop、Kafka、Flink等基础组件。
让线程再跑一会
·
2024-02-11 11:58
离线数仓
大数据
大数据Flume--入门
文章目录FlumeFlume定义Flume基础架构AgentSourceSinkChannelEventFlume
安装部署
安装地址
安装部署
Flume入门案例监控端口数据官方案例实时监控单个追加文件实时监控目录下多个新文件实时监控目录下的多个追加文件
泛黄的咖啡店
·
2024-02-11 09:04
大数据
flume
Hive与ClickHouse的区别
Hive是
Hadoop
生态系统中事实上的数据仓库标准。Hive是建立在
Hadoop
生态中的数据仓库中间件,其本身并不提供存储与计算能力。
晓之以理的喵~~
·
2024-02-11 08:18
Hadoop
大数据
hive
hive
clickhouse
hadoop
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他