E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop初体验
graylog
初体验
最近graylog比较火,部署了一个来测试下,看下后续能不能代替目前占用资源比较多的elk,目前未对graylog性能进行深入测试,只是简单体验了下,graylog的UI比较简陋,但是在报警以及权限方面优于ELK,整体来说比较看好,完全替代ELK目前来说做不到,但是未来可期特性ELKGraylog架构复杂度较复杂(需要Elasticsearch+Logstash+Kibana+Beats等)相对简
健康马m
·
2025-02-07 12:30
graylog
nginx+flume网络流量日志实时数据分析实战_日志数据分析(1)
得到visits模型
hadoop
jar/export/data/mapreduce/web_log.jarcn.itcast.bigdata.weblog.clickstream.ClickStreamVisit
2401_84182578
·
2025-02-07 11:22
程序员
nginx
flume
数据分析
【大数据入门核心技术-Flume】(二)Flume安装部署
目录一、准备工作1、基本
Hadoop
环境安装2、下载安装包二、安装1、解压2、修改环境变量3、修改并配置flume-env.sh文件4、验证是否安装成功一、准备工作1、基本
Hadoop
环境安装参考
Hadoop
forest_long
·
2025-02-07 08:33
大数据技术入门到21天通关
big
data
hadoop
大数据
hbase
flume
大数据集群搭建基础:
Hadoop
完全分布式搭建学习指南!!
Hadoop
完全分布式搭建学习指南
Hadoop
版本:
Hadoop
2.XJDK版本:JDK1.8一、准备工作设置主机名和IP在三台CentOS7.4机器上分别设置主机名和IP:node1:192.168.14.10node2
初次知晓
·
2025-02-07 01:16
大数据
分布式
hadoop
如何处理大规模数据集中的数据处理:Spark和ApacheFlink
文章目录1.简介2.基本概念术语说明数据处理(DataProcessing)任务调度(TaskScheduling)
Hadoop
ApacheSparkApacheFlink3.核心算法原理和具体操作步骤以及数学公式讲解
AI天才研究院
·
2025-02-07 01:43
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Hudi VS Doris 使用分析
Hudi(
Hadoop
UpsertsDeletesandIncrementals)定位-面向数据湖的增量写入、更新与删除技术。
sunxunyong
·
2025-02-07 01:13
数据库
Hive-Container killed by YARN for exceeding memory limits. 9.2 GB of 9 GB physical memory used. Cons...
Jobabortedduetostagefailure:Task3instage0.0failed4times,mostrecentfailure:Losttask3.3instage0.0(TID62,
hadoop
7
嘣嘣嚓
·
2025-02-07 01:41
spark
hive
boosting
scala
big
data
CDH+Kylin三部曲之三:Kylin官方demo
《CDH+Kylin三部曲之二:部署和设置》:完成CDH和Kylin部署,并在管理页面做好相关的设置;现在
Hadoop
、Kylin都就绪了,接下来实践Kylin的官方demo;Yarn参数设置Yarn的内存参数设置之后一定要重启
2401_89740692
·
2025-02-07 00:07
kylin
大数据
数据开发八股文整理-
Hadoop
什么是
hadoop
Hadoop
是一个分布式系统基础架构,主要解决海量数据的存储和海量数据的分析计算问题
Hadoop
运行模式本地模式和为分布式模式都是单机运行完全分布模式即是多台服务器组成分布式环境
Hadoop
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hadoop
大数据
分布式
HIVE常见面试题
1.简述hiveHive是一个构建在
Hadoop
之上的数据仓库工具,主要用于处理和查询存储在HDFS上的大规模数据。
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hive
hadoop
数据仓库
如何搭建
Hadoop
高可用集群
一、集群配置图在搭建集群之前,我们要考虑好集群中各个机器的配置。这里以四台机器为例,配置图如下:集群配置图ant151ant152ant153ant154NameNodeNameNodeDataNodeDataNodeDataNodeDataNodeNodeManagerNodeManagerNodeManagerNodeManagerResourceManagerResourceManagerJ
Alcaibur
·
2025-02-06 13:24
hadoop
大数据
java
使用python实现
Hadoop
中MapReduce
Hadoop
包含HDFS(分布式文件系统)、YARN(资源管理器)、MapReduce(编程模型)。
qq_44801116
·
2025-02-06 06:10
Python
python
hadoop
mapreduce
【大数据技术】编写Python代码实现词频统计(python+
hadoop
+mapreduce+yarn)
编写Python代码实现词频统计(python+
hadoop
+mapreduce+yarn)搭建完全分布式高可用大数据集群(VMware+CentOS+FinalShell)搭建完全分布式高可用大数据集群
Want595
·
2025-02-06 06:05
Python大数据采集与分析
大数据
python
hadoop
Hadoop
1.0和2.0的主要区别
Hadoop
1.0指的是版本为Apache
Hadoop
0.20.x、1.x或者CDH3系列的
Hadoop
,组件主要由HDFS和MapReduce两个系统组成,HDFS是一个分布式文件存储系统,MapReduce
web_15534274656
·
2025-02-06 03:43
java
hadoop
大数据
hdfs
dubbo
java-zookeeper
Hadoop
1.0-HDFS介绍
Hadoop
是Apache软件基金会所开发的并行计算框架与分布式文件系统。最核心的模块包括
Hadoop
Common、HDFS与MapReduce。
szjianzr
·
2025-02-06 03:13
HADOOP介绍
hadoop
HDFS
SQL on
Hadoop
SQL_on_
Hadoop
SQLon
Hadoop
概述
Hadoop
提供了一种分布式存储和计算的平台,为了解决传统关系型数据库无法处理海量数据的问题,通过扩展SQL的方式在
Hadoop
上执行分布式查询,称之为
Lostgreen
·
2025-02-06 03:42
大数据管理
sql
hadoop
数据库
笔记
学习
分布式
物联网架构之
Hadoop
hadoop
体系结构
Hadoop
是一个开源的分布式计算平台,主要用于存储和处理大规模数据集。
moluxiangfenglo
·
2025-02-06 01:54
架构
hadoop
大数据
kafka的高可用情况下,挂掉一个节点,为什么消费者消费不到数据了
brokerkafka集群kafka01kafka02kafka032.创建topictest(分区3副本3)kafka-topics.sh--create--topic'test'--zookeeper'
hadoop
01
黄土高坡上的独孤前辈
·
2025-02-05 21:55
Kafka
云计算:从基础架构原理到最佳实践之:云计算大数据分析与处理
禅与计算机程序设计艺术文章目录1.简介2.云计算概述2.1云计算简介2.2云计算特点3.大数据的定义与特点3.1大数据定义3.2大数据特点4.大数据分类、存储和处理技术4.1大数据分类4.2大数据存储和处理技术5.
Hadoop
-Cloud
AI天才研究院
·
2025-02-05 20:18
大数据AI人工智能
大数据
人工智能
语言模型
Java
Python
架构设计
大数据相关开源项目汇总
调度与管理服务Azkaban是一款基于Java编写的任务调度系统任务调度,来自LinkedIn公司,用于管理他们的
Hadoop
批处理工作流。
万里浮云
·
2025-02-05 17:03
大数据
60款顶级大数据开源工具
一、
Hadoop
相关工具1.
Hadoop
Apache的
Hadoop
项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
La victoria
·
2025-02-05 17:33
大数据
盘点大数据生态圈,那些繁花似锦的开源项目
盘点大数据生态圈,那些繁花似锦的开源项目发表于12小时前|2466次阅读|来源CSDN|6条评论|作者仲浩大数据开源
Hadoop
Sparkwidth="22"height="16"src="http
AI周红伟
·
2025-02-05 17:30
大数据
深度学习
为什么我的CDH不用Hue,改用Scriptis了?
理性谈谈Hue的优缺点平时做数据开发用的比较多的是CDH的Hue,Hue提供了对接
Hadoop
平台的UI界面,可以对Hbase数据进行直接操作,执行Mapreducer任务时有可视化的执行界面,进行数据报表和
兔子那么可爱
·
2025-02-05 09:58
大数据
UI
开源
数据分析
中间件
Hadoop
HDFS 安装详细步骤
Hadoop
安装详细步骤安装前分别在master、slave1、slave2三台机器的root用户下的主目录下创建目录bigdata,即执行下面的命令:mkdir~/bigdata
Hadoop
安装包下载检查
碟中碟山
·
2025-02-05 07:16
hadoop
hdfs
大数据
Hadoop
框架及HDFS详细概述
文章目录
Hadoop
概述一、
Hadoop
1、分布式和集群2、
Hadoop
框架2.1概述2.2版本更新2.3
Hadoop
架构详解2.4官方示例2.4.1圆周率练习2.4.2词频统计3、
Hadoop
的HDFS3.1
搬砖人_li
·
2025-02-05 07:14
大数据技术栈专栏
hadoop
hdfs
大数据
大数据:一种收集、分析和使用数据的文化
与所有IT投资一样,大数据成功的关键在于迭代,而不是关于
Hadoop
、NoSQL、Splunk或者任何特定的供应商或技术。
程序猿广坤
·
2025-02-04 22:39
大数据
编程语言
it资讯
人工智能
程序员
编程语言
大数据
Ubuntu下
Hadoop
的安装与使用
1、创建
hadoop
用户打开终端sudouseradd-m
hadoop
-s/bin/bashsudopasswd
hadoop
//为
hadoop
设置密码sudoadduser
hadoop
sudo//为
hadoop
ly201552y
·
2025-02-04 07:44
hadoop学习
hadoop
【数据仓库】
hadoop
web UI 增加账号密码认证
升级了
hadoop
版本到3.3.6,未配置任何鉴权,默认端口98708088开放到了公网,结果没几天就被挖矿攻击了。通过开放的端口提交了很多非法任务到yarn上,并成功在服务器执行了恶意脚本。
花菜回锅肉
·
2025-02-04 07:13
大数据
数据仓库
数据仓库
hadoop
Hadoop
3.2.1安装-单机模式和伪分布式模式
Hadoop
入门篇概述
Hadoop
是使用Java编写的,是为了解决大数据场景下的两大问题,分布式存储和分布式处理而诞生的,包含很多组件、套件。需要运行在Linux系统下。
花菜回锅肉
·
2025-02-04 07:13
大数据
hadoop
hdfs
大数据
linux
Spark3.1.2单机安装部署
类似
Hadoop
,但对
Hadoop
做了优化,计算任务的中间结果可以存储在内存中,不需要每次都写入HDFS,更适用于需要迭代运算的算法场景中。
花菜回锅肉
·
2025-02-04 07:43
大数据
spark
大数据
hadoop
Flink Standalone集群模式安装部署全攻略
二、安装前准备首先,确保已经安装好了
Hadoop
环境(因为后续配置中涉及到与
Hadoop
的集成)。三、安装步骤(一)环境准备退出conda的base环境(如果存在
自节码
·
2025-02-04 04:17
java
面试
开发语言
flink
大数据
Hive 分区和分桶总结
分区介绍2、分区表的操作3、动态分区2、分桶表1、分桶表介绍2、分桶表的操作3、分区表和分桶表的区别参考分区和分桶总结1、分区1、分区介绍由于数据量过于庞大,使用分区,可以并行的进行处理数据,有点类似于
Hadoop
Stray_Lambs
·
2025-02-03 14:23
大数据
hive
HBase的原理
一、什么是HBaseHBase是一个分布式,版本化,面向列的数据库,依赖
Hadoop
和Zookeeper(1)HBase的优点提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统(2)HBase表的特性
会探索的小学生
·
2025-02-03 11:30
大数据
HBase
Hadoop
的基础操作_
hadoop
常用操作
####下载文件语法:
hadoop
fs-get
hadoop
fs-copyToLocal示例:将user/text.txt文件下载到本地/usr/local/下-copyToLocal:复制到本地[root
字节全栈_kYu
·
2025-02-03 07:28
hadoop
eclipse
大数据
kylin套_Apache Kylin(一)Kylin介绍
1.传统大数据分析的问题在基于
Hadoop
生态的传统大数据分析中,主要使用的技术是MPP(MassivelyParallelProcessing)大规模并行处理和列式存储。
weixin_39898011
·
2025-02-03 07:57
kylin套
linux的apache安装,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)Spark(可选)2.3.0+Kafka(可选)1.0.0
姜白的树洞
·
2025-02-03 07:26
linux的apache安装
kylin linux 安装教程,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+Hive:0.13-1.2.1+HBase:1.1+Spark2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2
社本
·
2025-02-03 07:26
kylin
linux
安装教程
wow-agent---task4 MetaGPT
初体验
先说坑:1.使用gitclone模式安装metagpt2.模型尽量使用在线模型或本地高参数模型。这里使用python3.10.11调试成功一,安装安装|MetaGPT,参考这里的以开发模型进行安装gitclonehttps://github.com/geekan/MetaGPT.gitcd/your/path/to/MetaGPTpipinstall-e.在下载后的目录中有一个config文件夹,
Allen20000
·
2025-02-02 23:25
pygame
python
人工智能
ESP32-C3 学习测试 蓝牙 篇(二、蓝牙调试APP、开发板手机连接
初体验
)_esp32蓝牙app 添加应用
等了好久终于等到今天,盼了好久终于把蓝牙测试==!ESP32-C3专栏好久没更新了,这次抽点时间把蓝牙的准备工作做完。目录前言1、蓝牙手机调试工具2、ESP-IDF中示例的选择3、ESP32-C3BLE与手机连接初探结语前言距离上一次玩ESP32-C3的板子也有一段时间了,其实都是因为时间安排不过来,最近挤出了一点时间,看了一点蓝牙的资料,想着至少也要做个入门测试,让手机和开发板连接起来!ESP3
2501_90252715
·
2025-02-02 19:00
学习
智能手机
Hadoop
---(6)Sqoop(数据传输)
6.SqoopSqoop是一个用于
hadoop
数据和结构化数据之间转换的工具。
Mr Cao
·
2025-02-02 15:27
sqoop
大数据
Scikit-Learn K均值聚类
均值聚类1、K均值聚类1.1、K均值聚类及原理1.2、K均值聚类的优缺点1.3、聚类与分类的区别2、Scikit-LearnK均值聚类2.1、Scikit-LearnK均值聚类API2.2、K均值聚类
初体验
对许
·
2025-02-02 14:54
#
Python
#
人工智能与机器学习
scikit-learn
聚类
机器学习
hbase无法建表:org.apache.
hadoop
.hbase.PleaseHoldException: Master is initializing
1.环境:cdh6.2.12.现象:hbaseshell进去后,list命令执行正常,执行建表语句后报错:ERROR:org.apache.
hadoop
.hbase.PleaseHoldException
magicchu
·
2025-02-02 09:18
CDH
HBASE
大数据
Hive 整合 Spark 全教程 (Hive on Spark)
hadoop
.proxyuser.luanhao.groups*
hadoop
.proxyuser.luanhao.groups*2)HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00
字节全栈_rJF
·
2025-02-02 02:56
hive
spark
hadoop
spark和python的区别_Spark入门(Python)
Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被实现为
Hadoop
之上的特殊系统。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
spark python入门_python pyspark入门篇
一.环境介绍:1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:spark-1.6.0-bin-
hadoop
2.6.tar.gz二.Setup1.解压spark
weixin_39686634
·
2025-02-01 23:12
spark
python入门
安装HBase-2.4.12 (
hadoop
3.3.1)
1.下载https://www.apache.org/dyn/closer.lua/hbase/2.4.12/hbase-2.4.12-bin.tar.gz节点角色配置节点MasterZooKeeperRegionServernode001yesyesyesnode002backupyesyesnode003noyesyes2.解压下载的文件,并切换到新创建的目录。(base)[root@node
不饿同学
·
2025-02-01 17:18
大数据
hbase
big
data
hadoop
Hadoop
--HA架构详解
为了解决上述问题,
Hadoop
给出了高容错,高可用的HA方案:一个HDFS集群至少存在两个nameNode,一个nameNode处在active(主)状态,其他nameNode处在standby(备
娘子,出来看上帝
·
2025-02-01 10:20
Hadoop
Hadoop
大数据
HA
Hadoop
HA 架构
为什么要用集群?企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过master,建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务(-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active对外,另外一台是
weixin_30569033
·
2025-02-01 09:49
shell
大数据
【
hadoop
学习之路】Hive HQL 语句实现查询
目录表数据表1students_data.txt表2course.txt实验步骤结论表数据表1students_data.txt21434,Sara,F,21,20,73,classC41443,Mary,M,19,30,90,classA43333,Dery,F,20,40,85,classB45454,Mary,F,22,10,91,classA14634,Henry,M,18,50,56,c
新世纪debug战士
·
2025-02-01 03:58
hadoop学习之路
hive
HDFS总结
基于前面的学习与配置,相信对于HDFS有了一定的了解HDFS概述1.什么是HDFS
Hadoop
DistributedFileSystem:分步式文件系统HDFS是
Hadoop
体系中数据存储管理的基础HDFS
ChenJieYaYa
·
2025-01-31 20:03
Hadoop
hdfs
hadoop
big
data
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他