E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop并行计算
【MapReduce】分布式计算框架MapReduce
它的设计初衷是解决搜索引擎中大规模网页数据的并行处理问题,之后成为Apache
Hadoop
的核心子项目。它是一个面向批处理的分布式计算框架;在分布式环境中,MapRedu
桥路丶
·
2025-02-08 15:00
大数据Hadoop快速入门
big
data
hive 连接Datagrip失败
在hive目录下使用beeline命令:bin/beeline-ujdbc:hive2://
hadoop
102:10000-nsxr具体的报错信息如下所示:解决办法:在
hadoop
的core-site.xml
都给我吃吧
·
2025-02-08 06:55
hive
hadoop
大数据
分布式
Hive之数据操作DML
Load)通过查询语句向表中插入数据(Insert)查询语句中创建表并加载数据(AsSelect)创建表时通过Location指定加载数据路径Import数据到指定Hive表中5.2数据导出Insert导出
Hadoop
WHYBIGDATA
·
2025-02-08 06:55
Hive
hive
hadoop
大数据
2025年大年初一篇,C#调用GPU
并行计算
推荐
C#调用GPU库的主要目的是利用GPU的
并行计算
能力,加速计算密集型任务,提高程序性能,支持大规模数据处理,优化资源利用,满足特定应用场景的需求,并提升用户体验。
zzlyx99
·
2025-02-08 02:30
c#
开发语言
一文了解mapreduce及工作原理
目录前言-MR概述1.
Hadoop
MapReduce设计思想及优缺点设计思想优点:缺点:2.
Hadoop
MapReduce核心思想3.MapReduce工作机制剖析MapReduce运行机制过程描述第一阶段
TEL浅笑嫣然
·
2025-02-07 20:22
openstack
大数据
hadoop
笔记
2024-JAVA-大数据-面试汇总_大数据java部门面试(1)
Hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能33.说说内部表和外部表的区别?
2401_84141419
·
2025-02-07 19:15
程序员
java
大数据
面试
大数据-267 实时数仓 - ODS Lambda架构 Kappa架构 核心思想
目前已经更新到了:
Hadoop
(已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis
m0_74823336
·
2025-02-07 16:57
面试
学习路线
阿里巴巴
大数据
架构
Hbase基础
1.HBase简介HBASE理论HBase是一个基于
Hadoop
的分布式、面向列的开源数据库,对大数据实现了随机定位和实时读写。
yandao
·
2025-02-07 13:38
hadoop
hbase
big
data
hadoop
nginx+flume网络流量日志实时数据分析实战_日志数据分析(1)
得到visits模型
hadoop
jar/export/data/mapreduce/web_log.jarcn.itcast.bigdata.weblog.clickstream.ClickStreamVisit
2401_84182578
·
2025-02-07 11:22
程序员
nginx
flume
数据分析
Python 如何使用dask库来并行化Pandas DataFrame
Dask是一个用于
并行计算
的Python库,它可以处理比内存大得多的数据集。
openwin_top
·
2025-02-07 11:21
python编程示例系列二
python
pandas
开发语言
【大数据入门核心技术-Flume】(二)Flume安装部署
目录一、准备工作1、基本
Hadoop
环境安装2、下载安装包二、安装1、解压2、修改环境变量3、修改并配置flume-env.sh文件4、验证是否安装成功一、准备工作1、基本
Hadoop
环境安装参考
Hadoop
forest_long
·
2025-02-07 08:33
大数据技术入门到21天通关
big
data
hadoop
大数据
hbase
flume
大数据集群搭建基础:
Hadoop
完全分布式搭建学习指南!!
Hadoop
完全分布式搭建学习指南
Hadoop
版本:
Hadoop
2.XJDK版本:JDK1.8一、准备工作设置主机名和IP在三台CentOS7.4机器上分别设置主机名和IP:node1:192.168.14.10node2
初次知晓
·
2025-02-07 01:16
大数据
分布式
hadoop
如何处理大规模数据集中的数据处理:Spark和ApacheFlink
文章目录1.简介2.基本概念术语说明数据处理(DataProcessing)任务调度(TaskScheduling)
Hadoop
ApacheSparkApacheFlink3.核心算法原理和具体操作步骤以及数学公式讲解
AI天才研究院
·
2025-02-07 01:43
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Hudi VS Doris 使用分析
Hudi(
Hadoop
UpsertsDeletesandIncrementals)定位-面向数据湖的增量写入、更新与删除技术。
sunxunyong
·
2025-02-07 01:13
数据库
Hive-Container killed by YARN for exceeding memory limits. 9.2 GB of 9 GB physical memory used. Cons...
Jobabortedduetostagefailure:Task3instage0.0failed4times,mostrecentfailure:Losttask3.3instage0.0(TID62,
hadoop
7
嘣嘣嚓
·
2025-02-07 01:41
spark
hive
boosting
scala
big
data
CDH+Kylin三部曲之三:Kylin官方demo
《CDH+Kylin三部曲之二:部署和设置》:完成CDH和Kylin部署,并在管理页面做好相关的设置;现在
Hadoop
、Kylin都就绪了,接下来实践Kylin的官方demo;Yarn参数设置Yarn的内存参数设置之后一定要重启
2401_89740692
·
2025-02-07 00:07
kylin
大数据
数据开发八股文整理-
Hadoop
什么是
hadoop
Hadoop
是一个分布式系统基础架构,主要解决海量数据的存储和海量数据的分析计算问题
Hadoop
运行模式本地模式和为分布式模式都是单机运行完全分布模式即是多台服务器组成分布式环境
Hadoop
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hadoop
大数据
分布式
HIVE常见面试题
1.简述hiveHive是一个构建在
Hadoop
之上的数据仓库工具,主要用于处理和查询存储在HDFS上的大规模数据。
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hive
hadoop
数据仓库
如何搭建
Hadoop
高可用集群
一、集群配置图在搭建集群之前,我们要考虑好集群中各个机器的配置。这里以四台机器为例,配置图如下:集群配置图ant151ant152ant153ant154NameNodeNameNodeDataNodeDataNodeDataNodeDataNodeNodeManagerNodeManagerNodeManagerNodeManagerResourceManagerResourceManagerJ
Alcaibur
·
2025-02-06 13:24
hadoop
大数据
java
使用python实现
Hadoop
中MapReduce
Hadoop
包含HDFS(分布式文件系统)、YARN(资源管理器)、MapReduce(编程模型)。
qq_44801116
·
2025-02-06 06:10
Python
python
hadoop
mapreduce
【大数据技术】编写Python代码实现词频统计(python+
hadoop
+mapreduce+yarn)
编写Python代码实现词频统计(python+
hadoop
+mapreduce+yarn)搭建完全分布式高可用大数据集群(VMware+CentOS+FinalShell)搭建完全分布式高可用大数据集群
Want595
·
2025-02-06 06:05
Python大数据采集与分析
大数据
python
hadoop
Hadoop
1.0和2.0的主要区别
Hadoop
1.0指的是版本为Apache
Hadoop
0.20.x、1.x或者CDH3系列的
Hadoop
,组件主要由HDFS和MapReduce两个系统组成,HDFS是一个分布式文件存储系统,MapReduce
web_15534274656
·
2025-02-06 03:43
java
hadoop
大数据
hdfs
dubbo
java-zookeeper
Hadoop
1.0-HDFS介绍
Hadoop
是Apache软件基金会所开发的
并行计算
框架与分布式文件系统。最核心的模块包括
Hadoop
Common、HDFS与MapReduce。
szjianzr
·
2025-02-06 03:13
HADOOP介绍
hadoop
HDFS
SQL on
Hadoop
SQL_on_
Hadoop
SQLon
Hadoop
概述
Hadoop
提供了一种分布式存储和计算的平台,为了解决传统关系型数据库无法处理海量数据的问题,通过扩展SQL的方式在
Hadoop
上执行分布式查询,称之为
Lostgreen
·
2025-02-06 03:42
大数据管理
sql
hadoop
数据库
笔记
学习
分布式
物联网架构之
Hadoop
hadoop
体系结构
Hadoop
是一个开源的分布式计算平台,主要用于存储和处理大规模数据集。
moluxiangfenglo
·
2025-02-06 01:54
架构
hadoop
大数据
kafka的高可用情况下,挂掉一个节点,为什么消费者消费不到数据了
brokerkafka集群kafka01kafka02kafka032.创建topictest(分区3副本3)kafka-topics.sh--create--topic'test'--zookeeper'
hadoop
01
黄土高坡上的独孤前辈
·
2025-02-05 21:55
Kafka
云计算:从基础架构原理到最佳实践之:云计算大数据分析与处理
禅与计算机程序设计艺术文章目录1.简介2.云计算概述2.1云计算简介2.2云计算特点3.大数据的定义与特点3.1大数据定义3.2大数据特点4.大数据分类、存储和处理技术4.1大数据分类4.2大数据存储和处理技术5.
Hadoop
-Cloud
AI天才研究院
·
2025-02-05 20:18
大数据AI人工智能
大数据
人工智能
语言模型
Java
Python
架构设计
大数据相关开源项目汇总
调度与管理服务Azkaban是一款基于Java编写的任务调度系统任务调度,来自LinkedIn公司,用于管理他们的
Hadoop
批处理工作流。
万里浮云
·
2025-02-05 17:03
大数据
60款顶级大数据开源工具
一、
Hadoop
相关工具1.
Hadoop
Apache的
Hadoop
项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
La victoria
·
2025-02-05 17:33
大数据
盘点大数据生态圈,那些繁花似锦的开源项目
盘点大数据生态圈,那些繁花似锦的开源项目发表于12小时前|2466次阅读|来源CSDN|6条评论|作者仲浩大数据开源
Hadoop
Sparkwidth="22"height="16"src="http
AI周红伟
·
2025-02-05 17:30
大数据
深度学习
NVIDIA的算力支持
NVIDIA的GPU(图形处理器)因其强大的
并行计算
能力,成为了深度学习和人工智能(AI)领域的主流硬件。NVIDIA的Turing架构引入了更强的张量计算能力,使得深度学习任务能够更
杭州大厂Java程序媛
·
2025-02-05 16:55
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
为什么我的CDH不用Hue,改用Scriptis了?
理性谈谈Hue的优缺点平时做数据开发用的比较多的是CDH的Hue,Hue提供了对接
Hadoop
平台的UI界面,可以对Hbase数据进行直接操作,执行Mapreducer任务时有可视化的执行界面,进行数据报表和
兔子那么可爱
·
2025-02-05 09:58
大数据
UI
开源
数据分析
中间件
Hadoop
HDFS 安装详细步骤
Hadoop
安装详细步骤安装前分别在master、slave1、slave2三台机器的root用户下的主目录下创建目录bigdata,即执行下面的命令:mkdir~/bigdata
Hadoop
安装包下载检查
碟中碟山
·
2025-02-05 07:16
hadoop
hdfs
大数据
Hadoop
框架及HDFS详细概述
文章目录
Hadoop
概述一、
Hadoop
1、分布式和集群2、
Hadoop
框架2.1概述2.2版本更新2.3
Hadoop
架构详解2.4官方示例2.4.1圆周率练习2.4.2词频统计3、
Hadoop
的HDFS3.1
搬砖人_li
·
2025-02-05 07:14
大数据技术栈专栏
hadoop
hdfs
大数据
【2024第一期CANN训练营】Ascend C算子开发基础篇
AscendC是面向算子开发场景的编程语言,它原生支持C和C++标准规范,并提供了多层接口抽象、自动
并行计算
等关键技术,以提高算子开发效率。
小超编程
·
2025-02-05 03:45
c语言
java
算法
Kafka架构
其分区架构不仅赋予了Kafka强大的
并行计算
能力,使其能够高效处理海量数据,还显著提升了系统的容灾能力,确保在复杂的运行环境中始终保持稳定可靠。
优人ovo
·
2025-02-04 22:41
kafka
架构
分布式
大数据:一种收集、分析和使用数据的文化
与所有IT投资一样,大数据成功的关键在于迭代,而不是关于
Hadoop
、NoSQL、Splunk或者任何特定的供应商或技术。
程序猿广坤
·
2025-02-04 22:39
大数据
编程语言
it资讯
人工智能
程序员
编程语言
大数据
Ubuntu下
Hadoop
的安装与使用
1、创建
hadoop
用户打开终端sudouseradd-m
hadoop
-s/bin/bashsudopasswd
hadoop
//为
hadoop
设置密码sudoadduser
hadoop
sudo//为
hadoop
ly201552y
·
2025-02-04 07:44
hadoop学习
hadoop
【数据仓库】
hadoop
web UI 增加账号密码认证
升级了
hadoop
版本到3.3.6,未配置任何鉴权,默认端口98708088开放到了公网,结果没几天就被挖矿攻击了。通过开放的端口提交了很多非法任务到yarn上,并成功在服务器执行了恶意脚本。
花菜回锅肉
·
2025-02-04 07:13
大数据
数据仓库
数据仓库
hadoop
Hadoop
3.2.1安装-单机模式和伪分布式模式
Hadoop
入门篇概述
Hadoop
是使用Java编写的,是为了解决大数据场景下的两大问题,分布式存储和分布式处理而诞生的,包含很多组件、套件。需要运行在Linux系统下。
花菜回锅肉
·
2025-02-04 07:13
大数据
hadoop
hdfs
大数据
linux
Spark3.1.2单机安装部署
类似
Hadoop
,但对
Hadoop
做了优化,计算任务的中间结果可以存储在内存中,不需要每次都写入HDFS,更适用于需要迭代运算的算法场景中。
花菜回锅肉
·
2025-02-04 07:43
大数据
spark
大数据
hadoop
Flink Standalone集群模式安装部署全攻略
二、安装前准备首先,确保已经安装好了
Hadoop
环境(因为后续配置中涉及到与
Hadoop
的集成)。三、安装步骤(一)环境准备退出conda的base环境(如果存在
自节码
·
2025-02-04 04:17
java
面试
开发语言
flink
大数据
大数据(一)MaxCompute
,总会有一些疑问产生,这里讲讲作者的疑问和思路二、介绍MaxCompute(原名ODPS-OpenDataProcessingService)是阿里云提供的大数据处理平台,专门用于批量数据存储和大规模
并行计算
胖当当技术
·
2025-02-03 23:39
架构
云计算
odps
学习
大数据
Hive 分区和分桶总结
分区介绍2、分区表的操作3、动态分区2、分桶表1、分桶表介绍2、分桶表的操作3、分区表和分桶表的区别参考分区和分桶总结1、分区1、分区介绍由于数据量过于庞大,使用分区,可以并行的进行处理数据,有点类似于
Hadoop
Stray_Lambs
·
2025-02-03 14:23
大数据
hive
HBase的原理
一、什么是HBaseHBase是一个分布式,版本化,面向列的数据库,依赖
Hadoop
和Zookeeper(1)HBase的优点提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统(2)HBase表的特性
会探索的小学生
·
2025-02-03 11:30
大数据
HBase
Hadoop
的基础操作_
hadoop
常用操作
####下载文件语法:
hadoop
fs-get
hadoop
fs-copyToLocal示例:将user/text.txt文件下载到本地/usr/local/下-copyToLocal:复制到本地[root
字节全栈_kYu
·
2025-02-03 07:28
hadoop
eclipse
大数据
kylin套_Apache Kylin(一)Kylin介绍
1.传统大数据分析的问题在基于
Hadoop
生态的传统大数据分析中,主要使用的技术是MPP(MassivelyParallelProcessing)大规模并行处理和列式存储。
weixin_39898011
·
2025-02-03 07:57
kylin套
linux的apache安装,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)Spark(可选)2.3.0+Kafka(可选)1.0.0
姜白的树洞
·
2025-02-03 07:26
linux的apache安装
kylin linux 安装教程,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+Hive:0.13-1.2.1+HBase:1.1+Spark2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2
社本
·
2025-02-03 07:26
kylin
linux
安装教程
Hadoop
---(6)Sqoop(数据传输)
6.SqoopSqoop是一个用于
hadoop
数据和结构化数据之间转换的工具。
Mr Cao
·
2025-02-02 15:27
sqoop
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他