E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop并行计算
云计算:从基础架构原理到最佳实践之:云计算大数据分析与处理
禅与计算机程序设计艺术文章目录1.简介2.云计算概述2.1云计算简介2.2云计算特点3.大数据的定义与特点3.1大数据定义3.2大数据特点4.大数据分类、存储和处理技术4.1大数据分类4.2大数据存储和处理技术5.
Hadoop
-Cloud
AI天才研究院
·
2025-02-05 20:18
大数据AI人工智能
大数据
人工智能
语言模型
Java
Python
架构设计
大数据相关开源项目汇总
调度与管理服务Azkaban是一款基于Java编写的任务调度系统任务调度,来自LinkedIn公司,用于管理他们的
Hadoop
批处理工作流。
万里浮云
·
2025-02-05 17:03
大数据
60款顶级大数据开源工具
一、
Hadoop
相关工具1.
Hadoop
Apache的
Hadoop
项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。
La victoria
·
2025-02-05 17:33
大数据
盘点大数据生态圈,那些繁花似锦的开源项目
盘点大数据生态圈,那些繁花似锦的开源项目发表于12小时前|2466次阅读|来源CSDN|6条评论|作者仲浩大数据开源
Hadoop
Sparkwidth="22"height="16"src="http
AI周红伟
·
2025-02-05 17:30
大数据
深度学习
NVIDIA的算力支持
NVIDIA的GPU(图形处理器)因其强大的
并行计算
能力,成为了深度学习和人工智能(AI)领域的主流硬件。NVIDIA的Turing架构引入了更强的张量计算能力,使得深度学习任务能够更
杭州大厂Java程序媛
·
2025-02-05 16:55
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
为什么我的CDH不用Hue,改用Scriptis了?
理性谈谈Hue的优缺点平时做数据开发用的比较多的是CDH的Hue,Hue提供了对接
Hadoop
平台的UI界面,可以对Hbase数据进行直接操作,执行Mapreducer任务时有可视化的执行界面,进行数据报表和
兔子那么可爱
·
2025-02-05 09:58
大数据
UI
开源
数据分析
中间件
Hadoop
HDFS 安装详细步骤
Hadoop
安装详细步骤安装前分别在master、slave1、slave2三台机器的root用户下的主目录下创建目录bigdata,即执行下面的命令:mkdir~/bigdata
Hadoop
安装包下载检查
碟中碟山
·
2025-02-05 07:16
hadoop
hdfs
大数据
Hadoop
框架及HDFS详细概述
文章目录
Hadoop
概述一、
Hadoop
1、分布式和集群2、
Hadoop
框架2.1概述2.2版本更新2.3
Hadoop
架构详解2.4官方示例2.4.1圆周率练习2.4.2词频统计3、
Hadoop
的HDFS3.1
搬砖人_li
·
2025-02-05 07:14
大数据技术栈专栏
hadoop
hdfs
大数据
【2024第一期CANN训练营】Ascend C算子开发基础篇
AscendC是面向算子开发场景的编程语言,它原生支持C和C++标准规范,并提供了多层接口抽象、自动
并行计算
等关键技术,以提高算子开发效率。
小超编程
·
2025-02-05 03:45
c语言
java
算法
Kafka架构
其分区架构不仅赋予了Kafka强大的
并行计算
能力,使其能够高效处理海量数据,还显著提升了系统的容灾能力,确保在复杂的运行环境中始终保持稳定可靠。
优人ovo
·
2025-02-04 22:41
kafka
架构
分布式
大数据:一种收集、分析和使用数据的文化
与所有IT投资一样,大数据成功的关键在于迭代,而不是关于
Hadoop
、NoSQL、Splunk或者任何特定的供应商或技术。
程序猿广坤
·
2025-02-04 22:39
大数据
编程语言
it资讯
人工智能
程序员
编程语言
大数据
Ubuntu下
Hadoop
的安装与使用
1、创建
hadoop
用户打开终端sudouseradd-m
hadoop
-s/bin/bashsudopasswd
hadoop
//为
hadoop
设置密码sudoadduser
hadoop
sudo//为
hadoop
ly201552y
·
2025-02-04 07:44
hadoop学习
hadoop
【数据仓库】
hadoop
web UI 增加账号密码认证
升级了
hadoop
版本到3.3.6,未配置任何鉴权,默认端口98708088开放到了公网,结果没几天就被挖矿攻击了。通过开放的端口提交了很多非法任务到yarn上,并成功在服务器执行了恶意脚本。
花菜回锅肉
·
2025-02-04 07:13
大数据
数据仓库
数据仓库
hadoop
Hadoop
3.2.1安装-单机模式和伪分布式模式
Hadoop
入门篇概述
Hadoop
是使用Java编写的,是为了解决大数据场景下的两大问题,分布式存储和分布式处理而诞生的,包含很多组件、套件。需要运行在Linux系统下。
花菜回锅肉
·
2025-02-04 07:13
大数据
hadoop
hdfs
大数据
linux
Spark3.1.2单机安装部署
类似
Hadoop
,但对
Hadoop
做了优化,计算任务的中间结果可以存储在内存中,不需要每次都写入HDFS,更适用于需要迭代运算的算法场景中。
花菜回锅肉
·
2025-02-04 07:43
大数据
spark
大数据
hadoop
Flink Standalone集群模式安装部署全攻略
二、安装前准备首先,确保已经安装好了
Hadoop
环境(因为后续配置中涉及到与
Hadoop
的集成)。三、安装步骤(一)环境准备退出conda的base环境(如果存在
自节码
·
2025-02-04 04:17
java
面试
开发语言
flink
大数据
大数据(一)MaxCompute
,总会有一些疑问产生,这里讲讲作者的疑问和思路二、介绍MaxCompute(原名ODPS-OpenDataProcessingService)是阿里云提供的大数据处理平台,专门用于批量数据存储和大规模
并行计算
胖当当技术
·
2025-02-03 23:39
架构
云计算
odps
学习
大数据
Hive 分区和分桶总结
分区介绍2、分区表的操作3、动态分区2、分桶表1、分桶表介绍2、分桶表的操作3、分区表和分桶表的区别参考分区和分桶总结1、分区1、分区介绍由于数据量过于庞大,使用分区,可以并行的进行处理数据,有点类似于
Hadoop
Stray_Lambs
·
2025-02-03 14:23
大数据
hive
HBase的原理
一、什么是HBaseHBase是一个分布式,版本化,面向列的数据库,依赖
Hadoop
和Zookeeper(1)HBase的优点提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统(2)HBase表的特性
会探索的小学生
·
2025-02-03 11:30
大数据
HBase
Hadoop
的基础操作_
hadoop
常用操作
####下载文件语法:
hadoop
fs-get
hadoop
fs-copyToLocal示例:将user/text.txt文件下载到本地/usr/local/下-copyToLocal:复制到本地[root
字节全栈_kYu
·
2025-02-03 07:28
hadoop
eclipse
大数据
kylin套_Apache Kylin(一)Kylin介绍
1.传统大数据分析的问题在基于
Hadoop
生态的传统大数据分析中,主要使用的技术是MPP(MassivelyParallelProcessing)大规模并行处理和列式存储。
weixin_39898011
·
2025-02-03 07:57
kylin套
linux的apache安装,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)Spark(可选)2.3.0+Kafka(可选)1.0.0
姜白的树洞
·
2025-02-03 07:26
linux的apache安装
kylin linux 安装教程,Apache Kylin | 安装指南
软件要求
Hadoop
:2.7+Hive:0.13-1.2.1+HBase:1.1+Spark2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2
社本
·
2025-02-03 07:26
kylin
linux
安装教程
Hadoop
---(6)Sqoop(数据传输)
6.SqoopSqoop是一个用于
hadoop
数据和结构化数据之间转换的工具。
Mr Cao
·
2025-02-02 15:27
sqoop
大数据
hbase无法建表:org.apache.
hadoop
.hbase.PleaseHoldException: Master is initializing
1.环境:cdh6.2.12.现象:hbaseshell进去后,list命令执行正常,执行建表语句后报错:ERROR:org.apache.
hadoop
.hbase.PleaseHoldException
magicchu
·
2025-02-02 09:18
CDH
HBASE
大数据
电脑要使用cuda需要进行什么配置
在电脑上使用CUDA(NVIDIA的
并行计算
平台和API),需要进行以下配置和准备:1.检查NVIDIA显卡支持确保你的电脑拥有支持CUDA的NVIDIA显卡。
Channing Lewis
·
2025-02-02 06:19
计算机科学
AI
电脑
cuda
Java 大数据高性能计算:利用多线程与
并行计算
框架(39)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、本博客的精华专栏:
青云交
·
2025-02-02 05:40
大数据新视界
Java
大视界
大数据
高性能计算
多线程
并行计算框架
Apache
Spark
线程安全
数据一致性
java
Hive 整合 Spark 全教程 (Hive on Spark)
hadoop
.proxyuser.luanhao.groups*
hadoop
.proxyuser.luanhao.groups*2)HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00
字节全栈_rJF
·
2025-02-02 02:56
hive
spark
hadoop
spark和python的区别_Spark入门(Python)
Spark使用函数式编程范式扩展了MapReduce模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被实现为
Hadoop
之上的特殊系统。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
spark python入门_python pyspark入门篇
一.环境介绍:1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:spark-1.6.0-bin-
hadoop
2.6.tar.gz二.Setup1.解压spark
weixin_39686634
·
2025-02-01 23:12
spark
python入门
安装HBase-2.4.12 (
hadoop
3.3.1)
1.下载https://www.apache.org/dyn/closer.lua/hbase/2.4.12/hbase-2.4.12-bin.tar.gz节点角色配置节点MasterZooKeeperRegionServernode001yesyesyesnode002backupyesyesnode003noyesyes2.解压下载的文件,并切换到新创建的目录。(base)[root@node
不饿同学
·
2025-02-01 17:18
大数据
hbase
big
data
hadoop
Hadoop
--HA架构详解
为了解决上述问题,
Hadoop
给出了高容错,高可用的HA方案:一个HDFS集群至少存在两个nameNode,一个nameNode处在active(主)状态,其他nameNode处在standby(备
娘子,出来看上帝
·
2025-02-01 10:20
Hadoop
Hadoop
大数据
HA
Hadoop
HA 架构
为什么要用集群?企业里面,多台机器伪分布式每一个角色都是一个进程HDFS:NNSNNDNYARN:RMNM大数据所有组件,都是主从架构master-slaveHDFS读写请求都是先到NN节点,但是,HBase读写请求不是经过master,建表和删除表是需要经过masterNN节点挂了,就不能提供对外服务(-put,-get)需要配置两个NN节点(实时的,任何时刻只有一台active对外,另外一台是
weixin_30569033
·
2025-02-01 09:49
shell
大数据
matlab的多线程操作
docmemmapfile、helpmemmapfile理解:回调函数,同步回调、异步回调(不知道也没关系,csdn里面很多人都写了这个)一、结论截止到2021a版本,matlab不能实现传统意义的多线程,但是可以实现
并行计算
m0_74823044
·
2025-02-01 07:01
面试
学习路线
阿里巴巴资料职业发展
matlab
单片机
开发语言
后端
【
hadoop
学习之路】Hive HQL 语句实现查询
目录表数据表1students_data.txt表2course.txt实验步骤结论表数据表1students_data.txt21434,Sara,F,21,20,73,classC41443,Mary,M,19,30,90,classA43333,Dery,F,20,40,85,classB45454,Mary,F,22,10,91,classA14634,Henry,M,18,50,56,c
新世纪debug战士
·
2025-02-01 03:58
hadoop学习之路
hive
HDFS总结
基于前面的学习与配置,相信对于HDFS有了一定的了解HDFS概述1.什么是HDFS
Hadoop
DistributedFileSystem:分步式文件系统HDFS是
Hadoop
体系中数据存储管理的基础HDFS
ChenJieYaYa
·
2025-01-31 20:03
Hadoop
hdfs
hadoop
big
data
11 Spark面试真题
2.
hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.
hadoop
和spark的相同点和不同点?5.RDD持久化原理?6.checkpoint检查点机制?
TTXS123456789ABC
·
2025-01-31 16:26
#
Spark
spark
面试
大数据
【详细讲解】hive优化
1、开启本地模式大多数的
Hadoop
Job是需要
Hadoop
提供的完整的可扩展性来处理大数据集的。不过,有时Hive的输入数据量是非常小的。
songqq27
·
2025-01-31 06:56
大数据
hive
CUDA编程(一):GPU计算与CUDA编程简介
CUDA编程(一):GPU计算与CUDA编程简介GPU计算GPU硬件资源GPU软件资源GPU存储资源CUDA编程GPU计算NVIDIA公司发布的CUDA是建立在GPU上的一个通用
并行计算
平台和编程模型,
AI Player
·
2025-01-30 21:17
CUDA
人工智能
CUDA
NVIDIA
GPU编程与CUDA
CUDA编程
并行计算
整体流程从主机端申请内存,把内存部分的内容拷贝到设备端在设备端的核函数计算从设备端拷贝到主机端,并且释放内存显存主机端:cpu设备端:gpu核函数:在gpu上运行的函数CUDA内存模型
Nice_cool.
·
2025-01-30 21:17
Cuda与TensorRT
c++
大数据毕业设计
hadoop
+spark+hive豆瓣图书数据分析可视化大屏 豆瓣图书爬虫 图书推荐系统
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统,它可以根据用户的历史行为和偏好,为用户提供个性化的书籍推荐。该系统采用Spark技术,可以实现大数据的实时处理,从而提高推荐系统的准确性和可靠性。此外,该系统还可以根据用户的习惯和偏好,提供更加个性化的书籍推荐,从而满足用户的需求。系统的使用者包含普通用户和管理员两类,普通用户是系统的主要服务对象,主流人群是经常查看
qq_79856539
·
2025-01-30 20:03
javaweb
java
大数据
hadoop
课程设计
Transformer架构的GPU并行和之前的NLP算法并行有什么不同?
1.什么是GPU
并行计算
?GPU
并行计算
是一种利用图形处理单元(GPU)进行大规模并行数据处理的技术。
AI大模型学习不迷路
·
2025-01-30 07:49
transformer
自然语言处理
大模型
深度学习
NLP
LLM
大语言模型
python 分布式集群_Python搭建Spark分布式集群环境
Spark最大的特点就是快,可比
Hadoop
MapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群,而是使用三台电脑来搭建一个小型分布式集群环境安装。
小国阁下
·
2025-01-30 05:32
python
分布式集群
Hadoop
错误: put: Lease mismatch on ... by DFSClient_NONMAPREDUCE_-499992815_1.... 学习总结
错误总结分享:使用了
hadoop
挺长时间了,多数人应该很熟悉它的特点了吧,但是今天突然遇到个错误,从来没见过,一时自己也想不到是什么原因,就在网上查了一些资料,得到了解决的办法,再次分享一下。
星月情缘02
·
2025-01-30 03:45
ETL技术
Hadoop
hdfs租约
hadoop错误
Hadoop
3.3.4伪分布式环境搭建
文章目录前言一、准备1.下载
Hadoop
2.配置环境变量3.配置免密二、
Hadoop
配置1.
hadoop
-env.sh2.hdfs-site.xml3.core-site.xml4.mapred-site.xml5
凡许真
·
2025-01-29 21:28
分布式
hadoop
伪分布式
hadoop3.3.4
Hadoop
HA 格式化NameNode 顺序
文章目录前言一、启动JournalNode二、格式化NameNode1.执行格式化命令2.启动namenode3.执行格式化命令4.启动namenode其他前言记录搭建
Hadoop
HA架构时格式化namenode
凡许真
·
2025-01-29 21:58
hadoop
大数据
分布式
HA
云计算技术深度解析与代码使用案例
云计算技术特点云计算是网格计算、分布式计算、
并行计算
、效
我的运维人生
·
2025-01-29 17:19
云计算
运维开发
技术共享
Hive存储系统全面测试报告
ApacheHive作为一个基于
Hadoop
的数据仓库工具,因其能够提供类SQL查询功能(HiveQL)而广受欢迎。
蚂蚁质量
·
2025-01-29 13:27
软件测试
测试用例
功能测试
window10下编译
hadoop
报错:Failed to execute goal org.apache.maven.plugins:maven-antrun-plugin:1.7:
Windows10下build
hadoop
2.7.3报错:Failedtoexecutegoalorg.apache.maven.plugins:maven-antrun-plugin:1.7:[ERROR
huangxgc
·
2025-01-28 22:30
hadoop
hadoop
windows
图文详解 MapReduce on YARN
本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系正文权威版本——《
Hadoop
权威指南第3版》1.作业提交MRrunJob从RM获取新的作业ID作业客户端检査作业的输出说明,计算输入分片并将作业资源
Shockang
·
2025-01-28 13:20
大数据技术体系
大数据
mapreduce
yarn
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他