E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop学习篇
深度
学习篇
---昇腾NPU&CANN 工具包
介绍昇腾NPU是华为推出的神经网络处理器,具有强大的AI计算能力,而CANN工具包则是面向AI场景的异构计算架构,用于发挥昇腾NPU的性能优势。以下是详细介绍:昇腾NPU架构设计:采用达芬奇架构,是一个片上系统,主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心,包括控制CPU和AICPU,前者用于控制处理器整体运行,后者承担非矩阵类复杂计算。此外,还拥有AICore
Atticus-Orion
·
2025-07-12 12:55
上位机知识篇
图像处理篇
深度学习篇
深度学习
人工智能
NPU
昇腾
CANN
Hive简介
文章目录Hive简介Hive特点Hive和RDBMS的对比Hive的架构Hive的数据组织Hive数据类型Hive简介1、Hive由Facebook实现并开源2、是基于
Hadoop
的一个数据仓库工具3、
·
2025-07-12 05:29
python基于
Hadoop
的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法:设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理,难度适中,本选题是学生所学专业知识的延续,符合学生专业发展方向,对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
·
2025-07-12 02:45
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30
hadoop
104:8020dfs.namenode.rpc-address.nameservice1.namenode37
hadoop
106
·
2025-07-12 02:44
HIVE(二)
的三种方式DDLDML数据操作向表中装载数据数据导出常用函数Like和RLike分组Join排序分区表和分桶表访问HIVE的三种方式启动Hive命令,CtrlC退出客户端,执行测试语句,与sql一致[wyc@
hadoop
102hive
2301_78012738
·
2025-07-12 02:14
hive
数据仓库
安全运维的 “五层防护”:构建全方位安全体系
身份认证-行为监测-自动响应-审计溯源”的五层防护架构,融合AI、零信任等技术,构建全链路安全运维体系,以下从技术逻辑与实践落地展开解析:第一层:全域资产纳管——筑牢安全根基挑战云网基础设施包含分布式计算(
Hadoop
KKKlucifer
·
2025-07-11 11:02
安全
运维
Hive 事务表(ACID)问题梳理
文章目录问题描述分析原因什么是事务表概念事务表和普通内部表的区别相关配置事务表的适用场景注意事项设计原理与实现文件管理格式参考博客问题描述工作中需要使用pyspark读取Hive中的数据,但是发现可以获取metastore,外部表的数据可以读取,内部表数据有些表报错信息是:AnalysisException:org.apache.
hadoop
.hive.ql.metadata.HiveExcept
·
2025-07-10 10:21
Docker快速构建Hive测试环境
Hive是一个基于
Hadoop
的数据仓库基础设施,它提供了一种类似于SQL的查询语言,用于分析和处理大规模数据集。
静谧星光
·
2025-07-09 08:29
docker
hive
容器
编程
HDFS 伪分布模式搭建与使用全攻略(适合初学者 & 开发测试环境)
HDFS(
Hadoop
DistributedFileSystem)作为
Hadoop
生态系统的核心组件,广泛应用于海量数据的分布式存储场景。
huihui450
·
2025-07-09 08:27
hdfs
hadoop
大数据
YARN container cpu超核如何解决
在Apache
Hadoop
YARN中,ContainerCPU超核(即Container使用的CPU资源超过分配量)是一个常见问题,可能导致集群性能下降或不稳定。
fzip
·
2025-07-08 08:19
YARN
超核
Hadoop
-Mapreduce入门
Hadoop
-Mapreduce入门MapReduce介绍mapreduce设计MapReduce编程规范入门案例WordCountMapReduce介绍MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景
·
2025-07-08 06:33
Hadoop
MapReduce入门
入门简介计算过程分为两个阶段Map和ReduceMap阶段并行处理输入数据Reduce阶段对Map结果进行汇总针对python语言来说:map函数或者reduce函数来说,输出的数据格式为元组tuple一个简单的MapReduce程序只需要指定map()reduce()input()output()剩下的由框架完成。Linux常见命令:-读取文件(文本文件,在Windows下使用记事本打开的文件)
且行且安~
·
2025-07-08 06:02
数据分析进阶之路
Linux命令
hadoop
MapReduce入门
Hadoop
MapReduce 入门
一、
Hadoop
3.0.4环境准备1.环境要求Java8(
Hadoop
3.0.4不支持Java11+)单节点或多节点Linux系统(推荐Ubuntu18.04+)至少4GB内存(建议8GB+)50GB以上磁盘空间
·
2025-07-08 06:29
管理大数据存储的十大技巧
Hadoop
已经逆转了这一趋势回归DAS。每一个
Hadoop
集群都拥有自身的——虽然是横向扩展型——直连式存储,这有助于
Hadoop
管理数据本地化,但也放弃了共享存储的规模和效率。
weixin_34238633
·
2025-07-07 18:31
大数据
数据库
运维
MapReduce数据处理过程2万字保姆级教程
目录1.MapReduce的核心思想:分而治之的艺术2.
Hadoop
MapReduce的架构:从宏观到微观3.WordCount实例:从代码到执行的完整旅程4.源码剖析:Job.submit的魔法5.Map
大模型大数据攻城狮
·
2025-07-07 15:44
mapreduce
大数据
yarn
cdh
hadoop
大数据面试
shuffle
Hadoop
核心组件最全介绍
文章目录一、
Hadoop
核心组件1.HDFS(
Hadoop
DistributedFileSystem)2.YARN(YetAnotherResourceNegotiator)3.MapReduce二、数据存储与管理
Cachel wood
·
2025-07-07 12:54
大数据开发
hadoop
大数据
分布式
spark
数据库
计算机网络
数据仓库技术及应用(Hive 产生背景与架构设计,存储模型与数据类型)
1.Hive产生背景传统
Hadoop
架构存在的一些问题:MapReduce编程必须掌握Java,门槛较高传统数据库开发、DBA、运维人员学习门槛高HDFS上没有Schema的概念,仅仅是一个纯文本文件Hive
娟恋无暇
·
2025-07-07 12:49
数据仓库
笔记
hive
深度
学习篇
---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程,包括数据准备、模型构建、训练和部署,不依赖任何深度学习框架,仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集,将其分为好果和坏果两类,并进行预处理:importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
·
2025-07-07 03:20
缺少关键的 MapReduce 框架文件
计算圆周率时提醒
Hadoop
集群缺少关键的MapReduce框架文件mr-framework.tar.gz在http://master:7180/cmf/services/4/status里直接安装再次运行代码
·
2025-07-06 20:30
大数据 ETL 工具 Sqoop 深度解析与实战指南
异构数据源连接:支持关系型数据库(如MySQL、Oracle)与
Hadoop
生态(HDFS、H
·
2025-07-06 12:18
安装
Hadoop
集群&入门&源码编译
安装
Hadoop
集群完全分布式先决条件准备三台机器NameStaticIPDESCbigdata102192.168.1.102DataNode、NodeManager、NameNodebigdata103192.168.1.103DataNode
只年
·
2025-07-06 11:05
大数据
Hadoop
hadoop
大数据
分布式
Hadoop
之HDFS
Hadoop
之HDFSHDFS的Shell操作启动
Hadoop
集群(方便后续测试)[atguigu@
hadoop
102~]$sbin/start-dfs.sh[atguigu@
hadoop
102~]$sbin
只年
·
2025-07-06 10:02
大数据
Hadoop
HDFS
hadoop
hdfs
大数据
安装Python3.12报错:HTTP 429 TOO MANY REQUESTS for url <https://mirrors.ustc.edu.cn/anaconda/pkgs/free/li
安装Python3.12报错(base)[xxx@
hadoop
104python_shell]$condacreate--namepythonThirteenpython=3.12报错如下:Retrievingnotices
·
2025-07-06 06:35
大数据分析技术的学习路径,不是绝对的,仅供参考
Java/Scala:深入理解
Hadoop
/Spark等框架会更有优势。初学者
水云桐程序员
·
2025-07-06 02:12
学习
大数据
数据分析
学习方法
头歌作业-HBase 开发:使用Java操作HBase
第一关packagestep1;importjava.io.IOException;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.hbase.HBaseConfiguration
http_lizi
·
2025-07-06 00:56
hbase
java
python
HDFS中fsimage和edits究竟是什么
fsimage和edits是
Hadoop
HDFS(
Hadoop
分布式文件系统)中的两个关键组件,用于存储文件系统的元数据,以确保文件系统的持久性和一致性。
清平乐的技术博客
·
2025-07-05 20:55
大数据运维
hdfs
hadoop
大数据
spark处理kafka的用户行为数据写入hive
在CentOS上部署
Hadoop
(
Hadoop
3.4.1)和Hive(Hive3.1.2)的详细步骤说明。
月光一族吖
·
2025-07-05 12:33
spark
kafka
hive
【
Hadoop
】
Hadoop
车辆数据存储
Hadoop
车辆数据存储本作业旨在实现将车辆数据按天存储到
Hadoop
分布式文件系统(HDFS)中,并根据数据文件大小分割成多个文件进行存储。数据格式为JSON。
db_hjx_2066
·
2025-07-05 12:29
java
hadoop
计算机毕业设计之基于
Hadoop
的公共自行车数据分布式存储与计算
如今,在科学技术飞速发展的情况下,信息化的时代也已因为计算机的出现而来临,信息化也已经影响到了社会上的各个方面。它可以为人们提供许多便利之处,可以大大提高人们的工作效率。随着计算机技术的发展的普及,各个领域也都体会到其强大的数据处理能力,这也成为各行各业不可或缺的工具。所以计算机技术被广泛应用于信息管理系统和数据处理等方面。通过它可以大大减少相关的工作处理步骤,也可以提高信息和数据的安全性。本文对
·
2025-07-05 12:58
如何学习才能更好地理解人工智能工程技术专业和其他信息技术专业的关联性?
例如:AI(机器学习)├─数据支撑:大数据技术(
Hadoop
/Spark)+数据
人工智能教学实践
·
2025-07-04 18:05
python编程实践
人工智能
学习
人工智能
HDFS与HBase有什么关系?
1、HDFS文件存储系统和HBase分布式数据库HDFS是
Hadoop
分布式文件系统。HBase的数据通常存储在HDFS上。HDFS为HBase提供了高可靠性的底层存储支持。
lucky_syq
·
2025-07-04 13:58
hdfs
hbase
hadoop
大数据基础知识-
Hadoop
、HBase、Hive一篇搞定
Hadoop
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构,其核心设计包括分布式文件系统(HDFS)和MapReduce编程模型;
Hadoop
是一个开源的分布式计算框架,旨在帮助用户在不了解分布式底层细节的情况下
原来是猪猪呀
·
2025-07-04 13:28
hadoop
大数据
分布式
Hadoop
、HDFS、Hive、Hbase区别及联系
Hadoop
、HDFS、Hive和HBase是大数据生态系统中的关键组件,它们都是由Apache软件基金会管理的开源项目。下面将深入解析它们之间的区别和联系。
静心观复
·
2025-07-04 13:27
大数据
hadoop
hdfs
hive
Hadoop
入门案例WordCount
wordcount可以说是
hadoop
的入门案例,也是基础案例主要体现思想就是mapreduce核心思想原始文件为
hadoop
.txt,内容如下:hello,javahello,java,linux,
hadoop
hadoop
码喵喵
·
2025-07-04 01:42
hadoop
mapreduce
大数据
Hadoop
入门案例
Hadoop
的运行流程:客户端向HDFS请求文件存储或使用MapReduce计算。NameNode负责管理整个HDFS系统中的所有数据块和元数据信息;DataNode则实际存储和管理数据块。
'Wu'
·
2025-07-04 01:12
学习日常
大数据
hadoop
hdfs
大数据
【字节跳动】数据挖掘面试题0003:有一个文件,每一行是一个数字,如何用 MapReduce 进行排序和求每个用户每个页面停留时间
要使用MapReduce对文件中的数字进行排序,需要实现一个MapReduce作业,将数字作为键处理,利用
Hadoop
的默认排序机制对键进行排序。
·
2025-07-03 19:30
头歌 当HBase遇上MapReduce
packagecom.processdata;importjava.io.IOException;importjava.util.List;importjava.util.Scanner;importorg.apache.
hadoop
.conf.Configuration
敲代码的苦13
·
2025-07-03 11:00
头歌
hbase
mapreduce
数据库
MapReduce01:基本原理和wordCount代码实现
本篇文章中,笔者记录了自己对于MapReduce的肤浅理解,参考资料主要包括《大数据
Hadoop
3.X分布式处理实战》和网络视频课程。
冬至喵喵
·
2025-07-03 08:35
大数据
mapreduce
大数据集群架构
hadoop
集群、Hbase集群、zookeeper、kafka、spark、flink、doris、dataeas(二)
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
争取不加班!
·
2025-07-03 00:05
hadoop
hbase
zookeeper
大数据
运维
输入
hadoop
version时,解决Cannot execute /home/
hadoop
/libexec/
hadoop
-config.sh.的方法
在ubuntu用
hadoop
version遇到了一个错误:Cannotexecute/home/
hadoop
/
hadoop
2.8/libexec/
hadoop
-config.sh.解决方法:在/etc/
有奇妙能力吗
·
2025-07-02 21:45
ubuntu
hadoop
hdfs
linux
大数据
分布式
Hadoop
、Spark、Flink 三大大数据处理框架的能力与应用场景
一、技术能力与应用场景对比产品能力特点应用场景
Hadoop
-基于MapReduce的批处理框架-HDFS分布式存储-容错性强、适合离线分析-作业调度使用YARN-日志离线分析-数据仓库存储-T+1报表分析
·
2025-07-02 13:45
Hadoop
WordCount 程序实现与执行指南
Hadoop
WordCount程序实现与执行指南下面是使用Python实现的
Hadoop
WordCount程序,包含完整的Mapper和Reducer部分。
·
2025-07-02 00:07
使用matplotlib绘制散点图、柱状图和饼状图-
学习篇
一、散点图Python代码如下:num_points=100x=np.random.rand(num_points)#x点位随机y=np.random.rand(num_points)#y点位随机colors=np.random.rand(num_points)#颜色随机sizes=1000*np.random.rand(num_points)#大小随机alphas=np.random.rand(
Zorione
·
2025-07-01 09:00
Python
matplotlib
学习
python
centos 7+
hadoop
2.7.3
安装JDK版本:jdk-8u131-linux-x64.tar.gz需要先删除系统自带的openjdk先查找java再移除[
hadoop
@localhost~]$rpm-qa|grepjavajava-
mozhw
·
2025-06-30 16:05
c/c++
linu/unix
java
MapReduce概述
1、MapReduce概述1.1MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“
Hadoop
的数据分析应用”的核心框架。
Tate小白
·
2025-06-29 14:08
大数据学习
mapreduce
【笔记-软考】大数据架构-Lambda与Kappa架构对比
1.简介大数据系统架构的设计思想很大程度受技术条件和思维模式的限制;Lambda架构在提出初期面向小范围业务,直接将成熟离线处理技术(
Hadoop
)和实时处理技术(Storm)相结合,用View模型将二者处理后得到的输出结果结合起来
我叫白小猿
·
2025-06-27 17:53
软考
软考
架构
大数据
Kappa
Lambda
HDFS(
Hadoop
分布式文件系统)总结
文章目录一、HDFS概述1.定义与定位2.核心特点二、HDFS架构核心组件1.NameNode(名称节点)2.DataNode(数据节点)3.Client(客户端)4.SecondaryNameNode(辅助名称节点)三、数据存储机制1.数据块(Block)设计2.复制策略(默认复制因子=3)3.数据完整性校验四、文件读写流程1.写入流程2.读取流程五、高可用性(HA)机制1.单点故障解决方案2.
Cachel wood
·
2025-06-26 22:40
大数据开发
hadoop
hdfs
大数据
散列表
算法
哈希算法
spark
Spark教程1:Spark基础介绍
二、Spark的核心优势三、Spark的核心概念四、Spark的主要组件五、Spark的部署模式六、Spark与
Hadoop
的关系七、Spark应用开发流程八、Spark的应用场景九、Spark版本更新与社区一
Cachel wood
·
2025-06-26 21:37
大数据开发
spark
大数据
分布式
计算机网络
数据库
数据仓库
Hadoop
的部分用法
前言
Hadoop
是一个由Apache基金会开发的开源框架,它允许跨多个机器使用分布式处理大数据集。
覃炳文20230322027
·
2025-06-26 16:30
hadoop
hive
大数据
分布式
Netty4.1 - TCP粘包拆包解决方案及案例代码
它已经得到了成百上千的商业项目的验证,例如
Hadoop
的RPC框架Avro就使用了Netty作为底层通信框架,其他的业界主流RPC框架,例如:Dubbo、Google开源的gRPC、新浪微博开源的Motan
wwyh520
·
2025-06-26 14:18
IO编程
netty
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他