E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop基础教程
spark hdfs 常用命令
lsrmgettext以下按照使用频率和使用先后顺序排序(纯个人习惯)ls列出hdfs文件系统路径下的目录和文件hdfsdfs-ls列出hdfs文件系统路径下所有的目录和文件hdfsdfs-ls-Rrm
hadoop
fs-rm
毛球饲养员
·
2025-03-05 11:19
spark
spark
hdfs
Spark详解二
masterlocal[2](local[2]是说,执行Application需要用到CPU的2个核)2、Standalone独立模式:Spark自带的一种集群模式Spark自己管理集群资源,此时只需要将
Hadoop
卢子墨
·
2025-03-05 11:13
Spark原理
实战
总结
spark
Spark基本命令
一、spark所在目录cdusr/local/spark二、启动spark/usr/local/spark/sbin/start-all.sh启动
Hadoop
以及Spark:bash.
chenworeng5605
·
2025-03-05 10:42
大数据
scala
shell
Spark是什么?可以用来做什么?
相比传统的
Hadoop
MapReduce,Spark在速度、易用性和功能多样性上具有显著优势。
Bugkillers
·
2025-03-05 10:37
大数据
spark
大数据
分布式
Rust编程
基础教程
:Web开发入门
作者:禅与计算机程序设计艺术1.背景介绍由于Rust语言的出生地广泛流行于各个领域,有许多公司、组织都在用Rust进行开发,包括微软、Facebook、阿里巴巴、GitHub等。在移动端领域,包括华为、苹果、OPPO、vivo等都在大力推动Rust的应用。同时,Rust也越来越受欢迎,成为云计算、区块链、高性能计算等领域的主流编程语言。因此,对于新手而言,理解Rust编程语言的基本概念及特性,掌握
AI天才研究院
·
2025-03-05 05:33
AI实战
DeepSeek
R1
&
大数据AI人工智能大模型
Python实战
大数据
人工智能
语言模型
Java
Python
架构设计
大数据面试临阵磨枪不知看什么?看这份心理就有底了-大数据常用技术栈常见面试100道题
目录1描述
Hadoop
的架构和它的主要组件。2MapReduce的工作原理是什么?3什么是YARN,它在
Hadoop
中扮演什么角色?4Spark和
Hadoop
MapReduce的区别是什么?
大模型大数据攻城狮
·
2025-03-04 21:59
大数据
面试
职场和发展
面试题
数据仓库
算法
Spark使用Parqute存储方式有什么好处
列式存储:压缩效率和查询效率谓词下推存储层:查询数据块生态兼容性高:Spark,
hadoop
等都兼容
冰火同学
·
2025-03-04 21:27
Spark
spark
初学者如何用 Python 写第一个爬虫?
大数据技术:涵盖
Hadoop
(HDFS)、Hive、Spark
ADFVBM
·
2025-03-04 16:19
面试
学习路线
阿里巴巴
python
爬虫
开发语言
hadoop
集群启动问题总结
首先,我们来尝试启动
hadoop
集群:start-all.sh然后,我遇到了下面的问题:Warning:Permanentlyadded'
hadoop
'(RSA)tothelistofknownhosts
@飞往你的山
·
2025-03-04 01:29
hadoop
hdfs
大数据
Linux 下Hive 安装(Remote Metastore Database 单节点)
1、Linux下安装好mysql:Linux下Mysql安装2、启动
hadoop
集群:1、zk启动[root@node02~]#zkServer.shstartZooKeeperJMXenabledbydefaultUsingconfig
A6-母婴小店-第6分店
·
2025-03-03 22:33
HIVE
hadoop
Llama 3.2入门
基础教程
(非常详细),Llama 3.2微调、部署以及多模态训练入门到精通,收藏这一篇就够了!
9月25日Meta发布了Llama3.2,包括11B和90B的视觉语言模型。前排提示,文末有大模型AGI-CSDN独家资料包哦!Llama3技术剖析与部署相较于Llama2,Llama3的改变其实并不是太大。Tokenizer变成了128K的词表,使用了GQA,不在是原来的只在Llama2-70B里使用了。所以说,最大的改变就是词表与GQA。然后在训练上变化比较大,参数变大了,400B的还没放出来
中年猿人
·
2025-03-03 17:49
llama
android
人工智能
语言模型
深度学习
学习
自然语言处理
html 视频在线播放,HTML 视频(Video)播放
HTML视频(Videos)播放示例html>
基础教程
(nhooo.com)测试看看‹/›问题以及解决方法在HTML中播放视频并不容易!
不教书的塞涅卡
·
2025-03-03 16:14
html
视频在线播放
大数据经典技术解析:
Hadoop
+Spark大数据分析原理与实践
Apache
Hadoop
和ApacheSpark是目前主流开源大数据框架。由于其易于部署、高容错性、并行计算能力强、适应数据量大、可编程、社区支持广泛等特点,大大提升了大数据应用的效率和效果。
AI天才研究院
·
2025-03-03 10:27
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Hadoop
基础知识及部署模式
一、
Hadoop
是什么
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。
2301_82242502
·
2025-03-03 06:28
hadoop
大数据
分布式
探讨
Hadoop
的基础架构及其核心特点
Hadoop
是一个开源软件框架,用于存储和处理大规模数据集。
xx155802862xx
·
2025-03-03 06:58
hadoop
大数据
分布式
菜鸟Java
基础教程
1.Java简介
Java简介Java简介Java分为三个体系:主要特性1.Java语言是简单的:2.Java语言是面向对象的:3.Java语言是分布式的:4.Java语言是健壮的:5.Java语言是安全的:6.Java语言是体系结构中立的:7.Java语言是可移植的:8.Java语言是解释型的:9.Java是高性能的:10.Java语言是多线程的:11.Java语言是动态的:Java简介Java是由SunMicr
风之弋然
·
2025-03-03 05:52
编程语言
学习笔记
java
python
开发语言
Hadoop
毕业设计:计算机毕业设计选题汇总(建议收藏)
文章目录前言基于
Hadoop
的毕业设计选题毕设作品展示前言2025全新毕业设计项目博主介绍:✌全网粉丝10W+,CSDN全栈领域优质创作者,博客之星、掘金/华为云/阿里云等平台优质作者。
会写代码的羊
·
2025-03-03 05:16
毕设选题
hadoop
课程设计
大数据
毕设选题
毕设题目
数据分析
Redis
基础教程
(六):redis 哈希(Hash)
首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快!如有需要请大家订阅我的专栏【Redis系列】哟!我会定期更新相关系列的文章关注!关注!!请关注!!!请大家关注下博主,您的支持是我不断创作的最大动力!!!文章目录引言一、哈希数据类型概述命令详解二、实战案例场景:用户信息管理步骤1:初始化用户信息步骤2:获取用户信息步
菜鸟小码
·
2025-03-03 04:13
Redis系列
redis
哈希算法
数据库
缓存
大数据技术学习框架(更新中......)
Hadoop
相关HDFS分布式文件系统MR(MapReduce)离线数据处理MR-图解YARN集群资源管理ZooKeeperZooKeeper分布式协调框架Hive相关Hive-01之数仓、架构、数据类型
小技工丨
·
2025-03-03 04:05
大数据技术学习
大数据
学习
Python
基础教程
之Matplotlib-基础绘图
最近想自学一些数据可视化相关的工具,首先想到了Python,于是自己写一些文章,把学习成果和问题贴出来,方便自己后续查询。之前有断断续续学习过一些Python的基础语法,所以直接从Matplotlib开始,后续应该会继续更新其他相关信息。目前用的开发工具是jupyternotebook,对Python感兴趣的小伙伴也可以在评论区交流起来。>>>Matplotlibbasicusage>>>导入模块
粒子jiang
·
2025-03-02 13:06
Python教程
python
matplotlib
Ubuntu从零创建
Hadoop
集群
目录前言前提准备1.设置网关和网段2.查看虚拟机IP及检查网络3.Ubuntu相关配置镜像源配置下载vim编辑器4.设置静态IP和SSH免密(可选)设置静态IPSSH免密5.JDK环境部署6.
Hadoop
爱编程的王小美
·
2025-03-02 12:57
大数据专业知识系列
ubuntu
hadoop
linux
使用宝塔大家Java项目遇到的问题
记录一下使用宝塔大家Java项目遇到的问题:1.没有那个文件或目录/var/tmp/springboot/vhost/scripts/system-service.sh:没有那个文件或目录Feb2811:13:01
hadoop
05spring_system-service
LOVE_DDZ
·
2025-03-01 10:45
JAVA
Spring-Boot
java
spring
boot
开发语言
如何使用Spark Streaming将数据写入HBase
Spark:确保Spark已经安装,并且Spark版本与HBase的
Hadoop
版本兼容。HBaseConnectorforSpark:你需要使用HBase的SparkConnecto
Java资深爱好者
·
2025-03-01 05:02
spark
hbase
大数据
项目经验之LZO压缩?思维导图 代码示例(java 架构)
在
Hadoop
生态系统中,使用LZO压缩可以显著减少存储空间,并且由于其快速的解压速度,对于大规模数据处理任务来说是非常有利的。以下是关于LZO压缩的项目经验总结、思维导图描述以及Java代码示例。
用心去追梦
·
2025-03-01 05:31
java
架构
开发语言
HIVE 面试题总结
Hive依赖于HDFS存储数据,Hive将HQL转换成MapReduce执行,所以说Hive是基于
Hadoop
的一个数据仓库工具,实质就是一款基于HDFS的MapReduce计算框架,对存储在HDFS中的数据进行分析和管理
小余真旺财
·
2025-02-28 11:00
Hive
hive
Hive 面试题
Hive是基于
Hadoop
的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
昨夜为你摘星
·
2025-02-28 11:59
探索React的深度应用:React Survey——构建问卷神器
ReactSurvey——构建问卷神器去发现同类优质开源项目:https://gitcode.com/在浩瀚的前端开发世界里,React与Redux已成为构建复杂Web应用的得力助手,但它们的强大往往隐藏在
基础教程
之后
傅尉艺Maggie
·
2025-02-28 07:25
python调用kafka
先启动
hadoop
,zookeeper,kafka启动命令
hadoop
启动命令sbin/start-all.shzookeeper启动命令.
smile__su
·
2025-02-28 06:47
python
python
kafka
Python大数据可视化:基于Python的王者荣耀战队的数据分析系统设计与实现_flask+
hadoop
+spider
开发语言:Python框架:flaskPython版本:python3.7.7数据库:mysql5.7数据库工具:Navicat11开发软件:PyCharm系统展示管理员登录管理员功能界面比赛信息管理看板展示系统管理摘要本文使用Python与MYSQL技术搭建了一个王者荣耀战队的数据分析系统。对用户提出的功能进行合理分析,然后搭建开发平台以及配置计算机软硬件;通过对数据流图以及系统结构的设计,创建
m0_74823490
·
2025-02-27 12:47
面试
学习路线
阿里巴巴
python
flask
hadoop
华为MRS产品组件
MRS:MRS是一个在华为云上部署和管理
Hadoop
系统的服务,一键即可部署
Hadoop
集群。
QianJin_zixuan
·
2025-02-27 06:59
hadoop
hive
大数据
数据库架构
gaussdb
Hive SQL 使用及进阶详解
一、Hive简介Hive是建立在
Hadoop
之上的数据仓库基础架构,它提供了类似于SQL的查询语言HiveSQL(也称为HQL),用于对存储在
Hadoop
分布式文件系统(HDFS)中的大规模数据进行数据查询和分析
小四的快乐生活
·
2025-02-27 03:37
hive
sql
hadoop
docker-compose -volumes 两种不同定义方式
学习docker-compose部署
hadoop
集群、看到docker-compose一种不同volumes定义方式version:"3"services:namenode:image:bde2020/
胖胖胖胖胖虎
·
2025-02-26 14:34
Docker
docker
hadoop
big
data
初识
hadoop
关于
hadoop
的写入(存入)nn里面维护了一份元数据。
西门吹水之城
·
2025-02-26 12:45
hadoop
hadoop
HDFS是如何存储和管理大数据
HDFS(
Hadoop
DistributedFileSystem,
Hadoop
分布式文件系统)是专为大数据处理而设计的分布式文件系统,具有高吞吐量、高容错性等特点,适用于大规模数据存储和管理。
python资深爱好者
·
2025-02-26 11:38
大数据
hdfs
hadoop
Hadoop
基础原理
Hadoop
基础原理基本介绍
Hadoop
的必要性
Hadoop
核心组件
Hadoop
生态系统中的附加组件HDFSHDFS集群架构HDFS读写流程HDFS写流程HDFS读流程NameNode持久化机制MapReduce
disgare
·
2025-02-26 11:38
数据库
hadoop
大数据
分布式
Kafka
基础教程
— 可靠的数据传递
作者简介:大家好,我是码炫码哥,前中兴通讯、美团架构师,现任某互联网公司CTO,兼职码炫课堂主讲源码系列专题代表作:《jdk源码&多线程&高并发》,《深入tomcat源码解析》,《深入netty源码解析》,《深入dubbo源码解析》,《深入springboot源码解析》,《深入spring源码解析》,《深入redis源码解析》等联系qq:184480602,加我进群,大家一起学习,一起进步,一起对
码炫课堂-码哥
·
2025-02-26 10:33
kafka专题
kafka
消息队列
DirectX12(D3D12)
基础教程
二“纹理”
什么是纹理,简单理解叫贴图,比如现在一张1920X1080图片要显示在1920X1080的窗口上,那么图片像素与窗口一一对应简单的复制粘贴。如果图片大小与目标大小不一样时通过某种算法实现显示目标窗口上,这就叫纹理过滤。纹理坐标范围0到1,原点在左下角使用d3d12窗口显示一张图片,如果用gdi+现实简单多了,调用一个函数就可以解决。1.读取图片信息大小,像素深度BPP,d3d12所要的格式,数据。
指掀涛澜天下惊
·
2025-02-26 02:38
d3d12
c++
vc
3d
c++
visual
studio
windows
开发语言
2024年DirectX12(D3D12)
基础教程
(十七)—(5)
UINTnMeshCnt=stMeshData.m_paiModel->mNumMeshes;if(0==nMeshCnt){ATLTRACE("文件(%s)中没有网格数据!\n",pszFileName);returnFALSE;}constaiMesh\*paiSubMesh=nullptr;constaiVector3DZero3D(0.0f,0.0f,0.0f);UINTnNumBones
2401_84165919
·
2025-02-26 02:04
程序员
3d
Spark集群架构介绍
据SparkCertifiedExperts显示,在内存中运行时,Sparks性能要比
Hadoop
快一百倍,在磁盘上运行,Sparks比
Hadoop
快达十倍。
olifchou
·
2025-02-25 20:23
Spark
spark
apache
spark
大数据
分布式
Spark Standalone集群架构
北风网spark学习笔记SparkStandalone集群架构SparkStandalone集群集群管理器,clustermanager:Master进程,工作节点:Worker进程搭建了一套
Hadoop
htfenght
·
2025-02-25 20:22
spark
spark
Hadoop
--NameSpace(名称空间)
1.名称空间的定义 HDFS的名称空间是一个逻辑上的文件系统目录树,类似于传统文件系统的目录结构。组成目录:用于组织文件的逻辑容器。文件:存储在HDFS中的实际数据单元。元数据:包括文件名、权限、所有者、文件大小、创建时间、修改时间等信息。2.名称空间的作用名称空间的主要作用是:组织文件通过目录树的形式组织文件,方便用户管理和访问。维护元数据记录文件和目录的元数据信息(如权限、所有者、大小等)。
Cynthiaaaaalxy
·
2025-02-25 18:42
hadoop
大数据
分布式
spark程序提交到集群上_Spark集群模式&Spark程序提交
ApacheMesos—通用的集群管理,可以在其上运行
Hadoop
MapReduce和一些服务应用。
Hadoop
YARN—
Hadoop
2中的资源管理器。
毫无特色
·
2025-02-25 16:25
spark程序提交到集群上
Hadoop
--Secondary NameNode工作机制,作用及与NameNode HA的区别
SecondaryNameNode主要用于辅助NameNode进行元数据的管理和检查点(Checkpoint)的生成。1.SecondaryNameNode的工作机制详解SecondaryNameNode的工作机制可以分为以下步骤:①SecondaryNameNode询问NameNode是否需要CheckpointSecondaryNameNode会定期(由dfs.namenode.check
Cynthiaaaaalxy
·
2025-02-25 08:32
hadoop
大数据
分布式
Hadoop
之jdk的安装
【实验目的】1.安装配置JDK1.五台独立PC机或虚拟机主机之间有有效的网络连接2.每台主机内存2G以上,磁盘剩余空间500M以上所有主机上已安装CentOS7.4操作系统3.所有主机已完成网络属性配置1.卸载原有JDK该项的所有操作步骤需要使用root用户进行。并且在集群中每台主机操作一次,发现没有,不必卸载因为我的查看没有jdk,所以不需要卸载原有的,只需直接安装即可。2.安装此项的所有操作步
快来削我吖
·
2025-02-25 01:11
云存储
hadoop
jdk
centos
Hadoop
HDFS基准测试
一、测试写入速度确保HDFS集群和YARN集群成功启动
hadoop
jar/export/server/
hadoop
-3.1.4/share/
hadoop
/mapreduce/
hadoop
-mapreduce-client-jobclient
Yvonne978
·
2025-02-24 14:22
大数据
hadoop
hdfs
大数据
jmeter 与大数据生态圈中的服务进行集成
以下为你详细介绍JMeter与大数据生态圈中几种常见服务(
Hadoop
HDFS、Spark、Kafka、Elasticsearch)集成的方法:与
Hadoop
HDFS集成实现思路HDFS是
Hadoop
的分布式文件系统
小赖同学啊
·
2025-02-24 13:40
jmeter专栏
jmeter
大数据
数据质量管理工具(Trifacta Wrangler)
2015年10月:正式推出TrifactaWrangler,让非技术用户也能通过直观的可视化工作流程来探索、转换和丰富数据,同时其旗舰产品、专注于
Hadoop
的Trifacta数据处理解决方案更名为TrifactaWranglerEnterprise
deepdata_cn
·
2025-02-24 09:46
数据质量
数据质量
Hadoop
常用操作命令
启动HDFSsbin/start-dfs.sh启动yarnsbin/start-yarn.sh启动NodeManageryarn-daemon.shstartnodemanager启动DataNode
hadoop
-daemon.shstartdatanode
hzw0510
·
2025-02-24 07:02
hadoop
大数据
分布式
【Python爬虫(45)】Python爬虫新境界:分布式与大数据框架的融合之旅
目录一、大数据处理框架初印象1.1
Hadoop
:大数据处理的基石1.2
奔跑吧邓邓子
·
2025-02-24 05:18
Python爬虫
python
爬虫
分布式
开发语言
大数据框架
hive运维
showlocks;查看锁unlocktable表名;释放锁发现释放不了锁,执行下面sethive.support.concurrency=false;sethive.txn.manager=org.apache.
hadoop
.hive.ql.lockmgr.DummyTxnManager
花泽啸
·
2025-02-23 23:04
Hive
hive
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他