E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop核心技术
【代码随想录-链表】环形链表 II
推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java
核心技术
点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列
檀越剑指大厂
·
2024-02-02 18:48
s6
算法与数据结构
链表
数据结构
Hive和Hbase的各自适用场景
一、区别:Hbase:
Hadoop
database的简称,也就是基于
Hadoop
数据库,是一种NoSQL数据库,主要适用于海量明细数据(十亿、百亿)的随机实时查询,如日志明细、交易清单、轨迹行为等。
yoku酱
·
2024-02-02 17:36
【好书推荐-第三期】《深入理解Java
核心技术
:写给Java工程师的干货笔记》全网阅读量千万的Java工程师成神之路学习笔记,Java基础知识点查漏补缺
作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主、前后端开发、人工智能研究生。公粽号:程序员洲洲。本文专栏:本文收录于洲洲的《送书福利》系列专栏,该专栏福利多多,只需关注+点赞+收藏三连即可参与送书活动!欢迎大家关注本专栏~专栏一键跳转同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深度学习从0
程序员洲洲
·
2024-02-02 14:50
送书福利
java
笔记
学习
Hadoop
原理
Hadoop
框架分布式文件存储-HDFS即
Hadoop
内提供分布式数据存储的文件系统分布式计算框架-MapReduce即
Hadoop
内提供的进行分布式计算的组件分布式资源调度-YARN即
Hadoop
内提供的进行分布式资源调度的组件
我走之後
·
2024-02-02 14:25
hadoop
大数据
分布式
大数据技术之
Hadoop
相关导论大数据相关导论首先我们要知道一切皆数据数据的作用从海量数据中提取出有效的价值信息,实现数据的商业化,价值化,给企业的决策者或者运营人员提供数据支持或者分析性报告.更好的了解事与物的运行规律,给生活赋能.什么是大数据数据的体量比较大,2000年全球互联的概念提出及普及后,数据量开始快速增长....数据单位:bit,byte,kb,mb,gb,tb,pb,eb,zb,yb,bb,nb,db大数
我走之後
·
2024-02-02 14:54
大数据
hadoop
分布式
PySpark(一)Spark原理介绍、PySpark初体验及原理
SparkVS
Hadoop
尽管Spark相对于
Hadoop
而言具有较大优势,但Spark并不能完全替代
Hadoop
在计算层面,Spark相比较MR(MapReduce)有巨大的性能优势,但至今仍有许多计算工具基于
独憩
·
2024-02-02 13:11
PySpark
python
分布式
大数据
spark
Redis
核心技术
与实战【学习笔记】 - 14.Redis 旁路缓存的工作原理及如何选择应用系统的缓存类型
概述我们知道,Redis提供了高性能的数据存取功能,广泛应用在缓存场景中,既可以提升业务的响应速度,又可以避免把高并发的请求发送到数据库。如果Redis做缓存时出现了问题,比如说缓存失效,那么,大量请求就会直接积压到数据库,给数据库带来巨大的压力,很可能导致数据库宕机。正是因为Redis用作缓存的普遍性以及它在业务应用的重要作用,所以,我们需要系统的掌握缓存的一系列内容,包括工作原理、替换策略、异
陈建111
·
2024-02-02 13:08
Redis核心技术学习
缓存
redis
Redis
旁路缓存
【livy】Spark Livy深究
的解决方案从任何地方提交job使用交互式的Scala、Python语言与远程的spark集群进行通信无需更改代码Livy的运作流程阐述Livy的安装、启动、访问Livy的启动:依次启动zookeeper集群、
Hadoop
小赵要加油
·
2024-02-02 13:07
livy
大数据
分布式
华天动力OA ntkodownload.jsp 任意文件读取漏洞
Ⅰ、漏洞描述华天动力OA是一个以技术领先著称的协同软件产品,拥有领先业界的三大
核心技术
:协同平台、工作流和智能报表,是业内唯一实现协同工具软件、协同应用软件、协同平台融合的
Love Seed
·
2024-02-02 13:41
安全
亿某通电子文档安全管理系统 UploadFileToCatalog SQL注入漏洞
Ⅰ、漏洞描述亿某通新一代电子文档安全管理系统(简称:CDG)是一款融合文档加密、数据分类分级、访问控制、关联分析、大数据分析、智能识别等
核心技术
的综合性数据智能安全产品。产
Love Seed
·
2024-02-02 13:10
安全
sql
数据库
Iceberg从入门到精通系列之二十一:Spark集成Iceberg
从入门到精通系列之二十一:Spark集成Iceberg一、在Spark3中使用Iceberg二、添加目录三、创建表四、写五、读六、Catalogs七、目录配置八、使用目录九、替换会话目录十、使用目录特定的
Hadoop
最笨的羊羊
·
2024-02-02 12:20
日常分享专栏
Iceberg
从入门到精通系列之二十一
Spark集成Iceberg
新书速览|PyTorch 2.0深度学习从零开始学
为读者揭示PyTorch2.0进行深度学习项目实战的
核心技术
,实战案例丰富而富有启发。02本书内容本书共分15章,内容包括PyTorch概述、开发环境搭建、基于PyTorch的MNIST分类实
全栈开发圈
·
2024-02-02 12:46
深度学习
pytorch
人工智能
实时数据湖:Flink CDC流式写入Hudi
点击上方蓝色字体,选择“设为星标”回复"面试"获取更多惊喜1.环境准备•Flink1.12.2_2.11•Hudi0.9.0-SNAPSHOT(master分支)•Spark2.4.5、
Hadoop
3.1.3
王知无(import_bigdata)
·
2024-02-02 12:01
spark
hadoop
hive
大数据
mysql
pyspark的安装及使用
遇到加载不了选项框的情况可以尝试用手机打开网址获取下载链接后下载直接解压,注意路径不要有空格环境变量配置Path配置测试安装情况,cmd输入spark-shell出现WelcometoSpark表示安装成功,如果没有装
Hadoop
a013067506e4
·
2024-02-02 11:56
王腾:小米手机用户忠诚度安卓第一;谷歌2023年裁员逾1.2万,遣散费高达21亿美元;库克预告iOS 18重磅更新 | 极客头条
英伟达中国特供AI芯片H20售价曝光,起售价11万元王腾:小米手机用户忠诚度安卓第一5.5G、6G
核心技术
,中国移动卫星通信新进展:星载核心网研制成功第三方开源社区“Linux中国”官宣停止运营,主
极客日报
·
2024-02-02 09:52
人工智能
harmonyos
Hadoop
环境搭建
目录一、简介1.1、概念1.2、优势1.3、
Hadoop
组成部分二、
Hadoop
运行环境搭建2.1安装VM(虚拟机管理环境)2.2VM网络设置2.3安装CentOS7系统2.4master主机进行网络配置
业里村牛欢喜
·
2024-02-02 07:24
hadoop
大数据
hdfs
Hadoop
-生产调优(更新中)
128*1024*1024*1024/150byte≈9.1亿GMBKBByte2)
Hadoop
2.x系列,配置NameNode内存NameNode内存默认2000m,如果内存服务器内存4G,NameNode
OnePandas
·
2024-02-02 07:47
Hadoop
hadoop
大数据
分布式
Hadoop
3.x基础(3)- MapReduce
MapReduce概述MapReduce定义MapReduce优缺点优点缺点MapReduce核心思想MapReduce进程常用数据序列化类型MapReduce编程规范WordCount案例实操本地测试提交到集群测试
Hadoop
魅美
·
2024-02-02 07:45
大数据基础
hadoop
(二)
hadoop
搭建
1.下载访问https://
hadoop
.apache.org/releases.html查看
hadoop
最新下载地址wgethttps://dlcdn.apache.org/
hadoop
/common
调试大师
·
2024-02-02 07:41
Hadoop
大数据
hadoop
大数据
分布式
(一)
hadoop
搭建之环境准备1
1.参考http://www.fogsvc.com/97.html文档设置三台虚拟机并固定ip192.168.1.10
hadoop
-master192.168.1.11
hadoop
-slave1192.168.1.12
hadoop
-slave22
调试大师
·
2024-02-02 07:40
大数据
Hadoop
hadoop
大数据
分布式
【Hive】配置
服务部署hiveserver2服务介绍部署启动远程连接1.使用命令行客户端beeline进行远程访问metastore服务运行模式部署其他常见配置显示当前表头和库日志配置Hive的JVM堆内存设置关闭
Hadoop
返返返
·
2024-02-02 07:33
大数据开发
hive
大数据
Hbase安装详解
node1、node2、node3(已在/etc/hosts文件里做好了ip和名字的映射)b、软件压缩包存储路径:/export/software/c、解压后安装包存储路径:/export/server/d、
hadoop
沉默鹰_90
·
2024-02-02 06:30
软件安装
hbase
大数据
linux
HBase详细安装指南
HBase–
Hadoop
Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在
嘎嘎嘎啊哈
·
2024-02-02 06:59
hadoop
hbase
big
data
Java技术栈 —— Hive与HBase
一、参考文章或视频链接[1]《Java技术栈——
Hadoop
入门(一)》-CSDN二、如何
键盘国治理专家
·
2024-02-02 06:23
Java技术栈
java
hive
hbase
成为高手的
核心技术
——复盘
古人说过:“吾日三省吾身”,每天的反省是我们快速成长的方法之一,那么都需要反省什么呢?这就涉及到了复盘的知识。下面我们通过什么是复盘、为什么要复盘以及怎么进行复盘来认识一下它。什么是复盘?复盘一般包括六个步骤:1)当初行动的意图或目的是什么?2)实际发生了什么事?3)我们从这件事中可以学到什么?4)现在我们应该怎么做?5)采取行动6)分享给更多的人从这六个步骤我们可以看出复盘就是将我们通过事件学到
By92
·
2024-02-02 01:45
黑猴子的家:API 操作 HDFS 文件夹删除
1、Code->GitHubhttps://github.com/liufengji/
hadoop
_hdfs.git2、Code@TestpublicvoiddeleteAtHDFS()throwsException
黑猴子的家
·
2024-02-02 00:29
Java接收solr动态域_Solr和Spring Data Solr
Solr可以和
Hadoop
(http://www.yiibai.com/
hadoop
/)一起使用。由于
Hadoop
处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。
weixin_39897015
·
2024-02-01 22:27
Java接收solr动态域
性能超Spark 100倍,算立方补上邦盛科技实时智能技术体系的关键拼图丨爱分析访谈
其
核心技术
之一是能够实时快速、高并发处理
ifenxi爱分析
·
2024-02-01 20:10
spark
科技
大数据
安装配置hive
[root@
hadoop
00~]#wget-chttps://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.7/apache-hive-2.3.7-
m0_69595107
·
2024-02-01 19:28
Hadoop
hive
hadoop
数据仓库
database
大数据
安装配置sqoop
一、了解Sqoop1、Sqoop产生的原因A.多数使用
hadoop
技术的处理大数据业务的企业,有大量的数据存储在关系型数据中。
m0_69595107
·
2024-02-01 19:27
Hadoop
sqoop
hadoop
分布式
apache
centos
大数据
Hadoop
-3.1.3(四)读写流程详解
读文件流程客户端向namenode发起OpenFile请求,目的是获取要下载文件的输入流。namenode收到请求会后会检查路径的合法性,以及客户端的权限。客户端发起OpenFile的同时,还会掉用GetBlockLocation。当第一次的检验通过之后,namenode会将文件的块信息(元数据)封装到输入流,交给客户端。3.4.客户端用输入流,根据元数据信息去找指定的datanode读取文件块(
_大叔_
·
2024-02-01 19:38
Redis
核心技术
与实战【学习笔记】 - 13.Redis缓冲区可能引起的问题及解决套路
缓冲区的功能其实很简答,主要就是用一块内存空间来暂时存放命令数据,以免出现因为数据和命令的处理速度慢于发送速度而导致的数据丢失和性能的问题。但是因为缓冲区的内存空间有限,如果往里面写入数据的速度持续地大于从里面读取数据的速度,就会导致缓冲区需要越来越多的内存来暂存数据。当缓冲区占用的内存超出了设定的上限阈值时,就会出现缓冲区溢出。如果发生了溢出,就会丢失数据了。那是不是不给缓冲区的大小设置上限,就
陈建111
·
2024-02-01 17:01
Redis核心技术学习
redis
redis缓冲区
Kafka运维相关知识
它的最大的特性就是可以实时的处理大量数据以满足各种需求场景:比如基于
hadoop
的批处理系统、低延迟的实时系统、storm/spark流式处理引擎。
全脂主妇
·
2024-02-01 17:31
消息组件
kafka
分布式
Redis
核心技术
与实战【学习笔记】 - 12.Redis删除数据后,为什么内存占用率还是很高?
前言在使用Redis是,经常会遇到一个问题:明明做了数据删除,数据量不大,但是使用top命令查看时,发现Redis还是占用了很多内存。这是因为,当删除数据后,Redis释放的内存空间会由内存分配器管理,并不会立即返回操作系统,所以,操作系统操作系统仍然会记录这给Redis分配了大量内存。这往往会伴随一个潜在的风险点:Redis释放的内存空间可能并不是联系的,那么,这些不连续的内存空间可能处于一种闲
陈建111
·
2024-02-01 17:31
Redis核心技术学习
redis
redis
内存碎片
内存碎片
Redis
核心技术
与实战【学习笔记】 - 11.响应延迟的波动问题及解决方案
在Redis的实际应用中,有一个非常严重的问题,就是Redis突然变慢了。举个例子,在秒杀场景下,一旦Redis变慢了,大量的用户下单请求就会被拖慢,也就是说,用户提交了下单申请,确没有得到响应,这会给用户带来非常糟糕的体验,甚至可能会导致用户流失。而且,在实际的生产环境中,Redis往往只是业务系统中的一个环节,(例如作为缓存或是数据库)。一旦Redis上的请求延迟增加,就可能引起业务系统中的一
陈建111
·
2024-02-01 17:01
Redis核心技术学习
redis
响应延迟
性能调优
开源大数据集群部署(八)Ranger编译部署
简单说明如下:在pom.xml中更改对应
hadoop
集群组件版本。ranger2编译前提条件是python3和mvn已安装完成。
云掣YUNCHE
·
2024-02-01 16:57
开源大数据集群部署
开源
大数据
Python中的Django的
核心技术
与应用
文章目录概要第2章django
核心技术
第3章django核心组件第4章django核心组件的应用第5章django核心组件的扩展小结概要本研究旨在对PYTHON中的Django
核心技术
进行深入的研究和分析
容丹丹
·
2024-02-01 16:24
Python
python
django
前端
json
bootstrap
大数据开发流程图
1、大数据流程图2、大数据各个环节主要技术2.1、数据处理主要技术Sqoop:(发音:skup)作为一款开源的离线数据传输工具,主要用于
Hadoop
(Hive)与传统数据库(MySql,PostgreSQL
xyzkenan
·
2024-02-01 14:30
大数据开发
大数据
大数据开发流程
Cloudera Manager 安装 Kafka 并简单使用
Kafka的目的是通过
Hadoop
的并行加载机制来统一线上和离线的消息处理,也是为了通过集群机来提供实时的消费。
大数据AI
·
2024-02-01 13:25
大数据从入门到精通
cloudera
kafka
大数据
大数据之Spark
Spark介绍什么是Spark专为大规模数据处理而设计的快速通用的计算引擎类
Hadoop
MapReduce的通用并行计算框架拥有
Hadoop
MapReduce所具有的优点但不同于MapReduce的是Job
进击的-小胖子
·
2024-02-01 12:37
大数据
spark
big
data
scala
大数据
实时大数据
大数据之Spark:Spark大厂面试真题
2.
hadoop
和spark使用场景?3.spark如何保证宕机迅速恢复?4.
hadoop
和spark的相同点和不同点?5.RDD持久化原理?checkpoint检查点机制?
浊酒南街
·
2024-02-01 12:35
大数据系列三
spark
big
data
面试
大数据之 Spark 与
Hadoop
MapReduce 对比
ApacheSpark和Apache
Hadoop
MapReduce是两个广泛用于大数据处理的开源框架,它们在设计目标、性能表现和功能特性上有显著的不同点:执行模型:MapReduce(MR):基于批处理模式
转身成为了码农
·
2024-02-01 12:30
大数据
spark
hadoop
大数据之 Spark Shuffle 和
Hadoop
MapReduce Shuffle的区别
SparkShuffle和
Hadoop
MapReduceShuffle是分布式计算框架中处理中间结果的关键阶段,它们的主要区别在于设计原理、执行效率和资源利用率:
Hadoop
MapReduceShuffleSort-based
转身成为了码农
·
2024-02-01 12:30
大数据
spark
hadoop
spark处理速度为什么比MapReduce快?
官网的这张图下边有一行字:Logisticregressionin
Hadoop
andSpark迭代场景下spark的处理速度大致是
hadoop
的100倍。️
CoreDao
·
2024-02-01 12:29
Spark
spark
hadoop
大数据
mapreduce
机器学习系列——(一)概述
导语:在当今高度数字化和信息化的时代,机器学习作为一项
核心技术
,正日益渗透到我们生活的方方面面。它不仅为我们提供了更智能、更高效的解决方案,还给予了计算机系统从经验中学习和改进的能力。
飞影铠甲
·
2024-02-01 10:42
机器学习
机器学习
人工智能
Hadoop
-MapReduce-源码跟读-ReduceTask阶段篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、Reducer类我们先看下我们写的reduce所继承的
隔着天花板看星星
·
2024-02-01 09:54
hadoop
mapreduce
Hadoop
3.x基础(2)- HDFS
来源:B站尚硅谷目录HDFS概述HDFS产出背景及定义HDFS优缺点HDFS组成架构HDFS文件块大小(面试重点)HDFS的Shell操作(开发重点)基本语法命令大全常用命令实操准备工作上传下载HDFS直接操作HDFS的API操作HDFS的API案例实操HDFS文件上传(测试参数优先级)HDFS文件下载HDFS文件更名和移动HDFS删除文件和目录HDFS文件详情查看HDFS文件和文件夹判断HDFS
魅美
·
2024-02-01 09:22
大数据基础
大数据
hadoop
Hadoop
已死,AI 吞噬世界!
【CSDN编者按】你用上GPT-4了吗?在数据领域,AI正逐步重塑数据处理和分析的各个环节,从ETL、数据治理到数据分析和消费方式均会发生根本性变化。Kyligence联合创始人&CEO,Apache顶级开源项目ApacheKylin的创建者韩卿(Luke.han)将用这篇文章来分享他在AI冲击开源领域之后引发的深度思考,其中涵盖了开源项目的商业化路径、技术变迁对行业格局的影响、AI对数据分析和业
CSDN资讯
·
2024-02-01 09:50
hadoop
人工智能
大数据
分布式
报错:ERROR: org.apache.
hadoop
.hbase.PleaseHoldException: Master is initializing解决方案
错误如图:解决方案:1.输入cd/opt/zookeeper/bin进入zookeeper文件的bin目录下2.输入./zkCli.sh进入客户端3.删除hbase,输入rmr/hbase4.关闭hbase输入stop-hbase.sh如果未能退出,就使用kill-9进程号强制删除5.重新启动start-hbase.sh此时已经可以正常运行6.如果以上操作还是不成功删除hbase在hdfs的存储路
:)คิดถึง
·
2024-02-01 09:35
错误处理
hbase
关于
Hadoop
进行namenode格式化时ERROR conf.Configuration: error parsing conf xxx.xml错误的问题
关于
Hadoop
进行namenode格式化时ERRORconf.Configuration:errorparsingconfxxx.xml错误的问题在配置完core-default.xml,mapred-site.xml
平江路的鱼
·
2024-02-01 09:34
大数据
hadoop
Linux
格式化
错误
大数据
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他