E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop海量数据
Hive中分区表与分桶表的操作
目录分区表一级分区表知识点示例多级分区知识点示例分区表的操作示例
hadoop
_hive文档分桶表重要参数基础分桶表知识点示例分桶表排序知识点示例分桶原理分区表和分桶表区别分区表分区表特点/好处:需要产生分区目录
Sisi525693
·
2024-02-05 10:26
hive
hadoop
数据仓库
[
Hadoop
]万字长文
Hadoop
相关优化和问题排查总结
namenode优化namenode内存生产配置NameNode心跳并发配置开启回收站配置datanode的优化hdfs调优
hadoop
的优化YARN的优化HDFS调优的基本原则HDFS调优的常用参数排查哪个任务的
王一1995
·
2024-02-05 10:55
hadoop
jvm
java
Hive drop 事务表 报错 flushing changes to datastore
-2802:13:01][08S01][1]Errorwhileprocessingstatement:FAILED:ExecutionError,returncode1fromorg.apache.
hadoop
.hive.ql.exec.DDLTask.MetaException
AdamShyly
·
2024-02-05 10:54
Hive
踩过的坑
hive
Hadoop
3.x单机安装教程
为什么要搭建单机环境的
Hadoop
?
文景大大
·
2024-02-05 10:06
大数据 - Spark系列《三》- 加载各种数据源创建RDD
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客目录3.1
王哪跑nn
·
2024-02-05 09:28
spark
大数据
spark
分布式
大数据原理-Spark
概述:基于内存计算三大分布式计算系统:
Hadoop
、Spark、Storm特点:采用有向无环图DAG作业调度运行速度快循环数据流容易使用:可以通过SparkShell交互式编程用途:SQL查询、流式计算
monster++
·
2024-02-05 09:28
大数据原理
分布式
编程语言
分布式计算
hadoop
spark
大数据 - Spark系列《四》- Spark分布式运行原理
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-05 08:54
spark
大数据
分布式
spark
Hadoop
执行WorldCount出现的问题和解决
failedonconnectionexception:java.net.ConnectException:Connectionrefused;Formoredetailssee:http://wiki.apache.org/
hadoop
SZHjy
·
2024-02-05 08:38
大数据
hadoop
大数据
2.0
Hadoop
运行环境
由于
Hadoop
是为集群设计的软件,所以我们在学习它的使用时难免会遇到在多台计算机上配置
Hadoop
的情况,这对于学习者来说会制造诸多障碍,主要有两个:昂贵的计算机集群。
二当家的素材网
·
2024-02-05 07:01
Hadoop
教程
hadoop
大数据
分布式
impala与kudu进行集成
文章目录概要Kudu与Impala整合配置Impala内部表Impala外部表Impalasql操作kuduImpalajdbc操作表如果使用了
Hadoop
使用了Kerberos认证,可使用如下方式进行连接
shandongwill
·
2024-02-05 07:44
大数据
impala
kudu
impala与kudu集成
1.0
Hadoop
教程
Hadoop
是一个开源的分布式计算和存储框架,由Apache基金会开发和维护。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
3.0
Hadoop
概念
本章着重介绍
Hadoop
中的概念和组成部分,属于理论章节。如果你比较着急可以跳过。但作者不建议跳过,因为它与后面的章节息息相关。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
基于
hadoop
+spark的大规模日志的一种处理方案
而且CDN上的访问日志一般都非常大,需要用大数据处理架构来进行处理,本文描述了一种利用
hadoop
+spark来处理大量CDN日志的方法,当然本方
码农心语
·
2024-02-05 06:36
日志处理
大规模
大数据
hadoop
spark
cdn
人类与AI的优势互补
具体而言:大数据处理与分析:AI拥有强大的数据处理能力,可以在短时间内对
海量数据
进行挖掘和学习,发现其中隐藏的规律、趋势和关联性,这对于商业智能、科研探索以及预测模型构建等领域具有重大价值。
科学禅道
·
2024-02-05 06:16
人工智能的未来
人工智能
布隆过滤器(BloomFilter)原理及如何实现(使用Redis的bitmap数据结构)
1、简介在
海量数据
下判断某个值是否存在时,如果使用匹配方式是非常耗时耗力的,因此布隆过滤器因此而生,布隆过滤器可以从
海量数据
中判断某个值是否存在,但是有一定的误差。
知其_所以然
·
2024-02-05 03:25
java技术
Redis
BloomFilter
BloomFilter
linux中如何输入控制字符
看以下实例:以下文本中的字段用^A分隔,[leo@
hadoop
orgplan]$sed"s/^A//g"orgplan一定要注意^并不是数字键6上的
发狂的蜗牛
·
2024-02-05 01:47
linux
运维
服务器
2021-11-08
习近平总书记在主持学习时强调,要站在统筹中华民族伟大复兴战略全局和世界百年未有之大变局的高度,统筹国内国际两个大局、发展安全两件大事,充分发挥
海量数据
和丰富应用场景优势,促进数字技术与实体经济深度融合,
summertrain
·
2024-02-05 01:21
【数据结构 09】哈希
哈希运算常用于加密、位图、布隆过滤,位图的作用是
海量数据
的标记,布隆过滤器的作用是提高
海量数据
查询的效率(客户端向服务端查询数据)。一、哈希函数Ha
AllinTome
·
2024-02-05 00:28
数据结构
哈希算法
数据结构
算法
[Java并发]-----第2章 并发编程的其他基础知识
为什么要进行多线程并发编程(废话)多核CPU时代的到来打破了单核CPU对多线程效能的限制.对多个CPU意味着每个线程可以使用自己的CPU运行,这减少了线程上下文切换的开销,但随着对应用系统性能和吞吐量要求的提高,出现了处理
海量数据
和请求的要求
Benjamin_Lee
·
2024-02-04 23:07
HBase相关面试准备问题
为什么选择HBase1、海量存储Hbase适合存储PB级别的
海量数据
,在PB级别的数,能在几十到几百毫秒内返回数据。这与Hbase的极易扩展性息息相关。
大数据左右手
·
2024-02-04 22:21
大数据
面试
大数据
Flink1.18.0集成Yarn-session模式部署
上次部署了
Hadoop
集群
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager
china-zhz
·
2024-02-04 21:34
flink
yarn
hadoop
大数据
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、
Hadoop
部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件
china-zhz
·
2024-02-04 21:33
hdfs
mapreduce
hadoop
yarn
深入解析Elasticsearch的内部数据结构和机制:行存储、列存储与倒排索引之行存(一)
它之所以能够在
海量数据
中实现毫秒级的搜索响应,以及灵活的数据分析,要归功于其内部精妙的数据结构和机制。
地瓜伯伯
·
2024-02-04 21:49
工具
elasticsearch
java
spring
spring
cloud
企业级大数据安全架构(九)FreeIPA管理员密码忘记后如何修改
作者:楼高1重置DirectoryServer管理员密码1.1停止directoryserver服务[root@ipaschema]#start-dirsrvHDP-
HADOOP
如果你不知道你的实例名,
云掣YUNCHE
·
2024-02-04 20:36
企业级大数据安全架构
大数据
安全架构
安全
Hadoop
集群搭建
搭建
Hadoop
集群涉及多个步骤,包括准备硬件环境、安装和配置
Hadoop
以及验证集群的安装。
终将老去的穷苦程序员
·
2024-02-04 19:53
hadoop
HDFS常用命令
hdfsdfs-putwc.input/user/anna/input查看上传的文件是否正确bin/hdfsdfs-cat/user/anna/input/wc.input运行mapreduce程序bin/
hadoop
jarshar
须臾之北
·
2024-02-04 18:41
Fink CDC数据同步(六)数据入湖Hudi
数据入湖HudiApacheHudi(简称:Hudi)使得您能在
hadoop
兼容的存储之上存储大量数据,同时它还提供两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。
大数据_苡~
·
2024-02-04 16:21
flink
hadoop
【C++干货铺】哈希结构的应用:位图 | 布隆过滤器 |
海量数据
处理
目录位图位图的概念位图的实现位图的应用布隆过滤器布隆过滤器的提出布隆过滤器的概念布隆过滤器的插入布隆过滤器的查找布隆过滤器的删除布隆过滤器的优点布隆过滤器的缺陷哈希切分位图位图的概念一道面试题给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中。【腾讯】解决方案:从头到尾遍历这40亿个数。时间复杂度排序()+二分查找其实这里最大的问题是这40亿个整数将近
小白不是程序媛
·
2024-02-04 16:33
C++干货铺
哈希算法
算法
布隆过滤器
哈希切割
c++
学习
海量数据
处理商用短链接生成器平台 - 2
第二章短链平台项目创建+git代码管理+开发分层规范第1集短链平台实战-Maven聚合工程创建微服务项目**简介:Maven聚合工程创建微服务项目实战**Maven聚合工程拆分dcloud-common公共依赖包dcloud-appFlink+Kafka实时计算dcloud-account账号+流量包微服务dcloud-data数据可视化微服务dcloud-gateway业务网关dcloud-li
从零开始学习人工智能
·
2024-02-04 15:52
java
spring
boot
spring
cloud
java-ee
dubbo
2021-03-07
走进Java世界大家应该都接触过计算机,计算机俗称“电脑”,是能够按照程序运行的,自动、高速处理
海量数据
的现代化智能电子设备。
比小白还小白的JAVA开发者
·
2024-02-04 15:19
海量数据
处理商用短链接生成器平台
第一章
海量数据
处理商用短链接生成器平台介绍第1集什么是短链接生成器短链接生成器是一种工具,可以将较长的链接转换成较短的链接。这种工具在许多场景中都很有用,包括营销、社交媒体分享和数据报告等。
从零开始学习人工智能
·
2024-02-04 15:19
java开发
eclipse
java
hibernate
spring
maven
kafka
spring
boot
如何解决“
hadoop
:未找到命令”?
原因是未将
hadoop
命令添加至执行路径。
听风347
·
2024-02-04 15:17
eclipse
hadoop
大数据
做大数据需要学习哪些东西啊
Linux:因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解
hadoop
、hi
kuntoria
·
2024-02-04 14:02
大数据技术未来发展前景及趋势分析
Storm加速了流数据处理的过程,为
Hadoop
批处理提供实时数据处理。Spark:Spark是一个兼容
Hadoop
数据源的内存数据处理平台,运行速度相比于
Hadoop
MapReduce更快。
丨程序之道丨
·
2024-02-04 12:54
django基于
Hadoop
的小额信贷平台系统(程序+开题)
本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取系统程序文件列表开题报告内容研究背景:随着互联网技术的快速发展,小额信贷平台系统在金融领域得到了广泛应用。传统的小额信贷模式存在信息不对称、审批流程繁琐等问题,而小额信贷平台系统通过整合用户、银行和信贷公示等多方资源,实现了借款申请、撤销借款以及用户信用分等功能,为用户提供了更加便捷和高效的金融服务。意义:小额信贷平台系
liu10662
·
2024-02-04 12:36
django
python
后端
kafka自定义分区策略详解
Kafka作为一种高性能、可扩展的消息队列系统,在处理
海量数据
和高并发场景下表现出色。而针对Kafka消息的分区选择,则可以通过自定义分区器来实现。
啄sir.
·
2024-02-04 11:01
kafka
分布式
java
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki4
·
2024-02-04 11:08
Ranger-Yarn插件安装
登陆hdfs安装的用户,garrison/zdh1234(用户组
hadoop
),获取安装包解压安装scp/home/backup/ranger/ranger-0.6.0-yarn-plugin.tar.gz.tar–zxvfr
木木与呆呆
·
2024-02-04 10:22
Hadoop
详解
架构设计NameNodeNameNode:文件系统的命名空间(面试题)1.文件名称2.文件目录结构3.文件的属性(权限创建时间副本数)4.文件对应哪些数据块-->数据块对应哪些分布在哪些DN节点上列表不会持久化存储这个映射关系,是通过集群的启动和运行时,DataNode定期发送blockReport给NameNode,以此NameNode在【内存】中动态维护这种映射关系。作用:管理文件系统的命名空
ly稻草
·
2024-02-04 09:34
Hadoop
3.x基础(3)- Yarn
来源:B站尚硅谷目录Yarn资源调度器Yarn基础架构Yarn工作机制作业提交全过程Yarn调度器和调度算法先进先出调度器(FIFO)容量调度器(CapacityScheduler)公平调度器(FairScheduler)Yarn常用命令yarnapplication查看任务yarnlogs查看日志yarnapplicationattempt查看尝试运行的任务yarncontainer查看容器ya
魅美
·
2024-02-04 09:36
大数据基础
大数据
hadoop
转载-58同城离线计算平台设计与实践
58同城离线计算平台设计与实践编者荐语:58离线计算平台基于
Hadoop
生态体系打造,单集群4000+台服务器,数百PB存储,日40万计算任务,面临挑战极大。
无色的叶
·
2024-02-04 09:14
【数据结构 10】位图
一、位图在
海量数据
的标记的时候,比如数十亿上百亿上千亿的数据,我们要统计数据是否出现,直接存储数据的话对内存的消耗太大了,这时我们可以通过位图来标记出现过的数据,位图可以标记0~42亿之间的整型数据,我们也可通过复用多个位图实现统计数据出现的次数
AllinTome
·
2024-02-04 07:36
数据结构
数据结构
c++
算法
完结,从零开始学python(十八)想成为一名APP逆向工程师,需要掌握那些技术点?
我们来简单的回顾一下内容1.编程语法语法编程并发编程网络编程多线程/多进程/协程数据库编程MySQLRedisMongoDB2.机器学习3.全栈开发4.数据分析Numpy+pandas+Matplotlib
Hadoop
Spark5
爬完虫变成龙
·
2024-02-04 07:52
python
python开发
APP逆向
python
开发语言
python爬虫
python开发
java
APP逆向
NDK
Hive 主要内容一览
Hadoop
使用HDFS进行存储,使
大数据左右手
·
2024-02-04 07:13
Hive
大数据
面试
大数据
大数据本地环境搭建03-Spark搭建
需要提前部署好Zookeeper/
Hadoop
/Hive环境1Local模式1.1上传压缩包下载链接链接:https://pan.baidu.com/s/1rLq39ddxh7np7JKiuRAhDA?
OnePandas
·
2024-02-04 06:31
Spark
大数据集群环境搭建
大数据
spark
分布式
Hadoop
大数据实战系列文章之Hive
hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据可以将
测试帮日记
·
2024-02-04 05:45
spark运维问题记录
环境:spark-2.1.0-bin-
hadoop
2.71.Spark启动警告:neitherspark.yarn.jarsnotspark.yarn.archiveisset,fallingbacktouploadinglibrariesunderSPARK_HOME
lishengping_max
·
2024-02-04 05:11
Spark
spark
解决“Spark context stopped while waiting for backend“ issue
在配置为4C16G的虚拟机上安装
hadoop
生态全家桶,在安装Spark2,使用了社区版2.3的版本。
江畔独步
·
2024-02-04 05:10
Spark
bigdata
大数据组件部署下载链接
Hadoop
2.7下载连接:https://archive.apache.org/dist/
hadoop
/core/
hadoop
-2.7.6/Hive2.3.2下载连接:http://archive.apache.org
运维道上奔跑者
·
2024-02-04 05:13
大数据
zookeeper
hbase
kafka
hadoop
hive
【大数据开发运维解决方案】
Hadoop
+Hive+HBase+Kylin 伪分布式安装指南
Hadoop
2.7.6+Mysql5.7+Hive2.3.2+Hbase1.4.9+Kylin2.4单机伪分布式安装文档注意:######################################
运维道上奔跑者
·
2024-02-04 05:43
大数据
hadoop
分布式
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他