E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Kafka;Hadoop
2018-07-19 sqoop
sqoop:数据从传统数据库到到
hadoop
的导入,导出安装:1.解压2.修改配置文件cdSQOOP_HOME/conf$mvsqoop-env-template.shsqoop-env.sh打开sqoop-env.sh
江江江123
·
2024-02-12 20:10
【解决方案】pyspark 初次连接mongo 时报错Class not found exception:com.mongodb.spark.sql.DefaultSource
=spark.read.format("com.mongodb.spark.sql.DefaultSource").load() File"/home/cisco/spark-2.4.1-bin-
hadoop
2
能白话的程序员♫
·
2024-02-12 19:33
Spark
spark
Hadoop
分布式系统架构-MapReduce-02
1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算,彼此间几乎没有依赖关系。Reduce负责“合”,即对map阶段的结果进行全局汇总。MapRedu
一直上上签X
·
2024-02-12 16:41
(一)Docker 在线部署和离线部署
环境:CentOS7.31.在线部署[root@
hadoop
004~]#yuminstall-yhttpd[root@
hadoop
004~]#servicehttpdstartRedirectingto
白面葫芦娃92
·
2024-02-12 15:51
zk01
zookeeper基础ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是
Hadoop
和Hbase的重要组件。提供的功能包括:命名服务、配置管理、集群管理、分布式锁、队列管理。
矮肥
·
2024-02-12 11:41
Structured Streaming
StructuredStreaming和SparkSQL、SparkStreaming关系二、编写StructuredStreaming程序的基本步骤(一)实现步骤(二)运行测试三、输入源(一)File源(二)
Kafka
Francek Chen
·
2024-02-12 11:44
Spark编程基础
spark
zookeeper
kafka
Structured
Streaming
Apache
Kafka
内核深度剖析
目前来说
Kafka
已经非常稳定,并且逐步应用更加广泛,已经算不得新生事物,但是不可否认
Kafka
一枝独秀如同雨后春笋,非常耀眼,今天我们仔细分解一下
Kafka
,了解一下它的内幕。以下
ThoughtWorks
·
2024-02-12 10:36
2018-11-16
hadoop
3.1完全分布式部署
Hadoop
3.1.0完全分布式集群部署,三台服务器部署结构如下github配置文件源码地址Pdsh使用方法http://kumu-linux.github.io/blog/2013/06/19/pdsh
Albert陈凯
·
2024-02-12 08:20
hadoop
-YARN
Apache
Hadoop
YARN百度百科:https://baike.baidu.com/item/yarn/16075826?
weixin_33736649
·
2024-02-12 07:44
大数据
Hadoop
-MapReduce-Yarn集群搭建
通过官网搭建:
hadoop
.apache.org/docs/r2.6.5/
hadoop
-project-dist/
hadoop
-common/SingleCluster.ht
qq_2368521029
·
2024-02-12 07:44
搭建
Hadoop
-3.1.3 HA 集群
本文目录1.集群部署分布规划2.Zookeepr集群安装3.HDFS-HAⅠ.配置core-site.xmlⅡ.配置hdfs-site.xmlⅢ.配置分发4.YARN-HAⅠ.配置yarn-site.xmlⅡ.配置分发4.启动前的配置5.启动HA集群Ⅰ.单独启动Ⅱ.脚本方式启动HA集群6.HA集群测试
扛麻袋的少年
·
2024-02-12 07:43
#
Hadoop
hadoop
hdfs
大数据
Hadoop
-HA高可用集群部署
Hadoop
HAHA概述(1)所谓HA(HighAvailablity),即高可用(7*24小时不中断服务)。(2)实现高可用最关键的策略是消除单点故障。
魔笛Love
·
2024-02-12 07:13
hadoop
hdfs
big
data
Hadoop
-Yarn-ResourceManagerHA
一、介绍在
Hadoop
2.4之前,ResourceManager是YARN集群中的单点故障ResourceManagerHA是通过Active/Standby体系结构实现的,在任何时候其中一个RM都是活动的
隔着天花板看星星
·
2024-02-12 07:42
hadoop
大数据
分布式
Hadoop
:认识MapReduce
MapReduce是一个用于处理大数据集的编程模型和算法框架。其优势在于能够处理大量的数据,通过并行化来加速计算过程。它适用于那些可以分解为多个独立子任务的计算密集型作业,如文本处理、数据分析和大规模数据集的聚合等。然而,MapReduce也有其局限性,比如对于需要快速迭代的任务或者实时数据处理,MapReduce可能不是最佳选择。总的来说,MapReduce是大数据技术中的一个重要概念,它在Ha
爱写代码的July
·
2024-02-12 06:41
大数据与云计算
hadoop
mapreduce
大数据
org.apache.
hadoop
.fs.ChecksumException: Checksum error: file:/root/test.txt at 0
上传文件到集群遇到以下异常:org.apache.
hadoop
.fs.ChecksumException:Checksumerror:file:/root/test.txtat0[root@master
橙汁啤酒厂
·
2024-02-12 05:24
hadoop
大数据
-bash: export: =‘: 不是有效的标识符 -bash: export:
:/opt/
hadoop
-2.7.3//bin:/opt/jdk1.8.0_131
橙汁啤酒厂
·
2024-02-12 05:24
linux操作时遇到的相关问题
bash
开发语言
HBase集群部署
1.HBase安装相关版本:
Hadoop
:2.7.3hbase:1.3.1hbase相关版本下载安装HBase需要安装hbase-1.3.1-bin.tar.gz软件包,下载并解压到/opt目录下2.HBase
橙汁啤酒厂
·
2024-02-12 05:23
大数据
hbase
数据库
大数据
hadoop
Kafka
原理浅析
简介
kafka
是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息,消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。
long_c2b7
·
2024-02-12 03:45
[1132]Flink与
Kafka
版本对应关系
以下为Flink和
Kafka
的版本对照表Flink版本
Kafka
版本1.12.X2.4.11.11.X2.4.11.10.X2.2.11.9.X2.2.01.8.X2.0.11.7.X2.0.10.10
周小董
·
2024-02-12 01:47
Java技术栈
flink
【Flink】 Flink与
Kafka
版本对应关系
1.概述转载:Flink与
Kafka
版本对应关系转载这个主要是上次做flink
kafka
版本升级,忘记记录了。
九师兄
·
2024-02-12 01:17
大数据-flink
【Flink异常】flink与
kafka
版本匹配: NetworkClient$DefaultMetadataUpdater.handleServerDisconnect
文章目录1.异常详情2.报错原因及解决办法3.Flink与
Kafka
的版本匹配1.异常详情使用flink1.11的
kafka
connector读取0.9版本的
kafka
报错:[10:49:12:644]
search-lemon
·
2024-02-12 01:17
Flink
flink
Flink Maven项目兼容多版本
Kafka
主要有两种方法可以解决:修改jar包内部的包名或者使用自定义classloaderFlink需要导入
kafka
-clients来支持对
kafka
的生产和消费。
weixin_30855099
·
2024-02-12 01:47
大数据
java
scala
zero-copy
zero-copy零拷贝在linux上
kafka
使用了两种手段实现零拷贝:mmap写入数据阶段sendfile读取数据阶段-其实通过transferTo()调用系统的sendfileOS中的零拷贝在没有
甜甜起司猫_
·
2024-02-12 01:21
实现订单到期关闭
目录一、被动关闭二、定时任务三、JDK自带的DelayQueue四、Netty的时间轮五、
Kafka
的时间轮六、RocketMQ延迟消息七、RabbitMQ死信队列八、RabbitMQ插件九、Redis
雾里有果橙
·
2024-02-11 22:56
rabbitmq
分布式
clickhouse之表引擎
对于ck来说,目前位置包含了以下部分引擎:1.集成外部系统的表引擎,支持方式有
kafka
,JDBC,ODBC,HDFS等2.合并树家族(最为常用且重要)3.日志
落花流水i
·
2024-02-11 22:53
ClickHouse
使用clickhouse
kafka
表引擎消费
kafka
写入clickhouse
系列文章目录1:seatunnel消费
kafka
数据写入clickhouse文章目录系列文章目录文章目录前言1.创建
kafka
引擎表2.创建clickhouseMergeTree表3.创建
kafka
物化视图写入结构表三
冰帆<
·
2024-02-11 22:22
大数据
seatunel
消息中间件
clickhouse
python
开发语言
Hadoop
运行环境搭建
模板虚拟机环境准备1)准备一台模板虚拟机
hadoop
100,虚拟机配置要求如下:模板虚拟机:内存4G,硬盘50G,安装必要环境,为安装
hadoop
做准备[root@
hadoop
100~]#yuminstall-yepel-release
nucty
·
2024-02-11 18:53
大数据
hadoop
大数据
SpringCloud微服务实战——搭建企业级开发框架(三十六):使用Spring Cloud Stream实现消息中间件功能
在以往消息队列的使用中,我们通常使用集成消息中间件开源包来实现对应功能,而消息中间件的实现又有多种,比如目前比较主流的ActiveMQ、RocketMQ、RabbitMQ、
Kafka
,Stream等
·
2024-02-11 17:42
HBase知识点总结
一、HBase基础HBase是一种建立在
Hadoop
文件系统之上的分布式、可扩展、支持海量数据存储的NoSQL数据库。HBase是BigTable的开源Java版本。
·
2024-02-11 17:17
hbase大数据数据库
干货|为什么
Kafka
不支持读写分离
在
Kafka
中,生产者写入消息、消费者读取消息的操作都是与leader副本进行交互的,从而实现的是一种主写主读的生产消费模型。
Java机械师
·
2024-02-11 15:13
Kafka
概念和基本架构
1、
Kafka
介绍
Kafka
是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多生产者、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx
悠然予夏
·
2024-02-11 12:38
消息队列
架构
java
Kafaka
kafka
基础概念分享
一、目录1、MQ基础概念2、
Kafka
数据存储设计3、
Kafka
生产者设计4、
Kafka
消费者设计5、
Kafka
提交与移位6、
Kafka
消息保留策略二、MQ概念MQ是messagequeue,消息队列,
小豆腐和小豆浆
·
2024-02-11 12:38
kafka
java
分布式
kafka
学习之基本概念
一、
kafka
常用基本概念producer:生产者,生产并发送消息的一方。consumer:消费者,接收消费消息的一方。topic:一类消息的集合。
侧身左睡
·
2024-02-11 12:08
kafka
kafka
学习记录
Kafka
概念类总结
Kafka
概念类总结一、
kafka
定义二、优缺点优点缺点三
kafka
名词四consumer和topic五
Kafka
存储结构六Producer分区partition策略七Consumer消费方式partition
吃再多糖也不长胖
·
2024-02-11 12:38
kafka
kafka
java
分布式
kafka
基本概念
绪论
Kafka
是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。
L.S.V.
·
2024-02-11 12:38
kafka
java
Elasticearch和
Kafka
概念对比
1、概念对比
kafka
集群包含多个broker,每个broker都是一个
kafka
实例。每个服务器会有多个broker,我们暂且认为每个服务器包含一个broker。
Yisnow.
·
2024-02-11 12:37
框架
kafka
elasticsearch
es
Kafka
概念与安装
一、概念1.
kafka
主要由Producer、
Kafka
Cluster、Consumer三部分构成2.
Kafka
Cluster一般由多个服务器组成(至少需要2N+1,N>0),每个服务器有一个唯一的broker.id
35s
·
2024-02-11 12:37
Kafka
kafka
kafka
概念详述
【一】
kafka
基本概述具有发布和订阅消息流,以容错的方式记录消息流,以文件的方式来存储消息流,可以在消息发布的时候进行处理。
种棵红黑树
·
2024-02-11 12:37
消息组件
kafka
kafka
基础概念
简介
Kafka
是一个分布式、支持分区的(partition)、多副本的(replication)的基于发布/订阅模式的消息队列,主要应用于大数据实时处理领域。
大河院开心鸭
·
2024-02-11 12:37
kafka
kafka
分布式
java
Kafka
概念图
盗一张图:取自:https://sookocheff.com/post/
kafka
/
kafka
-in-a-nutshell/
豪豪君在此
·
2024-02-11 12:07
我爱kafka
kafka爱我
Kafka
概念,安装,常用命令(一)
1、什么是
Kafka
Kafka
可以看成一个流平台,这个平台上可以发布和订阅数据流,并把他们保存起来,进行处理。
响彻天堂丶
·
2024-02-11 12:06
kafka入门
kafka
Kafka
第一章:
Kafka
的概述1.1、
kafka
是一个分布式的基于发布/订阅模型的消息队列,主要用于大数据实时处理领域。
小白鼠捉大猫咪
·
2024-02-11 12:06
java
kafka
java
Java面试题之:
Kafka
概念
Java面试题之:
Kafka
概念
Kafka
概念
Kafka
概念
Kafka
是一种高吞吐量、分布式、基于发布/订阅的消息系统,最初由LinkedIn公司开发,使用Scala语言编写,目前是Apache的开源项目
faramita_of_mine
·
2024-02-11 12:06
The
interview
questions
kafka
java
分布式
面试题
kafka
的概念
它是
Kafka
中用于组织和存储消息的基本单元。一个Topic可以被看作是一个消息发布的地方,生产者将消息发布到一个特定的Topic,而消费者则订阅一个或多个Topic以接收消息。
可爱的小小小狼
·
2024-02-11 12:35
kafka
kafka
分布式
离线数仓(一)【数仓概念、需求架构】
前言今天开始学习数仓的内容,之前花费一年半的时间已经学完了
Hadoop
、Hive、Zookeeper、Spark、HBase、Flume、Sqoop、
Kafka
、Flink等基础组件。
让线程再跑一会
·
2024-02-11 11:58
离线数仓
大数据
使用
Kafka
和 MongoDB 进行 Go 异步处理
我还添加了
Kafka
为消息层服务,这样微服务就可以异步处理它自己关心的东西了。下面是这个使用了两个微服务的简单的异步处理示例的上层架构图。
跨过山河大海
·
2024-02-11 11:56
Redis与
Kafka
达成高并发更新库存与数据一致性保证
一.并发更新方案采用在Redis中判断并更新库存(库存值可增可减),由Redis保证库存的正确性,由
Kafka
与MongodDB数据库事务保证最终的一致性。
greatsharp
·
2024-02-11 11:56
分布式
Redis
高并发
分布式
kafka
redis
消息队列原理和选型:
Kafka
、RocketMQ 、RabbitMQ 和 ActiveMQ
我有时会问同事,为啥你用RabbitMQ,不用
Kafka
,或者RocketMQ呢,他给我的回答“因为公司用的就是这个,大家都这么用”,如果你去面试,直接就被Pass,今天这篇文章,告诉你如何回答。
90后小伙追梦之路
·
2024-02-11 11:56
架构
java
面试
kafka
java-rabbitmq
java-activemq
java
redis
Kafka
&
Kafka
manager本地搭建
1、brewinstall
kafka
(
kafka
依赖zookeeper):image.png2、启动zookeeper&
Kafka
:如上述提示:zookeeper-server-start/usr/local
hellokitty小丸子
·
2024-02-11 10:57
数据采集系统的优化实战
1概述在历时2个月的不断优化过程中,将数据采集系统的处理能力(
kafka
一个topic)从2.5万提升到了10万,基本符合对下一次峰值的要求了。
易企秀工程师
·
2024-02-11 10:09
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他