Kafka;Hadoop 第11页

2018-07-19 sqoop

sqoop:数据从传统数据库到到hadoop的导入,导出安装：1.解压2.修改配置文件cdSQOOP_HOME/conf$mvsqoop-env-template.shsqoop-env.sh打开sqoop-env.sh

江江江123·2024-02-12 20:10

【解决方案】pyspark 初次连接mongo 时报错Class not found exception:com.mongodb.spark.sql.DefaultSource

=spark.read.format("com.mongodb.spark.sql.DefaultSource").load() File"/home/cisco/spark-2.4.1-bin-hadoop2

能白话的程序员♫·2024-02-12 19:33

Hadoop分布式系统架构-MapReduce-02

1、MapReduce介绍MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”，适用于大量复杂的任务处理场景（大规模数据处理场景）。Map负责“分”，即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算，彼此间几乎没有依赖关系。Reduce负责“合”，即对map阶段的结果进行全局汇总。MapRedu

一直上上签X·2024-02-12 16:41

（一）Docker 在线部署和离线部署

环境：CentOS7.31.在线部署[root@hadoop004~]#yuminstall-yhttpd[root@hadoop004~]#servicehttpdstartRedirectingto

白面葫芦娃92·2024-02-12 15:51

zk01

zookeeper基础ZooKeeper是一个分布式的，开放源码的分布式应用程序协调服务，是Hadoop和Hbase的重要组件。提供的功能包括：命名服务、配置管理、集群管理、分布式锁、队列管理。

矮肥·2024-02-12 11:41

Structured Streaming

StructuredStreaming和SparkSQL、SparkStreaming关系二、编写StructuredStreaming程序的基本步骤（一）实现步骤（二）运行测试三、输入源（一）File源（二）Kafka

Francek Chen·2024-02-12 11:44

Apache Kafka内核深度剖析

目前来说Kafka已经非常稳定，并且逐步应用更加广泛，已经算不得新生事物，但是不可否认Kafka一枝独秀如同雨后春笋，非常耀眼，今天我们仔细分解一下Kafka，了解一下它的内幕。以下

ThoughtWorks·2024-02-12 10:36

2018-11-16 hadoop3.1完全分布式部署

Hadoop3.1.0完全分布式集群部署，三台服务器部署结构如下github配置文件源码地址Pdsh使用方法http://kumu-linux.github.io/blog/2013/06/19/pdsh

Albert陈凯·2024-02-12 08:20

hadoop-YARN

ApacheHadoopYARN百度百科：https://baike.baidu.com/item/yarn/16075826?

weixin_33736649·2024-02-12 07:44

Hadoop-MapReduce-Yarn集群搭建

通过官网搭建：hadoop.apache.org/docs/r2.6.5/hadoop-project-dist/hadoop-common/SingleCluster.ht

qq_2368521029·2024-02-12 07:44

搭建 Hadoop-3.1.3 HA 集群

本文目录1.集群部署分布规划2.Zookeepr集群安装3.HDFS-HAⅠ.配置core-site.xmlⅡ.配置hdfs-site.xmlⅢ.配置分发4.YARN-HAⅠ.配置yarn-site.xmlⅡ.配置分发4.启动前的配置5.启动HA集群Ⅰ.单独启动Ⅱ.脚本方式启动HA集群6.HA集群测试

扛麻袋的少年·2024-02-12 07:43

Hadoop-HA高可用集群部署

HadoopHAHA概述(1)所谓HA(HighAvailablity),即高可用(7*24小时不中断服务)。(2)实现高可用最关键的策略是消除单点故障。

魔笛Love·2024-02-12 07:13

Hadoop-Yarn-ResourceManagerHA

一、介绍在Hadoop2.4之前，ResourceManager是YARN集群中的单点故障ResourceManagerHA是通过Active/Standby体系结构实现的，在任何时候其中一个RM都是活动的

隔着天花板看星星·2024-02-12 07:42

Hadoop：认识MapReduce

MapReduce是一个用于处理大数据集的编程模型和算法框架。其优势在于能够处理大量的数据，通过并行化来加速计算过程。它适用于那些可以分解为多个独立子任务的计算密集型作业，如文本处理、数据分析和大规模数据集的聚合等。然而，MapReduce也有其局限性，比如对于需要快速迭代的任务或者实时数据处理，MapReduce可能不是最佳选择。总的来说，MapReduce是大数据技术中的一个重要概念，它在Ha

爱写代码的July·2024-02-12 06:41

org.apache.hadoop.fs.ChecksumException: Checksum error: file:/root/test.txt at 0

上传文件到集群遇到以下异常：org.apache.hadoop.fs.ChecksumException:Checksumerror:file:/root/test.txtat0[root@master

橙汁啤酒厂·2024-02-12 05:24

-bash: export: =‘: 不是有效的标识符 -bash: export:

:/opt/hadoop-2.7.3//bin:/opt/jdk1.8.0_131

橙汁啤酒厂·2024-02-12 05:24

HBase集群部署

橙汁啤酒厂·2024-02-12 05:23

Kafka原理浅析

简介kafka是一个分布式消息队列。具有高性能、持久化、多副本备份、横向扩展能力。生产者往队列里写消息，消费者从队列里取消息进行业务逻辑。一般在架构设计中起到解耦、削峰、异步处理的作用。

long_c2b7·2024-02-12 03:45

[1132]Flink与Kafka版本对应关系

以下为Flink和Kafka的版本对照表Flink版本Kafka版本1.12.X2.4.11.11.X2.4.11.10.X2.2.11.9.X2.2.01.8.X2.0.11.7.X2.0.10.10

周小董·2024-02-12 01:47

【Flink】 Flink与Kafka版本对应关系

1.概述转载：Flink与Kafka版本对应关系转载这个主要是上次做flinkkafka版本升级，忘记记录了。

九师兄·2024-02-12 01:17

【Flink异常】flink与kafka版本匹配: NetworkClient$DefaultMetadataUpdater.handleServerDisconnect

文章目录1.异常详情2.报错原因及解决办法3.Flink与Kafka的版本匹配1.异常详情使用flink1.11的kafkaconnector读取0.9版本的kafka报错：[10:49:12:644]

search-lemon·2024-02-12 01:17

Flink Maven项目兼容多版本Kafka

主要有两种方法可以解决：修改jar包内部的包名或者使用自定义classloaderFlink需要导入kafka-clients来支持对kafka的生产和消费。

weixin_30855099·2024-02-12 01:47

zero-copy

zero-copy零拷贝在linux上kafka使用了两种手段实现零拷贝：mmap写入数据阶段sendfile读取数据阶段-其实通过transferTo()调用系统的sendfileOS中的零拷贝在没有

甜甜起司猫_·2024-02-12 01:21

实现订单到期关闭

目录一、被动关闭二、定时任务三、JDK自带的DelayQueue四、Netty的时间轮五、Kafka的时间轮六、RocketMQ延迟消息七、RabbitMQ死信队列八、RabbitMQ插件九、Redis

雾里有果橙·2024-02-11 22:56

clickhouse之表引擎

对于ck来说,目前位置包含了以下部分引擎:1.集成外部系统的表引擎,支持方式有kafka,JDBC,ODBC,HDFS等2.合并树家族(最为常用且重要)3.日志

落花流水i·2024-02-11 22:53

使用clickhouse kafka表引擎消费kafka写入clickhouse

系列文章目录1：seatunnel消费kafka数据写入clickhouse文章目录系列文章目录文章目录前言1.创建kafka引擎表2.创建clickhouseMergeTree表3.创建kafka物化视图写入结构表三

冰帆<·2024-02-11 22:22

Hadoop运行环境搭建

模板虚拟机环境准备1）准备一台模板虚拟机hadoop100，虚拟机配置要求如下：模板虚拟机：内存4G，硬盘50G，安装必要环境，为安装hadoop做准备[root@hadoop100~]#yuminstall-yepel-release

nucty·2024-02-11 18:53

SpringCloud微服务实战——搭建企业级开发框架（三十六）：使用Spring Cloud Stream实现消息中间件功能

在以往消息队列的使用中，我们通常使用集成消息中间件开源包来实现对应功能，而消息中间件的实现又有多种，比如目前比较主流的ActiveMQ、RocketMQ、RabbitMQ、Kafka，Stream等

·2024-02-11 17:42

HBase知识点总结

一、HBase基础HBase是一种建立在Hadoop文件系统之上的分布式、可扩展、支持海量数据存储的NoSQL数据库。HBase是BigTable的开源Java版本。

·2024-02-11 17:17

干货|为什么Kafka不支持读写分离

在Kafka中，生产者写入消息、消费者读取消息的操作都是与leader副本进行交互的，从而实现的是一种主写主读的生产消费模型。

Java机械师·2024-02-11 15:13

Kafka概念和基本架构

1、Kafka介绍Kafka是最初由Linkedin公司开发，是一个分布式、分区的、多副本的、多生产者、多订阅者，基于zookeeper协调的分布式日志系统（也可以当做MQ系统），常见可以用于web/nginx

悠然予夏·2024-02-11 12:38

kafka基础概念分享

一、目录1、MQ基础概念2、Kafka数据存储设计3、Kafka生产者设计4、Kafka消费者设计5、Kafka提交与移位6、Kafka消息保留策略二、MQ概念MQ是messagequeue,消息队列，

小豆腐和小豆浆·2024-02-11 12:38

kafka学习之基本概念

一、kafka常用基本概念producer：生产者，生产并发送消息的一方。consumer：消费者，接收消费消息的一方。topic：一类消息的集合。

侧身左睡·2024-02-11 12:08

Kafka概念类总结

Kafka概念类总结一、kafka定义二、优缺点优点缺点三kafka名词四consumer和topic五Kafka存储结构六Producer分区partition策略七Consumer消费方式partition

吃再多糖也不长胖·2024-02-11 12:38

kafka基本概念

绪论Kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。

L.S.V.·2024-02-11 12:38

Elasticearch和Kafka概念对比

1、概念对比kafka集群包含多个broker，每个broker都是一个kafka实例。每个服务器会有多个broker，我们暂且认为每个服务器包含一个broker。

Yisnow.·2024-02-11 12:37

Kafka概念与安装

一、概念1.kafka主要由Producer、KafkaCluster、Consumer三部分构成2.KafkaCluster一般由多个服务器组成（至少需要2N+1，N>0），每个服务器有一个唯一的broker.id

35s·2024-02-11 12:37

kafka概念详述

【一】kafka基本概述具有发布和订阅消息流，以容错的方式记录消息流，以文件的方式来存储消息流，可以在消息发布的时候进行处理。

种棵红黑树·2024-02-11 12:37

kafka基础概念

简介Kafka是一个分布式、支持分区的（partition）、多副本的（replication）的基于发布/订阅模式的消息队列，主要应用于大数据实时处理领域。

大河院开心鸭·2024-02-11 12:37

Kafka概念图

盗一张图：取自：https://sookocheff.com/post/kafka/kafka-in-a-nutshell/

豪豪君在此·2024-02-11 12:07

Kafka 概念，安装，常用命令（一）

1、什么是KafkaKafka可以看成一个流平台，这个平台上可以发布和订阅数据流，并把他们保存起来，进行处理。

响彻天堂丶·2024-02-11 12:06

Kafka

第一章：Kafka的概述1.1、kafka是一个分布式的基于发布/订阅模型的消息队列，主要用于大数据实时处理领域。

小白鼠捉大猫咪·2024-02-11 12:06

Java面试题之：Kafka 概念

Java面试题之：Kafka概念Kafka概念Kafka概念 Kafka是一种高吞吐量、分布式、基于发布/订阅的消息系统，最初由LinkedIn公司开发，使用Scala语言编写，目前是Apache的开源项目

faramita_of_mine·2024-02-11 12:06

kafka的概念

它是Kafka中用于组织和存储消息的基本单元。一个Topic可以被看作是一个消息发布的地方，生产者将消息发布到一个特定的Topic，而消费者则订阅一个或多个Topic以接收消息。

可爱的小小小狼·2024-02-11 12:35

离线数仓（一）【数仓概念、需求架构】

前言今天开始学习数仓的内容，之前花费一年半的时间已经学完了Hadoop、Hive、Zookeeper、Spark、HBase、Flume、Sqoop、Kafka、Flink等基础组件。

让线程再跑一会·2024-02-11 11:58

使用 Kafka 和 MongoDB 进行 Go 异步处理

我还添加了Kafka为消息层服务，这样微服务就可以异步处理它自己关心的东西了。下面是这个使用了两个微服务的简单的异步处理示例的上层架构图。

跨过山河大海·2024-02-11 11:56

Redis与Kafka达成高并发更新库存与数据一致性保证

一.并发更新方案采用在Redis中判断并更新库存（库存值可增可减），由Redis保证库存的正确性，由Kafka与MongodDB数据库事务保证最终的一致性。

greatsharp·2024-02-11 11:56

消息队列原理和选型：Kafka、RocketMQ 、RabbitMQ 和 ActiveMQ

我有时会问同事，为啥你用RabbitMQ，不用Kafka，或者RocketMQ呢，他给我的回答“因为公司用的就是这个，大家都这么用”，如果你去面试，直接就被Pass，今天这篇文章，告诉你如何回答。

90后小伙追梦之路·2024-02-11 11:56

Kafka&Kafka manager本地搭建

1、brewinstallkafka（kafka依赖zookeeper）：image.png2、启动zookeeper&Kafka：如上述提示：zookeeper-server-start/usr/local

hellokitty小丸子·2024-02-11 10:57

数据采集系统的优化实战

1概述在历时2个月的不断优化过程中，将数据采集系统的处理能力(kafka一个topic)从2.5万提升到了10万，基本符合对下一次峰值的要求了。

易企秀工程师·2024-02-11 10:09

推荐频道

Kafka;Hadoop