flink车联网hbase 第23页

Flink CDC 系列 - 同步 MySQL 分库分表，构建 Iceberg 实时数据湖

▼关注「ApacheFlink」，获取更多技术干货▼摘要：本篇教程将展示如何使用FlinkCDC构建实时数据湖，并处理分库分表合并同步的场景。

Apache Flink·2024-01-17 18:39

【FLINK】Kafka数据源通过Flink-cdc进行实时数据同步

何为FLINK-CDC？

木棉庭·2024-01-17 18:09

Java 实现mysql 同步 flink cdc 做数据收集 demo

**准备环境**java8mysqlflink1.3.5flinkcdc2.2.1数据库创建2张测试表格student、和student1CREATETABLE`student`(`id`int(11)

你是小可爱吗·2024-01-17 18:08

Flink的ListState在小规模场景下的缓存提速和接口优化丰富的实践

实时计算功能，底层是基于Flink，我们在此基础上开发辅助插件和可视化开发运维套件，我们将其称之为SailFlink。

OkGogooXSailboat·2024-01-17 18:36

Aviator表达式扩展--数组、列表负向序号索引以及自己的JSON库支持方括号([])赋值

1.背景笔者开发的大数据大数据平台XSailboat中的DataStudio模块包含基于DAG图的实时计算可视化开发功能，实现了Flink计算任务的可视化开发（想要了解更多，可以查看《Flink的DAG

OkGogooXSailboat·2024-01-17 18:36

关于Flink在一条计算管道中配置流和数据流通过广播方式合流的情形下，无保存点和检查点重跑时，让配置流先行，数据流等延迟几秒再进入合流节点的思考

1.背景笔者带领的团队在自研的大数据平台XSailboat上进行专家策略规则的计算管道开发时，遇到这样一种情形：计算管道中存在一条配置流和数据流通过广播方式合流的情形。配置流和数据流的输入源都是Kafka主题，但是是两个不同的Kafka主题。配置流的Kafka主题中存储的是规则配置，数据流中存储的是要分析的数据。在开发调试的时候，这两个主题中已有数据，一调试运行，数据流先到达被处理，配置流晚到，造

OkGogooXSailboat·2024-01-17 18:36

增加Java对象序列化和反序列化灵活性、适应性的方法

1.背景笔者在进行SailFlink框架开发的时候，涉及大量需要序列化和反序列的类，尤其是各种算子的Function方法。

OkGogooXSailboat·2024-01-17 18:06

本地运行Flink退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法

1.背景在开发大数据平台XSailboat中的查看Flink任务的状态数据工具时，用StateProcessAPI解析保存点数据，将其从HDFS上读取出来再将其解析过后下沉到HDFS以CSV格式保存，然后由其它接口提供对这个文件的分页加载功能

OkGogooXSailboat·2024-01-17 18:05

Flink的Reduce算子，Name-Position形式的Row数据在使用保存点/检查点重新启动的时候，变成了Position-Based形式的Row解决

1.背景大数据平台XSailboat提供了基于ApacheFlink的实时计算管道开发功能。DataStudio的实时计算管道开发功能中提供了分区规约节点(keyBy+reduce)。

OkGogooXSailboat·2024-01-17 18:05

基于大数据平台(XSailboat)的计算管道实现MySQL数据源的CDC同步--flink CDC

1.背景笔者在先前的一篇文档《数据标签设计–大数据平台(XSailboat)的数据标签模块》提到了关于数据标签的模块，现已实现并应用于项目中。在项目中遇到这样一种情形：在业务系统中，对某类对象打了标签，现在需要对这类对象进行过滤并分页查询，支持使用这类对象的属性和所打标签进行过滤。这就出现了一个问题：标签和打标信息是存储在大数据平台的数据库中的，而业务数据是存储在业务系统数据库中的，这是两个数据库

OkGogooXSailboat·2024-01-17 18:05

Windows下HBase的搭建

@[TOC]Windows下HBase的搭建HBase下载与设置（Windows）本人刚刚接触HBase，为了配置HBase，参考了一些博客，按照操作顺序执行后存在一些问题，解决后，得出了有效的步骤，并一定对所有情况都适用

qq_42725437·2024-01-17 17:51

flink1.15消费kafka之checkpoint 二

前言上一篇讲解了checkpoint恢复的流程，以及checkpoint恢复时如何从状态中获取topic、partition，开始offset值，本篇主要如何取到offset值进行消费的。流程Task运行时，首先调用doRun方法：publicvoidrun(){try{doRun();}finally{terminationFuture.complete(executionState);}}pr

zhiyi329·2024-01-17 16:29

2024.1.16 用户画像day01 - 项目介绍

elasticSearch-业务数据源导入-离线指标开发-Flume实时采集-Nginx日志埋点数据-结构化流实时指标-制作报表数仓开发用户画像实时开发hive-spark数据挖掘结构化流-Flume-Kafka-Flink

白白的wj·2024-01-17 15:40

Flink Sql on Zeppelin（2）——维表Join

维表join代码编写之前在讲FlinkSql的时候和大家聊过维表以及如何用FlinkSql来完成维表Join现在带大家看看如何用Zeppelin来实现这个功能首先，我们先引入我们所需的依赖包，目前大家先跟着我这么写

狄杰丶·2024-01-17 15:33

ZooKeeper 原理及其在 Hadoop 和 HBase 中的应用

简介ZooKeeper是一个开源的分布式协调服务，由雅虎创建，是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。基本概念本节将介绍ZooKeeper的几个核心概念。这些概念贯穿于之后对ZooKeeper更深入的讲解，因此有必要预先了解这些概念。集群角色在

Java程序员YY·2024-01-17 15:08

经纬恒润首个国产化4G T-BOX已获客户定点

4GT-BOX,基于4G蜂窝通讯、GNSS卫星定位和车辆总线通信等核心技术，可以为整车客户提供包括行车数据采集、高精度位置信息、车辆故障监控、车辆远程查询和控制（开闭锁、空调控制、发动机启停等）、OTA等丰富的车联网服务

经纬恒润·2024-01-17 15:41

FlinkSQL【分组聚合-多维分析-性能调优】应用实例分析

FlinkSQL处理如下实时数据需求：实时聚合不同类型/账号/发布时间的各个指标数据，比如：初始化/初始化后删除/初始化后取消/推送/成功/失败的指标数据。

PONY LEE·2024-01-17 14:44

sqlserver-＞clickhouse迁移数据

网上看了很多cdc的方案，说实在的，flink也不好弄，主要是驱动。

kaka9·2024-01-17 14:20

【Flink-1.17-教程】-【二】Flink 集群搭建、Flink 部署、Flink 运行模式

【Flink-1.17-教程】-【二】Flink集群搭建、Flink部署、Flink运行模式1）集群角色2）Flink集群搭建2.1.集群启动2.2.向集群提交作业3）部署模式3.1.会话模式（SessionMode

bmyyyyyy·2024-01-17 12:16

StreamX流批一体一站式大数据平台：大数据Flink可视化工具的革命性突破，让你的数据更高效、更直观！

介绍：StreamX，开源的流批一体一站式大数据平台，致力于让Flink开发更简单。它极大地降低了学习成本和开发门槛，使开发者可以专注于最核心的业务。

知识分享小能手·2024-01-17 12:15

Flink旁路输出OutputTag

文章目录前言代码示例1.流复制2.条件分流3.迟到数据分流前言除了由DataStream操作产生的主要流之外，还可以产生任意数量的旁路输出结果流。结果流中的数据类型不必与主要流中的数据类型相匹配，并且不同旁路输出的类型也可以不同。当你需要拆分数据流时，通常必须复制该数据流，然后从每个流中过滤掉不需要的数据。使用旁路输出时，首先需要定义用于标识旁路输出流的OutputTag：//需要使用匿名内部类，

shandongwill·2024-01-17 12:42

Hbase - 自定义Rowkey规则

在Flink中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢，这时候我们就可以定制TableInputFormat来实现我们的需求了，我们还可以采用Flink的DataSet的方式读取

kikiki2·2024-01-17 11:48

Hbase - kerberos认证异常

>之前怎么认证都认证不上，问题找了好了，发现它的异常跟实际操作根本就对不上，死马当活马医，当时也是瞎改才好的，给大家伙记录记录。```KrbException:ServernotfoundinKerberosdatabase(7)-LOOKING_UP_SERVER>>>KdcAccessibility:removestorm1.starsriver.cnatsun.security.krb5.K

kikiki4·2024-01-17 10:29

flink1.15 维表join guava cache和mysql方面优化

优化前mysql响应慢,导致算子中数据输出追不上输入,导致显示cpubusy:100%优化后效果两个图对应两个时刻:----优化前selectl.id,JSON_EXTRACT(r.msg,'$$.key1')asmsgv(selectid,uidfromtb1lwhereid=?)join(selectuid,msgfromtb2)ronl.uid=r.uid;--优化后分两次查询mysql并且

Thomas2143·2024-01-17 08:10

Flink实战之运行架构

本文章：重点是分析清楚运行架构以及并行度与slot的分配1、JobManager和TaskManagerFlink中的节点可以分为JobManager和TaskManager。

core512·2024-01-17 06:16

HBase当中的二级索引的基本介绍

由于HBase的查询比较弱，如果需要实现类似于selectname,salary,count(1),max(salary)fromusergroupbyname,salaryorderbysalary等这样的复杂性的统计需求

临界爵迹·2024-01-17 06:44

HBase的协处理器

1、起源Hbase作为列族数据库最经常被人诟病的特性包括：无法轻易建立“二级索引”，难以执行求和、计数、排序等操作。

临界爵迹·2024-01-17 06:43

HBase三个重要机制

1、flush机制当MemStore达到阈值，将Memstore中的数据Flush进Storefile涉及属性：hbase.hregion.memstore.flush.size：134217728即：

临界爵迹·2024-01-17 06:13

HBase的预分区

1、手动指定预分区hbase(main):001:0>create'staff','info','par

临界爵迹·2024-01-17 06:13

FlinkAPI开发之水位线（Watermark）

案例用到的测试数据请参考文章：Flink自定义Source模拟数据流原文链接：https://blog.csdn.net/m0_52606060/article/details/135436048Flink

Appreciate(欣赏)·2024-01-17 06:08

FlinkAPI开发之处理函数

案例用到的测试数据请参考文章：Flink自定义Source模拟数据流原文链接：https://blog.csdn.net/m0_52606060/article/details/135436048概述之前所介绍的流处理

Appreciate(欣赏)·2024-01-17 06:03

深入理解与应用Flink中的水印机制

在ApacheFlink这一现代大数据处理框架中，对实时流数据的高效、准确处理是一个核心诉求。

临界爵迹·2024-01-17 06:03

HBASE学习四：常用命令汇总梳理

1、服务状态2、问题排查3、运维操作、命令积累#基础判断业务状态命令#自动均衡region命令

Studying！！！·2024-01-17 05:59

kylin集群负载均衡(kylin3,hbaseRIF问题)

hbase历险记目录hbase历险记寻找问题分析原因解决方案方案1（资源问题、失败）方案2（成功）寻找问题不知道你是不是有这样的疑惑。

向他一样rap·2024-01-17 05:52

HBase 基础

HBase基础HBase1.HBase简介1.1HBase定义1.2HBase数据模型1.2.1HBase逻辑结构1.2.2HBase物理存储结构1.2.3数据模型1.3HBase基本架构2.HBase

奇妙的代码·2024-01-17 05:21

【总结】Dinky学习笔记

概述Dinky是一个开箱即用、易扩展，以ApacheFlink为基础，连接OLAP和数据湖等众多框架的一站式实时计算平台，致力于流批一体和湖仓一体的探索与实践官网：Dinky核心特性沉浸式：提供专业的DataStudio

THE WHY·2024-01-17 04:11

Flink启动Yarn Session报错：Couldn‘t deploy Yarn session cluster

Flink版本：1.1.3启动YarnSession的语句：bin/yarn-session.sh-nmtest-d报错截图如下：仅通过ERROR信息只能知道是yarnsession集群未能正常启动，因此继续向下查找

THE WHY·2024-01-17 04:09

HBase集群写入出现大量毛刺排查

一名10年以上大数据架构&研发经验从业者，目前主要从事云原生大数据方向设计，擅长云原生技术、数据架构、数据平台构建、大数据组件性能调优问题现象查看监控，业务请求量正常，但是server端毛刺严重近期在HBase

KubeData·2024-01-17 02:12

Flink实例：状态管理State 过期时间TTL

1State过期时间TTL使用flink进行实时计算中，会遇到一些状态数不断累积，导致状态量越来越大的情形。

大数据供成屎·2024-01-17 01:44

【状态管理｜概述】Flink的状态管理：为什么需要state、怎么保存state、对于state过大怎么处理

roman_日积跬步-终至千里·2024-01-17 01:13

Flink State 状态管理

文章目录前言一、状态分类二、keyed代码示例ListStateMapState总结前言状态在Flink中叫做State，用来保存中间计算结果或者缓存数据。

shandongwill·2024-01-17 01:43

00-初识MySQL

非关系型数据库：MongoDB，Redis，HBase等。MySQL是一个关系型数据库管理系统，是IT界使用

绿色的小苹果·2024-01-16 21:51

Hudi0.14.0最新编译（修订版）

1编译环境Java1.8maven3.9.3hadoop3.3.4hive3.1.3spark3.2.1flink1.16.0hudi0.14.02hudi准备2.1源码$gitclonehttps:/

跟着大数据和AI去旅行·2024-01-16 20:40

Docker安装各种软件

目录一.Nacos二.MySQL5.7三.Tomcat四.Clickhouse五.Redis六.Zookeeper七.Kafka八.Flink九.Fastdfs十.RabbitMQ十一.Elasticsearch

黑暗对我避而远之·2024-01-16 20:37

Alink 使用技巧：如何使用批式 CSV 数据读取？

Alink是基于Flink的机器学习算法平台，欢迎访问Alink的GitHub获取更多信息。本文主要分享Alink的使用技巧之一，如何使用批式CSV进行数据读取。

流计算Alink·2024-01-16 19:39

大数据学习入门到实战教程，精心整理万字长文入门，老奶奶看了都说学会了

换个角度说，大数据是：1、有海量的数据2、有对海量数据进行挖掘的需求3、有对海量数据进行挖掘的软件工具（hadoop、spark、storm、flink、tez

悦悦学Python·2024-01-16 18:10

HBase实践 | HBase TB级数据规模不停机迁移最佳实践

背景有关HBase集群如何做不停服的数据迁移一直都是云HBase被问的比较多的一个问题，目前有许多开源的工具或者HBase本身集成的方案在性能、稳定性、使用体验上都不是很好，因此阿里云提供了BDS迁移服务

王知无(import_bigdata)·2024-01-16 16:38

HBase集群管理

通过之前文章的描述，我们已经有能力设计并部署搭建HBase集群了当我们的HBase集群开始运行的时候，新的挑战又来了例如，我们可能会遇到在集群运行的时候添加或者删除节点又或者需要拷贝/备份整个集群的数据等等如何在集群运行的时候以最小的代价来执行这些操作呢

xiaohei.info·2024-01-16 16:08

《21天晋级大数据实战营》小结汇总

【DAY17】轻松探索数据背后的价值-数据湖探索实验小结点击查看【DAY15】让数据产生价值--数据仓库服务实验小结点击查看【DAY14】机器学习实战-销售预测实验小结点击查看【DAY13】车联网应用之轨迹分析实验小结点击查看

技术火炬手·2024-01-16 12:48

DataX&数据同步（全量）

1.DataX简介1.1DataX概述 DataX是阿里巴巴开源的一个异构数据源离线同步工具，致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP

韩顺平的小迷弟·2024-01-16 11:29

推荐频道

flink车联网hbase

Flink CDC 系列 - 同步 MySQL 分库分表，构建 Iceberg 实时数据湖

【FLINK】Kafka数据源通过Flink-cdc进行实时数据同步

Java 实现mysql 同步 flink cdc 做数据收集 demo

Flink的ListState在小规模场景下的缓存提速和接口优化丰富的实践

Aviator表达式扩展--数组、列表负向序号索引以及自己的JSON库支持方括号([])赋值

关于Flink在一条计算管道中配置流和数据流通过广播方式合流的情形下，无保存点和检查点重跑时，让配置流先行，数据流等延迟几秒再进入合流节点的思考

增加Java对象序列化和反序列化灵活性、适应性的方法

本地运行Flink退出时java.nio.file.DirectoryNotEmptyException、目录没有正常删除解决方法

Flink的Reduce算子，Name-Position形式的Row数据在使用保存点/检查点重新启动的时候，变成了Position-Based形式的Row解决

基于大数据平台(XSailboat)的计算管道实现MySQL数据源的CDC同步--flink CDC

Windows下HBase的搭建

flink1.15消费kafka之checkpoint 二

2024.1.16 用户画像day01 - 项目介绍

Flink Sql on Zeppelin（2）——维表Join

ZooKeeper 原理及其在 Hadoop 和 HBase 中的应用

经纬恒润首个国产化4G T-BOX已获客户定点

FlinkSQL【分组聚合-多维分析-性能调优】应用实例分析

sqlserver-＞clickhouse迁移数据

【Flink-1.17-教程】-【二】Flink 集群搭建、Flink 部署、Flink 运行模式

StreamX流批一体一站式大数据平台：大数据Flink可视化工具的革命性突破，让你的数据更高效、更直观！

Flink旁路输出OutputTag

Hbase - 自定义Rowkey规则

Hbase - kerberos认证异常

flink1.15 维表join guava cache和mysql方面优化

Flink实战之运行架构

HBase当中的二级索引的基本介绍

HBase的协处理器

HBase三个重要机制

HBase的预分区

FlinkAPI开发之水位线（Watermark）

FlinkAPI开发之处理函数

深入理解与应用Flink中的水印机制

HBASE学习四：常用命令汇总梳理

kylin集群负载均衡(kylin3,hbaseRIF问题)

HBase 基础

【总结】Dinky学习笔记

Flink启动Yarn Session报错：Couldn‘t deploy Yarn session cluster

HBase集群写入出现大量毛刺排查

Flink实例：状态管理State 过期时间TTL

【状态管理｜概述】Flink的状态管理：为什么需要state、怎么保存state、对于state过大怎么处理

Flink State 状态管理

00-初识MySQL

Hudi0.14.0最新编译（修订版）

Docker安装各种软件

Alink 使用技巧：如何使用批式 CSV 数据读取？

大数据学习入门到实战教程，精心整理万字长文入门，老奶奶看了都说学会了

HBase实践 | HBase TB级数据规模不停机迁移最佳实践

HBase集群管理

《21天晋级大数据实战营》小结汇总

DataX&数据同步（全量）