小晨说数据

2020年最新大数据面试题，你都会吗？

关注公众号“小晨说数据”，一起学习，一起进步！

1.阐述 Flink 如何处理反压，相比 Storm，Spark Streaming 提供的反压机制，描述其实现有什么不同？

2.阐述流处理引擎提供的三种数据处理语义，解释 Flink Checkpoint 机制如何保证 Flink 程序结果的 Exactly-Once 语义，描述如何通过两阶段提交协议提供端到端的 Exactly-Once 保证？结合 Kafka 如何构建端到端的 Exactly-Once 处理？

3.阐述 Flink 提供的容错机制，解释分布式快照 Chandy Lamport 算法逻辑，剖析 Flink Checkpoint 具体实现流程？

4.如何处理 Flink 作业频繁重启问题？

5.如何优化大状态的 Flink 作业？

6.如何排查 Flink Checkpoint 超时问题？

7.如何处理 Flink 作业中的数据倾斜问题？

8.Flink 反压机制，如何排查反压瓶颈在哪，及如何处理反压问题？

9.哪种 join 可以满足单个流断流的时候仍然能够保证正确的 join 到数据？

10.watermark 是怎么生成和传递的？

1、怎么定位数据倾斜，真实场景！

2、多个shuffle算子怎么确定那个算子产生的数据倾斜

3、作业的监控我的作业正常10000条，一会变成3条了。怎么处理！谁监控

4、SparkStreaming 消费 kafka 保证数据不丢失不重复(在redis和mysql中保存时间戳，判断redis时间戳 mysql时间戳。假如redis挂了，程序启动判断mysql的时间戳是否比redis时间戳大时间戳大的数据删掉。)

5、hashMap怎么存储数据

6、JVM原理

7、Spark中遇到的问题

8、使用过什么自定义函数吗

小步：

1、Flink的watermark

2、mr shuffle spark shuffle

3、快排归并空间复杂度时间复杂度

4、三天连续登录

1、工作内容技术点

2、统计一年的销售额，截止到每个月的和

3、行转列列转行

4、快照拉链表快照

YOHO

1、Flink kafka的offset怎么保存 (flink对接kafka这方面对接的比较好，由kafka自身维护就可以，外部并设置了checkpoint保存高版本;低版本的kafka保证存在ZK中)

2、Spark 消费kafka怎么保证精准一次

3、Kafka的优化

4、redis了解的多吗？AOF RDB 使用的什么类型

5、String 可被继承吗(不可被继承，final修饰的

6、hashMap安全吗怎么实现安全

•HashMap线程不安全，扩容完会将原数组导入到新数组，有两层循环，先循环数组，再循环每个数组下标位置的链表。多个线程同时扩容的情况可能会导致闭环单链表 put的时候可能多线程数据不一致。两个线程A和线程B ，线程A插入数据，获取到链表头的节点。线程A的时间片用完了，此时B起来了，插入数据，并成功，此时A再次被调起来，假设两者插入的链表中的索引一致，但是此时的A是有过期的链表头的，他并不知道B已经插入过去了，此时就会覆盖掉B插入的数据，数据丢失 •HashTable：HashTable底层使用synchronized来保证线程安全，get方法 put方法都加了 synchronized所有线程竞争一把锁，效率低。 •ConcurrentHashmap：JDK1.7 使用锁分段技术，它包含一个segment数组，将数据分段存储，给每一段数据配一把锁，效率高 JDK1.8 ConcurrentHashMap 舍弃了segment的概念，直接对数组上，即每个链表的头节点加锁，当有现成访问时，就给这个元素加锁synchronize 运用CAS比较并替换，是一种实现并发算法时常用到的技术 CAS是乐观锁技术，当多个线程尝试使用CAS同时更新同一个变量时，只有其中一个线程能更新变量的值，而其它线程都失败，失败的线程并不会被挂起，而是被告知这次竞争中失败，并可以再次尝试。1、hashTable是现场安全的，底层用的synchronized来保证线程安全，所有线程竞争一把锁，效率低、

7、sum（） over（）

8、hive UDF写的多吗

9、Spark on Yarn job死了，怎么拉起来 HA高可用通过什么参数设置

10、Spark Flink的反压

11、Flink DataSet（离线）

12、Flink 容错机制状态管理3

•checkpoint检查点使Flink具有容错能力 •其实感觉容错机制做大的技术就是checkpoint内部的barrier，他会在内部等待其他流的相对应的数据到来，而且内部还会缓存，这样一来生成快照的的时间点就是数据处理完的时刻

13、Spark消费kafka 记录的是哪个offset 获取的？一个批次的？还是一个窗口的？拿到的是批次的RDD。每一个批次是一个RDD ，拿到的是每个RDD的offset

14、mysql索引？引擎？底层结构？

15、对象何时进入老年代？

•当对象在新生代存活次数达到15次，会进入老年代•当对象是个大对象，年轻代放不下去，会放到老年代有个值可以设置对象的大小，大于这个值就会被放入老年代•Java中 spark怎么拿线程•年轻老年代 GC 发生在什么时候 1、当jvm无法为新创建的对象分配空间时发生Minor GC 2、Minor GC的时候可能就会触发Full FC 因为年老代动态估算要盛出多少空间接收年轻代过来的对象，为其腾地方

1、Flink kafka的offset怎么保存，存在checkpoint中能保证精准一次吗

2、工作中对于kafka的优化

3、Flink 容错机制

理想汽车：

1、a.txt存储：id name age school ee awk b.txt id name age c.txt id school ee 然后合并b c 文件返回a文件状态 awk -F '\t' -v OFS='\t' 'NR==FNR{S[$1]=$0;next}NR>FNR{print S[$1],$2,$3}' b.txt c.txt >> d.txt

2、hive函数 lag lead 用法 lead(col,1) over(order by time)

3、grep 参数区分大小写存在A不存在BC cat d.txt | grep "A" | grep -v "BC"

4、了解一下自动驾驶的技术以及自动驾驶辅助系统二面要问的

5、 300W * 50 1 5000 0000K 150000M 150G

6、数据传过来：操作数据车轮转速传感器数据与前方车辆的距离（取平均值）（打包发送过来 1M的包）

7、离线架构实时架构（可以有点延迟）

头条：

链表反转

数组排序：

sql 尽可能join就行了

TCP UDP区别：两个不同的传输协议，UDP 面向无连接随时可以发送数据数据会乱序，且可能会丢失，并不会重发，没有流量控制，照收不误数据报模式占用系统资源少首部开销小，只有8个字节 TCP 面向连接的发送数据之前需要先建立连接，连接建立好之后再发送数据，发送完数据确认之后再关闭连接。（只有建立连接，对方存在时才会发送数据）数据有顺序。乱了也会重新排好序，丢失的话会反馈并重发会有流量控制流模式占用系统资，源多首部开销20字节

进程线程区别

1、进程：系统进行分配的和管理资源的基本单位

2、线程：进程的一个执行单元。进程内调度的实体。是程序执行的最小单位。轻量级进程一个程序至少一个进程，一个进程至少一个线程

Flink项目：讲项目讲的细一点

数仓离线方面数据分层维度建模数据分层（ods dwd dws ads 详细的分层）维度建模---星型模型（往上说雪花模型）

Atlas元数据管理血缘关系图

Java用过 python不了解

String 不可变 stringBuilder StringBuffer String：不可变字符串，字符串本身不会发生变化，在常量区中只存储一个 StringBuffer：JDK1.0 可变字符串字符串本身可以发生变化效率低多线程线程安全 StringBuilder：JDK1.5 可变字符串字符串本身可以发生变化效率高单线程线程不安全

Java的GC 清除策略赋值算法年老：标记清除标记整理

hive 的排序：order by sort by cluster by

hive UDF UDTF UDAF UDF：继承UDF类重写 evaluate 方法一对一输入输出 UDTF：继承 GenericUDTF 实现里面的方法一对多的输入输出 UDAF: 多进一出继承UDAF类重写方法：初始化合并

MR Combiner （归并排序生成文件之后进行Combiner）

kafka 数据丢失（Spark怎么保证的消费kafka精准 Flink怎么保证消费的kafka）两阶段提交的保证

B树 B+树区别数据库为什么用B+树（B+树找数据比B树更好）数据库使用B+树肯定是从查找效率上来考虑的，B+树的查询首先是二分查找，而且每个根结点只存的是索引ID，这样以页为单位的索引终究可以放置更多的节点，减少更多的IO。拿到索引ID，然后去叶子节点找到数据

left semi join 各种join的区别

二叉树的镜像？？？？

归并排序复杂度

Spark组件？

1、client：客户端提交应用程序

2、master：控制，管理和监控整个Spark集群

3、worker：集群工作节点汇报执行进度和结果给master 节点会运行一个或者多个executor进程

4、Driver：主要就是执行代码，切分任务，接收executor的心跳信息，初始化SparkContext

5、executor：负责运行Task 负责将数据存储在内存或者磁盘

6、RDD：Spark的核心数据结构通过算子进行转换

复杂类型的指标？

自己职业规划？

问什么离职

单链表实现两个数字相加例如：1234+567=?

redis rdb以及AOF 持久化

Spark 和 hive 比有什么区别？

1、hive本身是不存储数据的，他是基于hdfs的。只不过的计算引擎分为mr spark 通过hive封装schema具有结构化的数据，通过sql进行交互式查询 hive是具有元数据信息的，构成的血缘关系处理海量数据

2、Spark的数据来源不一定是hdfs上的数据，加快了数据仓库的计算速度，基于他的内存式计算，

持久化机制支持sql方式开发通过DF加上schema

UDF UDTF UDAF区别？UDF 继承 UDF 一对一 UDTF 继承 GenericUDTF 一进多出 UDAF 继承 UDAF 多进一出

七层协议四层协议物理层数据链路层网络层传输层会话层表示层应用层网络接口层网络层传输层应用层物理层数据链路层网络层传输层应用层

JVM G1和CMS的区别？

Flink 实时的维度发生变化，不停任务（广播流）广播流 MapStateDescriptor

mysql的主从复制谁读谁写

1、主库master的一些更新时间会记录在binlog中

2、从库启动，启动一个IO线程，连接主库

3、主库把binlog的内容发送到从库

4、从节点slave会去读取这个binlog，将读取的内容写到他的中继日志

5、slave重做中继日志的事件，数据重演，得到一样的数据

主master负责写入数据从slave负责读取数据

Flink 的checkpoint机制

Flink 的保证精准一次性

Flink 的数据积压了怎么办？（Flink内部背压开启静态限速）

Flink 结果写到mysql保证效率

hive 的执行计划

1、用户提交查询等任务提交到Driver

2、解析器将SQL转回为抽象语法树

3、遍历抽象语法树，抽出基本的查询单元QueryBlock

4、遍历QueryBlock 翻译为执行操作数

5、逻辑层优化器进行执行操作树的优化，减少shuffle数据量

6、遍历执行操作数，翻译为MR任务。最终生成之中的执行计划

7、执行并输出结果

Volatile：线程间可见，禁止指令重排序，被volatile修饰的变量在初始化过程不会重新排序

JVM垃圾回收器：最常用的ParNew（年轻代） + CMS（老年代）目前有的垃圾回收器：Serialize 序列化的 parallel 并行的 CMS 这几种的问题就是正在运行的程序需要被停止进行垃圾回收（STW）目前最新的是ZGC，还在处于测试阶段。比较新的是G1 JDK1.7出来的，JDK1.9比较稳定的，现在JDK12 可控的
设计目标：追求最短的垃圾停顿，让程序的响应速度最快，默认是200ms，即垃圾回收时间不会超过200ms，程序在200ms之内肯定会响应 G1管理内存，会把内存分为一块一块的region，不一定是连续的。每个region可能会使老年代，也可能是伊甸区或幸存区，并不是固定的。当对象比较大的时候可以申请多个region 每个region不能超过32M 最小1M (1 2 4 8 16 32)只能是2的几次方默认目标是2048个 G1的特点：

1、追求响应速度，一般垃圾回收控制在200ms之内。

2、比较灵活，分region回收，优鲜回收花费时间少，垃圾比例高的region 关于对象的存活次数，超过一定次数放入老年代------》 Parallel Scavenge 默认15 CMS默认是6 G1默认15 还会有动态年龄，当to区域放不下去的时候，会把年龄比较大的直接放到老年代再就是大对象直接放到老年代

G1 分为4步：

1、初始标记STW：找根没有引用的

2、并发标记：

3、最终标记STW：

4、并行回收STW：最终的回收算法还是复制算法如果200ms没有完成垃圾回收，没关系，可以重复这个动作，默认是8次

Python异步编程 - asyncio库孤寒者 Python全栈系列教程 python 异步编程 asyncio yield 协程
目录：每篇前言：异步IOPython中的异步编程实现方式：协程Python传统协程示例：实现生产者-消费者模型消费者：生产者：运行流程：整体流程：传统协程——>现代协程：asyncio库async/await每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于爬虫必备前端技术栈专栏：《爬虫必备前端技术栈
Flink命令行启动Job任务平凡的运维之路 linux 程序人生
Flink非交互式运行Job任务Flink命令行启动Job任务具体命令flink参数说明-c,--class-d,--detached后台运行-p,--parallelism并行度[test@xxx~]$flinkrun-d-cclass_nameJob-p3./flink-statics-1.0.jar-zookeeper"10.130.41.51:2181,10.130.41.52:2181,
快速启动flink项目 for your wish flink java 大数据
按照这个步骤1分钟内创建完成idea-----File----new---Project------Maven----Createfromarchetype----AddArchetype弹出框：GroupId填org.apache.flinkArtifactId填flink-quickstart-javaVersion填1.14.0选中刚刚添加的Archetype，点Next填写你要创建的这个f
【Flink】flink启动任务，taskmanager.out 文件增涨非常快九师兄 flink 大数据
1.概述flink启动任务，taskmanager.out文件增涨非常快，这个文件大小怎么限定？测试了很多办法发现都不起作用这个问题可以试试：【Flink】Flink1.11.2onYARN滚动日志配置但是后面我发现不是这个导致的，是slf4j依赖冲突，jar包删除就可以了
IDEA本地启动flink 任务 Direction_Wind intellij-idea flink java
1pom中添加org.apache.flinkflink-clients_${scala.binary.version}${flink.version}org.apache.flinkflink-runtime-web_${scala.binary.version}${flink.version}2下载flink-dist包并3打印日志中搜索localhost可以找到flink的管理页面
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
【工具】gdb使用详细介绍努力努力再努力～～ linux疑难问题排查实战 gdb linux 问题调试
linux问题排查实战专栏，分享了作为公司专家，在解决内存、性能、各类死机等疑难问题的排查经验，认真学习可以让你在日后工作中大放光彩。前言在工作中，无论是学习代码流程还是问题的定位，GDB都显得尤为重要，多掌握一些命令可以提升我们的效率和解决问题的能力；按照我的理解，对GDB的掌握程度可以分为三种人：基础命令，大家都知道相对高阶一点的，少数人了解，掌握之后可以提升调试解决问题的效率需要结合反汇编、
【Linux】Linux下调试器gdb的使用安度因 Linux linux 运维服务器测试工具调试
作者主页：@安度因学习社区：StackFrame专栏链接：Linux文章目录一、前言二、铺垫三、指令集和使用1、指令集2、演示四、结语如果无聊的话，就来逛逛我的博客栈吧!一、前言前几篇Linux博客中，我们分别学习了与编辑、编译、自动化构建代码、上传代码的工具。而今天，我们将学习最后一个工具——Linux下的调试器gdb
FlinkCDC实战：将 MySQL 数据同步至 ES 小DuDu flink mysql
当前需要处理的业务场景:将订单表和相关联的表(比如:商品表、子订单表、物流信息表)组织成宽表,放入到ES中,加速订单数据的查询.同步数据到es.概述1.什么是CDC2.什么是FlinkCDC3.FlinkCDCConnectors和Flink的版本映射实战1.宽表查询1.1创建mysql表1.2启动Flink集群和FlinkSQLCLI1.3在FlinkSQLCLI中使用FlinkDDL创建表1.
DeepLabv3+改进18:在主干网络中添加REP_BLOCK AICurator 深度学习 python 机器学习 deeplabv3+语义分割
【DeepLabv3+改进专栏！探索语义分割新高度】你是否在为图像分割的精度与效率发愁？本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络（ConvNet）构建模块，可在不增加推理时间成本的情况下提升性能。该模块名为多样化分支块（DBB），通过结合不同尺度和复杂度的多样化分支
使用opengl绘制立方体_一步步学OpenGL(25) -《Skybox天空盒子》 weixin_39962153 使用opengl绘制立方体
教程25Skybox天空盒子原文：http://ogldev.atspace.co.uk/www/tutorial25/tutorial25.htmlCSDN完整版专栏：https://blog.csdn.net/cordova/article/category/9266966背景天空盒子是一种让场景看上去更广阔无垠的一种视觉技术，用无缝对接的封闭纹理将摄像机的视口360度无死角的包裹起来。封闭纹
网络系统管理专栏-配套练习+知识点详解漩涡·鸣人智能路由器网络
目录总体规划1、设备命名规范和设备的基础信息2、密码恢复和软件版本统一模块三：网络搭建与网络冗余备份方案部署表1-11Ipv6地址分配表模块五：出口安全防护与远程接入试题解析：考核点1：考点解析：2、Portfast+Bpduguard防环方案3、rldp◆考核点2：考点解析：◆考核点3：考点解析：◆考核点4：考点解析：◆考核点5：考点解析：◆考核点6：考点解析：◆考核点7：◆考核点8：◆考核点9
Flink 通过 Chunjun Oracle LogMiner 实时读取 Oracle 变更日志并写入 Doris 的方案 roman_日积跬步-终至千里 #flink 实战 flink oracle 大数据
文章目录一、技术背景二、关键技术1、OracleLogMiner2、Chunjun的LogMiner关键流程3、修复ChunjunOracleLogMiner问题一、技术背景在大数据实时同步场景中，需要将Oracle数据库的变更数据（CDC）采集并写入ApacheDoris，以支持数据分析、BI报表、实时数据仓库等应用。本方案基于Flink+Chunjun，通过OracleLogMiner解析Re
java中如何根据已有word文件快速生成目录和页码？ bug菌¹ 全栈Bug调优(实战版)java word python 生成目录生成页码文件操作
本文收录于《全栈Bug调优(实战版)》专栏，主要记录项目实战过程中所遇到的Bug或因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！全文目录：问题描述解决方案优化基于Docx4j的TOC生成性能问题及日志警告解决方案**1.性能优化****1.1避免使用FOP渲染获取页码****1.2使用更高效的文档
Vue.js的watch监听阿珊和她的猫 vue.js 前端 javascript
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》、《前端求职突破计划》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》文章目录引言`watch`选项的基本概念`watch`选项的基本语法`watch
数据中台（二）数据中台相关技术栈 Yuan_CSDF #数据中台
1.平台搭建1.1.Amabari+HDP1.2.CM+CDH2.相关的技术栈数据存储：HDFS，HBase，Kudu等数据计算：MapReduce,Spark,Flink交互式查询：Impala,Presto在线实时分析：ClickHouse，Kylin，Doris，Druid，Kudu等资源调度：YARN，Mesos，Kubernetes任务调度：Oozie，Azakaban，AirFlow，
S32K144外设实验（二）：ADC单通道单次采样（软件触发）上层精灵的赞美诗 #S32K144的外设基础实验单片机嵌入式硬件 eclipse mcu 笔记
文章目录1.概述1.1理论回顾1.1.1时钟系统1.1.2采样通道1.2实验目的2.配置与代码编写1.概述1.1理论回顾S32K144的ADC应该说是特别灵活，笔者采用循序渐进的方式来学习使用这个很重要的外设。在《入门笔记系列》专栏中对用户手册进行了翻译和解读，这里在回顾一下ADC的基本功能，第一次实验我们不使用过于复杂的触发方式。只使用一个通道来理解S32K144的ADC。1.1.1时钟系统首先
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
Apache Doris整合Iceberg + Flink CDC构建实时湖仓体的联邦查询分析架构 MfvShell apache flink 架构 Flink
随着大数据技术的迅猛发展，构建实时湖仓体并进行联邦查询分析成为了许多企业的迫切需求。在这篇文章中，我们将探讨如何利用ApacheDoris整合Iceberg和FlinkCDC来构建这样一个架构，并提供相应的源代码示例。简介实时湖仓体是一种灵活、可扩展的数据架构，结合了数据湖和数据仓库的优势。ApacheDoris是一款开源的分布式SQL引擎，专注于实时分析和查询。Iceberg是一种开放式表格格式
DRAM refresh里面的tRFC tREFI tREF之间是什么关系 DRAM视界 DRAM从旁听到入门笔记微信经验分享微信公众平台百度
欢迎大家关注微信公众号:DRAM视界也欢迎大家订阅本专栏。本专栏会持续不断的分享DRAM相关的经验**学DRAM的痛苦之一，是DRAM里面的timing太多了，各种各样的timing五花八门，奇形怪状，不知所云。**Refresh操作里面也有很多对timing的要求，ACT要求tRCD/tFAW,PRE要求tRP,tRTP等。REF要求tRFC/tREFI/tREF等等。那tRFCvstREFIv
【商城实战(43)】探秘知名商城架构：解锁电商成功密码奔跑吧邓邓子商城实战架构微服务 spring boot 商城实战商城架构
【商城实战】专栏重磅来袭！这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建，运用uniapp、ElementPlus、SpringBoot搭建商城框架，到用户、商品、订单等核心模块开发，再到性能优化、安全加固、多端适配，乃至运营推广策略，102章内容层层递进。无论是想深入钻研技术细节，还是探寻商城运营之道，本专栏都能提供从0到1的系统讲解，助力你打造独具竞争力的电商平台，开启电商实战
flink从kafka读取数据写入clickhouse本地表的实现 Breatrice_li kafka flink 分布式大数据
实现功能因为直接写clickhouse的分布式表在数据量比较大的时候会有各种问题，所以做了一个flink读取kafka数据然后路由写入到相应的本地表节点，并且关于不同的表的配置信息可以随时更改并设置生效时间。实现流程首先从kafka将数据读取过来然后进行相应的处理及逻辑判断写入到对应的clickhouse表格中最后根据CDC读取来的配置信息进行相应节点的hash路由，直接写入本地表读取kafka数
demo flink写入kafka_Flink 写入数据到 Kafka ONES Piece demo flink写入kafka
Flink写入数据到Kafka前言通过Flink官网可以看到Flink里面就默认支持了不少sink，比如也支持Kafkasinkconnector(FlinkKafkaProducer)，那么这篇文章我们就来看看如何将数据写入到Kafka。准备Flink里面支持Kafka0.8、0.9、0.10、0.11.这里我们需要安装下Kafka，请对应添加对应的FlinkKafkaconnector依赖的版
Flink读取kafka数据并写入HDFS 王知无(import_bigdata) Flink系统性学习专栏 hdfs kafka flink
硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/HDFS/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021年从零到大数据专家面试篇之消息队列篇2021年从零到大数据专家面试篇之Spark篇2021年从零到大数据专家面试篇之Hbase篇
Java 大视界 -- Java 大数据在智能体育赛事直播数据分析与观众互动优化中的应用（142）青云交大数据新视界 Java 大视界 java 大数据体育赛事直播数据分析观众互动数据采集个性化推荐
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
「清华大学、北京大学」DeepSeek 课件PPT专栏 YuKeeHgg DeepSeek AI 华彬智融知识库 DeepSeek ai 华彬智融
你要的这里都打包好啦，快快收藏起来！名称链接团队简介类型DeepSeek——从入门到精通1️⃣DeepSeek从入门到精通「清华团队」清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室PPT课件DeepSeek如何赋能职场应用?——从提示语技巧到多场景应用2️⃣DeepSeek赋能职场应用「清华团队」中央民族大学新闻与传播学院清华大学@新媒沈阳团队向安玲PPT课件普通人如何抓住DeepSeek红
HoRain云--Node.js文件下载服务实战：Express实现安全高效的文件传输 HoRain云小助手 node.js express 安全
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
Java 大视界 -- 基于 Java 的大数据实时流处理中的窗口操作与时间语义详解（135）青云交大数据新视界 Java 大视界 java 大数据大数据实时流处理窗口操作时间语义滚动窗口滑动窗口
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
华为OD机试题库清单以及考点说明，2025.3.16切换2025A卷（Python/JS/C/C++）哪吒搬砖工逆袭Java架构师华为od python javascript 2025A卷华为OD机试
专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C++）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景，发现新题目，随时更新。2024年8月14日，华为官方已经将华为OD机试（D卷）切换为E卷。目前正在考的是E卷，按照华为OD往常的操作，E卷题目是由往
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(

2020年最新大数据面试题，你都会吗？

你可能感兴趣的:(flink专栏)