远方时光

Flink面试题精简

Flink基础：

1 简单介绍一下 Flink

·框架和分布式处理引擎；

·对无界和有界数据流进行有状态计算；

·提供了数据分布、容错机制以及资源管理等核心功能；

·提供了诸多高抽象层的API以便用户编写分布式任务：

- DataSet API，对静态数据进行批处理操作，将静态数据抽象成分布式的数据集

- DataStream API，对数据流进行流处理操作，将流式的数据抽象成分布式的数据流

- Table API，对结构化数据进行查询操作，将结构化数据抽象成关系表

·Flink 还针对特定的应用领域提供了领域库。Flink ML机器学习库、Gelly，图计算库。

2 Flink相比传统的Spark Streaming区别?

标准的实时处理引擎，基于事件驱动。而Spark Streaming是微批（Micro-Batch）的模型。

分几个方面介绍两个框架的主要区别：

架构模型

·SparkStreaming 在运行时的主要角色包括：Master、Worker、Driver、Executor

·Flink 在运行时主要包含：Jobmanager、Taskmanager和Slot。

2. 任务调度

·SparkStreaming连续不断的生成微批次数据，构建有向无环图DAG，依次创建DStreamGraph、JobGenerator、JobScheduler。

·Flink根据用户提交的代码生成StreamGraph，经过优化生成JobGraph，然后提交给 JobManager进行处理，生成ExecutionGraph，ExecutionGraph是Flink 任务调度的核心。

时间机制

·SparkStreaming 只支持处理时间

·Flink 处理时间、事件时间、注入时间、watermark机制来处理滞后数据。

容错机制

·SparkStreaming设置checkpoint，发生故障并重启，从上次checkpoint之处恢复，只能使得数据不丢失，可能会重复处理，不能做到恰好一次处理语义。

·Flink则使用两阶段提交协议来解决这个问题。

3 Flink的组件栈有哪些？

Flink是一个分层架构的系统，每一层所包含的组件都提供了特定的抽象，用来服务于上层组件。

·Deploy层: locol、standalone、cluster、cloud

·Runtime层: Flink 计算的核心实现，比如：支持分布式流处理、JobGraph到ExecutionGraph的映射、调度等。

·API层：DataStream API、DataSet API

·Libraries层: CEP、Table API&SQL、FlinkML、Gelly

4 Flink 的运行必须依赖 Hadoop组件吗？

Flink可以完全独立于Hadoop，但是做为大数据的基础设施，Hadoop体系是任何大数据框架都绕不过去的。

Flink可以和Yarn集成做资源调度，也可以读写HDFS，或者利用HDFS做检查点。

5 你们的Flink集群规模多大？

将自己生产环节中的集群规模、节点、内存情况说明，部署模式（一般是Flink on Yarn），除此之外，用户也可以同时在小集群（少于5个节点）和拥有 TB 级别状态的上千个节点上运行 Flink 任务。

6 Flink的基础编程模型了解吗？

Flink 程序的基本构建是数据输入来自一个 Source，经过 Transformation 进行转换，然后在一个或者多个Sink接收器中结束。执行时Flink程序映射到streaming dataflows。

7 Flink集群有哪些角色？各自有什么作用？

·JobManager：Master

- 集群的协调者

- 接收Flink Job

- 协调检查点

- Failover 故障恢复等

- 管理Flink集群中从节点TaskManager

·TaskManager执行计算的Worker，

- 执行Flink Job的一组Task

- 管理资源信息，如内存、磁盘、网络

- 在启动的时候将资源的状态向JobManager汇报

·Client程序提交的客户端，提交一个Flink程序时会首先创建一个Client

- Client首先会对用户提交的Flink程序进行预处理，并提交到Flink集群中处理；

- 从用户提交的Flink程序配置中获取JobManager的地址，并建立连接；

- 将Flink Job提交给JobManager。

8 说说 Flink 资源管理中 Task Slot 的概念

TaskManager会将自己节点上管理的资源分为不同的Slot：固定大小的资源子集。

避免了不同Job的Task互相竞争内存资源，Slot只会做内存的隔离。没有做CPU的隔离。

9 说说 Flink 的常用算子？

Map：对输入的参数进行转换操作。

Filter：过滤掉指定条件的数据。

KeyBy：按照指定的key进行分组。

Reduce：用来进行结果汇总合并。

Window：窗口函数，根据某些特性将每个key的数据进行分组（例如：在5s内到达的数据）

10 说说你知道的Flink分区策略？

分区策略是用来决定数据如何发送至下游。Flink 支持了8中分区策略的实现。

·GlobalPartitioner：分发到第一个实例

·ShufflePartitioner：随机

·RebalancePartitioner：循环

·RescalePartitioner：根据并行度

·BroadcastPartitioner：广播到每个实例（适合于大数据集和小数据集做Jion）

·ForwardPartitioner：one to one

·KeyGroupStreamPartition：按key的hash值分发到下游实例

·CustomPartitionerWrapper：用户自定义分区器。

11 Flink的并行度了解吗？Flink的并行度设置是怎样的？

Flink中的任务可并行执行任务，每个并行的实例处理一部分数据。并行实例的数量被称为并行度。可以从不同层面设置并行度（优先级：算子层面>环境层面>客户端层面>系统层面）

12 Flink的Slot和parallelism有什么区别？

·slot是指taskmanager的并发执行能力

·parallelism是指taskmanager实际使用的并发能力

13 Flink有没有重启策略？说说有哪几种？

·固定延迟重启策略（Fixed Delay Restart Strategy）

·故障率重启策略（Failure Rate Restart Strategy）

·没有重启策略（No Restart Strategy）

·Fallback重启策略（Fallback Restart Strategy）

14 用过Flink中的分布式缓存吗？如何使用？

Flink实现的分布式缓存目的是在本地读取文件，并把他放在taskmanager节点中，防止task重复拉取。

15 说说Flink中的广播变量，使用时需要注意什么？

Flink是并行的计算过程可能不在一个Slot中进行。广播变量理解为是一个公共的共享变量，当访问同一份数据，把一个DataSet数据集广播，然后不同的task在节点上都能够获取到（这个数据在每个节点上只会存在一份）

16 说说Flink中的窗口？

·Sessionwindow

·timeWindow(Time.seconds(5))

timeWindow(Time.seconds(5), Time.seconds(3))

·countWindow(5)

countWindow(5,3)

17 说说Flink中的状态存储？

·计算的过程中需要存储中间状态，来避免数据丢失和状态恢复

·状态存储策略会影响状态持久化如何和 checkpoint 交互

·三种状态存储方式：MemoryStateBackend、FsStateBackend、RocksDBStateBackend

18 Flink中的时间有哪几类

·EventTime为基准来定义时间窗口,消息本身携带EventTime

·IngesingtTime为基准来定义时间窗口,是source 的systemTime

·ProcessingTime基准来定义时间窗口，是operator 的systemTime

19 Flink 中水印是什么概念，起到什么作用？

为处理 EventTime 窗口计算提出的一种机制, 本质上是一种时间戳。

Watermark经常和Window一起被用来处理乱序事件。

20 Flink Table & SQL 熟悉吗？TableEnvironment这个类有什么作用

TableEnvironment是Table API和SQL集成的核心概念。这个类主要用来：

·在内部catalog中注册表

·注册外部catalog

·执行SQL查询

·注册用户定义（标量，表或聚合）函数

·将DataStream或DataSet转换为表

·持有对ExecutionEnvironment或StreamExecutionEnvironment的引用

21 Flink SQL的实现原理是什么？是如何实现 SQL 解析的呢？

·用calcite对StreamSQL进行语法检验，语法检验通过后，转换成calcite的逻辑树节点,最终形成calcite的逻辑计划

·采用Flink自定义的优化规则和calcite火山模型、启发式模型共同对逻辑树进行优化，生成最优的Flink物理计划

·对物理计划采用janino codegen生成代码，生成用低阶API DataStream 描述的流应用，提交到Flink平台执行

Flink中级

1 Flink是如何支持批流一体的？

Flink的开发者认为批处理是流处理的一种特殊情况。批处理是有限的流处理。

Flink 使用一个引擎支持了DataSet API 和 DataStream API。

2 Flink是如何做到高效的数据交换的？

在一个Flink Job中数据需要在不同的task中进行交换，数据交换是由TaskManager负责的，TaskManager的网络组件首先从缓冲buffer中收集一批records再发送，batch 技术可以更加高效的利用网络资源。

3 Flink是如何做容错的？

·Checkpoint 负责定时制作分布式快照、对程序中的状态进行备份；

·State 用来存储计算过程中的中间状态。

4 Flink 分布式快照的原理是什么？

持续创建分布式数据流及其状态的一致快照。

在input source端插入barrier，控制barrier的同步来实现snapshot的备份和exactly-once语义。

5 Flink是如何保证Exactly-once语义的？

Flink通过实现两阶段提交和状态保存来实现端到端的一致性语义。

分为以下几个步骤：

·开始事务（beginTransaction）创建一个临时文件夹，来写把数据写入到这个文件夹里面

·预提交（preCommit）将内存中缓存的数据写入文件并关闭

·正式提交（commit）将之前写完的临时文件放入目标目录下。这代表着最终的数据会有一些延迟

·丢弃（abort）丢弃临时文件

若失败发生在预提交成功后，正式提交前。可以根据状态来提交预提交的数据，也可删除预提交的数据。

6 Flink 的 kafka 连接器有什么特别的地方？

Flink 在1.9版本发布的全新kafka连接器，不同版本的kafka集群只需要依赖一个connector即可。

7 说说 Flink的内存管理是如何做的?

·Flink是将对象都序列化到一个预分配的内存块上。

·Flink大量的使用了堆外内存，如果需要处理的数据超出了内存限制，则存储到硬盘上。

·Flink 为了直接操作二进制数据实现了自己的序列化框架。

·Flink的内存管理分为三部分：

- Network Buffers：这个是在TaskManager启动的时候分配的，用于缓存网络数据的内存，每个块是32K，默认分配2048个;

- Memory Manage pool：大量的Memory Segment块，用于运行时的算法（Sort/Join/Shuffle等），启动的时候就会分配;

- User Code：用于User code和TaskManager本身的数据结构。

8 说说 Flink的序列化如何做的?

·Java本身自带的序列化和反序列化的功能，但是笨重。

·Flink针对不同数据集，可以自动生成对应的TypeSerializer，能非常高效地对数据集进行序列化和反序列化。

9 Flink中的Window出现了数据倾斜，你有什么解决办法？

window产生数据倾斜指的是数据在不同的窗口内堆积的数据量相差过多。数据源头发送的数据量速度不同导致的。

·在数据进入窗口前做预聚合

·重新设计窗口聚合的key

10 Flink中在使用聚合函数 GroupBy、Distinct、KeyBy 等函数时出现数据热点如何解决？

·在业务上规避这类问题：单独处理数据北京的数据。

·Key的设计上：把热key进行拆分，北京按照地区进行拆分聚合。

·参数设置：Flink 1.9.0 SQL性能优化中升级了微批模型（MiniBatch）。原理是缓存一定的数据后再触发处理，减少对状态访问并提升吞吐量，减少数据的输出量。

11 Flink任务延迟高，想解决这个问题，你会如何入手？

·在Flink的后台任务管理中看到Flink的哪个算子和task出现了反压。

·资源调优：作业中的Operator的并发数、CPU、堆内存等参数进行调优。

·作业参数调优：并行度的设置，State的设置，checkpoint的设置。

12 Flink是如何处理反压的？

Flink 内部是基于producer-consumer模型来进行消息传递的，Flink的反压设计也是基于这个模型。

Flink 使用了高效有界的分布式阻塞队列：下游消费者消费变慢，上游就会受到阻塞。

13 Flink的反压和Strom有哪些不同？

Flink是逐级反压，而Storm是直接从源头降速。

14 Operator Chains（算子链）这个概念你了解吗？

为了更高效地分布式执行，Flink会尽可能地将operator的subtask链接在一起形成task。每个task在一个线程中执行。将operators链接成task是非常有效的优化：

·减少线程之间的切换，

·减少消息的序列化/反序列化，

·减少数据在缓冲区的交换，

·减少了延迟的同时提高整体的吞吐量。

15 Flink什么情况下才会把Operator chain在一起形成算子链？

·上下游的并行度一致

·下游节点的入度为1 (也就是说下游节点没有来自其他节点的输入)

·上下游节点都在同一个slot group中

·下游节点的chain策略为 ALWAYS(可以与上下游链接，map、flatmap、filter等默认是ALWAYS）

·上游节点的chain策略为ALWAYS或HEAD（只能与下游链接，不能与上游链接，Source默认是HEAD）

·两个节点间数据分区方式是forward（参考理解数据流的分区）

·用户没有禁用chain

16 说说Flink1.9的新特性？

·支持hive读写，支持UDF

·Flink SQL TopN和GroupBy等优化

·Checkpoint跟savepoint针对实际业务场景做了优化

·Flink state查询

17 消费kafka数据的时候，如何处理脏数据？

可以在处理前加一个fliter算子，将不符合规则的数据过滤出去。

Flink高级

1 Flink Job的提交流程

·用户提交的Flink Job会被转化成一个DAG任务运行，分别是：StreamGraph、JobGraph、ExecutionGraph

·Flink中JobManager与TaskManager，JobManager与Client的交互是基于Akka工具包的，是通过消息驱动

·整个Flink Job的提交还包含着ActorSystem的创建，JobManager的启动，TaskManager的启动和注册

2 Flink所谓"三层图"结构是哪几个"图"？

·StreamGraph 最接近代码所表达的逻辑层面的计算拓扑结构，按照用户代码的执行顺序向StreamExecutionEnvironment添加StreamTransformation构成流式图。

·JobGraph 从StreamGraph生成，将可以串联合并的节点进行合并，设置节点之间的边，安排资源共享slot槽位和放置相关联的节点，上传任务所需的文件，设置检查点配置等。相当于经过部分初始化和优化处理的任务图。

·ExecutionGraph 由JobGraph转换而来，包含了任务具体执行所需的内容，是最贴近底层实现的执行图。

3 TaskManager在集群中扮演了什么角色？

TaskManager 相当于整个集群的 Slave 节点，

·负责具体的任务执行和对应任务在每个节点上的资源申请和管理。

·TaskManager从JobManager 接收需要部署的任务，然后使用Slot资源启动Task，建立数据接入的网络连接，接收数据并开始数据处理。通过数据流进行数据交互.

·Flink 的任务运行采用多线程的方式，Flink能够提高CPU使用效率，在多个任务和Task之间通过askSlot方式共享系统资源，TaskManager中管理多个TaskSlot资源池。

4 Flink 计算资源的调度是如何实现的？

TaskManager会将其所有的资源平分给Task slot：固定大小的资源子集

·多个task运行在同一个JVM中。

·共享TCP连接（基于多路复用）和心跳消息，

·减少数据的网络传输，共享一些数据结构，减少了每个task的消耗。

·每个slot可以接受单个task，也可以接受多个连续task组成的pipeline，

5 Flink 中的分布式快照机制是如何实现的？

·Flink的容错机制是制作分布式数据流和操作算子状态的一致性快照。快照充当一致性checkpoint，系统可以在发生故障时回滚。

·barriers在数据流源处被注入并行数据流中。然后barriers向下游流动，一旦sink操作算子从其所有输入流接收到barriers n，它就向checkpoint协调器确认快照n完成。

Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
[ Linux 命令基础 ] Linux 命令大全-命令前置知识-系统管理-文件和目录管理-文本处理命令-网络管理命令-权限和用户管理命令-磁盘管理命令 _PowerShell shell脚本入门到精通 Linux 命令大全 linux命令前置知识 linux系统管理 linux文件和目录管理 linux文本处理命令 linux网络管理命令 linux权限和用户管理命令
博主介绍‍博主介绍：大家好，我是_PowerShell，很高兴认识大家~✨主攻领域：【渗透领域】【数据通信】【通讯安全】【web安全】【面试分析】点赞➕评论➕收藏==养成习惯（一键三连）欢迎关注一起学习一起讨论⭐️一起进步文末有彩蛋作者水平有限，欢迎各位大佬指点，相互学习进步！我们搞网络安全需要经常用到linux命令，比用拿到linux的shell，需要使用linux命令。再比如sh脚本，我们经常
360 最新Android面试题及参考答案大模型大数据攻城狮 android 安卓面经安卓面试 dex结构 hook技术 Binder aosp
一个activity只能有一个进程么【对进程的理解】在Android中，一个Activity并不只能有一个进程。进程是操作系统进行资源分配和调度的一个独立单位。从原理上来说，Android系统允许开发者通过在AndroidManifest.xml文件中的标签设置android:process属性，来指定Activity运行在不同的进程中。例如，如果有一个对性能要求很高的多媒体播放Activity，
前端开发：这就是终点吗？前端javascript
ReactHook深入浅出CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读让我们重新回到2021年后远程办公风潮兴起的日子，那时候，程序员岗位炙手可热。机会遍地都是，你甚至只需参加少量培训，通过面试后便能轻松收获年薪超15万的工作，还有余暇拍摄一段《程序员的一天》上传网络。经过短短一年左右的培训，你便踏上了年薪六位数的职业道路——那时候，当程序员似乎是一个人人羡慕的理想职业。然而
Java进阶面试速记登陆成功200 JAVA进阶开发语言 java
注解注解@Override类似一个标签,作用在方法上,表示此方法是从父类中重写而来注解是java中的标注方式,可以最用在类,方法,变量,参数成员上在编译期间,会被编译到字节码文件中,运行时通过反射机制获得注解内容,进行解析.内置注解java中内定好的注解例如@Override@Deprecated-标记过时方法。如果使用该方法，会报编译警告。@SuppressWarnings-指示编译器去忽略注解
春招，作为普通IT实习生的我有哪些想法和准备？十八朵郁金香学习
想法&随记对即将毕业的大学生来说，秋招和春招是求职的好机会，也是一次尝试向社会进行"自我推销"的机会，体现自己的综合能力，是“意满签Offer”？还是“露出马脚，社死场面”？“准备-天时地利人和-行动”后，我们会有答案。话题回到自己，春招，我有哪些想法？去年，在学校举办校园秋招招聘之前，我已经通过线上投递+线下面试找到实习，在一家人数规模100~200的公司当前端实习生，到现在已有四个多月，没有经
[前端面试场景题]虚拟列表 GISer_Jinger 前端面试
嗯，用户问的是“前端虚拟列表详解”，我需要详细回答这个问题。首先，我得先理解虚拟列表的概念和用途。根据搜索结果，虚拟列表主要用于优化长列表的渲染性能，特别是在处理大量数据时。用户可能想知道它的核心原理、实现方法以及实际应用场景。看网页1提到虚拟列表的定义和关键点，只渲染视口内的数据项，减少DOM节点。网页2和网页4都给出了具体的Vue和原生JS实现案例，比如动态计算起始和结束索引，使用transf
Java面试宝典，kafka优先级队列 m0_57081324 程序员 java 经验分享面试
为什么要分库分表？首先回答一下为什么要分库分表，答案很简单：数据库出现性能瓶颈。用大白话来说就是数据库快扛不住了。数据库出现性能瓶颈，对外表现有几个方面：大量请求阻塞在高并发场景下，大量请求都需要操作数据库，导致连接数不够了，请求处于阻塞状态。SQL操作变慢如果数据库中存在一张上亿数据量的表，一条SQL没有命中索引会全表扫描，这个查询耗时会非常久。存储出现问题业务量剧增，单库数据量越来越大，给存储
通过Bokeh实现大规模数据可视化的最佳实践【从静态图表到实时更新】步入烟尘算法指南信息可视化 Bokeh python
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
静态html 500错误,HTTP-500错误金门走狗静态html 500错误
http500内部服务器(HTTP-InternalServerError)错误说明IIS服务器无法解析ASP代码，访问一个静态页面试试是否也出现这个问题，如果访问静态页面没问题，那就要分以下几种情况来分析了：①你是否改变过计算机名称。②站点所在的文件目录是否自定义了安全属性。③安装了域控制器后是否调整了域策略。如果是其中的一种情况，请一一将改变的参数设置回来看是否解决问题。如果静态空间也无法访问
flink作业访问zk出现acl报错问题分析 spring208208 大数据组件线上问题分析 flink zookeeper 大数据
#问题现象向yarn集群提交flink作业的时候会出现zkacl的异常经确认：1.zk相关acl密码没有更改过2.重新部署客户端配置后提交任务同样报错3.修改flink的zk目录，重启后可以正常运行任务(在zk重新生了新的znode节点)#问题分析1.首先确认是否是权限的问题，即程序中zk用户没有权限操作zk上的flink节点目录确认集群上zookeeper的flink的acl权限，确认为flin
Flink Cdc TiDB详解 24k小善 flink 大数据 java
1.什么是FlinkTiDBCDC？简单说就是用Flink实时抓取TiDB数据库的数据变化（比如新增、修改、删除），并将这些变化数据以流的形式处理，用于实时分析、同步到其他系统等场景。TiDB本身是分布式数据库，而Flink是流处理引擎，两者的结合适合需要高吞吐、低延迟的大规模数据处理场景[7][8]。2.底层原理TiDB侧：通过TiCDC组件（TiDB的变更数据捕获工具）捕获数据变更，类似MyS
Flink CDC 与 SeaTunnel CDC 简单对比窝窝和牛牛 flink 大数据 cdc SeaTunnel
FlinkCDC与SeaTunnelCDC简单对比CDC技术概述变更数据捕获（ChangeDataCapture，简称CDC）是一种用于捕获数据库中数据变更的技术，能够实时识别、捕获并输出数据库中的插入、更新和删除操作。CDC技术在现代数据架构中扮演着至关重要的角色，特别是在实时数据集成、数据同步和事件驱动架构等场景中。CDC的工作原理CDC主要通过以下几种方式捕获数据变更：基于日志的CDC：直接
复习JVM LMQ6 jvm
JVM的三个主要主题:1.java内存区域划分:a.堆b.栈c.元数据区d.程序计数器2.类加载a.加载:打开.class文件,读取内容b.验证:验证.class文件的格式是否符合要求.c.准备:给类对象分配内存空间d.解析:初始化字符串常量e.初始化:对类对象中的各个部分初始化,比如静态代码块,静态成员的初始化等经典面试题:双亲委派模型他出现在"加载"环节,根据"全限定名称"寻找对应的.clas
NLP高频面试题（七）——GPT和Bert的mask有什么区别？ Chaos_Wang_ NLP常见面试题自然语言处理 gpt bert
GPT和BERT的Mask机制对比：核心区别与优化策略在NLP领域，GPT和BERT是最具代表性的预训练语言模型之一。它们都在训练过程中使用了Mask机制来引导模型学习语言表示，但具体实现方式和目标却有所不同。本文将深入探讨GPT和BERT的Mask方法的核心区别，并分析其优化策略。1.BERT的Mask机制：基于MLM（MaskedLanguageModel）BERT（Bidirectional
Vue相关面试题努力的搬砖人. vue.js
以下是150道Vue相关面试题及详细答案：Vue基础1.Vue.js是什么？Vue.js是一个用于构建用户界面的渐进式JavaScript框架，专注于视图层，允许开发者以声明式的方式构建用户界面，具有轻量、高效、易上手等特点。2.Vue实例的作用是什么？Vue实例是应用程序的核心，它管理数据、方法、生命周期钩子等，通过数据双向绑定将数据与视图层连接起来，实现数据驱动视图。3.如何创建一个Vue实例
Kafka常见问题 C18298182575 kafka linq 分布式
Kafka集群，常见MQ面试问题Kafka集群，常见MQ问题Kafka名词介绍•Topic:消息队列，生产者和消费者面向的都是一个Topic•Broker:一个Kafka服务器就是一个Broker，一个集群由多个Broker组成。一个Broker可以容纳多个Topic•Producer:消息生产者，向KafkaBroker发生消息的客户端•Consumer:消息消费者，向KafkaBroker取消
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
.gitlab-ci.yml 配置文件详解程序媛夏天 Git gitlab ci/cd .gitlab-ci.yml
个人主页：不爱吃糖的程序媛‍♂️作者简介：前端领域新星创作者、CSDN内容合伙人，专注于前端各领域技术，成长的路上共同学习共同进步，一起加油呀！✨系列专栏：前端面试宝典、JavaScript进阶、vue实战资料领取：前端进阶资料以及文中源码可以在公众号“不爱吃糖的程序媛”领取git工具文档说明：https://docs.gitlab.com/ee/ci/yaml/gitlab_ci_yaml.ht
输了，腾讯golang一面凉了 golang学习记 golang golang
本月正值4月，是金三银四的找工作的最佳时机。同时竞争也是很大，因为每年这个时候快要毕业的大学生也进去了找工作的潮水中。今天分享我的一位大佬朋友CC，勇闯腾讯golang的面试经历。这次面试问题的方向主要集中在计算机基础个网络方面。下面是主要问到的问题。第一个，http握手，https证书第二个，操作系统的中断，堆和栈第三个，数据库，乐观锁，悲观锁，acid等TSL四次握手的过程是什么第一次握手首先
golang面经整理（一）（k8s,docker二次开发方向，云原生方向） gooooer 1024程序员节
笔者在2022年7月份-9月份之间面试了很多golang和k8s相关的面试，主要想从事云原生相关的开发工作，大小公司面试了很多，现将整体面试感受和一些通用的问题做一些整理记录，帮助大家在面试的时候更好的进行准备。最近大环境不好，大厂的岗位也少了不少。主要投递的岗位包含广州、深圳的岗位，面试的是golang工程师相关的岗位，但其实单纯做云原生相关岗位比较少，基本上局限于国内的几朵云，阿里云，华为云，
栈力扣hot100热门面试算法题面试基础核心思路背题滑动窗口最大值字符串解码每日温度柱状图中最大矩形有效的括号最小栈尘土哥算法 leetcode 面试
栈栈的核心思路：每个数都要进栈or队列，但是要及时维护栈or队列，当某元素没有存在的意义时就删掉，关键是思考栈尾什么时候有用与没用。滑动窗口最大值https://leetcode.cn/problems/sliding-window-maximum/题解链接https://leetcode.cn/problems/sliding-window-maximum/solutions/3067170/d
广州各大IT公司情况调查总结 Monika Zhang 就业面试攻略其他
腾讯微信地址：广东省广州市海珠区新港中路397号TIT创意园B1-B3号使用C语言，C#居多门槛比较高字节跳动广州市天河区珠江东路6号广州周大福金融中心15层01-06室应聘比较注重算法阿里广州市海珠区阅江西路唯品会总部大厦西侧约170米不需要机试，面试难度比较高，注重技术深度，要有一技之长华为广州市黄埔区黄埔东路与红荔西路交叉路口往南约80米需要机试，三道算法题，400分，150分及格，多刷题不
HDFS相关的面试题努力的搬砖人. java 面试 hdfs
以下是150道HDFS相关的面试题，涵盖了HDFS的基本概念、架构、操作、数据存储、高可用性、权限管理、性能优化、容错机制、与MapReduce的结合、安全性、数据压缩、监控与管理、与YARN的关系、数据一致性、数据备份与恢复等方面，希望对你有所帮助。HDFS基本概念1.HDFS是什么？它的设计目标是什么？•HDFS是Hadoop分布式文件系统，设计目标是实现对大规模数据的高吞吐量访问，适用于一次
服务器虚拟化相关的面试题努力的搬砖人. java 面试服务器其他
以下是服务器虚拟化相关的面试题，涵盖了服务器虚拟化的基础概念、技术原理、应用场景、性能优化、容错与高可用性、网络与存储、管理与监控、安全与备份、与其他技术的结合等方面，希望对你有所帮助。服务器虚拟化基础概念1.什么是服务器虚拟化？它的主要目的是什么？•服务器虚拟化是指通过虚拟化技术将一台物理服务器虚拟成多台虚拟机，每台虚拟机可以独立运行操作系统和应用程序。其主要目的是提高服务器的资源利用率，降低硬
Flink相关面试题努力的搬砖人. 面试 java 后端 flink
以下是150道ApacheFlink面试题及其详细回答，涵盖了Flink的基础知识、核心架构、API使用、性能调优等多个方面，每道题目都尽量详细且简单易懂：Flink基础概念类1.什么是ApacheFlink？ApacheFlink是一个开源的流处理和批处理框架，能够实现快速、可靠、可扩展的大数据处理。它既可以处理无界的数据流，也可以处理有界的数据批，提供了低延迟和高吞吐量的实时数据处理能力。Fl
前端面试：[React] scheduler 调度机制原理？ returnShitBoy 前端 react.js javascript
ReactScheduler是React16.8引入的一种调度机制，旨在对高效渲染和复杂应用程序的性能进行优化。它允许React在空闲时间进行渲染，优先处理对用户体验最为重要的任务。以下是Scheduler调度机制的原理，以及它在实际工作中如何帮助管理渲染。1.调度机制的背景React的渲染过程可能会受到多个因素的影响，例如用户输入、网络请求以及其他状态变化。传统的渲染机制在某些情况下可能导致性能
算法刷题记录——LeetCode篇(1) [第1~100题](持续更新) Allen Wurlitzer 实战-算法解题算法 leetcode 职场和发展
更新时间：2025-03-21LeetCode刷题目录：算法刷题记录——专题目录汇总技术博客总目录：计算机技术系列博客——目录页优先整理热门100及面试150，不定期持续更新，欢迎关注！1.两数之和给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
前端面试请叫我子鱼编程语言笔试面试程序员 web interview
前端面试之道JS基础知识点及常考面试题原始（Primitive）类型面试题：原始类型有哪几种？null是对象嘛？在JS中，存在着6种原始值，分别是：booleannullundefinednumberstringsymbol首先原始类型存储的都是值，是没有函数可以调用的对象（Object）类型面试题：对象类型和原始类型的不同之处？函数参数是对象会发生什么问题？在JS中，除了原始类型那么其他的都是对
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象