roman_日积跬步-终至千里

【状态管理｜概述】Flink的状态管理：为什么需要state、怎么保存state、对于state过大怎么处理

文章目录

一. state相关
- 1. state种类
- 2. State的存在形式
- 3. state在哪产生
- 4. state 内存设置
二. state backend
- 1. 三种状态后端
- 2. 如何在hdfs中存储？
- 3. 设置checkpoint
- - 3.1. 大状态下设置checkpoint
  - 3.2. EXACTLY_ONCE下设置分析checkpoint
三. State设置过期时间
- 1. datastream的TTL
- 2.Table API和SQL的状态管理
- - 2.1. 问题描述与分析
  - 2.2. 状态设置
  - 2.3. 实现逻辑与源码分析

一. state相关

1. state种类

按照数据的划分和扩张方式，Flink中大致分为2类：

Keyed States：记录每个Key对应的状态值

因为一个任务的并行度有多少，就会有多少个子任务，当key的范围大于并行度时，就会出现一个subTask上可能包含多个Key（），但不同Task上不会出现相同的Key（解决了shuffle的问题？）

常用的 MapState、ValueState。

Operator States：记录每个Task对应的状态值数据类型。

2. State的存在形式

Keyed State 和 Operator State 存在两种形式：managed （托管状态）和 raw（原始状态）。

托管状态是由Flink框架管理的状态，原始状态是由用户自行管理状态的具体数据结构。

通常所有的 datastream functions 都可以使用托管状态，但是原始状态接口仅仅能够在实现 operators的时候使用。

推荐使用 managed state 而不是使用 raw state，因为使用托管状态的时候 Flink 可以在 parallelism 发生改变的情况下能够动态重新分配状态，而且还能更好的进行内存管理。

3. state在哪产生

没有状态的操作

从概念上讲，源表从来不会在状态中被完全保存。形如 SELECT … FROM … WHERE
这种只包含字段映射或过滤器的查询的查询语句通常是无状态的管道。

诸如 join、聚合或去重操作需要在 Flink 抽象的容错存储内保存中间结果。看下sum的状态操作

@Internal
public class StreamGroupedReduceOperator<IN>
        extends AbstractUdfStreamOperator<IN, ReduceFunction<IN>>
        implements OneInputStreamOperator<IN, IN> {

    private static final long serialVersionUID = 1L;

    private static final String STATE_NAME = "_op_state";

    private transient ValueState<IN> values;

    private final TypeSerializer<IN> serializer;

    public StreamGroupedReduceOperator(ReduceFunction<IN> reducer, TypeSerializer<IN> serializer) {
        super(reducer);
        this.serializer = serializer;
    }

    @Override
    public void open() throws Exception {
        super.open();
        ValueStateDescriptor<IN> stateId = new ValueStateDescriptor<>(STATE_NAME, serializer);
        //获得value state
        values = getPartitionedState(stateId);
    }

    @Override
    public void processElement(StreamRecord<IN> element) throws Exception {
        IN value = element.getValue();
        IN currentValue = values.value();
        //如果currentValue不为null，则说明不是第一次启动，也就是在hdfs上已经存储了中间状态 
        if (currentValue != null) {
            //先做一个聚合，然后再更新，之后输出到下游
            IN reduced = userFunction.reduce(currentValue, value);
            values.update(reduced);
            output.collect(element.replace(reduced));
        } else {
            //第一次启动直接更新数据，之后输出到下游
            values.update(value);
            output.collect(element.replace(value));
        }
    }
}

4. state 内存设置

从 Flink1.10 开始，Flink 默认将 state 内存大小配置为每个 task slot 的托管内存。

调试内存性能的问题主要是通过调整配置项，来提高Flink的托管内存：

taskmanager.memory.managed.size 
//推荐使用比例计算
taskmanager.memory.managed.fraction

具体调优案例分析可见：Flink on yarn双流join问题分析+性能调优思路

二. state backend

Flink状态后端主要负责两件事：本地的状态管理、将检查点（checkpoint）状态写入远程存储。

flink state可以存储在java堆内存内或者内存之外。

默认情况下，使用MemoryStateBackend，Flink的state会保存在taskManager的内存中，而checkpoint会保存在jobManager的内存中。

1. 三种状态后端

flink提供三种开箱即用的State Backend：

状态后端	数据存储	容量限制	场景
MemoryStateBackend	State:TaskManager 内存中 Checkpoint:存储在jobManager 内存	单个State maxStateSize默认为5M maxStateSize <= akka.frame.size默认10M Checkpoint总大小不能超过JobMananger的内存	本地测试状态比较少的作业不推荐生产环境中使用
FsStateBackend	State:TaskManager 内存 Checkpoint:外部文件系统（本地或HDFS）	单个TaskManager上State总量不能超过TM内存总数据大小不超过文件系统容量	窗口时间比较长，如分钟级别窗口聚合，Join等需要开启HA的作业可在生产环境中使用
RocksDBStateBackend	将所有的状态序列化之后, 存入本地的 RocksDB 数据库中.(一种 NoSql 数据库, KV 形式存储) State: TaskManager 中的KV数据库（实际使用内存+磁盘） Checkpoint:外部文件系统（本地或HDFS）	单TaskManager 上 State总量不超过其内存+磁盘大小,单 Key最大容量2G 总大小不超过配置的文件系统容量	超大状态作业需要开启HA的作业生产环境可用

2. 如何在hdfs中存储？

Keyed States 和 Operator States 会存储在一个带有编号的 chk 目录中，比如说一个 flink 任务的 Keyed States 的 subTask 个数是4，Operator States 对应的 subTask 也是 4，那么 chk 会存一个元数据文件 _metadata ，四个 Keyed States 文件，四个 Operator States 的文件。

也就是说 Keyed States 和 Operator States 会分别存储 subTask 总数个状态文件。

3. 设置checkpoint

一般需求，我们的 Checkpoint 时间间隔可以设置为分钟级别（1-5 分钟）。

3.1. 大状态下设置checkpoint

对于状态很大的任务每次 Checkpoint 访问 HDFS 比较耗时，可以设置为 5~10 分钟一次Checkpoint，并且调大两次 Checkpoint 之间的暂停间隔，例如设置两次 Checkpoint 之间至少暂停 4 或 8 分钟。

具体案例分析可见：Flink on yarn双流join问题分析+性能调优思路

3.2. EXACTLY_ONCE下设置分析checkpoint

如果 Checkpoint 语义配置为 EXACTLY_ONCE，那么在 Checkpoint 过程中还会存在 barrier 对齐的过程，可以通过 Flink Web UI 的 Checkpoint 选项卡来查看 Checkpoint 过程中各阶段的耗时情况，从而确定到底是哪个阶段导致 Checkpoint 时间过长然后针对性的解决问题。

三. State设置过期时间

使用 flink 进行实时计算中，会遇到一些状态数不断累积，导致状态量越来越大的情形。例如，作业中定义了超长的时间窗口，或者在动态表上应用了无限范围的 GROUP BY 语句，以及执行了没有时间窗口限制的双流 JOIN 等等操作。

对于这些情况，经常导致堆内存出现 OOM，或者堆外内存（RocksDB）用量持续增长导致超出容器的配额上限，造成作业的频繁崩溃。

从 Flink 1.6 版本开始引入了 State TTL 特性，该特性可以允许对作业中定义的 Keyed 状态进行超时自动清理，对于Table API 和 SQL 模块引入了空闲状态保留时间（Idle State Retention Time）进行状态管理。

1. datastream的TTL

要使用 State TTL 功能，首先要定义一个 StateTtlConfig 对象。State TTL功能所指定的过期时间并不是全局生效的，而是和某个具体的算子状态所绑定。

以下描述了state的构建、配置：过期时间、状态时间戳的更新，对过期数据的处理等内容。

 
StateTtlConfig ttlConfig = StateTtlConfig
    .newBuilder(Time.seconds(1)) //过期时间：上次访问的时间 +TTL 超过了当前时间，则表明状态过期了。
    .setUpdateType(StateTtlConfig.UpdateType.OnCreateAndWrite) //状态时间戳更新的时间
    .setStateVisibility(StateTtlConfig.StateVisibility.NeverReturnExpired) //已过期但是还未处理的状态怎么处理，NeverReturnExpired：一旦状态过期，则永远不会被返回给调用方
    //清理策略：
    .cleanupFullSnapshot() //对过期状态不主动处理。默认情况下，过期值只有在显式读出时才会被删除，例如通过调用 ValueState.value() 方法。
    .cleanupIncrementally(1024,true)//增量清理，可配置读取若干条记录就执行一次清理，并可指定每次清理多少条失效记录。
    .build();
    
ValueStateDescriptor<String> stateDescriptor = new ValueStateDescriptor<>("text state", String.class);
stateDescriptor.enableTimeToLive(ttlConfig);

TTL配置不是check/savepoints的一部分，而是Flink在当前运行的作业中如何处理它的一种方式。

小结：

state TTL 机制，应对通用的状态暴增特别有效。然而，机制不能保证一定可以及时清理掉失效的状态，以及目前仅支持 Processing Time 时间模式等等。

2.Table API和SQL的状态管理

针对 Table API 和 SQL 模块的持续查询/聚合语句，Flink 还提供了另一项失效状态清理机制，这就是 Idle State Retention Time。

2.1. 问题描述与分析

如下，官网的例子一个持续查询的分组语句，没有时间窗口的定义，理论上会无限地计算下去，但这里会出现一个问题：随着时间的推移，内存的状态会积累很多，直到状态达到了存储系统的极限，作业崩溃。

SELECT sessionId, COUNT(*) FROM clicks GROUP BY sessionId;

针对上面的问题，Flink 提出了空闲状态保留时间（Idle State Retention Time）的概念，如下描述：

通过为每个状态设置Timer，如果这个状态中途被访问过，则重新设置Timer；否则（如果状态一直没有被访问）Timer到期时做状态清理。

这样就可以确保每个状态能够被及时的清理。

2.2. 状态设置

streamTableEnvironment.getConfig().setIdleStateRetentionTime(
					Time.minutes(idleStateRetentionTime),
                    Time.of(idleStateRetentionTime * 60 + 5, TimeUnit.MINUTES));

注意：

旧版本 Flink 允许只指定一个参数，表示最早和最晚清理周期相同，但是这样可能会导致同一时间段有很多状态都到期，从而造成瞬间的处理压力。

新版本（1.11）的 Flink 要求两个参数之间的差距至少要达到 5 分钟，从而避免大量状态瞬间到期，对系统造成的冲击。

2.3. 实现逻辑与源码分析

使用CleanupState 来表示idle state retention time

//状态空闲时间timer的注册
public interface CleanupState {
    default void registerProcessingCleanupTimer(
            ValueState<Long> cleanupTimeState, //通过ValueState来维护状态清理时间
            long currentTime,
            long minRetentionTime,
            long maxRetentionTime,
            TimerService timerService)
            throws Exception {
        //最近一次要清理状态的时间
        Long curCleanupTime = cleanupTimeState.value();
 
        //如果curCleanupTime为空 或 维护的时间+最小的状态空闲时间大于curCleanupTime 
        if (curCleanupTime == null || (currentTime + minRetentionTime) > curCleanupTime) {
           //重新注册一个timer，
           //此时要注意：如果maxRetentionTime和minRetentionTime的间隔过小，就会频繁的产生timer与更新valuestate，维护timer的成本将会变大。
            long cleanupTime = currentTime + maxRetentionTime;
            timerService.registerProcessingTimeTimer(cleanupTime);
            //如果之前有timer则删除
            if (curCleanupTime != null) {
                timerService.deleteProcessingTimeTimer(curCleanupTime);
            }
            //并更新清理时间，用于触发下一次清理
            cleanupTimeState.update(cleanupTime);
        }
    }
}

当数据第一次出现，或者curTime+minRetentionTime超过了最近的清理时间，就用curTime+maxRetentionTime，创建新的Timer，用于触发下一次清理，如果有了过期的timer就删除。
所以如果maxRetentionTime和minRetentionTime的间隔过小，就会频繁的产生timer与更新valuestate，维护timer的成本将会变大。

参考：
Flink 状态管理详解（State TTL、Operator state、Keyed state）

Application的onLowMemory从Android API 34开始系统不再触发，从API 35开始废弃 zhangphil Android android
Application的onLowMemory从AndroidAPI34开始系统不再触发，从API35开始废弃Android的Application的onLowMemory()是在ComponentCallbacks定义实现，源代码链接https://android.googlesource.com/platform/frameworks/base/+/master/core/java/andro
深度解析：Java内部类与外部类的交互机制 hi星尘 java java 交互开发语言
1.内部类概述在Java中，**内部类（InnerClass）**是定义在另一个类内部的类。根据是否依赖外部类实例，内部类可分为：非静态内部类（成员内部类）：持有外部类的隐式引用，可访问其成员。静态内部类（StaticNestedClass）：不依赖外部类实例，需显式传递引用。局部内部类（LocalClass）：定义在方法或作用域内。匿名内部类（AnonymousClass）：无类名，直接实例化。
基于esbuild封装类似tsup工具 aiguangyuan 前端架构前端开发系统架构
在现代前端开发中，构建工具的选择直接影响着项目的开发效率和最终产物的性能。随着TypeScript的普及，开发者对高效、快速的TypeScript构建工具的需求日益增长。esbuild作为一款新兴的JavaScript打包器，以其惊人的构建速度引起了广泛关注，而tsup则是基于esbuild的一个优秀封装，专门为TypeScript库开发提供了零配置的便捷体验。本文将探讨如何基于esbuild核心
前端开发核心：HTML、CSS与JavaScript学习指南 Randy Rhoads
本文还有配套的精品资源，点击获取简介：HTML、CSS和JavaScript是前端开发的基础，分别负责网页的结构、样式和动态行为。学习这三种技术需要理解它们之间的关系及其协同工作的机制。本笔记提供了一个全面的复习资料，包括标签使用、CSS布局技巧、JavaScript基础语法和DOM操作，旨在帮助巩固知识点和发现潜在的学习盲点。同时，介绍了响应式设计、Web组件、ServiceWorker等现代前
java web5（黑马） rzl02 java 前端开发语言
Request&Response作用：Request：获取请求数据Response：设置响应数据Request继承体系1.Tomcat需要解析请求数据，封装为request对象，并且创建request对象传递到service方法中2.使用request对象，查阅JavaEEAPI文档的HttpServletRequest接口获取请求数据1.获取请求数据>请求行:GET/request-demo/r
jvm执行i++代码的步骤，内存中数据的流转过期小朋友、 jdk
大家好，今天看了一个java面试讲解课程，里面说i++，在jvm执行时，会被分成四步：1.主存中i的数值放到线程工作内存2.加一3.加一的值放回线程工作内存中4.线程工作内存中的值放回主存中使用idea编写了一个例子，获取jvm的汇编指令，使用指令说明，翻译过来在内存中数值流转。发现2,3是一个命令iadd。具体如下:例子：packagecom.wmr.jvmtest;publicclassIPl
java中next()和nextline()用法区别（详细说明）
直接给出总结:next()：当遇到空格/Tab键/回车截止读取,不包含空格/Tab键/回车,开头如果有空格/Tab/回车，直接无视，读取后面的字符，直到遇到空格/Tab键/回车截止读取；nextLine()：读取字符前后的空格/Tab键，有回车键时截止读取，包含回车键。注意:nextInt（）、nextdoublie（）、nextfloat（）和next（）方法的效果是一样的
Entity Framework 实体数据模型入门：从创建到实战应用 Leon@Lee 数据库
EntityFramework（简称EF）作为.NET平台下的ORM（对象关系映射）框架，极大地简化了数据库操作。本文将由浅入深，带您一步步了解EF实体数据模型的创建、配置、开发与使用，即使是新手也能快速上手。一、EF与ADO.NET：为何选择EF？在介绍EF之前，我们先看看传统的数据访问方式与EF的区别：ADO.NET的局限：直接编写SQL语句操作数据库，需要手动处理类型转换、SQL拼接等问题，
常见构建工具使用与原理浅析
1.初版构建工具1.1.GruntGrunt是前端第一个正式的构建工具，它基于Node.js开发。Grunt同样是基于插件实现功能拓展增强，但对于像Webpack上很多能力，如HMR、ScopeHoisting等都是不支持的，可以作为学习Webpack前的了解。Grunt更像是一种自动化的配置工具集，就如官方所说，Grunt是TheJavaScriptTaskRunner，每个Grunt任务通常必
在项目架构时，如何选择打包构建工具？ aiguangyuan 前端架构前端开发系统架构
在选择打包构建工具时，项目的具体需求、团队的技术栈、开发者的熟悉程度、以及项目的复杂度都是需要考虑的重要因素。1.项目规模与复杂度大型复杂项目：如果你的项目是一个大型复杂的单页应用程序（SPA），例如企业级应用，建议使用Webpack。Webpack的强大配置能力和丰富的插件生态系统能够满足复杂项目的各种需求，如代码拆分、缓存优化、懒加载等。中小型项目或库：如果是中小型项目或开发一个JavaScr
进程 ⇢ JVM ⇢ 线程＋内存关系 MYGAG jvm
.从零到跑起一个Java程序OS创建进程execvejava…→新进程的地址空间、handle、时间片就位。JavaLauncher进场可执行文件里的C/C++的main()解析参数，dlopenlibjvm.so/jvm.dll。JNI_CreateJavaVM诞生JVM实例△分配堆、元空间、代码缓存等△拉起GC/JIT/信号处理等守护线程把Launcher的原生线程变成Javamain线程开始
10.2 ChatGPT自动生成训练数据实战：37.2%准确率提升秘籍少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力 chatgpt 人工智能机器学习语言模型
ChatGPT自动生成训练数据实战：37.2%准确率提升秘籍使用ChatGPT自动设计生成训练数据的Prompt在大模型微调场景中，高质量训练数据的获取往往是制约模型效果的核心瓶颈。根据2023年GoogleResearch的实证研究，使用GPT-4生成的合成数据对LLaMA2进行微调，能达到人工标注数据85%的效果水平。本章将揭秘如何通过ChatGPT自动生成适配ChatGLM3的微调数据。一、
ModusToolbox 实战入门 - PSOC C3 Smart IO 与 GPIO 应用篇 WPG大大通 Infineon产线大大通软件 GPIO CPU 开发工具
摘要本文将带您了解PSOC™ControlC3MCU的架构与开发工具，并示范如何使用EclipseIDEforModusToolbox™创建项目。通过本次使用smartI/O外设的实作示例，您将学习如何将按钮输入引脚通过smartI/O连接至输出引脚，以驱动外部LED，在无需CPU参与的情况下完成初始化后自动运行，进一步体验PSOC™ControlC3的低功耗与高集成特性。软件下载与安装软件版本M
java并发编程--可见性、原子性、有序性 weixin_ab jvm jvm
在Java并发编程中，可见性、原子性和有序性是保证多线程程序正确性的三个重要特性：1.原子性（Atomicity）定义：原子性指的是一个操作是不可中断的，要么全部执行成功，要么全部不执行。就好像是一个“原子”，不可再分。在Java中，对基本数据类型（除long和double在某些平台上）的简单读写操作是原子的，但像i++这样的复合操作不是原子的。示例：publicclassAtomicityExa
Java自定义类热加载实现原理与实践 weixin_ab #类的加载机制 java类加载
Java自定义类热加载实现原理与实践在Java开发中，类热加载（ClassReloading）指在程序运行时动态替换已加载的类，避免重启应用。核心原理是通过自定义类加载器打破JVM类加载的固有规则，实现类的动态加载与更新。以下从实现原理、核心步骤、代码示例到生产实践展开详细解析。一、热加载核心原理：突破类加载机制限制1.类加载器的隔离性每个类加载器维护独立的命名空间，相同类名的类由不同加载器加载会
Spring Boot类加载机制深度剖析 weixin_ab #类的加载机制 java类加载
SpringBoot类加载机制深度剖析：从可执行Jar到自动配置的实现原理SpringBoot通过对Java类加载机制的定制化扩展，实现了可执行Jar包运行、自动配置、热部署等核心特性。其类加载机制既保留了JVM标准规范，又针对微服务架构和嵌入式容器进行了优化，以下从架构设计、核心组件、典型场景到源码实现展开深度解析。一、SpringBoot类加载器体系架构（对比独立Tomcat）1.简化的两层类
爆改RAG！用强化学习让你的检索增强生成系统“开挂”——从小白到王者的实战指南许泽宇的技术分享人工智能
“RAG不准？RL来救场！”——一位被RAG气哭的AI工程师前言：RAG的烦恼与AI炼丹师的自我修养在AI圈混久了，大家都知道RAG（Retrieval-AugmentedGeneration，检索增强生成）是大模型落地的“万金油”方案。无论是企业知识库、智能问答，还是搜索引擎升级，RAG都能插上一脚。但你用过RAG就知道，理想很丰满，现实很骨感。明明知识库里啥都有，问个“量子比特的数学表达式”，
【干货】深度解析个人IP打造：从定位到变现的全维度运营指南老蒋新思维创始人IP
在短视频浪潮席卷的当下，越来越多人意识到“个人IP”的商业价值。但许多人将其简单等同于“真人出镜发内容”或“企业找员工代言”，这种浅层认知往往导致运营陷入瓶颈。事实上，打造个人IP是一项系统性工程，需要从定位、内容、平台到商业体系的全链条规划。本文将聚焦「定位」这一核心基石，结合实战案例与趋势洞察，为创业者提供可落地的操作框架。一、定位本质：构建差异化价值坐标个人IP的定位绝非“选赛道”这么简单，
java类加载机制：Tomcat的类加载机制 weixin_ab #类的加载机制 java类加载
Tomcat类加载机制深度解析：打破双亲委派的Web容器实现Tomcat作为JavaWeb容器，其类加载机制为满足Web应用的隔离性、热部署和兼容性需求，对标准Java类加载机制进行了定制化扩展，核心是打破双亲委派模型并引入多层级类加载器。以下从架构设计、核心组件、热部署实现到典型问题展开解析。一、Tomcat类加载器层级架构（与标准JVM的区别）1.四层类加载器体系BootstrapClassL
从新闻到知识图谱：用大模型和知识工程“八步成诗”打造科技并购大脑许泽宇的技术分享知识图谱科技人工智能
一句话摘要：本文带你用现代NLP和知识图谱技术，把科技公司并购新闻变成结构化的知识大脑，过程全景揭秘，理论与实战齐飞，代码只用伪代码，干货与段子齐发，助你成为AI知识工程老司机！前言：为什么要把新闻变成知识图谱？想象一下，你是个投资分析师，老板让你一周内梳理全球科技并购大事件，找出谁在买谁、花了多少钱、背后有哪些大佬、涉及哪些新技术……你会怎么做？A.手动Ctrl+F，Excel狂敲，熬夜爆肝？B
EasyExcel 初使用—— Java 实现多种写入 Excel 功能 Java雪荷 EasyExcel java excel 开发语言 github
前言大家好，我是雪荷。之前有一篇博客（EasyExcel初使用——Java实现读取Excel功能_javaeasyexcel.read-CSDN博客）介绍了Java如何读取Excel表格，那么此篇博客就和大家介绍下Java如何利用EasyExcel写入Excel。EasyExcel官方网址：EasyExcel官方文档-基于Java的Excel处理工具|EasyExcel前置准备引入依赖先创建一个S
Spring Boot 牵手EasyExcel：解锁高效数据处理姿势灵犀学长 Spring Boot 全栈开发 spring boot java 架构微服务后端
引言在日常的Java开发中，处理Excel文件是一个极为常见的需求。无论是数据的导入导出，还是报表的生成，Excel都扮演着重要的角色。例如，在企业的财务管理系统中，需要将每月的财务数据导出为Excel报表，方便财务人员进行数据分析和审计；在人力资源管理系统中，可能需要导入员工的基本信息、考勤记录等数据到系统中。然而，传统的Excel处理方式，如使用POI等工具，虽然功能强大，但在面对复杂的业务场
Java 工作中常用案例 qq_4240 java
1.LocalDateTime获取某月的第一天开始时间和最后一天的结束时间/***获取指定年和月的第一天和最后一天*应用：数据库同步，本地库和其他库按照月份分组统计后，两两比对后，得到不相同的月份，*根据月份的第一天和最后一天，查询两个库具体值，做交集或差集，然后得到未同步*的数据后同步数据*2022-12xx*2022-11xx*@parammonth2022-12*@return*/publi
SVG格式深度解析与Path应用实战：从原理到企业级全场景开发（实战版）
一、简介在数字图形领域，SVG（ScalableVectorGraphics）凭借其矢量特性、可编辑性和交互能力，成为现代设计和开发的核心工具。本文将从SVG的基础原理出发，深入解析其技术特性，并与主流图像格式（如JPEG、PNG、PLT等）进行对比分析。通过企业级应用案例，结合代码示例和Mermaid图表，帮助开发者全面掌握SVG的应用场景与开发技巧，实现从零到一的高效实践。二、SVG格式的核心
搜索领域SEO进阶：内容优化与用户体验提升搜索引擎技术 ux ai
搜索领域SEO进阶：从关键词堆砌到用户价值——内容优化与体验升级的实战指南关键词SEO进阶、内容质量、用户体验、E-E-A-T、用户行为信号、结构化数据、页面速度优化摘要当“SEO=关键词堆砌”的时代成为历史，当搜索引擎算法从“识别文字”进化到“理解意图”，SEO从业者正面临一场从“技术投机”到“用户价值”的范式转移。本文将深度拆解搜索领域的进阶策略：从内容优化的核心逻辑（E-E-A-T框架、主题
探索 Vue.js 前端开发中的插件系统大厂前端小白菜 vue.js 前端 javascript ai
探索Vue.js前端开发中的插件系统关键词：Vue.js、插件系统、install方法、全局功能、代码复用、生命周期、模块化开发摘要：本文通过乐高积木的比喻，深入浅出地讲解Vue.js插件系统的核心原理。从install方法的工作原理到实战开发全局加载提示插件，揭秘如何通过插件机制实现功能扩展与代码复用，并探讨其在现代前端工程中的最佳实践。背景介绍目的和范围本文旨在帮助开发者理解Vue.js插件系
掌握大数据领域数据湖的部署要点
掌握大数据领域数据湖的部署要点关键词：数据湖,大数据部署,数据治理,存储架构,元数据管理,数据质量,湖仓一体摘要：在数据爆炸的时代，企业面临着"数据多却用不好"的困境——结构化数据藏在数据库里，非结构化数据堆在服务器上，半结构化数据散落在日志文件中。数据湖就像一个"智能中央仓库"，能统一存储所有类型的数据，并通过灵活的管理让数据"活起来"。本文将用"图书馆管理员建仓库"的故事，从概念理解、架构设计
Gradio全解13——MCP详解（2）——MCP能力协商与通信机制
Gradio全解13——MCP详解（2）——MCP能力协商与通信机制第13章MCP详解13.2MCP能力协商与通信机制13.2.1能力协商机制与消息规范1.能力协商机制2.消息规范及错误码13.2.2MCP通信机制1.协议层四种方法2.传输层机制：Stdio与StreamableHTTP3.Stdio与StreamableHTTP实战参考文献本章目录如下：《Gradio全解13——MCP详解（1）
使用Node.js命令行进行编程翠绿探寻 node.js vim 编辑器编程
Node.js是一个基于ChromeV8JavaScript引擎构建的运行时环境，它可以让开发者使用JavaScript语言编写服务器端代码。Node.js命令行界面（CLI）是一个强大的工具，它提供了与Node.js交互和执行JavaScript代码的能力。在本文中，我们将介绍如何在Node.js命令行中使用JavaScript进行编程，并提供相应的源代码示例。1.安装Node.js首先，我们需
Kafka系列之：不删除Kafka Topic，清理Kafka Topic中的数据快乐骑行^_^ Kafka Kafka系列不删除Kafka Topic 清理Kafka Topic数据
Kafka系列之：不删除KafkaTopic，清理KafkaTopic中的数据一、需求二、Java删除Topic中数据三、python删除Topic中数据一、需求需要清理topic中的数据但是不能通过删除topic删除数据，则采取基于topic的offset删除topic中的数据二、Java删除Topic中数据HashMapdeleteRecords=newHashMap<>();这一行创建了一个
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &