最笨的羊羊

Iceberg从入门到精通系列之十八：一篇文章深入了解Flink对Iceberg的支持

一、Flink支持的iceberg功能
二、使用Flink SQL Client时的准备
三、Flink's Python API
四、添加目录。
五、Hive catalog
六、类型转换
七、待支持的功能

Apache Iceberg 支持 Apache Flink 的 DataStream API 和 Table API。

一、Flink支持的iceberg功能

功能支持	Flink	注意事项
SQL create catalog	✔️
SQL create database	✔️
SQL create table	✔️
SQL create table like	✔️
SQL alter table	✔️	仅支持更改表属性，不支持列和分区更改
SQL drop_table	✔️
SQL select	✔️	支持流式和批处理模式
SQL insert into	✔️	支持流式和批处理模式
SQL insert overwrite	✔️
DataStream read	✔️
DataStream append	✔️
DataStream overwrite	✔️
Metadata tables	✔️
Rewrite files action	✔️

二、使用Flink SQL Client时的准备

在 Flink 中创建 Iceberg 表，建议使用 Flink SQL Client，这样用户更容易理解概念。

从 Apache 下载页面下载 Flink。 Iceberg 在编译 Apache Iceberg-flink-runtime jar 时使用 Scala 2.12，因此建议使用与 Scala 2.12 捆绑在一起的 Flink 1.16。

FLINK_VERSION=1.16.1
SCALA_VERSION=2.12
APACHE_FLINK_URL=https://archive.apache.org/dist/flink/
wget ${APACHE_FLINK_URL}/flink-${FLINK_VERSION}/flink-${FLINK_VERSION}-bin-scala_${SCALA_VERSION}.tgz
tar xzvf flink-${FLINK_VERSION}-bin-scala_${SCALA_VERSION}.tgz

在 Hadoop 环境中启动独立的 Flink 集群：

# HADOOP_HOME is your hadoop root directory after unpack the binary package.
APACHE_HADOOP_URL=https://archive.apache.org/dist/hadoop/
HADOOP_VERSION=2.8.5
wget ${APACHE_HADOOP_URL}/common/hadoop-${HADOOP_VERSION}/hadoop-${HADOOP_VERSION}.tar.gz
tar xzvf hadoop-${HADOOP_VERSION}.tar.gz
HADOOP_HOME=`pwd`/hadoop-${HADOOP_VERSION}

export HADOOP_CLASSPATH=`$HADOOP_HOME/bin/hadoop classpath`

# Start the flink standalone cluster
./bin/start-cluster.sh

启动 Flink SQL 客户端。 Iceberg项目中有一个单独的flink-runtime模块来生成捆绑的jar，可以直接由Flink SQL客户端加载。要手动构建 flink-runtime 捆绑的 jar，请构建 Iceberg 项目，它将在 /flink-runtime/build/libs 下生成 jar。或者从 Apache 存储库下载 flink-runtime jar。

# HADOOP_HOME is your hadoop root directory after unpack the binary package.
export HADOOP_CLASSPATH=`$HADOOP_HOME/bin/hadoop classpath`   

./bin/sql-client.sh embedded -j <flink-runtime-directory>/iceberg-flink-runtime-1.16-1.3.0.jar shell

默认情况下，Iceberg 附带用于 Hadoop 目录的 Hadoop jar。要使用 Hive 目录，请在打开 Flink SQL 客户端时加载 Hive jar。幸运的是，Flink 为 SQL 客户端提供了捆绑的 Hive jar。有关如何下载依赖项并开始使用的示例：

# HADOOP_HOME is your hadoop root directory after unpack the binary package.
export HADOOP_CLASSPATH=`$HADOOP_HOME/bin/hadoop classpath`

ICEBERG_VERSION=1.3.0
MAVEN_URL=https://repo1.maven.org/maven2
ICEBERG_MAVEN_URL=${MAVEN_URL}/org/apache/iceberg
ICEBERG_PACKAGE=iceberg-flink-runtime
wget ${ICEBERG_MAVEN_URL}/${ICEBERG_PACKAGE}-${FLINK_VERSION_MAJOR}/${ICEBERG_VERSION}/${ICEBERG_PACKAGE}-${FLINK_VERSION_MAJOR}-${ICEBERG_VERSION}.jar -P lib/

HIVE_VERSION=2.3.9
SCALA_VERSION=2.12
FLINK_VERSION=1.16.1
FLINK_CONNECTOR_URL=${MAVEN_URL}/org/apache/flink
FLINK_CONNECTOR_PACKAGE=flink-sql-connector-hive
wget ${FLINK_CONNECTOR_URL}/${FLINK_CONNECTOR_PACKAGE}-${HIVE_VERSION}_${SCALA_VERSION}/${FLINK_VERSION}/${FLINK_CONNECTOR_PACKAGE}-${HIVE_VERSION}_${SCALA_VERSION}-${FLINK_VERSION}.jar

./bin/sql-client.sh embedded shell

三、Flink’s Python API

使用 pip 安装 Apache Flink 依赖项：

pip install apache-flink==1.16.1

提供iceberg-flink-runtime jar的file://路径，可以通过构建项目并查看/flink-runtime/build/libs获得，或者从Apache官方下载存储库。第三方 jar 可以通过以下方式添加到 pyflink：

env.add_jars(“文件:///my/jar/path/connector.jar”)
table_env.get_config().get_configuration().set_string(“pipeline.jars”, “file:///my/jar/path/connector.jar”)

官方文档中也提到了这一点。下面的示例使用 env.add_jars(…)：

import os

from pyflink.datastream import StreamExecutionEnvironment

env = StreamExecutionEnvironment.get_execution_environment()
iceberg_flink_runtime_jar = os.path.join(os.getcwd(), "iceberg-flink-runtime-1.16-1.3.0.jar")

env.add_jars("file://{}".format(iceberg_flink_runtime_jar))

接下来，创建StreamTableEnvironment并执行Flink SQL语句。以下示例展示了如何通过 Python Table API 创建自定义目录：

from pyflink.table import StreamTableEnvironment
table_env = StreamTableEnvironment.create(env)
table_env.execute_sql("""
CREATE CATALOG my_catalog WITH (
    'type'='iceberg', 
    'catalog-impl'='com.my.custom.CatalogImpl',
    'my-additional-catalog-config'='my-value'
)
""")

运行查询：

(table_env
    .sql_query("SELECT PULocationID, DOLocationID, passenger_count FROM my_catalog.nyc.taxis LIMIT 5")
    .execute()
    .print())

+----+----------------------+----------------------+--------------------------------+
| op |         PULocationID |         DOLocationID |                passenger_count |
+----+----------------------+----------------------+--------------------------------+
| +I |                  249 |                   48 |                            1.0 |
| +I |                  132 |                  233 |                            1.0 |
| +I |                  164 |                  107 |                            1.0 |
| +I |                   90 |                  229 |                            1.0 |
| +I |                  137 |                  249 |                            1.0 |
+----+----------------------+----------------------+--------------------------------+
5 rows in set

四、添加目录。

Flink 支持使用 Flink SQL 创建目录。

目录配置

通过执行以下查询来创建和命名目录（将替换为您的目录名称，将 = 替换为目录实现配置）：

CREATE CATALOG <catalog_name> WITH (
  'type'='iceberg',
  ``=``
);

以下属性可以全局设置，并且不限于特定的目录实现：

type：必须是iceberg。（必需的）
catalog-type：hive、hadoop 或rest 用于内置目录，或未设置以使用catalog-impl 实现自定义目录。（选修的）
Catalog-impl：自定义目录实现的完全限定类名。如果未设置目录类型，则必须设置。（选修的）
property-version：描述属性版本的版本号。如果属性格式发生更改，此属性可用于向后兼容。当前属性版本为1。（可选）
cache-enabled：是否启用目录缓存，默认值为true。（选修的）
cache.expiration-interval-ms：目录条目在本地缓存多长时间，以毫秒为单位；负值如 -1 将禁用过期，值 0 不允许设置。默认值为-1。（选修的）

五、Hive catalog

这将创建一个名为 hive_catalog 的 Iceberg 目录，可以使用 ‘catalog-type’=‘hive’ 进行配置，该目录从 Hive 元存储加载表：

CREATE CATALOG hive_catalog WITH (
  'type'='iceberg',
  'catalog-type'='hive',
  'uri'='thrift://localhost:9083',
  'clients'='5',
  'property-version'='1',
  'warehouse'='hdfs://nn:8020/warehouse/path'
);

如果使用 Hive 目录，可以设置以下属性：

uri：Hive 元存储的 Thrift URI。（必需的）
client：Hive Metastore 客户端池大小，默认值为 2。（可选）
warehouse：Hive仓库位置，如果既没有设置hive-conf-dir来指定包含hive-site.xml配置文件的位置，也没有在classpath中添加正确的hive-site.xml，则应指定此路径。
hive-conf-dir：包含 hive-site.xml 配置文件的目录路径，该文件将用于提供自定义 Hive 配置值。如果同时设置 hive-conf-dir 和仓库，则 /hive-site.xml（或类路径中的 hive 配置文件）中的 hive.metastore.warehouse.dir 值将被仓库值覆盖创建iceberg目录。
hadoop-conf-dir：包含 core-site.xml 和 hdfs-site.xml 配置文件的目录路径，这些文件将用于提供自定义 Hadoop 配置值。

创建表

CREATE TABLE `hive_catalog`.`default`.`sample` (
    id BIGINT COMMENT 'unique id',
    data STRING
);

写数据

要将新数据附加到具有 Flink 流作业的表中，请使用 INSERT INTO：

INSERT INTO `hive_catalog`.`default`.`sample` VALUES (1, 'a');
INSERT INTO `hive_catalog`.`default`.`sample` SELECT id, data from other_kafka_table;

要将表中的数据替换为查询结果，请在批处理作业中使用 INSERT OVERWRITE（flink 流作业不支持 INSERT OVERWRITE）。覆盖是 Iceberg 表的原子操作。

具有 SELECT 查询生成的行的分区将被替换，例如：

INSERT OVERWRITE `hive_catalog`.`default`.`sample` VALUES (1, 'a');

Iceberg 还支持通过选择值覆盖给定分区：

INSERT OVERWRITE `hive_catalog`.`default`.`sample` PARTITION(data='a') SELECT 6;

Flink 原生支持将 DataStream 和 DataStream 写入iceberg表。

StreamExecutionEnvironment env = ...;

DataStream<RowData> input = ... ;
Configuration hadoopConf = new Configuration();
TableLoader tableLoader = TableLoader.fromHadoopTable("hdfs://nn:8020/warehouse/path", hadoopConf);

FlinkSink.forRowData(input)
    .tableLoader(tableLoader)
    .append();

env.execute("Test Iceberg DataStream");

分支写入

FlinkSink 中的 toBranch API 还支持写入 Iceberg 表中的分支。

FlinkSink.forRowData(input)
    .tableLoader(tableLoader)
    .toBranch("audit-branch")
    .append();

读
使用以下语句提交 Flink 批处理作业：

-- Execute the flink job in batch mode for current session context
SET execution.runtime-mode = batch;
SELECT * FROM `hive_catalog`.`default`.`sample`;

Iceberg 支持处理从历史快照 ID 开始的 Flink 流作业中的增量数据：

-- Submit the flink job in streaming mode for current session.
SET execution.runtime-mode = streaming;

-- Enable this switch because streaming read SQL will provide few job options in flink SQL hint options.
SET table.dynamic-table-options.enabled=true;

-- Read all the records from the iceberg current snapshot, and then read incremental data starting from that snapshot.
SELECT * FROM `hive_catalog`.`default`.`sample` /*+ OPTIONS('streaming'='true', 'monitor-interval'='1s')*/ ;

-- Read all incremental data starting from the snapshot-id '3821550127947089987' (records from this snapshot will be excluded).
SELECT * FROM `hive_catalog`.`default`.`sample` /*+ OPTIONS('streaming'='true', 'monitor-interval'='1s', 'start-snapshot-id'='3821550127947089987')*/ ;

SQL 也是检查表的推荐方法。要查看表中的所有快照，请使用快照元数据表：

SELECT * FROM `hive_catalog`.`default`.`sample`.`snapshots`

Iceberg支持Java API中的流式或批量读取：

DataStream<RowData> batch = FlinkSource.forRowData()
     .env(env)
     .tableLoader(tableLoader)
     .streaming(false)
     .build();

六、类型转换

Iceberg 对 Flink 的集成会自动在 Flink 和 Iceberg 类型之间进行转换。当写入 Flink 不支持的类型（例如 UUID）的表时，Iceberg 将接受并转换 Flink 类型的值。

Flink 到 Iceberg

Flink 类型按照下表转换为 Iceberg 类型：

Flink	Iceberg	Notes
boolean	boolean
tinyint	integer
smallint	integer
integer	integer
bigint	long
float	float
double	double
char	string
varchar	string
string	string
binary	binary
varbinary	fixed
decimal	decimal
date	date
time	time
timestamp	timestamp without timezone
timestamp_ltz	timestamp with timezone
array	list
map	map
multiset	map
row	struct
raw		Not supported
interval		Not supported
structured		Not supported
timestamp with zone		Not supported
distinct		Not supported
null		Not supported
symbol		Not supported
logical		Not supported

Iceberg to Flink

Iceberg 类型按照下表转换为 Flink 类型：

Iceberg	Flink
boolean	boolean
struct	row
list	array
map	map
integer	integer
long	bigint
float	float
double	double
date	date
time	time
timestamp without timezone	timestamp(6)
timestamp with timezone	timestamp_ltz(6)
string	varchar(2147483647)
uuid	binary(16)
fixed(N)	binary(N)
binary	varbinary(2147483647)
decimal(P, S)	decimal(P, S)

七、待支持的功能

目前的 Flink Iceberg 集成工作尚不支持一些功能：

不支持创建隐藏分区的Iceberg表
不支持创建带有计算列的Iceberg表
不支持创建带水印的Iceberg表
不支持添加列、删除列、重命名列、更改列，会在flink 1.18.0版本中支持

Flink CDC的安装配置我的K8409 Flink flink 大数据
FlinkCDC是基于ApacheFlink构建的，用于捕获数据库表中数据的变更情况，包括数据的插入、更新和删除操作，并能将这些变更数据以流的形式实时传输到其他系统中进行处理和分析。传统的数据同步工具往往是定时任务，存在时间延迟。而FlinkCDC能实时捕获数据库的变更数据，一旦有数据变化，立即将其同步到目标系统，让数据在各个系统之间保持高度一致，几乎不存在延迟。CDC含义：变更数据捕获（Chan
Flink整合Hudi及使用我的K8409 Flink flink 服务器 linux
1、jar包上传上传jar包即可完成整合#1、将hudi-flink1.15-bundle-0.15.0.jar包上传到flink的lib目录下/usr/local/soft/flink-1.15.3/lib--如果没有启动集群，直接忽略#2、重启flink的集群yarnapplication-listyarnapplication-killapplication_1706339492248_00
计算机编程中的事件驱动架构在提升应用程序响应性方面的作用与实现借口热点资讯
博客主页：借口的CSDN主页⏩文章专栏：《热点资讯》计算机编程中的事件驱动架构在提升应用程序响应性方面的作用与实现计算机编程中的事件驱动架构在提升应用程序响应性方面的作用与实现计算机编程中的事件驱动架构在提升应用程序响应性方面的作用与实现引言事件驱动架构概述定义历史背景核心组件事件源（EventSource）事件处理器（EventHandler）中介者（Mediator）消息队列（MessageQ
大数据笔记之 Flink1.17 算子凡许真大数据 flink1.17 算子
文章目录前言一、Partition分区（物理分区）1.1随机分区shuffle1.2轮询分区rebalance1.3重缩放分区rescale1.4广播分区broadcast1.5全局分区global1.6keyby1.7自定义分区Custom二、transform2.1flatMap2.2filter2.3RichFunction2.4map三、Aggregate聚合3.1keyBy()3.2ma
JavaScript中的隐式类型转换阿珊和她的猫 javascript 开发语言 ecmascript
前端开发工程师、技术日更博主、已过CET6阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1牛客高级专题作者、打造专栏《前端面试必备》、《2024面试高频手撕题》蓝桥云课签约作者、上架课程《Vue.js和Egg.js开发企业级健康管理项目》、《带你从入门到实战全面掌握uni-app》前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。文章
TDengine 做为 FLINK 数据源技术参考手册 TDengine （老段） tdengine flink 大数据涛思数据时序数据库数据库
ApacheFlink是一款由Apache软件基金会支持的开源分布式流批一体化处理框架，可用于流处理、批处理、复杂事件处理、实时数据仓库构建及为机器学习提供实时数据支持等诸多大数据处理场景。与此同时，Flink拥有丰富的连接器与各类工具，可对接众多不同类型的数据源实现数据的读取与写入。在数据处理的过程中，Flink还提供了一系列可靠的容错机制，有力保障任务即便遭遇意外状况，依然能稳定、持续运行。借
【ComfyUI专栏】ComfyUI的缺失节点的安装雾岛心情 ComfyUI AIGC
在使用ComfyUI过程中，我们可能会碰到经常要去各类网站下载工作流进行内容生成。下面的内容是在openart中下载工作流节点的操作。常规的云端生图节点包含如下的网站：Civital.comEsheep.comOpenart.ai各类工作流的格式都是Json格式，但是在去进行内容生成的过程中，我们总数会发现工作流中缺少一些节点，这些节点确实原因非常简单，是因为云端工作流的节点相比本地节点要多，而且
【自我提升】一、Hyperledger Fabric 概念梳理记录菌 hyperledger fabric hyperledger
写在前面：最近因为业务需要，开始学习HyperledgerFabric了，做java全栈工程师可真难搞。现在算是啥类型的都在涉及了，现在这个技术啥都不懂，就先开个学习专栏，记录记录。顺带也给各位道友参考参考。目录1.什么是hyperledger2.什么是HyperledgerFabric2.1主要特点2.2应用场景3.关键名词4.通道概念4.1通道的关键特性如下：4.2通道的工作机制：5.步骤简单
深入详解使用 RabbitMQ 过程中涉及到的多个细节问题（面试可用） dvlinker C/C++实战专栏 C/C++软件开发从入门到实战 rabbitmq 面试分布式
目录1、基础类问题2、cluster相关问题3、综合性问题4、参考资料C++软件异常排查从入门到精通系列教程（专栏文章列表，欢迎订阅，持续更新...）https://blog.csdn.net/chenlycly/article/details/125529931
Python实现链接MinIO，并将文件数据从MinIO批量下载并保存到本地写python的鑫哥 Python课堂 python MinIO 文件下载数据存储存储桶 Buckets 文件夹下载
前言本文是该专栏的第43篇，后面会持续分享python的各种干货知识，值得关注。MinIO是一个高性能的对象存储服务，它兼容亚马逊S3云存储服务接口，非常适合于存储大容量非结构化的数据，比如说“图片、视频、日志文件、备份数据和容器/虚拟机镜像”等。MinIO原生支持Kubernetes，可以用于构建云存储服务。MinIO可以在标准硬件上运行，非常适合私有云和边缘计算场景。MinIO提供了存储桶级粒
【SpringMVC】——Json数据交互处理 Y小夜 ssm框架 json
个人主页：【Y小夜】作者简介：一位双非学校的大二学生，编程爱好者，专注于基础和实战分享，欢迎私信咨询！入门专栏：【MySQL，Java基础，Rust】热门专栏：【Python，Javaweb，Vue框架】感谢您的点赞、关注、评论、收藏、是对我最大的认可和支持！❤️目录Json概述Json构成要素JSON与JavaScript的关系JSON的优点JSON的应用JSON工具的使用返回json字符串统一
使用异步任务队列与事件驱动架构提升Serverless应用的实时处理能力与资源利用率的技术详解瑕疵热点资讯
博客主页：瑕疵的CSDN主页Gitee主页：瑕疵的gitee主页⏩文章专栏：《热点资讯》使用异步任务队列与事件驱动架构提升Serverless应用的实时处理能力与资源利用率的技术详解使用异步任务队列与事件驱动架构提升Serverless应用的实时处理能力与资源利用率的技术详解使用异步任务队列与事件驱动架构提升Serverless应用的实时处理能力与资源利用率的技术详解引言异步任务队列概述定义与特点
2.3、numpy 数组：广播机制、遍历数组融码一生 Python数据处理与分析 numpy numpy python 开发语言数据分析
点击上方分类专栏、进行系统性学习（文末可扫码领取资料）1、广播机制NumPy中的广播机制（Broadcast）旨在解决不同形状数组之间的算术运算问题。如果进行运算的两个数组形状完全相同，它们直接可以做相应的运算。importnumpyasnpa=np.array([0.1,0.2,0.3,0.4])b=np.array([10,20,30,40])c=a*b#jy:[1.4.9.16.]print
【YOLO11改进 - Backbone主干】LSKNet：旋转目标检测新网络,通过DW卷积核和空间选择机制来动态调整目标的感受野 YOLO大师目标检测网络人工智能 yolov11 YOLO python 计算机视觉
YOLOv11目标检测创新改进与实战案例专栏文章目录：YOLOv11创新改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLOv11目标检测创新改进与实战案例文章目录YOLOv11目标检测创新改进与实战案例专栏介绍摘要创新点文章链接基本原理**LSKNet的结构**3.2大核卷积3.3空间核选择核心代码YOLO11引入代码tasks注册步骤1
Docker 入门到精通专栏--2.2 容器 (Container) xiaoheshang_123 eureka java 云原生
目录2.2容器(Container)2.2.1容器的生命周期管理2.2.2启动、停止、删除容器2.2.3查看容器状态与日志总结2.2容器(Container)容器是Docker镜像的运行实例，它提供了一个独立的、隔离的运行环境，包含了自己的文件系统、进程空间和网络栈。容器化技术使得应用程序可以在不同的环境中保持一致的行为，并且可以快速启动和停止。本节将详细介绍容器的生命周期管理、如何启动、停止和删
固件开发项目实例1000例专栏--基础知识：嵌入式系统概览 xiaoheshang_123 固件开发项目实例1000例专栏固件
目录嵌入式系统概览1.嵌入式系统定义2.组成部分3.开发环境4.设计流程5.应用领域6.发展趋势“嵌入式系统概览”作为基础知识部分的第一章节，旨在为读者提供一个全面且深入的理解，关于什么是嵌入式系统、它们的工作原理、应用场景以及开发流程等基本概念。以下是这一章节的详细介绍：嵌入式系统概览1.嵌入式系统定义嵌入式系统是一种专用计算机系统，设计用于执行特定任务或一组任务。它们通常被集成到更大的机械或电
固件开发项目实例1000例专栏--基础知识：微控制器架构 xiaoheshang_123 固件开发项目实例1000例专栏嵌入式硬件
目录微控制器架构1.微控制器概述2.微控制器的主要组成部分3.微控制器的工作原理4.常见的微控制器架构5.微控制器的选择6.实践案例小结“固件开发项目1000例”专栏中，“微控制器架构”是基础知识部分的重要一章。这一章节旨在帮助读者深入了解微控制器的基本结构、工作原理及其关键组成部分。以下是这一章节的详细介绍：微控制器架构1.微控制器概述微控制器（MicrocontrollerUnit,MCU）是
Rust语言进阶之enumerate用法实例(九十六) Android系统攻城狮 rust 开发语言后端
简介：CSDN博客专家、《Android系统多媒体进阶实战》一书作者新书发布：《Android系统多媒体进阶实战》优质专栏：Audio工程师进阶系列【原创干货持续更新中……】优质专栏：多媒体系统工程师系列【原创干货持续更新中……】优质视频课程：AAOS车载系统+AOSP14系统攻城狮入门视频实战课人生格言：人生从来没有捷径，只有行动才是治疗恐惧和懒惰的唯一良药.更多原创,欢迎关注：Android系
对抗训练对模型性能有何影响？借雨醉东风热点追踪人工智能机器学习深度学习
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
Python从0到100（八十六）：神经网络-ShuffleNet通道混合轻量级网络的深入介绍是Dream呀 Python python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
Vue3实现酷炫打字机效果：让你的网站文字动起来陈书予三十天精通 Vue 3 (含示例代码和代码说明)vue.js javascript 前端 vue elementui
✅创作者：陈书予个人主页：陈书予的个人主页陈书予的个人社区，欢迎你的加入:陈书予的社区专栏地址:三十天精通Vue3文章目录引言一、介绍1.1什么是酷炫打字机效果1.2Vue3框架简介二、创建Vue3项目2.1安装VueCLI2.2创建Vue3项目2.3运行项目三、实现酷炫打字机效果3.1准备工作3.2创建Typewriter组件3.3实现打字机效果四、优化酷炫打字机效果4.1优化Typewrite
Python 运维（二）：Python 虚拟环境水滴技术 Python入门核心技术 python linux 开发语言虚拟环境
本文收录于《Python入门核心技术》专栏，专栏总目录：点这里，订阅后可阅读专栏内所有文章。大家好，我是水滴~~本文介绍了如何创建和使用Python虚拟环境，以及如何管理项目的依赖库。通过合理使用虚拟环境，你可以更好地组织和管理Python项目，提高开发效率和代码可靠性。文章内容包含大量的示例代码，希望能够帮助新手同学快速入门。文章目录1.什么是Python虚拟环境？2.创建Python虚拟环境2
2025数学建模美赛C题【Models for Olympic Medal Tables】第一问步入烟尘 2025数学建模美赛C题 2025数学建模美赛数学建模奥运会历史奖牌
本文为个人解题笔记，仅供参考学习。本文C题的第一问。其他问题均在本专栏内，订阅一次，全部可见。文章目录问题1解题全流程解题完整过程：建立预测奥运会奖牌数的数学模型1.数据分析与清理1.1数据来源与结构1.2数据清理2.探索性数据分析(EDA)2.1国家奖牌分布趋势2.2奖牌与赛事数量的关系2.3主办国优势分析3.模型建立3.1奖牌数预测模型3.2奖牌首次获得预测模型3.3奖牌分布与赛事类型关联模型
【信息系统项目管理师-选择真题】2005下半年综合知识答案和详解数据知道信息系统项目管理师(软考高级)数据库软考高级高项高项论文综合知识信息系统项目管理师
更多内容请见：备考信息系统项目管理师-专栏介绍和目录文章目录【第1题】【第2题】【第3题】【第4题】【第5题】【第6题】【第7~8题】【第9~10题】【第11题】【第12题】【第13题】【第14题】【第15题】【第16题】【第17题】【第18题】【第19题】【第20题】【第21题】【第22题】【第23题】【第24~25题】【第26题】【第27题】【第28题】【第29题】【第30题】【第31题】【第
『OpenCV-Python』Trackbar控件的用法
点赞+关注+收藏=学会了推荐关注《OpenCV-Python专栏》在OpenCV中，Trackbar控件（滑块）是一个非常常用的GUI组件，用于在图像处理和计算机视觉任务中进行交互式调整参数。比如说，加载一个图片，通过一个滑块调整图片的亮度，这样便于我们用肉眼观察图片的变化。Trackbar允许用户通过拖动滑块来调整参数的值，并且会实时更新显示结果。比如上图这个例子，创建了3个Trackbar控件
『OpenCV-Python』鼠标事件 opencv
点赞+关注+收藏=学会了在使用OpenCV进行图像处理时，有时需要与图像进行交互，例如选择感兴趣区域（ROI）、标注关键点、调整参数、获取图片指定位置的颜色值等。OpenCV提供了鼠标事件支持，可以在图像窗口中通过鼠标实现丰富的交互功能。推荐《OpenCV专栏》用到的方法是cv2.setMouseCallback(window_name,on_mouse,param=None)，用这个方法监听鼠标
『OpenCV-Python』视频的读取和保存
点赞+关注+收藏=学会了推荐关注《OpenCV-Python专栏》上一讲介绍了OpenCV的读取图片的方法，这一讲简单聊聊OpenCV读取和保存视频。视频的来源主要有2种，一种是本地视频文件，另一种是实时视频流，比如手机和电脑的摄像头。要读取这两种视频的方法都是一样的，只是传的参数不同而已。读取摄像头视频读取摄像头的内容并显示出来需要几步获取摄像头内容逐帧渲染importcv2cap=cv2.Vi
YOLO系列之训练环境（GPU）搭建篇 w94ghz YOLO改进系列 YOLOv8改进系列 YOLO 深度学习人工智能 python 目标检测
YOLOv8专栏导航：点击此处跳转Pytorch环境配置（Windows）Anaconda安装此处下载安装即可⭐温馨提示：安装路径
YOLOv10改进策略【注意力机制篇】| EMA 即插即用模块，提高远距离建模依赖（含二次创新） Limiiiing YOLOv10改进专栏 YOLO 目标跟踪计算机视觉深度学习
一、本文介绍本文记录的是基于EMA模块的YOLOv10目标检测改进方法研究。EMA认为跨维度交互有助于通道或空间注意力预测，并且解决了现有注意力机制在提取深度视觉表示时可能带来的维度缩减问题。在改进YOLOv10的过程中能够为高级特征图产生更好的像素级注意力，能够建模长程依赖并嵌入精确的位置信息。专栏目录：YOLOv10改进目录一览|涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF
【Codecs系列】H.266/VVC视频编码标准技术系列汇总飞翔的鲲 H.266 VVC 视频编码 codec VTM
DATE：2020.9.30文章目录1、H.266/VCC标准专栏2、H.266/VCC视频编码标准技术汇总1、H.266/VCC标准专栏视音频技术之H.266/VVC2、H.266/VCC视频编码标准技术汇总【Codecs系列】H.266QTBT(QuadtreeplusBinaryTree)块结构介绍【Codecs系列】H.266/VVC视频编码标准(一)：相关网址【Codecs系列】H
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Iceberg从入门到精通系列之十八：一篇文章深入了解Flink对Iceberg的支持