一瓢一瓢的饮 alanchan

Flink（十四）Flink 的table api与sql之数据类型: 内置数据类型以及它们的属性

Flink 系列文章

Flink（一）1.12.7或1.13.5详细介绍及本地安装部署、验证
Flink（二）1.13.5二种部署方式(Standalone、Standalone HA )、四种提交任务方式（前两种及session和per-job）验证详细步骤
Flink（三）flink重要概念（api分层、角色、执行流程、执行图和编程模型）及dataset、datastream详细示例入门和提交任务至on yarn运行
Flink（四）介绍Flink的流批一体、transformations的18种算子详细介绍、Flink与Kafka的source、sink介绍
Flink（五）source、transformations、sink的详细示例（一）
Flink（五）source、transformations、sink的详细示例（二）-source和transformation示例
Flink（五）source、transformations、sink的详细示例（三）-sink示例
Flink（六）Flink四大基石之Window详解与详细示例（一）
Flink（六）Flink四大基石之Window详解与详细示例（二）
Flink（七）Flink四大基石之Time和WaterMaker详解与详细示例（watermaker基本使用、kafka作为数据源的watermaker使用示例以及超出最大允许延迟数据的接收实现）
Flink（八）Flink四大基石之State概念、使用场景、持久化、批处理的详解与keyed state和operator state、broadcast state使用和详细示例
Flink（九）Flink四大基石之Checkpoint容错机制详解及示例（checkpoint配置、重启策略、手动恢复checkpoint和savepoint）
Flink（十）source、transformations、sink的详细示例（二）-source和transformation示例【补充示例】
Flink（十一）Flink配置flink-conf.yaml详细说明（HA配置、checkpoint、web、安全、zookeeper、historyserver、workers、zoo.cfg）
Flink（十二）Flink source和sink 的 clickhouse 详细示例
Flink（十三）Flink 的table api与sql的基本概念、通用api介绍
Flink（十四）Flink 的table api与sql之数据类型: 内置数据类型以及它们的属性
Flink（十五）Flink 的table api与sql之流式概念-配置时间属性和如何处理更新结果
Flink（十六）Flink 的table api与sql之连接外部系统: 读写外部系统的连接器和格式
Flink（十七）Flink 的table api与sql之Table API: Table API 支持的操作
Flink（十八）Flink 的table api与sql之SQL: SQL 支持的操作和语法
Flink（十九）Flink 的table api与sql之内置函数: Table API 和 SQL 中的内置函数
Flink（二十）Flink 的table api与sql之SQL Client: 不用编写代码就可以尝试 Flink SQL，可以直接提交 SQL 任务到集群上
Flink（二十一）Flink 的table api与sql之table api与sql使用示例

文章目录

Flink 系列文章
一、Flink SQL数据类型介绍
- 1、数据类型
- 2、Table API 中的数据类型
二、Flink SQL 数据类型种类
- 1、Character Strings
- - 1）、CHAR
  - 2）、VARCHAR / STRING
- 2、Binary Strings
- - 1）、BINARY
  - 2）、VARBINARY / BYTES
- 3、Exact Numerics
- - 1）、DECIMAL
  - 2）、TINYINT
  - 3）、SMALLINT
  - 4）、INT
  - 5）、BIGINT
- 4、Approximate Numerics
- - 1）、FLOAT
  - 2）、DOUBLE
- 5、Date and Time
- - 1）、DATE
  - 2）、TIME
  - 3）、TIMESTAMP
  - 4）、TIMESTAMP WITH TIME ZONE
  - 5）、TIMESTAMP_LTZ
  - 6）、INTERVAL YEAR TO MONTH
  - 7）、INTERVAL DAY TO SECOND
- 6、Constructured Data Types
- - 1）、ARRAY
  - 2）、MAP
  - 3）、MULTISET
  - 4）、ROW
- 7、User-Defined Data Types
- - 1）、Registered Structured Types
  - 2）、Unregistered Structured Types
- 8、Other Data Types
- - 1）BOOLEAN
  - 2）、RAW
  - 3）、NULL
三、类型转换
- 1、CAST 方法
- 2、旧版本 CAST 方法
四、数据类型提取

本文基于flink1.17版本，介绍了flink的数据类型的全部内容，包含数据类型定义、自定义数据类型、类型转换与提取。
本文全部是说明性的，为后续的table api和sql使用奠定基础。
本文分为四个部分，即数据类型介绍、数据类型种类、数据类型转换和数据类型提取。

一、Flink SQL数据类型介绍

1、数据类型

在 Flink 的 Table 生态系统中，数据类型描述了数据的逻辑类型，可以用来表示转换过程中输入、输出的类型。
Flink 的数据类型类似于 SQL 标准中的术语数据类型，但包含了值的可空性，以便于更好地处理标量表达式。

以下是一些数据类型的例子：

INT
INT NOT NULL
INTERVAL DAY TO SECOND(3)
ROW<myField ARRAY<BOOLEAN>, myOtherField TIMESTAMP(3)>

可在下文中找到所有预先定义好的数据类型。

2、Table API 中的数据类型

在定义 connector、catalog、用户自定义函数时，使用 JVM 相关 API 的用户可能会使用到 Table API 中基于 org.apache.flink.table.types.DataType 的一些实例。
数据类型实例有两个职责：

作为逻辑类型的表现形式，定义 JVM 类语言或 Python 语言与 Table 生态系统的边界，而不是以具体的物理表现形式存在于数据的传输过程或存储中。
可选的: 在与其他 API 进行数据交换时，为 Planner 提供这些数据物理层面的相关提示。

对于基于 JVM 的语言，所有预定义的数据类型都可以在 org.apache.flink.table.api.DataTypes 下找到。

使用 Table API 编程时，建议使用星号引入所有相关依赖，以获得更流畅的 API 使用体验：

import static org.apache.flink.table.api.DataTypes.*;

DataType t = INTERVAL(DAY(), SECOND(3));

在Table 生态系统中，当需要将 SQL 中的数据类型对应到实际编程语言中的数据类型时，就需要有物理提示。物理提示明确了对应过程中应该使用哪种数据格式。

比如，在 source 端产生数据时，可以规定：TIMESTAMP 的逻辑类型，在底层要使用 java.sql.Timestamp 这个类表示，而不是使用默认的 java.time.LocalDateTime 类。有了物理提示，可以帮助 Flink 运行时根据提供的类将数据转换为其内部数据格式。同样在 sink 端，定义好数据格式，以便能从 Flink 运行时获取、转换数据。

下面的例子展示了如何声明一个桥接转换类：

// 告诉 Flink 运行时使用 java.sql.Timestamp 处理数据，而不是 java.time.LocalDateTime
DataType t = DataTypes.TIMESTAMP(3).bridgedTo(java.sql.Timestamp.class);

// 告诉 Flink 运行时使用基本的 int 数组来处理数据，而不是用包装类 Integer 数组
DataType t = DataTypes.ARRAY(DataTypes.INT().notNull()).bridgedTo(int[].class);

只有在扩展 API 时才需要使用到物理提示。使用预定义的 source、sink 以及 Flink 函数时，不需要用到物理提示。在使用 Table API 编写程序时，Flink 会忽略物理提示（例如 field.cast(TIMESTAMP(3).bridgedTo(Timestamp.class))）

二、Flink SQL 数据类型种类

本部分介绍所有Flink支持的预定义的数据类型，可能和Flink的版本有关，本部分介绍的是Flink 1.17版本。
所有预定义的数据类型都可以通过org.apache.flink.table.api.DataTypes来查看。

1、Character Strings

1）、CHAR

固定长度的字符串

sql 类型

CHAR
CHAR(n)

java类型

DataTypes.CHAR(n)

n的长度没有指定的时候，默认为1，n的范围为【1， 2,147,483,647】。

2）、VARCHAR / STRING

可变长度的字符串

sql 类型

VARCHAR
VARCHAR(n)

STRING

java类型

DataTypes.VARCHAR(n)

DataTypes.STRING()

n不指定的时候，默认为1。n的范围为【1， 2,147,483,647】。
STRING就是VARCHAR(2147483647)。

2、Binary Strings

1）、BINARY

固定长度的二进制字符串，即字节的序列。n不指定的时候，默认为1。n的范围为【1， 2,147,483,647】。

sql类型

BINARY
BINARY(n)

java类型

DataTypes.BINARY(n)

2）、VARBINARY / BYTES

可变长度的二进制字符串。n不指定的时候，默认为1。n的范围为【1， 2,147,483,647】。
BYTES就是VARBINARY(2147483647)。

sql类型

VARBINARY
VARBINARY(n)

BYTES

java类型

DataTypes.VARBINARY(n)

DataTypes.BYTES()

3、Exact Numerics

1）、DECIMAL

具有固定精度和小数位数的十进制数的数据类型。
DECIMAL(p, s)，p是精度，即数字的位数，s是小数位位数，p范围是【1，38】，s的范围值【0，p】，不指定的时候默认p为10，s为0
NUMERIC(p, s) 和 DEC(p, s) 是一样的。

sql类型

DECIMAL
DECIMAL(p)
DECIMAL(p, s)

DEC
DEC(p)
DEC(p, s)

NUMERIC
NUMERIC(p)
NUMERIC(p, s)

java类型

DataTypes.DECIMAL(p, s)

2）、TINYINT

是1字节有符号的整型数值，范围是【-128，127】

sql类型

TINYINT

java类型

DataTypes.TINYINT()

3）、SMALLINT

2字节有符号的整型数字，范围是【-32,768，32,767】。

sql类型

SMALLINT

java类型

DataTypes.SMALLINT()

4）、INT

4字节的有符号整型数字，范围是【-2,147,483,648 ， 2,147,483,647】。
INT和INTEGER一样的。

sql类型

INT

INTEGER

java类型

DataTypes.INT()

5）、BIGINT

8字节的有符号整型数字，范围是【 -9,223,372,036,854,775,808 ， 9,223,372,036,854,775,807】。

sql类型

BIGINT

java类型

DataTypes.BIGINT()

4、Approximate Numerics

1）、FLOAT

4 字节单精度浮点数的数据类型。
与 SQL 标准相比，该类型不带参数。

sql类型

FLOAT

java类型

DataTypes.FLOAT()

2）、DOUBLE

8 字节双精度浮点数的数据类型。
DOUBLE和DOUBLE PRECISION一样。

sql类型

DOUBLE

DOUBLE PRECISION

java类型

DataTypes.DOUBLE()

5、Date and Time

1）、DATE

由年-月-日组成的日期的数据类型，其值范围从 0000-01-01 到 9999-12-31。
与 SQL 标准相比，范围从 0000 年开始。

sql类型

DATE

java类型

DataTypes.DATE()

2）、TIME

不带时区的时间的数据类型，由小时：分钟：秒[.分数]组成，精度高达纳秒，值范围为 00：00：00.0000000000 到 23：59：59.9999999999。
与 SQL 标准相比，不支持闰秒（23：59：60 和 23：59：61）。未提供时区时间。

可以使用 TIME（p）声明类型，其中 p 是秒的小数部分（精度）的位数。p 的值必须介于 0 和 9 之间（包括 0 和 9）。如果未指定精度，则 p 等于 0。

sql类型

TIME
TIME(p)

java类型

DataTypes.TIME(p)

3）、TIMESTAMP

不带时区的时间戳的数据类型，由年-月-日小时：分钟：秒[.小数]组成，精度高达纳秒，值范围从 0000-01-01 00：00：00.000000000 到 9999-12-31 23：59：59.9999999999。

与SQL标准相比，不支持闰秒（23：59：60和23：59：61），语义更接近java.time.LocalDateTime。

不支持与 BIGINT（一种 JVM 长类型）之间的转换。但是，此类型不受时区限制。有关更多java.time.Instant类语义，请使用TIMESTAMP_LTZ。

可以使用 TIMESTAMP（p）声明类型，其中 p 是秒的小数部分（精度）的位数。p 的值必须介于 0 和 9 之间（包括 0 和 9）。如果未指定精度，则 p 等于 6。

没有时区的TIMESTAMP§是这种类型的同义词。

sql类型

TIMESTAMP
TIMESTAMP(p)

TIMESTAMP WITHOUT TIME ZONE
TIMESTAMP(p) WITHOUT TIME ZONE

java类型

DataTypes.TIMESTAMP(p)

4）、TIMESTAMP WITH TIME ZONE

时间戳的数据类型，其时区由年-月-日小时：分钟：秒[.fractional] 区域组成，精度高达纳秒，值范围从 0000-01-01 00：00：00.000000000 +14：59 到 9999-12-31 23：59：59.9999999999 -14：59。
与TIMESTAMP_LTZ相比，时区偏移信息以物理方式存储在每个基准面中。它单独用于每次计算、可视化或与外部系统的通信。

sql类型

TIMESTAMP WITH TIME ZONE
TIMESTAMP(p) WITH TIME ZONE

java类型

DataTypes.TIMESTAMP_WITH_TIME_ZONE(p)

5）、TIMESTAMP_LTZ

具有本地时区的时间戳的数据类型，由年-月-日小时：分钟：秒[.fractional] 区域组成，精度高达纳秒，值范围从 0000-01-01 00：00：00.000000000 +14：59 到 9999-12-31 23：59：59.9999999999 -14：59
This type fills the gap between time zone free and time zone mandatory timestamp types by allowing the interpretation of UTC timestamps according to the configured session time zone.
可以使用 TIMESTAMP_LTZ（p）声明类型，其中 p 是秒的小数部分（精度）的位数。p 的值必须介于 0 和 9 之间（包括 0 和 9）。如果未指定精度，则 p 等于 6。

TIMESTAMP§ WITH LOCAL TIME ZONE 是该类型的同义词。

sql类型

TIMESTAMP_LTZ
TIMESTAMP_LTZ(p)

TIMESTAMP WITH LOCAL TIME ZONE
TIMESTAMP(p) WITH LOCAL TIME ZONE

java类型

DataTypes.TIMESTAMP_LTZ(p)
DataTypes.TIMESTAMP_WITH_LOCAL_TIME_ZONE(p)

6）、INTERVAL YEAR TO MONTH

一组年月间隔类型的数据类型。

这种类型必须按照下面中之一进行参数化：

interval of years,
interval of years to months,
or interval of months.

年-月的间隔由 +年-月组成，值范围从 -9999-11 到 +9999-11。
对于所有类型的resolutions，值表示形式都是相同的。例如，50 的月份间隔始终以年到月的间隔格式表示（具有默认的年份精度）：+04-02。
可以使用上述组合声明类型，其中 p 是年数（年份精度）。p 的值必须介于 1 和 4 之间（包括 1 和 4）。如果未指定年份精度，则 p 等于 2。

sql类型

INTERVAL YEAR
INTERVAL YEAR(p)
INTERVAL YEAR(p) TO MONTH
INTERVAL MONTH

java类型

DataTypes.INTERVAL(DataTypes.YEAR())
DataTypes.INTERVAL(DataTypes.YEAR(p))
DataTypes.INTERVAL(DataTypes.YEAR(p), DataTypes.MONTH())
DataTypes.INTERVAL(DataTypes.MONTH())

7）、INTERVAL DAY TO SECOND

一组day-time间隔类型的数据类型。
这种类型必须按照下面中之一进行参数化：

interval of days,
interval of days to hours,
interval of days to minutes,
interval of days to seconds,
interval of hours,
interval of hours to minutes,
interval of hours to seconds,
interval of minutes,
interval of minutes to seconds,
or interval of seconds.

day-time间隔由 +天小时：月：秒.小数组成，值范围为 -999999 23：59：59.999999999 到 +999999 23：59：59.9999999999。对于所有类型的resolutions，值表示形式都是相同的。例如，秒间隔 70 始终以天到秒的间隔格式表示（具有默认精度）：+00 00：01：10.000000。

sql类型

INTERVAL DAY
INTERVAL DAY(p1)
INTERVAL DAY(p1) TO HOUR
INTERVAL DAY(p1) TO MINUTE
INTERVAL DAY(p1) TO SECOND(p2)
INTERVAL HOUR
INTERVAL HOUR TO MINUTE
INTERVAL HOUR TO SECOND(p2)
INTERVAL MINUTE
INTERVAL MINUTE TO SECOND(p2)
INTERVAL SECOND
INTERVAL SECOND(p2)

java类型

DataTypes.INTERVAL(DataTypes.DAY())
DataTypes.INTERVAL(DataTypes.DAY(p1))
DataTypes.INTERVAL(DataTypes.DAY(p1), DataTypes.HOUR())
DataTypes.INTERVAL(DataTypes.DAY(p1), DataTypes.MINUTE())
DataTypes.INTERVAL(DataTypes.DAY(p1), DataTypes.SECOND(p2))
DataTypes.INTERVAL(DataTypes.HOUR())
DataTypes.INTERVAL(DataTypes.HOUR(), DataTypes.MINUTE())
DataTypes.INTERVAL(DataTypes.HOUR(), DataTypes.SECOND(p2))
DataTypes.INTERVAL(DataTypes.MINUTE())
DataTypes.INTERVAL(DataTypes.MINUTE(), DataTypes.SECOND(p2))
DataTypes.INTERVAL(DataTypes.SECOND())
DataTypes.INTERVAL(DataTypes.SECOND(p2))

可以使用上述组合声明类型，其中 p1 是天数的位数（日精度），p2 是秒的小数位数（小数精度）。P1 的值必须介于 1 和 6 之间（包括 1 和 6）。P2 的值必须介于 0 和 9 之间（包括 0 和 9）。如果未指定 p1，则默认情况下等于 2。如果未指定 p2，则默认情况下等于 6。

6、Constructured Data Types

1）、ARRAY

具有相同子类型的元素数组的数据类型。
与 SQL 标准相比，数组的最大基数无法指定，但固定为 2，147，483，647。此外，支持任何有效类型作为子类型。

ARRAY，其中 t 是所包含元素的数据类型。
t ARRAY 是更接近 SQL 标准的同义词。例如，INT ARRAY 等效于 ARRAY

sql类型

ARRAY<t>
t ARRAY

java类型

DataTypes.ARRAY(t)

2）、MAP

将key（包括 NULL）map到value（包括 NULL）的关联数组的数据类型。map不能包含重复的键;每个键最多可以映射到一个值。
元素类型没有限制;须确保唯一性。
map类型是 SQL 标准的扩展。

sql类型

MAP<kt, vt>

java类型

DataTypes.MAP(kt, vt)

MAP，其中 kt 是键元素的数据类型，vt 是值元素的数据类型。

3）、MULTISET

multiset（=bag）的数据类型，与set不同，它允许每个元素具有公共子类型的多个实例。每个唯一值（包括 NULL）都映射到某个多重性。
元素类型没有限制;须确保唯一性。

sql类型

MULTISET<t>
t MULTISET

java类型

DataTypes.MULTISET(t)

MULTISET，其中 t 是所包含元素的数据类型。
t MULTISET 是更接近 SQL 标准的同义词。例如，INT MULTISET 等效于 MULTISET。

4）、ROW

字段序列（ a sequence of fields）的数据类型。
字段由字段名称、字段类型和可选描述组成。表中行的最具体类型是行类型。在这种情况下，行的每一列对应于与列具有相同序号位置的行类型的字段。
与 SQL 标准相比，可选字段描述简化了复杂结构的处理。
ROW类似于其他不符合标准的框架中已知的 STRUCT 类型。

sql类型

ROW<n0 t0, n1 t1, ...>
ROW<n0 t0 'd0', n1 t1 'd1', ...>

ROW(n0 t0, n1 t1, ...>
ROW(n0 t0 'd0', n1 t1 'd1', ...)

java类型

DataTypes.ROW(DataTypes.FIELD(n0, t0), DataTypes.FIELD(n1, t1), ...)
DataTypes.ROW(DataTypes.FIELD(n0, t0, d0), DataTypes.FIELD(n1, t1, d1), ...)

可以使用 ROW 其中 n 是字段的唯一名称，t 是字段的逻辑类型，d 是字段的描述。
ROW（…）是更接近 SQL 标准的同义词。例如，ROW（myField INT， myOtherField BOOLEAN）等价于 ROW。

7、User-Defined Data Types

尚不完全支持用户定义的数据类型。它们目前（从 Flink 1.11 开始）仅在函数的参数和返回类型中作为未注册的结构化类型公开。

结构化类型类似于面向对象编程语言中的对象。它包含零个、一个或多个属性。每个属性都由名称和类型组成。
有两种结构化类型，如下：

存储在目录中并由目录标识符标识的类型（如 cat.db.MyType）。这些等于结构化类型的 SQL 标准定义。
由实现类（如com.myorg.model.MyType）标识的匿名定义的未注册类型（通常以反射方式提取）。这些在以编程方式定义表程序时很有用。它们允许重用现有的 JVM 类，而无需再次手动定义数据类型的模式。

1）、Registered Structured Types

目前（1.17版本）不支持注册的结构化类型。因此，它们不能存储在目录中或在创建表 DDL 中引用。

2）、Unregistered Structured Types

未注册的结构化类型可以使用自动反射提取从常规 POJO（Plain Old Java Objects 普通旧 Java 对象）创建。
结构化类型的实现类必须满足以下要求：

该类必须是全局可访问的，这意味着它必须声明为公共的、静态的而不是抽象的。
该类必须提供具有零参数的默认构造函数或分配所有字段的完整构造函数。
类的所有字段必须可由公共声明或遵循常见编码样式（如getField（），isField（），field（））的getter读取。
类的所有字段都必须可由公共声明、完全赋值构造函数或遵循常见编码样式（如 setField（…）、field（…））的 setter 写入。
所有字段都必须通过反射提取隐式映射到数据类型，或者使用 @DataTypeHint 批注显式映射到数据类型。
声明为静态或暂时性的字段将被忽略。

反射提取支持字段的任意嵌套，只要字段类型不（传递地）引用自身。
声明的字段类（例如，public int age;）必须包含在为本文档中每种数据类型定义的支持的 JVM 桥接类列表中（例如.java.lang.Integer 或 int 表示 INT）。

对于某些类，需要注释才能将类映射到数据类型（例如@DataTypeHint（“DECIMAL（10，2）”）为java.math.BigDecimal分配固定的精度和小数位数）。

示例如下：

class User {

    // extract fields automatically
    public int age;
    public String name;

    // enrich the extraction with precision information
    public @DataTypeHint("DECIMAL(10, 2)") BigDecimal totalBalance;

    // enrich the extraction with forcing using RAW types
    public @DataTypeHint("RAW") Class<?> modelClass;
}

DataTypes.of(User.class);

8、Other Data Types

1）BOOLEAN

Data type of a boolean with a (possibly) three-valued logic of TRUE, FALSE, and UNKNOWN.
布尔值的数据类型，其（可能）三值逻辑为 TRUE、FALSE 和 UNKNOWN。

sql 类型

BOOLEAN

java类型

DataTypes.BOOLEAN()

2）、RAW

Data type of an arbitrary serialized type. This type is a black box within the table ecosystem and is only deserialized at the edges.
任意序列化（arbitrary serialized）类型的数据类型。此类型是表生态系统中的黑盒，仅在边缘反序列化。
原始类型是 SQL 标准的扩展。

sql类型

RAW('class', 'snapshot')

java类型

DataTypes.RAW(class, serializer)

DataTypes.RAW(class)

可以使用 RAW（‘class’， ‘snapshot’）声明该类型，其中 class 是原始类，snapshot是 Base64 编码的序列化 TypeSerializerSnapshot。通常，类型字符串不是直接声明的，而是在保留类型时生成的。

在 API 中，可以通过直接提供类 + 类型序列化程序或传递类并让框架从那里提取类 + 类型序列化程序来声明 RAW 类型。

3）、NULL

用于表示非类型化 NULL 值的数据类型。
NULL类型是 SQL 标准的扩展。null 类型除了 NULL 之外没有其他值，因此，它可以转换为类似于 JVM 语义的任何可空类型。
此类型有助于在使用 NULL 文本的 API 调用中表示未知类型，以及桥接到定义此类类型的格式，例如 JSON 或 Avro。
这种类型在实践中不是很有用，这里只是为了完整性而提到。

sql类型

NULL

java类型

DataTypes.NULL()

三、类型转换

1、CAST 方法

Flink Table API 和 Flink SQL 支持从输入数据类型到目标数据类型的转换。有的转换无论输入值是什么都能保证转换成功，而有些转换则会在运行时失败（即不可能转换为目标数据类型对应的值）。例如，将 INT 数据类型的值转换为 STRING 数据类型一定能转换成功，但无法保证将 STRING 数据类型转换为 INT 数据类型。

在生成执行计划时，Flink 的 SQL 检查器会拒绝提交那些不可能直接转换为目标数据类型的SQL，并抛出 ValidationException 异常，例如从 TIMESTAMP 类型转化到 INTERVAL 类型。然而有些查询即使通过了 SQL 检查器的验证，依旧可能会在运行期间转换失败，这就需要用户正确处理这些失败了。

在 Flink Table API 和 Flink SQL 中，可以用下面两个内置方法来进行转换操作：

CAST：定义在 SQL 标准的 CAST 方法。在某些容易发生转换失败的查询场景中，当实际输入数据不合法时，作业便会运行失败。类型推导会保留输入类型的可空性。
TRY_CAST：常规 CAST 方法的扩展，当转换失败时返回 NULL。该方法的返回值允许为空。

CAST('42' AS INT) --- 结果返回数字 42 的 INT 格式（非空）
CAST(NULL AS VARCHAR) --- 结果返回 VARCHAR 类型的空值
CAST('non-number' AS INT) --- 抛出异常，并停止作业

TRY_CAST('42' AS INT) --- 结果返回数字 42 的 INT 格式
TRY_CAST(NULL AS VARCHAR) --- 结果返回 VARCHAR 类型的空值
TRY_CAST('non-number' AS INT) --- 结果返回 INT 类型的空值
COALESCE(TRY_CAST('non-number' AS INT), 0) --- 结果返回数字 0 的 INT 格式（非空）

下表展示了各个类型的转换程度，“Y” 表示支持，“!” 表示转换可能会失败，“N” 表示不支持：

备注：
所有转化到具有固长或变长的类型时会根据类型的定义来裁剪或填充数据。
使用 TO_TIMESTAMP 方法和 TO_TIMESTAMP_LTZ 方法的场景，不要使用 CAST 或 TRY_CAST。
支持转换，当且仅当用其内部数据结构也支持转化时。转换可能会失败，当且仅当用其内部数据结构也可能会转换失败。
支持转换，当且仅当用使用 RAW 的类和类的序列化器一样。
支持转换，当且仅当用使用 INTERVAL 做“月”到“年”的转换。
支持转换，当且仅当用使用 INTERVAL 做“天”到“时间”的转换。
请注意：无论是 CAST 还是 TRY_CAST，当输入为 NULL ，输出也为 NULL。

2、旧版本 CAST 方法

用户可以通过将参数 table.exec.legacy-cast-behaviour 设置为 enabled 来启用 1.15 版本之前的 CAST 行为。在 Flink 1.15 版本此参数默认为 disabled。

如果设置为 enabled，请注意以下问题：

转换为 CHAR/VARCHAR/BINARY/VARBINARY 数据类型时，不再自动修剪（trim）或填充（pad）。
使用 CAST 时不再会因为转化失败而停止作业，只会返回 NULL，但不会像 TRY_CAST 那样推断正确的类型。
CHAR/VARCHAR/STRING 的转换结果会有一些细微的差别。

不建议配置此参数，而是强烈建议在新项目中保持这个参数为默认禁用，以使用最新版本的 CAST 方法。在下一个版本，这个参数会被移除。

四、数据类型提取

在 API 中的很多地方，Flink 都尝试利用反射机制从类信息中自动提取数据类型，以避免重复地手动定义 schema。但是，通过反射提取数据类型并不总是有效的，因为有可能会缺失逻辑信息。因此，可能需要在类或字段声明的附近添加额外信息以支持提取逻辑。

下表列出了无需更多信息即可隐式映射到数据类型的类。

如果你打算在 Scala 中实现类，建议使用包装类型（例如 java.lang.Integer）而不是 Scala 的基本类型。如下表所示，Scala 的基本类型（例如 Int 或 Double）会被编译为 JVM 基本类型（例如 int/double）并产生 NOT NULL 语义。此外，在泛型中使用的 Scala 基本类型（例如 java.util.Map[Int, Double]）在编译期间会被擦除，导致类信息类似于 java.util.Map[java.lang.Object, java.lang.Object]。

本文档中提到的其他 JVM 桥接类需要 @DataTypeHint 注释。

数据类型 hints 可以参数化或替换单个函数参数和返回类型、结构化类或结构化类的字段的默认提取逻辑。实现者可以通过声明 @DataTypeHint 注解来选择默认提取逻辑的修改程度。

@DataTypeHint 注解提供了一组可选的 hint 参数。其中一些参数如以下示例所示。更多信息可以在注解类的文档中找到。

示例如下：

import org.apache.flink.table.annotation.DataTypeHint;

class User {

    // 使用默认转换类 `java.lang.Integer` 定义 INT 数据类型
    public @DataTypeHint("INT") Object o;

    // 使用显式转换类定义毫秒精度的 TIMESTAMP 数据类型
    public @DataTypeHint(value = "TIMESTAMP(3)", bridgedTo = java.sql.Timestamp.class) Object o;

    // 通过强制使用 RAW 类型来丰富提取
    public @DataTypeHint("RAW") Class<?> modelClass;

    // 定义所有出现的 java.math.BigDecimal（包含嵌套字段）都将被提取为 DECIMAL(12, 2)
    public @DataTypeHint(defaultDecimalPrecision = 12, defaultDecimalScale = 2) AccountStatement stmt;

    // 定义当类型不能映射到数据类型时，总是将其视为 RAW 类型，而不是抛出异常
    public @DataTypeHint(allowRawGlobally = HintFlag.TRUE) ComplexModel model;
}

以上，基于flink1.17版本，介绍了flink的数据类型的全部内容，包含数据类型定义、自定义数据类型、类型转换与提取。

你可能感兴趣的:(#,Flink专栏,flink,sql,flink,table,flink,sql,flink,流批一体化,flink,实时计算,checkpoint)

AI程序员大逃杀：从“码农”到“魔法师”的奇幻漂流 ——揭秘人工智能如何重塑程序员工作流 lifire_H 人工智能
当程序员遇上AI，是“饭碗不保”还是“原地飞升”？这场代码界的工业革命，正在让每个程序员经历从“流水线工人”到“科技魔法师”的奇幻蜕变。一、效率革命：当键盘遇上“读心术”1.需求分析：从“鸡同鸭讲”到“灵魂共鸣”还记得那些年被客户需求文档支配的恐惧吗？甲方爸爸一句“我想要五彩斑斓的黑”，就能让产品经理和程序员集体崩溃。现在，AI就像个自带翻译机的“需求捕手”——把客户支离破碎的诉求往WPSAI里一
MySQL 奇幻之旅：从基础探秘到高级应用魔法进阶的华夫饼进大厂 mysql 数据库
MySQL奇幻之旅：从基础探秘到高级应用魔法在数据库的神秘世界里，MySQL宛如一座蕴藏无尽宝藏的城堡，我怀揣着探索的热情与求知的渴望，踏上了这趟扣人心弦的学习征程。一、MySQL基础：城堡基石的雕琢（一）数据库与表的操作：构建数据的栖息之所数据库创建与管理：绘制数据城堡的蓝图：犹如精心绘制城堡的设计图，我熟练掌握了使用CREATEDATABASE语句创建数据库的魔法咒语，像CREATEDATAB
基于Redis geo地理位置的物流路线规划系统实现方案 xiyubaby.17 缓存 redis
物流路线规划系统实现方案一、系统架构图数据存储层数据处理层业务服务层客户端RedisGEOPostgreSQL图数据库地理编码服务实时交通处理路线优化引擎距离计算服务路径规划服务订单管理服务物流管理系统司机APP客户门户客户端API网关业务服务层数据处理层数据存储层二、核心模块实现1.地理模型定义publicclassLocation{privateStringid;privateStringad
RAMS（区域大气建模系统）与 OpenFOAM 的耦合：构建跨尺度大气流动模拟平台 Hardess-god RAMS 算法人工智能机器学习
随着城市气象、风能开发和空气质量模拟需求的提升，单一尺度的模拟工具已难以满足复杂地形和城市结构下的精细气流场重建需求。RegionalAtmosphericModelingSystem（RAMS）作为区域尺度大气模式，在捕捉天气系统和地形强迫方面表现优异；而OpenFOAM则是功能强大的开源计算流体力学（CFD）平台，能够实现亚米级的湍流建模和局地流场分辨。将两者耦合，实现区域与城市尺度的联动模拟
攻克 CREO 到 STL 转换难关：技术挑战剖析 3D小将迪威模型联讯软件 SolidWorks模型 CATIA模型 UG模型 SketchUp模型 PROE模型 CAD图纸 MMD模型
一、引言CREO是一款功能强大的3DCAD/CAM/CAE一体化软件，在产品设计、模具开发、机械制造等多个领域广泛应用。它支持复杂的参数化设计、曲面建模和装配模拟等操作，能满足从概念设计到产品制造全过程的需求。而STL（Stereolithography）格式则是3D打印领域的标准文件格式，主要用于描述三维物体的表面几何形状。随着3D打印技术的普及，将CREO模型转换为STL格式，以便进行3D打印
JavaScript 案例购物车《嘘》安静 javascript 前端开发语言
思路：1、获取页面元素，本练习用的表格table实现2、声明一个数组，包含自己需要渲染的内容，每个内容需要声明一个默认值，便于之后用来判断是否被勾选3、封装渲染函数：通过遍历每一个元素，判断勾选状态，如果被勾选，就直接添加选中属性，没有则正常添加。4、接着遍历元素的每一个键，并分别赋值给每一个td。5、判断合计金额，每次遍历完成后，需要把被勾选的元素单价*数量并赋值给总价的元素。6、最后直接渲染到
何同学采访苹果CEO库克上热搜，网友表示自愧不如程序员的店小二
昨日，22岁B站知名UP主“老师好我叫何同学”采访了苹果CEO蒂姆-库克，登上微博热搜榜，引起了网友们的热议。何同学是北京邮电大学学霸，22岁的大学生，出于兴趣的原因在B站注册账号发布数码产品的测评视频，他做的视频和别人不一样，称得上机圈顶流。因为在B站发了一个5G测评视频，让何同学彻底火了，仅有40个视频，在B站累计播放已超过1.7亿次，粉丝数达到了673万，何同学还作为嘉宾参加了央视一套的《开
Kubernetes Init 容器：实现 Nginx 和 PHP 对 MySQL 的依赖检查曹天骄 kubernetes nginx php
在设计KubernetesPod时，如果需要在启动Nginx和PHP之前等待MySQL启动完成，可以通过初始化容器（initC）来实现。初始化容器可以用于检查MySQL是否可用，只有在MySQL可用后，才会继续启动主容器（Nginx和PHP）。设计思路初始化容器（initC）:使用一个简单的脚本或工具（如mysql-client）来检查MySQL服务是否可用。如果MySQL可用，初始化容器成功退出
MyBatis-Plus 的加载及初始化一个public的class java mybatis
在SpringBoot启动过程中，MyBatis-Plus的加载和初始化涉及多个阶段的工作。这些工作包括MyBatis-Plus自身的配置解析、Mapper接口的扫描与注册、SQL语句的动态注入以及底层MyBatis的初始化等。以下是对整个过程的详细分析：1.SpringBoot启动时对MyBatis-Plus的加载SpringBoot在启动时会对MyBatis-Plus进行自动配置（AutoCo
C++ 的内存管理有哪些改进？ c++
C++20引入了对协程的官方支持，这是C++语言发展的一个重要里程碑。协程为异步编程、并发任务处理以及复杂的控制流提供了一种更高效、更简洁的解决方案。以下是C++20中协程支持的主要优势：一、简化异步编程在传统的异步编程中，开发者通常需要使用回调函数、std::future和std::promise等机制来处理异步任务。这些方法虽然有效，但代码往往难以阅读和维护，且容易出错。C++20的协程提供了
腾讯面经，有点难度~ 后端go
今天分享组织内的朋友在腾讯安全的实习面经。内容涵盖了QPS测试方法、SQL聚合查询、Linux进程管理、Redis数据结构与持久化、NAT原理、Docker隔离机制、Go语言GMP调度模型、协程控制、系统调用流程、变量逃逸分析及map操作等等知识点。下面是我整理的面经详解：面经详解一个表，里面有数据列，id，name,class，查学生最喜欢的前10个课程，sql语句实现SELECTclass,C
oracle12c 监控表状态，类似触发器，获取表名称乱码问题 YiWait Java java oracle
1、类似触发器原理，实时监听2、解决获取表名称乱码问题进入调试模式查看源码里面这个类，oracletableName的编码模式：主体代码如下：搞了两天终于发现问题所在，tablename开始出来是???这种乱码。确定是字符集编码的问题，在网上找了类似问题。需要引入oracle的语言包。@Slf4jpublicclassMyTest{publicstaticvoidmain(String[]args
SQL中体会多对多 PlumCarefree sql 数据库
我们可以根据学生与课程多对多关系的数据库模型，给出实际的表数据以及对应的查询结果示例，会用到JOIN``LEFTJOIN两种连接1.学生表（students）student_idstudent_name1张三2李四3王五2.课程表（courses）course_idcourse_name1数学2英语3物理3.选课表（student_courses）idstudent_idcourse_id1112
ResNet改进(11)：添加 Squeeze-and-Excitation模块和替换Mish激活函数点我头像干啥 ResNet 改进【有效涨点！】深度学习 pytorch python
本专栏代码均经过测试，可以直接替换项目中的模型，一键运行！采用最新的即插即用模块，有效涨点！！1.SE模块和Mish激活函数SE模块是一种通道注意力机制，旨在增强网络对重要特征通道的关注，从而提升模型的表达能力。它通过显式地建模通道之间的依赖关系，动态调整每个通道的特征响应。SE模块的核心思想：Squeeze：通过全局平均池化（GlobalAveragePooling,GAP）将每个通道的空间维度
算力租赁：人工智能时代的“水电煤”革命——以NVIDIA 4090为例解读下一代算力解决方案算法工程gpu
引言：当AI算力需求遇上“算力饥渴症”2023年，ChatGPT仅用2个月突破1亿用户，StableDiffusion让普通人秒变艺术家，但背后是单次训练消耗超10万GB内存、千亿级参数的恐怖算力需求。当全球AI企业陷入“算力饥渴症”时，一种名为算力租赁的创新模式正以每年37%的增速（MarketsandMarkets数据）重塑行业格局。本文将深度解析这一革命性服务，并聚焦搭载NVIDIARTX4
MybatisPlus 伶星37 spring boot 后端
代码部分添加依赖该代码添加位置：就是在springboot配置文件里面的pom.xml里面要添加的东西对新手说的话，如果这一步没有看懂的话，可以去看一下基础，否则这样的话不能做到理解学习//mybatis-plus的一个插件com.baomidoumybatis-plus-boot-starter3.4.2//这个是关于mysql的一种依赖mysqlmysql-connector-java5.1.
mongodb与爬虫的关系 getapi mongodb 爬虫数据库
MongoDB与爬虫之间的关系主要体现在数据存储和管理的层面。爬虫（WebCrawler或Spider）是一种自动化工具，用于从互联网上抓取网页内容或特定数据。而MongoDB是一个NoSQL数据库，常被用来存储和管理爬虫抓取到的数据。以下是它们之间关系的具体分析：1.爬虫的数据存储需求爬虫在运行过程中会抓取大量的非结构化或半结构化数据（例如HTML页面、JSON数据、图片链接等）。这些数据通常具
Java 大视界 -- Java 大数据在智慧农业精准灌溉与施肥决策中的应用（144）青云交大数据新视界 Java 大视界 java 大数据智慧农业精准灌溉施肥决策数据分析机器学习
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 基于 Java 的大数据机器学习模型的多模态融合技术与应用（143）青云交大数据新视界 Java 大视界 java 大数据机器学习多模态融合智能安防智能客服数据处理
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
单节点MySQL部署 QX_hao MySQL mysql
Ubuntu22.04安装单节点Mysql步骤1：更新软件包列表并安装MySQL更新系统的软件包列表：sudoaptupdatesudoaptupgrade-y安装MySQLServer：sudoaptinstallmysql-server-y检查MySQL服务是否已启动：sudosystemctlstatusmysql如果没有运行，可以手动启动：sudosystemctlstartmysql步骤
SQL Server 2022常见问题软件研究员数据库 sql server
根据本人多年使用数据库的经验，总结SQLServer2022数据库常见问题包含安装、链接、性能等问题，下面简单说下。一、安装失败问题主要是以下问题：1、硬件配置问题sqlServer2022运行的最低硬件配置要求：根据官网公布要求最低1G内存，最低6G可用磁盘空间，处理器速度1.4GHz，x64处理器；显示器Super-VGA(800x600)。注意：在这里我说的是最低配置。2、软件插件问题缺少.
美国国家航空航天局（NASA）的PUNCH任务 novanova2009 数码相机
地球浸没在来自太阳的物质流中。这种被称为太阳风的流正在冲刷我们的星球，造成令人叹为观止的极光，影响太空中的卫星和宇航员，甚至影响地面基础设施。美国宇航局（NASA）的PUNCH（统一日冕和日球层旋光仪PolarimetertoUnifytheCoronaandHeliosphere）任务将首次将太阳的日冕（或外层大气层）和太阳风一起成像，以更好地了解太阳、太阳风和地球作为一个单一的互连系统。PUN
卫星网络仿真平台：IPLOOK赋能空天地一体化通信新生态爱浦路 IPLOOK 运维
卫星仿真平台在6G技术加速演进与天地一体化网络建设的大背景下，卫星通信作为地面网络的重要补充，正成为全球通信覆盖的关键支撑。IPLOOK凭借其深厚的技术积累与创新实践，推出的卫星网络仿真平台（SCEPS），不仅填补了行业技术空白，更通过多维度功能设计与产学研深度合作，为构建空天地一体化网络提供了全栈式解决方案。一、卫星仿真平台：技术架构与核心功能IPLOOK卫星仿真平台基于“分层式、组件化、插件化
FreeRTOS进阶使用之流缓冲区：高效处理字节流的秘密武器逸云客嵌入式 FreeRTOS操作系统单片机 stm32 mcu
在嵌入式开发中，流缓冲区（StreamBuffer）是FreeRTOS中用于高效处理字节流数据传输的核心机制，尤其适合任务间或中断与任务间的连续数据传输场景（如串口通信、网络数据流等）。本文将深入解析其原理、特点、使用方法及注意事项，助你进阶掌握这一关键技术。一、流缓冲区是什么？为什么需要它？流缓冲区是FreeRTOS中基于环形缓冲区实现的字节流传输机制，其核心作用是动态管理数据的读写，支持任意长
前端页面列表白线问题解决方案松岛的枫叶前端 vue.js elementui
/*完全消除行间边框*/.el-table{--el-table-border-color:transparent!important;}.el-tabletd.el-table__cell{border-bottom:none!important;}.el-tableth.el-table__cell.is-leaf{border-bottom:none!important;}.el-table
JavaWeb学习笔记时间会给答案scidag java java-ee servlet 笔记学习数据库
一.刨析JDBC1.概念：JDBC就是java语言操作关系型数据库的一套API2.常用API2.1DriverManager:作用1.注册驱动2.获取数据库连接;都是静态方法，直接类名.方法2.2Connection:作用1.获取sql执行对象2.事务管理《《关于管理事务回滚常用方法setAutoCommit（）commit(),rollback()2.3Statement:作用执行SQL语句《《
hbase表无法删除，命令行卡住问题处理 spring208208 大数据组件线上问题分析 hbase 数据库大数据
问题现象hbase表无法删除，命令行卡住1.activemaster日志出现超时WARNorg.apache.hadoop.hbase.master.procedure.TruncateTableProcedure:Retriableerrortryingtotruncatetable=xxxstate=TRUNCATE_TABLE_PRE_OPERATIONorg.apache.hadoop.h
如何快速搭建一套属于自己的埋点系统，看这里有详细部署操作文档 webfunny2020 前端
webfunny新产品——点位系统上线啦~欢迎使用webfunny的埋点系统，它是一个轻量级、易使用，埋点分析一体化的产品，用户可以根据自己的需求，创建不同的埋点，选择不同的图形在数据看板中来展示分析数据；webfunny支持单个数据的展示，有适用于体现数据的变化趋势，也有适用于体现总量和比率，还支持多个数据进行重叠展示等等。下面介绍一下如何快速搭建属于自己的一套埋点系统。分为下面几个主要步骤：创
SQLyog 13.1.6 社区免费中文版：高效便捷的MySQL管理工具 m0_74823264 面试学习路线阿里巴巴 mysql 数据库
SQLyog13.1.6社区免费中文版：高效便捷的MySQL管理工具sqlyog_13.1.6.7z项目地址:https://gitcode.com/open-source-toolkit/a94c8项目介绍SQLyog13.1.6社区免费中文版是一款专为MySQL设计的数据库管理工具，以其强大的功能和直观的图形用户界面（GUI）深受开发者和数据库管理员的喜爱。该版本为社区免费版，提供了中文界面，
MySQL 中，分库分表机制和分表分库策略小赖同学啊 java mysql oracle 数据库
在MySQL中，分库分表是一种常见的数据库水平扩展方案，用于解决单库单表数据量过大导致的性能瓶颈问题。通过将数据分散到多个数据库或表中，可以提高系统的并发处理能力、降低单点故障风险，并提升查询性能。一、分库分表的作用提升性能：分散数据存储和查询压力，避免单库单表的性能瓶颈。提高并发能力：多个数据库或表可以并行处理请求，提高系统吞吐量。降低单点故障风险：数据分散存储，单个数据库或表故障不会影响整个系
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比