爱上_下划线

Apache NiFi 典型案例

NIFI典型案例

课程目标

1、离线同步Mysql数据到DFS

2、Json内容转换为Hive支持的文本格式

3、实时同步Mysql数据到Hive

4、Kafka的使用

1.离线同步Mysql数据到hdfs

大数据数据仓库系统中，经常需要进行数据同步操作，可以使用nifi来进行灵活的全流程操作。

准备工作：

启动Mysql服务(5.7版本)，在Mysql中运行\资料\mysql\nifi_test.sql中的SQL语句。
启动Hadoop集群(与NiFi集群在同一个可访问的局域网网段)

1.1处理器流程

QueryDatabaseTable ——> ConvertAvroToJSON ——> SplitJson ——> PutHDFS

QueryDatabaseTable读取Mysql数据，ConvertAvroToJSON将数据转换为可阅读的Json格式，再通过SplitJson进行切割获得单独的对象，PutHDFS将所有对象写入HDFS中。

1.2处理器说明

QueryDatabaseTable

描述

生成SQL选择查询，或使用提供的语句，并执行该语句以获取其指定的“最大值”列中的值大于先前看到的最大值的所有行。查询结果将转换为Avro格式。几种属性都支持表达式语言，但不允许传入连接。变量注册表可用于为包含表达式语言的任何属性提供值。如果需要利用流文件属性来执行这些查询，则可以将GenerateTableFetch和/或ExecuteSQL处理器用于此目的。使用流技术，因此支持任意大的结果集。使用标准调度方法，可以将该处理器调度为在计时器或cron表达式上运行。该处理器只能在主节点上运行。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示所有默认值，以及属性是否支持NiFi表达式语言。

名称	默认值	描述
Database Connection Pooling Service		用于获得与数据库的连接的Controller Service。 DBCPConnectionPoolLookup DBCPConnectionPoo HiveConnectionPool
Database Type	泛型	数据库的类型/风格，用于生成特定于数据库的代码。在许多情况下，通用类型就足够了，但是某些数据库（例如Oracle）需要自定义SQL子句。 Generic Oracle Oracle 12+ MS SQL 2012+ MS SQL 2008 MySQL
Table Name		要查询的数据库表的名称。使用自定义查询时，此属性用于别名查询，并在FlowFile上显示为属性。支持表达式语言：true（仅使用变量注册表进行评估）
Columns to Return		查询中要使用的列名的逗号分隔列表。如果您的数据库需要对名称进行特殊处理（例如，引号），则每个名称都应包括这种处理。如果未提供任何列名，则将返回指定表中的所有列。注意：对于给定的表使用一致的列名很重要，这样增量提取才能正常工作。支持表达式语言：true（仅使用变量注册表进行评估）
Additional WHERE clause		构建SQL查询时要在WHERE条件中添加的自定义子句。支持表达式语言：true（仅使用变量注册表进行评估）
Custom Query		用于检索数据的自定义SQL查询。代替从其他属性构建SQL查询，此查询将包装为子查询。查询必须没有ORDER BY语句。支持表达式语言：true（仅使用变量注册表进行评估）
Maximum-value Columns		列名的逗号分隔列表。自处理器开始运行以来，处理器将跟踪返回的每一列的最大值。使用多列意味着列列表的顺序，并且期望每列的值比前一列的值增长得更慢。因此，使用多个列意味着列的层次结构，通常用于分区表。该处理器只能用于检索自上次检索以来已添加/更新的那些行。请注意，某些JDBC类型（例如位/布尔值）不利于保持最大值，因此这些类型的列不应在此属性中列出，并且会在处理期间导致错误。如果未提供任何列，则将考虑表中的所有行，这可能会对性能产生影响。注意：对于给定的表使用一致的最大值列名称很重要，这样增量提取才能正常工作。支持表达式语言：true（仅使用变量注册表进行评估）
Max Wait Time	0秒	正在运行的SQL选择查询所允许的最长时间，零表示没有限制。少于1秒的最长时间将等于零。支持表达式语言：true（仅使用变量注册表进行评估）
Fetch Size	0	一次要从结果集中获取的结果行数。这是对数据库驱动程序的提示，可能不被尊重和/或精确。如果指定的值为零，则忽略提示。支持表达式语言：true（仅使用变量注册表进行评估）
Max Rows Per Flow File	0	一个FlowFile中将包含的最大结果行数。这将使您可以将非常大的结果集分解为多个FlowFiles。如果指定的值为零，那么所有行都将在单个FlowFile中返回。支持表达式语言：true（仅使用变量注册表进行评估）
Output Batch Size	0	提交流程会话之前要排队的输出FlowFiles的数量。设置为零时，将在处理所有结果集行并且输出FlowFiles准备好转移到下游关系时提交会话。对于较大的结果集，这可能导致在处理器执行结束时传输大量的FlowFiles。如果设置了此属性，则当指定数量的FlowFiles准备好进行传输时，将提交会话，从而将FlowFiles释放到下游关系。注意：设置此属性后，将不会在FlowFiles上设置maxvalue。和fragment.count属性。支持表达式语言：true（仅使用变量注册表进行评估）*
Maximum Number of Fragments	0	最大片段数。如果指定的值为零，那么将返回所有片段。当此处理器提取大表时，这可以防止OutOfMemoryError。注意：设置此属性可能会导致数据丢失，因为未按顺序排列传入结果，并且片段可能会在任意边界处终止，其中结果集中不包含行。支持表达式语言：true（仅使用变量注册表进行评估）
Normalize Table/Column Names	假	是否将列名中的非Avro兼容字符更改为Avro兼容字符。例如，冒号和句号将更改为下划线，以建立有效的Avro记录。真正假
Transaction Isolation Level		此设置将为支持此设置的驱动程序设置数据库连接的事务隔离级别。TRANSACTION_NONE TRANSACTION_READ_COMMITTED TRANSACTION_READ_UNCOMMITTED TRANSACTION_REPEATABLE_READ TRANSACTION_SERIALIZABLE
Use Avro Logical Types	假	是否对DECIMAL / NUMBER，DATE，TIME和TIMESTAMP列使用Avro逻辑类型。如果禁用，则写为字符串。如果启用，则使用逻辑类型并将其写为其基础类型，特别是DECIMAL / NUMBER为逻辑“十进制”：以具有附加精度和小数位元数据的字节形式写入，DATE为逻辑“ date-millis”：以int表示天自Unix时代（1970-01-01）起，TIME为逻辑’time-millis’：写为int，表示自Unix纪元以来的毫秒数； TIMESTAMP为逻辑’timestamp-millis’：写为长时，表示自Unix纪元以来的毫秒数。如果书面Avro记录的阅读者也知道这些逻辑类型，则可以根据阅读器的实现在更多上下文中反序列化这些值。真正假
Default Decimal Precision	10	当将DECIMAL / NUMBER值写入为“十进制” Avro逻辑类型时，需要表示可用位数的特定“精度”。通常，精度是由列数据类型定义或数据库引擎默认定义的。但是，某些数据库引擎可以返回未定义的精度（0）。写入那些未定义的精度数字时，将使用“默认十进制精度”。支持表达式语言：true（仅使用变量注册表进行评估）
Default Decimal Scale	0	当将DECIMAL / NUMBER值写入为“十进制” Avro逻辑类型时，需要一个特定的“标度”来表示可用的十进制数字。通常，规模是由列数据类型定义或数据库引擎默认定义的。但是，当返回未定义的精度（0）时，某些数据库引擎的比例也可能不确定。写入那些未定义的数字时，将使用“默认小数位数”。如果一个值的小数位数超过指定的小数位数，那么该值将被四舍五入，例如1.53在小数位数为0时变为2，在小数位数1时变为1.5。支持表达式语言：true（仅使用变量注册表进行评估）

ConvertAvroToJSON

描述

将Binary Avro记录转换为JSON对象。该处理器提供了Avro字段到JSON字段的直接映射，因此，生成的JSON将具有与Avro文档相同的层次结构。请注意，Avro模式信息将丢失，因为这不是从二进制Avro到JSON格式的Avro的转换。输出JSON编码为UTF-8编码。如果传入的FlowFile包含多个Avro记录的流，则生成的FlowFile将包含一个JSON Array，其中包含所有Avro记录或JSON对象序列。如果传入的FlowFile不包含任何记录，则输出为空JSON对象。空/单个Avro记录FlowFile输入可以根据“包装单个记录”的要求选择包装在容器中。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示任何默认值。

名称	默认值	允许值	描述
JSON容器选项	数组	没有数组	确定如何显示记录流：作为单个Object序列（无）（即，将每个Object写入新行），或者作为Objects数组（array）。
包装单条记录	假	真正假	确定是否将空记录或单个记录的结果输出包装在“ JSON容器选项”指定的容器数组中
Avro模式			如果Avro记录不包含架构（仅基准），则必须在此处指定。

SplitJson

描述

该处理器使用JsonPath表达式指定需要的数组元素，将JSON数组分割为多个单独的流文件。每个生成的流文件都由指定数组的一个元素组成，并传输到关系“split”，原始文件传输到关系“original”。如果没有找到指定的JsonPath，或者没有对数组元素求值，则将原始文件路由到“failure”，不会生成任何文件。

该处理器需要使用人员掌握JsonPath表达式语言。

属性配置

在下面的列表中，必需属性的名称以粗体显示。任何其他属性(不是粗体)都被认为是可选的，并且指出属性默认值（如果有默认值），以及属性是否支持表达式语言。

属性名称	默认值	可选值	描述
JsonPath Expression			一个JsonPath表达式，它指定用以分割的数组元素。
Null Value Representation	1	empty string the string ‘null’	指定结果为空值时的表示形式。

PutHDFS

描述

将FlowFile数据写入Hadoop分布式文件系统（HDFS）

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示所有默认值，以及属性是否支持NiFi表达式语言。

名称	默认值	允许值	描述
Hadoop Configuration Resources			由文件或逗号分隔的文件列表，其中包含Hadoop文件系统配置。否则，Hadoop将在类路径中搜索“ core-site.xml”和“ hdfs-site.xml”文件，或者将恢复为默认配置。要使用swebhdfs，请参阅PutHDFS文档的“其他详细信息”部分。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Credentials Service			指定应用于Kerberos身份验证的Kerberos凭据控制器服务
Kerberos Principal			Kerberos主体作为身份验证。需要在您的nifi.properties中设置nifi.kerberos.krb5.file。支持的表达语言：true（仅使用变量注册表进行评估）
Kerberos Keytab			与主体关联的Kerberos密钥表。需要在您的nifi.properties中设置nifi.kerberos.krb5.file。支持的表达语言：true（仅使用变量注册表进行评估）
Kerberos Relogin Period	4小时		尝试重新登录kerberos之前应该经过的时间。此属性已被弃用，并且对处理没有影响。现在，重新登录会自动发生。支持表达式语言：true（仅使用变量注册表进行评估）
Additional Classpath Resources			以逗号分隔的文件和/或目录的路径列表，该列表将添加到类路径中，并用于加载本机库。指定目录时，该目录中所有具有的文件都将添加到类路径中，但不包括其他子目录。
Directory			文件应写入的父HDFS目录。如果目录不存在，将创建该目录。支持表达式语言：true（将使用流文件属性和变量注册表进行评估）
Conflict Resolution Strategy	失败	更换忽视失败附加	指示当输出目录中已经存在同名文件时应该怎么办
Block Size			写入HDFS的每个块的大小。这将覆盖Hadoop配置
IO Buffer Size			IO期间用于缓冲文件内容的内存量。这将覆盖Hadoop配置
Replication			HDFS复制每个文件的次数。这将覆盖Hadoop配置
Permissions umask			用八进制数表示的umask，用于确定写入HDFS的文件的权限。这将覆盖Hadoop属性“ fs.permissions.umask-mode”。如果未定义此属性和“ fs.permissions.umask-mode”，则将使用Hadoop默认值“ 022”。
Remote Owner			写入后，将HDFS文件的所有者更改为此值。仅当NiFi以具有HDFS超级用户特权来更改所有者的用户身份运行时才有效支持表达式语言：true（将使用流文件属性和变量注册表进行评估）
Remote Group			写入后，将HDFS文件的组更改为此值。仅当NiFi以具有HDFS超级用户特权来更改组的用户身份运行时才有效支持表达式语言：true（将使用流文件属性和变量注册表进行评估）
Compression codec	没有	没有默认邮编邮编 LZ4 LZO 贪睡自动	没有描述。
Ignore Locality	假	真正假	指示HDFS系统忽略位置规则，以便在群集中随机分配数据

1.3操作

1.3.1创建组

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FfPSeihu-1622120224479)(./images/MysqlToHDFS组.gif)]

1.3.2创建QueryDatabaseTable

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4NGzHDOO-1622120224484)(./images/创建QueryDataTable.gif)]

1.3.3创建并配置Mysql连接池

1.3.3.1创建连接池

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pupuxvkN-1622120224485)(./images/创建Mysql连接池.gif)]

1.3.3.2配置连接池

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Zc81zdTt-1622120224489)(.\images\image-20200219164809426.png)]

Database Connection URL = jdbc:mysql://192.168.52.6:3306/nifi_test?characterEncoding=UTF-8&useSSL=false&allowPublicKeyRetrieval=true
Database Driver Class Name = com.mysql.jdbc.Driver
#此处的jar包需要提前上传到nifi服务器中
Database Driver Location(s) = /export/download/jars/mysql-connector-java-5.1.40.jar
Database User = root
Password = 123456

1.3.3.3启动连接池

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wgwnNeGB-1622120224491)(./images/启动Mysql连接池.gif)]

1.3.4配置QueryDatabaseTable

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-x2JTlQxU-1622120224492)(.\images\image-20200219171053077.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j38BDRZO-1622120224493)(.\images\image-20200219171703195.png)]

Custom Query = select id,name,mobile,email,son_json from user_info_nifi limit 15

1.3.5创建配置ConvertAvroToJSON

1.3.5.1创建配置ConvertAvroToJSON

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-p10ZV0NM-1622120224495)(./images/配置ConvertAvroToJson.gif)]

1.3.5.2连接

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-79GR315R-1622120224495)(./images/连接Q和C.gif)]

1.3.5.3 负载均衡消费数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fsY0HKJe-1622120224497)(./images/负载均衡消费query.gif)]

1.3.6创建配置SplitJson

1.3.6.1 SplitJson配置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tncXimbT-1622120224498)(.\images\image-20200219173310756.png)]

JsonPath Expression = $.*

1.3.6.2 连接

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AtfaQ9Rm-1622120224498)(./images/连接C和S.gif)]

1.3.7创建配置PutHDFS

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ncwsh2BL-1622120224499)(.\images\image-20200219175456103.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-koSoDzgq-1622120224500)(.\images\image-20200219175036736.png)]

Hadoop Configuration Resources = /export/download/config/hdfs-site.xml,/export/download/config/core-site.xml
Directory = /user/hive/warehouse/nifi_test.db/user_info_nifi
Conflict Resolution Strategy = append

1.3.8运行查看效果

1.3.8.1 启动QueryDatabaseTable，并查看队列中数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e4sDKuqr-1622120224500)(./images/启动QueryDatabaseTable.gif)]

1.3.8.2 启动ConvertAvroToJSON，并查看队列中数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CVr8Hjzv-1622120224501)(./images/启动ConvertAvroToJSON.gif)]

1.3.8.3 启动SplitJson，并查看队列中数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8vVzWfGs-1622120224503)(./images/启动SplitJson.gif)]

1.3.8.4 启动PutHDFS，并查看处理器接收和输出的数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5HG7t8xG-1622120224504)(./images/启动PutHDFS.gif)]

1.3.8.5 查看HDFS数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yhraSnEF-1622120224504)(./images/查看HDFS数据.gif)]

2. Json内容转换为Hive支持的文本格式

在向HDFS同步数据的示例中，我们保存的文本内容是Json格式的，如图：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Xn845ucz-1622120224505)(.\images\image-20200220045630404.png)]

如果数据需要被Hive的外部表所使用，那么目前的Json数据格式是不满足要求的，我们如何将Json格式数据转换为Hive所需要的文本格式呢？

2.1处理器流程

QueryDatabaseTable ——> ConvertAvroToJSON ——> SplitJson ——> EvaluateJsonPath ——> ReplaceText ——> PutHDFS

这里的重点是，增加了EvaluateJsonPath和ReplaceText处理器，EvaluateJsonPath用来提取json中的属性，ReplaceText用来替换掉FlowFile中的内容，以使内容符合Hive外部表所支持的文本格式。

将Json数据中的属性值提取出来；
转换为\t分割字段；\n分割行数据的格式。

2.2处理器说明

EvaluateJsonPath

描述

该处理器根据流文件的内容计算一个或多个JsonPath表达式。这些表达式的结果被写入到FlowFile属性，或者写入到FlowFile本身的内容中，这取决于处理器的配置。通过添加用户自定义的属性来输入jsonpath，添加的属性的名称映射到输出流中的属性名称(如果目标是flowfile-attribute;否则，属性名将被忽略)。属性的值必须是有效的JsonPath表达式。“auto-detect”的返回类型将根据配置的目标进行确定。当“Destination”被设置为“flowfile-attribute”时，将使用“scalar”的返回类型。当“Destination”被设置为“flowfile-content”时，将使用“JSON”返回类型。如果JsonPath计算为JSON数组或JSON对象，并且返回类型设置为“scalar”，则流文件将不进行修改，并将路由到失败。如果所提供的JsonPath计算为指定的值，JSON的返回类型可以返回“scalar”。如果目标是“flowfile-content”，并且JsonPath没有计算到一个已定义的路径，那么流文件将被路由到“unmatched”，无需修改其内容。如果目标是“flowfile-attribute”，而表达式不匹配任何内容，那么将使用空字符串创建属性作为值，并且FlowFile将始终被路由到“matched”。

属性配置

属性名称	默认值	可选值	描述
Destination	flowfile-content	flowfile-contentflowfile-content	指示是否将JsonPath计算结果写入流文件内容或流文件属性;如果使用flowfile-attribute，则必须指定属性名称属性。如果设置为flowfile-content，则只能指定一个JsonPath，并且忽略属性名。
Return Type	auto-detect	auto-detectjsonscalar	指示JSON路径表达式的期望返回类型。选择“auto-detect”，“flowfile-content”的返回类型自动设置为“json”，“flowfile-attribute”的返回类型自动设置为“scalar”。
Path Not Found Behavior	ignore	warnignore	指示在将Destination设置为“flowfile-attribute”时如何处理丢失的JSON路径表达式。当没有找到JSON路径表达式时，选择“warn”将生成一个警告。
Null Value Representation	empty string	empty stringempty string	指示产生空值的JSON路径表达式的所需表示形式。

动态属性：

该处理器允许用户指定属性的名称和值。

属性名称	属性值	描述
用户自由定义的属性名称	用户自由定义的属性值	在该处理器生成的文件流上添加用户自定义的属性。如果使用表达式语言，则每批生成的流文件只执行一次计算 . 支持表达式语言:true(只使用变量注册表进行计算)

应用场景

通常当需要从流文件json中提取某些数据作为流属性时，使用此处理器；或者从流文件json内容中提取一部分内容作为下一个流文件内容，使用此处理器。

ReplaceText

描述

使用其他值替换匹配正则表达式的流文件部分内容，从而更新流文件的内容。

属性配置

属性名称	默认值	可选值	描述
Search Value	(?s)(^.*$)		正则表达式，仅用于“Literal Replace”和“Regex Replace”匹配策略支持表达式语言:true
Replacement Value	$1		使用“Replacement Strategy”策略时插入的值。支持表达式语言:true
Character Set	UTF-8		字符集
Maximum Buffer Size	1 MB		指定要缓冲的最大数据量(每个文件或每行，取决于计算模式)，以便应用替换。如果选择了“Entire Text”，并且流文件大于这个值，那么流文件将被路由到“failure”。在“Line-by-Line”模式下，如果一行文本比这个值大，那么FlowFile将被路由到“failure”。默认值为1 MB，主要用于“Entire Text”模式。在“Line-by-Line”模式中，建议使用8 KB或16 KB这样的值。如果将<Replacement Strategy>属性设置为一下其中之一:Append、Prepend、Always Replace，则忽略该值
Replacement Strategy	Regex Replace	PrependAppendRegex ReplaceLiteral ReplaceAlways Replace	在流文件的文本内容中如何替换以及替换什么内容的策略。
Evaluation Mode	Entire text	Line-by-LineEntire text	对每一行单独进行“替换策略”(Line-by-Line)；或将整个文件缓冲到内存中(Entire text)，然后对其进行“替换策略”。

应用场景

使用正则表达式，来逐行或者全文本替换文件流内容，往往用于业务逻辑处理。

2.3操作

2.3.1 EvaluateJsonPath提取Json字段值

2.3.1.1 创建并连接EvaluateJsonPath

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oZsl9egs-1622120224505)(./images/创建并连接EvaluateJsonPath.gif)]

2.3.1.2 将Json字段配置到attribute

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TyCXNzF4-1622120224506)(.\images\image-20200220053215487.png)]

flowfile-attribute即为将变量放置在属性中；

扩展属性就是我们读取到的Json属性。

同时处理把Invalid警告处理掉

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PfbxpnrN-1622120224508)(./images/处理Invalid.gif)]

2.3.1.3 启动查看结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AMivXWzw-1622120224508)(./images/启动EvaluateJsonPath.gif)]

我们可以看到，经过EvaluateJsonPath处理后，FlowFile的属性中，已经包含了Json的字段值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Ue9vilwQ-1622120224510)(.\images\image-20200220054532165.png)]

2.3.2 ReplaceText变更文本内容和格式

虽然我们已经获取到了Json中的具体字段值，但是可以看到，FlowFile的内容还是Json。如何替换掉FlowFile中的内容数据呢？

2.3.2.1 创建ReplaceText并连接

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0uhfvq5m-1622120224510)(./images/创建ReplaceText.gif)]

2.3.2.2 解决Invalid

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HgXnaMpK-1622120224512)(./images/ReplaceTextInvalid.gif)]

2.3.2.3 配置替换FlowFile内容

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WKNEPYha-1622120224513)(.\images\image-20200220062521410.png)]

2.3.3 运行查看结果

2.3.3.1 运行所有处理器，查看最后的FlowFile输出

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9cT8tPMj-1622120224514)(.\images\hdfs-FlowFile输出.png)]

2.3.3.2 查看输出的HDFS文件

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tZPwJUGe-1622120224515)(.\images\image-20200220063258767.png)]

我们发现，最终的HDFS文件，已经符合Hive的格式要求，抽取完成。

3.实时同步Mysql数据到Hive

3.1 处理器流程

NiFi监控MySQL binlog处理调用流程如下: CaptureChangeMySQL ——> RouteOnAttribute ——> EvaluateJsonPath ——> ReplaceText ——> PutHiveQL

准备工作

Mysql建库建表：

create table nifi_test.nifi_hive
(
    id       int auto_increment
        primary key,
    name     varchar(64) null,
    day_time date        null
);

Hive建表：

CREATE TABLE myhive.nifi_hive(id int,name string,day_time string)
STORED AS ORC
TBLPROPERTIES('transactional'='true');

替换Hive支持nar包：

上传文件NiFi\资料\nifi安装包\nifi-hive-nar-1.9.2.nar，将其替换到NiFi服务的lib目录下，并重启NiFi集群。

3.2 处理器说明

CaptureChangeMySQL

描述

从MySQL数据库检索更改数据捕获（CDC）事件。CDC事件包括INSERT，UPDATE，DELETE操作。事件将作为单独的流文件输出，并按操作发生的时间排序。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示任何默认值，属性是否支持NiFi表达式语言以及属性是否被视为“敏感”，这意味着将加密其值。在敏感属性中输入值之前，请确保nifi.properties文件具有属性nifi.sensitive.props.key的条目。

名称	默认值	允许值	描述
MySQL Hosts			与MySQL群集中的节点相对应的主机名/端口条目的列表。条目应使用冒号（例如host1：port，host2：port等）以逗号分隔。例如mysql.myhost.com:3306。该处理器将尝试按顺序连接到列表中的主机。如果一个节点发生故障并为集群启用了故障转移，则处理器将连接到活动节点（假定在此属性中指定了其主机条目。MySQL连接的默认端口为3306。支持表达式语言：true（将为仅使用变量注册表进行评估）
MySQL Driver Class Name			MySQL数据库驱动程序类的类名称支持表达式语言：true（仅使用变量注册表进行评估）
MySQL Driver Location(s)			包含MySQL驱动程序JAR及其依赖项（如果有）的文件/文件夹和/或URL的逗号分隔列表。例如，“ / var / tmp / mysql-connector-java-5.1.38-bin.jar” 支持表达式语言：true（仅使用变量注册表进行评估）
Username			访问MySQL集群的用户名支持表达式语言：true（仅使用变量注册表进行评估）
Password			访问MySQL集群的密码敏感属性：true 支持表达式语言：true（仅使用变量注册表进行评估）
Server ID			连接到MySQL复制组的客户端实际上是一个简化的从属服务器（服务器），并且服务器ID值在整个复制组中必须是唯一的（即不同于任何主服务器或从属服务器使用的任何其他服务器ID）。因此，每个CaptureChangeMySQL实例在复制组中必须具有唯一的服务器ID。如果未指定服务器ID，则默认值为65535。支持表达式语言：true（仅使用变量注册表进行评估）
Database/Schema Name Pattern			用于将数据库（或模式，取决于RDBMS术语）与CDC事件列表进行匹配的正则表达式（regex）。正则表达式必须与存储在RDBMS中的数据库名称匹配。如果未设置该属性，则数据库名称将不会用于过滤CDC事件。注意：DDL事件（即使它们影响不同的数据库）也与会话用来执行DDL的数据库相关联。这意味着，如果与一个数据库建立了连接，但针对另一个数据库发出了DDL，则连接的数据库将是与指定模式匹配的数据库。
Table Name Pattern			用于影响影响匹配表的CDC事件的正则表达式（regex）。正则表达式必须与存储在数据库中的表名匹配。如果未设置该属性，则不会基于表名过滤任何事件。
Max Wait Time	30秒		建立连接所允许的最长时间，零表示实际上没有限制。支持表达式语言：true（仅使用变量注册表进行评估）
Distributed Map Cache Client			标识用于保留有关处理器所需的各种表，列等的信息的分布式映射缓存客户端控制器服务。如果未指定客户端，则生成的事件将不包括列类型或名称信息。
Retrieve All Records	true	true false	指定是否获取所有可用的CDC事件，而与当前binlog文件名和/或位置无关。如果binlog文件名和位置值存在于处理器的状态中，则将忽略此属性的值。这允许进行4种不同的配置：1）如果Binlog数据在处理器状态下可用，则该数据用于确定开始位置，并且“检索所有记录”的值将被忽略。2）如果没有二进制日志数据处于处理器状态，则将“检索所有记录”设置为true表示从二进制日志历史记录的开头开始。3）如果没有Binlog数据处于处理器状态，并且未设置Initial Binlog文件名/位置，则Retrieve All Records设置为false意味着从Binlog历史记录的末尾开始。4）如果没有二进制日志数据处于处理器状态，并且设置了初始二进制日志文件名/位置，然后将“检索所有记录”设置为false意味着从指定的初始Binlog文件/位置开始。要重置行为，请清除处理器状态（请参阅处理器文档的“状态管理”部分）。
Include Begin/Commit Events	false	true false	指定是否在二进制日志中发出与BEGIN或COMMIT事件相对应的事件。如果在下游流中需要BEGIN / COMMIT事件，则将其设置为true，否则将其设置为false，这将抑制这些事件的产生并提高流性能。
Include DDL Events	false	true false	指定是否在二进制日志中发出与数据定义语言（DDL）事件相对应的事件，例如ALTER TABLE，TRUNCATE TABLE。如果在下游流中需要DDL事件是必需的，则将其设置为true；否则，将其设置为false，这将抑制这些事件的生成并提高流性能。
State Update Interval	0秒		指示使用二进制日志文件/位置值更新处理器状态的频率。零值表示仅在处理器停止或关闭时才更新状态。如果在某个时候处理器状态不包含所需的二进制日志值，则发出的最后一个流文件将包含最后观察到的值，并且可以使用“初始二进制日志文件”，“初始二进制日志位置”和“初始序列”将处理器返回到该状态。 ID属性。支持表达式语言：true（仅使用变量注册表进行评估）
Initial Sequence ID			指定一个初始序列标识符，如果该处理器的状态没有当前序列标识符，则使用该序列标识符。如果处理器的状态中存在序列标识符，则将忽略此属性。序列标识符是单调递增的整数，它记录处理器生成的流文件的顺序。它们可以与EnforceOrder处理器一起使用，以保证CDC事件的有序交付。支持表达式语言：true（仅使用变量注册表进行评估）
Initial Binlog Filename			指定一个初始binlog文件名，如果该处理器的State没有当前binlog文件名，则使用该文件名。如果处理器的状态中存在文件名，则忽略此属性。如果不需要先前的事件，可以将其与初始Binlog位置一起使用以“向前跳过”。请注意，支持NiFi表达式语言，但是在配置处理器时会评估此属性，因此可能不会使用FlowFile属性。支持使用表达式语言来启用变量注册表和/或环境属性。支持表达式语言：true（仅使用变量注册表进行评估）
Initial Binlog Position			如果该处理器的State没有当前的binlog文件名，则指定要使用的binlog的初始偏移量（由Initial Binlog Filename指定）。如果处理器的状态中存在文件名，则忽略此属性。如果不需要先前的事件，可以将其与初始Binlog文件名一起使用以“向前跳过”。请注意，支持NiFi表达式语言，但是在配置处理器时会评估此属性，因此可能不会使用FlowFile属性。支持使用表达式语言来启用变量注册表和/或环境属性。支持表达式语言：true（仅使用变量注册表进行评估）

写入属性

名称	描述
cdc.sequence.id	序列标识符（即严格增加的整数值），用于指定CDC事件流文件相对于其他事件流文件的顺序。
cdc.event.type	一个字符串，指示发生的CDC事件的类型，包括（但不限于）‘begin’, ‘insert’, ‘update’, ‘delete’, ‘ddl’ 和 ‘commit’。
mime.type	处理器以JSON格式输出流文件内容，并将mime.type属性设置为application / json

DistributedMapCacheServer

描述

提供可通过套接字访问的映射（键/值）缓存。与该服务的交互通常是通过DistributedMapCacheClient服务完成的。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示任何默认值。

名称	默认值	允许值	描述
港口	4557		侦听传入连接的端口
最大缓存条目	10000		缓存可以容纳的最大缓存条目数
驱逐策略	最少使用	最少使用最近最少使用先进先出	确定应使用哪种策略从缓存中逐出值以为新条目腾出空间
持久性目录			如果指定，则缓存将保留在给定目录中；如果未指定，则高速缓存将仅在内存中
SSL上下文服务		StandardRestrictedSSLContextService	如果指定，此服务将用于创建SSL上下文，以用于保护通信；如果未指定，则通信将不安全

DistributedMapCacheClientService

描述

提供与DistributedMapCacheServer通信的功能。可以使用它来在NiFi群集中的节点之间共享地图

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示任何默认值。

名称	默认值	描述
服务器主机名		运行DistributedMapCacheServer服务的服务器的名称
服务器端口	4557	与DistributedMapCacheServer服务通信时将使用的远程服务器上的端口
SSL上下文服务		如果指定，则表示用于与远程服务器通信的SSL上下文服务。如果未指定，通讯将不会被加密 StandardSSLContextService StandardRestrictedSSLContextService
通讯超时	30秒	指定在无法发送或接收数据时确定存在通信故障之前与远程服务器通信之前要等待多长时间

RouteOnAttribute

描述

该处理器使用属性表达式语言，根据流文件的属性去计算然后进行路由。该处理器往往用于判断逻辑。

属性配置

属性名称	默认值	可选值	描述
Routing Strategy	Route to Property name	Route to Property nameRoute to ‘matched’ if all matchRoute to ‘matched’ if any matches	指定如何确定在计算表达式语言时使用哪个关系

动态属性

该处理器允许用户指定属性的名称和值。

属性名称	属性值	描述
用户自由定义的属性名称 (Relationship Name)	用户自由定义的属性值 (Attribute Expression Language)	将其属性与动态属性值中指定的属性表达式语言相匹配的流文件路由到动态属性键中指定的关系. 支持表达式语言:true

连接关系

名称	描述
unmatched	不匹配任何用户定义表达式的流文件将被路由到这里

自定义连接关系

可以根据用户配置处理器的方式创建动态连接关系。

Name	Description
动态属性的属性名	匹配动态属性的属性表达式语言的流文件

PutHiveQL

描述

执行HiveQL DDL / DML命令（例如，UPDATE，INSERT）。预期传入File的内容是要执行的HiveQL命令。HiveQL命令可以使用？转义参数。在这种情况下，要使用的参数必须作为FlowFile属性存在，命名约定为hiveql.args.N.type和hiveql.args.N.value，其中N是一个正整数。hiveql.args.N.type应该是指示JDBC类型的数字。FlowFile的内容应采用UTF-8格式。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示任何默认值。

名称	默认值	描述
Hive Database Connection Pooling Service		Hive Controller Service，用于获取与Hive数据库的连接
Batch Size	100	在单个事务中放入数据库的首选FlowFiles数
Character Set	UTF-8	指定记录数据的字符集。
Statement Delimiter	;	语句分隔符，用于在多语句脚本中分隔SQL语句
Rollback On Failure	false	指定如何处理错误。默认情况下（false），如果在处理FlowFile时发生错误，则FlowFile将根据错误类型路由到“失败”或“重试”关系，处理器可以继续下一个FlowFile。相反，您可能想回滚当前已处理的FlowFile，并立即停止进一步的处理。在这种情况下，您可以通过启用此“回滚失败”属性来实现。如果启用，失败的FlowFiles将保留在输入关系中，而不会受到惩罚，并会反复处理，直到成功处理或通过其他方式将其删除为止。重要的是要设置足够的“有效期限”，以免重试次数过多。

HiveConnectionPool

描述

为Apache Hive提供数据库连接池服务。可以从池中请求连接，使用后返回连接。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示任何默认值，属性是否支持NiFi表达式语言。

名称	默认值	描述
Database Connection URL		用于连接数据库的数据库连接URL。可能包含数据库系统名称，主机，端口，数据库名称和一些参数。数据库连接URL的确切语法由Hive文档指定。例如，当连接到安全的Hive服务器时，通常将服务器主体作为连接参数包括在内。支持表达式语言：true（仅使用变量注册表进行评估）
Hive Configuration Resources		包含Hive配置（例如，hive-site.xml）的文件或文件的逗号分隔列表。否则，Hadoop将在类路径中搜索“ hive-site.xml”文件，或恢复为默认配置。请注意，例如要启用Kerberos身份验证，必须在配置文件中设置适当的属性。请参阅Hive文档以获取更多详细信息。支持表达式语言：true（仅使用变量注册表进行评估）
Database User		数据库用户名支持表达式语言：true（仅使用变量注册表进行评估）
Password		数据库用户的密码敏感属性：true 支持表达式语言：true（仅使用变量注册表进行评估）
Max Wait Time	500毫秒	池在失败之前将等待（如果没有可用连接时）返回连接的最大时间，或者无限期等待-1。支持表达式语言：true（仅使用变量注册表进行评估）
Max Total Connections	8	可以同时从该池分配的活动连接的最大数量，或者为无限制的最大数量。支持表达式语言：true（仅使用变量注册表进行评估）
Validation query		验证查询，用于在返回连接之前对其进行验证。当借用的连接无效时，它将被丢弃并返回新的有效连接。注意：使用验证可能会降低性能。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Credentials Service		指定应用于Kerberos身份验证的Kerberos凭据控制器服务
Kerberos Principal		Kerberos主体作为身份验证。需要在您的nifi.properties中设置nifi.kerberos.krb5.file。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Keytab		与主体关联的Kerberos密钥表。需要在您的nifi.properties中设置nifi.kerberos.krb5.file。支持表达式语言：true（仅使用变量注册表进行评估）

3.3 操作

3.3.1 开启Mysql的binlog日志

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9kc3bMBS-1622120224515)(./images/注意.png)]Mysql的版本号要求5.7。

3.3.1.1 登陆MySQL查看日志状态

# mysql -u root -p123456
mysql> show variables like '%log_bin%';

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3AqBfHpv-1622120224517)(./images/mysql的binglog状态)]

3.3.1.2 退出MySQL登陆

mysql> exit

3.3.1.3 Linux开启binlog

编辑配置文件

vi /etc/my.cnf

行尾加上

server_id = 1
log_bin = mysql-bin
binlog_format = row

server-id :表示单个结点的id,单个节点可以随意写，多个节点不能重复，
log-bin指定binlog日志文件的名字为mysql-bin，以及其存储路径。

重启服务

systemctl restart mysqld.service

或者

service mysqld restart

重新登陆查询开启状态

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gqssakWD-1622120224518)(./images/已开启binlog.png)]

3.3.1.4 Windows开启binlog

修改配置文件

找到mysql配置文件my.ini所在目录，一般在C:\ProgramData\MySQL\MySQL Server 5.7。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vZPIA1sg-1622120224518)(./images/注意.png)]注意目录不是C:\ Program Files \MySQL\MySQL Server 5.7。

server_id = 1
log_bin = mysql-bin
binlog_format = row

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QA32oSte-1622120224519)(./images/971912-20170223143611054-1457866695.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AK2jhFkX-1622120224520)(./images/971912-20170223143654882-327666417.png)]

重启Mysql服务

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TpHaX2PI-1622120224521)(./images/971912-20170223143853085-842589715.png)]

查询开启状态

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jV3iezLv-1622120224522)(./images/image-20200220174246783.png)]

3.3.1.5 开启Mysql远程访问权限

GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456' WITH GRANT OPTION;
FLUSH PRIVILEGES;

3.3.2 实时获取Mysql变更

3.3.2.1 创建处理器组

组名：MySqlToHive_Timely

3.3.2.2 创建CaptureChangeMySQL

CaptureChangeMySQL的配置中需要DistributedMapCacheClientService、DistributedMapCacheServer处理器，一并创建。

3.3.2.3 配置DistributedMapCacheServer

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dKkFj1jG-1622120224523)(.\images\image-20200227025101418.png)]

3.3.2.4 配置DistributedMapCacheClientService

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-56Pv39oc-1622120224525)(.\images\image-20200227025331788.png)]

3.3.2.5 启动Cache服务和客户端

在模拟的集群模式下，因为三台服务都在同一台主机，所以会存在端口冲突的问题，但是并不影响使用。因为只要有一个节点的缓存服务启动正常就可以使用。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rllQhNqY-1622120224526)(.\images\image-20200224024222684.png)]

3.3.2.6 配置CaptureChangeMySQL

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mFz7izgC-1622120224527)(.\images\image-20200224023812223.png)]

MySQL Hosts = 192.168.52.6:3306
MySQL Driver Class Name = com.mysql.jdbc.Driver
MySQL Driver Location(s) = /export/download/jars/mysql-connector-java-5.1.40.jar
Username = root
Password = 123456
Include Begin/Commit Events = true
Include DDL Events = true

3.3.2.7 启动CaptureChangeMysql

启动后报错：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0HWd77nf-1622120224528)(.\images\image-20200224024651506.png)]

FlowFile数据的属性信息：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YfptoKfX-1622120224528)(.\images\image-20200224030240843.png)]

3.3.3 根据条件路由

3.3.3.1 RouteOnAttribute多线程消费

根据自己的服务器硬件配置，以及数据的更新速率，进行评估后填写。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6D8xFA90-1622120224529)(.\images\image-20200224032737491.png)]

3.3.3.2 NiFi表达式

NiFi表达式官网：https://nifi.apache.org/docs/nifi-docs/html/expression-language-guide.html

之前我们已经了解过NiFi表达式语言，这里我们仅针对equals函数进行说明。

NiFi表达式的equals函数

equals

说明：equals函数使用非常广泛，它确定其主题是否等于另一个String值。请注意，该equals函数直接比较两个String值。注意不要将此函数与matchs函数混淆，后者会根据正则表达式评估其主题。

学科类型：任意

参数：

value：用于比较Subject的值。必须与主题类型相同。

返回类型：布尔值

示例：我们可以使用表达式${filename:equals('hello.txt')}检查FlowFile的文件名是否为“ hello.txt” ，或者可以检查属性hello的值是否等于属性的值filename： ${hello:equals( ${filename} )}。

3.3.3.3 设置自定义属性

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QefDgSEG-1622120224530)(.\images\image-20200224032758290.png)]

3.3.3.4 运行并查看输出

输出的数据内容：

{
    "type": "insert",
    "timestamp": 1582484253000,
    "binlog_filename": "mysql-bin.000005",
    "binlog_position": 375,
    "database": "nifi_test",
    "table_name": "nifi_hive_streaming",
    "table_id": 108,
    "columns": [
        {
            "id": 1,
            "name": "id",
            "column_type": 4,
            "value": 7
        },
        {
            "id": 2,
            "name": "name",
            "column_type": 12,
            "value": "testName5"
        },
        {
            "id": 3,
            "name": "day_time",
            "column_type": 91,
            "value": "2020-02-24"
        }
    ]
}

3.3.4 提取关键属性

EvaluateJsonPath等处理器在提取数据时，可以使用JsonPath表达式，来灵活的获取信息。

3.3.4.1 JsonPath表达式

简介

类似于XPath在xml文档中的定位，JsonPath表达式通常是用来路径检索或设置Json的。

JsonPath中的“根成员对象”始终称为$，无论是对象还是数组。

其表达式可以接受“dot–notation”和“bracket–notation”格式，例如

$.store.book[0].title、$[‘store’][‘book’][0][‘title’]

操作符

符号	描述
$	查询的根节点对象，用于表示一个json数据，可以是数组或对象
@	过滤器断言（filter predicate）处理的当前节点对象，类似于java中的this字段
*	通配符，可以表示一个名字或数字
…	可以理解为递归搜索，Deep scan. Available anywhere a name is required.
.	表示一个子节点
[‘’ (, ‘’)]	表示一个或多个子节点，
[ (, )]	表示一个或多个数组下标
[start:end]	数组片段，区间为[start,end),不包含end
[?()]	过滤器表达式，表达式结果必须是boolean

函数

可以在JsonPath表达式执行后进行调用，其输入值为表达式的结果。

名称	描述	输出
min()	获取数值类型数组的最小值	Double
max()	获取数值类型数组的最大值	Double
avg()	获取数值类型数组的平均值	Double
stddev()	获取数值类型数组的标准差	Double
length()	获取数值类型数组的长度	Integer

过滤器

过滤器是用于过滤数组的逻辑表达式，一个通常的表达式形如：[?(@.age > 18)]，可以通过逻辑表达式&&或||组合多个过滤器表达式，例如[?(@.price < 10 && @.category == ‘fiction’)]，字符串必须用单引号或双引号包围，例如[?(@.color == ‘blue’)] or [?(@.color == “blue”)]。

操作符	描述
==	等于符号，但数字1不等于字符1(note that 1 is not equal to ‘1’)
!=	不等于符号
<	小于符号
<=	小于等于符号
>	大于符号
>=	大于等于符号
=~	判断是否符合正则表达式，例如[?(@.name =~ /foo.*?/i)]
in	所属符号，例如[?(@.size in [‘S’, ‘M’])]
nin	排除符号
size	size of left (array or string) should match right
empty	判空符号

示例

{
    "store": {
        "book": [
            {
                "category": "reference",
                "author": "Nigel Rees",
                "title": "Sayings of the Century",
                "price": 8.95
            },
            {
                "category": "fiction",
                "author": "Evelyn Waugh",
                "title": "Sword of Honour",
                "price": 12.99
            },
            {
                "category": "fiction",
                "author": "Herman Melville",
                "title": "Moby Dick",
                "isbn": "0-553-21311-3",
                "price": 8.99
            },
            {
                "category": "fiction",
                "author": "J. R. R. Tolkien",
                "title": "The Lord of the Rings",
                "isbn": "0-395-19395-8",
                "price": 22.99
            }
        ],
        "bicycle": {
            "color": "red",
            "price": 19.95
        }
    },
    "expensive": 10
}

JsonPath (点击链接测试)	结果
$. s t o r e . b o o k [*] . a u t h o r < b r / > 或 < b r / >$ …author	获取json中store下book下的所有author值
$.store.* 显示所有叶子节点值	所有的东西，书籍和自行车
$.store…price	获取json中store下所有price的值
$…book[2]	获取json中book数组的第3个值
$…book[-2]	倒数的第二本书
$. . b o o k [0, 1] < b r / > 或 < b r / >$ …book[:2]	前两本书
$…book[1:2]	从索引1（包括）到索引2（排除）的所有图书
$…book[-2:]	获取json中book数组的最后两个值
$…book[2:]	获取json中book数组的第3个到最后一个的区间值
$…book[?(@.isbn)]	获取json中book数组中包含isbn的所有值
$.store.book[?(@.price < 10)]	获取json中book数组中price<10的所有值
$…book[?(@.price <= $[‘expensive’])]	获取json中book数组中price<=expensive的所有值
$…book[?(@.author =~ /.*REES/i)]	获取json中book数组中的作者以REES结尾的所有值（REES不区分大小写）
$…*	逐层列出json中的所有值，层级由外到内
$…book.length()	获取json中book数组的长度

3.3.4.2 提取Json属性到Attribute

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-y2AN57o1-1622120224531)(.\images\image-20200224052413600.png)]

3.3.4.3 运行并查看输出

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QEzkocMT-1622120224532)(.\images\image-20200224055018928.png)]

3.3.5 ReplaceText转换Sql

配置ReplaceText

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-usUf3JaW-1622120224533)(.\images\image-20200224072302056.png)]

Replacement Value = insert into myhive.nifi_hive (id,name,day_time) values (${id},'${name}','${day_time}')

启动查看结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oiwj9UY4-1622120224534)(.\images\image-20200224074104607.png)]

3.3.6 写入Hive

3.3.6.1 创建PutHiveQL

略

3.3.6.2 创建配置HiveConnectionPool

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ggPleQep-1622120224534)(.\images\image-20200224074630902.png)]

Database Connection URL = jdbc:hive2://192.168.52.120:10000
Hive Configuration Resources = /export/download/config/core-site.xml,/export/download/config/hdfs-site.xml,/export/download/config/hive-site.xml

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tHi6wevX-1622120224536)(./images/注意.png)]配置完成后，记得启用HiveConnectionPool。

3.3.6.3 PutHiveQL关联HiveConnectionPool

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D1qhpeUC-1622120224536)(.\images\image-20200224075057004.png)]

3.3.7 验证Hive表中是否成功写入数据

略。

4. Kafka的使用

Kafka是一个由Scala和java编写的高吞吐量的分布式发布订阅消息。它拥有很高的吞吐量、稳定性和扩容能力，在OLTP和OLAP中都会经常使用。使用NiFi可以简单快速的建立起kafka的生产者和消费者，而不需要编写繁杂的代码。

4.1 处理器说明

4.1.1 PublishKafka_0_10

描述

使用Kafka 0.10.x Producer API将FlowFile的内容作为消息发送到Apache Kafka。要发送的消息可以是单独的FlowFiles，也可以使用用户指定的定界符（例如换行符）进行定界。用于获取消息的辅助NiFi处理器是ConsumeKafka_0_10。

属性配置

Name	Default Value	Description
Kafka Brokers	localhost:9092	逗号分隔的已知Kafka Broker列表，格式为<主机>：<端口> 支持表达式语言：true（仅使用变量注册表进行评估）
Security Protocol	纯文本	与经纪人通信的协议。对应于Kafka的“ security.protocol”属性。
Kerberos Service Name		与代理JAAS文件中配置的Kafka服务器的主要名称匹配的服务名称。可以在Kafka的JAAS配置或Kafka的配置中定义。对应于Kafka的’security.protocol’属性，除非选择的SASL选项之一，否则它将被忽略。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Credentials Service		指定应用于Kerberos身份验证的Kerberos凭据控制器服务
Kerberos Principal		将用于连接到代理的Kerberos主体。如果未设置，则应在bootstrap.conf文件中定义的JVM属性中设置JAAS配置文件。该主体将被设置为“ sasl.jaas.config” Kafka的属性。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Keytab		用于连接代理的Kerberos密钥表。如果未设置，则应在bootstrap.conf文件中定义的JVM属性中设置JAAS配置文件。该主体将被设置为“ sasl.jaas.config” Kafka的属性。支持表达式语言：true（仅使用变量注册表进行评估）
SSL Context Service		指定用于与Kafka通信的SSL上下文服务。
Topic Name		要发布到的Kafka主题的名称。支持表达式语言：true（将使用流文件属性和变量注册表进行评估）
Delivery Guarantee	0	指定保证消息发送到Kafka的要求。对应于Kafka的“ acks”属性： Best Effort Guarantee Single Node Delivery Guarantee Replicated Delivery
Kafka Key		用于消息的密钥。如果未指定，则将流文件属性’kafka.key’用作消息密钥（如果存在）。请注意，同时设置Kafka密钥和标界可能会导致许多具有相同密钥的Kafka消息。这不是问题，因为Kafka不会强制执行或假定消息和密钥的唯一性。尽管如此，同时设置分界符和Kafka密钥仍存在Kafka数据丢失的风险。在Kafka上进行主题压缩时，将基于此密钥对消息进行重复数据删除。支持表达式语言：true（将使用流文件属性和变量注册表进行评估）
Key Attribute Encoding	utf-8	发出的FlowFiles具有名为“ kafka.key”的属性。此属性指示应如何编码属性的值。
Message Demarcator		指定用于在单个FlowFile中划分多个消息的字符串（解释为UTF-8）。如果未指定，则FlowFile的全部内容将用作一条消息。如果指定，则FlowFile的内容将在此定界符上分割，并且每个部分作为单独的Kafka消息发送。要输入特殊字符（例如“换行”），请根据您的操作系统使用CTRL + Enter或Shift + Enter。支持表达式语言：true（将使用流文件属性和变量注册表进行评估）
Max Request Size	1兆字节	请求的最大大小（以字节为单位）。对应于Kafka的’max.request.size’属性，默认值为1 MB（1048576）。
Acknowledgment Wait Time	5秒	在向Kafka发送消息后，这表明我们愿意等待Kafka做出回应的时间。如果Kafka在此时间段内未确认该消息，则FlowFile将被路由为“失败”。
Max Metadata Wait Time	5秒	在整个“发送”调用失败之前，发布者将在“发送”调用期间等待获取元数据或等待缓冲区刷新的时间。对应于Kafka的’max.block.ms’属性支持表达式语言：true（仅使用变量注册表进行评估）
Partitioner class	org…DefaultPartitioner	指定用于计算消息的分区标识的类。对应于Kafka的’partitioner.class’属性。 RoundRobinPartitioner、DefaultPartitioner
Compression Type	没有	此参数允许您为此生产者生成的所有数据指定压缩编解码器。

4.1.2 ConsumeKafka_0_10

描述

消耗来自专门针对Kafka 0.10.x Consumer API构建的Apache Kafka的消息。用于发送消息的辅助NiFi处理器是PublishKafka_0_10。

属性配置

在下面的列表中，必需属性的名称以粗体显示。其他任何属性（非粗体）均视为可选。该表还指示所有默认值，以及属性是否支持NiFi表达式语言。

名称	默认值	描述
Kafka Brokers	localhost:9092	逗号分隔的已知Kafka Broker列表，格式为<主机>：<端口> 支持表达式语言：true（仅使用变量注册表进行评估）
Security Protocol	纯文本	与经纪人通信的协议。对应于Kafka的“ security.protocol”属性。
Kerberos Service Name		与代理JAAS文件中配置的Kafka服务器的主要名称匹配的服务名称。可以在Kafka的JAAS配置或Kafka的配置中定义。对应于Kafka的’security.protocol’属性，除非选择的SASL选项之一，否则它将被忽略。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Credentials Service		指定应用于Kerberos身份验证的Kerberos凭据控制器服务
Kerberos Principal		将用于连接到代理的Kerberos主体。如果未设置，则应在bootstrap.conf文件中定义的JVM属性中设置JAAS配置文件。该主体将被设置为“ sasl.jaas.config” Kafka的属性。支持表达式语言：true（仅使用变量注册表进行评估）
Kerberos Keytab		用于连接代理的Kerberos密钥表。如果未设置，则应在bootstrap.conf文件中定义的JVM属性中设置JAAS配置文件。该主体将被设置为“ sasl.jaas.config” Kafka的属性。支持表达式语言：true（仅使用变量注册表进行评估）
SSL Context Service		指定用于与Kafka通信的SSL上下文服务。
Topic Name(s)		要从中提取的Kafka主题的名称。如果逗号分隔，则可以提供多个。支持表达式语言：true（仅使用变量注册表进行评估）
Topic Name Format	names	指定提供的主题是逗号分隔的名称列表还是单个正则表达式。 names、pattern
Group ID		组ID用于标识同一使用者组内的使用者。对应于Kafka的’group.id’属性。支持表达式语言：true（仅使用变量注册表进行评估）
Offset Reset	latest	当Kafka中没有初始偏移量或服务器上不再存在当前偏移量时（例如，因为该数据已被删除），使您可以管理条件。对应于Kafka的’auto.offset.reset’属性。 earliest、latest、none
Key Attribute Encoding	utf-8	发出的FlowFiles具有名为“ kafka.key”的属性。此属性指示应如何编码属性的值。
Message Demarcator		由于KafkaConsumer批量接收消息，因此您可以选择输出FlowFiles，其中包含给定主题和分区的单个批次中的所有Kafka消息，并且该属性允许您提供一个字符串（解释为UTF-8）以用于分界多封Kafka讯息。这是一个可选属性，如果未提供，则收到的每条Kafka消息都会在触发该消息时产生一个FlowFile。要输入特殊字符（例如“换行”），请使用CTRL + Enter或Shift + Enter，具体取决于操作系统支持的表达语言：true（仅使用变量注册表进行评估）
Max Poll Records	10000	指定Kafka在一次轮询中应返回的最大记录数。
Max Uncommitted Time	1 secs	指定在必须提交偏移量之前允许通过的最长时间。该值影响补偿的提交频率。较少地提交偏移量会增加吞吐量，但是如果在提交之间重新平衡或JVM重新启动，则可能会增加潜在数据重复的窗口。此值还与最大轮询记录和消息定界符的使用有关。使用消息分界器时，未提交的消息会比未分配的消息多得多，因为跟踪内存的情况要少得多。

4.2 Producer生产

4.2.1 创建处理器

创建处理器组kafka，进入组后分别创建GenerateFlowFile和PublishKafka_0_10处理器。

4.2.2 负载均衡生产消息

4.2.2.1 连接GenerateFlowFile和PublishKafka_0_10

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DMJcbO8r-1622120224537)(.\images\image-20200225210827547.png)]

4.2.2.2 负载均衡并发

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qOgeULPq-1622120224537)(.\images\image-20200225210922052.png)]

4.2.3 配置GenerateFlowFile

4.2.3.1 调度配置：

每1秒生产一次数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LaJRfMmP-1622120224538)(.\images\image-20200225205505624.png)]

4.2.3.2 属性配置

文件大小100b；每次生成10个相同文件；每次生成的流文件内容唯一。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-O3l1eE3h-1622120224540)(.\images\image-20200225205114163.png)]

4.2.4 配置PublishKafka_0_10

4.2.4.1 属性配置

Brokers设置为192.168.52.100:9092,192.168.52.110:9092,192.168.52.120:9092

topic设置为nifi-topic，如果topic不存在，会自动创建；

Delivery Guarantee，对应kafka的acks机制，选择最为保险的Guarantee Replicated Delivery，相当于acks=all。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ElK5uAW0-1622120224540)(.\images\image-20200225205854431.png)]

4.2.4.2 关系配置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yu0d4OU7-1622120224541)(.\images\image-20200225210330647.png)]

4.2.5 启动流程并监听数据

4.2.5.1 启动流程

略

4.2.5.2 监听kafka消费数据

在kafka所在服务器执行监听命令：

/export/servers/kafka_2.11-0.10.2.1/bin/kafka-console-consumer.sh --bootstrap-server  192.168.52.110:9092 --topic nifi-topic

4.3 Consumer消费

4.3.1 创建处理器并连接

创建ConsumeKafka_0_10和LogAttribute处理器，并连接。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IOlXCFKm-1622120224542)(.\images\image-20200225212642989.png)]

4.3.2 配置ConsumeKafka_0_10

Brokers地址要和Producer的设置一样：192.168.52.100:9092,192.168.52.110:9092,192.168.52.120:9092

Topic设置和Producer一致：nifi-topic

GroupId随意设置：nifi

Offset Reset设置为：latest，从最新的消息开始消费

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-63XF2w8U-1622120224543)(.\images\image-20200225213912193.png)]

4.3.3 设置LogAttribute

设置为自连接

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MPhOcA99-1622120224544)(.\images\image-20200225214438127.png)]

4.3.4 启动流程并查看日志

略、

4.3.5 增加生产频率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-14dXjjmV-1622120224545)(./images/注意.png)]注意：如果服务器资源有限，不要进行此操作。

GenerateFlowFile的调度频率加快：20ms

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MMhKohj0-1622120224546)(.\images\image-20200225214812081.png)]

观察kafka消费情况，和nifi日志打印。

你可能感兴趣的:(javascript,java,vue,数据库,uefi,entity,sync)

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
Vue3+Vite+TS+Axios整合详细教程老马聊技术 Vue Vite TS vue.js
1.Vite简介Vite是新一代的前端构建工具，在尤雨溪开发Vue3.0的时候诞生。类似于Webpack+Webpack-dev-server。其主要利用浏览器ESM特性导入组织代码，在服务器端按需编译返回，完全跳过了打包这个概念，服务器随起随用。生产中利用Rollup作为打包工具，号称下一代的前端构建工具。vite是一种新型的前端构建工具，能够显著的提升前端开发者的体验。它主要有俩部分组成：一个
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
本地包解决npm error code E404 雅痞yuppie npm 前端 node.js
这个错误提示表明npm找不到名为create-vue-admin-cli的包。这是因为你开发的CLI工具还没有发布到npm官方注册表。要解决这个问题，有两种方法：方法一：使用本地开发模式测试1.确保你的CLI已正确链接到全局在你的vue-admin-cli项目根目录下执行：npmlink这会在全局环境中创建一个符号链接，指向你本地的CLI项目。2.使用本地链接的CLI创建项目直接使用命令：vue-
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
javaSE面试题---语法基础、面向对象、常用类、集合、多线程、文件和IO yang_xiao_wu_ java 面试开发语言 javase java基础多线程文件和IO
目录语法基础1.jdkjrejvm区别2.基本数据类型3.引用数据类型4.自动类型转换、强制类型转换5.常见的运算符6.&和&&区别7.++--在前和在后的区别8.+=有什么作用9.switch..case中switch支持哪些数据类型10.break和continue区别11.while和dowhile区别12.如何生成一个取值范围在[min,max]之间的随机数13.数组的长度如何获取？数组下
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。