小猪佩琪962

01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip204888 （备注大数据）

正文

[root@node1 ~]# cd /export/software/
[root@node1 software]# rz
上传软件包：flink-1.13.1-bin-scala_2.11.tgz

[root@node1 software]# chmod u+x flink-1.13.1-bin-scala_2.11.tgz
[root@node1 software]# tar -zxf flink-1.13.1-bin-scala_2.11.tgz -C /export/server/

[root@node1 ~]# cd /export/server/
[root@node1 server]# chown -R root:root flink-1.13.1
[root@node1 server]# mv flink-1.13.1 flink-standalone


2）、修改flink-conf.yaml

vim /export/server/flink-standalone/conf/flink-conf.yaml
修改内容：33行内容
jobmanager.rpc.address: node1


3）、修改masters

vim /export/server/flink-standalone/conf/masters
修改内容：
node1:8081


4）、修改workers

vim /export/server/flink-standalone/conf/workers
修改内容：
node1
node2
node3


5）、添加HADOOP\_CONF\_DIR环境变量(集群所有机器）

vim /etc/profile
添加内容：
export HADOOP_CONF_DIR=/export/server/hadoop/etc/hadoop

执行生效

source /etc/profile


6）、将Flink依赖Hadoop 框架JAR包上传至/export/server/flink-standalone/lib目录  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/8ae4148cdd5b45b2bf9301d8ae500765.png#pic_center)

[root@node1 ~]# cd /export/server/flink-standalone/lib/

[root@node1 lib]# rz
commons-cli-1.4.jar
flink-shaded-hadoop-3-uber-3.1.1.7.2.1.0-327-9.0.jar


7）、分发到集群其他机器

scp -r /export/server/flink-standalone root@node2:/export/server

scp -r /export/server/flink-standalone root@node3:/export/server


。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。  
 接下来，启动服务进程，运行批处理程序：词频统计WordCount。  
 1）、启动HDFS集群，在node1上执行如下命令

start-dfs.sh


2）、启动集群，执行如下命令

一键启动所有服务JobManager和TaskManagers

[root@node1 ~]# /export/server/flink-standalone/bin/start-cluster.sh
Starting cluster.
Starting standalonesession daemon on host node1.
Starting taskexecutor daemon on host node1.
Starting taskexecutor daemon on host node2.
Starting taskexecutor daemon on host node3.


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/ffbc9f09785742a4a4c3325ccb2cb8e8.png#pic_center)3）、访问Flink UI界面：http://node1:8081/#/overview  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/71628461a21d48ef9a88ca2db485c71d.png#pic_center)![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/0ac06f376ae1431bb2dbe51e2ac9ff1a.png#pic_center)4）、执行官方测试案例

准备测试数据

[root@node1 ~]# hdfs dfs -mkdir -p /wordcount/input/
[root@node1 ~]# hdfs dfs -put /root/words.txt /wordcount/input/


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/d2fe8f020bdf4e2ab22a412c7e94033d.png#pic_center)

运行程序，使用–input指定处理数据文件路径
/export/server/flink-standalone/bin/flink run
/export/server/flink-standalone/examples/batch/WordCount.jar
–input hdfs://node1:8020/wordcount/input/words.txt


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3ab1969ae0c54bb68230e85ef32d1755.png#pic_center)

使用–output指定处理结果数据存储目录

/export/server/flink-standalone/bin/flink run
/export/server/flink-standalone/examples/batch/WordCount.jar
–input hdfs://node1:8020/wordcount/input/words.txt
–output hdfs://node1:8020/wordcount/output/result

[root@node1 ~]# hdfs dfs -text /wordcount/output/result


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/39244ea7115a4c3fb2b4efd3bbc2e9c9.png#pic_center)  
 5）、关闭Standalone集群服务

一键停止所有服务JobManager和TaskManagers

[root@node1 ~]# /export/server/flink-standalone/bin/stop-cluster.sh
Stopping taskexecutor daemon (pid: 6600) on host node1.
Stopping taskexecutor daemon (pid: 3016) on host node2.
Stopping taskexecutor daemon (pid: 3034) on host node3.
Stopping standalonesession daemon (pid: 6295) on host node1.


**补充**：Flink Standalone集群启动与停止，也可以逐一服务启动

每个服务单独启动

在node1上启动

/export/server/flink-standalone/bin/jobmanager.sh start

在node1、node2、node3.

/export/server/flink-standalone/bin/taskmanager.sh start # 每台机器执行

===============================================================

每个服务单独停止

在node1上停止

/export/server/flink-standalone/bin/jobmanager.sh stop

在node1、node2、node3

/export/server/flink-standalone/bin/taskmanager.sh stop


#### 07-安装部署之Standalone HA


从Standalone架构图中，可发现JobManager存在`单点故障（SPOF`），一旦JobManager出现意外，整个集群无法工作。为了确保集群的高可用，需要搭建Flink的Standalone HA。  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/715af74eb954485cb1bc3d5e6e94a68a.png#pic_center)Flink Standalone HA集群，类似YARN HA 集群安装部署，可以启动多个主机点JobManager，使用Zookeeper集群监控JobManagers转态，进行选举leader，实现自动故障转移。  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/070a87654e934229a1a18131a0c456a7.png#pic_center) 在 Zookeeper 的协助下，一个 Standalone的Flink集群会同时有多个活着的 JobManager，其中\*\*只有一个处于Active工作状态，其他处于 Standby 状态。\*\*当工作中的 JobManager 失去连接后(如宕机或 Crash)，Zookeeper 会从 Standby 中选一个新的 JobManager 来接管 Flink 集群。  
 1）、集群规划  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/2f7bb0db07d142d08ae056b87b1b4558.png#pic_center)

在node1上复制一份standalone

[root@node1 ~]# cd /export/server/
[root@node1 server]# cp -r flink-standalone flink-ha

删除日志文件

[root@node1 ~]# rm -rf /export/server/flink-ha/log/*


2）、启动ZooKeeper，在node1上启动

start-zk.sh


3）、启动HDFS，在node1上启动，如果没有关闭，不用重启

start-dfs.sh


4）、停止集群，在node1操作，进行HA高可用配置

/export/server/flink-standalone/bin/stop-cluster.sh


5）、修改flink-conf.yaml，在node1操作

vim /export/server/flink-ha/conf/flink-conf.yaml
修改内容：
jobmanager.rpc.address: node1

high-availability: zookeeper
high-availability.storageDir: hdfs://node1:8020/flink/ha/
high-availability.zookeeper.quorum: node1:2181,node2:2181,node3:2181
high-availability.zookeeper.path.root: /flink
high-availability.cluster-id: /cluster_standalone

state.backend: filesystem
state.backend.fs.checkpointdir: hdfs://node1:8020/flink/checkpoints
state.savepoints.dir: hdfs://node1:8020/flink/savepoints


6）、修改masters，在node1操作

vim /export/server/flink-ha/conf/masters
修改内容：
node1:8081
node2:8081


7）、分发到集群其他机器，在node1操作

scp -r /export/server/flink-ha root@node2:/export/server/
scp -r /export/server/flink-ha root@node3:/export/server/


8）、修改node2上的flink-conf.yaml

[root@node2 ~]# vim /export/server/flink-ha/conf/flink-conf.yaml
修改内容：33 行
jobmanager.rpc.address: node2


9）、重新启动Flink集群

node1和node2上执行

/export/server/flink-ha/bin/jobmanager.sh start

node1和node2、node3执行

/export/server/flink-ha/bin/taskmanager.sh start # 每台机器执行


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/d100003f20eb4d6ea53b5c5d7b651e1d.png#pic_center)


#### 08-Flink on YARN之运行流程


 在一个企业中，为了最大化的利用集群资源，一般都会在一个集群中同时运行多种类型的Workload，因此 Flink 也支持在 Yarn 集群运行。



> 
> 为什么使用`Flink on Yarn或Spark on Yarn?`
> 
> 
> 


* 1）、Yarn的资源可以按需使用，提高集群的资源利用率
* 2）、Yarn的任务有优先级，根据优先级运行作业
* 3）、基于Yarn调度系统，能够自动化地处理各个角色的 Failover(容错)

 `当应用程序（MR、Spark、Flink）运行在YARN集群上时，可以实现容灾恢复。`


#### 09-Flink on YARN之安装部署


Flink on YARN安装配置，此处考虑高可用HA配置，集群机器安装软件框架示意图：  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/4085371818cf4166824b579e6f522631.png#pic_center)1）、关闭YARN的内存检查（`node1`操作）

yarn-site.xml中添加配置

vim /export/server/hadoop/etc/hadoop/yarn-site.xml


添加如下内容：

yarn.nodemanager.pmem-check-enabled false yarn.nodemanager.vmem-check-enabled false


2）、 配置Application最大的尝试次数（`node1`操作）

yarn-site.xml中添加配置

vim /export/server/hadoop/etc/hadoop/yarn-site.xml


添加如下内容：

yarn.resourcemanager.am.max-attempts 4


3）、同步yarn-site.xml配置文件（`node1`操作）

cd /export/server/hadoop/etc/hadoop
scp -r yarn-site.xml root@node2: $P W Dsc p - ry a r n - s i t e . x m l roo t @ n o d e 3 :$ PWD


4）、启动HDFS集群和YARN集群（`node1`操作）

[root@node1 ~]# start-dfs.sh

[root@node1 ~]# start-yarn.sh


5）、添加`HADOOP_CONF_DIR`环境变量(**集群所有机器**）

添加环境变量

vim /etc/profile


添加内容：

export HADOOP_CONF_DIR=/export/server/hadoop/etc/hadoop


环境变量生效

source /etc/profile


6）、上传软件及解压（`node1`操作）

[root@node1 ~]# cd /export/software/
[root@node1 software]# rz
上传软件包：flink-1.13.1-bin-scala_2.11.tgz

[root@node1 software]# chmod u+x flink-1.13.1-bin-scala_2.11.tgz
[root@node1 software]# tar -zxf flink-1.13.1-bin-scala_2.11.tgz -C /export/server/

[root@node1 ~]# cd /export/server/
[root@node1 server]# chown -R root:root flink-1.13.1
[root@node1 server]# mv flink-1.13.1 flink-yarn


7）、将Flink依赖Hadoop 框架JAR包上传至`/export/server/flink-yarn/lib`目录  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/8873f05a70be4177826d8e37aecbae3f.png#pic_center)

[root@node1 ~]# cd /export/server/flink-yarn/lib/
[root@node1 lib]# rz
commons-cli-1.4.jar
flink-shaded-hadoop-3-uber-3.1.1.7.2.1.0-327-9.0.jar


8）、配置HA高可用，依赖Zookeeper及重试次数（`node1`操作）

修改配置文件

vim /export/server/flink-yarn/conf/flink-conf.yaml


添加如下内容：

high-availability: zookeeper
high-availability.storageDir: hdfs://node1:8020/flink/yarn-ha/
high-availability.zookeeper.quorum: node1:2181,node2:2181,node3:2181
high-availability.zookeeper.path.root: /flink-yarn-ha
high-availability.cluster-id: /cluster_yarn

yarn.application-attempts: 10


9）、集群所有机器，同步分发Flink 安装包，便于任意机器提交运行Flink Job。

scp -r /export/server/flink-yarn root@node2:/export/server/

scp -r /export/server/flink-yarn root@node3:/export/server/


10）、启动Zookeeper集群（`node1`操作）

start-zk.sh


在Flink中执行应用有如下三种部署模式（Deployment Mode）：  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/28d9a859154f9ba2e2fd90d2110735.png#pic\_center


#### 10-Flink on YARN之Session模式运行


Flink on YARN ：`Session 模式`，表示多个Flink Job运行共享Standalone集群资源。


 先向Hadoop YARN申请资源，启动运行服务JobManager和TaskManagers，再提交多个Job到Flink 集群上执行。  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/49973f0f961c49779283216acda93473.png#pic_center)


* 无论JobManager还是TaskManager，都是运行NodeManager Contanier容器中，以JVM 进程方式运行；
* 提交每个Flink Job执行时，找的就是JobManager（**AppMaster**），找运行在YARN上应用ID；


Session 会话模式：arn-session.sh(开辟资源) + flink run(提交任务)


* 第一、Hadoop YARN 运行Flink 集群，开辟资源，使用：yarn-session.sh
	+ 在NodeManager上，启动容器Container运行JobManager和TaskManagers
* 第二、提交Flink Job执行，使用：flink run


准备测试数据，测试运行批处理词频统计WordCount程序

[root@node1 ~]# vim /root/words.txt


添加数据

spark python spark hive spark hive
python spark hive spark python
mapreduce spark hadoop hdfs hadoop spark
hive mapreduce


数据文件上传

[root@node1 ~]# hdfs dfs -mkdir -p /wordcount/input/
[root@node1 ~]# hdfs dfs -put /root/words.txt /wordcount/input/


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/0483edce90d94b92a9558eab20ae1804.png#pic_center)


* 第一步、在yarn上启动一个Flink会话，node1上执行以下命令

export HADOOP_CLASSPATH=hadoop classpath
/export/server/flink-yarn/bin/yarn-session.sh -d -jm 1024 -tm 1024 -s 2

参数说明

-d：后台执行
-s：每个TaskManager的slot数量
-jm：JobManager的内存（单位MB)
-tm：每个TaskManager容器的内存（默认值：MB）

提交flink 集群运行yarn后，提示信息

JobManager Web Interface: http://node1:44263
…
$ echo “stop” | ./bin/yarn-session.sh -id application_1633441564219_0001
If this should not be possible, then you can also kill Flink via YARN’s web interface or via:
$ yarn application -kill application_1633441564219_0001


* 第二步、查看UI界面，http://node1:8088/cluster/apps  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/80f2eba05d3b40e988631f2b0cce27ba.png#pic_center) JobManager提供WEB UI：http://node1:8088/proxy/application\_1614756061094\_0002/#/overview


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/1160194c94bb4c67be09e16a83ae19c2.png#pic_center)  
 此时，没有任何TaskManager运行在容器Container中，需要等待有Flink Job提交执行时，才运行TaskManager。


* 第三步、使用flink run提交任务

/export/server/flink-yarn/bin/flink run
-t yarn-session
-Dyarn.application.id=application_1652168669227_0001
/export/server/flink-yarn/examples/batch/WordCount.jar
–input hdfs://node1:8020/wordcount/input/words.txt


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/4b22a13cc5674c179937ba5101dbf584.png#pic_center)


* 第四步、通过上方的ApplicationMaster可以进入Flink的管理界面  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/e4648061b1a546128161cbfb5878bd5c.png#pic_center)
* 第五步、关闭yarn-session

优雅停止应用，如果设置重启次数，即使停止应用，也会重启，一直到超过次数以后，才能真正停止应用

echo “stop” | /export/server/flink-yarn/bin/yarn-session.sh -id application_1633441564219_0001

kill 命令，直接将运行在yarn应用杀死，毫不留情

yarn application -kill application_1633441564219_0001


#### 11-Flink on YARN之PerJob模式运行


每个Flink Job提交运行到Hadoop YARN集群时，根据自身的情况，单独向YARN申请资源，直到作业执行完成


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/5f9d6cd856684d4b86dc5958d9f5a40b.png#pic_center)


 在Hadoop YARN中，每次提交job都会创建一个新的Flink集群，任务之间相互独立，互不影响并且方便管理。任务执行完成之后创建的集群也会消失。


采用Job分离模式，**每个Flink Job运行，都会申请资源，运行属于自己的Flink 集群**。


* 第一步、直接提交job

export HADOOP_CLASSPATH=hadoop classpath
/export/server/flink-yarn/bin/flink run
-t yarn-per-job -m yarn-cluster
-yjm 1024 -ytm 1024 -ys 1
/export/server/flink-yarn/examples/batch/WordCount.jar
–input hdfs://node1:8020/wordcount/input

参数说明

-m：指定需要连接的jobmanager(主节点)地址，指定为 yarn-cluster，启动一个新的yarn-session
-yjm：JobManager可用内存，单位兆
-ytm：每个TM所在的Container可申请多少内存，单位兆
-ys：每个TM会有多少个Slot
-yd：分离模式（后台运行，不指定-yd, 终端会卡在提交的页面上）


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/f7e874e6eb12410db123cd6e050705aa.png#pic_center)


* 第二步、查看UI界面：http://node1:8088/cluster  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/45e3600e96ba4d89bcfb7dd33e324d9f.png#pic_center)  
 提交Flink Job在Hadoop YARN执行时，最后给出如下错误警告：  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/f37d9984b3a14a0b94e8a9e6120f556a.png#pic_center)

解决办法：在 flink 配置文件里 flink-conf.yaml设置
classloader.check-leaked-classloader: false


#### 12-Flink on YARN之Application模式运行


**Flink 1.11** 引入了一种新的部署模式，即 **Application** 模式，目前可以支持基于 Hadoop YARN 和 Kubernetes 的 Application 模式。

1、Session 模式：

所有作业Job共享1个集群资源，隔离性差，JM 负载瓶颈，每个Job中main 方法在客户端执行。

2、Per-Job 模式：

每个作业单独启动1个集群，隔离性好，JM 负载均衡，Job作业main 方法在客户端执行。


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/f1e28d1fffc44e7f83bd916057fd44bb.png#pic_center) 以上两种模式，main方法都是在客户端执行，需要**获取 flink 运行时所需的依赖项，并生成 JobGraph，提交到集群的操作都会在实时平台所在的机器上执行**，那么将会给服务器造成很大的压力。此外，提交任务的时候会**把本地flink的所有jar包先上传到hdfs上相应的临时目录**，带来大量的网络的开销，所以如果任务特别多的情况下，平台的吞吐量将会直线下降。



> 
> Application 模式下，用户程序的 main 方法将在集群中运行，用户**将程序逻辑和依赖打包进一个可执行的 jar 包里**，集群的入口程序 (ApplicationClusterEntryPoint) 负责调用其中的 main 方法来生成 JobGraph。  
>  ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/a0295cd4da0743cb8ef02f9b32f8af83.png#pic_center)
> 
> 
> 


 **Application 模式为每个提交的应用程序创建一个集群，并在应用程序完成时终止**。Application 模式在不同应用之间提供了资源隔离和负载平衡保证。在特定一个应用程序上，JobManager 执行 m**ain** 可以[节省所需的 CPU 周期]，还可以[节省本地下载依赖项所需的带宽]。  
 Application 模式==使用 bin/flink run-application提交作业，本质上是Session和Per-Job模式的折衷。


* 通过 **-t** 指定部署环境，目前支持部署在 yarn 上(-t yarn-application) 和 k8s 上(-t kubernetes-application）；
* 通过 **-D** 参数指定通用的运行配置，比如 jobmanager/taskmanager 内存、checkpoint 时间间隔等。

export HADOOP_CLASSPATH=hadoop classpath

/export/server/flink-yarn/bin/flink run-application
-t yarn-application
-Djobmanager.memory.process.size=1024m
-Dtaskmanager.memory.process.size=1024m
-Dtaskmanager.numberOfTaskSlots=1
/export/server/flink-yarn/examples/batch/WordCount.jar
–input hdfs://node1:8020/wordcount/input


由于MAIN方法在JobManager（也就是NodeManager的容器Container）中执行，当Flink Job执行完成以后，启动`MRJobHistoryServer`历史服务器，查看AppMaster日志信息。

node1 上启动历史服务

[root@node1 ~]# mr-jobhistory-daemon.sh start historyserver


第二步、查看UI界面：http://node1:8088/cluster  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/4412e73896b943269e15b35f90254a64.png#pic_center)


测试Flink Job不同运行模式时，注意事项如下  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/1abfd1ab1d1b4ee8b0b4930cb0282298.png#pic_center)


### 第三部分：Flink入门案例


#### 13-Flink入门案例之编程模型


基于Flink计算引擎，分别实现批处理（Batch）和流计算（Streaming ）中：词频统计WordCount。


第一点：Flink API== ，提供四个层次API，越在下面API，越复杂和灵活；越在上面API，使用越简单和抽象  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/5bc58d4b39ff438db8ab72ae9c4218d4.png#pic_center)  
 第二点：编程模型==，无论编写批处理还是流计算程序，分为三个部分：Data Source、Transformations和Data Sink

第一步、从数据源DataSource获取数据

流计算：DataStream
批处理：DataSet

第二步、对数据进行转换处理

第三步、结果数据输出DataSink


无论批处理Batch，还是流计算Stream，首先需要创建`执行环境ExecutionEnvironment对象`，类似Spark中`SparkSession`或者`SparkContext`。


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/f0d54f7832804f44a5e305f509014d0d.png#pic_center)  
 创建整个Flink基础课程Maven Project，设置MAVEN Repository仓库目录及Maven安装目录  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/468969e064d54db0bbab4b07f7d2c89e.png#pic_center)  
 约定：每天创建一个Maven Module]()，创建第1天Maven Module，模块结构：  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/6baa92ff5a41469bb178284a82df9a37.png#pic_center)  
 POM文件添加如下内容：


    
        nexus-aliyun
        Nexus aliyun
        http://maven.aliyun.com/nexus/content/groups/public
    
    
        central_maven
        central maven
        https://repo1.maven.org/maven2
    
    
        cloudera
        https://repository.cloudera.com/artifactory/cloudera-repos/
    
    
        apache.snapshots
        Apache Development Snapshot Repository
        https://repository.apache.org/content/repositories/snapshots/
        
            false
        
        
            true
        
    



    
        org.apache.flink
        flink-java
        1.13.1
    
    
        org.apache.flink
        flink-streaming-java_2.11
        1.13.1
    
    
        org.apache.flink
        flink-clients_2.11
        1.13.1
    
    
        org.apache.flink
        flink-runtime-web_2.11
        1.13.1
    

    
        org.slf4j
        slf4j-api
        1.7.7
        runtime
    
    
        org.slf4j
        slf4j-log4j12
        1.7.7
        runtime
    
    
        log4j
        log4j
        1.2.17
        runtime
    




    src/main/java
    src/test/java
    
        
        
            org.apache.maven.plugins
            maven-compiler-plugin
            3.5.1
            
                1.8
                1.8
                
            
        
        
            org.apache.maven.plugins
            maven-surefire-plugin
            2.18.1
            
                false
                true
                
                    **/*Test.*
                    **/*Suite.*
                
            
        
        
        
            org.apache.maven.plugins
            maven-shade-plugin
            2.3
            
                
                    package
                    
                        shade
                    
                    
                        
                            
                                *:*
                                
                                    
 META-INF/.SF
 META-INF/.DSA
 META-INF/*.RSA
 
 
 
 
  
                             
                        
                    
                
            
        
    

 
  
日志配置文件：`log4j.properties`



 
  This affects logging for both user code and Flink 
  log4j.rootLogger=INFO, console 
  Uncomment this if you want to only change Flink’s logging 
  #log4j.logger.org.apache.flink=INFO 
  The following lines keep the log level of common libraries/connectors on 
  log level INFO. The root logger does not override this. You have to manually 
  change the log levels here. 
  log4j.logger.akka=INFO
 log4j.logger.org.apache.kafka=INFO
 log4j.logger.org.apache.hadoop=INFO
 log4j.logger.org.apache.zookeeper=INFO 
  Log all infos to the console 
  log4j.appender.console=org.apache.log4j.ConsoleAppender
 log4j.appender.console.layout=org.apache.log4j.PatternLayout
 log4j.appender.console.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS} %-5p %-60c %x - %m%n 
  Suppress the irrelevant (wrong) warnings from the Netty channel handler 
  log4j.logger.org.apache.flink.shaded.akka.org.jboss.netty.channel.DefaultChannelPipeline=ERROR, console 
  
#### 14-Flink入门案例之WordCount【批处理】


首先，基于Flink计算引擎，[实现离线批处理Batch：从文本文件读取数据，词频统计]。  
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/da9fead8dd8f41ffb3f7ce1a66978d6e.png#pic_center)  
 批处理时词频统计思路如下伪代码所示：



 
  				spark flink flink flink spark
							|
							| flatMap
							|
		 3-1. 分割单词 spark, flink, flink, flink, spark
		 					|
		                    | map
		                    |
		 3-2. 转换二元组 (spark, 1) (flink, 1) (flink, 1) (flink, 1) (spark, 1)
		 					|
		                    | groupBy(0)
		                    |
		 3-3. 按照单词分组
		        spark -> [(spark, 1) (spark, 1)]
		        flink -> [(flink, 1) (flink, 1) (flink, 1) ]
		        			|
		                    |sum(1)
		                    |
		 3-4. 组内数据求和，第二元素值累加
		        spark -> 1 + 1 = 2
		        flink -> 1 + 1 + 1 =3
 
  
基于Flink编写批处理或流计算程序步骤如下：（5个步骤）



 
  1.执行环境-env
 2.数据源-source
 3.数据转换-transformation
 4.数据接收器-sink
 5.触发执行-execute 
  
编写批处理词频统计：`BatchWordCount`，创建Java类



 
  package cn.itqzd.flink.batch; 
  import org.apache.flink.api.common.functions.FlatMapFunction;
 import org.apache.flink.api.common.functions.MapFunction;
 import org.apache.flink.api.java.ExecutionEnvironment;
 import org.apache.flink.api.java.operators.AggregateOperator;
 import org.apache.flink.api.java.operators.DataSource;
 import org.apache.flink.api.java.operators.FlatMapOperator;
 import org.apache.flink.api.java.operators.MapOperator;
 import org.apache.flink.api.java.tuple.Tuple2;
 import org.apache.flink.util.Collector; 
  /**
 * 使用Flink计算引擎实现离线批处理：词频统计WordCount
 * 1.执行环境-env
 * 2.数据源-source
 * 3.数据转换-transformation
 * 4.数据接收器-sink
 * 5.触发执行-execute
 */
 public class BatchWordCount { 
  public static void main(String[] args) throws Exception {
	// 1.执行环境-env
	ExecutionEnvironment env = ExecutionEnvironment.getExecutionEnvironment() ;

	// 2.数据源-source
	DataSource inputDataSet = env.readTextFile("datas/words.txt");

	// 3.数据转换-transformation
	/\*
 
  spark flink spark hbase spark
 |flatMap
 分割单词: spark, flink, spark
 |map
 转换二元组：(spark, 1) (flink, 1) (spark, 1)， TODO：Flink Java API中提供元组类Tuple
 |groupBy(0)
 分组：spark -> [(spark, 1), (spark, 1)] flink -> [(flink, 1)]
 |sum(1)
 求和：spark -> 1 + 1 = 2, flink = 1
 */
 // 3-1. 分割单词
 FlatMapOperator wordDataSet = inputDataSet.flatMap(new FlatMapFunction() {
 @Override
 public void flatMap(String line, Collector out) throws Exception {
 String[] words = line.trim().split(“\s+”);
 for (String word : words) {
 out.collect(word);
 }
 }
 }); 
  	// 3-2. 转换二元组
	MapOperator> tupleDataSet = wordDataSet.map(new MapFunction>() {
		@Override
		public Tuple2 map(String word) throws Exception {
			return Tuple2.of(word, 1);
		}
	});

	// 3-3. 分组及求和, TODO: 当数据类型为元组时，可以使用下标指定元素，从0开始
	AggregateOperator> resultDataSet = tupleDataSet.groupBy(0).sum(1);

	// 4.数据接收器-sink
	resultDataSet.print();

	// 5.触发执行-execute， TODO：批处理时，无需触发，流计算必须触发执行
	//env.execute("BatchWordCount") ;
}
 
  } 
  
#### 15-Flink入门案例之WordCount【流计算】


编写Flink程序，**接收TCP Socket的单词数据，并以空格进行单词拆分，分组统计单词个数**。  
 ![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/59917f432fc68dc396caf0ed855167a1.png)



**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）**
![img](https://img-blog.csdnimg.cn/img_convert/41c64c7fc1698e1ea6a75d839aca466c.png)

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

				for (String word : words) {
					out.collect(word);
				}
			}
		});

		// 3-2. 转换二元组
		MapOperator> tupleDataSet = wordDataSet.map(new MapFunction>() {
			@Override
			public Tuple2 map(String word) throws Exception {
				return Tuple2.of(word, 1);
			}
		});

		// 3-3. 分组及求和, TODO: 当数据类型为元组时，可以使用下标指定元素，从0开始
		AggregateOperator> resultDataSet = tupleDataSet.groupBy(0).sum(1);

		// 4.数据接收器-sink
		resultDataSet.print();

		// 5.触发执行-execute， TODO：批处理时，无需触发，流计算必须触发执行
		//env.execute("BatchWordCount") ;
	}

}


 
  15-Flink入门案例之WordCount【流计算】 
  编写Flink程序，接收TCP Socket的单词数据，并以空格进行单词拆分，分组统计单词个数。
  
  网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。 
  需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）
 [外链图片转存中…(img-ZhXIfxxu-1713686082819)] 
  一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

语言模型与向量模型：深入解析与实例剖析 ♢.＊语言模型人工智能自然语言处理
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在自然语言处理领域，语言模型和向量模型
字节跳动的发展历史：技术驱动的创新征程 ♢.＊字节跳动
在当今数字化时代，字节跳动已然成为全球互联网行业中熠熠生辉的巨头。它以独特的技术创新和敏锐的市场洞察力，打造出一系列广受欢迎的产品，深刻改变了人们获取信息、娱乐和社交的方式。让我们一同回顾字节跳动的发展历程，探寻其背后的技术密码。创业初期：技术萌芽与探索（2012年）字节跳动成立于2012年3月，在北京正式启航。创业初期，团队规模较小，但怀揣着对互联网技术的无限热情与创新精神。同年8月，字节跳动推
【C语言】Main函数解析 Nebula嵌入式 c语言
目录前言Main函数解析代码前言我们从刚才是学习编程就学习了main函数，在linux中你执行一个可执行文件./a.out此时你同时想传入参数那应该怎么办呢？这时你就要了解main函数的一些用法才能实现上面的目的。Main函数解析intmain(intargc,char*argv[])也可以写成intmain(intargc,char**argv)。一般我们都习惯写前者。argc表示程序运行时发送
「焦虑永存」悖论：一个自媒体人的两年通关实录小路哥v 副业思考经验分享
在一个没有阳光的晚上，打开灯望着电脑不知道写什么，于是无聊的整理起flomo上以前写过的内容，标签太乱，边看边整理，重新分类打标签。随着一篇篇整理，看着那些用文字描写着当时的心境，我被带入到了2022年，2023年上半年，原来我当时在经历这些事情，在做这些事情。原来我当时是这样思考问题的，原来我当时同样很焦虑，不知道做什么，只能一遍一遍的尝试，一遍又一遍的探索新的东西。也同样面临看到同行的其他人一
大数据毕业设计hadoop+spark+hive豆瓣图书数据分析可视化大屏豆瓣图书爬虫图书推荐系统 qq_79856539 javaweb java 大数据 hadoop 课程设计
系统总体目标基于Spark的个性化书籍推荐系统是一种基于大数据技术的智能推荐系统，它可以根据用户的历史行为和偏好，为用户提供个性化的书籍推荐。该系统采用Spark技术，可以实现大数据的实时处理，从而提高推荐系统的准确性和可靠性。此外，该系统还可以根据用户的习惯和偏好，提供更加个性化的书籍推荐，从而满足用户的需求。系统的使用者包含普通用户和管理员两类，普通用户是系统的主要服务对象，主流人群是经常查看
【Elasticsearch 】自定义分词器程风破～ Elasticsearch elasticsearch 大数据搜索引擎
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
如何写好C++类铮铭 c++
先讲一个笑话：同时学习两年Java的程序员在一起讨论的是面向对象和设计模式，而同时学习两年C++的程序员，在一起讨论的是template和各种语言规范到底怎么回事情。下面就从公开的资料中撸一撸如何写好一个c++类，从头文件（.h）需要包含的文件开始：1、#define保护：符号的命名最好是以下形式：___H_，比如foo项目中的foo/src/bar/baz.h文件应该这样保护：#ifndefFO
03_如何高效的学习? Fioman_Hammer 经典语录学习随笔经验分享
文章目录一.整体性学习法介绍二.整体性学习的五个步骤:①获取信息②理解信息③拓展④纠错一.整体性学习法介绍学习并不是整理一个个独立的盒子,学习就是编织一张大网.整体性学习在于创造信息的网络,一个知识与另外一个知识相互关联,这些关联使得你真正的做到对知识的完全理解.你创造的联系越多,你就会记得越牢,理解得越好;二.整体性学习的五个步骤:一般来说,整体性学习分为五个步骤:获取->理解->拓展->纠错-
kotlin扩展函数！啃下这些Framework技术笔记，醍醐灌顶！_kotlin framework features 2401_89694162 笔记
前言选了开发这一行，就意味着想混得好就要持续学习，你的技术和薪资、位置直接挂钩，进步对于程序员的重要性就不赘述了，接下来作为过来人，为广大同行分享一些学习干货，希望可以帮到大家什么是HTTPS?HTTPS(基于安全套接字层的超文本传输协议或者是HTTPoverSSL)是一个Netscape开发的Web协议。你也可以说：HTTPS=HTTP+SSLHTTPS在HTTP应用层的基础上使用安全套接字层作
1 vs. N：Nginx在零信任架构下如何成为API安全网关的唯一选择？墨瑾轩 Nginx乐园 nginx 架构安全
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣你是否曾经疑惑过，在众多的安全网关解决方案中，为什么Nginx能够脱颖而出，成为构建零信任架构下API安全网关的最佳伙伴？今天我们就来揭开这个谜底，看看Nginx是如何凭借其强大的功能和灵活性，在这场“1对N”的较量中胜出的。我们将深入探讨每一个细节，并提供详
Python 调用常见大模型 API 全解析 ♢.＊ python 开发语言语言模型 nlp
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！调用通义千问接口获取APIKe
java FastJSON自定义序列化和反序列化(扩展点)方法总结！10个步骤让你轻松掌握墨瑾轩一起学学Java【一】开发语言 java
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣嘿，小伙伴们！今天我们要一起探讨一个非常实用的话题——如何使用FastJSON自定义序列化和反序列化。你知道吗？FastJSON是阿里巴巴开源的一个高性能JSON库，广泛应用于Java项目中。虽然FastJSON提供了丰富的内置功能，但有时候我们还需要根据具体
长沙旅游新打卡路线之湘江双层观光巴士？WebGIS带你一睹为快夜郎king leaflet TrackPlayer追踪 leaflet动态轨迹 Leaflet动态轨迹模拟
目录前言一、观光巴士路线及沿途风景1、互联网上的观光巴士信息2、沿途商圈、景点3、途径公交车站二、Leaflet.TrackPlayer简介1、Leaflet.TrackPlayer是什么？2、Leaflet.TrackPlayer方法和参数三、集成Leaflet.TrackPlayer到观光路线1、代码实现过程2、动态控制3、成果展示四、总结前言今天是大年初一，在蛇年的第一天里，给各位朋友拜个年
Apache Flink流处理框架 weixin_44594317 apache flink 大数据
ApacheFlink是一个分布式流处理框架和数据处理引擎，专注于以低延迟和高吞吐量处理无界和有界的数据流。它可以同时处理流式数据和批处理数据，并且提供强大的容错机制和状态管理功能。Flink常用于实时分析、复杂事件处理（CEP）、机器学习和批量数据处理等场景。1.Flink的核心概念在理解Flink的工作原理之前，先要了解它的一些核心概念：流处理(StreamProcessing)：处理数据流中
企业IT数字化运维运营平台（总体架构、总体蓝图）建设方案PPT 公众号：优享智库数字化转型数据治理主数据数据仓库数据库运维大数据人工智能
原文《企业IT数字化运维运营平台（总体架构、总体蓝图）建设方案》PPT格式，主要从构建IT一体化运营能力、构建统一IT运营管理体系、建立统一的应用系统监控视图、构建智能化、主动式的IT监控与运维能力进行建设一套企业IT统一智能运营管理平台。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库一、管理体系·构建面向业务的主动式统一运营理体系统一运营分析管理能力、统一运维监控管理
企业数字化规划蓝图、企业数字化运营分析管理大数据平台建设方案公众号：优享智库数字化转型数据治理主数据数据仓库大数据
**企业数字化规划蓝图及运营分析管理大数据平台建设方案****一、企业数字化规划蓝图**1.**数字化目标设定**企业在规划数字化进程时，首先需要明确数字化目标。这些目标应当与企业的整体战略和发展规划相一致，包括但不限于提高运营效率、优化客户体验、创新业务模式等。同时，目标应具体、可衡量，以便于后续的实施和评估。2.**技术平台规划**技术平台是支撑企业数字化的基础。在规划阶段，需要确定所需的技术
c语言自动生成系统时间函数,使用C语言中的time函数获取系统时间 weixin_39579483 c语言自动生成系统时间函数
使用C语言中的time函数获取系统时间可以通过time()函数来获得计算机系统当前的日历时间(CalendarTime)，处理日期时间的函数都是以本函数的返回值为基础进行运算。其原型为：time_ttime(time_t*t);如果你已经声明了参数t，你可以从参数t返回现在的日历时间，同时也可以通过返回值返回现在的日历时间，即从一个时间点(例如：1970年1月1日0时0分0秒)到现在此时的秒数。如
使用Flink进行流式图处理 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
使用Flink进行流式图处理1.背景介绍1.1大数据时代的到来随着互联网、物联网和移动互联网的快速发展,数据呈现出爆炸式增长。根据IDC的预测,到2025年,全球数据量将达到175ZB。传统的批处理系统已经无法满足对实时数据处理的需求。因此,流式计算应运而生,成为大数据处理的重要组成部分。1.2流式计算的概念流式计算是一种新兴的数据处理范式,它能够持续不断地处理来自各种数据源的数据流。与传统的批处
Android车机DIY开发之学习篇(七)NDK交叉工具构建勿忘初心91 车机DIY 学习嵌入式硬件 arm开发单片机
Android车机DIY开发之学习篇(七)NDK交叉工具构建1.ubuntu安装GCCsudoapt-getupdatesudoapt-getinstallgccg++sudogcc--versionsudog++--version2.测试GCCVSCODE中新建Hello.c编译#includeintmain(void){printf(“Hello,thisisaprogramcompiledb
Android Jetpack系列（一） Room 游逸丶 Android Jetpack Android jetpack Room Android AAC
AndroidJetpack系列（一）Room前言Room简介Room使用1引用2编写Entity实体类2编写Dao数据操作类3编写Database数据库操作类4调用示例前言Jetpack是2017年谷歌在开发者大会上发布的一套开发工具。Jetpack共包含4个部分：Architecture、Foundation、Behavior以及UI。其中的Architecture又称为AAC（Android
Flink流式计算入门 @Rocky Flink flink 大数据
什么是流式计算流式计算是一种实时处理和分析大规模数据流的计算方法，其核心思想是将数据视为连续流动的序列，而不是静态存储的数据。与传统的批处理计算不同，流式计算能够在数据生成的同时进行处理，提供及时的结果。核心概念数据流：流式计算中的基本单位，表示一系列动态生成的数据。数据流可以来自传感器、网络请求、用户行为等多种来源。计算流：在数据流上进行的各种计算操作，如过滤、聚合和转换等。这些操作实时进行，并
AI编译器之——为什么大模型需要Relax？ FF-Studio 人工智能深度学习自然语言处理机器学习语言模型
放在最前：Relax的关键创新深度学习模型（比如ChatGPT这种大模型）在运行时经常遇到“输入尺寸不固定”的情况。比如你问它一个问题，这次输入是10个字，下次可能是100个字。传统编译器处理这种“变来变去”的尺寸很笨——要么只能按固定尺寸优化（导致变尺寸时性能暴跌），要么每次都要重新编译（慢到没法用）。Relax的创新：符号形状：让编译器学会“代数”Relax允许编译器用“符号变量”（比如n）表
【DeepSeek】复现DeepSeek R1？快来看这个Open R1项目实践指南~ FF-Studio DeepSeek R1 语言模型自然语言处理深度学习人工智能
OpenR1项目基于DeepSeek-R1的技术报告和方法论，公开并复现R1的训练管线，并且希望所有开发者都能在这个基础上搭建自己的研究或应用。笔者研读了大量资料，对OpenR1的愿景、原理及在实践层面的具体操作，产生了许多想法。因此，这篇博客会从最初的概念入手，带领大家了解OpenR1的原理与技术细节，并侧重讲解其中最为关键的强化学习训练方法之一——GRPO(群组相对策略优化,GroupRela
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
【2024年-12月-续篇-开源社区openEuler实践记录】go-from-mod 我明天再来学Web渗透开源社区OpenEuler 开源 golang 开发语言 copilot 架构开源软件后端
前言初学Go语言，下面仅为个人所学以及小结，若有错误之处，还请指教。Go语言基础入门篇的一二节课，其中我对每个讲到的语法都重写或者本地测试运行过，其中第二节课的第三个小项目尚未实现（本人对网络连接那块的脚本尚不熟悉，）部分代码不能太多，所以贴图了有些。Go基础语法目前学过的Go语法只有课程内的，下面是一些小小的笔记。导包和输出packagemainimport"fmt"funcmain(){fmt
python与excel整合全教程刘同学Python学习日记 python excel 开发语言
Python与Excel的整合非常强大，尤其适合处理大数据、自动化表格操作以及进行高级数据分析。以下是一个全教程，涵盖常用的Python库及其应用：1.准备工作安装必要的库：使用以下命令安装常用库：pipinstallopenpyxlpandasxlrdxlsxwriterpywin32openpyxl:用于操作Excel的.xlsx文件（推荐）。pandas:强大的数据分析工具，支持读取和写入E
Vue 响应式渲染 - 模板语法 JSON_L 前端 #Vue vue.js 前端 javascript
Vue渐进式JavaScript框架基于Vue2的学习笔记-Vue响应式渲染-模板语法目录模板语法渲染变量（状态）绑定事件简写事件修改属性样式修改绑定图片路径动态显示和隐藏总结模板语法渲染变量（状态）在页面中直接渲染变量。示例如下：Title{{myname}}newVue({el:"#box",//elementdata:{myname:'我的名字是张三'}})绑定事件增加按钮，并对按钮绑定点击
Python.NET 安装与使用教程卫伊祺Ralph
Python.NET安装与使用教程项目地址:https://gitcode.com/gh_mirrors/py/pythonnet本教程将指导你了解并安装Python.NET——这是一个让Python程序员能够无缝集成.NET框架的开源库。1.项目目录结构及介绍在克隆或下载pythonnet的源代码仓库后，你会看到以下基本目录结构：pythonnet/├──LICENSE#许可文件├──MANIF
Apache TVM：开源深度学习编译器栈的领跑者计攀建Eliza
ApacheTVM：开源深度学习编译器栈的领跑者tvmOpendeeplearningcompilerstackforcpu,gpuandspecializedaccelerators项目地址:https://gitcode.com/gh_mirrors/tv/tvm项目介绍ApacheTVM是一个专为深度学习系统设计的编译器栈。它旨在弥合生产力导向的深度学习框架与性能和效率导向的硬件后端之间的差
从0开始使用面对对象C语言搭建一个基于OLED的图形显示框架（绘图设备封装） charlie114514191 OLED驱动开发记录单片机 c语言学习嵌入式软件 stm32 OLED
目录图像层的底层抽象——绘图设备抽象如何抽象一个绘图设备？桥接绘图设备，特化为OLED设备题外话：设备的属性，与设计一个相似函数化简的通用办法使用函数指针来操作设备总结一下图像层的底层抽象——绘图设备抽象在上一篇博客中，我们完成了对设备层的抽象。现在，我们终于可以卖出雄心壮志的一步了！那就是尝试去完成一个最为基础的图形库。我们要做的，就是设计一个更加复杂的绘图设备。为什么是绘图设备呢？我们程序员都
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发

正文

执行生效

一键启动所有服务JobManager和TaskManagers

准备测试数据

使用–output指定处理结果数据存储目录

一键停止所有服务JobManager和TaskManagers

每个服务单独启动

在node1上启动

在node1、node2、node3.

===============================================================

每个服务单独停止

在node1上停止

在node1、node2、node3

在node1上复制一份standalone

删除日志文件

node1和node2上执行

node1和node2、node3执行

yarn-site.xml中添加配置

yarn-site.xml中添加配置

添加环境变量

修改配置文件

参数说明

提交flink 集群运行yarn后，提示信息

优雅 停止应用，如果设置重启次数，即使停止应用，也会重启，一直到超过次数以后，才能真正停止应用

kill 命令，直接将运行在yarn应用杀死，毫不留情

参数说明

1、Session 模式：

2、Per-Job 模式：

node1 上启动历史服务

第一步、从数据源DataSource获取数据

第二步、对数据进行转换处理

第三步、结果数据输出DataSink

This affects logging for both user code and Flink

Uncomment this if you want to only change Flink’s logging

The following lines keep the log level of common libraries/connectors on

log level INFO. The root logger does not override this. You have to manually

change the log levels here.

Log all infos to the console

Suppress the irrelevant (wrong) warnings from the Netty channel handler

15-Flink入门案例之WordCount【流计算】

你可能感兴趣的:(2024年程序员学习,flink,学习,大数据)

优雅停止应用，如果设置重启次数，即使停止应用，也会重启，一直到超过次数以后，才能真正停止应用