讲文明的喜羊羊拒绝pua

大数据高级开发工程师——Flink学习笔记（1）

文章目录

Flink学习笔记
- Flink基础篇
- - Flink简介
  - - 1. 处理无界和有界数据
    - 2. 部署应用到任意地方
    - 3. 运行任意规模的应用
    - 4. 利用内存性能
  - Flink的特点和应用场景
  - - 1. Flink 的特点
    - 2. Flink 的应用场景
  - Flink基本技术栈和架构
  - - 1. Flink 基本技术栈
    - 2. Flink 基本架构
  - Flink安装
  - - 1. Standalone 模式安装
    - 2. Flink on Yarn模式安装
    - - 第一种：Session模式
      - 第二种：Per-Job模式
      - 第三种：Application模式
    - 3. 不同模式的任务提交
    - - 第一种：Session模式
      - 第二种：Per-Job模式
      - 第三种：Application模式
    - 4. Flink on Yarn 执行流程
  - Flink入门
  - - 1. 实时需求案例
    - 2. 离线需求案例

Flink学习笔记

Flink基础篇

Flink简介

官网地址：https://flink.apache.org/
Apache Flink® — Stateful Computations over Data Streams
Apache Flink 是一个分布式大数据处理引擎，可对有界数据流和无界数据流进行有状态的计算。能够部署在各种集群环境，对各种规模大小的数据进行快速计算。

1. 处理无界和有界数据

任何类型的数据都可以形成一种事件流。信用卡交易、传感器测量、机器日志、网站或移动应用程序上的用户交互记录，所有这些数据都形成一种流。
数据可以被作为无界或则有界流来处理。

- 无界流: 有定义流的开始，但没有定义流的结束。它们会无休止地产生数据。无界流的数据必须持续处理，即数据被摄取后需要立刻处理。我们不能等到所有数据都到达再处理，因为输入是无限的，在任何时候输入都不会完成。处理无界数据通常要求以特定顺序摄取事件，例如事件发生的顺序，以便能够推断结果的完整性。
- 有界流: 有定义流的开始，也有定义流的结束。有界流可以在摄取所有数据后再进行计算。有界流所有数据可以被排序，所以并不需要有序摄取。有界流处理通常被称为批处理。

Apache Flink 擅长处理无界和有界数据集：精确的时间控制和状态化使得 Flink 的运行时(runtime)能够运行任何处理无界流的应用。有界流则由一些专为固定大小数据集特殊设计的算法和数据结构进行内部处理，产生了出色的性能。

2. 部署应用到任意地方

Apache Flink 是一个分布式系统，它需要计算资源来执行应用程序。Flink 集成了所有常见的集群资源管理器，例如 Hadoop YARN、 Apache Mesos 和 Kubernetes，但同时也可以作为独立集群运行。

	Flink 被设计为能够很好地工作在上述每个资源管理器中，这是通过资源管理器特定(resource-manager-specific)的部署模式实现的。Flink 可以采用与当前资源管理器相适应的方式进行交互。
	部署 Flink 应用程序时，Flink 会根据应用程序配置的并行性自动标识所需的资源，并从资源管理器请求这些资源。在发生故障的情况下，Flink 通过请求新资源来替换发生故障的容器。提交或控制应用程序的所有通信都是通过 REST 调用进行的，这可以简化 Flink 与各种环境中的集成。

3. 运行任意规模的应用

Flink 旨在任意规模上运行有状态流式应用。因此，应用程序被并行化为可能数千个任务，这些任务分布在集群中并发执行。所以应用程序能够充分利用无尽的 CPU、内存、磁盘和网络 IO。而且 Flink 很容易维护非常大的应用程序状态。其异步和增量的检查点算法对处理延迟产生最小的影响，同时保证 exactly-once 状态的一致性。

Flink 用户报告了其生产环境中一些令人印象深刻的扩展性数字
	每天处理数万亿的事件
	可以维护几TB大小的状态
	可以部署上千个节点的集群

4. 利用内存性能

有状态的 Flink 程序针对本地状态访问进行了优化。任务的状态始终保留在内存中，如果状态大小超过可用内存，则会保存在能高效访问的磁盘数据结构中。任务通过访问本地（通常在内存中）状态来进行所有的计算，从而产生非常低的处理延迟。Flink 通过定期和异步地对本地状态进行持久化存储来保证故障场景下 exactly-once 的状态一致性。

Flink的特点和应用场景

1. Flink 的特点

批流统一
支持高吞吐、低延迟、高性能的流处理
支持带有事件时间的窗口(Window)操作
支持有状态计算的 Exactly-once 语义
支持高度灵活的窗口(Window)操作，支持基于 time、count、session 窗口操作
支持具有反压 Backpressure 功能的持续流模型
支持基于轻量级分布式快照(Snapshot)实现的容错
支持迭代计算
Flink 在 JVM 内部实现了自己的内存管理
支持程序自动优化：避免特定情况下 Shuffle、排序等昂贵操作，中间结果有必要进行缓存

2. Flink 的应用场景

在实际生产的过程中，大量数据在不断地产生，例如金融交易数据、互联网订单数据、 GPS 定位数据、传感器信号、移动终端产生的数据、通信信号数据等，以及我们熟悉的网络流量监控、服务器产生的日志数据，这些数据最大的共同点就是实时从不同的数据源中产生，然后再传输到下游的分析系统。针对这些数据类型主要包括实时智能推荐、复杂事件处理、实时欺诈检测、实时数仓与 ETL 类型、流数据分析类型、实时报表类型等实时业务场景，而 Flink 对于这些类型的场景都有着非常好的支持。

实时智能推荐：智能推荐会根据用户历史的购买行为，通过推荐算法训练模型，预测用户未来可能会购买的物品。对个人来说，推荐系统起着信息过滤的作用；对 Web/App 服务端来说，推荐系统起着满足用户个性化需求，提升用户满意度的作用。推荐系统本身也在飞速发展，除了算法，越来越完善，对时延的要求也越来越苛刻和实时化。利用 Flink 流计算帮助用户构建更加实时的智能推荐系统，对用户行为指标进行实时计算，对模型进行实时更新，对用户指标进行实时预测，并将预测的信息推送给 Wep/App 端，帮助用户获取想要的商品信息，另一方面也帮助企业提升销售额，创造更大的商业价值。
复杂事件处理：对于复杂事件处理，比较常见的案例主要集中于工业领域，例如对车载传感器、机械设备等实时故障检测，这些业务类型通常数据量都非常大，且对数据处理的时效性要求非常高。通过利用 Flink 提供的 CEP（复杂事件处理）进行事件模式的抽取，同时应用 Flink 的 Sql 进行事件数据的转换，在流式系统中构建实时规则引擎，一旦事件触发报警规则，便立即将告警结果传输至下游通知系统，从而实现对设备故障快速预警监测，车辆状态监控等目的。
实时欺诈检测：在金融领域的业务中，常常出现各种类型的欺诈行为，例如信用卡欺诈、信贷申请欺诈等，而如何保证用户和公司的资金安全，是来近年来许多金融公司及银行共同面对的挑战。随着不法分子欺诈手段的不断升级，传统的反欺诈手段已经不足以解决目前所面临的问题。以往可能需要几个小时才能通过交易数据计算出用户的行为指标，然后通过规则判别出具有欺诈行为嫌疑的用户，再进行案件调查处理，在这种情况下资金可能早已被不法分子转移，从而给企业和用户造成大量的经济损失。而运用 Flink 流式计算技术能够在毫秒内就完成对欺诈判断行为指标的计算，然后实时对交易流水进行规则判断或者模型预测，这样一旦检测出交易中存在欺诈嫌疑，则直接对交易进行实时拦截，避免因为处理不及时而导致的经济损失。
实时数仓与ETL：结合离线数仓，通过利用流计算诸多优势和 SQL 灵活的加工能力，对流式数据进行实时清洗、归并、结构化处理，为离线数仓进行补充和优化。另一方面结合实时数据 ETL 处理能力，利用有状态流式计算技术，可以尽可能降低企业由于在离线数据计算过程中调度逻辑的复杂度，高效快速地处理企业需要的统计结果，帮助企业更好地应用实时数据所分析出来的结果。
流数据分析：实时计算各类数据指标，并利用实时结果及时调整在线系统相关策略，在各类内容投放、无线智能推送领域有大量的应用。流式计算技术将数据分析场景实时化，帮助企业做到实时化分析 Web 应用或者 App 应用的各项指标，包括 App 版本分布情况、Crash 检测和分布等，同时提供多维度用户行为分析，支持日志自主分析，助力开发者实现基于大数据技术的精细化运营、提升产品质量和体验、增强用户黏性。
实时报表分析：实时报表分析是近年来很多公司采用的报表统计方案之一，其中最主要的应用便是实时大屏展示。利用流式计算实时得出的结果直接被推送到前端应用，实时显示出重要指标的变换情况。最典型的案例便是淘宝的双十一活动，每年双十一购物节，除疯狂购物外，最引人注目的就是天猫双十一大屏不停跳跃的成交总额。在整个计算链路中包括从天猫交易下单购买到数据采集、数据计算、数据校验，最终落到双十一大屏上展现的全链路时间压缩在 5 秒以内，顶峰计算性能高达数三十万笔订单/秒，通过多条链路流计算备份确保万无一失。而在其他行业，企业也在构建自己的实时报表系统，让企业能够依托于自身的业务数据，快速提取出更多的数据价值，从而更好地服务于企业运行过程中。

Flink基本技术栈和架构

1. Flink 基本技术栈

在flink整个软件架构体系中。同样遵循着分层的架构设计理念，在降低系统耦合度的同时，也为上层用户构建 flink 应用提供了丰富且友好的接口。

API & Libraries 层：作为分布式数据处理框架，fink同时提供了支撑流计算和批计算的接口，同时在此基础之上抽象出不同的应用类型的组件库。如：基于流处理的CEP（复杂事件处理库）、SQL&Table库、FlinkML(机器学习库)、Gelly(图处理库)。有流式处理API，批处理API。流式处理的支持事件处理，表操作。批处理的，支持机器学习，图计算，也支持表操作。
Runtime 核心层：主要负责对上层的接口提供基础服务，也就是flink分布式计算的核心实现。flink底层的执行引擎。
物理部署层：主要涉及到flink的部署模式，目前flink支持多种部署模式：本地 local、集群 standalone/yarn、云 GCE/EC2 谷歌云、亚马逊云、kubenetes 等。

2. Flink 基本架构

Flink 整个系统主要由两个组件组成，分别为 JobManager 和 TaskManager，Flink 架构也遵循 Master-Slave 架构设计原则，JobManager 为 Master 节点，TaskManager 为 Worker（Slave）节点。所有组件之间的通信都是借助于 Akka Framework，包括任务的状态以及 Checkpoint 触发等信息。

Client：客户端负责将任务提交到集群，与 JobManager 构建 Akka 连接，然后将任务提交JobManager，通过和 JobManager 之间进行交互获取任务执行状态。客户端提交任务可以采用 CLI 方式或者通过使用 Flink WebUI 提交，也可以在应用程序中指定 JobManager 的 RPC 网络端口构建 ExecutionEnvironment 提交 Flink 应用。
JobManager：负责整个 Flink 集群任务的调度以及资源的管理，从客户端中获取提交的应用，然后根据集群中 TaskManager 上 TaskSlot 的使用情况，为提交的应用分配相应的 TaskSlot 资源并命令 TaskManager 启动从客户端中获取的应用。
- JobManager 相当于整个集群的 Master 节点，且整个集群有且只有一个活跃的 JobManager，负责整个集群的任务管理和资源管理。
- JobManager 和 TaskManager 之间通过 Actor System 进行通信，获取任务执行的情况并通过 Actor System 将应用的任务执行情况发送给客户端。同时在任务执行的过程中，Flink JobManager 会触发 Checkpoint 操作，每个 TaskManager 节点收到 Checkpoint 触发指令后，完成 Checkpoint 操作，所有的 Checkpoint 协调过程都是在 Fink JobManager 中完成。
- 当任务完成后，Flink 会将任务执行的信息反馈给客户端，并且释放掉 TaskManager 中的资源以供下一次提交任务使用。
TaskManager：相当于整个集群的 Slave 节点，负责具体的任务执行和对应任务在每个节点上的资源申请和管理。客户端通过将编写好的 Flink 应用编译打包，提交到 JobManager，然后 JobManager 会根据已注册在 JobManager 中 TaskManager 的资源情况，将任务分配给有资源的 TaskManager节点，然后启动并运行任务。
- TaskManager 从 JobManager 接收需要部署的任务，然后使用 Slot 资源启动 Task，建立数据接入的网络连接，接收数据并开始数据处理。同时 TaskManager 之间的数据交互都是通过数据流的方式进行的。
- 可以看出，Flink 的任务运行其实是采用多线程的方式，这和 MapReduce 多 JVM 进行的方式有很大的区别，Flink 能够极大提高 CPU 使用效率，在多个任务和 Task 之间通过 TaskSlot 方式共享系统资源，每个 TaskManager 中通过管理多个 TaskSlot 资源池进行对资源进行有效管理。

Flink安装

1. Standalone 模式安装

集群规划

主机名	JobManager	TaskManager
node01	是	是
node02	是	是
node03		是

依赖：
- 主机之间免密码
- jdk1.8以上，配置JAVA_HOME
- 安装 hadoop 集群
- 安装 zookeeper 集群
下载安装包：flink-1.13.0-bin-scala_2.11.tgz
上传安装包到node01服务器，然后解压

tar -zxvf flink-1.13.0-bin-scala_2.11.tgz -C /bigdata/install/

安装步骤：node01修改以下配置文件

# 1、修改配置文件conf/flink-conf.yaml，新增配置
# 使用zookeeper搭建高可用
high-availability: zookeeper
# 存储JobManager的元数据到HDFS
high-availability.storageDir: hdfs://node01:8020/flink
high-availability.zookeeper.quorum: node01:2181,node02:2181,node03:2181

# 2、修改conf/masters
# 指定集群的JobManager地址
node01:8081
node02:8081

# 3、修改conf/workers
# 指定集群的TaskManager地址
node01
node02
node03

# 4、拷贝到其他节点
scp -r /bigdata/install/flink-1.13.0 node02:/bigdata/install
scp -r /bigdata/install/flink-1.13.0 node03:/bigdata/install

# 5、配置Flink集成hadoop
# 修改每个节点的/etc/profile, 添加 HADOOP_CLASSPATH，然后每个节点执行 source /etc/profile
export HADOOP_CLASSPATH=`hadoop classpath`

# 6、node01(JobMananger)节点启动，注意：启动之前先启动hadoop和zookeeper集群
cd /kkb/install/flink-1.13.0
bin/start-cluster.sh

# 7、关闭flink集群, 在主节点上执行
cd /bigdata/install/flink-1.13.0
bin/stop-cluster.sh

访问验证：http://node01:8081、http://node02:8081

StandAlone 模式需要考虑的参数

jobmanager.memory.process.size：  jobmanager节点可用的内存大小
taskmanager.memory.process.size： taskmanager节点可用的内存大小
taskmanager.numberOfTaskSlots：   每台taskmanager节点提供的TaskSlot总数
parallelism.default：             默认情况下任务的并行度
taskmanager.tmp.dirs：            taskmanager的临时数据存储目录

2. Flink on Yarn模式安装

Flink on Yarn 有三种模式

第一种：Session模式

在Yarn中初始化一个Flink集群，开辟指定的资源，之后我们提交的Flink Job都在这个Session中，也就是说不管提交多少个job，这些job都会共用开始时在yarn中申请的资源。这个Flink集群会常驻在Yarn集群中，除非手动停止。

优点：多个任务可以共用一套集群，方便管理监控。
缺点：当某一个任务异常导致对应的 TaskManager 崩溃，运行在其上的任务都会受到影响。同一个客户端节点上启动的作业越多，客户端节点的压力过大，它需要将任务的依赖和生成的JobGraph上传到集群中，这使客户端成为大量的资源消耗者，同时JobManager的负载也就越大。
适用场景：适用于量多、执行任务时间短、对资源不敏感的场景，比如作为在线(即席)查询引擎。

第二种：Per-Job模式

在Yarn中，每次提交job都会创建一个新的Flink集群，任务之间相互独立，互不影响并且方便管理。任务执行完成之后创建的集群也会消失。
该模式下，一个作业对应一个集群，作业之间相互隔离。

优点：每个任务单独维护集群，可以做到更好的资源隔离，集群的生命周期与任务相同，单独的任务失败也不会影响其他的任务。
缺点：每一次提交任务都需要开辟新的集群，任务运行在不同的集群中，监控管理不方便。同一个客户端节点启动的作业越多，客户端节点的压力过大。
适用场景：执行任务长、对资源敏感或者消耗资源大的任务。

第三种：Application模式

无论是 Session 还是 Per Job 模式，程序代码都是在客户端编译完成。这里的客户端就是我们执行 flink run 启动的程序(其实是Cli Frontend)。假如现在需要做一个平台给多个用户提交任务，或者任务的量级很大，那么客户端的压力会非常大。因为编译生成 StreamGraph 和 JobGraph 需要消耗大量的CPU，下载依赖的Jar包资源、上传 JobGraph 也需要大量的网络带宽，客户端很容易成为瓶颈。此时就考虑可不可以把编译图的工作放在集群中完成？

为了解决这个问题，社区在传统部署模式的基础上实现了Application模式。
Application 的设计跟 per job 非常像，只不过客户端不再编译图，而是直接把执行的 Jar 和参数信息发送到 yarn 的 AppMaster，在该进程中，同时完成JM 的启动、编译图(用户main方法执行)、任务执行等过程。

优点：在 Application 模式中，为每个应用创建一个集群，main方法会运行在集群中，避免客户端过大的压力。解决了 Session 和 Per Job 模式在客户端编译代码生成 JobGraph 的压力，这些工作交给集群中的 JobManager 去完成。
适用场景：多用户大批量任务提交，任务提交平台化，每个任务的计算资源互相隔离。

3. 不同模式的任务提交

第一种：Session模式

【yarn-session.sh(开辟资源) + flink run(提交任务)】

# 1. 在 flink 目录启动 yarn-session
bin/yarn-session.sh -n 2 -tm 1024 -s 1 -d
# -n: 指定申请多少个容器
# -s: 指定每个容器启动多少个slot
# -tm: 指定每个 TaskManager 申请多少内存
# -d: 以后台进程方式运行

# 2. 使用 flink 脚本提交任务
bin/flink run examples/batch/WordCount.jar -input hdfs://node01:8020/words.txt -output hdfs://node01:8020/output/result.txt
# 如果启动了很多的yarn-session, 在提交任务的时候可以通过参数 -yid 指定作业提交到哪一个yarn-session中运行
# 例如：
bin/flink run -yid application_1647823591557_0001 examples/batch/WordCount.jar -input hdfs://node01:8020/words.txt -output hdfs://node01:8020/output/result1.txt

# 3. 停止任务
yarn application -kill application_1647823591557_0001

资源申请：

提交任务执行

查看执行结果输出：

yarn-session.sh 脚本参数说明

【必选】  
	-n,--container <arg>   				# 分配多少个 yarn 容器 (=taskmanager的数量)  
【可选】
	-D <arg>                        	# 动态属性  
   	-d,--detached                   	# 独立运行  
   	-jm,--jobManagerMemory <arg>    	# JobManager 的内存 [in MB]  
   	-nm,--name                     		# 在 YARN 上为一个自定义的应用设置一个名字  
   	-q,--query                      	# 显示 yarn 中可用的资源 (内存, cpu核数)  
   	-qu,--queue <arg>               	# 指定 YARN 队列.  
   	-s,--slots <arg>                	# 每个 TaskManager 使用的 slots 数量  
   	-tm,--taskManagerMemory <arg>   	# 每个 TaskManager 的内存 [in MB]  
   	-z,--zookeeperNamespace <arg>   	# 针对 HA 模式在 zookeeper 上创建 NameSpace 
   	-id,--applicationId <yarnAppId> 	# YARN 集群上的任务 id，附着到一个后台运行的 yarn session 中

第二种：Per-Job模式

【flink run -t yarn-per-job(开辟资源+提交任务)】

# 启动集群，执行任务
bin/flink run -t yarn-per-job -yjm 1024 -ytm 1024 examples/batch/WordCount.jar -input hdfs://node01:8020/words.txt -output hdfs://node01:8020/output/result2.txt

# 注意：client端必须要设置 YARN_CONF_DIR 或者 HADOOP_CONF_DIR 或者 HADOOP_HOME 环境变量，通过这个环境变量来读取 YARN 和 HDFS 的配置信息，否则启动会失败。

flink run 脚本参数说明

run [OPTIONS] <jar-file> <arguments>  
 "run" 操作参数:  
-c,--class <classname>  		# 如果没有在jar包中指定入口类，则需要在这里通过这个参数指定  
-m,--jobmanager <host:port>  	# 指定需要连接的jobmanager(主节点)地址，使用这个参数可以指定一个不同于配置文件中的jobmanager  
-p,--parallelism <parallelism>  # 指定程序的并行度。可以覆盖配置文件中的默认值。
-t,--target <arg>   			# 用来指定部署目标

# 补充【任务提交到standalone集群中运行】需要指定连接 host 和 port 的 jobmanager
bin/flink run -m node01:6123 examples/batch/WordCount.jar -input hdfs://hostname:port/hello.txt -output hdfs://hostname:port/result1

第三种：Application模式

【flink run-application -t yarn-application】

# 启动集群，执行任务
bin/flink run-application -t yarn-application -Djobmanager.memory.process.size=1024m \
-Dtaskmanager.memory.process.size=1024m \
-Dtaskmanager.numberOfTaskSlots=1 \
examples/batch/WordCount.jar \
-input hdfs://node01:8020/words.txt \
-output hdfs://node01:8020/output2

# -t: 用来指定部署目标，目前支持 YARN（yarn-application）和K8S（kubernetes-application）。
# -D: 用来指定与作业相关的各项参数，具体可参见官方文档。

那么如何解决传输依赖项造成的带宽占用问题呢？Flink作业必须的依赖是发行包 flink-dist.jar，还有扩展库（位于== $FLINK_HOME/lib）==和插件库（位于==$ FLINK_HOME/plugin==）？

我们将它们预先上传到像 HDFS 这样的共享存储，再通过 yarn.provided.lib.dirs 参数指定存储的路径即可。

-Dyarn.provided.lib.dirs="hdfs://myhdfs/flink-common-deps/lib;hdfs://myhdfs/flink-common-deps/plugins"

这样所有作业就不必各自上传依赖，可以直接从 HDFS 拉取，并且 YARN NodeManager 也会缓存这些依赖，进一步加快作业的提交过程。同理，包含 Flink 作业的用户 JAR 包也可以上传到 HDFS，并指定远程路径进行提交。

4. Flink on Yarn 执行流程

Flink on Yarn 部署很简单，就是只要部署好 hadoop 集群即可，我们只需要部署一个 Flink 客户端，然后从 flink 客户端提交 Flink 任务即可。类似于 spark on yarn 模式。

STEP1：
- 启动新的 Flink Yarn 会话时，客户端首先检查所请求的资源（用于启动ApplicationMaster的内存和vcores）是否可用。然后它将包含Flink 程序和配置文件的jar包上传到HDFS。
STEP2：
- 客户端请求一个Yarn 的容器(container)用来启动ApplicationMaster。
STEP3：
- 分配一个ApplicationMaster容器(container)，并启动ApplicationMaster。由于客户端将配置文件和jar文件注册为容器的资源，因此NodeManager将负责准备容器（例如下载文件）。
- 完成后将启动ApplicationMaster（AM）, 该JobManager和AM在同一容器中运行，一旦成功启动，AM就知道JobManager的地址。
- 然后会为TaskManagers生成一个新的Flink配置文件（以便它们可以连接到JobManager），该文件会被上传到HDFS。此外，AM容器还提供Flink的Web界面。YARN代码分配的所有端口都是临时端口。这允许用户并行执行多个Flink YARN会话。
STEP4：
- AM 开始为 Flink 的 TaskManagers 分配容器，将从 HDFS 下载 jar 文件和修改后的配置。完成这些步骤后，可以接受jobs。

Flink入门

1. 实时需求案例

需求：通过flink流处理程序，接受socket数据，实现单词计数。
创建一个 Maven 工程，并添加依赖：

<properties>
    <flink.version>1.13.0flink.version>
properties>

<dependencies>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-clients_2.11artifactId>
        <version>${flink.version}version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-streaming-java_2.12artifactId>
        <version>${flink.version}version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-streaming-scala_2.11artifactId>
        <version>${flink.version}version>
    dependency>
dependencies>

使用 scala 语言开发：

import org.apache.flink.streaming.api.scala.{DataStream, StreamExecutionEnvironment}
//导入隐式转换的包
import org.apache.flink.api.scala._

object WordCountStreamScala {
  def main(args: Array[String]): Unit = {
    // 1. 构建流处理环境
    val env = StreamExecutionEnvironment.getExecutionEnvironment

    // 2. 从socket获取数据
    val sourceStream: DataStream[String] = env.socketTextStream("node01", 9999)

    // 3. 对数据进行处理
    val result: DataStream[(String, Int)] = sourceStream
                .flatMap(x => x.split(" "))  // 按照空格切分
                .map(x => (x, 1))                   // 每个单词计为1
                .keyBy(x => x._1)                   // 按照单词进行分组
                .sum(1)                    // 按照下标为1累加相同单词出现的次数

    // 4. 打印输出, sink
    result.print()

    // 5. 开启任务
    env.execute("WordCountStreamScala")
  }
}

本地启动程序，并在 node01 节点上使用命令 nc -lk 9999 发送 socket 数据，并查看控制台输出结果

将代码打成 jar 包，提交到 yarn 中运行：

flink run -t yarn-per-job -yjm 1024 -ytm 1024 -c com.yw.flink.example.WordCountStreamScala flink-demo-1.0.jar

查看 TaskManager 的输出的日志结果

使用 java 语言开发

public class WordCountStreamJava {
    public static void main(String[] args) throws Exception {
        // 1. 构建流处理环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 2. 从socket获取数据
        DataStreamSource<String> streamSource = env.socketTextStream("node01", 9999);

        // 3. 对数据进行处理
        DataStream<Tuple2<String, Integer>> resultStream = streamSource
                .flatMap((FlatMapFunction<String, Tuple2<String, Integer>>) (line, collector) -> {
                    String[] words = line.split(" ");
                    Arrays.stream(words).filter(Objects::nonNull)
                            .forEach(word -> collector.collect(new Tuple2<>(word, 1)));
                }).returns(Types.TUPLE(Types.STRING, Types.INT))
                .keyBy((KeySelector<Tuple2<String, Integer>, String>) tuple2 -> tuple2.f0)
                .sum(1);
        // 4. 打印输出, sink
        resultStream.print();

        // 5. 开启任务
        env.execute("WordCountStreamJava");
    }
}

测试：

2. 离线需求案例

需求：对文件进行单词计数，统计文件当中每个单词出现的次数。

import org.apache.flink.api.scala.{DataSet, ExecutionEnvironment}
import org.apache.flink.api.scala._

/**
  * scala开发flink的批处理程序
  */
object WordCountBatchScala {
  def main(args: Array[String]): Unit = {
    // 1. 构建Flink的批处理环境
    val env = ExecutionEnvironment.getExecutionEnvironment

    // 2. 读取数据文件
    val fileDataSet: DataSet[String] = env.readTextFile("words.txt")

    // 3. 对数据进行处理
    val resultDataSet: DataSet[(String, Int)] = fileDataSet
            .flatMap(x => x.split(" "))
            .map(x => (x, 1))
            .groupBy(0)
            .sum(1)

    // 4. 打印结果
    resultDataSet.print()

    // 5. 保存结果到文件
    resultDataSet.writeAsText("output")
    env.execute("FlinkFileCount")
  }
}

github 代码地址：https://github.com/shouwangyw/bigdata/tree/master/flink-demo

你可能感兴趣的:(大数据,Flink,flink,流计算,大数据,scala,java)

Selenium自动化测试框架入门与使用 Future_yzx selenium 测试工具
目录1.Selenium简介2.使用Selenium2.1Java使用Selenium2.2Python使用Selenium2.3支持的浏览器及WebDriver3.ChromeDriver的安装3.1查看本机Chrome版本3.2匹配对应的ChromeDriver并下载3.3配置ChromeDriver路径3.4在服务器（如CentOS）上安装ChromeJava中使用Selenium的代码示例
Django 静态文件配置实战指南 ivwdcwso django sqlite python 开发
静态文件（如CSS、JavaScript、图片等）是Django项目中构建用户界面的重要组成部分。然而，静态文件的配置问题常常导致开发和生产环境中的404NotFound错误。本文将详细介绍如何正确配置Django静态文件，结合最佳实践，帮助你解决常见的静态文件问题，并确保项目在不同环境中正常运行。©ivwdcwso(ID:u012172506)1.静态文件的基本概念1.1什么是静态文件？静态文件
Java实现FIFO缓存策略实战 smart_ljh 缓存策略 java 缓存开发语言 FIFO 策略模式
实现FIFO模型选择FIFO模型实现过程FIFO模型完整代码下面看一下先进先出的示例过程总结FIFO（FirstInFirstOut，先进先出）策略是一种基本的数据处理和存储管理方法，在Java中，这种策略通常用于管理那些需要按照顺序处理的数据项，比如任务的队列、数据的传输缓冲区等。在Java中，java.util.Queue接口以及实现了这个接口的类，比如LinkedList和PriorityQ
WAS 日志分析（websphere application server) Change is good websphere application server 服务器 jvm deployment
关键字:websphere日志WebSphereApplicationServer是一个基于Java的Web应用程序服务器，它构建在开放标准的基础之上，能帮助您部署与管理从简单的Web站点到强大的电子商务解决方案的诸多应用程序。它遵循J2EE并为Java组件、XML和Web服务提供了一个可移植的Web部署平台，这个平台能够与数据库交互并提供动态Web内容。随着WebSphereApplicatio
final 到底有啥用？99% 的开发者可能只知道一半！软件求生 #工作建议运维数据库 java 架构微服务
小伙伴们，你有过这样的经历吗？早晨喝了一杯奶茶，兴致勃勃地去面试，面试官却冷不丁地问了一句：“final在Java中有什么作用？”我的天哪！我当时脑子一片空白，只能挤出一句：“用来修饰变量吧。”看着面试官点了点头，但眉头却微微一皱，我就知道，完了……不怕！今天咱们就从头到尾，搞清楚final的所有用途，让你下次遇到这个问题，自信到能现场开课！什么是final？简单来说，final是Java中的一个
如何处理selenium Webdriver中的文本框？知识的宝藏 Selenium基础篇 selenium 前端 python
文本框或字段在整个网页中广泛使用，本文将介绍如何在Java中使用SeleniumWebdriver处理文本框。可以有各种文本字段，我们将尝试包括其中的大多数，并执行各种操作，如清除和输入文本。我们将使用我们的Selenium游乐场网站-testkru，与各种文本框进行交互。您也可以使用同一个网站来执行任何所需的操作。下面是文本框的屏幕截图;我们将使用其中的一些来执行文本框上的各种操作。我们来看看下
selenium clear（）方法清除文本框内容 Change is good selenium python 测试工具
在使用Selenium进行Web自动化测试时，清除文本框内容是一个常见的需求。这可以通过多种方式实现，取决于你使用的是哪种编程语言（如Python、Java等）以及你的具体需求。以下是一些常见的方法：1.使用clear()方法clear()方法是Selenium提供的一个非常直接的方法来清除文本框的内容。这个方法会删除文本框中的所有内容，并将其设置为空字符串。python：fromselenium
【附源码】Java计算机毕业设计小说阅读网站（程序+LW+部署）一念计算机毕设源码程序 java 课程设计 mysql
项目运行环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：java+mybatis+Maven等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境
python 分布式集群_Python搭建Spark分布式集群环境小国阁下 python 分布式集群
前言ApacheSpark是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。Spark最大的特点就是快，可比HadoopMapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群，而是使用三台电脑来搭建一个小型分布式集群环境安装。本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群，同样适用于搭建Spark1.6.2
高级java每日一道面试题-2025年01月24日-框架篇[SpringBoot篇]-如何理解 Spring Boot 中的 Starters(启动器) ? java我跟你拼了 java每日一道面试题 java spring boot 简化依赖管理自动配置加快开发速度自动管理依赖项简化外部化配置
如果有遗漏,评论区告诉我进行补充面试官:如何理解SpringBoot中的Starters(启动器)?我回答:一、Starters的定义与作用1.定义Starters是SpringBoot中的一组预定义依赖关系，这些依赖被封装在一个单一的包中。它们简化了Maven或Gradle配置文件中的依赖项声明，并自动配置和管理相关依赖项。2.作用简化依赖管理：通过引入一个starter，可以自动引入所有必要的
华为OD机试D卷 --矩阵匹配--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od 矩阵 python javascript java c++c语言
文章目录题目描述输入描述输出描述用例题目解析java源码js源码python源码c源码c++源码题目描述从一个N*M（N≤M）的矩阵中选出N个数，任意两个数字不能在同一行或同一列，求选出来的N个数中第K大的数字的最小值是多少。输入描述输入矩阵要求：1≤K≤N≤M≤150输入格式：NMKN*M矩阵输出描述N*M的矩阵中可以选出M!/N!种组合数组，每个组合数组种第K大的数中的最小值。无需考虑重复数字
python对接rocketmq i_nekohuang python rocketmq
背景有对接java系统监听其相关资源同步新增的需求，该java系统使用了rocketmq。前置说明1、目前Python客户端仅支持Linux和macOS操作系统，暂不支持Windows系统2、rocketmq-client-python基于rocketmq-client-cpp进行包装，因此需要先编译出librocketmq.so3、文档中相关源码包和依赖包版本和github中README.md有
go语言中的defer，panic和recover code_feien golang
go语言中的panic和recover基本概念deferpanicrecover使用场景基本概念defer介绍：defer主要用来注册多个延迟调用，这些调用以先进后出的顺序在函数返回前被执行。有点类似于java中的finaly语句。defer常用于保证一些资源最终能够得到回收和释放。使用：defer函数的实参在注册的时候通过值拷贝传递进去。例如下面的代码，实参a的值在defer注册的时候通过值拷贝
Java——String类常见方法_string[] a 判断长度 2501_90223240 java 开发语言
字符串数组本质因为String属于引用类型，所以str内存储的并不是字符串内容本身。我们进入String源码可以看到str数组内部存储的是对象的地址，字符串内容其实是存在**字符数组value[]**中的：调试起来看：这是它的简化内存布局图：字符串长度求字符串长度返回值：字符串或数组长度Stringstr1="hello";System.out.println(str1.length());判断字
Spring Boot与MongoDB集成指南行动π技术博客 spring boot mongodb 后端
1.引言在当今快速发展的软件开发领域，选择合适的技术栈对于构建高效、可扩展的应用程序至关重要。随着微服务架构和云原生应用的兴起，开发人员需要更灵活、更快速的解决方案来满足不断变化的业务需求。SpringBoot和MongoDB的结合正是这一需求的完美答案。1.1为什么选择SpringBoot和MongoDB？SpringBoot是一个开源的Java框架，它基于Spring框架，提供了快速开发和简化
814. 二叉树剪枝（JavaScript）进击的桐人 leetcode 中等题 medium javascript LeetCode JavaScript Binary Tree Pruning
给定二叉树根结点root，此外树的每个结点的值要么是0，要么是1。返回移除了所有不包含1的子树的原二叉树。(节点X的子树为X本身，以及所有X的后代。)示例1:输入:[1,null,0,0,1]输出:[1,null,0,null,1]解释:只有红色节点满足条件“所有不包含1的子树”。右图为返回的答案。示例2:输入:[1,0,1,0,0,0,1]输出:[1,null,1,null,1]示例3:输入:[
java ffmpeg(Windows/Linux)截取视频做封面 Mr.菜园子 JAVA ffmpeg java ffmpeg java ffmpeg windows(Linux)
一、Windows版本1、下载前往FFmpeg官网http://ffmpeg.org/download.html下载Windows版本FFmpeg（我下载ffmpeg-4.0-win64-shared）2、解压下载后解压到本地（我的解压目录D:\wedive_file\ffmpeg）二、Linux版本1、下载前往FFmpeg官网http://ffmpeg.org/download.html下载Li
Java 15中的密封类：探索与实践 t0_54manong java 开发语言个人开发
在Java15中，密封类（SealedClasses）作为一个新的预览特性被引入，它为类和接口的继承与实现提供了一种更为精细的控制方式。本文将通过实例详细探讨密封类的使用方法、与final类的区别，以及其适用场景。一、什么是密封类？密封类允许类或接口控制哪些类可以实现或继承它。这与传统的final类不同，final类完全禁止继承，而密封类则提供了一种更灵活的方式，允许开发者显式指定哪些类可以继承它
Spring Cloud和SpringBoot版本对应关系？思维导图代码示例（java 架构) 用心去追梦 java spring cloud spring boot
SpringCloud和SpringBoot的版本之间存在一定的对应关系，因为SpringCloud依赖于SpringBoot提供的基础功能。通常情况下，每个主要版本的SpringCloud都是与特定版本范围的SpringBoot兼容的。以下是截至2024年12月的最新版本信息和一个简化的关系图。SpringCloud和SpringBoot版本对应关系简化的关系图SpringEcosystemVe
数仓ETL测试星月情缘02 etl 数据仓库
提取，转换和加载有助于组织使数据在不同的数据系统中可访问，有意义且可用。ETL工具是用于提取，转换和加载数据的软件。在当今数据驱动的世界中，无论大小如何，都会从各种组织，机器和小工具中生成大量数据。在传统的编程方式中，ETL都提取并进行一些转换操作，然后将转换后的数据加载到目标数据库文件等。为此，需要用任何编程语言编写代码，如Java，C#，C++等。为了避免更多编码和使用库，将通过拖放组件来减少
RESTful API：概念、实际场景应用及在 Java 和 C# 中的实现太阳 restful java c#
RESTfulAPI：概念、实际场景应用及在Java和C#中的实现一、什么是RESTfulAPI**RESTfulAPI（RepresentationalStateTransferAPI）**即符合REST（RepresentationalStateTransfer，表述性状态转移）架构风格的应用程序编程接口。它是一种基于HTTP协议的软件架构风格，用于设计网络应用程序。（一）主要特点资源导向：将
python中cv是什么_python里面cv是什么意思 weixin_39639568 python中cv是什么
OpenCV(OpenSourceComputerVisionLibrary)开放源代码计算机视觉库，主要算法涉及图像处理、计算机视觉和机器学习相关方法。OpenCV其实就是一堆C和C++语言的源代码文件，这些源代码文件中实现了许多常用的计算机视觉算法。OpenCV由一系列C函数和C++类构成，它有C，C++，Python和java接口，当前SDK(SoftwareDevelopmentKit软件
基于Python+Spark的气象天气分析大屏可视化系统设计与实现毕设源码 sj52abcd python spark 课程设计毕业设计
博主介绍：✌专注于VUE,小程序，安卓，Java,python,物联网专业，有17年开发经验，长年从事毕业指导，项目实战✌选取一个适合的毕业设计题目很重要。✌关注✌私信我✌具体的问题，我会尽力帮助你。研究的背景:随着我国气象事业的发展，气象数据的实时分析和可视化成为越来越重要的任务。然而，目前气象数据的分析与展示手段仍然较为传统，缺乏交互性，不能满足现代气象业务的需求。因此，研究一种基于Pytho
【硬刚大数据】2021年从零到大数据专家之Hbase八股文王知无(import_bigdata)
欢迎关注博客主页：https://blog.csdn.net/u013411339欢迎点赞、收藏、留言，欢迎留言交流！本文由【王知无】原创，首发于CSDN博客！本文首发CSDN论坛，未经过官方和本人允许，严禁转载！本文是对《【硬刚大数据之学习路线篇】2021年从零到大数据专家的学习指南(全面升级版)》的面试部分补充。硬刚大数据系列文章链接：2021年从零到大数据专家的学习指南(全面升级版)
史上最强！Spring Boot 3.3 高效批量插入万级数据的多种方案 m0_74825074 面试学习路线阿里巴巴 spring boot 后端 java
SpringBoot3.3多种方式实现高效批量插入万级数据，史上最强！在大数据处理场景下，如何高效地将大量数据插入数据库是一个重要课题。本文基于SpringBoot3.3及MyBatis-Plus，介绍几种高效的批量插入数据的方法，包括：使用JDBC批处理使用自定义SQL批处理单条插入（for循环）拼接SQL语句插入MyBatis-Plus的saveBatch方法循环插入+开启批处理模式每种方式都
Java框架介绍:Quartz从入门到进阶(图) hdy007 Java quartz 框架 java 作业存储 struts
你曾经需要应用执行一个任务吗？这个任务每天或每周星期二晚上11：30，或许仅仅每个月的最后一天执行。一个自动执行而无须干预的任务在执行过程中如果发生一个严重错误，应用能够知到其执行失败并尝试重新执行吗？你和你的团队是用java编程吗？如果这些问题中任何一个你回答是，那么你应该使用Quartz调度器。旁注：Matrix目前就大量使用到了Quartz。比如，排名统计功能的实现，在Jmatrix里通过Q
PHP代码免费加密平台：保护你的代码安全网友阿贵 PHP php
PHP代码免费加密平台：保护你的代码安全引言在开发过程中，保护源代码的安全性是非常重要的。PHP作为一种广泛使用的服务器端脚本语言，其代码的安全性尤为重要。为了帮助开发者更好地保护自己的代码，我们推出了PHP代码免费加密平台（php.javait.cn）。本文将详细介绍该平台的功能和使用方法。平台简介1.平台功能PHP代码免费加密平台提供了以下主要功能：PHP混淆加密：无需安装组件运行，兼容主流P
Selenium 浏览器操作与使用技巧——详细解析（Java版） Future_yzx selenium java 测试工具
目录一、浏览器及窗口操作二、键盘与鼠标操作三、勾选复选框四、多层框架/窗口定位五、操作下拉框六、上传文件操作七、处理弹窗与alert八、处理动态元素九、使用Selenium进行网站监控前言Selenium是一款非常强大的Web自动化测试工具，能够帮助开发者与测试人员进行浏览器的自动化操作。通过Selenium，您不仅可以进行传统的自动化测试，还可以实现网站监控、动态元素处理、用户交互等高级功能。本
Quartz 架构和单体应用介绍小马不敲代码 SpringBoot 架构定时任务
一、摘要Quartz架构介绍SpringBootQuartz应用整合二、关于QuartzQuartz是OpenSymphony开源组织在Jobscheduling领域开源的一个作业调度框架项目，完全由Java编写，主要是为了实现在Java应用程序中进行作业调度并提供了简单却强大的机制！Quartz不仅可以单独使用，还可以与J2EE与J2SE应用程序相结合使用！同时，Quartz允许程序开发人员根据
多租户架构未提供足够的租户安全培训和教育图幻未来网络安全
多租户架构下租户安全培训与教育的需求分析与解决方案引言随着云计算和大数据技术的飞速发展，多租户架构已成为企业数字化转型的重要基石。多租户架构允许一个应用程序实例为多个租户提供服务，从而降低了企业的运营成本。然而，这种架构也带来了一系列的安全挑战。为了解决这些问题，企业需要加强对租户的安全培训和教育，确保租户了解如何在使用多租户架构时保护自己的数据和应用程序。本文将探讨多租户架构下的租户安全培训和教
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri