逐梦s

flume sqoop kafka使用小结

1.flume
flume是高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统。flume不仅可以采集数据，还可以对数据进行简单的处理。
flume的文件采集source工具只能识别文本数据。
2.flume-ng
flume-ng中，flume的集群只有一种角色agent
agent中有三种组件：source、channel、sink
source作用是采集数据，它可以是主动的去监听、抓取，可以可以被动的接收和等待
channel作用是做数据的缓存，当采集数据并发高的时候，有可能source采集数据的速度比sink消费数据的速度要快，因此需要channel来做一个中间缓存，解决这种速度不一致问题
sink作用是消费channel中的数据，它的消费会保证消费成功只有保证消费成功以后，它才会把这个数据从channel中删除，否则还存在于channel中。

一个agent中可以由多个source、channel、sink
一个source可以对接多个channel
一个sink只可以对接一个channel

在source上有两种组件
选择器（selector）：当1个source对应多个channel时，可以使用选择器来分配source中什么样的数据到达什么样的channel
拦截器（interceptor）：数据由source到达channel的过程中对数据进行拦截并可以进行处理

3.flume agent的程序开发
flume采集过程程序的开发其实就是定义配置文件，在配置文件定义好source、channel、sink、selector、interceptor等组件，以及他们之间的关系。
flume程序是properties格式配置文件，范式如下：
# list the sources, sinks and channels for the agent
.sources =
.sinks =
.channels =

# set channel for source
.sources..channels = ...

# set channel for sink
.sinks..channel =
多个之间用空格来间隔
4.flume agent的启动
bin/flume-ng agent --conf conf --conf-file example.conf --name a1 -Dflume.root.logger=INFO,console
bin/flume-ng agent -c conf -f example.conf -n a1 -Dflume.root.logger=INFO,console
5.测试常用的source和sink
avro source被用来做测试，需要flume客户端程序把数据发送过来。
logger sink直接把获取到的数据打印在控制台

6.flume的客户端程序开发
项目中添加flume依赖

org.apache.flume
flume-ng-core
1.8.0

然后
构建RpcClient，使用RpcClientFactory的方法来构建。
构建Event对象，使用EventBuilder
然后调用client的append方法把数据发送给avrosource
7.Event
event是flume传递数据的最小单元
event里面包括两部分：header和body
header里面是一组kv数据，kv的类型都是String，header里面kv的内容可以被selector、interceptor或sink所使用
body里面是要传递具体的数据内容

写一个flume的客户端程序发送数据到一个flume agent
agent采集到数据之后把数据存储在hdfs上，以文本的方式存储
客户端发送的event的header里面写一个kv，k是timestamp，vlaue是当前时间戳值
8.客户端类型
Failover Client：解决单个flume节点挂掉，可以选择发送到集群中其他flume节点。
给一个client配置多个flume节点，在某个时间点只有一个节点来接受这个clien的数据，当这个节点挂掉之后，客户端会选择其他的节点来进行传输数据

LoadBalancing RPC client：解决单个节点上数据吞吐量过大达到瓶颈，可以使用LoadBalancing RPC client来进行负载均衡。

在代码实现上需要对client进行配置
Failover
写配置文件：clientconfig.properties
client.type = default_failover #配置客户端类型为default_failover。
hosts = h1 h2 h3 #给client配置多个flume节点
#每个节点的hostname和port可以独立设置
hosts.h1 = host1.example.org:41414
hosts.h2 = host2.example.org:41414
hosts.h3 = host3.example.org:41414
max-attempts = 3 #每个节点传输失败三次被判断为节点失败，开始尝试下一个节点

配置有了之后再实例化client对象的时候就可以使用
RpcClientFactory.getInstance(File propertiesFile)
其中参数propertiesFile去加载clientconfig.properties文件

对于配置信息可以写在自定义的配置文件中，也可以直接在代码里构建Properties对象，然后把上述配置参数写在Properties对象里面，然后使用RpcClientFactory.getInstance(Properties properties)方法来构造client对象

发送数据和普通的client没什么不同

写一个程序实现Failover类型的客户端，然后启动两个flume agent，达到客户端程序启动后往一个agent中发数据，结束这个agent的进程后，client会自动把数据发送到第二个agent

LoadBalancing RPC
client.type = default_loadbalance
hosts = h1 h2 h3 #给client添加多个flume节点，解决单节点处理流量达到瓶颈问题
hosts.h1 = host1.example.org:41414
hosts.h2 = host2.example.org:41414
hosts.h3 = host3.example.org:41414

backoff = false
maxBackoff = 0 # 当多个节点中有一个节点发生故障，这两个参数决定client是否重发已往失败节点上发送的数据，重发多少条

host-selector = round_robin # 这个决定着客户端以什么标准均衡的把数据发送到多个节点上去。round_robin，random，FQCN（自定义类型）

写一个LoadBalancing RPC客户端，配置两个agent，启动两个agent，客户端均衡的把数据发送到两个agent中
运行程序，并核对客户端发送的记录条数和两个agent各自收到的记录条数之和是否一致
agent把数据以文本的方式保存到hdfs上
9.selector
每个flume的source都有selector
selector的类型有两种
replicating（默认）：副本每个event从source出去会以副本的形式发送到多个channel中，也就是数每个channel中的数据都是全量的
multiplexing ：多路一个event从soucce中出去会选择进入某个channel，也就是说每个channel中的数据是部分，多个channel接受的数据加起来才是source中发送数据的全量。

多路需要有选择条件，这个选择条件需要存放在event的header中，K：条件名称，V：判断值
a1.sources = r1
a1.channels = c1 c2 c3 c4
a1.sources.r1.selector.type = multiplexing
a1.sources.r1.selector.header = state
a1.sources.r1.selector.mapping.CZ = c1
a1.sources.r1.selector.mapping.US = c2 c3
a1.sources.r1.selector.default = c4
上述flume的采集过程中，event的header中state key对应的
value是CZ的会被发送到c1 channel中
value是US的会被同时发送到c2和c3两个channel中
value是其余值的会被发送到c4 channel中

写一个客户端发送的数据event的header加上一个k:province ,v:henan、shandong、hebei、shanghai等
写一个agent，声明三个channel和三个sink，
用select把v是henan的数全部保存在hdfs上的一个/flume/henan目录下
把v是shanghai的数全部保存在hdfs上的一个/flume/shanghai目录下
v是其他值的全部都保存在/flume/other目录下
10.interceptor
interceptor是event从source之后和channel之前的一个中间过程，它可以对source发往channel的event进行拦截，并且可以对event进行处理，也可以对event进行过滤。
在代码上interceptor是添加在source上的：
a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.interceptors = i1 i2
a1.sources.r1.interceptors.i1.type = org.apache.flume.interceptor.HostInterceptor$Builder
a1.sources.r1.interceptors.i1.preserveExisting = false
a1.sources.r1.interceptors.i1.hostHeader = hostname
a1.sources.r1.interceptors.i2.type = org.apache.flume.interceptor.TimestampInterceptor$Builder
a1.sinks.k1.filePrefix = FlumeData.%{CollectorHost}.%Y-%m-%d
a1.sinks.k1.channel = c1
i1和i2都是interceptor，它被添加在source r1上，使用a1.sources.r1.interceptors=i1 i2的形式来声明和添加
然后通过
a1.sources.r1.interceptors.i1.params=value 的形式来具体配置

interceptor常用类型：
Timestamp Interceptor ：给event的header上添加一个kv，k:timestamp(可修改)，v:当前节点的时间戳
Host Interceptor ：给event的header上添加一个kv，k:host(可修改),v:当前节点的ip地址或者hostname
Static Interceptor ：给event的header上添加一个kv，k:自己指定，v:自己指定
Remove Header Interceptor：用来删除event的header上的一个或者多个kv，根据k的值
UUID Interceptor ：给event的header上添加一个kv，k:id(可修改)，v:随机产生的uuid

Search and Replace Interceptor：在event的body内容的字符串里，查找某个值，然后替换成指定的值。查找的值可以使用正则表达式匹配，替换的值可以是静态值（自己指定），也可以是匹配值例如：
正则表达式：The quick brown ([a-z]+) jumped over the lazy ([a-z]+)
匹配值中可以使用：$1代表正则中的第一个小括号，$2代表正则表达式中的第二个小括号。

Regex Filtering Interceptor ：正则表达式过滤拦截器，先匹配，然后选择匹配上的要被过滤掉还是匹配不上的被过滤掉
Regex Extractor Interceptor ：正则表达式抽取拦截器，先拦截，在匹配，再抽取，抽取的结果更新到原event的body中

写一个client随机发送模拟的电话号码：一个11位数字的字符串
写一个flume，对body中的电话号码进行脱敏处理，如：13592381243 ---》 135xxxx1243
11.自定义拦截器步骤
1创建项目添加flume依赖：

   org.apache.flume
   flume-ng-core
   1.7.0

2创建类型实现org.apache.flume.interceptor.Interceptor接口
3在实现类中实现
public Event intercept(Event event)
public List intercept(List events)
方法的拦截处理逻辑
4在实现类中定义一个名称为Builder的内部类实现Interceptor.Builder接口
实现
public void configure(Context context)
方法用来接收flume agent配置程序中传来的参数
实现
public Interceptor build()
方法用来完成对自定义的interceptor类的实例化
5项目打包
把项目放到flume安装目录的的lib子目录下
6在flume的agent配置程序中
interceptor的type参数为自定义类型的全名
参数结合着Builder类的configure方法来配置。

12.常用source和sink
source ：Avro Source，Spooling Directory Source，Kafka Source
sink ：HDFS Sink，Kafka Sink，Hive Sink，HBaseSinks，ElasticSearchSink，HTTP Sink

写一个flume的客户端往agent发送数据，数据内容包括人员信息：id、name、age
在agent中用HBaseSink 把数据保存到hbase的 flume_user表中，表有1个列簇i，列成员对应name、age，id作为rowkey

# 如果需要使用正则处理value可以使用以下的serializer
agent.sinks.hbaseSink.serializer= org.apache.flume.sink.hbase.RegexHbaseEventSerializer
# 指定某一列来当主键，而不是用随机生成的key
# agent.sinks.hbaseSink.serializer.rowKeyIndex = 0
# 指定正则表达式,这里用的正则是匹配逗号分隔的字符串
agent.sinks.hbaseSink.serializer.regex=^([^,]+),([^,]+),([^,]+),([^,]+)$
# 指定在列族中对应的的colName
agent.sinks.hbaseSink.serializer.colNames=c1,c2,c3,c4

13.sqoop
sqoop是hadoop体系下把数据从关系型数据库与大数据体系。存储系统之间相互导入导出的etl工具。它的底层原理，是把指令解析编译成mr，然后发送到yarn下去分布式执行，从而完成把数据在rdbms和hadoop体系下的迁移。

sqoop目前维护的版本：sqoop1和sqoop2
sqoop1:1.4.6以下的版本
sqoop2:1.99.x以上的版本

14.元数据
hdfs的metadata存储在namenode的本地文件系统的目录里面，包含fsimage和edits文件
hive的metadata是可以由用户来配置，存储在类似mysql的关系型数据库里面
hbase的metadata包含两部分：meta表和root表，其meta表存储在hbase数据库中，root表存储在zookeeper中。
关系型数据库的metadata，在数据库系统本身的数据字典表中
sqoop2的metadata是存储在本身配置的关系型数据库中。默认的是derby数据库。
kafka的metadata存储在zookeeper中

15.sqoop1
$ sqoop tool-name [tool-arguments]

16.使用sqoop1把mysql中的hive数据库下的的TBLS表中的数据导入到hdfs的/sqoop1/hive/tbls目录中
sqoop import .....(generic-args) (import-args)
sqoop-import .....(generic-args) (import-args)

sqoop import --connect jdbc:mysql://centos1:3306/hive \
--driver com.mysql.jdbc.Driver \
--username root \
--password sa \
--verbose \
--as-textfile \
--table TBLS \
--target-dir /sqoop1/hive/tbls \
--delete-target-dir

如果是以table的形式导入数据的话，sqoop会默认按照table的primary key在作为分割的条件，把数据根据primary key来划分成若干个区间，每个区间启动一个map任务来抓取数据，并导入到hdfs上。

17.使用sql从mysql中抽取数据导入到hdfs上
sqoop import --connect jdbc:mysql://centos1:3306/hive \
--driver com.mysql.jdbc.Driver \
--username root \
--password sa \
--verbose \
--as-textfile \
--query 'select * from TBLS WHERE $CONDITIONS' \
--split-by TBL_ID \
--target-dir /sqoop1/hive/tbls1 \
--delete-target-dir

使用sql的方式导入数据，对sql上必须要有where，where后面必须要有$CONDITIONS，必须指定split-by，根据什么字段来分割table数据。

如果是带条件的导入：
导入TBLS 的 TBL_TYPE='MANAGED_TABLE'
sqoop import --connect jdbc:mysql://centos1:3306/hive \
--driver com.mysql.jdbc.Driver \
--username root \
--password sa \
--verbose \
--as-textfile \
--query "select * from TBLS WHERE \$CONDITIONS and TBL_TYPE='MANAGED_TABLE'" \
--split-by TBL_ID \
--target-dir /sqoop1/hive/tbls2 \
--delete-target-dir
在使用双引号来括中sql语句的时候$CONDITIONS的$符号前面要加一个转义字符：\$CONDITIONS

18.增量导入
增量导入，就是对于同一数据按照批次导入的时候，每个批次导入的数据都最新的数据，每个批次导入的数据都是不同条件下的数据，所有批次的数据累计起来就是全量数据。
1.根据数据特征字段，把这些字段作为条件来完成导入过程
2018-01-15导入的数据，取数规则上使用：select * from tableA where op_date='2018-01-15'
2018-01-16导入的数据，取数规则上使用：select * from tableA where op_date='2018-01-16'
2.设定检查字段
--check-column 设置检查字段，每次执行导入的时候会自动在导入数据上加条件检查这个字段的值
--incremental 增量模式：append、lastmodified。当要导的数据表的检查字段，是递增的，也就是说新的数据记录进入数据库这个字段的值只可能变大不可能变小这种场景可以使用append，结合--check-column和--last-value使用。如果数据不仅仅是新增记录，还有数据改变的情况，这种情况下就不能直接使用append的方式增量导入了，可以在导入的数据上添加一个字段last-modified，每当被更新时，这个字段值需要修改成当前的时间戳，在检查导入的时候，--last-value设置的时间戳和被导入的数据的last-modified进行比较，凡是符合last-modified>last-value的数据会被选中并导入。

事实表一般使用append
维度表一般使用last-modified

19.sqoop1把数据从mysql导入到hive中
sqoop import --connect jdbc:mysql://centos1:3306/hive \
--driver com.mysql.jdbc.Driver \
--username root \
--password sa \
--verbose \
--as-textfile \
--table TBLS \
--hive-import \
--hive-overwrite \
--create-hive-table \
--hive-table from_sqoop1

20.sqoop1把数据从mysql导入到hbase中
sqoop import --connect jdbc:mysql://centos1:3306/hive \
--driver com.mysql.jdbc.Driver \
--username root \
--password sa \
--verbose \
--as-textfile \
--table TBLS \
--column-family i \
--hbase-row-key TBL_ID \
--hbase-table from_sqoop1

因为版本问题，如果自动在hbase中创建表，会报错：
--hbase-create-table \
21.sqoop1把hdfs上的数据导入到mysql
导出的时候要求rdbms上要已经存在目标表:
create table test.wc(
word varchar(30)
,count int
,primary key(word)
);
sqoop export \
--connect jdbc:mysql://centos1:3306/test \
--driver com.mysql.jdbc.Driver \
--username root \
--password sa \
--verbose \
--export-dir /wctestoutput/part-r-00000 \
--table wc \
--input-fields-terminated-by '\t'

把数据从大数据平台导出到关系型数据库中需要注意update-mode和update-key
--update-mode
--update-key
update-mode是用来指定当数据插入或更新到rdbms数据库时的模式：updateonly和allowinsert
update-key用来指定当sqoop是使用update语句去写rdbms是的where后的限定条件。

22.sqoop2是服务型的架构
使用sqoop2的时候需要启动sqoop服务
sqoop2-server start

使用sqoop2-shell连接服务进行操作和查看sqoop2

sqoop2的元数据：connector、job、link、role等信息，在启动sqoop2-server的目录下会生成一个@BASEDIR@和一个@LOGDIR@，其中@BASEDIR@是元数据（derby的数据库文件），@LOGDIR@是sqoop2-server运行的日志输出。

sqoop2的组件：connector：代表着sqoop可以连接操作的数据存储系统类型（有FROM和TO）
link ：代表一个具体的数据库链接，比方说虚拟机集群下的hdfs连接，或者centos1上的mysql连接
job ：代表一个具体的数据导入导出的过程，比方说把TBLS表从hive中导入到hdfs上

sqoop2的开发方式：
1在shell中通过create指令创建link
根据link创建job，job中需要指定 from link1 to link2
使用start job来启动job完成数据导入过程的执行
link和job都有自己的名称和id，在执行指令时通过name或id来制定要操作或使用的具体的link或job

2使用api来连接sqoop2的服务，然后通过api方法远程调用sqoop2的rpc服务完成link的创建，job的创建和job的启动，来完成sqoop2数据迁移的执行过程。

23.sqoop2的配置参数
http://sqoop.apache.org/docs/1.99.7/user.html
不同的connector对应的link和job（from、to）都有不同的配置参数
Link Configuration
FROM Job Configuration
TO Job Configuration

创建link的时候参照Link Configuration
创建from job的时候，比方说有一个job的from link是generic-jdbc-connector类型的，就需要查看generic-jdbc-connector的FROM Job Configuration
创建to job，的时候，比方说，这个job是把数据导出到jdbc数据库中，就需要查看generic-jdbc-connector的TO Job Configuration

24.sqoop2 java api开发过程
创建项目，添加sqoop依赖：

org.apache.sqoop
sqoop-client
${requestedVersion}

1构建sqoop的客户端对象SqoopClient类型，参数sqoop2-server的url，如："http://centos1:12000/sqoop/"
2通过client.createLink创建link对象，使用client.saveLink方法来保存link到sqoop2-server中
3通过client.createJob方法创建job对象，对job配置完成后，使用client.saveJob来把job保存到sqoop2-server中
4通过client.startJob方法来启动sqoop2-server中已有的job，执行sqoop2的数据迁移构成
注：
在java api的MJob、MLink的配置参数文档中是没有的，可以使用api的
MLinkConfig linkConfig = link.getConnectorLinkConfig();
MFromConfig fromJobConfig = job.getFromJobConfig();
MToConfig toJobConfig = job.getToJobConfig();
方法来获取link、from job、to job的配置参数
遍历这三个对象获取到MInput，每一个MInput代表一个配置参数，通过对配置参数的设置，完成对job和link的配置。

1.把mysql中的TBLS使用sqoop2 shell指令的方式导入的hdfs /sqoop2/tbls
2.把hdfs上的wordcount结果迁移到mysql test数据库下的wc2表中，使用java api的方式来完成
25.sqoop2在运行job时需要hadoop启动jobhistory server
sqoop2需要调用jobhistory server来判断每个job的执行任务和状态的
如果不启动jobhistory server，在sqoop2里已启动的job不能被终结，也不能删除，不能重新启动

26.kafka架构
broker，一个kafka的服务节点被称作一个broker，分布式下的kafka是由多个broker动态的形成的一个消息队列集群。
broker节点是一个逻辑的概念，一个broker节点其实就是一个java进程，因此一个物理服务器上可以运行多个broker节点。
多个broker之间，通过zookeeper来形成一个集群对外提供统一的消息队列服务。
27.kafka的安装配置
每一个broker都有一个server.properties配置文件，在启动broker的时候来指定配置文件的路径。
broker.id 每个broker节点在集群中拥有唯一的brokerid，集群中的每一个broker，id不能重复
listeners broker是一个服务，它对外提供服务需要占用网络端口，同一个物理节点上运行的多个broker服务，端口不能重复
log.dirs 目录下保存的该broker存储的消息内容，同一个物理节点上的运行的多个broker服务，log目录不能重复
zookeeper.connect 默认是localhost:2181，可以配置整个zookeeper的各个节点的zookeeper服务端口 centos1:2181,centos2:2181,centos3:2181

kafka把内存中的数据强制flush到磁盘上的触发条件
log.flush.interval.messages
log.flush.interval.ms
kafka会把消息以文件的形式保存在每个broker的log.dirs目录下面，但kafka并不是永久保存数据的，它里面可以通过参数配置来触发删除过程来删除过期的数据
log.retention.hours 时间触发参数
log.retention.bytes log文件尺寸触发参数
log.retention.check.interval.ms 删除条件是否满足检查参数

配置kafka中的topic是否可直接删除
delete.topic.enable
28.kafka的数据模型
topic kafka数据分类的模式名称，类似于数据库中的表table的概念
partition 一个topic可以划分为多个partition，每个partition分布在不同的broker节点上。数据在写入topic的时候，可以严格保证单个paritition有序。
replication 每一个partition都有多个replication，kafka使用副本形式来维护它的容错功能。多个副本在某一个时间点只有一个是leader角色，而其他的是flower角色，对外提供读写服务的只有leader，flower会实时的根leader之间进行数据同步。当leader所在的节点故障，zookeeper会从flower中选举一个来接替leader继续对外提供读写服务。

读写模型
producer 生产者，负责把消息传到kafka的topic上，默认会均衡的分配到多个parition上。producer还可以指定某个partition来把所有消息都发送到这个partition上。
consumer 消费者，可以从kafka的topic中读取消息来进行数据处理。一个consumer会从一个topic中的多个partition中顺序读取数据，consumer也可以指定某个partiton，只从这一个partition中消费消息记录。
consumer group 消费组，kafka支持分布式消费，同一个topic可以同时由多个consumer来进行并行消费，消费组可以保证一个组下多个consumer消费同一个topic中的数据时不会重复消费。
offset 在kafka的topic中数据被消费的时候，每一个topic的每一个partition对应的每一个消费组都会记录一个offset，kafka就是使用offset来保证一个组下的多个消费者数据不会消费重复。offset(topic,partition,groupname)。每当一条记录被消费者消费之后kafka会根据消费者的commit行为来更新这个offset。offset的数据是保存在kafka里面名称为__consumer_offsets的topic里面的。
kafka的消费者还可以指定起始的offset来进行消费。

kafka的元数据信息，保存在zookeeper上。topic、topic的partition、partition的replication

29.常用指令
启动kafka
kafka-server-start.sh config/server.properties &

topic操作指令（创建，删除，查看，修改）
kafka-topics.sh
增
kafka-topics.sh --zookeeper centos1:2181 --create --partitions 2 --replication-factor 2 --topic bd19first
查
kafka-topics.sh --zookeeper centos1:2181 --list
kafka-topics.sh --zookeeper centos1:2181 --describe --topic bd19first
改（修改topic的partition数量，replication数量，和topic的configuration参数）
kafka-topics.sh --zookeeper centos1:2181 --alter --topic bd19first --partitions 3
删
kafka-topics.sh --zookeeper centos1:2181 --delete --topic bd19first

控制台生产者和消费者通常用于测试和调试
kafka-console-producer.sh --broker-list centos1:9092,centos2:9092,centos1:9093 --topic bd19first
kafka-console-consumer.sh --bootstrap-server centos1:9092,centos2:9092,centos3:9092 --topic bd19first
kafka-console-consumer.sh --bootstrap-server centos1:9092,centos2:9092,centos3:9092 --topic bd19first --partition 0 --offset 2

kafka-server-start.sh server.properties &
kafka-server-start.sh server1.properties &

kafka-server-start.sh server2.properties &
kafka-server-start.sh server3.properties &

kafka-server-start.sh server4.properties &
kafka-server-start.sh server5.properties &

30.kafka的api使用
首先创建maven项目，添加kafka依赖

org.apache.kafka
kafka-clients
0.10.1.0

org.slf4j
slf4j-log4j12
1.7.22

然后根据producer的api文档和consumer的api文档来创建客户端程序

kafka是一个消息队列系统，它传递的数据是封装在message里面的，message分成两部分，k和v

producer
构建连接kafka服务的配置对象Properties后者Map
构建一个Producer对象，使用KafkaProducer
partitionsFor(String topic)获取topic下面的partition信息
使用send(ProducerRecord record)方法发送message到kafka服务端
message对象的类型是ProducerRecord
flush()把producer客户端内存中的数据全部flush到kafka服务器上

consumer
构建消费者的properties配置对象
构建一个Consumer对象，使用KafkaConsumer类型
assign(Collection partitions)用来指定该consumer消费哪些topic的哪些partition
beginningOffsets(Collection partitions)获取本次消费给定参数中的partition上的offset值

commitAsync()
commitAsync(Map offsets, OffsetCommitCallback callback)
commitAsync(OffsetCommitCallback callback)
commitSync()
commitSync(Map offsets)
提交offset，如果要使用上述五个方法手动提交offset的需要再properties里面设置enable.auto.commit为false。

获取上一次提交的某partition下的offset值
committed(TopicPartition partition)

手动指定消费的起始offset值：
seek(TopicPartition partition, long offset)
seekToBeginning(Collection partitions)
seekToEnd(Collection partitions)

订阅topic
subscribe(Collection topics)
取出要消费的数据
poll(long timeout)

linux上新建一个/usr/tmp/spool的目录，每当有新的文本文件被拷贝到这个目录下时-------》flume spooldirsource 监听这个目录-------》使用kafkasink------》kafka topic：log-----》java consumer读取log topic中的数据并且控制台打印出来

sqoop import --connect jdbc:mysql://centos1:3306/hive --username root --password sa --table TBLS --target-dir /sqoop1test/aa --as-textfile

你可能感兴趣的:(flume sqoop kafka使用小结)

element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
高级编程--XML+socket练习题 masa010 java 开发语言
1.北京华北2114.8万人上海华东2,500万人广州华南1292.68万人成都华西1417万人（1）使用dom4j将信息存入xml中（2）读取信息，并打印控制台（3）添加一个city节点与子节点（4）使用socketTCP协议编写服务端与客户端，客户端输入城市ID，服务器响应相应城市信息（5）使用socketTCP协议编写服务端与客户端，客户端要求用户输入city对象，服务端接收并使用dom4j
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
C#中使用split分割字符串互联网打工人no1 c#
1、用字符串分隔：usingSystem.Text.RegularExpressions;stringstr="aaajsbbbjsccc";string[]sArray=Regex.Split(str,"js",RegexOptions.IgnoreCase);foreach(stringiinsArray)Response.Write(i.ToString()+"");输出结果：aaabbbc
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
knob UI插件使用换个号韩国红果果 JavaScript jsonp knob
图形是用canvas绘制的 js代码 var paras = { max:800, min:100, skin:'tron',//button type thickness:.3,//button width width:'200',//define canvas width.,canvas height displayInput:'tr
Android+Jquery Mobile学习系列(5)-SQLite数据库白糖_ JQuery Mobile
目录导航 SQLite是轻量级的、嵌入式的、关系型数据库，目前已经在iPhone、Android等手机系统中使用,SQLite可移植性好，很容易使用，很小，高效而且可靠。因为Android已经集成了SQLite，所以开发人员无需引入任何JAR包，而且Android也针对SQLite封装了专属的API，调用起来非常快捷方便。我也是第一次接触S
impala-2.1.2-CDH5.3.2 dayutianfei impala
最近在整理impala编译的东西，简单记录几个要点：根据官网的信息（https://github.com/cloudera/Impala/wiki/How-to-build-Impala）： 1. 首次编译impala，推荐使用命令： ${IMPALA_HOME}/buildall.sh -skiptests -build_shared_libs -format 2.仅编译BE ${I
求二进制数中1的个数周凡杨 java 算法二进制
解法一：对于一个正整数如果是偶数，该数的二进制数的最后一位是 0 ，反之若是奇数，则该数的二进制数的最后一位是 1 。因此，可以考虑利用位移、判断奇偶来实现。 public int bitCount(int x){ int count = 0; while(x!=0){ if(x%2!=0){ /
spring中hibernate及事务配置 g21121 Hibernate
hibernate的sessionFactory配置：  <bean id="sessionFactory" class="org.springframework.orm.hibernate3.LocalSessionFactoryBean"> <
log4j.properties 使用 510888780 log4j
log4j.properties 使用一.参数意义说明输出级别的种类 ERROR、WARN、INFO、DEBUG ERROR 为严重错误主要是程序的错误 WARN 为一般警告，比如session丢失 INFO 为一般要显示的信息，比如登录登出 DEBUG 为程序的调试信息配置日志信息输出目的地 log4j.appender.appenderName = fully.qua
Spring mvc-jfreeChart柱图（2）布衣凌宇 jfreechart
上一篇中生成的图是静态的，这篇将按条件进行搜索，并统计成图表，左面为统计图，右面显示搜索出的结果。第一步：导包第二步；配置web.xml(上一篇有代码) 建BarRenderer类用于柱子颜色 import java.awt.Color; import java.awt.Paint; import org.jfree.chart.renderer.category.BarR
我的spring学习笔记14-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。 PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java
maven 之 cobertura 简单使用 antlove maven test unit cobertura report
1. 创建一个maven项目 2. 创建com.CoberturaStart.java package com; public class CoberturaStart { public void helloEveryone(){ System.out.println("=================================================
程序的执行顺序百合不是茶 JAVA执行顺序
刚在看java核心技术时发现对java的执行顺序不是很明白了,百度一下也没有找到适合自己的资料,所以就简单的回顾一下吧代码如下; 经典的程序执行面试题 //关于程序执行的顺序 //例如： //定义一个基类 public class A(){ public A(
设置session失效的几种方法 bijian1013 web.xml session失效监听器
在系统登录后，都会设置一个当前session失效的时间，以确保在用户长时间不与服务器交互，自动退出登录，销毁session。具体设置很简单，方法有三种：（1）在主页面或者公共页面中加入：session.setMaxInactiveInterval(900);参数900单位是秒，即在没有活动15分钟后，session将失效。这里要注意这个session设置的时间是根据服务器来计算的，而不是客户端。所
java jvm常用命令工具 bijian1013 java jvm
一.概述程序运行中经常会遇到各种问题，定位问题时通常需要综合各种信息，如系统日志、堆dump文件、线程dump文件、GC日志等。通过虚拟机监控和诊断工具可以帮忙我们快速获取、分析需要的数据，进而提高问题解决速度。本文将介绍虚拟机常用监控和问题诊断命令工具的使用方法，主要包含以下工具: &nbs
【Spring框架一】Spring常用注解之Autowired和Resource注解 bit1129 Spring常用注解
Spring自从2.0引入注解的方式取代XML配置的方式来做IOC之后，对Spring一些常用注解的含义行为一直处于比较模糊的状态，写几篇总结下Spring常用的注解。本篇包含的注解有如下几个： Autowired Resource Component Service Controller Transactional 根据它们的功能、目的，可以分为三组，Autow
mysql 操作遇到safe update mode问题 bitray update
我并不知道出现这个问题的实际原理,只是通过其他朋友的博客,文章得知的一个解决方案,目前先记录一个解决方法,未来要是真了解以后,还会继续补全. 在mysql5中有一个safe update mode,这个模式让sql操作更加安全,据说要求有where条件,防止全表更新操作.如果必须要进行全表操作,我们可以执行 SET
nginx_perl试用 ronin47 nginx_perl试用
因为空闲时间比较多，所以在CPAN上乱翻，看到了nginx_perl这个项目(原名Nginx::Engine)，现在托管在github.com上。地址见：https://github.com/zzzcpan/nginx-perl 这个模块的目的，是在nginx内置官方perl模块的基础上，实现一系列异步非阻塞的api。用connector/writer/reader完成类似proxy的功能（这里
java-63-在字符串中删除特定的字符 bylijinnan java
public class DeleteSpecificChars { /** * Q 63 在字符串中删除特定的字符 * 输入两个字符串，从第一字符串中删除第二个字符串中所有的字符。 * 例如，输入”They are students.”和”aeiou”，则删除之后的第一个字符串变成”Thy r stdnts.” */ public static voi
EffectiveJava--创建和销毁对象 ccii 创建和销毁对象
本章内容： 1. 考虑用静态工厂方法代替构造器 2. 遇到多个构造器参数时要考虑用构建器（Builder模式） 3. 用私有构造器或者枚举类型强化Singleton属性 4. 通过私有构造器强化不可实例化的能力 5. 避免创建不必要的对象 6. 消除过期的对象引用 7. 避免使用终结方法 1. 考虑用静态工厂方法代替构造器类可以通过
[宇宙时代]四边形理论与光速飞行 comsci
从四边形理论来推论为什么光子飞船必须获得星光信号才能够进行光速飞行？一组星体组成星座向空间辐射一组由复杂星光信号组成的辐射频带，按照四边形-频率假说一组频率就代表一个时空的入口那么这种由星光信号组成的辐射频带就代表由这些星体所控制的时空通道，该时空通道在三维空间的投影是一
ubuntu server下python脚本迁移数据 cywhoyi python Kettle pymysql cx_Oracle ubuntu server
因为是在Ubuntu下，所以安装python、pip、pymysql等都极其方便，sudo apt-get install pymysql，但是在安装cx_Oracle（连接oracle的模块）出现许多问题，查阅相关资料，发现这边文章能够帮我解决，希望大家少走点弯路。http://www.tbdazhe.com/archives/602 1.安装python 2.安装pip、pymysql
Ajax正确但是请求不到值解决方案 dashuaifu Ajax async
Ajax正确但是请求不到值解决方案解决方案：1 . async: false , 2. 设置延时执行js里的ajax或者延时后台java方法！！！！！！！例如： $.ajax({ &
windows安装配置php+memcached dcj3sjt126com PHP Install memcache
Windows下Memcached的安装配置方法 1、将第一个包解压放某个盘下面，比如在c:\memcached。 2、在终端（也即cmd命令界面）下输入 'c:\memcached\memcached.exe -d install' 安装。 3、再输入： 'c:\memcached\memcached.exe -d start' 启动。（需要注意的: 以后memcached将作为windo
iOS开发学习路径的一些建议 dcj3sjt126com ios
iOS论坛里有朋友要求回答帖子，帖子的标题是：想学IOS开发高阶一点的东西，从何开始，然后我吧啦吧啦回答写了很多。既然敲了那么多字，我就把我写的回复也贴到博客里来分享，希望能对大家有帮助。欢迎大家也到帖子里讨论和分享，地址：http://bbs.csdn.net/topics/390920759 下面是我回复的内容：结合自己情况聊下iOS学习建议，
Javascript闭包概念 fanfanlovey JavaScript 闭包
1.参考资料 http://www.jb51.net/article/24101.htm http://blog.csdn.net/yn49782026/article/details/8549462 2.内容概述要理解闭包，首先需要理解变量作用域问题内部函数可以饮用外面全局变量 var n=999; 　　functio
yum安装mysql5.6 haisheng mysql
1、安装http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm 2、yum install mysql 3、yum install mysql-server 4、vi /etc/my.cnf 添加character_set_server=utf8
po/bo/vo/dao/pojo的详介 IT_zhlp80 java BO VO DAO POJO po
JAVA几种对象的解释 PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作. VO:value object值对象。通常用于业务层之间的数据传递，和PO一样也是仅仅包含数据而已。但应是抽象出的业务对象,可
java设计模式 kerryg java 设计模式
设计模式的分类：一、设计模式总体分为三大类： 1、创建型模式（5种）：工厂方法模式，抽象工厂模式，单例模式，建造者模式，原型模式。 2、结构型模式（7种）：适配器模式，装饰器模式，代理模式，外观模式，桥接模式，组合模式，享元模式。 3、行为型模式（11种）：策略模式，模版方法模式，观察者模式，迭代子模式，责任链模式，命令模式，备忘录模式，状态模式，访问者
[1]CXF3.1整合Spring开发webservice——helloworld篇木头.java spring webservice CXF
Spring 版本3.2.10 CXF 版本3.1.1 项目采用MAVEN组织依赖jar 我这里是有parent的pom，为了简洁明了，我直接把所有的依赖都列一起了，所以都没version，反正上面已经写了版本 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="ht
Google 工程师亲授：菜鸟开发者一定要投资的十大目标 qindongliang1922 工作感悟人生
身为软件开发者，有什么是一定得投资的？ Google 软件工程师 Emanuel Saringan 整理了十项他认为必要的投资，第一项就是身体健康，英文与数学也都是必备能力吗？来看看他怎么说。（以下文字以作者第一人称撰写））你的健康无疑地，软件开发者是世界上最久坐不动的职业之一。每天连坐八到十六小时，休息时间只有一点点，绝对会让你的鲔鱼肚肆无忌惮的生长。肥胖容易扩大罹患其他疾病的风险，
linux打开最大文件数量1,048,576 tianzhihehe c linux
File descriptors are represented by the C int type. Not using a special type is often considered odd, but is, historically, the Unix way. Each Linux process has a maximum number of files th
java语言中PO、VO、DAO、BO、POJO几种对象的解释衞酆夼 java VO BO POJO po
PO:persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录，多个记录可以用PO的集合。PO中应该不包含任何对数据库的操作。 BO:business object业务对象封装业务逻辑的java对象