双斜杠少年

flume 入门初识

介绍

Flume 是 Cloudera 提供的日志收集系统,具有分布式、高可靠、高可用性等特点,对海量日志采集、聚合和传输,Flume 支持在日志系统中定制各类数据发送方,同时,Flume 提供对数据进行简单处理, 并写到各种数据接受方的能力。

Flume 使用 java 编写,其需要运行在 Java1.6 或更高版本之上。

工作方式

Flume采用了多Master的方式。为了保证配置数据的一致性，Flume[1] 引入了ZooKeeper，用于保存配置数据，ZooKeeper本身可保证配置数据的一致性和高可用，另外，在配置数据发生变化时，ZooKeeper可以通知Flume Master节点。Flume Master间使用gossip协议同步数据。

流程结构

Flume的结构主要分为三部分：source、channel以及sink.其中source为源头，负责采集日志；channel为通道，负责传输和暂时储存；sink为目的地，将采集到的日志保存起来。在真正日志采集的过程中，根据待采集日志的类型以及存储需求，选择相应的类型的source、channel和sink进行配

架构

数据流

Flume 的核心是把数据从数据源收集过来,再送到目的地。为了保证输送一定成功,在送到目的地之前,会先缓存数据,待数据真正到达目的地后,删除自己缓存的数据。

Flume 传输的数据的基本单位是 Event,如果是文本文件,通常是一行记录,这也是事务的基本单位。Event 从 Source,流向 Channel,再到 Sink,本身为一个 byte 数组,并可携带 headers 信息。Event 代表着一个数据流的最小完整单元,从外部数据源来,向外部的目的地去。

Flume 运行的核心是 Agent。它是一个完整的数据收集工具,含有三个核心组件,分别是 source、channel、sink。通过这些组件, Event 可以从一个地方流向另一个地方,如下图所示。

source 可以接收外部源发送过来的数据。不同的 source,可以接受不同的数据格式。比如有目录池(spooling directory)数据源, 可以监控指定文件夹中的新文件变化,如果目录中有文件产生,就会立刻读取其内容。

channel 是一个存储地,接收 source 的输出,直到有 sink 消费掉 channel 中的数据。channel 中的数据直到进入到下一个 channel 中或者进入终端才会被删除。当 sink 写入失败后,可以自动重启,不会造成数据丢失,因此很可靠。

sink 会消费 channel 中的数据,然后送给外部源或者其他 source。如数据可以写入到 HDFS 或者 HBase 中。

多代理流

flume 允许多个 agent 连在一起,形成前后相连的多级跳。

合并流

多通路流

核心组件解析

source

Client 端操作消费数据的来源,Flume 支持 Avro,log4j,syslog 和 http post(body 为 json 格式)。可以让应用程序同已有的 Source 直接打交道,如 AvroSource,SyslogTcpSource。也可以写一个 Source,以 IPC(进程间通信协议) 或 RPC(远程进程间通信协议) 的方式接入自己的应用,Avro 和 Thrift 都可以(分别有 NettyAvroRpcClient 和 ThriftRpcClient 实现了 RpcClient 接口),其中 Avro 是默认的 RPC 协议。具体代码级别的 Client 端数据接入,可以参考官方手册。

对现有程序改动最小的使用方式是使用是直接读取程序原来记录的日志文件,基本可以实现无缝接入,不需要对现有程序进行任何改动。对于

直接读取文件 Source,有两种方式:

ExecSource:

以运行 Linux 命令的方式,持续的输出最新的数据,如文件名指令,在这种方式下,取的文件名必须是指定的。 ExecSource 可以实现对日志的实时收集,但是存在 Flume 不运行或者指令执行出错时,将无法收集到日志数据,无法保证日志数据的完整性。

且flume 运行中可动态的修改配置文件。flume不用停止动态修改。

SpoolSource:

监测配置的目录下新增的文件,并将文件中的数据读取出来。需要注意两点:

拷贝到 spool 目录下的文件不可以再打开编辑;
spool 目录下不可包含相应的子目录。

SpoolSource 虽然无法实现实时的收集数据,但是可以使用以分钟的方式分割文件,趋近于实时。如果应用无法实现以分钟切割日志文件的话,可以两种收集方式结合使用。在实际使用的过程中,可以结合 log4j 使用,使用 log4j 的时候,将 log4j 的文件分割机制设为1分钟一次,将文件拷贝到 spool 的监控目录。log4j 有一个 TimeRolling 的插件,可以把 log4j 分割文件到 spool 目录。基本实现了实时的监控。

Flume 在传完文件之后,将会修改文件的后缀,变为 .COMPLETED (后缀也可以在配置文件中灵活指定)。

Channel

有几个 channel 可供选择,分别是 Memory Channel, JDBC Channel , File Channel, Psuedo Transaction Channel。比较常见的是前三种 channel。

MemoryChannel 可以实现高速的吞吐,但是无法保证数据的完整性。
Memory Channel 是一个不稳定的隧道,其原因是由于它在内存中存储所有事件。如果 java 进程死掉,任何存储在内存的事件将会丢失。另外,内存的空间受到 RAM 大小的限制。
MemoryRecoverChannel 在官方文档的建议上已经建义使用 FileChannel 来替换。

FileChannel 保证数据的完整性与一致性。在具体配置 FileChannel 时,建议 FileChannel 设置的目录和程序日志文件保存的目录设成不同的磁盘,以便提高效率。

File Channel 是一个持久化的隧道(channel),它持久化所有的事件,并将其存储到磁盘中。因此,即使 Java 虚拟机当掉,或者操作系统崩溃或重启,再或者事件没有在管道中成功地传递到下一个代理(agent),这一切都不会造成数据丢失。,而 File Channel 不受内存和 jvm 的限制,只要磁盘空间足够,它就可以将所有事件数据存储到磁盘上。

sink

Sink 在设置存储数据时,可以向文件系统、数据库、hadoop 存数据,在日志数据较少时,可以将数据存储在文件系中,并且设定一定的时间间隔保存数据。（一定时间间隔把数据刷到文件系统中）在日志数据较多时,可以将相应的日志数据存储到 Hadoop 中,便于日后进行相应的数据分析.更多 sink 的内容可以参考官方手册。

Flume处理日志

Flume不止可以采集日志，还可以对日志进行简单的处理，在source处可以通过interceptor对日志正文处的重要内容进行过滤提取，在channel处可以通过header进行分类，将不同类型的日志投入不同的通道中，在sink处可以通过正则序列化来将正文内容进行进一步的过滤和分类。

Flume Source Interceptors

Flume可以通过interceptor将重要信息提取出来并且加入到header中，常用的interceptor有时间戳、主机名和UUID等，用户也可以根据个人需求编写正则过滤器，将某些特定格式的日志内容过滤出来，以满足特殊需求。

Flume Channel Selectors

Flume可以根据需求将不同的日志传输进不同的channel，具体方式有两种：复制和多路传输。复制就是不对日志进行分组，而是将所有日志都传输到每个通道中，对所有通道不做区别对待；多路传输就是根据指定的header将日志进行分类，根据分类规则将不同的日志投入到不同的channel中，从而将日志进行人为的初步分类。

Flume Sink Processors

Flume在sink处也可以对日志进行处理，常见的sink处理器包括custom、failover、load balancing和default等，和interceptor一样，用户也可以根据特殊需求使用正则过滤处理器，将日志内容过滤出来，但和interceptor不同的是在sink处使用正则序列化过滤出的内容不会加入到header中，从而不会使日志的header显得过于臃肿。

性能

可靠性

Flume 的核心是把数据从数据源收集过来,再送到目的地。为了保证输送一定成功,在送到目的地之前,会先缓存数据,待数据真正到达目的地后,删除自己缓存的数据。(sink传输后删除channel 的数据)

Flume 使用事务性的方式保证传送 Event 整个过程的可靠性。 Sink 必须在 Event 被存入 Channel 后,或者已经被传达到下一站 agent 里,又或者,已经被存入外部数据目的地之后,才能把 Event 从 Channel 中 remove 掉。(也就是数据持久化了，或者数据流出当前agent)这样数据流里的 event 无论是在一个 agent 里还是多个 agent 之间流转,都能保证可靠,因为以上的事务保证了 event 会被成功存储起来。而 Channel 的多种实现在可恢复性上有不同的保证。也保证了 event 不同程度的可靠性。比如 Flume 支持在本地保存一份文件 channel 作为备份,而 memory channel 将 event 存在内存 queue 里,速度快,但丢失的话无法恢复。

可恢复性

还是靠 Channel。推荐使用 FileChannel,事件持久化在本地文件系统里(性能较差)。

你可能感兴趣的:(5.4,flume,flume)

MyBatisPlus——基本CRUD 前丨尘忆·梦 mysql 数据库 java
文章目录1、BaseMapper2、插入3、删除3.1、通过id删除记录3.2、通过id批量删除记录3.3、通过map条件删除记录4、修改5、查询5.1、根据id查询用户信息5.2、根据多个id查询多个用户信息5.3、通过map条件查询用户信息5.4、查询所有数据6、通用ServiceServiceCRUD接口6.1、IService6.2、创建Service接口和实现类6.3、扫描组件6.4、测
【Gin】HTTP 请求调试器
文章目录项目概述代码功能详解1.导入必要的包2.主函数和路由设置3.请求信息捕获4.请求参数和头信息5.请求体处理5.1JSON数据处理5.2表单数据处理5.3Multipart表单数据处理5.4其他类型数据处理6.构造响应对象7.返回JSON响应功能特点使用场景完整代码项目概述这个GinHTTP请求调试器是一个功能完整的工具，用于测试和调试前端接口调用。它能够捕获并记录所有请求信息，并以清晰的结
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
Flume到Kafka且均分到多个partition 小学僧来啦 Flume Kafka partition Flume
@Author:Spinach|GHB@Link:http://blog.csdn.net/bocai8058文章目录说明情况解决方法说明情况Flume向kafka发布数据时，发现kafka接收到的数据总是在一个partition中，而我们希望发布来的数据在所有的partition平均分布。应该怎么做呢？解决方法Flume的官方文档是这么说的：KafkaSinkusesthetopicandkey
D2-ROS2入门文档陈纬度啊 AutoCar 学习
ROS2基础入门学习指南目录ROS2简介与概述开发环境搭建ROS2核心概念开发第一个ROS2程序ROS2消息机制详解5.1Topic通信5.2Service通信5.3Action通信5.4Parameter参数自定义消息与接口ROS2包管理与工作空间Launch文件与系统启动ROS2工具与调试技巧ROS2组件与生命周期管理ROS2多线程与执行器ROS2QoS与性能优化ROS2安全机制ROS2仿真与
解锁WSL：Windows下的Linux新世界奔跑吧邓邓子必备核心技能 windows linux WSL 跨平台开发
目录一、WSL是什么二、WSL的功能特点2.1运行Linux环境2.2开发工具支持2.3文件系统集成2.4命令行交互2.5性能和兼容性三、WSL的版本区别3.1WSL1介绍3.2WSL2介绍3.3两者对比四、WSL的安装教程4.1安装前准备4.2安装步骤4.3安装Linux分发版五、WSL的常用命令5.1系统镜像管理5.2系统启动与关闭5.3镜像导出与导入5.4其他常用命令六、WSL的应用场景6.
软件测试的概念
目录1.认识测试2.软件测试的工作内容3.什么是需求4.开发模型5.常见的开发模型5.1.瀑布模型5.2.螺旋模型5.3.增量模型5.4.迭代模型5.5.敏捷模型5.5.1.敏捷模型的常见方法6.测试模型6.1.v模型6.2.W模型(双V模型）7.软件测试的生命周期软件测试在生命周期各阶段的应用8.BUG8.1.BUG分类（按严重性）8.2.BUG的生命周期1.认识测试软件测试是软件开发过程中的关
STM32之有源蜂鸣器模块如愿小李单片机设计单片机嵌入式硬件 stm32
目录一、系统概述二、无源蜂鸣器模块简介2.1基本概念与工作原理2.2与无源蜂鸣器对比2.3关键电气参数2.4硬件驱动设计2.5选型与使用注意事项三、硬件设计3.1硬件组成3.2硬件连接四、软件设计4.1开发环境配置4.2关键代码实现4.2.1GPIO初始化4.2.2蜂鸣器控制函数4.2.3报警模式实现五、注意事项5.1驱动电路必须使用三极管5.2电压匹配5.3保护措施5.4电流消耗六、总结一、系统
【2025/07/04】GitHub 今日热门项目
GitHub今日热门项目每日精选优质开源项目|发现优质开源项目，跟上技术发展趋势报告概览统计项数值说明报告日期2025-07-04(周五)GitHubTrending每日快照数据时间12:00:27实时爬取生成项目总数16个精选热门开源项目⭐总星数475.9K社区认可度指标今日热度+5.4K24小时新增关注数据洞察核心指标项目总览16个精选项目⭐社区认可475.9K总星标数今日热度5.4K新增关注
学习虚幻C++开发日志——初识虚幻框架未来牛马之星学习虚幻C++开发日志学习虚幻 c++
1.虚幻引擎架构1.1虚幻引擎模块（Modules）官方文档：虚幻引擎模块|虚幻引擎5.4文档|EpicDeveloperCommunity(epicgames.com)模块（Modules）是虚幻引擎（UE）的软件架构的基本构建块。Module分为引擎模块,项目模块,插件模块.注意：1.要控制模块的加载方式和时间，请在.uproject或.uplugin文件中为你的模块添加配置信息。这包括模块的
Java高并发系统限流算法的应用赵广陆 arithmetic java 算法开发语言
目录1概述2计数器限流2.1概述2.2实现2.3结果分析2.4优缺点2.5应用3漏桶算法3.1概述3.2实现3.3结果分析3.4优缺点4令牌桶算法4.1概述4.2实现4.3结果分析4.4应用5滑动窗口5.1概述5.2实现5.3结果分析5.4应用想学习架构师构建流程请跳转：Java架构师系统架构设计1概述在开发高并发系统时有三把利器用来保护系统：缓存、降级和限流。限流可以认为服务降级的一种，限流是对
Mysql数据库操作 2301_80329775 MySQL管理和高可用 Linux系统管理数据库 mysql adb
目录前言一：Mysql数据库介绍二:MYSQL库操作1.系统数据库2.数据库操作2.1创建数据库2.2数据库命名规则2.3选择数据库2.4查看数据库2.5删除数据库三：MYSQL表操作1.表介绍2.查看表3.创建表3.1语法3.2类型介绍日期类型：3.3约束条件3.4创建表示例4.查看表结构5.修改表5.1修改表名5.2增加字段5.3删除字段5.4修改字段6.复制表7.删除表四、MySQL数据操作
大数据ETL工具比较：Sqoop vs Flume vs Kafka AI天才研究院 AI人工智能与大数据大数据 etl sqoop ai
大数据ETL工具比较：SqoopvsFlumevsKafka关键词：大数据ETL、Sqoop、Flume、Kafka、数据迁移、日志采集、消息队列摘要：在大数据生态中，ETL（抽取-转换-加载）是数据价值挖掘的关键环节。不同业务场景对数据传输的实时性、可靠性、数据类型有差异化需求，催生了Sqoop、Flume、Kafka等特色鲜明的ETL工具。本文从核心架构、工作原理、性能指标、实战案例四个维度，
Python训练营打卡——DAY16（2025.5.5） cosine2025 Python训练营打卡 python 开发语言机器学习
目录一、NumPy数组基础笔记1.理解数组的维度(Dimensions)2.NumPy数组与深度学习Tensor的关系3.一维数组(1DArray)4.二维数组(2DArray)5.数组的创建5.1数组的简单创建5.2数组的随机化创建5.3数组的遍历5.4数组的运算6.数组的索引6.1一维数组索引6.2二维数组索引6.3三维数组索引二、SHAP值的深入理解三、总结1.NumPy数组基础总结2.SH
Docker环境下部署拼图网页小游戏江湖有缘玩转小游戏合集 docker 容器运维小游戏
【好玩的经典游戏】Docker环境下部署拼图网页小游戏前言一、相关介绍1.1httpd介绍1.2拼图网页小游戏介绍二、本次实践介绍2.1本地环境规划2.2本次实践说明三、本地环境检查3.1检查Docker服务状态3.2检查Docker版本3.3检查dockercompose版本四、下载httpd镜像五、创建httpd容器5.1新建目录5.2创建httpd容器5.3查看容器状态5.4访问httpd服
CentOS5.4 安装过程（图解） suixinm Linux
CentOS5.4安装过程（图解）一：虚拟机配置：网络连接选择桥接模式二：开始安装CentOS5.4进入CentOS安装界面，直接回车。注意：如果你实际机器的内存是512或者是更低，将会提示你内存不足以支持图形界面安装，一般玩技术最好是安装2G内存或者更高三：输入回车键以后将进入光驱检查界面：如果你存在光驱的话依旧选择OK，如果你没有光驱那么Skip（因为我们是在虚拟机中安装的所以直接Skip）四
解锁Selenium：Web自动化的常用操作秘籍奔跑吧邓邓子必备核心技能 selenium 前端自动化 Web自动化常用操作秘籍
目录一、Selenium简介二、环境搭建2.1安装Selenium库2.2下载浏览器驱动三、定位元素3.1通过ID定位3.2通过名称定位3.3通过XPath表达式定位3.4通过CSS选择器定位3.5通过类名定位3.6通过标签名定位四、元素操作4.1单击元素4.2输入文本4.3清除文本内容4.4获取元素文本4.5获取元素属性值五、浏览器操作5.1打开URL5.2页面导航5.3刷新页面5.4窗口操作5
【C++高阶二】STL的map和set Pacify_The_North C++c++开发语言 windows visualstudio
【C++高阶二】STL的map和set1.初识map和set2.pair3.set3.1模板参数3.2typedef的类型3.3insert3.4erase3.5lower_bound与upper_bound4.multiset5.map5.1模板参数5.2typedef的类型5.3普通接口5.4insert5.5operator[]6.multimap1.初识map和setset是一个无序集合，
python实战项目77：足球运动员数据分析 wp_tao Python副业接单实战项目 python 数据分析开发语言
python实战项目77：足球运动员数据分析一、数据集介绍二、加载数据集三、查看数据3.1查看数据大小3.2查看数据前几行3.3查看数据基本信息四、数据预处理4.1查看并处理缺失值4.2查看并处理重复值五、运动员身高和体重分布5.1查看身高和体重列数据情况5.2数据类型转换5.3绘制身高分布直方图5.3绘制体重分布直方图5.4统计运动员左右脚比例六、俱乐部球员评分分析6.1俱乐部球员平均分top1
在大数据求职面试中如何回答分布式协调与数据挖掘问题
在大数据求职面试中如何回答分布式协调与数据挖掘问题场景：小白的大数据求职面试小白是一名初出茅庐的程序员，今天他来到一家知名互联网公司的面试现场，面试官是经验丰富的老黑。以下是他们之间的对话：第一轮提问：分布式与数据采集老黑：小白，你对Zookeeper有了解吗？小白：当然，Zookeeper是一个分布式协调服务，主要用于分布式应用程序中的同步服务、命名服务和配置管理。老黑：不错，你能说说Flume
MySQL 数据库管理与操作指南 XMYX-0 数据库 mysql
文章目录MySQL数据库管理与操作指南1.忘记MySQL密码的处理方法2.MySQL数据库备份与恢复2.1数据库备份2.2数据库恢复3.MySQL用户与权限管理3.1创建用户与授权3.2查看所有用户3.3删除用户4.关闭GTID复制模式5.查看数据表的存储引擎5.1查看MySQL支持的存储引擎5.2查看当前默认存储引擎5.3查看具体表的存储引擎5.4查看所有表的状态6.数据库操作命令6.1删除表6
手把手教你玩转 Sqoop：从数据库到大数据的「数据搬运工」 AAA建材批发王师傅数据库 sqoop 大数据 hive hdfs
一、Sqoop是什么？——数据界的「超级搬运工」兄弟们，今天咱们聊个大数据圈的「搬运小能手」——Sqoop！可能有人会问：这玩意儿跟Flume啥区别？简单来说：Flume是专门搬日志数据的「快递员」而Sqoop是搬数据库数据的「搬家公司」它的名字咋来的？SQL+Hadoop，直接告诉你核心技能：在关系型数据库（比如MySQL）和Hadoop家族（HDFS、Hive、HBase）之间疯狂倒腾数据！核
Flum的组件和原理。以及配置和基础命令
ApacheFlume架构的原理和组成ApacheFlume是一个高可靠、高性能的服务，用于收集、聚合和移动大量日志数据。它的架构设计灵活且可扩展，能够适应各种不同的数据源和目的地。一、Flume的核心组件及其任务1.Agent定义：Flume的基本运行单元，是一个独立的进程。功能：负责执行数据采集任务，包含Source、Channel和Sink三个主要部分。2.Source（源）定义：数据进入F
Vue购物车应用实现教程全栈凯哥 vue.js 前端 javascript
文章目录1.项目介绍2.开发环境准备3.设计购物车界面4.创建Vue实例和数据模型5.实现购物车功能5.1从本地存储加载数据5.2监听数据变化保存到本地存储5.3实现全选/反选功能5.4计算选中商品的总价和总数量5.5实现修改商品数量功能5.6实现删除商品功能5.7实现结算功能6.添加样式7.完整代码8.Vue知识点解析8.1数据渲染与绑定8.2条件渲染与列表渲染8.3类与样式绑定8.4事件处理8
【docker安装Oracle11g】顶级小趴菜 docker 容器 oracle
docker安装Oracle11g目录docker安装Oracle11g1.拉取oracle_11g镜像:2.创建Oracle_11g容器:3.查看Oracle容器：4.重启Oracle容器：5.进入oracle11g容器进行配置:5.1切换到root用户下：5.2进入容器环境并修改环境变量：5.3创建软连接：5.4切换到oracle用户并登录sqlplus修改sys、system用户密码:5.5
第5.4章 SLAM实战：使用std::chrono计算传感器消息时间戳行知SLAM 机器人工程师带你入门SLAM unix c++自动驾驶人工智能
在机器人及自动驾驶定位中，传入的IMU和激光的消息都需要判断其数据的正确性，其中，主要会判断消息的开机时间和观测时间，其中开机时间主要通过调用chrono的函数计算，观测时间主要由GPS的时间来获得（GPS观测时间已由上篇文章总结GPS时间计算）。std::chrono是C++11引入的时间处理库，提供了高精度、类型安全且跨平台的时间计算功能。它主要包含三个核心概念：duration：表示时间间隔
计算机网络：DNS解析过程、转发和重定向区别、HTTP发展、HTTPS、GET和POST Tony-1fan 合集计算机网络网络 http java https
文章目录1简述DNS解析过程2转发和重定向的区别3HTTP3.1简述HTTP1.03.2简述HTTP1.1的改进3.3简述HTTP2.0的改进3.4HTTP特点4简述http状态码和对应的信息5HTTPS5.1什么是HTTPS5.2HTTPS的连接过程5.3HTTPS的优点5.4HTTPS的缺点6HTTP与HTTPS的区别7Get与Post区别1简述DNS解析过程客户机发出查询请求，在本地计算机缓
网络安全防护：注入攻击熙客 12_计算机网络 web安全安全
目录1、概念2、核心原理3、主要类型3.1SQL注入3.2OS命令注入3.3跨站脚本-XSS3.4LDAP注入3.5XPath注入3.6代码注入3.7模板注入3.8HTTP头注入3.9日志注入4、危害分析5、防御措施5.1输入验证5.2参数化查询5.3输出编码/转义5.4使用安全API5.5最小权限原则5.6启用安全配置5.7错误处理5.8Web应用防火墙5.9定期安全测试1、概念本质：把用户输入
解锁自动化测试：软件质量的智能钥匙
目录一、自动化测试是什么1.1定义1.2核心概念二、自动化测试的优势2.1提高效率2.2增强一致性2.3扩大测试覆盖率2.4降低成本三、自动化测试的实施步骤3.1精准规划3.2工具甄选3.3用例设计3.4脚本开发3.5结果分析四、自动化测试工具介绍4.1开源工具4.2商业工具4.3API与服务测试工具4.4其他工具五、自动化测试面临的挑战5.1技术难度5.2维护成本5.3缺乏标准5.4缺乏认可六、
Python Cookbook 5文件与IO
目录5.1读写文本数据5.2打印输出至文件中5.3使用其它分隔符或行终止符打印5.4读写二进制数据5.5文件不存在时才能写入5.6字符串的IO操作5.7读写压缩文件5.8固定大小记录的文件迭代5.9读取二进制数据到可变缓冲区中5.10内存映射的二进制文件5.11文件路径名的操作5.12测试文件是否存在5.13获取文件夹中的文件列表5.14忽略文件名编码5.15打印不合法的文件名5.16增加或改变已
项目中枚举与注解的结合使用飞翔的马甲 java enum annotation
前言：版本兼容，一直是迭代开发头疼的事，最近新版本加上了支持新题型，如果新创建一份问卷包含了新题型，那旧版本客户端就不支持，如果新创建的问卷不包含新题型，那么新旧客户端都支持。这里面我们通过给问卷类型枚举增加自定义注解的方式完成。顺便巩固下枚举与注解。一、枚举 1.在创建枚举类的时候，该类已继承java.lang.Enum类，所以自定义枚举类无法继承别的类，但可以实现接口。
【Scala十七】Scala核心十一：下划线_的用法 bit1129 scala
下划线_在Scala中广泛应用，_的基本含义是作为占位符使用。_在使用时是出问题非常多的地方，本文将不断完善_的使用场景以及所表达的含义 1. 在高阶函数中使用 scala> val list = List(-3,8,7,9) list: List[Int] = List(-3, 8, 7, 9) scala> list.filter(_ > 7) r
web缓存基础：术语、http报头和缓存策略 dalan_123 Web
对于很多人来说，去访问某一个站点，若是该站点能够提供智能化的内容缓存来提高用户体验，那么最终该站点的访问者将络绎不绝。缓存或者对之前的请求临时存储，是http协议实现中最核心的内容分发策略之一。分发路径中的组件均可以缓存内容来加速后续的请求，这是受控于对该内容所声明的缓存策略。接下来将讨web内容缓存策略的基本概念，具体包括如如何选择缓存策略以保证互联网范围内的缓存能够正确处理的您的内容，并谈论下
crontab 问题周凡杨 linux crontab unix
一： 0481-079 Reached a symbol that is not expected. 背景： */5 * * * * /usr/IBMIHS/rsync.sh
让tomcat支持2级域名共享session g21121 session
tomcat默认情况下是不支持2级域名共享session的，所有有些情况下登陆后从主域名跳转到子域名会发生链接session不相同的情况，但是只需修改几处配置就可以了。打开tomcat下conf下context.xml文件找到Context标签,修改为如下内容如果你的域名是www.test.com <Context sessionCookiePath="/path&q
web报表工具FineReport常用函数的用法总结（数学和三角函数）老A不折腾 Web finereport 总结
ABS ABS(number):返回指定数字的绝对值。绝对值是指没有正负符号的数值。 Number:需要求出绝对值的任意实数。示例: ABS(-1.5)等于1.5。 ABS(0)等于0。 ABS(2.5)等于2.5。 ACOS ACOS(number):返回指定数值的反余弦值。反余弦值为一个角度，返回角度以弧度形式表示。 Number:需要返回角
linux 启动java进程 sh文件墙头上一根草 linux shell jar
#!/bin/bash #初始化服务器的进程PId变量 user_pid=0; robot_pid=0; loadlort_pid=0; gateway_pid=0; ######### #检查相关服务器是否启动成功 #说明： #使用JDK自带的JPS命令及grep命令组合，准确查找pid #jps 加 l 参数，表示显示java的完整包路径 #使用awk，分割出pid
我的spring学习笔记5-如何使用ApplicationContext替换BeanFactory aijuans Spring 3 系列
如何使用ApplicationContext替换BeanFactory？ package onlyfun.caterpillar.device; import org.springframework.beans.factory.BeanFactory; import org.springframework.beans.factory.xml.XmlBeanFactory; import
Linux 内存使用方法详细解析 annan211 linux 内存 Linux内存解析
来源 http://blog.jobbole.com/45748/ 我是一名程序员，那么我在这里以一个程序员的角度来讲解Linux内存的使用。一提到内存管理，我们头脑中闪出的两个概念，就是虚拟内存，与物理内存。这两个概念主要来自于linux内核的支持。 Linux在内存管理上份为两级，一级是线性区，类似于00c73000-00c88000，对应于虚拟内存，它实际上不占用
数据库的单表查询常用命令及使用方法(-) 百合不是茶 oracle 函数单表查询
创建数据库; --建表 create table bloguser(username varchar2(20),userage number(10),usersex char(2)); 创建bloguser表,里面有三个字段 &nbs
多线程基础知识 bijian1013 java 多线程 thread java多线程
一．进程和线程进程就是一个在内存中独立运行的程序，有自己的地址空间。如正在运行的写字板程序就是一个进程。 “多任务”：指操作系统能同时运行多个进程（程序）。如WINDOWS系统可以同时运行写字板程序、画图程序、WORD、Eclipse等。线程：是进程内部单一的一个顺序控制流。线程和进程 a. 每个进程都有独立的
fastjson简单使用实例 bijian1013 fastjson
一.简介阿里巴巴fastjson是一个Java语言编写的高性能功能完善的JSON库。它采用一种“假定有序快速匹配”的算法，把JSON Parse的性能提升到极致，是目前Java语言中最快的JSON库；包括“序列化”和“反序列化”两部分，它具备如下特征：
【RPC框架Burlap】Spring集成Burlap bit1129 spring
Burlap和Hessian同属于codehaus的RPC调用框架，但是Burlap已经几年不更新，所以Spring在4.0里已经将Burlap的支持置为Deprecated,所以在选择RPC框架时，不应该考虑Burlap了。这篇文章还是记录下Burlap的用法吧，主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成
【Mahout一】基于Mahout 命令参数含义 bit1129 Mahout
1. mahout seqdirectory $ mahout seqdirectory --input (-i) input Path to job input directory(原始文本文件). --output (-o) output The directory pathna
linux使用flock文件锁解决脚本重复执行问题 ronin47 linux lock　重复执行
linux的crontab命令，可以定时执行操作，最小周期是每分钟执行一次。关于crontab实现每秒执行可参考我之前的文章《linux crontab 实现每秒执行》现在有个问题，如果设定了任务每分钟执行一次，但有可能一分钟内任务并没有执行完成，这时系统会再执行任务。导致两个相同的任务在执行。例如： <? // test .php
java-74-数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 bylijinnan java
public class OcuppyMoreThanHalf { /** * Q74 数组中有一个数字出现的次数超过了数组长度的一半，找出这个数字 * two solutions: * 1.O(n) * see <beauty of coding>--每次删除两个不同的数字，不改变数组的特性 * 2.O(nlogn) * 排序。中间
linux 系统相关命令 candiio linux
系统参数 cat /proc/cpuinfo cpu相关参数 cat /proc/meminfo 内存相关参数 cat /proc/loadavg 负载情况性能参数 1）top M：按内存使用排序 P：按CPU占用排序 1：显示各CPU的使用情况 k：kill进程 o：更多排序规则回车：刷新数据 2）ulimit ulimit -a：显示本用户的系统限制参
[经营与资产]保持独立性和稳定性对于软件开发的重要意义 comsci 软件开发
一个软件的架构从诞生到成熟，中间要经过很多次的修正和改造如果在这个过程中，外界的其它行业的资本不断的介入这种软件架构的升级过程中那么软件开发者原有的设计思想和开发路线
在CentOS5.5上编译OpenJDK6 Cwind linux OpenJDK
几番周折终于在自己的CentOS5.5上编译成功了OpenJDK6，将编译过程和遇到的问题作一简要记录，备查。 0. OpenJDK介绍 OpenJDK是Sun（现Oracle）公司发布的基于GPL许可的Java平台的实现。其优点： 1、它的核心代码与同时期Sun（-> Oracle）的产品版基本上是一样的，血统纯正，不用担心性能问题，也基本上没什么兼容性问题；（代码上最主要的差异是
java乱码问题 dashuaifu java乱码问题 js中文乱码
swfupload上传文件参数值为中文传递到后台接收中文乱码在js中用setPostParams（{"tag" : encodeURI( document.getElementByIdx_x("filetag").value，"utf-8")}）; 然后在servlet中String t
cygwin很多命令显示command not found的解决办法 dcj3sjt126com cygwin
cygwin很多命令显示command not found的解决办法修改cygwin.BAT文件如下 @echo off D: set CYGWIN=tty notitle glob set PATH=%PATH%;d:\cygwin\bin;d:\cygwin\sbin;d:\cygwin\usr\bin;d:\cygwin\usr\sbin;d:\cygwin\us
[介绍]从 Yii 1.1 升级 dcj3sjt126com PHP yii2
2.0 版框架是完全重写的，在 1.1 和 2.0 两个版本之间存在相当多差异。因此从 1.1 版升级并不像小版本间的跨越那么简单，通过本指南你将会了解两个版本间主要的不同之处。如果你之前没有用过 Yii 1.1，可以跳过本章，直接从"入门篇"开始读起。请注意，Yii 2.0 引入了很多本章并没有涉及到的新功能。强烈建议你通读整部权威指南来了解所有新特性。这样有可能会发
Linux SSH免登录配置总结 eksliang ssh-keygen Linux SSH免登录认证 Linux SSH互信
转载请出自出处：http://eksliang.iteye.com/blog/2187265 一、原理我们使用ssh-keygen在ServerA上生成私钥跟公钥，将生成的公钥拷贝到远程机器ServerB上后,就可以使用ssh命令无需密码登录到另外一台机器ServerB上。生成公钥与私钥有两种加密方式，第一种是
手势滑动销毁Activity gundumw100 android
老是效仿ios，做android的真悲催！有需求：需要手势滑动销毁一个Activity 怎么办尼？自己写？不用~，网上先问一下百度。结果： http://blog.csdn.net/xiaanming/article/details/20934541 首先将你需要的Activity继承SwipeBackActivity，它会在你的布局根目录新增一层SwipeBackLay
JavaScript变换表格边框颜色 ini JavaScript html Web html5 css
效果查看：http://hovertree.com/texiao/js/2.htm代码如下，保存到HTML文件也可以查看效果： <html> <head> <meta charset="utf-8"> <title>表格边框变换颜色代码-何问起</title> </head> <body&
Kafka Rest : Confluent kane_xie kafka REST confluent
最近拿到一个kafka rest的需求，但kafka暂时还没有提供rest api（应该是有在开发中，毕竟rest这么火），上网搜了一下，找到一个Confluent Platform，本文简单介绍一下安装。这里插一句，给大家推荐一个九尾搜索，原名叫谷粉SOSO，不想fanqiang谷歌的可以用这个。以前在外企用谷歌用习惯了，出来之后用度娘搜技术问题，那匹配度简直感人。环境声明：Ubu
Calender不是单例 men4661273 单例 Calender
在我们使用Calender的时候，使用过Calendar.getInstance()来获取一个日期类的对象，这种方式跟单例的获取方式一样，那么它到底是不是单例呢，如果是单例的话，一个对象修改内容之后，另外一个线程中的数据不久乱套了吗？从试验以及源码中可以得出，Calendar不是单例。测试： Calendar c1 =
线程内存和主内存之间联系 qifeifei java thread
1， java多线程共享主内存中变量的时候，一共会经过几个阶段， lock:将主内存中的变量锁定，为一个线程所独占。 unclock:将lock加的锁定解除，此时其它的线程可以有机会访问此变量。 read:将主内存中的变量值读到工作内存当中。 load:将read读取的值保存到工作内存中的变量副本中。
schedule和scheduleAtFixedRate tangqi609567707 java timer schedule
原文地址：http://blog.csdn.net/weidan1121/article/details/527307 import java.util.Timer;import java.util.TimerTask;import java.util.Date; /** * @author vincent */public class TimerTest {
erlang 部署 wudixiaotie erlang
1.如果在启动节点的时候报这个错： {"init terminating in do_boot",{'cannot load',elf_format,get_files}} 则需要在reltool.config中加入 {app, hipe, [{incl_cond, exclude}]}, 2.当generate时，遇到： ERROR

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他