kettle入门之文本文件输入

文本文件输入控件由: 文件,内容,错误处理,过滤,字段,其他输出字段Tap页组成,适用于读取txt与csv文件
kettle入门之文本文件输入_第1张图片

文件: 主要(常用)功能选择文件,添加文件,预览文件

kettle入门之文本文件输入_第2张图片

内容:  主要用于配置分割字符, 行号,字符编码 以及过滤头尾行

kettle入门之文本文件输入_第3张图片

 

文本限定符: 让分隔符能以文本的形式正常解析

kettle入门之文本文件输入_第4张图片

错误处理

过滤: 可以简单过滤一些我们不需要的数据.不过每次过滤都是一行数据.并不是单个数据

过滤字符串: 只支持字符串 不支持正则
        过滤器位置: 暂不清楚填写规则 不填默认全局过滤
       停止在过滤器: 是与否 是的话 就停在过滤器的位置
        积极匹配: 感觉翻译有问题, 是/否 是: 将符合过滤器的数据保留, 否: 不保留符合过滤器的数据
kettle入门之文本文件输入_第5张图片

字段: 为读取的列起名字, 确定类型,格式化等.类似于我们定义实体

kettle入门之文本文件输入_第6张图片

 

  1. 名称: 通常通过点击获取字段自动获取也可以通过手动自定义;
  2. 类型: 总共有9种,按照需要选取
  3. 格式: 按照需要选取所需要的数字与日期格式
  4. 长度: 用于浮点数等长度的约定默认会按照目前目前的最大长度选取
  5. 货币类型: 顾名思义
  6. 小数:暂时不清楚如何使用;
  7. 分组:暂时不清楚如何使用;
  8. Null if : 是否为空, 基本上不用选,可以用于简单的校验数据
  9. 默认 :  暂时不清楚如何使用;
  10. 去除空字符串方式, 去除左端 右端 两头都去除空格
  11. 重复:  暂不清楚

其他输出字段: 主要包含一些文件名路径的展示
kettle入门之文本文件输入_第7张图片

未完待续.....

你可能感兴趣的:(kettle,#,输入,java,etl)