模型自动化运行利器——IBM SPSS Modeler Batch

背景介绍

很多用户都会关注一个问题,就是模型创建完成之后,如何自动化运行模型,因为不可能每次要运行都要打开SPSS Modeler客户端,点击“运行”,那么今天这篇文章就给大家介绍下通过IBM SPSS Modeler Batch批处理模式实现自动化运行模型的过程。

IBM SPSS Modeler Batch可以实现不需要打开IBM SPSS Modeler客户端,不需要用户干预就可以自动地周期性地运行任务, 需要注意的是,IBM SPSS Modeler Batch必须是有购买IBM SPSS Modeler Server才能够附带有的功能。

批处理模式简介

适用于批处理模式的任务包括:

  • 在后台运行比较耗时的建模训练;
  • 在计划的时间(例如在夜间,此时计算机上的任务运行不影响白天的服务器资源占用)运行预测任务;
  • 针对大量数据运行数据预处理(例如在后台或夜间运行);
  • 运行定期的计划任务,例如每周/月报告;

在批处理模式下工作

在批处理模式下工作通过包括:

  • 使用clemb命令以批处理模式调用IBM SPSS Modeler
  • 连接到服务器
  • 加载现有的流或脚本文件
  • 执行流或脚本

实例介绍

3.使用Windows操作系统的计划任务程序调用druglearn.bat文件。

以下介绍最常用的连接IBM SPSS Modeler服务器,调用.str流文件自动执行的实现步骤。

1.使用IBM SPSS Modeler 创建了流文件 druglearn.str,并保存在C:\wing目录下。

该数据流文件中,源是数据库,最终分析结果是导出到Excel文件。

2.编写batch文件,先打开文本编辑器,输入以下内容,并以 .bat为后缀保存起来。

clemb -hostname myserver -port 80 -username dminer -password 1234 -stream"C:\wing\druglearn.str"-P:databasenode.datasource={"POC",sa,123456,true} -execute -logreport32.log

以下对每个参数进行解释:

  • clemb是调用命令;
  • server是连接的IBM SPSS Modeler服务器名称
  • port是连接的IBM SPSS Modeler服务器端口号
  • username是登陆IBM SPSS Modeler服务器用户名
  • password是登陆IBM SPSS Modeler服务器密码
  • stream是指向要调用的流文件(包括路径和流文件名称)
  • P:databasenode.datasource是流文件中,源节点数据库连接所需要的信息,包括ODBC连接配置的名称、数据库用户名、数据库登陆密码
  • excute是表示执行
  • log表示输出日志文件到report32.log

在每个参数前面,都以符号“-”分隔。

在触发器面板上,设置为每周六晚上22:00执行,如下图

在操作面板上,选择刚才保存好的druglearn.bat文件。

确定后则完成了设置计划任务。

其它参数内容

IBM SPSS Modeler Batch所使用的参数可以非常灵活,除了我们实例中用到的命令参数,还可以是流文件中自定义的参数,想了解更多内容,可在网站上下载试用IBM SPSS Modeler并查看相关的用户手册。

via:华南IBM大数据支持团队


你可能感兴趣的:(数据分析)