SKIL/开始/发行说明

发行说明

SKIL 1.2.1

特点和改进

  • “关于”页现在显示许可证到期日期。
  • 更新页面以便在许可证过期时更新许可证。
  • 内部API更改以获得更稳定的用户界面体验。
  • 添加了“支持zip按钮”,用于共享系统信息、日志和流程信息,以获得更好的客户支持。
  • 修复了pyspark和spark不匹配的库。
  • 安spark无需安装7zip。
  • 添加expirationDate以获取许可证端点 GET /license
  • 许可证页的Loading指示器。
  • 模型服务器v2(管道)的前端更改。
  • 修复了Ubuntu Docker对/var/skil的镜像权限。

已知问题

  • 用于保存数据的Docker镜像在操作系统上占用大量存储空间。这将很快在以后的版本中得到修复。
  • SKIL Launcher(bundle)不适用于Linux。

SKIL 1.2.0

特点和改进

  • 新的集中日志获取系统。
  • 模型服务器版本控制和回滚。
  • 用于监控正在运行的训练和批量推理作业的新作业系统和用户界面。
  • 部署中的模型服务器度量仪表板。
  • 通过Beam解释器增加了基于Java的笔记本的支持。
  • 下一代基于管道的模型服务器。
    • PMML实现增加了对Scikit-learn、XGBoost和许多R、Spark和SAS模型的支持。
    • 完全可定制的输入前置处理器和输出后置处理器。
    • 高效的内存映射向量查找。
    • 更高的TensorFlow模型的吞吐量。
    • 支持二进制numpy数组和支持输入输出的apache arrow。
    • 支持目标检测端点中的自定义类标签。
    • 能够通过反馈在模型服务器内重新训练模型。
  • 增加了对Windows、Mac和Debian/Ubuntu的支持。
    • 包括一个简单的基于GUI的启动程序。
  • 企业版现在可以支持Active Directory/LDAP进行身份验证。
  • 创建了简化的python API。
  • 社区版许可证现在支持10个模型服务器而不是2个,工作间现在不受限制。

已知问题

  • install-python.bat脚本中的Deactivate调用有时会导致以下错误:

  • \miniconda\Scripts\deactivate' is not recognized as an internal or external command,
    operable program or batch file.
    
    
    image.gif

    可以安全地忽略这个错误并继续使用SKIL。这将在以后的版本中修复。

  • 在Zeppelin上运行%pyspark脚本时,有时会看到pyspark没有响应错误。将这些问题连同 /logs文件夹下的skil日志文件一起报告给我们。我们正在积极地为以后的版本解决这个问题。

SKIL 1.1.2

特点和改进

  • 为大型TensorFlow模型添加性能改进。

SKIL 1.1.1

特点和改进

  • skil-server-miniconda现在安装了非GPU版本的python库,这样它们就可以与CPU一起使用了。要在安装了CUDA的服务器上的那些库中启用GPU,请安装与安装的CUDA版本相应的-GPU版本。
  • 更新默认笔记本以展示训练DL4J和Keras模型。
  • 复制的模型服务器URL现在与客户端API兼容。

已知问题

  • Docker 容器有时会下载zeppelin解释器,即使它们已经包含在内。在访问工作间之前,请等待下载完成。查看消息“About to join jetty web server”,了解Zeppelin何时准备就绪。

SKIL 1.1.0

特点和改进

  • 大量的错误和性能修复。
  • 更新为DL4J 1.0.0-beta,运行在CUDA 9.1上的TensorFlow 1.7用于模型服务器,TensorFlow 1.8用于Zeppelin笔记本。
  • 用于管理大量部署和实验的各种UI改进。
  • 用于SKIL集群的集中配置和管理UI。
  • 添加了模型服务器API。
    • 支持目标检测模型,如yolo和ssd。
    • 支持具有多个输入和输出的模型。
    • 对需要输入掩码的循环网络的扩展支持。
  • 支持使用压缩图像作为神经网络的输入,服务器端自动调整大小和归一化。
  • 从SKIL中打开笔记本将自动登录到Zeppelin。
  • 在外部或云Spark集群上使用DL4J进行Spark训练和推理。
  • 嵌入式ZooKeeper现在是持久的,可以在集群模式下使用。
  • TensorFlow模型服务器现在在GPU上运行(如果可用)。

已知问题

  • 捆绑式miniconda安装错误地需要CUDA。如果遇到此问题,请升级到1.1.1版。
  • TensorFlow模型服务器不支持Workers>1。
  • 当给定损坏的模型时,模型服务器不会总是进入失败状态。
  • 升级后的TensorFlow版本导致ONNX库加载失败。将在稍后的ONNX版本中修复。
  • 日志包含有关许可和端口冲突的良性错误。这将在下面的小版本中解决。

SKIL 1.0.3

特点和改进

  • 负载均衡器不会在多节点部署中更新模型服务器URL。
  • MNIST数据集在benchmark.deeplarn.online上不再可用(数据集将嵌入到RPM中)。
  • 模型服务器负载均衡器性能改进。

SKIL 1.0.2

特点和改进

  • 现在支持用于推理的多节点SKIL安装。
  • 完全离线可安装的RPM。
  • 添加了进程的显示名称。
  • 能够自定义默认zeppelin服务器的配置。
  • 可配置的日志。
  • 许多小的用户界面和可用性改进。

已知问题

  • 停止部署可能会导致工作区中出现临时错误。只需再次尝试该操作就可以消除错误。
  • 目前无法从实验中删除带有附加评估结果的模型。
  • SKIL中嵌入的ZooKeeper将数据存储在内存中,重新启动SKIL服务器将在工作间和部署中导致错误。建议使用外部Zookeeper。

你可能感兴趣的:(SKIL/开始/发行说明)