v14.2.5 Nautilus 发布

Nautilus v14.2.5发布

这是Ceph Nautilus版本系列的第五个版本。在许多值得注意的更改中,此版本修复了
14.2.3 中引入的严重BlueStore错误。建议所有Nautilus用户升级到此版本。

显着的变化¶

关键修复:

  • 此版本修复了一个重要的BlueStore错误,该错误在14.2.3中引入(并且在14.2.4中也存在),当使用单独的“ WAL”设备时,该错误可能导致数据损坏。

新的健康警告:

  • 如果守护程序最近崩溃,Ceph现在将发出运行状况警告。
    自Nautilus最初发布以来,Ceph 就一直在收集崩溃报告,但是
    运行状况警报是新的。要查看新的崩溃(或所有崩溃,如果您刚刚
    升级的话):

    ceph crash ls-new
    

    要确认特定的崩溃(或所有崩溃)并使运行状况警告静音:

    ceph crash archive-all
    
  • 如果RADOS池的pg_num 值不是2的幂,Ceph现在将发出健康警告。可以通过将池调整为附近的2的幂来解决此问题:

        ceph osd pool set  pg_num 
    

    或者,可以通过以下方式使警告静音:

    ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false
    
  • 如果将RADOS池的size设置为1,
    或者换句话说,如果该池配置为没有冗余,则Ceph将发出健康警告。
    如果池大小设置为最小
    建议值,则Ceph将停止发出警告:

    ceph osd pool set  size 
    

    可以通过以下方式使警告静音:

    ceph config set global mon_warn_on_pool_no_redundancy false
    
  • 如果平均osd心跳ping
    时间超过所计算的任何间隔的可配置阈值,现在就会生成健康警告。OSD计算平均值,最小值和最大值的1分钟,5分钟和15分钟间隔。新的配置选项mon_warn_on_slow_ping_ratio指定的百分比osd_heartbeat_grace来确定阈值。零值将禁用警告。 以毫秒为单位指定的新配置选项mon_warn_on_slow_ping_time会 覆盖计算值,并在OSD心跳ping花费的时间超过指定的数量时引发警告。
    新的管理命令ceph守护程序mgr。

      #dump_osd_network [阈值],
    

将列出所有ping时间长于config选项确定的指定阈值或值的所有连接,以3个间隔中任意间隔的平均值为准。
另一种新的管理命令,ceph daemon OSD。

#dump_osd_network [门槛],

将做由指定的OSD开始同时但只包括心跳。

telemetry 模块中的更改:

  • telemetry 模块现在具有默认启用的“设备”通道,该通道将向telemetry.ceph.com报告匿名的硬盘和SSD健康指标,以构建和改进设备故障预测算法。由于telemetry 报告的内容已更改,因此您需要通过以下方式重新选择加入

    ceph telemetry on
    

您可以通过以下方式确切查看将首先报告哪些信息:

  ceph telemetry show
  ceph telemetry show device   # specifically show the device channel

如果您不愿意共享设备指标,则可以先停用该频道,然后再重新启用:

ceph config set mgr mgr/telemetry/channel_device false
ceph telemetry on
  • telemetry 模块现在报告有关CephFS文件系统的更多信息,
    包括:

    • 多少个MDS守护程序(总计和每个文件系统)
    • 启用(或已启用)哪些功能
    • 多少个数据池
    • 文件系统的大致年龄(年份+创建月份)
    • 多少个文件,字节和快照
    • 缓存了多少元数据

    我们还添加了:

    • 监视器正在运行哪个Ceph版本
    • 监视器是否使用msgr v1或v2地址
    • 监视器使用的是IPv4还是IPv6地址
    • 是否启用RADOS缓存分层(以及哪种模式)
    • 是否复制池或对擦除进行编码,以及
      正在使用哪个擦除代码配置文件插件和参数
    • 集群中有多少台主机,每种类型的守护程序有多少台主机
    • 是否正在使用单独的OSD群集网络
    • 集群中有多少个RBD池和映像,以及有多少个池启用了RBD镜像
    • 存在多少个RGW守护程序,区域和区域组;正在使用哪些RGW前端
    • 有关CRUSH映射的汇总统计信息,例如使用了哪些算法,有多少个
      存储桶,定义了多少个规则以及
      使用了什么可调参数

    如果启用了telemetry 功能,则需要使用以下选项重新加入:

    ceph telemetry on
    

    您可以通过以下方式确切查看将首先报告哪些信息:

    ceph telemetry show        # see everything
    ceph telemetry show basic  # basic cluster info (including all of the new info)
    

OSD:

  • 一个新的OSD守护程序命令“ dump_recovery_reservations”显示
    在优先级队列中持有的(in_progress)和等待中的恢复锁。
  • 另一个新的OSD守护程序命令“ dump_scrub_reservations”显示了
    为本地(主要)和远程(副本)PG保留的清理保留。

RGW:

  • RGW现在支持S3对象锁API集,允许使用WORM模型
    存储对象。添加了6个新的API,放置/获取存储桶对象锁定,
    放置/获取对象保留,放置/获取对象合法保留。
  • RGW现在支持列表对象V2

你可能感兴趣的:(v14.2.5 Nautilus 发布)