版本

记录云产品历代版本的功能变更历史,并对下一个版本的研发进度进行预告

最新

V 6.2.1

发布说明
新增功能

• 将平台可观测能力基础设施化,并提供OpenAPI规范接口。 • 支持云产品声明式注册监控数据源和告警规则。 • 支持云产品通过接口获取监控数据,定制开发监控面板。 • 适配平台组织架构,支持监控、告警相关资源的租户隔离。 • 适配ECNF场景,支持用户命名空间下资源的监控告警。 • 支持以告警分组为粒度订阅告警消息,大幅提升告警通知的灵活性。 • 支持数字原生引擎、云产品、用户负载三种不同来源的告警管理。 • 新增告警规则模块,支持查看、启用和禁用操作。 • 新增告警消息模块,支持查看、屏蔽、更新屏蔽和取消屏蔽操作。 • 新增告警分组模块,支持关联告警订阅,按组发送规则产生的告警消息。 • 新增告警订阅模块,支持设置邮箱、webhook地址类型的订阅终端。 • 新增配额管理模块,支持分配告警消息、告警订阅和订阅终端资源的数量。 • 支持对dpdk节点ovs-vswitchd pmd线程使用率的监控告警。 • 支持对dpdk网卡状态的实时告警。 • 支持网络包速率的监控。

优化功能

• 对接平台IAM,重构认证鉴权体系。 • 升级后端组件版本,提升监控告警服务的稳定性。 • 大规模环境下,优化后端组件水平扩展的性能。 • 大规模环境下,支持全局监控数据的关联查询。 • 大规模环境下,降低节点磁盘状态监控的性能消耗。 • 大规模环境下,降低节点时间同步状态监控的性能消耗。 • 完善企业微信、钉钉、短信告警通知的平台信息。 • 去除存储集群健康状态告警消息中的冗余信息。 • 修复平台部分网络进出流量统计数据颠倒的问题。 • 修复平台部分网络流量统计数据周期归零的问题。 • 修复对HPE Nimble存储误报多路径链路残留的问题。 • 修复日志相关告警无法触发的问题。 • 修复告警邮件语言切换失败的问题。 • 修复ECNF场景下,用户负载与EOS服务重名导致的告警误报问题。

V 6.1.1

发布说明
新增功能

• 支持云产品在统一监控中心自注册监控与告警,赋予云产品定制自身可观测性边界的能力。 • 新增针对ETCD的监控告警及页面可视化展示,进一步拓展对平台基础组件的感知能力。 • 磁盘监控支持多raid卡场景。 • 新增集群时间与外部时间服务器不同步的告警,在集群时间不同步时第一时间通知运维人员处理,避免后续因时间不同步可能引起的其它连锁反应。 • 新增对DPDK节点的监控告警,为高性能负载均衡服务的稳定运行提供保障。 • 新增裸金属网关的相关告警,提升软SDN服务的整体可观测性。 • 新增磁盘寿命预测、延迟检测的相关监控告警,存储集群中出现坏盘和慢盘故障时能第一时间触发告警。 • 新增RAID卡故障信息日志的检测告警,支持通过日志感知RAID卡故障的途径。

优化功能

• 监控服务开源生态组件大版本升级,提高服务稳定性,降低内存使用量。 • 优化后端部署形态,简化后端服务组件,降低运维复杂度。 • 告警接口切换到统一监控告警API服务(emla),统一监控和告警的API使用规范。 • 适配托管EKS、ESS升级导致的监控指标变动。 • 优化节点CPU内存相关告警,支持分角色展示告警的具体内容。

权限说明
允许使用持久化存储

V 6.0.3

发布说明
新增功能

• 新增SDN和SR-IOV相关服务的监控、告警、展示。 • 新增网络中断处理进程及SDN相关进程的告警功能。 • 新增网络带宽占用率的告警功能。 • 接管所有监控数据采集客户端,整合到云监控服务中统一管控。

优化功能

• 修复安装部署时导入监控模板到数据库中的任务失败后不会重试的问题。 • 修复某些场景下监控服务因文件权限不足导致的启动失败问题。 • 减小安装包体积。

权限说明
允许使用持久化存储

V 6.0.2

发布说明
新增功能

• 解决监控云产品升级失败的问题。 • 添加安全容器磁盘IO、CPU、内存监控数据采集。 • 添加安全容器节点维度的已分配CPU、内存监控数据统计。 • 屏蔽安全容器存储卷空间使用率告警。

优化功能

• 无。

权限说明
允许使用持久化存储

V 6.0.1

发布说明
新增功能

• 支持OTA式平滑无感安装与升级,可以第一时间获取最新产品能力、修复产品缺陷。 • 分布式存储集群的iops和带宽支持按pool展示。 • 新增一些关键告警,例如多路径残留告警、块存储异常只读告警等。 • 支持通过钉钉、企业微信和短信三种方式获取平台监控告警信息。 • 支持兼容ssacli工具的HP RAID卡。 • 对外开放监控、告警API服务。 • 支持产品化对接Zabbix,Zabbix Server支持范围为V4版本。

优化功能

• 优化了获取rabbitmq状态数据的agent在大规模环境下运行效率。 • 修复了某些异常场景会导致监控数据库启动失败的问题。 • 修复了集群小概率会发送重复告警的问题。 • 提升了磁盘监控脚本中针对特定类型硬盘的兼容性。 • 优化了存储集群实际可用容量统计的精确度。 • 提升针对特定型号服务器获取CPU温度和电压的兼容性。 • 提升了磁盘读写延迟统计的精确性。

权限说明
允许使用持久化存储