系统健康

监控系统组件状态

系统健康概述

OpenClaw 的健康检查系统监控所有关键组件的状态,确保系统正常运行。

健康检查提供实时指标和警报,帮助您及时发现和解决问题。

健康检查指标

系统资源

  • CPU 使用率: 监控处理器负载
  • 内存使用: 跟踪内存消耗和可用内存
  • 磁盘空间: 监控存储使用情况
  • 网络连接: 检查网络状态和带宽

服务状态

  • 数据库连接: 检查数据库连接池状态
  • 模型 API 可用性: 验证 AI 模型服务连接
  • 消息队列: 监控消息处理状态
  • 通道服务: 验证各消息通道可用性

API 健康端点

通过 HTTP 端点获取系统健康信息:

GET /api/health

响应示例:

{
  "status": "healthy",
  "timestamp": "2023-12-01T10:00:00Z",
  "checks": {
    "database": {
      "status": "pass",
      "responseTime": 25
    },
    "models": {
      "status": "pass",
      "providers": {
        "openai": "pass",
        "anthropic": "pass"
      }
    },
    "storage": {
      "status": "pass",
      "freeSpace": "125GB"
    },
    "network": {
      "status": "pass",
      "connectivity": "ok"
    }
  },
  "details": {
    "version": "1.0.0",
    "uptime": "2 days, 14:30:15",
    "activeUsers": 12,
    "pendingJobs": 3
  }
}

自动恢复机制

故障检测

自动检测服务故障并记录问题详情。

恢复尝试

根据配置策略自动尝试恢复故障的服务。

通知系统

当检测到严重问题时,通过配置的通知渠道发送警报。