如何使用 Opserver 來監控 Windows Server

之前文章 如何使用 Opserver 來監控 Redis 介紹該怎麼設定 Opserver for Redis,如何使用 Opserver 來監控 Elasticsearch 介紹如何設定 Opserver for Elasticsearch ,接著就來看看該如何使用 Opserver 監控 Windows Server

文章大綱

  1. 安裝 Opserver
  2. Opserver 安全性設定
  3. 監控 Windows Server

安裝 Opserver

  1. clone

  2. 解壓縮至硬碟

  3. 設定啟始專案

    • 預設為 Opserver.Core

      1error

    • Opserver 專案,按右鍵,選 Set as StartUp Project

      2startup

  4. 編譯 (Build)

Opserver 安全性設定

  • 沒找到 SecuritySettings.config 的錯誤 3needconfig

  • 加入 SecuritySettings.config

    • Opserver 專案, Config 資料夾下有 SecuritySettings.config.example

      4securityconfig

    • rename SecuritySettings.config.exampleSecuritySettings.config

    • 依需求設定權限(/about可以檢查現行安全設定)

      • AD (default)

        <SecuritySettings provider="AD" />

        5AD

      • alladmin

        <SecuritySettings provider="alladmin" />

        6alladmin

      • View All

        <SecuritySettings provider="" />

        7viewall

    • 如果不是使用 AD ,畫面需要帳號密碼,請使用 admin/admin

      login

監控 Windows Server

  • 加入 DashboardSettings.json

    • Opserver 專案, Config 資料夾下有 DashboardSettings.json.example

      1setting

    • rename DashboardSettings.json.exampleDashboardSettings.json

  • DashboardSettings.json 設定連線資訊 providers

    • wmi 為例

      • nodes 可以有多台,可以填 servername 或是 ip
      • StaticDataTimeoutSeconds 是靜態資料(e.g. node 名稱,及磁碟 size) cache 秒數,預設是 300 秒
      • DynamicDataTimeoutSeconds 是動態資料 (e.g. CPU load) cache 秒數,預設是 30 秒
      • HistoryHours 紀錄保留時間,預設 2 小時
      • Username 遠端電腦的使用者帳號
      • Password 達端電腦的使用者密碼
      {
          "providers": {
              "wmi": {
              "nodes": [ "192.168.1.1","192.168.2.1" ],
              "staticDataTimeoutSeconds": 300,
              "dynamicDataTimeoutSeconds": 5,
              "historyHours": 2,
              "Username": "AD\\username",
              "Password": "password"
              }
          }
      }
      
  • 靜態資料 cache 時間 (StaticDataTimeoutSeconds)

    預設值可以參考 \Opserver.Core\Settings\DashboardSettings.WMI.cs

    • 預設 300 秒
  • 動態資料 cache 時間 (DynamicDataTimeoutSeconds)

    預設值可以參考 \Opserver.Core\Settings\DashboardSettings.WMI.cs

    • 預設 30 秒
  • 紀錄保留時間 cahce 時間 (HistoryHours)

    預設可以參考 \Opserver.Core\Settings\DashboardSettings.WMI.cs

    • 預設 2 小時
  • 設定警戒值

    key說明
    cpuWarningPercentcpu 用量警戒(黃色)
    cpuCriticalPercentcpu 用量危急(紅色)
    memoryWarningPercent記憶體 用量警戒(黃色)
    memoryCriticalPercent記憶體 用量危急(紅色)
    diskWarningPercent磁碟空間 用量警戒(黃色)
    diskCriticalPercent磁碟空間 用量危急(紅色)
  • 設定監控 server 分群

    • 利用 regular expression 解析 server name 來分群
    • 也可以依群組個別設定 警戒值

      "categories": [
          {
          "name": "DEV Web Servers",
          "pattern": "192.168.1.*",
          "cpuWarningPercent": 25,
          "memoryWarningPercent": 65,
          "memoryCriticalPercent": 75
          },
          {
          "name": "Localhost Web Servers",
          "pattern": "192.168.2.*",
          "cpuWarningPercent": 25,
          "memoryWarningPercent": 75
          }
      ],
      

監控結果

2result

心得

只能使用同一組帳號密碼,比較難符合現實需求,但 open source 的好處就是不足的地方可以自行修改

20170612 補充: Server 離線

  • Server 離線會以下特徵

    1. 主機名稱跟主機圖示會變成黃燈
    2. 該離線主機所有資訊也會加上黃底

    3offline

參考資料

  1. Opserver GitHub
  2. 如何使用 Opserver 來監控 Redis
  3. 如何使用 Opserver 來監控 Elasticsearch