Tôi đã phác thảo hành trình của mình để theo dõi nagios phụ thứ hai trên mỗi máy chủ lưu trữ thông qua mỏ muối và check_mk tại đây:
http://garthwaite.org/saltmine_check_mk_agent.html
Bài báo đi qua nhiều tuần và tắt mày mò để làm cho tất cả hoạt động. Tôi sẽ tóm tắt giải pháp:
Tạo mô-đun check_mk tùy chỉnh cho tất cả các tay sai:
#!/usr/bin/env python
''' Support for running check_mk_agent over salt '''
import os
import salt.utils
from salt.exceptions import SaltException
def __virtual__():
''' Only load the module if check_mk_agent is installed '''
if os.path.exists('/usr/bin/check_mk_agent'):
return 'check_mk'
return False
def agent():
''' Return the output of check_mk_agent '''
return __salt__['cmd.run']('/usr/bin/check_mk_agent')
Đặt khoảng thời gian khai thác của minion thành một phút:
salt '*' file.append /etc/salt/minion.d/mine.conf "mine_interval: 1"
Định cấu hình máy chủ giám sát để kéo tất cả đầu ra check_mk_agent của minion vào một tệp json duy nhất, sau đó định cấu hình check_mk để truy vấn tệp đó thay vì bất kỳ truy vấn mạng nào. Tất cả được thực hiện với đoạn script sau trên minion giám sát:
#!/usr/bin/env python
import sys
import json
import fcntl
DATAFILE="/dev/shm/cmk.json"
NAG_UID = 105
NAG_GID = 107
def do_update():
import os
import salt.client
caller = salt.client.Caller()
data = caller.function('mine.get', '*', 'check_mk.agent')
lockfile = open(DATAFILE+".lock", "w")
fcntl.flock(lockfile, fcntl.LOCK_EX)
datafile = open(DATAFILE, "w")
datafile.write(json.dumps(data))
for f in (DATAFILE, DATAFILE+".lock"):
os.chmod(f, 0644)
os.chown(f, NAG_UID, NAG_GID)
def get_agent(minion):
lockfile = open(DATAFILE+".lock", "w")
fcntl.flock(lockfile, fcntl.LOCK_SH)
data = json.load(file(DATAFILE))
return data[minion]
if __name__ == '__main__':
if len(sys.argv) != 2:
print "Usage: mine_agent.py --update | <minion id>"
elif sys.argv[1] in ['--update', '-u']:
do_update()
else:
minion = sys.argv[1]
print get_agent(minion)
Cập nhật mỗi phút:
$ cat /etc/cron.d/retrieve_mined_minion_data
*/1 * * * * root /etc/check_mk/mine_agent.py --update
Cuối cùng: Thay đổi nguồn dữ liệu cho tất cả các mục tiêu nagios trong /etc/check_mk/main.mk:
datasource_programs = [
( '/etc/check_mk/mine_agent.py <HOST>', ['mine'], ALL_HOSTS ),
]