Đầu tiên, tôi phải hỏi: "tắt máy"? Bạn có nghĩa là máy khởi động lại hoặc nó thực sự dừng lại? Nếu nó dừng, nó bị cấu hình sai (có lẽ trong BIOS) hoặc một cái gì đó đang tích cực tắt máy (tức là init 0).
Nếu không, ứng cử viên chính của bạn sẽ là / var / log / syslog và /var/log/kern.log vì vấn đề của bạn có vẻ như hoảng loạn hạt nhân hoặc lỗi phần cứng do phần mềm kích hoạt. Tất nhiên, nếu máy chủ chạy một số dịch vụ (ví dụ apache) cũng có thể cung cấp cho bạn manh mối.
Thông thường, trong các tình huống như thế này, có các mục nhật ký được tạo, nhưng vì máy gặp khó khăn, nó sẽ không quản lý để ghi các mục vào đĩa. Nếu hộp được đặt, có khả năng nó được kết nối với bảng điều khiển nối tiếp bởi đối tác colo. Đó là nơi tôi sẽ tìm nếu tôi không tìm thấy điều gì khả nghi trong nhật ký trên.
Nếu máy không được kết nối với bàn điều khiển nối tiếp và không có gì trong nhật ký, bạn có thể muốn xem xét gửi syslog đến một hộp khác qua mạng. Có lẽ giao diện mạng tồn tại lâu hơn một chút và thông điệp tường trình có thể được đọc trên máy chủ nhật ký hệ thống. Có một cái nhìn tại rsyslog hoặc syslog-ng.
CẬP NHẬT:
Tôi đồng ý với @Johann bên dưới. Nguyên nhân rất có thể của dừng là bộ theo dõi nhiệt độ bộ xử lý. Hãy thử kiểm tra / vẽ nhiệt độ trong hộp thông qua lmsensors hoặc smartctl (thường là dễ nhất). Tôi thấy rằng colld là vô song trong việc theo dõi số lượng lớn các biến theo thời gian. Nó có thể làm cả IPMI và cảm biến lm và hddtemp. Ngoài ra, một số BIOS: es đăng nhập nhiệt độ sự kiện.