Làm cách nào để biết đĩa bị lỗi trên ESXi / những lỗi này có ý nghĩa gì?


10

Tôi có một máy chủ chạy VMware ESXi v4.1.0 348481. Nó có RAID10 phần cứng và ổ đĩa sao lưu SATA. Tôi có một máy ảo đang chạy, nó có vmdk khởi động chính trên kho dữ liệu RAID10 và vmdk 600 GB trên kho dữ liệu của ổ đĩa sao lưu SATA. VM chạy Debian linux với kernel FreeBSD và sử dụng ZFS cho ổ đĩa sao lưu.

EDIT: Ổ đĩa không được gắn trực tiếp vào VM. Nó được sử dụng như một Kho dữ liệu VMware và VM có vmdk trên kho dữ liệu của ổ đĩa SATA. Kho dữ liệu không đầy đủ (chỉ đầy đủ 65%)

Tôi đã đăng nhập vào máy chủ bằng SSH và thấy rằng bản sao lưu tối qua đã bị treo và zfs listhoặc zpool listcả hai đều bị treo. Vì vậy, tôi đã mở giao diện điều khiển ảo trong ESXi và rất buồn khi thấy:

Ảnh chụp màn hình này làm tôi buồn

(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)

Tôi đã cố gắng khởi động lại VM và tôi nhận được một thông báo rằng hệ thống sẽ ngừng hoạt động để khởi động lại, và sau đó bị treo. (^ C xuất hiện nhưng không giết shutdown). Tôi không thể ngắt hoặc kill -9các zpool list zfs listhoặc rsynccác quá trình - Không có gì xảy ra khi tôi cố gắng.

  1. Điều này cho thấy ổ đĩa SATA dự phòng bị lỗi? Hoặc đây có thể chỉ là một lỗi ESXi?
  2. Làm thế nào trong ứng dụng khách vSphere tôi có thể biết nếu ổ đĩa bị lỗi? Tôi không thấy bất kỳ dấu hiệu nào, mọi thứ trong Trạng thái Sức khỏe Phần cứng đều tốt và tôi không thấy gì trong Cấu hình lưu trữ.
  3. Làm thế nào tôi nên tiến hành từ đây? Tôi có nên khởi động lại VM không?

CẬP NHẬT: Tôi chỉ khó khởi động lại VM. Sau khi nó trở lại trực tuyến, tuy nhiên, zpool dự phòng đã trực tuyến:

root@timestandstill:/home/jnet# zpool status -v
  pool: backup
 state: ONLINE
status: One or more devices has experienced an error resulting in data
        corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
        entire pool from backup.
   see: http://www.sun.com/msg/ZFS-8000-8A
 scrub: none requested
config:

        NAME        STATE     READ WRITE CKSUM
        backup      ONLINE       0     0     0
          da1       ONLINE       0     0     0


errors: Permanent errors have been detected in the following files:

        /backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics

Tôi đang nghiêng rất nhiều về việc thay thế ổ đĩa ...

Câu trả lời:


5

Những lỗi đó thực sự chỉ ra rằng một trong các ổ đĩa SATA đã gặp đủ các khối xấu để hết dung lượng phân bổ lại khối. Ổ đĩa đó là xấu, và cần phải được thay thế. Tôi không chắc chắn nơi khách hàng vSphere có thông tin được hiển thị, nhưng các mục nhật ký khá rõ ràng.

Nếu phần cứng của bạn cho phép nó, một trao đổi nóng sẽ được thực hiện. Nếu không, bạn sẽ phải tắt mọi thứ để thực hiện thay đổi. Nếu máy ảo đó không tự tắt sau 30 phút, đã đến lúc chỉ cần chấm dứt nó. Đó là rủi ro, nhưng nếu nó thực sự được treo thì không có gì nhiều cho nó.


Cảm ơn @ sysadmin1138. Vì vậy, mặc dù những lỗi đó hiển thị bên trong VM, nhưng rõ ràng nó chỉ ra một vấn đề phần cứng thực sự? IE không chỉ là một số trò chơi VMware?
Josh

@Josh Nếu bạn đã trình bày trực tiếp ổ đĩa SATA cho VM, thì bạn chắc chắn sẽ thấy điều đó. Đối với lưu trữ được hỗ trợ tệp, tôi ít chắc chắn hơn; nó có thể là kho dữ liệu của bạn đã hết dung lượng.
sysadmin1138

Tôi nên làm rõ điều đó. Nó là lưu trữ được hỗ trợ tập tin. Kho dữ liệu có nhiều dung lượng: đó là ổ 1TB và VMDK là 600 GB, không có gì khác trên đĩa. Dù bằng cách nào, đó rõ ràng là một cái gì đó sai, vì vậy trừ khi người khác cho tôi một lời giải thích rõ ràng về những gì có thể, tôi sẽ thay thế ổ đĩa.
Josh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.