Có một vấn đề ở đây trên Cụm chuyển đổi dự phòng Windows Server 2016 (WSFC) lưu trữ Trường hợp cụm chuyển đổi dự phòng SQL (FCI) sử dụng Storage Spaces Direct (S2D). Trên mỗi máy chủ, sau khi tạo thành công ban đầu, S2D sẽ tự động thêm một ổ RAID không được sử dụng vào nhóm lưu trữ (mặc dù S2D không thể được tạo trên các ổ RAID và hoàn toàn nhấn mạnh vào các đĩa không được bảo vệ). Bây giờ nó đã bị hỏng, do - theo như tôi có thể tìm ra - chính xác là như vậy. Kết quả là, đĩa ảo đang ngoại tuyến, lấy toàn bộ cụm xuống với nó. Nó sẽ không trở lại trực tuyến, do một nguồn tài nguyên mạng cụm bị thiếu. Các đĩa trong câu hỏi có thể được nghỉ hưu nhưng không được gỡ bỏ. Sửa chữa đĩa ảo không chạy, kiểm tra tương thích cụm xác nhận cấu hình không hợp lệ.
Đây là một thiết lập mới. Vì vậy, tôi chỉ có thể xóa đĩa ảo, cụm hoặc thậm chí các máy chủ và bắt đầu lại. Nhưng trước khi chúng tôi làm việc hiệu quả, tôi cần đảm bảo, điều này không bao giờ xảy ra nữa. Hệ thống tự bắn vào đầu gối ảo bị dừng chỉ bằng cách thêm một cách không cần thiết và thêm một đĩa không được hỗ trợ là không có nền tảng nào chúng ta có thể triển khai. Vì vậy, chủ yếu tôi cần một cách để ngăn chặn điều này xảy ra, thay vì sửa chữa nó ngay bây giờ. Tôi đoán là việc ngăn chặn một thiết lập S2D lấy nhiều đĩa hơn so với nó được tạo ra sẽ thực hiện thủ thuật. Chi phí tương tác thủ công nhiều hơn trong quá trình thay thế đĩa thực không đáng kể so với clusterf ... chúng tôi có ở đây. Nhiều khi tôi duyệt tài liệu cho đến nay, tuy nhiên, tôi không thể tìm ra cách nào để kiểm soát điều đó. Trừ khi tôi thiếu thứ gì đó, cả Set-StoragePool,
Bất kỳ trợ giúp hoặc gợi ý sẽ được đánh giá rất cao.
Sau đây chỉ là thông tin chi tiết ở trên: Chúng tôi có 2 máy chủ HPE DL380 Gen9 được kết nối với nhau thông qua Ethernet 10GB có khả năng RDMA và qua 1GB vào mạng máy khách. Mỗi tính năng một bộ điều khiển RAID HP ??? và bộ điều khiển HBA đơn giản HP ??? (vì S2D hoàn toàn yêu cầu và chỉ hoạt động trên các đĩa được gắn trực tiếp, không gắn thẻ). Cấu hình lưu trữ bao gồm OS-RAID trên bộ điều khiển RAID, Files-RAID trên bộ điều khiển RAID và bộ đĩa được gắn trực tiếp trên HBA dành cho S2D.
Tôi đã thiết lập 2 phiên bản trung tâm dữ liệu Windows Servers 2016 trên OS-RAID, đã cài đặt tính năng WSFC, chạy và vượt qua kiểm tra khả năng tương thích cụm bao gồm tùy chọn S2D, tạo cụm mà không lưu trữ, thêm nhân chứng chia sẻ tệp (trên một máy riêng biệt), bật S2D trên nhóm lưu trữ, tự động bao gồm tất cả các đĩa không có ổ đĩa và trên đỉnh của nhóm đó đã tạo một đĩa ảo loại gương và sử dụng NTFS làm hệ thống tệp, vì đây được coi là lựa chọn của FS cho SQL FCI cài đặt.
Sau đó, tôi đã cài đặt phiên bản tiêu chuẩn SQL 2016 dưới dạng FCI trên cụm đó, nhập cơ sở dữ liệu và kiểm tra tất cả. Mọi thứ đều ổn Cơ sở dữ liệu ở ngay đó và nhanh hơn bao giờ hết. Buộc cũng như chuyển đổi dự phòng tự động là một làn gió. Mọi thứ đều tốt
Ngày hôm sau, chúng tôi đã cố gắng sử dụng các Tệp-RAID còn lại. Điều đầu tiên là thay đổi cấp độ RAID vì chúng tôi không thích cấu hình trước. Ngay sau khi xóa khối lượng RAID được cấu hình sẵn và xây dựng một khối mới (trên mỗi máy chủ), chúng tôi đã phát hiện ra rằng cụm bị hỏng. Từ những gì tôi có thể tìm ra cho đến nay, khối lượng Tệp-RAID được cấu hình sẵn trong thời gian đó đã được tự động thêm vào nhóm và khi chúng tôi vừa xóa nó, nó đã bị mất khỏi nhóm. Trong khi tôi kiểm tra, tôi đã tìm thấy Files-RAID mới, trong khi vẫn đang được tạo, cũng đã được hiển thị dưới dạng ổ đĩa vật lý của nhóm. Vì vậy, nhóm hiện bao gồm 2 khối RAID trên mỗi máy chủ, một trong số đó thậm chí không tồn tại. Các ổ đĩa này (nhưng không phải đĩa của chúng) được liệt kê bởi Get-PhysDisk cùng với các đĩa vật lý thực sự trên HBA, không chắc đó có phải là thường xuyên không.
Tôi đã có thể rút các đĩa vật lý đó (tức là những đĩa thực sự là ổ RAID) và hiện tại chúng được đánh dấu là đã nghỉ hưu. Nhưng họ vẫn ở trong hồ bơi và tôi không thể loại bỏ chúng ngay bây giờ, cố gắng để làm điều đó thất bại. Repair-VirtualDisk sẽ xây dựng lại đĩa ảo về trạng thái phù hợp trên chỉ các đĩa còn lại (Tôi đã thực hiện điều này: https://social.technet.microsoft.com/Forums/windows/en-US/dbbf317b-80d2-4992- b5a9-20b83526a9c2 / Storage-space-remove-vật lý-đĩa? forum = wonerver8gen ), nhưng công việc này ngay lập tức kết thúc, "thành công", tất nhiên, không có tác dụng gì.
Cố gắng chuyển đổi đĩa ảo trực tuyến trở lại thất bại, nói rằng một nguồn tài nguyên cụm được nối mạng là không có sẵn. Theo tôi hiểu, điều này chỉ có thể đề cập đến nhóm lưu trữ (khả dụng), vì các đĩa bị thiếu không phải là nguồn tài nguyên cụm. Các hồ bơi cho thấy không có lỗi để sửa chữa. Chạy thử nghiệm khả năng tương thích cụm xác nhận một cấu hình không phù hợp với cụm.
Tôi không thể tìm thấy bất kỳ phần nào còn lại sẽ nhúc nhích thêm một inch, toàn bộ điều này có vẻ bế tắc cho tốt. Có ý tưởng nào về cách ngăn chặn WSFC đang chạy khỏi ... theo cách đó không?
Tôi không gặp phải bất kỳ thông báo lỗi nào mà tôi thấy đặc biệt là giác ngộ và tôi không muốn đánh bom trang nhiều hơn bằng cách đăng tất cả chúng. Nếu bất cứ ai muốn có bất kỳ chi tiết cụ thể, chỉ cần cho tôi biết.
Cảm ơn rất nhiều vì thời gian của bạn, các bạn!
Karts
Get-PhysicalDisk -CanPool $true | Sort Model | ft FriendlyName, BusType, CanPool, OperationalStatus, HealthStatus, Usage, Size
Ngoài ra, có bất kỳ cơ hội nào bạn đã mắc lỗi khi cấu hình lại File-RAID gán ổ đĩa S2D cho RAID mới không?