Có cách nào để ngăn không gian lưu trữ trực tiếp tự động thêm đĩa không?


8

Có một vấn đề ở đây trên Cụm chuyển đổi dự phòng Windows Server 2016 (WSFC) lưu trữ Trường hợp cụm chuyển đổi dự phòng SQL (FCI) sử dụng Storage Spaces Direct (S2D). Trên mỗi máy chủ, sau khi tạo thành công ban đầu, S2D sẽ tự động thêm một ổ RAID không được sử dụng vào nhóm lưu trữ (mặc dù S2D không thể được tạo trên các ổ RAID và hoàn toàn nhấn mạnh vào các đĩa không được bảo vệ). Bây giờ nó đã bị hỏng, do - theo như tôi có thể tìm ra - chính xác là như vậy. Kết quả là, đĩa ảo đang ngoại tuyến, lấy toàn bộ cụm xuống với nó. Nó sẽ không trở lại trực tuyến, do một nguồn tài nguyên mạng cụm bị thiếu. Các đĩa trong câu hỏi có thể được nghỉ hưu nhưng không được gỡ bỏ. Sửa chữa đĩa ảo không chạy, kiểm tra tương thích cụm xác nhận cấu hình không hợp lệ.

Đây là một thiết lập mới. Vì vậy, tôi chỉ có thể xóa đĩa ảo, cụm hoặc thậm chí các máy chủ và bắt đầu lại. Nhưng trước khi chúng tôi làm việc hiệu quả, tôi cần đảm bảo, điều này không bao giờ xảy ra nữa. Hệ thống tự bắn vào đầu gối ảo bị dừng chỉ bằng cách thêm một cách không cần thiết và thêm một đĩa không được hỗ trợ là không có nền tảng nào chúng ta có thể triển khai. Vì vậy, chủ yếu tôi cần một cách để ngăn chặn điều này xảy ra, thay vì sửa chữa nó ngay bây giờ. Tôi đoán là việc ngăn chặn một thiết lập S2D lấy nhiều đĩa hơn so với nó được tạo ra sẽ thực hiện thủ thuật. Chi phí tương tác thủ công nhiều hơn trong quá trình thay thế đĩa thực không đáng kể so với clusterf ... chúng tôi có ở đây. Nhiều khi tôi duyệt tài liệu cho đến nay, tuy nhiên, tôi không thể tìm ra cách nào để kiểm soát điều đó. Trừ khi tôi thiếu thứ gì đó, cả Set-StoragePool,

Bất kỳ trợ giúp hoặc gợi ý sẽ được đánh giá rất cao.

Sau đây chỉ là thông tin chi tiết ở trên: Chúng tôi có 2 máy chủ HPE DL380 Gen9 được kết nối với nhau thông qua Ethernet 10GB có khả năng RDMA và qua 1GB vào mạng máy khách. Mỗi tính năng một bộ điều khiển RAID HP ??? và bộ điều khiển HBA đơn giản HP ??? (vì S2D hoàn toàn yêu cầu và chỉ hoạt động trên các đĩa được gắn trực tiếp, không gắn thẻ). Cấu hình lưu trữ bao gồm OS-RAID trên bộ điều khiển RAID, Files-RAID trên bộ điều khiển RAID và bộ đĩa được gắn trực tiếp trên HBA dành cho S2D.

Tôi đã thiết lập 2 phiên bản trung tâm dữ liệu Windows Servers 2016 trên OS-RAID, đã cài đặt tính năng WSFC, chạy và vượt qua kiểm tra khả năng tương thích cụm bao gồm tùy chọn S2D, tạo cụm mà không lưu trữ, thêm nhân chứng chia sẻ tệp (trên một máy riêng biệt), bật S2D trên nhóm lưu trữ, tự động bao gồm tất cả các đĩa không có ổ đĩa và trên đỉnh của nhóm đó đã tạo một đĩa ảo loại gương và sử dụng NTFS làm hệ thống tệp, vì đây được coi là lựa chọn của FS cho SQL FCI cài đặt.

Sau đó, tôi đã cài đặt phiên bản tiêu chuẩn SQL 2016 dưới dạng FCI trên cụm đó, nhập cơ sở dữ liệu và kiểm tra tất cả. Mọi thứ đều ổn Cơ sở dữ liệu ở ngay đó và nhanh hơn bao giờ hết. Buộc cũng như chuyển đổi dự phòng tự động là một làn gió. Mọi thứ đều tốt

Ngày hôm sau, chúng tôi đã cố gắng sử dụng các Tệp-RAID còn lại. Điều đầu tiên là thay đổi cấp độ RAID vì chúng tôi không thích cấu hình trước. Ngay sau khi xóa khối lượng RAID được cấu hình sẵn và xây dựng một khối mới (trên mỗi máy chủ), chúng tôi đã phát hiện ra rằng cụm bị hỏng. Từ những gì tôi có thể tìm ra cho đến nay, khối lượng Tệp-RAID được cấu hình sẵn trong thời gian đó đã được tự động thêm vào nhóm và khi chúng tôi vừa xóa nó, nó đã bị mất khỏi nhóm. Trong khi tôi kiểm tra, tôi đã tìm thấy Files-RAID mới, trong khi vẫn đang được tạo, cũng đã được hiển thị dưới dạng ổ đĩa vật lý của nhóm. Vì vậy, nhóm hiện bao gồm 2 khối RAID trên mỗi máy chủ, một trong số đó thậm chí không tồn tại. Các ổ đĩa này (nhưng không phải đĩa của chúng) được liệt kê bởi Get-PhysDisk cùng với các đĩa vật lý thực sự trên HBA, không chắc đó có phải là thường xuyên không.

Tôi đã có thể rút các đĩa vật lý đó (tức là những đĩa thực sự là ổ RAID) và hiện tại chúng được đánh dấu là đã nghỉ hưu. Nhưng họ vẫn ở trong hồ bơi và tôi không thể loại bỏ chúng ngay bây giờ, cố gắng để làm điều đó thất bại. Repair-VirtualDisk sẽ xây dựng lại đĩa ảo về trạng thái phù hợp trên chỉ các đĩa còn lại (Tôi đã thực hiện điều này: https://social.technet.microsoft.com/Forums/windows/en-US/dbbf317b-80d2-4992- b5a9-20b83526a9c2 / Storage-space-remove-vật lý-đĩa? forum = wonerver8gen ), nhưng công việc này ngay lập tức kết thúc, "thành công", tất nhiên, không có tác dụng gì.

Cố gắng chuyển đổi đĩa ảo trực tuyến trở lại thất bại, nói rằng một nguồn tài nguyên cụm được nối mạng là không có sẵn. Theo tôi hiểu, điều này chỉ có thể đề cập đến nhóm lưu trữ (khả dụng), vì các đĩa bị thiếu không phải là nguồn tài nguyên cụm. Các hồ bơi cho thấy không có lỗi để sửa chữa. Chạy thử nghiệm khả năng tương thích cụm xác nhận một cấu hình không phù hợp với cụm.

Tôi không thể tìm thấy bất kỳ phần nào còn lại sẽ nhúc nhích thêm một inch, toàn bộ điều này có vẻ bế tắc cho tốt. Có ý tưởng nào về cách ngăn chặn WSFC đang chạy khỏi ... theo cách đó không?

Tôi không gặp phải bất kỳ thông báo lỗi nào mà tôi thấy đặc biệt là giác ngộ và tôi không muốn đánh bom trang nhiều hơn bằng cách đăng tất cả chúng. Nếu bất cứ ai muốn có bất kỳ chi tiết cụ thể, chỉ cần cho tôi biết.

Cảm ơn rất nhiều vì thời gian của bạn, các bạn!

Karts

Cập nhật theo yêu cầu của ông Raspberry nhập mô tả hình ảnh ở đây


3
Bạn có thể vui lòng chia sẻ cho chúng tôi danh sách các ổ đĩa của bạn và các loại xe buýt của họ không? Lệnh PoweShell: Get-PhysicalDisk -CanPool $true | Sort Model | ft FriendlyName, BusType, CanPool, OperationalStatus, HealthStatus, Usage, SizeNgoài ra, có bất kỳ cơ hội nào bạn đã mắc lỗi khi cấu hình lại File-RAID gán ổ đĩa S2D cho RAID mới không?
Ông Raspberry

2
Điểm nào trong S2D + SQL Server? Tại sao bạn muốn chi tiền cho một máy ảo được cấp phép không giới hạn nếu bạn không có kế hoạch (thực sự không thể ...) chạy bất kỳ? SQL Server 2016 có thể thực hiện Luôn luôn AG cơ bản ngay cả với Tiêu chuẩn và bạn có thể tiết kiệm số tiền LỚN chỉ bằng cách sử dụng Windows Server Standard 2016. docs.microsoft.com/en-us/sql/database-engine/iêu
BaronSamedi1958

@Ông. Raspberry: Tôi đã cập nhật mục nhập với danh sách các đĩa vật lý. Xin lưu ý rằng tôi đã bỏ qua "-CanPool $ true" vì không ai có thể sử dụng được.
Karsten Köpnick

3
@ KarstenKöpnick: Chà, tôi sẽ đề nghị bạn xem xét về SQL Server Luôn luôn FCI + StarWind Virtual SAN Free. Cấu hình này sẽ thực hiện công việc tốt hơn trong trường hợp cụm 2 nút của bạn với chi phí thấp hơn và dễ dàng hơn nhiều để triển khai và quản lý mà không có vấn đề như vậy. starwindsoftware.com/ từ
Ông Raspberry

1
"S2D là con đường để đi dường như" Chà ... Chúc may mắn với điều đó :)
BaronSamedi1958

Câu trả lời:


5

Có, bạn có thể vô hiệu hóa hành vi tự động gộp. Trải nghiệm không tuyệt vời, nhưng chắc chắn là có thể và được hỗ trợ. Tên cài đặt và cú pháp cmdlet ví dụ, nằm trong phần Cài đặt của tài liệu công khai này:

https://technet.microsoft.com/en-us/windows-server-docs/failover-clustering/health-service-overview

Về cơ bản, hãy chạy nó với tư cách Quản trị viên:

Cụm Get-StorageSubSystem * | Set-StorageHealthSding -Name "System.Storage.PhysicalDisk.AutoPool.Enables" -Giá trị sai

Hi vọng điêu nay co ich! - Vũ trụ (@cosmosdarwin), Microsoft PM


@CosmosDarvin: Cảm ơn! Có vẻ như điều đó có thể làm nên trò. Tôi cần đọc thêm một chút về chiều sâu của nó và hiểu ý nghĩa của nó, sau đó tôi sẽ thử và báo cáo.
Karsten Köpnick

@CosmosDarvin: Cảm ơn rất nhiều. Cuối cùng tôi đã có cơ hội tìm hiểu sâu hơn về chủ đề này để tìm hiểu về hậu quả tiềm tàng. Theo như tôi có thể nói, với tùy chọn đó bị vô hiệu hóa, hậu quả duy nhất là các đĩa sẽ phải được thêm vào nhóm theo cách thủ công bằng lệnh Add-PhysDisk. Đó là một sự đánh đổi tốt. Tôi không thể tìm thấy bất kỳ dấu hiệu nào về các biến chứng hoặc bất lợi khác, vì vậy tôi sẽ thử. - Chỉ cần ghi lại sự cần thiết để thêm đĩa thủ công trong trường hợp thay thế. - Tôi sẽ báo cáo kết quả.
Karsten Köpnick

Báo cáo kết quả: Tôi muốn nói thêm rằng tôi không thể thu thập bất kỳ trải nghiệm thực tế nào với phương pháp này. Nó đã được quyết định để thêm một bao vây đĩa và sử dụng nó thay vì S2D. Việc thay thế đĩa trong RAID có kích thước là một nhiệm vụ thường xuyên và yêu cầu phải có người có đủ chuyên môn bất cứ lúc nào để thực hiện can thiệp PowerShell, thậm chí là tài liệu, để hoán đổi đĩa đơn giản được xem là công cụ chặn hiển thị. Nhìn nó theo cách đó, tôi hoàn toàn đồng ý. Vì vậy, chúng tôi cài đặt lại bằng cách sử dụng bao vây và không có vấn đề gì kể từ đó. - Cảm ơn tất cả các bạn đã giúp đỡ và chuyên gia của bạn.
Karsten Köpnick

2

Cách giải quyết mà tôi đã tìm thấy cho vấn đề này là thay đổi Loại Bus của ổ đĩa hoặc ổ đĩa RAID bằng cách thay đổi nó từ một trong những loại được hỗ trợ sang loại không được hỗ trợ.

Bạn sẽ phải xác định trình điều khiển từ Trình quản lý thiết bị và sau khi vào sổ đăng ký và tìm tên trình điều khiển ở vị trí bên dưới.

HKEY_LOCAL_MACHINE \ HỆ THỐNG \ CurrentControlset \ Services \ SmartPqi \ Tham số

Trong trường hợp của tôi, tôi đã thay đổi khoá đăng ký tương ứng với SAS thành RAID

«BusType» = 0x00000008 (RAID) (thay vì 0x0000000a) (SAS)

khởi động lại máy

Sau thay đổi này, bạn có thể có nhóm lưu trữ trong hệ thống con Windows Storage thay vì Spaces Storage Spaces

Hãy cẩn thận nếu bạn muốn áp dụng loại giải pháp này vì đây không phải là giải pháp được xác thực và có thể khiến môi trường sản xuất của bạn gặp rủi ro cao.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.