Một số sự thật về nhà lưu trữ, hoặc tại sao lưu trữ doanh nghiệp lại đắt đỏ như vậy?
Ổ cứng tiêu dùng cung cấp dung lượng lớn để ngay cả người dùng khó tính nhất * ho * truyền phát trực tuyến * ho * có thể mua đủ để lưu trữ bộ sưu tập vài terabyte. Trong thực tế, dung lượng đĩa đã tăng nhanh hơn so với bóng bán dẫn đếm trên silicon trong một vài thập kỷ nay.
Lưu trữ 'doanh nghiệp' là một vấn đề phức tạp hơn một chút vì dữ liệu có các yêu cầu về hiệu suất và tính toàn vẹn chỉ ra cách tiếp cận có phần nặng nề hơn. Dữ liệu phải có một số đảm bảo về tính khả dụng trong trường hợp xảy ra lỗi phần cứng và nó có thể phải được chia sẻ với một số lượng lớn người dùng, điều này sẽ tạo ra nhiều yêu cầu đọc / ghi hơn một người dùng.
Các giải pháp kỹ thuật cho vấn đề này có thể đắt hơn nhiều lần trên mỗi gigabyte so với các giải pháp lưu trữ của người tiêu dùng. Họ cũng yêu cầu bảo trì vật lý; sao lưu phải được thực hiện và thường được lưu trữ ngoài trang web để một đám cháy không phá hủy dữ liệu. Quá trình này thêm chi phí liên tục.
Hiệu suất
Trên ổ đĩa 1TB của người tiêu dùng hoặc thậm chí doanh nghiệp của bạn, bạn chỉ có một đầu. Đĩa quay với tốc độ 7200 vòng / phút, hoặc 120 vòng quay mỗi giây. Điều này có nghĩa là bạn có thể nhận được tối đa 120 thao tác I / O truy cập ngẫu nhiên mỗi giây trong lý thuyết * và có phần ít hơn trong thực tế. Do đó, sao chép một tệp lớn trên một ổ đĩa 1TB tương đối chậm.
Trên một mảng đĩa với các đĩa 14x 72GB, bạn có 14 đầu trên các đĩa với tốc độ (giả sử) 15.000 vòng / phút hoặc khoảng 250 vòng quay mỗi giây. Điều này cung cấp cho bạn tối đa lý thuyết là 3.500 thao tác I / O ngẫu nhiên mỗi giây * (một lần nữa, có phần ít hơn trong thực tế). Tất cả những thứ khác bằng một bản sao tệp sẽ nhanh hơn nhiều lần.
*
Bạn có thể nhận được nhiều hơn một lần truy cập ngẫu nhiên trên mỗi vòng quay của đĩa nếu hình dạng của các lần đọc cho phép ổ đĩa di chuyển các đầu và đọc một khu vực tình cờ có sẵn trong một vòng quay của đĩa. Nếu các truy cập đĩa được phân tán rộng rãi, bạn có thể sẽ trung bình ít hơn một. Khi một mảng đĩa được định dạng theo bố cục sọc (xem bên dưới), bạn sẽ nhận được tối đa một sọc đọc trên mỗi vòng quay của đĩa trong hầu hết các trường hợp và (trung bình tùy thuộc vào bộ điều khiển RAID) có thể ít hơn một trung bình.
Ổ đĩa 7200 RPM 1TB có thể sẽ nhanh chóng hợp lý trên I / O tuần tự. Các mảng đĩa được định dạng theo sơ đồ sọc (RAID-0, RAID-5, RAID-10, v.v.) thường có thể đọc tối đa một sọc trên mỗi vòng quay của đĩa. Với dải 64K, chúng ta có thể đọc 64Kx250 = 16 MB hoặc hơn dữ liệu mỗi giây trên đĩa 15.000 RPM. Điều này mang lại thông lượng tuần tự khoảng 220 MB mỗi giây trên một mảng 14 đĩa, tốc độ này không nhanh hơn nhiều so với 150 MB / giây hoặc được trích dẫn cho đĩa SATA 1TB hiện đại.
Để truyền phát video (ví dụ), một mảng gồm 4 đĩa SATA trong RAID-0 với kích thước sọc lớn (một số bộ điều khiển RAID sẽ hỗ trợ kích thước sọc lên tới 1MB) có khá nhiều thông lượng tuần tự. Ví dụ này về mặt lý thuyết có thể truyền phát khoảng 480 MB / giây, đủ thoải mái để thực hiện chỉnh sửa video HD không nén thời gian thực. Do đó, chủ sở hữu của Mac Pros và phần cứng tương tự có thể thực hiện các tác vụ tổng hợp video HD cần có một máy có mảng sợi gắn trực tiếp chỉ vài năm trước.
Lợi ích thực sự của một mảng đĩa là trên công việc cơ sở dữ liệu, được đặc trưng bởi số lượng lớn các yêu cầu I / O nhỏ, phân tán. Trên loại hiệu suất khối lượng công việc này bị hạn chế bởi độ trễ vật lý của các bit kim loại trong đĩa đi vòng tròn và qua lại. Số liệu này được gọi là IOPS (hoạt động I / O mỗi giây). Bạn càng có nhiều đĩa vật lý - bất kể dung lượng - về mặt lý thuyết bạn có thể làm càng nhiều IOPS. Nhiều IOPS hơn có nghĩa là nhiều giao dịch hơn mỗi giây.
Toàn vẹn dữ liệu
Ngoài ra, hầu hết các cấu hình RAID cung cấp cho bạn một số dự phòng dữ liệu - đòi hỏi nhiều hơn một đĩa vật lý theo định nghĩa. Sự kết hợp giữa sơ đồ lưu trữ với sự dư thừa như vậy và số lượng ổ đĩa lớn hơn mang lại cho hệ thống khả năng phục vụ đáng tin cậy một khối lượng công việc giao dịch lớn.
Cơ sở hạ tầng cho mảng đĩa (và SAN trong trường hợp cực đoan hơn) không chính xác là một mục thị trường đại chúng. Ngoài ra, nó là một trong những bit thực sự, thực sự không thể thất bại. Sự kết hợp giữa tiêu chuẩn xây dựng và khối lượng thị trường nhỏ hơn không hề rẻ.
Tổng chi phí lưu trữ bao gồm sao lưu
Trong thực tế, chi phí lớn nhất để duy trì 1TB dữ liệu có thể là sao lưu và phục hồi. Một ổ đĩa băng và 34 bộ băng SDLT hoặc băng siêu âm cho một chu kỳ sao lưu và phục hồi đầy đủ của ông nội có thể sẽ có giá cao hơn một mảng đĩa 1TB đã làm. Thêm chi phí lưu trữ ngoài trang web và tiền lương của một con khỉ băng đơn lẻ và đột nhiên 1TB dữ liệu của bạn không quá rẻ.
Chi phí của các đĩa thường là một cách công bằng trong hệ thống phân cấp của chi phí lưu trữ chi phối. Tại một ngân hàng, tôi có dịp làm việc cho bộ lưu trữ SAN có giá 900 bảng / GB cho một hệ thống phát triển và 5.000 bảng / GB cho một đĩa trên máy chủ sản xuất. Ngay cả ở mức giá của nhà cung cấp doanh nghiệp, chi phí vật lý của các đĩa chỉ là một phần rất nhỏ. Một ví dụ khác mà tôi biết là có một IBM Shark SAN (được cấu hình tương đối khiêm tốn) có giá của chúng ở đâu đó vượt quá 1 triệu bảng Anh. Chỉ cần bộ nhớ vật lý trên này được tính khoảng £ 9 / gigabyte, hoặc khoảng £ 9.000 cho không gian tương đương với ổ cứng tiêu dùng 1TB của bạn.