Hệ thống tệp Linux cho một máy chủ tệp lớn


8

Tôi muốn biết, từ những người có kinh nghiệm hơn, đâu là sự lựa chọn tốt nhất của hệ thống tệp để sử dụng cho một máy chủ tệp có hơn 20TB đĩa cứng. Cá nhân tôi luôn sử dụng EXT3 (trước đây) và EXT4 (kể từ khi có) [và một lần ReiserFS 3 mặc dù nó gây ra nhiều hỏng dữ liệu] trên máy tính cá nhân của tôi và trên các đĩa BOOT và ROOT "máy chủ nhỏ".

Tuy nhiên, vì các công cụ EXT4 (mặc dù không phải bản thân EXT4) bị giới hạn ở các phân vùng 16TB nên đây có thể không phải là lựa chọn tốt nhất của tôi. Phân phối sẽ là Debian 6.0 (Bóp) và / hoặc Gentoo (phiên bản mới nhất), do đó, kernel nên khá gần đây (trên Debian ít nhất là có backport), nghĩa là kernel linux> = 2.6.32.

Máy chủ tệp sẽ được sử dụng cho ba mục đích gửi thư (và cả các phân vùng riêng biệt, vì mục đích là để giữ cho dữ liệu "an toàn" và không thực sự quan tâm nhiều đến chi phí hoạt động). Tất cả các đĩa mặc dù được mã hóa bằng LUKS :

  1. Đa phương tiện, tải xuống và kho lưu trữ debian cục bộ [Tôi có ít nhất 6 máy chạy Debian]> 20TB (có thể tách thêm giữa kho lưu trữ Media, Tải xuống và Debian)
  2. Dữ liệu (Tài liệu, Ảnh, ...) ~ 4TB SAFE (có nghĩa là raid1 hoặc raid6 + đĩa sao lưu)
  3. Sao lưu> = 20 TB để sao lưu các máy tính khác trong mạng gigabit của tôi (bạn có thể đề xuất một phần mềm sao lưu toàn bộ hệ điều hành ngay cả khi đó là windows, BackupPC cho biết điều đó có thay thế không?)

Tốc độ nhanh không thực sự cần thiết (truy cập đồng thời: tối đa tới 2 hoặc 3 tệp lớn, ví dụ như video), ngay cả khi "chỉ" 200 MB / giây đọc từ 10 ổ cứng Raid6 tôi có thể sống với điều đó.

Tóm lại tôi tìm kiếm một hệ thống tập tin đáng tin cậy, có thể mở rộng (nghĩa là có thể mở rộng dễ dàng) hỗ trợ hơn 20TB / phân vùng. FS càng an toàn và đáng tin cậy thì càng tốt. Phần cứng được sử dụng sẽ có ít nhất một lõi tứ (amd x4 630 hoặc intel i5-2500k) và nhiều RAM (> 8GB, có thể> 16GB) để đáp ứng yêu cầu phần cứng.

PC / Máy chủ của tôi sẽ được kết nối với một UPS (Nguồn cung cấp điện liên tục) trong trường hợp mất điện Có thể làm phương tiện và sao lưu trên các máy riêng biệt (ví dụ: hai máy chủ).


7
Ở quy mô này, bạn thực sự cần phải nghiêm túc đánh giá ZFS. Thời gian xây dựng lại và tỷ lệ lỗi trở thành mối quan tâm nghiêm trọng với nhiều đĩa như bạn đang nói và zfs là fs ổn định duy nhất hiện có với khả năng kiểm tra và sửa lỗi mạnh mẽ trong suốt quá trình.
afrazier

1
ZFS không được hỗ trợ linux (chỉ với FUSE) hoặc được hỗ trợ nguyên bản ở trạng thái pre-alpha sớm. Tôi không xem xét sử dụng solaris là một lựa chọn. Chưa bao giờ dùng thử FreeBSD một lần và có thể quan tâm, tuy nhiên hiện tại tôi không biết nếu phần mềm hỗ trợ đột kích phần mềm (và hỗ trợ phần cứng nói chung) tốt như linux
user51166

1
Tôi biết, nhưng ZFS đang chạy tự nhiên trên các nền tảng khác. Mặc dù hỗ trợ phần cứng không giống như Linux, nhưng đó không phải là điều bạn lo lắng nhất. ZFS là một ngăn xếp lưu trữ đầy đủ, vì vậy cuộc đột kích phần mềm nằm ngoài phương trình. Đánh giá cách bạn sẽ lưu trữ, quản lý, bảo vệ và sao lưu dữ liệu của mình trước khi chọn hệ điều hành hoặc hệ thống lưu trữ. Đừng giảm giá ZFS chỉ vì nó không có nguồn gốc trên Linux, có lẽ đây là giải pháp lưu trữ tiên tiến nhất hiện có miễn phí.
afrazier

Cảm ơn bạn đã trả lời, nhưng tôi không hiểu: ngay cả khi tôi có thể sử dụng FreeBSD mà không gặp vấn đề gì (không chắc chắn về điều đó), có điều gì giống như cuộc đột kích phần mềm được triển khai không? Bất cứ điều gì như LUKS (Mã hóa Linux) cho FreeBSD? Cảm ơn. Tôi quen thuộc với Gentoo và Debian GNU / Linux. Máy chủ là một máy chủ gia đình .
dùng51166

Hay bạn đang đề xuất một hệ điều hành khác ngoài FreeBSD?
user51166

Câu trả lời:


3

Rất nhiều người đang đề xuất ZFS. Nhưng ZFS không có sẵn tự nhiên trong Linux ngoại trừ thông qua cầu chì. Tôi sẽ không đề xuất điều này cho tình huống của bạn, nơi hiệu suất có thể là quan trọng.

Thật không may, ZFS sẽ không bao giờ có sẵn như là một mô-đun hạt nhân riêng trừ khi các vấn đề cấp phép được sắp xếp theo cách nào đó.

XFS là tốt, nhưng một số người đã báo cáo các vấn đề tham nhũng và tôi thực sự không thể nhận xét về điều đó. Tôi đã chơi với các phân vùng XFS nhỏ và không gặp phải những vấn đề này nhưng không được sản xuất.

ZFS có quá nhiều ưu điểm & tính năng hữu ích không thể bỏ qua. Tóm lại, chúng là (xem ZFS Wiki để biết mô tả đầy đủ về ý nghĩa của chúng):

  • Toàn vẹn dữ liệu
  • Bể chứa
  • L2ARC
  • Công suất cao
  • Sao chép trên viết
  • Ảnh chụp nhanh & nhái
  • Phân dải động
  • Kích thước khối biến
  • Tạo hệ thống tập tin nhẹ
  • Quản lý bộ nhớ cache
  • Endianness thích nghi
  • Chống trùng lặp
  • Mã hóa

Vậy làm thế nào để chúng ta có được xung quanh nó? Đề xuất thay thế của tôi có thể phù hợp với tình huống của bạn là xem xét nexenta . Đây là một hạt nhân Open Solaris với các công cụ người dùng GNU chạy trên đầu trang. Có nhân Open Solaris nghĩa là có sẵn ZFS.


Từ trang web của họ "Phiên bản cộng đồng: Phiên bản MIỄN PHÍ, không giới hạn cho tối đa 18TB dung lượng lưu trữ". Có vẻ như tôi sẽ nhận được một giới hạn khác như của EXT4
user51166

Và tôi hiểu rằng ZFS đơn giản là "tốt nhất" như hầu hết các bạn đang nói. Chỉ cần cố gắng tìm ra phân phối hệ điều hành / solaris "tốt nhất" có thể chạy nó.
dùng51166

Debian GNU / kFreeBSD dường như hỗ trợ ZFS và tôi thích cách Debian, không chắc tôi có thể sử dụng điều này tuy nhiên dường như có một cộng đồng hỗ trợ nhỏ và vẫn còn một số lỗi lớn.
dùng51166

@ user51166 - Bạn cũng nên xem xét FreeBSD hoặc FreeNAS nếu máy chủ của bạn hoàn toàn để lưu trữ. Cả hai đều có hỗ trợ ZFS.
Matt H

4

Bạn nên thử XFS, phù hợp với yêu cầu của bạn:

XFS là một hệ thống tệp 64 bit. Nó hỗ trợ kích thước hệ thống tệp tối đa là 8 exbibytes trừ đi một byte, mặc dù điều này phải tuân theo giới hạn khối được áp đặt bởi hệ điều hành máy chủ. Trên các hệ thống Linux 32 bit, điều này giới hạn kích thước tệp và hệ thống tệp ở mức 16 tebibytes.


Tôi nghe nói nó có thể gây mất dữ liệu khi đối mặt với sự cố mất điện và việc ghi nhật ký của nó không bao gồm dữ liệu (chỉ ghi nhật ký trên siêu dữ liệu). Đã sử dụng nó một lần trên máy tính để bàn của tôi nhưng tạo ra rất nhiều lỗi fsck, do đó tôi không muốn sử dụng nó nữa. Tôi nhắc lại: hiệu suất không phải là phạm vi (chính) của sự lựa chọn này: sự ổn định là.
dùng51166

Tôi không nghĩ rằng XFS không ổn định, tôi sử dụng nó trong một số máy chủ tệp và tôi không gặp vấn đề gì ...
thay đổi

Không, nó ổn định theo nghĩa là có một phiên bản ổn định. Điều đó có nghĩa là tôi sẽ không bị mất dữ liệu trong những năm qua? XFS chắc chắn là tốt nếu bạn đang tìm kiếm hiệu suất, mặc dù tôi nhớ đọc trên mạng có vấn đề mất dữ liệu (mặc dù không nhiều như với reiser 3 may mắn thay). Quên chỉ định, nhưng tôi đang xem một thiết lập LUKS, do đó LVM sẽ được sử dụng , nếu điều đó có thể giúp ích.
user51166

Không tồn tại một Hệ thống tệp hoàn hảo ... Tôi nghĩ rằng đối với yêu cầu của bạn, XFS là phù hợp nhất. Không nên có bất kỳ vấn đề nào khi sử dụng LVM trên XFS.
aleroot

Chắc chắn là không. Bất kỳ "hạn chế" / "đặc điểm" đặc biệt nào? Các vấn đề về fsck và / hoặc chống phân mảnh trực tuyến như các vấn đề của ext4?
user51166

4

Tùy chọn dễ nhất của bạn là sử dụng XFS. Rất nhiều trải nghiệm tồi tệ xung quanh XFS dựa trên các phiên bản cũ và các sự cố phần cứng máy tính để bàn mà tôi không nghĩ là thực sự phù hợp cho việc triển khai mới trên phần cứng máy chủ chất lượng tiêu chuẩn. Tôi đã viết một bài đăng trên blog về chủ đề này có thể giúp bạn sắp xếp tình huống hiện tại. Có nhiều cài đặt cơ sở dữ liệu XFS bận rộn với hàng trăm người dùng và terabyte dữ liệu tôi giúp quản lý. Tất cả đều nằm trong kernel Debian Lenny (2.6.26) trở lên và tôi đã không nghe thấy một gợi ý rắc rối nào với họ trong nhiều năm. Tôi sẽ không sử dụng XFS với bất kỳ kernel nào sớm hơn thế. Tôi đã nghe một số báo cáo trực tiếp về việc mọi người nhìn thấy hành vi XFS lạ khi hệ thống hết bộ nhớ hoặc không gian đĩa; Mặc dù vậy tôi vẫn chưa thấy điều đó.

Tùy chọn hợp lý duy nhất khác là sử dụng ext4 với một số hack để hỗ trợ các hệ thống tập tin lớn hơn. Tôi sẽ không mong đợi rằng có một mức độ tin cậy rất khác nhau. Tôi đã phải khôi phục dữ liệu từ nhiều hệ thống ext4 bị hỏng do lỗi kernel, cho đến nay tất cả các hệ thống đều cố định ngược dòng nhưng không có trong kernel của nhà phân phối tại thời điểm đó. ext4 có tập hợp các vấn đề siêu dữ liệu riêng như mất dữ liệu phân bổ bị trì hoãn , những điều ít có khả năng xảy ra trên ext3. Tôi sẽ ước tính tỷ lệ bạn gặp phải lỗi ext4 thậm chí còn cao hơn bình thường nếu bạn buộc nó vượt quá giới hạn kích thước bình thường, đơn giản vì có vẻ như nhiều khả năng bạn sẽ gặp một đường dẫn mã mới được kiểm tra kém hơn tại một số điểm .

Ý tưởng thay thế là chỉ sử dụng ext3 an toàn và nhàm chán hơn, chấp nhận giới hạn 16TB và phân vùng mọi thứ tốt hơn để không có hệ thống tệp đơn lẻ nào phải lớn như vậy.

Một kết thúc lỏng lẻo liên quan đến các vấn đề tạp chí. Bạn đã không nói về cách tất cả các ổ đĩa này sẽ được kết nối. Hãy chắc chắn rằng bạn hiểu hàm ý của bất kỳ bộ nhớ đệm ghi nào trong chuỗi lưu trữ của bạn ở đây. Vô hiệu hóa nó hoặc đảm bảo hệ thống tập tin đang xóa bộ đệm. Tôi đã lấy một số tài nguyên về điều đó tại Đáng tin cậy nếu đó chưa phải là thứ bạn đang kiểm tra.

Ổ đĩa hút. Mảng RAID hút. Hệ thống tập tin hút. Nhiều thất bại xảy ra. Tôi rất vui khi thấy bạn đã nghĩ về sao lưu; đi từ tốt đến độ tin cậy cao về lưu trữ đòi hỏi nhiều hơn là chỉ RAID và một số ổ đĩa dự phòng. Sự dư thừa chi phí một cái gì đó ở mọi cấp độ và tiền cho phần cứng so với độ phức tạp của phần mềm rất khó để điều hướng. Và xem kỳ vọng hiệu suất của bạn. Mặc dù một mảng RAID như bạn đang xem xét sẽ dễ dàng thực hiện hàng trăm MB / s, tất cả chỉ cần hai trình đọc đồng thời tìm kiếm đĩa xung quanh để giảm xuống chỉ còn vài MB / s. Tôi có thể dễ dàng nghiền nát một mảng RAID10 24 đĩa sao cho nó chỉ cung cấp <5MB / s so với khối lượng công việc chuẩn . Một điều có ích là đảm bảo rằng bạn điều chỉnh hướng đọc lên trên nếu có thể có nhiều trình đọc phát trực tuyến.


Tôi sẽ sử dụng nó ở nhà, vì vậy tôi có kế hoạch sử dụng phần cứng chính. Cũng có thể sử dụng Phần cứng máy chủ nhưng tôi vẫn phải xem SB-E sẽ cung cấp gì vào năm tới trong bộ phận xeon (tôi cũng muốn chơi một chút với ảo hóa). Nếu nó không quá đắt, tôi dự định sẽ sử dụng phần cứng máy chủ và bộ nhớ ECC giá rẻ (rất nhiều). Hiệu suất-khôn ngoan Tôi không muốn bất cứ điều gì đặc biệt.
dùng51166

Và vâng, tôi đang nghĩ về các bản sao lưu, nhưng vẫn chưa thực hiện chúng. Tôi vẫn đang tìm kiếm một giải pháp sao lưu có khả năng tạo hình ảnh hệ thống và / hoặc dễ dàng tar / zip / ... các thư mục cần thiết với giao diện quản lý cho phép tự động khôi phục. BackupPC dường như chỉ là một giới hạn nhỏ và không chắc chắn tôi tin tưởng Crashplan (sử dụng nó để sao lưu dữ liệu đến vị trí từ xa, muốn dự phòng do đó là một hệ thống khác). Tôi có phải tự viết GUI web hay thứ gì đó tương tự như vậy không (phần mềm nguồn mở hoặc ít nhất là miễn phí để sử dụng)
user51166

2

Việc triển khai trên ZFS bằng FreeBSD có thể xảy ra ở đây bằng cách sử dụng gbde để mã hóa. Bản thân ZFS sẽ là nhà cung cấp RAID phần mềm, thông qua RAIDZ . Sự phức tạp trong quản lý lưu trữ của việc xây dựng các zpool không khác biệt đáng kể so với những gì Linux sẽ đưa bạn đến với mdadm, và trong một số trường hợp sẽ thực sự dễ dàng hơn. Bản cài đặt ZFS đầu tiên của tôi (trên Solaris 10 khoảng 3 năm trước) có hệ thống tệp 17TB trên 48 ổ đĩa. Tôi đã sống sót qua nhiều lần thất bại ở đó mà không gặp vấn đề gì, học cách quản lý ZFS khi tôi đi.

Ưu điểm chính là tính năng kiểm tra của ZFS cung cấp khả năng phát hiện lỗi tốt hơn Linux, đây là một biện pháp bảo vệ chống lại phần cứng xấu đáng xem xét. Nhược điểm chính là xung quanh FreeBSD ít phổ biến hơn. Bạn chưa biết cách quản trị nó, hỗ trợ phần cứng yếu hơn Linux một chút và vì đây là một nền tảng ít phổ biến hơn nên không có nhiều người yêu cầu trợ giúp nếu bạn gặp vấn đề.

Một mảng lưu trữ nhiều terabyte thực sự làm nổi bật những gì ZFS là tốt mặc dù. Thật đáng để xem xét nghiêm túc nếu bạn sẵn sàng lao vào một cái gì đó mới. Nếu bạn muốn khám phá hoang tưởng sao lưu thực sự, hãy xây dựng các máy chủ sao lưu Linux và FreeBSD, để giảm tỷ lệ lỗi hệ điều hành là một điểm gây ra lỗi duy nhất.


Đã có Linux làm máy chủ tệp và tôi vẫn phải thực sự bắt đầu sử dụng nó (Tôi chỉ bắt đầu một số thử nghiệm phần mềm RAID-6 + LUKS trên 6 đĩa). Vấn đề duy nhất là tôi có rất ít thời gian để chơi với nó. Tôi thích câu trả lời của bạn. Vì vậy, những gì bạn đề nghị là hệ điều hành nếu đi theo cách ZFS? FreeBSD và opensolaris (không được duy trì nữa), OpenIndiana (OpenSolaris openource như tôi đã thấy) và Solaris Express 11 (Oracle: S) dường như là những lựa chọn duy nhất. Tôi không sử dụng nó ở nơi làm việc, đó là sở thích của tôi ở nhà, nhưng dù sao tôi cũng muốn thứ gì đó ổn định và cũng dễ sử dụng.
dùng51166

Tôi đã thực sự quen với việc sử dụng năng khiếu và xuất hiện. Sự hiểu biết của tôi về cách bạn biên dịch / quản lý / cập nhật các cổng trong freebsd (cd / usr / ... && make install) là nó dường như không "đúng" (tôi hy vọng người theo chủ nghĩa thuần túy sẽ tha thứ cho tôi khi sử dụng thuật ngữ này , nhưng có vẻ lạ đối với tôi rằng nếu bạn muốn cập nhật gói bạn phải làm điều đó, không có sự phụ thuộc tự động nào được giải quyết [Tôi chỉ xem qua hướng dẫn của FreeBSD]). Hoặc có một hệ thống quản lý gói đơn giản như của debian hay gentoo?
user51166

Tôi đã biết tôi có thể chỉ đơn giản là rsync những gì tôi muốn hoặc tar / diff, v.v. nhưng tôi muốn biết nếu có bất cứ điều gì thực tế hơn đã tồn tại. Cảm ơn
user51166

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.