Tôi quản lý một ứng dụng có chứa một filestore trong đó tất cả các tệp được lưu trữ với tên tệp bằng với tổng md5 của chúng. Tất cả các tập tin được lưu trữ trong một thư mục. Hiện tại có hàng ngàn, nhưng sẽ sớm có hàng triệu tệp trên máy chủ. Máy chủ hiện tại đang chạy Ubuntu 11.10 trên hệ thống tệp ext4.
Có người nói với tôi rằng không nên để nhiều tệp vào một thư mục, vì điều này sẽ tạo ra sự gia tăng đáng kể về thời gian tra cứu và độ tin cậy (anh ta có một câu chuyện về các tệp tối đa mà một thư mục duy nhất có thể trỏ đến, dẫn đến một danh sách liên kết lớn). Thay vào đó, ông đề nghị tạo các thư mục con với các chuỗi con của tên tệp. Tuy nhiên, điều này sẽ làm cho một số thứ trong ứng dụng của tôi trở nên cồng kềnh hơn nhiều.
Điều này vẫn đúng hay các hệ thống tập tin hiện đại (ví dụ ext4) có nhiều cách hiệu quả hơn để giải quyết vấn đề này và quy mô tự nhiên? Wikipedia có một số chi tiết về các hệ thống tệp, nhưng nó không thực sự nói gì về các tệp tối đa trên mỗi thư mục hoặc thời gian tra cứu.