Chi tiết kỹ thuật cho tính năng chống trùng lặp Server 2012


12

Giờ đây, Windows Server 2012 đi kèm với các tính năng chống trùng lặp cho các khối NTFS, tôi đang gặp khó khăn trong việc tìm kiếm các chi tiết kỹ thuật về nó. Tôi có thể suy luận từ tài liệu TechNet rằng chính hành động khử trùng lặp là một quá trình không đồng bộ - không giống như cách SIS Groveler sử dụng để làm việc - nhưng hầu như không có chi tiết nào về việc triển khai (thuật toán được sử dụng, tài nguyên cần thiết, thậm chí cả thông tin về hiệu suất cân nhắc không có gì ngoài một khuyến nghị theo quy tắc kiểu ngón tay cái).

Thông tin chi tiết và con trỏ được đánh giá rất cao, so sánh với hiệu quả chống trùng lặp ZFS của Solaris cho một tập hợp các kịch bản sẽ là tuyệt vời.

Câu trả lời:


9

Như tôi nghi ngờ, nó dựa trên hệ thống con VSS ( nguồn ) cũng giải thích bản chất không đồng bộ của nó. Các khối de-dupe được lưu trữ trong \System Volume Information\Dedup\ChunkStore\*, với các cài đặt trong \System Volume Information\Dedup\Settings\*. Điều này có tác động đáng kể đến cách phần mềm sao lưu của bạn tương tác với các khối lượng như vậy, điều này được giải thích trong bài viết được liên kết (tóm tắt: w / o khấu trừ hỗ trợ sao lưu của bạn sẽ có cùng kích thước như mọi khi, với hỗ trợ khấu trừ bạn sẽ chỉ sao lưu các cửa hàng khấu trừ nhỏ hơn nhiều).

Đối với các phương pháp được sử dụng, tốt nhất tôi có thể tìm thấy là một bài nghiên cứu được đưa ra bởi một nhà nghiên cứu của Microsoft vào năm 2011 ( nguồn , fulltext ) tại hội nghị Usenix FAST11. Mục 3.3 đi vào sự trùng lặp trong Lưu trữ chính . Có vẻ như dữ liệu này đã được sử dụng để phát triển tính năng suy luận NTFS. Trích dẫn này đã được sử dụng:

Thuật toán chính tắc cho các khối được xác định nội dung có kích thước thay đổi là Dấu vân tay Rabin [25].

Có rất nhiều dữ liệu trong bài báo để sàng lọc, nhưng sự phức tạp của bộ công cụ họ đã sử dụng, kết hợp với các tính năng mà chúng ta biết là vào năm 2012, khuyến nghị mạnh mẽ rằng lý do trong bài báo đã được sử dụng để phát triển các tính năng. Không thể biết chắc chắn nếu không có bài viết msDN, nhưng điều này gần như chúng ta có thể có được trong thời gian này.

So sánh hiệu suất với ZFS sẽ phải đợi cho đến khi các điểm chuẩn được thực hiện với nó.


2
Cảm ơn bạn đã tham khảo, mặc dù tôi phải thừa nhận rằng tôi đã hy vọng vào một thứ gì đó giống tài liệu hơn cho một tính năng hợp lý như suy luận về hiệu suất, tính toàn vẹn dữ liệu và mức tiêu thụ bộ nhớ. Vâng, chúng ta hãy chờ xem, sau đó.
the-wợi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.