Tôi có thể nói rằng DryadLinq là thứ gần nhất mà .NET dân gian của chúng tôi phải Hadoop. Nhưng nó phụ thuộc vào những gì bạn muốn sử dụng hadoop cho. Nếu bạn đang tìm kiếm hệ thống tệp phân phối tự bảo trì (DFS) được tối ưu hóa thì DryadLINQ không phải là thứ bạn đang tìm kiếm. Nó tương tự như DFS nhưng bạn phải tự xây dựng các phân vùng và phân phối từng phân vùng.
Điều đó đang được nói, nếu khía cạnh thực thi phân tán của Hadoop mà bạn đang tìm kiếm hơn DryadLINQ thực sự tuyệt vời (và không, tôi không liên kết với MS). Miễn là bạn có thiết lập cụm Microsoft HPC thì việc bắt đầu với DryadLINQ thực sự dễ dàng.
Mã bạn viết thực sự chỉ là mã LINQ thẳng, ngoại trừ việc thay vì thực thi LINQ, IEnumerable<T>
bạn phải thực thi nó trênPartitionedTable<T>
(cấu trúc dữ liệu phân tán tự xây dựng).
Điều thực sự thú vị về DryadLINQ là thời gian quay nhanh (thử, kiểm tra, điều chỉnh, lặp lại) khi phát triển các thuật toán. Bạn chỉ cần viết mã LINQ để thực hiện các tính toán của mình và DryadLINQ sẽ đảm nhiệm toàn bộ phần thực thi được phân phối. Đó là chất tương tự tự nhiên nhất mà tôi từng gặp giúp việc viết mã để xử lý phân tán giống như viết mã cho quá trình xử lý đơn lẻ.