Các vấn đề nghiên cứu chính trong các giao dịch phân phối là gì?


10

Bối cảnh: Xử lý giao dịch đã là một chủ đề nghiên cứu truyền thống trong lý thuyết cơ sở dữ liệu. Ngày nay các giao dịch phân tán được phổ biến bởi các hệ thống lưu trữ phân tán quy mô lớn thường liên quan đến phân vùng dữ liệu (còn gọi là shending) và sao chép dữ liệu .

Các vấn đề nghiên cứu chính trong các giao dịch phân phối là gì?

Có những lý thuyết và giải pháp nổi tiếng nào cần cải thiện (lý thuyết) không?

Bất kỳ tài liệu tham khảo được đánh giá cao.

Câu trả lời:


9

Có nhiều lĩnh vực nghiên cứu cả về lý thuyết và thực hành cơ sở dữ liệu phân tán.

Một trong những thách thức thực tế chính là việc thực hiện các cơ chế kiểm soát đồng thời hiệu quả cho các cơ sở dữ liệu phân tán và nhân rộng địa lý. Để thực hiện các giao dịch một cách hiệu quả, các cơ chế như vậy có thể cung cấp các đảm bảo yếu hơn khả năng tuần tự hóa, đòi hỏi các giao dịch dường như được thực hiện tuần tự. Một giải pháp thay thế cho tính tuần tự hóa là giải quyết cách ly Snapshot [1], nhưng điều này đã được chứng minh là có quy mô kém đối với các hệ thống phân tán và sao chép địa lý. Ở trạng thái hiện đại, hai biến thể khác nhau của Cách ly chụp nhanh (SI) đã được xác định để đối phó với kiểm soát đồng thời trong các hệ thống sao chép địa lý: Cách ly chụp nhanh song song (PSI) [2] và Cách ly chụp nhanh không đơn điệu (NMSI) [NMSI) 3,4]. Đối với những gì nó liên quan đến cơ sở dữ liệu phân tán (nghĩa là nơi dữ liệu được phân chia giữa các trang web khác nhau),

Có các khái niệm khác nhau về các mức cô lập cung cấp các đảm bảo yếu hơn khả năng tuần tự hóa, một câu hỏi quan trọng khác là viết các chương trình theo cách để các lệnh thực thi dường như vẫn có thể nối tiếp. Một tiêu chí âm thanh cho Snapshot Isolation đã được đưa ra trong [1]. Một số người trong nhóm của tôi hiện đang làm việc để đưa ra một tiêu chí hợp lý cho PSI.

Một câu hỏi khác có liên quan, cả từ quan điểm lý thuyết và thực tiễn, là vấn đề chặt chém giao dịch. Về cơ bản băm nhỏ là một kỹ thuật phân tích tĩnh trong đó các giao dịch chi tiết thô được chia thành các giao dịch hạt nhỏ hơn. Đối với tính tuần tự, câu hỏi này đã được giải quyết trong [6] và lý thuyết kết quả đã được áp dụng để đưa ra một triển khai thực tế trong [7].

Từ quan điểm của nền tảng lý thuyết của cơ sở dữ liệu phân tán, đã có một số đề xuất sử dụng các kỹ thuật từ cộng đồng mô hình bộ nhớ yếu [8] để xác định chính thức hành vi của các giao dịch. Trong [9] các tác giả đưa ra một khái niệm chính thức về hành vi cho các giao dịch; cách tiếp cận tương tự đã được sử dụng trong [10] để chỉ định hành vi của các kiểu dữ liệu được nhân rộng.

Gần đây, tôi và một số đồng nghiệp của tôi (Alexey Gotsman và Hongseok Yang) đã xây dựng, bắt đầu từ các kỹ thuật được phát triển trong [8,9,10], một khung lý thuyết để chỉ định hành vi có thể quan sát được của các mức độ nhất quán cho cơ sở dữ liệu sao chép địa lý. Chúng tôi đã sử dụng thành công khuôn khổ để đưa ra một tiên đề về SI, PSI và NMSI, mỗi trong số chúng tôi đã chứng minh là đúng đối với việc thực hiện đơn giản. Chúng tôi cũng khai thác lý thuyết kết quả để đưa ra tiêu chí chặt chém cho PSI. Những kết quả này hy vọng chúng tôi sẽ công bố trong tương lai gần.

Xin đừng ngần ngại viết cho tôi nếu bạn có câu hỏi khác. Hi vọng điêu nay co ich,

Andrea Cerone.

Người giới thiệu:

[1] Fekete et al, Tạo cách ly ảnh chụp nhanh (2005)

[2] Sovran et al, Lưu trữ giao dịch cho các hệ thống sao chép địa lý (2011)

[3] Arkedani et al, Cách ly ảnh chụp không đơn điệu: tính nhất quán có thể mở rộng và mạnh mẽ cho các hệ thống giao dịch được sao chép địa lý (2013)

[4] Arkedani et al, Về khả năng mở rộng của cách ly ảnh chụp (2013)

[5] Binnig et al, Phân lập ảnh chụp nhanh phân tán: giao dịch toàn cầu thanh toán toàn cầu, giao dịch địa phương thanh toán cục bộ

[6] Shasha et al, Giao dịch chặt chém: thuật toán và nghiên cứu hiệu suất (1995)

[7] Zhang et al, Chuỗi giao dịch: đạt được tính tuần tự với độ trễ thấp trong các hệ thống lưu trữ phân tán địa lý (2013)

[8] Alglave, Một hệ thống phân cấp chính thức của các mô hình bộ nhớ yếu (2012)

[9] Buckhardt et al, Hiểu sự nhất quán cuối cùng (2013)

[10] Buckhardt et al, Các kiểu dữ liệu được nhân rộng: Đặc điểm kỹ thuật, Xác minh, Tối ưu hóa (2014)


Cảm ơn câu trả lời toàn diện của bạn. Đối với SI, có các giao thức không khóa, phân tán trong các cài đặt được nhân rộng trong tài liệu không? Hay nỗ lực này là vô nghĩa vì SI không có quy mô tốt? Đối với PSI, tôi đã đọc một bài báo (Tim Krasnka @ Eurosys'13) trong đó đề cập đến việc thực hiện nó trong công việc trong tương lai. Là Generalized Paxos thích hợp cho việc này? Những ưu / nhược điểm / thách thức có thể có so với bản gốc trong Sovran et al [2] là gì? Cảm ơn một lần nữa.
hengxin

2
Thật vậy, SI không mở rộng tốt cho các hệ thống nhân rộng địa lý. Trong [4] ở trên, các tác giả chứng minh rằng có các thuộc tính, chẳng hạn như Sao chép một phần chính hãng, không thể đạt được bằng các DBMS được sao chép địa lý chạy ở mức độ nhất quán SI. Trong [5], các tác giả cho thấy các ví dụ về các vụ hành quyết hành xử theo SI cục bộ (tại các phân đoạn đơn lẻ), nhưng không phải trên toàn cầu và đề xuất một biến thể của SI, được gọi là DSI. Đối với những gì nó liên quan đến MDCC, tôi không biết về bài viết này và tôi phải thừa nhận rằng tôi không biết chi tiết triển khai của Paxos tổng quát. Nhưng tôi sẽ vui vẻ có một cái nhìn, và trả lời càng sớm càng tốt.
Andrea Cerone
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.