Tại sao có nhiều giải pháp MPP dựa trên PostgreSQL thay vì MySQL?


7

Dữ liệu Astor, Greenplum và GridQuery đều cho phép Xử lý song song các truy vấn SQL. Chúng cũng được xây dựng xung quanh công nghệ PostgreSQL. Đây chỉ là do vấn đề cấp phép hoặc có lý do khác? Đối với tôi, nó có vẻ giống như MyISAM, không tuân thủ ACID và do đó không gặp vấn đề tương tự với MVCC (như đã thấy ở đây ) vì PostgreQuery phù hợp hơn nhiều để xây dựng kho dữ liệu hiệu suất cao. Sau khi tất cả tải OLAP không yêu cầu giao dịch như tôi có thể thấy.

Câu trả lời:


13

Nó chủ yếu là một vấn đề giấy phép. Những phát triển này cuối cùng đã vá mã khá nặng nề, vì vậy nếu bạn giao dịch với MySQL, bạn sẽ phải mở mã nguồn của mình hoặc chịu trách nhiệm của chủ sở hữu công ty MySQL trong suốt cuộc đời kinh doanh của bạn. Một số ưu đãi dành cho MySQL khắc phục điều đó bằng cách triển khai công việc của họ như một công cụ lưu trữ, nhưng điều đó không cung cấp tất cả tính linh hoạt mà họ cần và cuối cùng họ cũng sẽ vá lõi MySQL.


Không đúng. Bạn chỉ phải cho đi nguồn nếu bạn phân phối ứng dụng GPL theo như tôi biết. Nếu bạn sử dụng nó trong nội bộ, bạn có thể giữ cho bạn những thay đổi cho chính mình. Đó là lý do tại sao Stallman nói SaaS là ​​sự kết thúc xung quanh GPL.
Gaius

7
Gaius: quan điểm của bạn là gì? Các giải pháp MPP được thảo luận ở đây bán phần mềm độc quyền có nguồn gốc từ phần mềm nguồn mở. Họ không bán phần mềm của họ như một dịch vụ.
Peter Eisentraut

10

Tôi có thể thấy hai lý do:

1) trong lịch sử, PostgreSQL có trình phân tích truy vấn và phân tích thống kê tốt hơn. Điều này có thể không đúng bây giờ, nhưng vài năm trước PostgreSQL tốt hơn nhiều so với MySQL đối với các truy vấn phức tạp, đó là các truy vấn OLAP.

2) PostgreSQL có chức năng / trình kích hoạt / hỗ trợ lập trình tốt hơn.


Tôi nghĩ rằng nó vẫn còn. mặc dù tôi không thể nói gì cho mysql 5.5
xenoterracide

1
Vâng, hầu hết thời gian, các nhánh thương mại này phát triển kế hoạch và trình tối ưu hóa của riêng họ để phù hợp với tính chất phân tán hoặc song song của những gì họ đang làm.
Peter Eisentraut

6

Như Peter Eisentraut đã chỉ ra một cách chính xác, trước hết và đó là vấn đề cấp phép. Postgres được cấp phép theo thỏa thuận giống như BSD, về cơ bản nó là "miễn phí cho tất cả mọi người", miễn là bạn tin tưởng vào các nhà phát triển ban đầu trong công việc phái sinh của mình.

Cuộc tranh luận về lịch trình khóa MVCC và khóa đã là chủ đề của hơn một vài 'cuộc chiến thần thánh' trực tuyến. Các cuộc tranh luận về giá trị của các công cụ lưu trữ khác nhau đã gây tranh cãi như nhau.

Ưu điểm của các công cụ lưu trữ chính khác nhau (còn gọi là lưu trữ hàng) là IMHO phần lớn không liên quan khi nói đến MPP RDBMS được xây dựng cho khối lượng công việc phân tích vì hai lý do:

  1. Mặc dù các đặc thù của công cụ lưu trữ rất quan trọng để xử lý các giao dịch ACID trong khối lượng công việc kiểu OLTP, trong môi trường lưu trữ dữ liệu thông thường, bạn chỉ cần hỗ trợ một loại "giao dịch" - tải hàng loạt. Lý tưởng nhất là tải hàng loạt sẽ thành công hoàn toàn hoặc thất bại hoàn toàn.
  2. Cơ sở dữ liệu phân tích, dựa trên các công cụ lưu trữ cột, trong nhiều trường hợp sẽ vượt trội hơn bất kỳ triển khai cửa hàng nào. Vertica là một cửa hàng cột từ đầu, Teradata và Greenplum gần đây đã thêm chức năng lưu trữ cột vào các sản phẩm của họ.

4

Tôi đã xây dựng một hệ thống MPP trên MySQL và tôi đã loại bỏ hệ thống này vì hai lý do:

1) là Oracle

2) là việc thiếu các phép nối băm - vòng lặp lồng nhau và các phép nối chỉ mục không mở rộng đến mức cần thiết trong hệ thống MPP - một lần nữa vì Oracle đã ngăn cản việc phân phối hàm băm được hứa hẹn trong dòng mã 5.x sau khi nó sở hữu.

Các hệ thống dữ liệu lớn MPP phải có các phép nối không phức tạp về hình học. - Các phép nối phức tạp tuyến tính hoặc log phải là một ưu tiên mạnh mẽ cho các hệ thống dữ liệu lớn thực sự.

Thay vào đó, tôi đã triển khai Actian theo chiều dọc trong hệ thống MPP DeepCloud mới trong khi vẫn duy trì khả năng tương thích mưa phùn / MySQL ở cấp độ người dùng.

Người dùng muốn phân tích dữ liệu lớn nhanh có thể tải xuống DeepCloud từ http://www.deepcloud.co


3
Xin chào Randolph, và chào mừng đến với trang web. Tôi sẽ chỉ khuyến khích bạn đã lướt qua faq và lưu ý một chút về các chương trình khuyến mãi. Người dùng ở đây có xu hướng nhăn mặt về vị trí sản phẩm, nhưng bạn đang làm đúng và thảo luận về những ưu và nhược điểm ở đây. Sẽ không có hại khi tiết lộ sự liên kết của bạn với sản phẩm trong tương lai, có thể nói "đây là một sản phẩm tôi làm trên đó là những gì bạn cần". (PS: Một số nhiều người phàn nàn rằng điều này "cảm thấy như một quảng cáo" nhưng bạn đang tích cực thảo luận tại sao ném bỏ là sự lựa chọn hợp lệ, đó là thích hợp)
jcolebrand
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.