Tôi không chắc chắn nếu các chuyên gia tư vấn bên ngoài sẽ hỗ trợ tốt hơn cho công ty của bạn nếu bạn sẽ xử lý các bộ dữ liệu thực sự lớn và bạn cần bắt đầu từ mặt đất. Xin đừng hiểu sai ý tôi, nhưng nếu những người đó làm hỏng một dự án với rất nhiều khách hàng, nó sẽ có tác động PR đến công ty của bạn.
Về 10 triệu tuple trong một bảng, nếu bạn có lập chỉ mục tốt thì sẽ ổn. Chúng ta cần lưu trữ một vài bộ dữ liệu 100 triệu trong một bảng ở đây (các mặt hàng đã bán) hoạt động tốt trên một nhà tiên tri lớn 11g
Đây là một bài đăng từ năm 2010 với bản đồ thiết kế db của facebook: Thiết kế cơ sở dữ liệu Facebook
Bạn có thể muốn đọc tài liệu mysql về các loại phân vùng như thế này: Tài liệu MySQL: Partinioning
MySQL hỗ trợ các loại sau:
Phân vùng RANGE . Kiểu phân vùng này gán các hàng cho các phân vùng dựa trên các giá trị cột nằm trong một phạm vi nhất định. Xem Phần 18.2.1, Phân vùng RANGE Riên.
Phân vùng DANH SÁCH . Tương tự như phân vùng bằng RANGE, ngoại trừ phân vùng được chọn dựa trên các cột khớp với một trong các tập hợp các giá trị rời rạc. Xem Phần 18.2.2, Phân vùng DANH SÁCH LỊCH SỬ.
Phân vùng HASH . Với kiểu phân vùng này, một phân vùng được chọn dựa trên giá trị được trả về bởi biểu thức do người dùng xác định hoạt động trên các giá trị cột trong các hàng được chèn vào bảng. Hàm này có thể bao gồm bất kỳ biểu thức nào hợp lệ trong MySQL mang lại giá trị nguyên không âm. Một phần mở rộng cho loại này, LINEAR HASH, cũng có sẵn. Xem Phần 18.2.3, phân vùng HASH
KEY phân vùng. Kiểu phân vùng này tương tự như phân vùng bằng HASH, ngoại trừ việc chỉ có một hoặc nhiều cột được đánh giá được cung cấp và máy chủ MySQL cung cấp chức năng băm riêng. Các cột này có thể chứa các giá trị khác, vì hàm băm do MySQL cung cấp đảm bảo kết quả số nguyên bất kể kiểu dữ liệu cột. Một phần mở rộng cho loại này, LINEAR KEY, cũng có sẵn. Xem phần 18.2.4, phân vùng KEY trên mạng.
I can't believe they would have one global user table with 950 million entries.
Tôi có thể, nó không mà lớn. Tôi đã làm việc với các bảng lớn hơn. Nó khá phổ biến. Tùy chọn khác tôi sẽ xem xét nếu bạn có nhiều dữ liệu khác là cơ sở dữ liệu NoQuery .