Sau đây chỉ là những lời ca tụng điên rồ và cuồng nhiệt ...
Nếu bạn để tất cả dữ liệu trong một bảng (không phân vùng), bạn sẽ có thời gian tìm kiếm O (log n) bằng khóa. Hãy lấy chỉ số tồi tệ nhất trên thế giới, cây nhị phân. Mỗi nút cây có chính xác một khóa. Cây nhị phân cân bằng hoàn hảo với các nút cây 268,435,455 (2 ^ 28 - 1) sẽ có chiều cao 28. Nếu bạn tách cây nhị phân này thành 16 cây riêng biệt, bạn nhận được 16 cây nhị phân mỗi cây với 16.777.215 (2 ^ 24 - 1) các nút cây cho chiều cao 24. Đường dẫn tìm kiếm giảm 4 nút, giảm 14.2857% chiều cao. Nếu thời gian tìm kiếm tính bằng micrô giây, thì thời gian tìm kiếm giảm 14.2857% là không đáng kể.
Bây giờ trong thế giới thực, một chỉ số BTREE sẽ có các bộ ba với nhiều khóa. Mỗi tìm kiếm BTREE sẽ thực hiện tìm kiếm nhị phân trong trang với khả năng có thể vào một trang khác. Ví dụ: nếu mỗi trang BTREE chứa 1024 khóa, chiều cao cây 3 hoặc 4 sẽ là chuẩn, chiều cao cây ngắn thực sự.
Lưu ý rằng việc chia bảng không làm giảm chiều cao của BTREE vốn đã nhỏ. Với một phân vùng gồm 260 triệu hàng, thậm chí có khả năng mạnh mẽ là có nhiều BTREE có cùng chiều cao. Tìm kiếm một khóa có thể đi qua tất cả các trang BTREE gốc mỗi lần. Chỉ một người sẽ hoàn thành đường dẫn của phạm vi tìm kiếm cần thiết.
Bây giờ mở rộng về điều này. Tất cả các phân vùng tồn tại trên cùng một máy. Nếu bạn không có các đĩa riêng biệt cho mỗi phân vùng, bạn sẽ có I / O đĩa và xoay trục chính như một nút cổ chai tự động bên ngoài hiệu suất tìm kiếm phân vùng.
Trong trường hợp này, phân vùng theo cơ sở dữ liệu sẽ không mua cho bạn bất cứ thứ gì nếu id là khóa tìm kiếm duy nhất được sử dụng.
Phân vùng dữ liệu sẽ phục vụ cho nhóm dữ liệu hợp lý và gắn kết trong cùng một lớp. Hiệu suất tìm kiếm từng phân vùng không cần phải được xem xét chính miễn là dữ liệu được nhóm chính xác. Một khi bạn đã đạt được phân vùng hợp lý, sau đó tập trung vào thời gian tìm kiếm. Nếu bạn chỉ tách dữ liệu bằng id, có thể nhiều hàng dữ liệu có thể không bao giờ được truy cập để đọc hoặc ghi. Bây giờ, đó phải là một sự cân nhắc chính: Xác định vị trí tất cả các id thường xuyên truy cập và phân vùng theo đó . Tất cả các id ít được truy cập thường nằm trong một bảng lưu trữ lớn vẫn có thể truy cập được bằng cách tra cứu chỉ mục cho truy vấn 'một lần trong một mặt trăng xanh'.
Tác động tổng thể phải có ít nhất hai phân vùng: Một cho các id thường xuyên truy cập và các paritiion khác cho các id còn lại. Nếu các id thường xuyên truy cập là khá lớn, bạn có thể tùy ý phân vùng đó.