Khả năng mở rộng được đo lường về mặt thông lượng dựa trên một số biến. Ví dụ: số lượng yêu cầu / giây với người dùng X. Cách đơn giản nhất để mô tả khả năng mở rộng là:
Một thước đo hiệu quả khi tải tăng.
Điều đầu tiên bạn cần hiểu trong việc thiết kế khả năng mở rộng là phép đo nào là quan trọng nhất cho ứng dụng của bạn? Có một số cách đo lường hiệu quả là thành phần chính của khả năng mở rộng:
- Yêu cầu đồng thời mỗi giây
- Thời gian phản hồi trung bình cho mỗi yêu cầu
- Số lượng hồ sơ được xử lý mỗi giây / phút
Có nhiều phép đo hiệu quả hơn có thể được sử dụng, nhưng chúng là phổ biến cho các hệ thống dựa trên web hoặc hệ thống xử lý hàng loạt.
Khía cạnh tiếp theo của khả năng mở rộng là đo lường những gì xảy ra với hiệu quả của bạn khi tải được tăng lên. Các cách phổ biến để tải tăng là:
- Nhiều người dùng nhấn máy chủ (tức là lưu lượng truy cập web nhiều hơn)
- Nhiều dữ liệu hơn trong cơ sở dữ liệu (nghĩa là các truy vấn mất nhiều thời gian hơn hoặc quá trình xử lý mất nhiều thời gian hơn)
- Lỗi ổ cứng trong RAID (hiệu suất lưu trữ / độ tin cậy bị ảnh hưởng)
- Mạng bão hòa
Mục tiêu cho một ứng dụng có thể mở rộng là duy trì hoặc cải thiện hiệu quả khi chúng ta xử lý vấn đề tải. Nói tóm lại, nếu thời gian phản hồi mất quá nhiều thời gian, chúng ta có thể thêm một máy chủ khác để phân phối tải đồng đều không? Cách tiếp cận này làm giảm khối lượng công việc cho một máy chủ thực hiện và giữ cho các máy chủ hoạt động ở "điểm ngọt" đó để đạt hiệu quả.
Ứng dụng của bạn sẽ cần phải được thiết kế đặc biệt để mở rộng quy mô. Điều đó có nghĩa là bạn phải cẩn thận với dữ liệu phiên, định tuyến các yêu cầu đến đúng máy chủ, giảm các tắc nghẽn làm hạn chế khả năng ứng dụng mở rộng quy mô.