Các trang web lớn như Google, Facebook và Twitter không nhất thiết phải có máy chủ 'tốt nhất' ở chỗ họ không chạy một số lượng nhỏ máy chủ công suất cao, họ chạy một số lượng lớn máy chủ nhỏ hơn và rẻ hơn. Họ hy vọng phần cứng sẽ chết và được thay thế và mã cho phép điều đó.
Một số điều điển hình trong các trang web quy mô lớn:
- Họ không sử dụng cơ sở dữ liệu SQL như myQuery. Thay vào đó, họ lưu trữ khóa-giá trị như HBase hoặc Cassandra. myQuery và các DB SQL khác quá chậm khi số lượng yêu cầu rất lớn.
- Họ lưu trữ càng nhiều càng tốt. Bộ nhớ đệm HTML như bạn nói. Dữ liệu của người dùng được lưu trữ trong bộ nhớ bằng cách sử dụng những thứ như memcached.
- Một số trang web, như Reddit, các trang bộ đệm trước khi người dùng thậm chí yêu cầu nó.
- Tính toán trước càng nhiều càng tốt, các trang web có xu hướng tìm ra những thứ như số lượng bạn bè của bạn (hoặc bất cứ điều gì) và bộ nhớ cache cũng vậy - một chút càng tốt được thực hiện một cách linh hoạt.
http://highscalability.com/ là một trang web tuyệt vời để tìm hiểu thêm về điều này.