Những loại hệ thống nào có thể mở rộng quy mô trên phạm vi thay vì quy mô trên phạm vi khác?

Tôi đã băn khoăn trong một thời gian dài nếu có những hệ thống phải "mở rộng quy mô" (lên một máy chủ mạnh hơn, đắt tiền hơn) thay vì "mở rộng quy mô" bằng cách chia thành nhiều máy chủ nhỏ hơn.

Các hệ thống như vậy có tồn tại không, và nếu vậy, có điều gì đặc biệt có xu hướng khiến các hệ thống cần phải được nhân rộng, thay vì thu nhỏ lại không? (Ví dụ: có thể các giao dịch cơ sở dữ liệu khiếu nại ACID hoặc các yêu cầu toàn vẹn dữ liệu mạnh khác tạo ra nhu cầu này.)

Vì việc nhân rộng có vẻ như sẽ mang lại chi phí phần cứng cao hơn nhiều so với việc nhân rộng ra, có vẻ như đó là điều bạn muốn tránh, nếu có thể, nhưng tôi không chắc liệu điều đó có luôn tránh được hay không.

Vì vậy, có những hệ thống không thể được thu nhỏ lại và thay vào đó phải được nhân rộng? Điều gì có thể gây ra điều này, và làm thế nào bạn sẽ xác định một hệ thống như vậy? (Họ có thường chia sẻ một số đặc điểm chung có thể khiến chúng dễ nhận dạng hơn không?)

database scalability infrastructure

— Demi
nguồn

Một ví dụ: signalvnoise.com/posts/3090-basecamp-nexts-caching-hardware

— ceejayoz

Mở rộng quy mô thường dễ dàng hơn nhiều nếu phần mềm của bạn chưa được thiết kế để mở rộng. Phần mềm thiết kế lại rất tốn kém hoặc không thể nếu bạn không sở hữu nguồn hoặc có ảnh hưởng đối với các nhà phát triển.

— Zoredache

Viết các hệ thống như vậy là một vấn đề rất khó khăn. Đặc biệt là các thiết kế chính / chính có thể đến và đi nơi nhiều chủ nhân viết vào cùng một bản ghi cùng một lúc. Ai viết thắng?

— Matt

Bạn có thể quan tâm Định lý CAP . Về cơ bản, một dịch vụ đòi hỏi cả tính nhất quán và tính sẵn có như được định nghĩa trong định lý sẽ không thể chấp nhận phân vùng. Hầu hết các yêu cầu trong thế giới thực có thể hy sinh một số tính nhất quán cho tính nhất quán cuối cùng (bằng tay hoặc tự động xử lý sự không nhất quán sau thực tế) hoặc hy sinh tính sẵn có bằng cách từ chối xử lý yêu cầu khi một số người tham gia không có mặt. Do đó, các hệ thống đòi hỏi cả tính nhất quán tuyệt đối và tính sẵn sàng tuyệt đối về cơ bản buộc phải tăng quy mô.

— Lie Ryan

Nếu theo "mạng LAN đáng tin cậy", bạn có nghĩa là "không bao giờ gặp sự cố", thì bạn không thiết kế cho thế giới thực.

— mfinni

Câu trả lời:

Tôi chủ yếu làm việc với một ứng dụng mà có zero tiềm năng mở rộng quy mô ngang . Mặc dù nó chạy trên Linux, nhưng các ứng dụng, cấu trúc dữ liệu và các yêu cầu I / O buộc tôi phải "tăng quy mô" lên các hệ thống lớn hơn để đáp ứng khối lượng công việc của người dùng tăng lên.

Nhiều ứng dụng giao dịch và kinh doanh kế thừa có các loại ràng buộc này. Đó là một lý do tôi nhấn mạnh rằng ngành công nghiệp tập trung vào các giải pháp đám mây và các kiến trúc quy mô web dựa trên DevOps bỏ qua một tỷ lệ tốt trong thế giới điện toán.

Thật không may, các hệ thống mở rộng mà tôi mô tả là thực sự không rõ ràng , vì vậy ngành công nghiệp có xu hướng bỏ qua giá trị của chúng hoặc coi thường các kỹ năng cần thiết để giải quyết các hệ thống quan trọng, lớn (ví dụ gia súc so với vật nuôi ).

— ewwhite
nguồn

"điều dễ nhất để làm là ném phần cứng vào vấn đề." Làm ơn, luật Moore, đừng ngừng làm việc!

— cjc

@Demetri - Microsoft SQL Server là sản phẩm "cấu hình cao" nhất mà tôi có thể nghĩ đó là một "quy mô" điển hình thay vì "mở rộng quy mô". Việc nhân rộng nó ra là không thể trừ khi bạn đáp ứng một bộ tiêu chí rất cụ thể để nhân rộng.

— Mark Henderson

Hoặc nếu bạn có thể phân tách giải pháp thành nhiều vấn đề. Ví dụ: không chạy báo cáo đối với cơ sở dữ liệu giao dịch của bạn; đạt được một bản sao chạy trên phần cứng khác. \

— mfinni

-1. Tôi nghĩ rằng bạn đã bỏ lỡ đánh vào trung tâm của vấn đề. Vấn đề của bạn không bị buộc phải thu nhỏ nếu bạn có thể viết lại hệ thống cho hệ thống mở rộng. Câu hỏi này về các hệ thống có miền vấn đề là không thể thực hiện được quy mô ngay cả khi được thiết kế từ đầu.

— Nói dối Ryan

@LieRyan Hiểu. Tôi nói rằng ứng dụng tôi hỗ trợ không thể được thu nhỏ (đó là một hệ thống giống như cơ sở dữ liệu) ... ngay cả khi được thiết kế lại, do các ràng buộc về kiến trúc.

— ewwhite

Từ góc độ nhà phát triển, tôi có thể nói rằng gần như mọi công cụ cơ sở dữ liệu chính thống truyền thống ngoài kia chỉ có thể mở rộng quy mô và nhân rộng ra rất nhiều sau khi nghĩ.

Trong những năm gần đây với nhu cầu về khả năng mở rộng lớn hơn và các hệ thống có tính sẵn sàng cao, đã có những nỗ lực để làm cho các cơ sở dữ liệu hiện có mở rộng ra. Nhưng bởi vì các thiết kế bị cản trở bởi mã kế thừa, nên nó chỉ được củng cố chứ không phải là cơ bản cho thiết kế. Bạn sẽ gặp phải điều này nếu cố gắng mở rộng hầu hết các công cụ cơ sở dữ liệu nổi tiếng. Thêm máy chủ nô lệ có thể khá khó để thiết lập và bạn sẽ nhận thấy rằng nó đi kèm với những hạn chế đáng kể, một số trong đó có thể yêu cầu sắp xếp lại các bảng cơ sở dữ liệu của bạn.

Ví dụ, hầu hết trong số chúng là nô lệ chủ / (đa-) thay vì thiết kế đa chủ. Nói cách khác, bạn có thể có toàn bộ máy chủ chỉ ngồi đó và không thể xử lý các truy vấn. Một số làm, nhưng với những hạn chế ... ví dụ chỉ đọc thiết kế đa nô lệ. Vì vậy, bạn có thể có một máy chủ ghi và tất cả các máy chủ khác cung cấp dữ liệu chỉ đọc. Bạn sẽ nhận thấy khi bạn thiết lập các hệ thống này, nó không phải lúc nào cũng là một quá trình đơn giản và khó để hoạt động tốt. Nó cảm thấy rất nhiều một tia trên ngoài trong nhiều trường hợp.

Mặt khác, có một số công cụ cơ sở dữ liệu mới hơn đang được phát triển với thiết kế đồng thời và đa chủ ngay từ đầu. NOSQL và NewQuery là lớp thiết kế mới.

Vì vậy, có vẻ như cách tốt nhất để có được hiệu suất tốt hơn từ máy chủ SQL truyền thống là tăng quy mô! Trong khi với NOSQL & NewQuery, cả hai đều mở rộng và mở rộng quy mô.

Lý do các hệ thống RDBMS truyền thống được kết hợp chặt chẽ là bởi vì tất cả chúng đều cần một cái nhìn nhất quán về cùng một dữ liệu. Khi bạn có nhiều máy chủ chấp nhận cập nhật cho cùng một dữ liệu từ các máy khách khác nhau, bạn tin tưởng vào máy chủ nào? Bất kỳ phương pháp nào cố gắng đảm bảo dữ liệu nhất quán thông qua một số loại cơ chế khóa đều cần có sự hợp tác từ các máy chủ khác làm giảm hiệu suất hoặc ảnh hưởng đến chất lượng dữ liệu trong đó mọi dữ liệu được đọc từ máy khách có thể bị lỗi thời. Và các máy chủ cần tự quyết định dữ liệu nào gần đây nhất khi ghi vào cùng một bản ghi. Như bạn có thể thấy đó là một vấn đề phức tạp trở nên phức tạp hơn bởi thực tế là khối lượng công việc được trải đều trên các máy chủ và không chỉ giữa các quy trình hoặc luồng mà việc truy cập dữ liệu vẫn còn khá nhanh.

— Matt
nguồn

Không phải Oracle RAC đã cung cấp quy mô từ 10g sao?

— Dani_l

Nó có. Nhưng sau đó có RAC và có RAC hoạt động hoàn hảo là hai điều khác nhau - điều này thực sự đòi hỏi sự chăm sóc đặc biệt để tiếp tục chạy. Đó là một thiết kế đẹp mặc dù. Nếu bạn cần nó, bạn có thể sẵn sàng trả giá.

— TomTom

Và lưu ý hệ thống lưu trữ được chia sẻ cần thiết cho Oracle RAC. Điều đó có thể đưa ra một vấn đề mở rộng tùy thuộc vào cách nó được thực hiện.

— Matt

Theo tôi, việc phân chia tỷ lệ lên / xuống được xác định dựa trên mức độ song song của một luồng công việc và các luồng song song cần phối hợp chặt chẽ với nhau như thế nào.

Single Threaded
Vì bất kỳ lý do gì, quy trình công việc này chỉ có thể hoạt động trong một luồng duy nhất.

Một luồng có nghĩa là một hệ thống có nghĩa là tăng quy mô để làm cho nó đi nhanh hơn.

Song song liên kết chặt chẽ
Đây là một hệ thống đa luồng, trong đó các luồng cần phải được liên kết chặt chẽ với nhau. Có lẽ giao tiếp giữa các quá trình cần phải rất nhanh, hoặc tất cả cần phải được quản lý thông qua một trình quản lý bộ nhớ duy nhất. Hầu hết các hệ thống RDBMS là loại tính toán song song này.

Đối với hầu hết các phần, các hệ thống này là những người mà quy mô lên hơn ra mặc dù có những ngoại lệ. Ví dụ, các quy trình công việc sẽ hoạt động trên cụm kiểu Ảnh hệ thống đơn, không gian bộ nhớ đơn nhưng độ trễ cao giữa các luồng, có thể giúp thu nhỏ dễ dàng hơn. Nhưng các hệ thống SSI như vậy rất khó để làm việc với hầu hết các kỹ sư chỉ tạo ra một hộp lớn hơn.

Song song liên kết lỏng lẻo
Đây là một hệ thống đa luồng / quy trình trong đó các luồng đều ổn với độ trễ cao giữa nhau. Hoặc không cần nói chuyện với nhau. Mở rộng quy mô phục vụ web và trang trại kết xuất là những ví dụ kinh điển của loại hệ thống này. Các hệ thống như thế này dễ dàng hơn nhiều để tạo ra lớn hơn so với song song kết hợp chặt chẽ, đó là lý do tại sao có rất nhiều hứng thú về phong cách hệ thống này.

Đây là phong cách mà quy mô ra dễ dàng hơn rất nhiều.

— sysadmin1138
nguồn

Lý do RDBMS được liên kết chặt chẽ là vì chúng được liên kết chặt chẽ với dữ liệu. tức là nhiều máy chủ truy cập cùng một tài nguyên.

— Matt