Sự khác biệt giữa Kho dữ liệu liên kết và phi tập trung là gì?


9

Tôi không thể tìm thấy bất kỳ định nghĩa hoặc giải thích rõ ràng về bất kỳ trong số này. Cả hai dường như phi tập trung. Dường như trong DWH Liên kết, dữ liệu được phân phối và không được tích hợp vào một kho lưu trữ duy nhất và được truy cập từ các nguồn phân tán.

Trong khi thực hiện DWH phi tập trung, dữ liệu được tích hợp vào một kho lưu trữ trung tâm.

Hãy giải thích sự khác biệt giữa hai triển khai này.

Câu trả lời:


6

Kho dữ liệu phi tập trung về cơ bản là một tập hợp các kho dữ liệu được duy trì bởi các vùng hoặc đơn vị kinh doanh riêng lẻ nhưng được cung cấp tập trung. Chúng có thể trên cùng một máy chủ vật lý, chia sẻ các công cụ báo cáo hoặc được cung cấp trên toàn tổ chức theo một cách khác. Cũng có thể có các thành phần tập trung như quản lý dữ liệu chủ. Điều này thường được thực hiện vì kho dữ liệu tập trung trở nên khó sử dụng vượt quá quy mô tổ chức nhất định. Một kho dữ liệu phải đáp ứng để thay đổi và nếu nó không phản hồi thì các bộ phận riêng lẻ sẽ bắt đầu xây dựng các giải pháp của riêng họ.

Bạn có thể thấy điều này ở các ngân hàng đầu tư, nơi có xu hướng làm kho dữ liệu để đáp ứng các yêu cầu cụ thể (ví dụ: một sáng kiến ​​quy định cụ thể hoặc một số loại báo cáo tài chính) thay vì xây dựng một kho tập trung trên toàn bộ doanh nghiệp. Một công ty có quy mô của một ngân hàng lớn đơn giản là quá phức tạp để thực hiện các yêu cầu đối với EDW tập trung hoàn toàn trong một khoảng thời gian hợp lý.

Kho dữ liệu được liên kết thêm một lớp hợp nhất chính trên các kho dữ liệu phi tập trung. Thông thường, điều này sẽ chỉ chứa một lát dữ liệu dọc hẹp, vì mục đích của nó là hợp nhất các số liệu chính trên toàn bộ doanh nghiệp để báo cáo cấp công ty hoặc nhóm, thay vì cung cấp nền tảng MI tổng quát cho tất cả các bộ phận. Các phòng ban còn lại để sản xuất các hệ thống EDW hoặc MI của riêng họ nhưng được yêu cầu cung cấp các bộ dữ liệu cần thiết để đưa vào lớp hợp nhất trung tâm.

Kiến trúc này cung cấp cho bạn tốt nhất của cả hai thế giới. Quản lý trung tâm có thể xem số liệu của họ trên toàn bộ tổ chức và các phòng ban có thể sắp xếp các giải pháp MI để đáp ứng nhu cầu của họ. Quản lý trung tâm chỉ cần áp đặt các yêu cầu dữ liệu cần thiết cho các phân tích và MI của họ như các nguồn cấp dữ liệu được cung cấp bởi các hệ thống phòng ban. Nếu họ cần báo cáo hoặc phân tích chuyên sâu hơn về một bộ phận cụ thể thì điều này có thể được cung cấp bởi các hệ thống phòng ban.

Bài viết được liên kết dưới đây thảo luận về kho dữ liệu liên kết chuyên sâu hơn.

http://www.zentut.com/data-warehouse/federated-data-warehouse-arch architecture /

Bài viết này thảo luận về cấu trúc liên kết kho dữ liệu sâu hơn.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational- tổ chức-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational- tổ chức-part-2


Vì vậy, cả hai đều được phân cấp, nhưng liên kết tích hợp một tập hợp con (số liệu chính) tại một nơi?
LifeH2O

Đúng. Đúng rồi. Hãy nhớ rằng những định nghĩa này khá không chính thức, vì vậy mọi người có thể sử dụng chúng theo cách khác nhau. Tôi chưa bao giờ có cơ hội xây dựng một trong hai loại hệ thống, mặc dù tôi đã từng đề xuất một kiến ​​trúc liên kết một lần và tôi đã thấy một vài trang web có các hệ thống có thể được phân loại theo định nghĩa mà tôi đang sử dụng.
Mối quan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.