Sự khác biệt giữa bảng Fact và bảng thứ nguyên?


112

Khi đọc một cuốn sách dành cho các đối tượng kinh doanh, tôi bắt gặp bảng thuật ngữ và bảng kích thước.

Tôi đang cố gắng tìm hiểu sự khác nhau giữa bảng Thứ nguyên và bảng Dữ kiện là gì?

Tôi đọc một vài bài báo trên internet nhưng tôi không thể hiểu rõ ràng ..

Bất kỳ ví dụ đơn giản sẽ giúp tôi hiểu rõ hơn?


Khái niệm này khá dài để mô tả chi tiết tốt, nếu bạn có một vấn đề cụ thể ngoài định nghĩa cơ bản, vui lòng cho chúng tôi biết về nó.
NoChance

Về cơ bản, tôi đang cố gắng hiểu liệu bảng kích thước cũng có thể là bảng dữ kiện hay không?

Câu trả lời:


52

Đây là để trả lời một phần:

Tôi đang cố gắng hiểu liệu bảng kích thước cũng có thể là bảng dữ kiện hay không?

Câu trả lời ngắn gọn (INMO) là Không là do 2 loại bảng được tạo ra vì những lý do khác nhau. Tuy nhiên, từ quan điểm thiết kế cơ sở dữ liệu, một bảng thứ nguyên có thể có một bảng cha như trường hợp của bảng dữ kiện luôn có một bảng thứ nguyên (hoặc nhiều hơn) như một bảng cha. Ngoài ra, bảng dữ kiện có thể được tổng hợp, trong khi bảng Thứ nguyên không được tổng hợp. Một lý do khác là bảng dữ kiện không được cập nhật tại chỗ trong khi bảng Thứ nguyên có thể được cập nhật tại chỗ trong một số trường hợp.

Thêm chi tiết:

Bảng dữ kiện và kích thước xuất hiện trong một cái thường được gọi là Lược đồ hình sao. Mục đích chính của giản đồ hình sao là đơn giản hóa một tập hợp các bảng chuẩn hóa phức tạp và hợp nhất dữ liệu (có thể từ các hệ thống khác nhau) thành một cấu trúc cơ sở dữ liệu có thể được truy vấn theo cách rất hiệu quả.

Ở dạng đơn giản nhất, nó chứa một bảng dữ kiện (Ví dụ: StoreSales) và một hoặc nhiều bảng thứ nguyên. Mỗi mục nhập Thứ nguyên có 0,1 hoặc nhiều bảng dữ kiện được liên kết với nó (Ví dụ về bảng thứ nguyên: Địa lý, Mặt hàng, Nhà cung cấp, Khách hàng, Thời gian, v.v.). Nó cũng sẽ hợp lệ cho thứ nguyên có cha mẹ, trong trường hợp đó, mô hình thuộc loại "Snow Flake". Tuy nhiên, các nhà thiết kế cố gắng tránh kiểu thiết kế này vì nó gây ra nhiều liên kết hơn khiến hiệu suất chậm hơn. Trong ví dụ về StoreSales, thứ nguyên Địa lý có thể bao gồm các cột (GeoID, ContenentName, CountryName, StateProvName, CityName, StartDate, EndDate)

Trong mô hình Snow Flakes, bạn có thể có 2 bảng chuẩn hóa cho thông tin Địa lý, đó là: Bảng Nội dung, Bảng Quốc gia.

Bạn có thể tìm thấy rất nhiều ví dụ trên Star Schema. Ngoài ra, hãy kiểm tra phần này để xem một chế độ xem thay thế trên mô hình giản đồ sao Inmon vs. Kimball . Kimbal có một diễn đàn tốt mà bạn cũng có thể muốn xem tại đây: Diễn đàn Kimball .

Chỉnh sửa: Để trả lời nhận xét về các ví dụ cho 4NF:

  • Ví dụ cho một bảng dữ kiện vi phạm 4NF:

Thông tin bán hàng (ID, BranchID, SalesPersonID, ItemID, Số lượng, TimeID)

  • Ví dụ cho một bảng dữ kiện không vi phạm 4NF:

AggregatedSales (BranchID, TotalAmount)

Đây là mối quan hệ trong 4NF

Ví dụ cuối cùng là khá phổ biến.


1
Một số bảng thông tin phản ánh dữ liệu mức giao dịch. Một số phản ánh dữ liệu tổng hợp. Bảng dữ kiện trong Lược đồ sao không nhất thiết phải nằm trong 3NF. Ví dụ: Dữ kiện bán hàng có thể chứa dữ liệu như (ID, BranchID, Số tiền, Người bán hàng, Thời gian) - Điều này vi phạm 3NF, BCNF và 4NF vì sự phụ thuộc của Người bán hàng và Chi nhánh. Theo đó, bảng thông tin điển hình nằm trong 4NF là không đúng.
NoChance

258

Trong Mô hình kho dữ liệu, giản đồ hình saogiản đồ bông tuyết bao gồm các bảng Sự kiệnThứ nguyên .

Bảng dữ kiện:

  • Nó chứa tất cả các khóa chính của thứ nguyên và các dữ kiện hoặc thước đo liên quan (là thuộc tính có thể thực hiện các phép tính) như số lượng đã bán, số lượng đã bán và doanh số trung bình.

Bảng kích thước:

  • Bảng kích thước cung cấp thông tin mô tả cho tất cả các phép đo được ghi trong bảng thực tế.
  • Kích thước tương đối rất nhỏ so với bảng thực tế.
  • Các kích thước thường được sử dụng là người, sản phẩm, địa điểm và thời gian.

nhập mô tả hình ảnh ở đây

nguồn hình ảnh


52
điều này hữu ích hơn rất nhiều so với câu trả lời được chấp nhận
Booji Boy 16/02

15
Chà, Một bức tranh có giá trị bằng một ngàn lời nói. Tôi không hiểu gì khi đọc các câu trả lời khác, nhưng câu trả lời này đã cứu tôi.
The One

Kích thước trông tương đối lớn so với bảng dữ kiện trong sơ đồ vì nó có nhiều dữ liệu mô tả hơn. Và chúng cũng nhiều hơn về số lượng
Blue Clouds

1
@Blue Clouds: Bạn phải nhận ra rằng Fact-Table chứa một mục nhập cho mọi kết hợp có thể có của for dim´s (ít nhất là nếu có dữ liệu). Mặc dù Thứ nguyên vị trí ở mức tối đa sẽ chứa một mục nhập cho mọi vị trí có thể (giả sử 50 điểm bán hàng) và sẽ hiếm khi phát triển, khi vị trí mới được thêm vào, bảng Dữ kiện có thể sẽ tăng lên mỗi ngày theo vị trí x mặt hàng x nhánh. Vì vậy, sự thật sẽ nhận được số lượng lớn hồ sơ khá nhanh.
Daniel

@Premraj Bảng dữ kiện có thể tồn tại mà không có khóa chính không?
Kalana

109

Đây dường như là một câu trả lời rất đơn giản về cách phân biệt giữa bảng dữ kiện và bảng thứ nguyên!

Nó có thể hữu ích khi nghĩ về kích thước như một sự vật hoặc vật thể. Một thứ chẳng hạn như một sản phẩm có thể tồn tại mà không cần tham gia vào một sự kiện kinh doanh nào. Một chiều là danh từ của bạn. Nó là thứ có thể tồn tại độc lập với một sự kiện kinh doanh, chẳng hạn như bán hàng. Sản phẩm, nhân viên, thiết bị, là tất cả những thứ tồn tại. Một thứ nguyên hoặc làm điều gì đó, hoặc đã làm gì đó với nó.

Nhân viên bán, khách hàng mua. Nhân viên và khách hàng là những ví dụ về kích thước, họ làm.

Sản phẩm được bán, chúng cũng là kích thước khi chúng có tác dụng gì đó với chúng.

Sự thật, là động từ. Một mục nhập trong bảng dữ kiện đánh dấu một sự kiện rời rạc xảy ra với một cái gì đó từ bảng thứ nguyên. Một lần bán sản phẩm sẽ được ghi lại trong một bảng dữ kiện. Sự kiện bán hàng sẽ được ghi nhận bởi sản phẩm nào đã được bán, nhân viên nào đã bán nó và khách hàng nào đã mua nó. Sản phẩm, Nhân viên và Khách hàng là tất cả các thứ nguyên mô tả sự kiện, bán hàng.

Ngoài ra, bảng dữ liệu cũng thường có một số loại dữ liệu định lượng. Số lượng đã bán, giá mỗi mặt hàng, tổng giá, v.v.

Nguồn: http://arcanecode.com/2007/07/23/dimensions-versus-facts-in-data-warehousing/


5
Viết rất hay, chỉ cần 5 phút để hiểu khái niệm.
user1951

Tóm lại: thứ nguyên là thuộc tính của sự kiện thực tế. HÀNG NGÀY. Bạn đang làm gì, DAFE?
youcantryreachingme

3
Vâng, đó là cách tôi nhớ về họ. Nó trái ngược với những gì bạn nghĩ. Bạn sẽ nghĩ rằng các sự kiện được sắp đặt trong đá và các kích thước là động, dựa trên chính các từ. Tuy nhiên, nó ngược lại: một bảng mờ cơ bản là một danh sách tra cứu khá tĩnh và một bảng dữ kiện cơ bản là dữ liệu sống đang được nhập vào.
undrline

1
Đây là lời giải thích yêu thích của tôi và khiến nó ấn tượng trong đầu tôi, cảm ơn!
Arjun Arun

9

Tôi thấy câu trả lời này dễ hiểu hơn từ quan điểm của một người không biết nhiều về thuật ngữ DB / DW.

http://databases.about.com/od/datamining/a/Facts-Vs-Dimensions.htm

Tôi khuyên bạn nên xem qua vấn đề này trước và sau đó xem qua câu trả lời của Emmad Kareem để biết thêm chi tiết. Hy vọng nó hữu ích.


1
Lời giải thích đầu tiên đã hoàn toàn rõ ràng. Một ví dụ rất hữu ích, bằng ngôn ngữ đơn giản, tiết lộ một số chi tiết. Bây giờ tôi cuối cùng đã nhận được nó.
sharon

Rất hay ... Tôi nghĩ bạn đã đúng ... hãy đọc nó trước. Tất cả các câu trả lời đều hữu ích ... nhưng câu trả lời này có cách diễn đạt khái niệm theo nghĩa 'con người' hơn.
Code Novice vào

4

Giải thích siêu đơn giản:

Bảng dữ liệu: bảng dữ liệu ánh xạ các ID tra cứu với nhau. Thường là một trong những bảng chính trung tâm cho ứng dụng của bạn.

Bảng thứ nguyên: bảng tra cứu được sử dụng để lưu trữ các giá trị (chẳng hạn như tên thành phố hoặc tiểu bang) được lặp lại thường xuyên trong bảng dữ kiện.


2

Ở dạng đơn giản nhất, tôi nghĩ rằng một bảng thứ nguyên giống như một bảng 'Master' - nó lưu giữ một danh sách tất cả các 'mục', có thể nói như vậy.

Bảng dữ kiện là một bảng giao dịch mô tả tất cả các giao dịch. Ngoài ra, dữ liệu tổng hợp (được nhóm lại) như tổng doanh số bán hàng theo người bán hàng, tổng doanh số bán hàng theo chi nhánh - các loại bảng này cũng có thể tồn tại dưới dạng bảng dữ kiện độc lập.


2

Bảng thứ nguyên Bảng thứ nguyên là một bảng chứa các thuộc tính của các phép đo được lưu trong bảng dữ kiện. Bảng này bao gồm cấu trúc phân cấp, danh mục và logic có thể được sử dụng để duyệt trong các nút.

Bảng dữ kiện chứa phép đo các quy trình nghiệp vụ và nó chứa các khóa ngoại cho các bảng thứ nguyên.

Ví dụ - Nếu quy trình kinh doanh là sản xuất gạch

Số lượng gạch trung bình do một người / máy sản xuất - thước đo quá trình kinh doanh


1
  1. Bảng dữ kiện chủ yếu bao gồm dữ kiện nghiệp vụ và khóa ngoại tham chiếu đến khóa chính trong bảng thứ nguyên. Bảng thứ nguyên chủ yếu bao gồm các thuộc tính mô tả là các trường văn bản.
  2. Bảng thứ nguyên chứa khóa thay thế, khóa tự nhiên và một tập hợp các thuộc tính. Ngược lại, bảng dữ kiện chứa khóa ngoại, số đo và kích thước suy biến.
  3. Bảng thứ nguyên cung cấp thông tin mô tả hoặc theo ngữ cảnh để đo lường bảng dữ kiện. Mặt khác, các bảng thực tế cung cấp các phép đo của một doanh nghiệp.
  4. Khi so sánh kích thước của hai bảng, bảng dữ kiện lớn hơn bảng chiều. Trong bảng so sánh, nhiều kích thước được trình bày hơn bảng dữ kiện. Trong một bảng dữ kiện, số lượng dữ kiện được quan sát ít hơn.
  5. Bảng thứ nguyên phải được tải trước. Trong khi tải bảng dữ kiện, người ta phải nhìn vào bảng kích thước. Điều này là do bảng dữ kiện có các số đo, dữ kiện và khóa ngoại là khóa chính trong bảng thứ nguyên.

Đọc thêm: Bảng kích thước và bảng dữ kiện | Sự khác biệt giữa | Bảng thứ nguyên so với Bảng dữ kiện http://www.differencebetween.net/technology/hardware-technology/dimension-table-and-fact-table/#ixzz3SBp8kPzo


-3

Bảng thứ nguyên: Nó không là gì nhưng chúng ta có thể duy trì thông tin về ngày đặc trưng được gọi là bảng thứ nguyên.

Ví dụ: Thứ nguyên thời gian, Thứ nguyên sản phẩm.

Bảng dữ kiện: Nó không là gì nhưng chúng tôi có thể duy trì thông tin về các chỉ số hoặc dữ liệu tính toán trước.

Ví dụ: Dữ kiện bán hàng, Thông tin đặt hàng.

Lược đồ hình sao: một liên kết bảng dữ kiện với biểu mẫu bảng thứ nguyên dưới dạng một Lược đồ Bắt đầu.

nhập mô tả hình ảnh ở đây


2
(Bài đăng này dường như không cung cấp câu trả lời chất lượng cho câu hỏi. Vui lòng chỉnh sửa câu trả lời của bạn hoặc chỉ đăng nó dưới dạng nhận xét cho câu hỏi).
sɐunıɔ ןɐ qɐp
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.