Sự khác biệt giữa cơ sở dữ liệu và kho dữ liệu là gì?


163

Sự khác biệt giữa cơ sở dữ liệu và kho dữ liệu là gì?

Không phải chúng giống nhau hay ít nhất là được viết trong cùng một thứ (ví dụ: Oracle RDBMS)?

Câu trả lời:


147

Kiểm tra này để biết thêm thông tin.

Từ một liên kết trước:

Cơ sở dữ liệu

  1. Được sử dụng để xử lý giao dịch trực tuyến ( OLTP ) nhưng có thể được sử dụng cho các mục đích khác như kho dữ liệu. Điều này ghi lại dữ liệu từ người dùng cho lịch sử.
  2. Các bảng và phép nối rất phức tạp vì chúng được chuẩn hóa (đối với RDMS ). Điều này được thực hiện để giảm dữ liệu dư thừa và để tiết kiệm không gian lưu trữ.
  3. Thực thể - Các kỹ thuật mô hình hóa quan hệ được sử dụng cho thiết kế cơ sở dữ liệu RDMS.
  4. Tối ưu hóa cho hoạt động viết.
  5. Hiệu suất thấp cho các truy vấn phân tích.

Kho dữ liệu

  1. Được sử dụng để xử lý phân tích trực tuyến ( OLAP ). Điều này đọc dữ liệu lịch sử cho Người dùng cho các quyết định kinh doanh.
  2. Các bảng và phép nối rất đơn giản vì chúng không được chuẩn hóa. Điều này được thực hiện để giảm thời gian phản hồi cho các truy vấn phân tích.
  3. Dữ liệu - Kỹ thuật mô hình hóa được sử dụng cho thiết kế Kho dữ liệu.
  4. Tối ưu hóa cho các hoạt động đọc.
  5. Hiệu suất cao cho các truy vấn phân tích.
  6. thường một cơ sở dữ liệu.

Điều quan trọng cần lưu ý là Kho dữ liệu có thể có nguồn gốc từ 0 đến nhiều cơ sở dữ liệu.


3
Mô hình hóa dữ liệu là một thuật ngữ chung và không chỉ áp dụng cho kho dữ liệu. (Có lẽ trong số 3 thứ hai, chúng có nghĩa là "mô hình hóa chiều", theo kinh nghiệm của tôi, đó là cách phổ biến nhất để xây dựng chúng.) Dòng cuối cùng không có ý nghĩa: kho dữ liệu "chứa" cơ sở dữ liệu như thế nào? Tôi có thể nói rằng một kho dữ liệu có nguồn gốc từ 0 đến nhiều cơ sở dữ liệu (OLTP).
Patrick Marchand

2
@Mark - Trường hợp nào nói cơ sở dữ liệu CHỈ dành cho OLTP? Nó cho thấy cơ sở dữ liệu liên quan đến kho dữ liệu.
TheCloudlessSky

5
@Nickolay - Đây là một câu trả lời hai năm tuổi. Chỉnh sửa và sửa nó nếu bạn quan tâm.
TheCloudlessSky

1
@DataMan - Đánh dấu đây là câu trả lời đúng. đó là một câu trả lời khá tốt và công bằng cho câu hỏi của bạn.
sanzy 13/03/2016

1
sự khác biệt giữa dữ liệu - Kỹ thuật mô hình hóa và Thực thể - Kỹ thuật mô hình hóa quan hệ là gì?
QAIS

32

Từ chế độ xem phi kỹ thuật: Cơ sở dữ liệu bị ràng buộc với một ứng dụng hoặc bộ ứng dụng cụ thể.

Kho dữ liệu là kho lưu trữ dữ liệu cấp doanh nghiệp. Nó sẽ chứa dữ liệu từ tất cả / nhiều phân khúc của doanh nghiệp. Nó sẽ chia sẻ thông tin này để cung cấp một bức tranh toàn cầu về doanh nghiệp. Nó cũng rất quan trọng để tích hợp giữa các phân khúc khác nhau của doanh nghiệp.

Từ góc nhìn kỹ thuật: Từ "Kho dữ liệu" không được đưa ra định nghĩa được công nhận. Cá nhân, tôi định nghĩa một kho dữ liệu là một tập hợp các dữ liệu. Trong đó mỗi data-mart bao gồm một hoặc nhiều cơ sở dữ liệu trong đó cơ sở dữ liệu dành riêng cho một bộ vấn đề cụ thể (ứng dụng, tập dữ liệu hoặc quy trình).

Đơn giản chỉ cần đặt một cơ sở dữ liệu là một thành phần của kho dữ liệu. Có nhiều nơi để khám phá khái niệm này, nhưng vì không có "định nghĩa", bạn sẽ tìm thấy những thách thức với bất kỳ câu trả lời nào bạn đưa ra.


Datamart tốt nhất là một cơ sở dữ liệu OLTP?
CᴴᴀZ

@ CᴴᴀZ để làm gì? Datamart được tạo cho OLAP, Datamart về mặt âm trầm là một DWH nhỏ (cho một phần nhỏ của doanh nghiệp). nó được tạo để Phân tích, vì vậy nếu bạn cần Hệ thống OLTP, Datamart không phải là lựa chọn của bạn, nếu bạn cần Mô hình Dữ liệu để Phân tích (Bắt đầu Lược đồ hoặc Luồng tuyết) thì bạn sẽ thích Datamart hơn.
Enrique Benito Casado

Xin chào @Enrique, có quan điểm của bạn: Datamart đóng góp cho OLAP. Tôi lấy gợi ý của Datamarts là OLTP từ đây - SQL Server OLTP Datamart .
CᴴᴀZ

Xin chào @ CᴴᴀZ, tôi đã đọc bài viết và đó sẽ chỉ là cách tạo OLTP bằng Datamart. đồng ý . (nhưng tôi nghĩ họ nói nó giống như ngoại lệ) Hãy chứng minh rằng cách họ nói qua, Bảng OLTP họ phải được chuẩn hóa để không có sự mâu thuẫn. việc chuẩn hóa không quá phức tạp để thực hiện trong lược đồ ER nhưng nó lại phức tạp hơn nhiều đối với Star-Schema hoặc Snow-Flow. Các lược đồ này được thực hiện để dễ dàng đọc trong Cơ sở dữ liệu và không phải là một hoạt động giao dịch. Đó là lý do tại sao sử dụng một Datamart như OLTP sẽ không phải là ý tưởng hay ngay cả khi có thể nhìn thấy được.
Enrique Benito Casado

16

Kho dữ liệu là một LOẠI cơ sở dữ liệu.

Ngoài những gì mọi người đã nói, kho dữ liệu có xu hướng là OLAP, với các chỉ mục, v.v. được điều chỉnh để đọc, không viết và dữ liệu được khử chuẩn hóa / chuyển thành các dạng dễ đọc và phân tích hơn.

Một số người đã nói "cơ sở dữ liệu" giống như OLTP - điều này không đúng. OLTP, một lần nữa, là một LOẠI cơ sở dữ liệu.

Các loại "cơ sở dữ liệu" khác: Tệp văn bản, XML, Excel, CSV ..., Tệp phẳng :-)


1
Đây là câu trả lời đúng của tất cả chúng. Và một chút về Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

Cách đơn giản nhất để giải thích là nói rằng kho dữ liệu không chỉ bao gồm một cơ sở dữ liệu. Cơ sở dữ liệu là một tập hợp dữ liệu được tổ chức theo một cách nào đó, nhưng kho dữ liệu được tổ chức đặc biệt để "tạo điều kiện cho báo cáo và phân tích". Tuy nhiên, đây không phải là toàn bộ câu chuyện vì kho dữ liệu cũng chứa "phương tiện để truy xuất và phân tích dữ liệu, trích xuất, chuyển đổi và tải dữ liệu và để quản lý từ điển dữ liệu cũng được coi là thành phần thiết yếu của hệ thống lưu trữ dữ liệu".

Kho dữ liệu


4

DataBase : - OLTP (quy trình giao dịch trực tuyến)

  • Đó là dữ liệu hiện tại, dữ liệu chi tiết cập nhật, dữ liệu cô lập quan hệ phẳng.
  • Mối quan hệ thực thể được sử dụng để thiết kế cơ sở dữ liệu
  • DB kích thước 100 MB-GB giao dịch đơn giản hoặc yêu cầu

Nhà máy

  • OLAP (Quy trình phân tích trực tuyến)
  • Đó là về Lược đồ sao dữ liệu, lược đồ uốn tuyết và thiên hà
  • lược đồ được sử dụng để thiết kế kho dữ liệu
  • Kích thước DB 100GB-TB Nền tảng hiệu năng truy vấn được cải thiện cho TÌM HIỂU DỮ LIỆU DỮ LIỆU DỮ LIỆU
  • Cho phép người dùng hiểu sâu hơn và hiểu biết về các khía cạnh khác nhau của dữ liệu công ty của họ thông qua truy cập nhanh, nhất quán, tương tác vào nhiều chế độ xem có thể có của dữ liệu

4

Kho dữ liệu so với cơ sở dữ liệu: Kho dữ liệu được thiết kế đặc biệt để phân tích dữ liệu, bao gồm việc đọc một lượng lớn dữ liệu để hiểu mối quan hệ và xu hướng trên dữ liệu. Một cơ sở dữ liệu được sử dụng để thu thập và lưu trữ dữ liệu, chẳng hạn như ghi lại chi tiết của giao dịch.

Data Warehouse: Thích hợp khối lượng công việc - Phân tích, báo cáo, dữ liệu lớn. Nguồn dữ liệu - Dữ liệu được thu thập và chuẩn hóa từ nhiều nguồn. Thu thập dữ liệu - Thao tác ghi hàng loạt thường theo lịch trình được xác định trước. Chuẩn hóa dữ liệu - Các lược đồ không chuẩn hóa, như lược đồ Star hoặc lược đồ Bông tuyết. Lưu trữ dữ liệu - Tối ưu hóa để đơn giản truy cập và truy vấn tốc độ cao. hiệu suất sử dụng lưu trữ cột. Truy cập dữ liệu - Tối ưu hóa để giảm thiểu I / O và tối đa hóa thông lượng dữ liệu.

Cơ sở dữ liệu giao dịch: Khối lượng công việc phù hợp - Xử lý giao dịch. Nguồn dữ liệu - Dữ liệu được thu thập từ một nguồn duy nhất, chẳng hạn như hệ thống giao dịch. Thu thập dữ liệu - Tối ưu hóa cho các hoạt động ghi liên tục vì dữ liệu mới có sẵn để tối đa hóa thông lượng giao dịch. Chuẩn hóa dữ liệu - Các lược đồ tĩnh, chuẩn hóa cao. Lưu trữ dữ liệu - Tối ưu hóa cho các hoạt động ghi cao trong suốt một khối vật lý theo hàng đơn. Truy cập dữ liệu - Khối lượng lớn các hoạt động đọc nhỏ.


1

Bất kỳ lưu trữ dữ liệu cho ứng dụng thường sử dụng cơ sở dữ liệu. Nó có thể là cơ sở dữ liệu quan hệ hoặc không có cơ sở dữ liệu sql hiện đang là xu hướng.

Kho dữ liệu cũng là cơ sở dữ liệu. Chúng ta có thể gọi cơ sở dữ liệu kho dữ liệu là lưu trữ dữ liệu chuyên biệt cho mục đích báo cáo phân tích cho công ty. Dữ liệu này được sử dụng cho quyết định kinh doanh quan trọng.

Các dữ liệu có tổ chức giúp báo cáo và đưa ra quyết định kinh doanh hiệu quả.


1

Cơ sở dữ liệu:

Được sử dụng để xử lý giao dịch trực tuyến (OLTP).

  • Định hướng giao dịch.
  • Ứng dụng định hướng.
  • Dữ liệu hiện tại.
  • Dữ liệu chi tiết.
  • Dữ liệu có thể mở rộng.
  • Nhiều người dùng, quản trị viên / hoạt động.
  • Thời gian thực hiện: ngắn.

Kho dữ liệu:

Được sử dụng để xử lý phân tích trực tuyến (OLAP).

  • Phân tích định hướng.
  • Chủ đề định hướng.
  • Dữ liệu lịch sử.
  • Dữ liệu tổng hợp.
  • Dữ liệu tĩnh.
  • Không có nhiều người dùng, người quản lý.
  • Thời gian thực hiện: dài.

1

Kho dữ liệu (DW) là quá trình thu thập và quản lý dữ liệu từ nhiều nguồn khác nhau để cung cấp những hiểu biết kinh doanh có ý nghĩa. Kho dữ liệu thường được sử dụng để kết nối và phân tích dữ liệu kinh doanh từ các nguồn không đồng nhất. Kho dữ liệu là cốt lõi của hệ thống BI được xây dựng để phân tích và báo cáo dữ liệu.


0

Nguồn cho kho dữ liệu có thể là cụm cơ sở dữ liệu, vì cơ sở dữ liệu được sử dụng cho quy trình Giao dịch trực tuyến như lưu giữ các bản ghi hiện tại..nhưng trong kho dữ liệu, nó lưu trữ dữ liệu lịch sử dành cho quy trình phân tích trực tuyến.


0

Kho dữ liệu là một loại cấu trúc dữ liệu thường được lưu trữ trên cơ sở dữ liệu. Kho dữ liệu đề cập đến mô hình dữ liệu và loại dữ liệu nào được lưu trữ ở đó - dữ liệu được mô hình hóa (mô hình dữ liệu) để phục vụ mục đích phân tích.

Cơ sở dữ liệu có thể được phân loại là bất kỳ cấu trúc nào chứa dữ liệu. Theo truyền thống, đó sẽ là một RDBMS như Oracle, SQL Server hoặc MySQL. Tuy nhiên, Cơ sở dữ liệu cũng có thể là Cơ sở dữ liệu NoQuery như Apache Cassandra hoặc MPP cột như AWS RedShift.

Bạn thấy một cơ sở dữ liệu chỉ đơn giản là một nơi để lưu trữ dữ liệu; kho dữ liệu là một cách cụ thể để lưu trữ dữ liệu và phục vụ một mục đích cụ thể, đó là phục vụ các truy vấn phân tích.

OLTP so với OLAP không cho bạn biết sự khác biệt giữa DW và Cơ sở dữ liệu, cả OLTP và OLAP đều nằm trên cơ sở dữ liệu. Họ chỉ lưu trữ dữ liệu theo một kiểu khác (phương pháp mô hình dữ liệu khác nhau) và phục vụ các mục đích khác nhau (OLTP - ghi lại các giao dịch, được tối ưu hóa để cập nhật; OLAP - phân tích thông tin, tối ưu hóa để đọc).


-1

Xem bằng các từ đơn giản: Dữ liệu -> Dữ liệu khổng lồ sử dụng cho Phân tích / lưu trữ / sao chép và Phân tích. Cơ sở dữ liệu -> Hoạt động CRUD với dữ liệu thường được sử dụng.

Nhà Dat biết là loại lưu trữ mà bạn không sử dụng hàng ngày và Cơ sở dữ liệu là thứ mà bạn thường xuyên giao dịch.

Ví dụ. Nếu chúng tôi đang yêu cầu sao kê của ngân hàng thì nó sẽ cung cấp cho chúng tôi 3/4 tháng 6 tháng 6 tháng trước, đó là trong cơ sở dữ liệu. Nếu bạn muốn nhiều hơn thế, nó lưu trữ trên nhà Dat biết.


-1

Ví dụ: Một ngôi nhà có giá trị $100,000, và nó được đánh giá cao $1000mỗi năm.

Để theo dõi giá trị căn nhà hiện tại, bạn sẽ sử dụng cơ sở dữ liệu vì giá trị sẽ thay đổi hàng năm.

Ba năm sau, bạn sẽ có thể thấy giá trị của ngôi nhà $103,000.

Để theo dõi giá trị ngôi nhà lịch sử, bạn sẽ sử dụng kho dữ liệu làm giá trị của ngôi nhà

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.