Trung bình, chế độ, tỷ lệ phần trăm và OLAP


9

Tôi là người mới đang cố gắng quấn đầu quanh OLAP và tôi có một vài câu hỏi.

  • Câu hỏi 1: Một khối OLAP có thể lưu trữ trung vị, chế độ, phần trăm không?
  • Câu hỏi 2: Truy vấn MDX do người dùng viết có thể trả về bản tóm tắt dữ liệu cấp hàng không? (ví dụ:% giao dịch> $ 100). Hoặc phải thiết kế khối lập phương thêm điều này vào khối?
  • Câu hỏi 3: Hiện tại có sản phẩm OLAP nào cung cấp cơ chế truy cập dữ liệu cấp hàng không? Cái nào?

Phòng CNTT của chúng tôi đang tìm kiếm phản hồi về loại vấn đề chúng tôi gặp phải với khối lập phương ROLAP của MS Analsis Services cụ thể. Chúng tôi không có quyền truy cập vào cơ sở dữ liệu quan hệ đằng sau nó và cần thực hiện các tính toán hiện không khả dụng dưới dạng các biện pháp trong khối.

Hãy để tôi xem nếu tôi có quyền này.

  1. Một khối lập phương có thể cung cấp số liệu thống kê cho số lượng, phương tiện, tỷ lệ, độ lệch chuẩn.
  2. Nếu một thống kê cụ thể chưa được phục vụ trong một biện pháp do nhà thiết kế khối cung cấp, chúng ta có thể viết một truy vấn MDX để lấy nó không? Hay họ cần thay đổi khối lập phương để tính toán trước từ dữ liệu cấp hàng?
  3. Một khối lập phương không thể cung cấp số liệu thống kê như trung bình, chế độ hoặc phần trăm, vì vậy các số liệu thống kê này không tổng hợp đúng.

Tôi đang đọc cuốn Ngữ pháp đồ họa của Leland Wilkinson và trong chương về Khai thác dữ liệu và OLAP, ông nói

Các [hoạt động khối] này hoạt động tốt với các số liệu thống kê như số lượng, phương tiện, tỷ lệ và độ lệch chuẩn. Các tập hợp đơn giản trên các lớp con có thể được tính bằng cách vận hành trên tổng, tổng bình phương và các thuật ngữ khác được kết hợp trong các hàm tuyến tính để tạo ra các thống kê tóm tắt cơ bản.

Chúng không hoạt động đúng với các số liệu thống kê như trung vị, chế độ và phân vị vì tổng số của các thống kê này không phải là thống kê tổng hợp của chúng. Ví dụ, trung vị của trung vị không phải là trung vị của tổng hợp.

Ông tiếp tục thêm:

Tuy nhiên, một mô hình ROLAP tinh vi hơn đã xuất hiện gần đây. Có thể, thông qua một số công nghệ, để cung cấp cho các thuật toán thống kê quyền truy cập vào dữ liệu thô thông qua mô hình quan hệ trong thời gian thực. Cách tiếp cận này hứa hẹn hơn các tập hợp cứng nhắc được cung cấp bởi các cấu trúc như khối dữ liệu.

Ở dạng thanh lịch nhất của kiến ​​trúc này, các ứng dụng có thể yêu cầu các kết nối từ xa cung cấp thông tin về các phương thức xử lý dữ liệu của họ và thực hiện hành động phù hợp tùy thuộc vào thông tin được trả về. Trong hình thức này, kiến ​​trúc thành phần có thể đạt được lời hứa thực sự của điện toán phân tán: thiết kế và thực thi độc lập với trang web, hệ điều hành hoặc ngôn ngữ.

Điều đó đã được viết vào khoảng năm 2005. Có ai biết các sản phẩm sử dụng phương pháp này để cho phép truy cập dữ liệu cấp hàng không?


1
Không có người nhận? Bất kỳ đề xuất về cách cải thiện câu hỏi để gợi ra một câu trả lời?
Tommy O'Dell

Câu trả lời:


5

Để trả lời câu hỏi của bạn theo thứ tự:

  1. Khối không lưu trữ trung vị, chế độ (hoặc thậm chí trung bình), nhưng bạn có thể viết các truy vấn tính toán chúng và nhúng chúng dưới dạng các số đo được tính trong khối. Khả năng nhúng loại tính toán này là một trong những điểm bán hàng độc đáo chính của công nghệ OLAP.
  2. Nếu bạn có thứ nguyên có thể xác định các hàng riêng lẻ (có thể là thứ nguyên suy biến hoặc 'thực tế' được lấy từ một mã định danh trên bảng thực tế) thì bạn có thể thực hiện truy vấn dựa trên các hàng riêng lẻ. Tuy nhiên, OLAP hoạt động theo các thứ nguyên và tổng hợp, do đó bạn sẽ cần phải có thứ nguyên có khả năng xác định các hàng riêng lẻ (với tổng hợp bao gồm một giá trị).
  3. Bất kỳ công cụ OLAP nào cũng có thể thực hiện những gì được mô tả trong (2), ngoài ra chúng thường hỗ trợ một cơ chế được gọi là 'khoan xuyên qua' trong đó khối sẽ trả về một đường viền của dữ liệu giao dịch nằm dưới một lát cắt nhất định mà bạn khoan vào.

Nếu bạn muốn thực hiện các phép tính không có sẵn trực tiếp trong tập lệnh khối, nhiều công cụ OLAP như ProClarity muộn, than thở sẽ cho phép bạn tạo các truy vấn liên quan đến các phép tính dựa trên MDX tùy chỉnh. Trừ khi khối không có thông tin bạn cần để thực hiện các tính toán thực tế, các tính toán MDX tùy chỉnh sẽ có thể hỗ trợ mọi tính toán bạn cần.

Mặc dù các truy vấn OLAP thường được liên kết với các truy vấn thống kê trong tổng hợp, nhưng nếu bạn có thứ nguyên cho phép đi sâu vào chi tiết, bạn cần chắc chắn có thể tạo các truy vấn sẽ tính toán trung bình, phần trăm hoặc truy vấn biểu đồ từ đó các chế độ có thể được suy ra hoặc tính toán.

Ví dụ: đây có một ví dụ về truy vấn phân tích pareto , dựa trên bảng xếp hạng.

Nhiều sản phẩm khối có thể hoạt động ở chế độ OLAP lai hoặc quan hệ, trong đó chúng không tự duy trì dữ liệu mà truy vấn nó từ cơ sở dữ liệu cơ bản. Ngoài ra, các công cụ ROLAP thuần túy như Đối tượng kinh doanh, Trình tạo báo cáo hoặc Trình khám phá có thể truy vấn từ cơ sở dữ liệu cơ bản và thực hiện từng bước công việc. Tuy nhiên, họ có xu hướng thiếu sự tinh tế của các sản phẩm OLAP chuyên dụng và họ không có nhiều khả năng phân tích thống kê.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.