CDF thực nghiệm vs CDF


20

Tôi đang tìm hiểu về Hàm phân phối tích lũy theo kinh nghiệm. Nhưng tôi vẫn không hiểu

  1. Tại sao lại gọi là 'Thực nghiệm'?

  2. Có sự khác biệt nào giữa CDF theo kinh nghiệm và CDF không?



Có một lời giải thích đơn giản, đơn giản, thanh lịch về mặt vé trong các mô hình hộp : CDF mô tả những gì trong hộp ban đầu. ECDF là những gì bạn nhận được khi đặt mẫu của mình (là một bộ vé được lấy từ hộp ban đầu: cái gọi là dữ liệu "theo kinh nghiệm") vào một hộp trống.
whuber

Một điều cần lưu ý là phân phối theo kinh nghiệm của bạn thường bị ràng buộc bởi cách nó được xây dựng, trong khi CDF có thể không. Chẳng hạn, nếu bạn xây dựng CDF theo kinh nghiệm từ các quan sát biến Poisson, ECDF thu được sẽ bị giới hạn bởi tần số quan sát cao nhất, trong khi CDF thực sự không bị ràng buộc.
Aksakal

Câu trả lời:


26

Đặt X là biến ngẫu nhiên.

  • Hàm phân phối tích lũy F(x) cho P(Xx) .
  • Hàm hàm phân phối tích lũy theo kinh nghiệm G(x) cho P(Xx) dựa trên các quan sát trong mẫu của bạn.

Sự khác biệt là biện pháp xác suất được sử dụng. Đối với CDF theo kinh nghiệm, bạn sử dụng thước đo xác suất được xác định bằng số tần số trong một mẫu thực nghiệm.

Ví dụ đơn giản (lật đồng xu):

Đặt là biến ngẫu nhiên biểu thị kết quả của một lần lật đồng xu trong đó biểu thị các đầu và biểu thị đuôi.XX= =1X= =0

CDF cho một đồng tiền công bằng được đưa ra bởi:

F(x)= ={0cho x<012cho 0x<11cho 1x

Nếu bạn lật 2 đầu và 1 đuôi, CDF theo kinh nghiệm sẽ là:

G(x)= ={0cho x<023cho 0x<11cho 1x

CDF theo kinh nghiệm sẽ phản ánh rằng trong mẫu của bạn, số lần lật của bạn là đầu.2/3

Một ví dụ khác ( là CDF cho phân phối bình thường):F

Đặt là biến ngẫu nhiên phân phối bình thường với giá trị trung bình và độ lệch chuẩn .X01

CDF được đưa ra bởi:

F(x)= =-x12πe-x22

Giả sử bạn có 3 lần rút IID và nhận được các giá trị . CDF theo kinh nghiệm sẽ là: x1<x2<x3

G(y)= ={0cho y<x113cho x1y<x223cho x2y<x31cho x3y

Với đủ số lần rút IID (và một số điều kiện đều đặn được thỏa mãn), CDF theo kinh nghiệm sẽ hội tụ vào CDF cơ bản của dân số.


12

Có sự khác biệt nào giữa CDF theo kinh nghiệm và CDF không?

Vâng, họ khác nhau. Một cdf theo kinh nghiệm là một cdf thích hợp, nhưng các cdf theo kinh nghiệm sẽ luôn luôn rời rạc ngay cả khi không được rút ra từ một phân phối rời rạc, trong khi cdf của một phân phối có thể là những thứ khác ngoài việc rời rạc.

Nếu bạn coi một mẫu như thể đó là một quần thể các giá trị, thì mỗi mẫu có thể xảy ra như nhau (nghĩa là xác suất đặt 1 / n trên mỗi quan sát) thì cdf của phân phối đó sẽ là ECDF của dữ liệu.

Tại sao nó được gọi là 'Thực nghiệm'?

Đó là ước tính của cdf dân số dựa trên mẫu; cụ thể nếu bạn xử lý tỷ lệ của mẫu ở mỗi giá trị dữ liệu riêng biệt và coi nó như một xác suất trong dân số, bạn sẽ nhận được ECDF.

Theo kinh nghiệm có ý nghĩa gì đó như "bằng quan sát chứ không phải lý thuyết", và đó chính xác là ý nghĩa của nó trong trường hợp này ... sử dụng các quan sát để xác định hàm phân phối.


10

CDF theo kinh nghiệm được xây dựng từ một bộ dữ liệu thực tế (trong sơ đồ bên dưới, tôi đã sử dụng 100 mẫu từ phân phối chuẩn thông thường). CDF là một cấu trúc lý thuyết - đó là những gì bạn sẽ thấy nếu bạn có thể lấy vô số mẫu.

CDF theo kinh nghiệm thường xấp xỉ CDF khá tốt, đặc biệt là đối với các mẫu lớn (trên thực tế, có những định lý về tốc độ hội tụ của nó đến CDF khi kích thước mẫu tăng lên).

CDF thực nghiệm vs CDF


10

Thực nghiệm là một cái gì đó bạn xây dựng từ dữ liệu và quan sát. Chẳng hạn, giả sử bạn muốn biết về sự phân bố chiều cao của mọi người trong một quốc gia. Bạn bắt đầu bằng cách đo người và đưa ra biểu đồ có thể xấp xỉ với phân phối. Sau đó, bạn tính toán CDF theo kinh nghiệm.

Nếu bạn đang sử dụng phân phối thống kê (một công thức xác định cho cùng một đầu ra chính xác với cùng các tham số), bạn cũng có thể tính CDF của nó.

N(μ= =1,75 m,σ= =0,1 m)


Có một phép đo độ tin cậy nào được sử dụng thể hiện khả năng CDF và CDF Emperical mô tả cùng một quần thể trong giới hạn của tất cả các mẫu thử nghiệm trên thế giới? Điều này dường như có ứng dụng cho bỏ phiếu bầu cử, ví dụ. (mặc dù có thể là không, vì đầu ra không được mô tả đúng như một chức năng ...)
BenPen

3

Theo Dictionary.com , các định nghĩa của "theo kinh nghiệm" bao gồm:

bắt nguồn từ hoặc được hướng dẫn bởi kinh nghiệm hoặc thử nghiệm.

Do đó, CDF theo kinh nghiệm là CDF bạn có được từ dữ liệu của mình. Điều này trái ngược với CDF lý thuyết (thường được gọi là "CDF"), được lấy từ mô hình thống kê hoặc xác suất như phân phối chuẩn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.