Tôi đang tìm hiểu về Hàm phân phối tích lũy theo kinh nghiệm. Nhưng tôi vẫn không hiểu
Tại sao lại gọi là 'Thực nghiệm'?
Có sự khác biệt nào giữa CDF theo kinh nghiệm và CDF không?
Tôi đang tìm hiểu về Hàm phân phối tích lũy theo kinh nghiệm. Nhưng tôi vẫn không hiểu
Tại sao lại gọi là 'Thực nghiệm'?
Có sự khác biệt nào giữa CDF theo kinh nghiệm và CDF không?
Câu trả lời:
Đặt là biến ngẫu nhiên.
Sự khác biệt là biện pháp xác suất được sử dụng. Đối với CDF theo kinh nghiệm, bạn sử dụng thước đo xác suất được xác định bằng số tần số trong một mẫu thực nghiệm.
Đặt là biến ngẫu nhiên biểu thị kết quả của một lần lật đồng xu trong đó biểu thị các đầu và biểu thị đuôi.
CDF cho một đồng tiền công bằng được đưa ra bởi:
Nếu bạn lật 2 đầu và 1 đuôi, CDF theo kinh nghiệm sẽ là:
CDF theo kinh nghiệm sẽ phản ánh rằng trong mẫu của bạn, số lần lật của bạn là đầu.
Đặt là biến ngẫu nhiên phân phối bình thường với giá trị trung bình và độ lệch chuẩn .
CDF được đưa ra bởi:
Giả sử bạn có 3 lần rút IID và nhận được các giá trị . CDF theo kinh nghiệm sẽ là:
Với đủ số lần rút IID (và một số điều kiện đều đặn được thỏa mãn), CDF theo kinh nghiệm sẽ hội tụ vào CDF cơ bản của dân số.
Có sự khác biệt nào giữa CDF theo kinh nghiệm và CDF không?
Vâng, họ khác nhau. Một cdf theo kinh nghiệm là một cdf thích hợp, nhưng các cdf theo kinh nghiệm sẽ luôn luôn rời rạc ngay cả khi không được rút ra từ một phân phối rời rạc, trong khi cdf của một phân phối có thể là những thứ khác ngoài việc rời rạc.
Nếu bạn coi một mẫu như thể đó là một quần thể các giá trị, thì mỗi mẫu có thể xảy ra như nhau (nghĩa là xác suất đặt 1 / n trên mỗi quan sát) thì cdf của phân phối đó sẽ là ECDF của dữ liệu.
Tại sao nó được gọi là 'Thực nghiệm'?
Đó là ước tính của cdf dân số dựa trên mẫu; cụ thể nếu bạn xử lý tỷ lệ của mẫu ở mỗi giá trị dữ liệu riêng biệt và coi nó như một xác suất trong dân số, bạn sẽ nhận được ECDF.
Theo kinh nghiệm có ý nghĩa gì đó như "bằng quan sát chứ không phải lý thuyết", và đó chính xác là ý nghĩa của nó trong trường hợp này ... sử dụng các quan sát để xác định hàm phân phối.
CDF theo kinh nghiệm được xây dựng từ một bộ dữ liệu thực tế (trong sơ đồ bên dưới, tôi đã sử dụng 100 mẫu từ phân phối chuẩn thông thường). CDF là một cấu trúc lý thuyết - đó là những gì bạn sẽ thấy nếu bạn có thể lấy vô số mẫu.
CDF theo kinh nghiệm thường xấp xỉ CDF khá tốt, đặc biệt là đối với các mẫu lớn (trên thực tế, có những định lý về tốc độ hội tụ của nó đến CDF khi kích thước mẫu tăng lên).
Thực nghiệm là một cái gì đó bạn xây dựng từ dữ liệu và quan sát. Chẳng hạn, giả sử bạn muốn biết về sự phân bố chiều cao của mọi người trong một quốc gia. Bạn bắt đầu bằng cách đo người và đưa ra biểu đồ có thể xấp xỉ với phân phối. Sau đó, bạn tính toán CDF theo kinh nghiệm.
Nếu bạn đang sử dụng phân phối thống kê (một công thức xác định cho cùng một đầu ra chính xác với cùng các tham số), bạn cũng có thể tính CDF của nó.
Theo Dictionary.com , các định nghĩa của "theo kinh nghiệm" bao gồm:
bắt nguồn từ hoặc được hướng dẫn bởi kinh nghiệm hoặc thử nghiệm.
Do đó, CDF theo kinh nghiệm là CDF bạn có được từ dữ liệu của mình. Điều này trái ngược với CDF lý thuyết (thường được gọi là "CDF"), được lấy từ mô hình thống kê hoặc xác suất như phân phối chuẩn.