Mặc dù một số bài đăng trên trang web đề cập đến nhiều thuộc tính khác nhau của Cauchy, tôi đã không quản lý được vị trí của một bài viết thực sự đặt chúng cùng nhau. Hy vọng rằng đây có thể là một nơi tốt để thu thập một số. Tôi có thể mở rộng này.
Đuôi nặng
Trong khi Cauchy đối xứng và có hình chuông gần giống nhau, hơi giống phân bố bình thường, nó có đuôi nặng hơn nhiều (và ít hơn một "vai"). Ví dụ, có một xác suất nhỏ nhưng khác biệt rằng một biến ngẫu nhiên Cauchy sẽ đặt hơn 1000 phạm vi liên dải từ trung vị - gần giống với một biến ngẫu nhiên bình thường có ít nhất 2,67 phạm vi liên dải từ trung vị của nó.
Phương sai
Phương sai của Cauchy là vô hạn.
Chỉnh sửa: JG nói trong các bình luận rằng nó không được xác định. Nếu chúng ta lấy phương sai là trung bình của một nửa khoảng cách bình phương giữa các cặp giá trị - giống hệt với phương sai khi cả hai tồn tại, thì nó sẽ là vô hạn. Tuy nhiên, theo định nghĩa thông thường JG là chính xác. [Tuy nhiên, ngược lại với phương tiện mẫu, không thực sự hội tụ với bất cứ thứ gì khi n trở nên lớn, phân phối phương sai mẫu tiếp tục tăng kích thước khi kích thước mẫu tăng; thang đo tăng tỷ lệ thuận với n hoặc tương đương phân phối phương sai log tăng trưởng tuyến tính với kích thước mẫu. Có vẻ hữu ích khi thực sự xem xét rằng phiên bản của phương sai mang lại vô hạn đang nói với chúng ta điều gì đó.]
Dĩ nhiên, độ lệch chuẩn mẫu tồn tại, nhưng mẫu càng lớn thì chúng càng có xu hướng lớn hơn (ví dụ độ lệch chuẩn mẫu trung bình tại n = 10 nằm trong khoảng 3,67 lần tham số tỷ lệ (một nửa IQR), nhưng tại n = 100 đó là khoảng 11,9).
Nghĩa là
Phân phối Cauchy thậm chí không có ý nghĩa hữu hạn; tích phân cho trung bình không hội tụ. Kết quả là, ngay cả luật số lượng lớn cũng không áp dụng - khi n phát triển, mẫu có nghĩa là không hội tụ đến một số lượng cố định (thực sự không có gì để chúng hội tụ).
Trong thực tế, phân phối của mẫu có nghĩa là từ phân phối Cauchy giống như phân phối của một quan sát đơn lẻ (!). Đuôi quá nặng đến nỗi việc thêm nhiều giá trị vào tổng sẽ tạo ra một giá trị thực sự cực kỳ đủ để chỉ bù cho việc chia cho mẫu số lớn hơn khi lấy giá trị trung bình.
Dự đoán
Bạn chắc chắn có thể tạo ra các khoảng dự đoán hoàn toàn hợp lý cho các quan sát từ phân phối Cauchy; có những công cụ ước tính đơn giản, khá hiệu quả, hoạt động tốt để ước tính vị trí và tỷ lệ và khoảng dự đoán gần đúng có thể được xây dựng - vì vậy, theo nghĩa đó, ít nhất, các biến thể Cauchy là 'có thể dự đoán được'. Tuy nhiên, đuôi kéo dài rất xa, do đó nếu bạn muốn một khoảng xác suất cao, nó có thể khá rộng.
Nếu bạn đang cố gắng dự đoán trung tâm phân phối (ví dụ: trong mô hình loại hồi quy), theo một cách nào đó, điều đó có thể tương đối dễ dự đoán; Cauchy khá đạt đỉnh (có rất nhiều phân phối "gần" với trung tâm cho một thước đo điển hình), vì vậy trung tâm có thể được ước tính tương đối tốt nếu bạn có một công cụ ước tính phù hợp.
Đây là một ví dụ:
Tôi đã tạo dữ liệu từ mối quan hệ tuyến tính với các lỗi Cauchy tiêu chuẩn (100 quan sát, chặn = 3, độ dốc = 1,5) và các đường hồi quy ước tính bằng ba phương pháp có hiệu quả hợp lý đối với y-outliers: Tukey 3 nhóm nhóm (màu đỏ), hồi quy Theil (xanh đậm) và hồi quy L1 (xanh dương). Không ai đặc biệt hiệu quả tại Cauchy - mặc dù tất cả họ sẽ tạo ra điểm khởi đầu tuyệt vời cho cách tiếp cận hiệu quả hơn.
Tuy nhiên, cả ba gần như trùng khớp với sự ồn ào của dữ liệu và nằm rất gần trung tâm nơi dữ liệu chạy; theo nghĩa đó, Cauchy rõ ràng là "có thể dự đoán".
Trung vị của phần dư tuyệt đối chỉ lớn hơn 1 một chút cho bất kỳ dòng nào (hầu hết các dữ liệu nằm khá gần với dòng ước tính); theo nghĩa đó cũng vậy, Cauchy là "có thể dự đoán được".
Đối với cốt truyện bên trái có một ngoại lệ lớn. Để xem dữ liệu tốt hơn, tôi thu hẹp tỷ lệ trên trục y xuống bên phải.