Có phải phân phối Cauchy bằng cách nào đó là một phân phối không thể đoán trước được?


14

Có phải phân phối Cauchy bằng cách nào đó là một phân phối "không thể đoán trước"?

Tôi đã thử làm

cs <- function(n) {
  return(rcauchy(n,0,1))
}

trong R cho vô số giá trị n và nhận thấy rằng đôi khi chúng tạo ra các giá trị khá khó đoán.

So sánh điều đó với ví dụ

as <- function(n) {
  return(rnorm(n,0,1))
}

mà dường như luôn cho một đám mây điểm "nhỏ gọn".

Bởi pic này nó sẽ trông giống như phân phối bình thường? Tuy nhiên, nó chỉ có thể làm cho một tập hợp con các giá trị. Hoặc có thể mẹo là các độ lệch chuẩn Cauchy (trong ảnh bên dưới) hội tụ chậm hơn nhiều (sang trái và phải) và do đó cho phép các ngoại lệ nghiêm trọng hơn, mặc dù ở xác suất thấp?

https://i.stack.imgur.com/zGTLU.png

Ở đây cũng như các rvs bình thường và cs là các rvs Cauchy.

nhập mô tả hình ảnh ở đây

Nhưng bởi sự cực đoan của các ngoại lệ, có thể các đuôi của pdf Cauchy không bao giờ hội tụ?


9
1. Câu hỏi của bạn mơ hồ / không rõ ràng, vì vậy thật khó để trả lời; ví dụ "không thể đoán trước" nghĩa là gì trong câu hỏi của bạn? bạn có ý nghĩa gì bởi "độ lệch chuẩn Cauchy" và sự hội tụ gần cuối? Bạn dường như không tính toán độ lệch chuẩn ở bất cứ đâu. độ lệch chuẩn của những gì, chính xác? 2. Nhiều bài đăng trên trang web thảo luận về các thuộc tính của Cauchy có thể giúp bạn tập trung vào câu hỏi của mình. Nó cũng có thể đáng để kiểm tra Wikipedia. 3. Tôi đề nghị tránh thuật ngữ "hình chuông"; cả hai mật độ dường như có hình dạng gần giống như một chiếc chuông; chỉ cần gọi họ bằng tên của họ.
Glen_b -Reinstate Monica

4
Chắc chắn là Cauchy rất nặng đuôi.
Glen_b -Reinstate Monica

1
Tôi đã đăng một vài sự thật; Hy vọng những điều này sẽ giúp bạn tìm ra những gì bạn muốn biết để bạn có thể tinh chỉnh câu hỏi của mình.
Glen_b -Reinstate Monica

1
|x|x

2
Các ngoại lệ lớn có thể xảy ra với bình thường nhưng chúng cực kỳ hiếm . Mật độ (và ở phần đuôi trên, đặc biệt có liên quan đến các ngoại lệ có ít nhất một kích thước nhất định, chức năng sinh tồn) cho các đầu bình thường về 0 nhanh hơn nhiều so với Cauchy - nhưng tuy nhiên cả mật độ (và cả hai chức năng sinh tồn) tiếp cận 0 và không bao giờ đạt được nó.
Glen_b -Reinstate Monica

Câu trả lời:


39

Mặc dù một số bài đăng trên trang web đề cập đến nhiều thuộc tính khác nhau của Cauchy, tôi đã không quản lý được vị trí của một bài viết thực sự đặt chúng cùng nhau. Hy vọng rằng đây có thể là một nơi tốt để thu thập một số. Tôi có thể mở rộng này.

Đuôi nặng

Trong khi Cauchy đối xứng và có hình chuông gần giống nhau, hơi giống phân bố bình thường, nó có đuôi nặng hơn nhiều (và ít hơn một "vai"). Ví dụ, có một xác suất nhỏ nhưng khác biệt rằng một biến ngẫu nhiên Cauchy sẽ đặt hơn 1000 phạm vi liên dải từ trung vị - gần giống với một biến ngẫu nhiên bình thường có ít nhất 2,67 phạm vi liên dải từ trung vị của nó.

Phương sai

Phương sai của Cauchy là vô hạn.

Chỉnh sửa: JG nói trong các bình luận rằng nó không được xác định. Nếu chúng ta lấy phương sai là trung bình của một nửa khoảng cách bình phương giữa các cặp giá trị - giống hệt với phương sai khi cả hai tồn tại, thì nó sẽ là vô hạn. Tuy nhiên, theo định nghĩa thông thường JG là chính xác. [Tuy nhiên, ngược lại với phương tiện mẫu, không thực sự hội tụ với bất cứ thứ gì khi n trở nên lớn, phân phối phương sai mẫu tiếp tục tăng kích thước khi kích thước mẫu tăng; thang đo tăng tỷ lệ thuận với n hoặc tương đương phân phối phương sai log tăng trưởng tuyến tính với kích thước mẫu. Có vẻ hữu ích khi thực sự xem xét rằng phiên bản của phương sai mang lại vô hạn đang nói với chúng ta điều gì đó.]

Dĩ nhiên, độ lệch chuẩn mẫu tồn tại, nhưng mẫu càng lớn thì chúng càng có xu hướng lớn hơn (ví dụ độ lệch chuẩn mẫu trung bình tại n = 10 nằm trong khoảng 3,67 lần tham số tỷ lệ (một nửa IQR), nhưng tại n = 100 đó là khoảng 11,9).

Nghĩa là

Phân phối Cauchy thậm chí không có ý nghĩa hữu hạn; tích phân cho trung bình không hội tụ. Kết quả là, ngay cả luật số lượng lớn cũng không áp dụng - khi n phát triển, mẫu có nghĩa là không hội tụ đến một số lượng cố định (thực sự không có gì để chúng hội tụ).

Trong thực tế, phân phối của mẫu có nghĩa là từ phân phối Cauchy giống như phân phối của một quan sát đơn lẻ (!). Đuôi quá nặng đến nỗi việc thêm nhiều giá trị vào tổng sẽ tạo ra một giá trị thực sự cực kỳ đủ để chỉ bù cho việc chia cho mẫu số lớn hơn khi lấy giá trị trung bình.

Dự đoán

Bạn chắc chắn có thể tạo ra các khoảng dự đoán hoàn toàn hợp lý cho các quan sát từ phân phối Cauchy; có những công cụ ước tính đơn giản, khá hiệu quả, hoạt động tốt để ước tính vị trí và tỷ lệ và khoảng dự đoán gần đúng có thể được xây dựng - vì vậy, theo nghĩa đó, ít nhất, các biến thể Cauchy là 'có thể dự đoán được'. Tuy nhiên, đuôi kéo dài rất xa, do đó nếu bạn muốn một khoảng xác suất cao, nó có thể khá rộng.

Nếu bạn đang cố gắng dự đoán trung tâm phân phối (ví dụ: trong mô hình loại hồi quy), theo một cách nào đó, điều đó có thể tương đối dễ dự đoán; Cauchy khá đạt đỉnh (có rất nhiều phân phối "gần" với trung tâm cho một thước đo điển hình), vì vậy trung tâm có thể được ước tính tương đối tốt nếu bạn có một công cụ ước tính phù hợp.

Đây là một ví dụ:

Tôi đã tạo dữ liệu từ mối quan hệ tuyến tính với các lỗi Cauchy tiêu chuẩn (100 quan sát, chặn = 3, độ dốc = 1,5) và các đường hồi quy ước tính bằng ba phương pháp có hiệu quả hợp lý đối với y-outliers: Tukey 3 nhóm nhóm (màu đỏ), hồi quy Theil (xanh đậm) và hồi quy L1 (xanh dương). Không ai đặc biệt hiệu quả tại Cauchy - mặc dù tất cả họ sẽ tạo ra điểm khởi đầu tuyệt vời cho cách tiếp cận hiệu quả hơn.

Tuy nhiên, cả ba gần như trùng khớp với sự ồn ào của dữ liệu và nằm rất gần trung tâm nơi dữ liệu chạy; theo nghĩa đó, Cauchy rõ ràng là "có thể dự đoán".

Trung vị của phần dư tuyệt đối chỉ lớn hơn 1 một chút cho bất kỳ dòng nào (hầu hết các dữ liệu nằm khá gần với dòng ước tính); theo nghĩa đó cũng vậy, Cauchy là "có thể dự đoán được".

mối quan hệ tuyến tính với lỗi Cauchy và ba đường hồi quy được trang bị

Đối với cốt truyện bên trái có một ngoại lệ lớn. Để xem dữ liệu tốt hơn, tôi thu hẹp tỷ lệ trên trục y xuống bên phải.


1
Đuôi nặng và phương sai là vô cùng có liên quan, phải không?
mavavilj

Chắc chắn rồi. Giá trị trung bình không xác định cũng liên quan đến đuôi nặng.
Glen_b -Reinstate Monica

Có những công cụ ước tính đơn giản, khá hiệu quả, hoạt động tốt để ước tính vị trí và tỷ lệ và khoảng dự đoán gần đúng có thể được xây dựng - bạn có thể cung cấp tài liệu tham khảo không?
Carlos Cinelli

Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
gung - Phục hồi Monica

@Carlos Có hai vấn đề khác nhau ở đó - (i) các công cụ ước tính đơn giản, khá hiệu quả cho vị trí (chẳng hạn như trung bình được cắt xén phù hợp) và tỷ lệ trong các phương pháp Cauchy và (ii) để xây dựng một khoảng dự đoán sẽ hoạt động cho Cauchy. Tôi nghĩ rằng cái đầu tiên đã được trình bày trên trang web và cái thứ hai sẽ xứng đáng với một câu hỏi của riêng nó.
Glen_b -Reinstate Monica

1

μσnμ±σμ±636,62σ

σ

Phân phối Cauchy xuất hiện khá nhiều trong tự nhiên, đặc biệt là khi bạn có một số hình thức tăng trưởng. Nó cũng xuất hiện ở nơi mọi thứ quay tròn, chẳng hạn như những tảng đá lăn xuống đồi. Bạn sẽ thấy nó là phân phối cốt lõi của một hỗn hợp phân phối xấu xí trong lợi nhuận của thị trường chứng khoán, mặc dù không phải là lợi nhuận cho những thứ như đồ cổ được bán trong các cuộc đấu giá. Lợi nhuận trên đồ cổ cũng thuộc về một bản phân phối không có giá trị trung bình hoặc phương sai, nhưng không phải là bản phân phối Cauchy. Sự khác biệt được tạo ra bởi sự khác biệt trong các quy tắc của đấu giá. Nếu bạn thay đổi các quy tắc của NYSE, thì bản phân phối Cauchy sẽ biến mất và một bản khác sẽ xuất hiện.

Để hiểu lý do tại sao nó thường có mặt, hãy tưởng tượng bạn là một nhà thầu trong một nhóm rất lớn các nhà thầu và các nhà thầu tiềm năng. Bởi vì cổ phiếu được bán trong một cuộc đấu giá kép, lời nguyền của người chiến thắng không được áp dụng. Ở trạng thái cân bằng, hành vi hợp lý là trả giá trị dự kiến ​​của bạn. Một kỳ vọng là một hình thức của trung bình. Một phân phối ước tính trung bình sẽ hội tụ về tính quy tắc khi kích thước mẫu đi đến vô cùng.

rt= =pt+1pt

Điều này làm cho thị trường chứng khoán rất biến động, nếu người ta nghĩ rằng thị trường chứng khoán nên có phân phối bình thường hoặc log-normal, nhưng không biến động bất ngờ nếu bạn đang mong đợi những cái đuôi nặng nề.

Tôi đã xây dựng cả các bản phân phối dự đoán Bayes và Thường xuyên cho phân phối Cauchy và đưa ra các giả định của chúng, chúng hoạt động tốt. Dự đoán Bayes giảm thiểu sự phân kỳ Kullback-Leibler, có nghĩa là nó gần giống như bạn có thể đến với thiên nhiên trong một dự đoán, cho một tập dữ liệu nhất định. Dự đoán thường xuyên giảm thiểu phân kỳ Kullback - Leibler trung bình so với nhiều dự đoán độc lập từ nhiều mẫu độc lập. Tuy nhiên, nó không nhất thiết phải hoạt động tốt đối với bất kỳ một mẫu nào như người ta mong đợi với độ bao phủ trung bình. Các đuôi làm hội tụ, nhưng chúng hội tụ chậm.

Cauchy đa biến thậm chí còn có nhiều đặc tính khó chịu hơn. Ví dụ, trong khi nó rõ ràng không thể hiệp phương sai vì không có nghĩa, nó không có gì giống với ma trận hiệp phương sai. Lỗi Cauchy luôn luôn hình cầu nếu không có gì khác đang xảy ra trong hệ thống. Ngoài ra, trong khi không có gì đồng biến, thì cũng không có gì độc lập. Để hiểu tầm quan trọng của điều đó theo nghĩa thực tế, hãy tưởng tượng hai quốc gia đang phát triển và họ giao dịch với nhau. Các lỗi trong một không độc lập với các lỗi khác. Những sai lầm của tôi ảnh hưởng đến sai lầm của bạn. Nếu một quốc gia bị chiếm giữ bởi một kẻ điên, những sai lầm của kẻ điên đó được cảm nhận ở khắp mọi nơi. Mặt khác, do các hiệu ứng không tuyến tính như người ta mong đợi với ma trận hiệp phương sai, các quốc gia khác có thể cắt đứt các mối quan hệ để giảm thiểu tác động.

Đây cũng là điều khiến cuộc chiến thương mại của Trump trở nên nguy hiểm. Nền kinh tế lớn thứ hai thế giới sau khi Liên minh châu Âu tuyên bố chiến tranh kinh tế thông qua thương mại chống lại mọi nền kinh tế khác và đang tài trợ cho cuộc chiến đó bằng cách vay tiền để chống lại nó từ các quốc gia mà nó tuyên chiến. Nếu những phụ thuộc đó bị buộc phải thư giãn, nó sẽ xấu xí theo cách mà không ai có ký ức sống. Chúng tôi đã không gặp vấn đề tương tự kể từ Chính quyền Jackson khi Ngân hàng Anh cấm vận thương mại Đại Tây Dương.

Phân phối Cauchy rất hấp dẫn bởi vì nó xuất hiện trong các hệ thống tăng trưởng theo cấp số nhân và đường cong S. Họ nhầm lẫn mọi người vì cuộc sống hàng ngày của họ chứa đầy mật độ có ý nghĩa và thường có sự khác biệt. Nó làm cho việc ra quyết định rất khó khăn vì những bài học sai được học.


Tôi thích cách táo bạo trong đó các thuộc tính toán học được ánh xạ tới hành vi trong thế giới thực trong câu trả lời này. Nhưng bạn không nên đề cập đến việc một Cuncated Cauchy (cả hai phía) có tất cả các khoảnh khắc của nó là hữu hạn?
Alecos Papadopoulos

Nó chỉ bị cắt ở bên trái. Hạn chế ngân sách hành tinh danh nghĩa là ngẫu nhiên ở bên phải và vì các hệ thống tiền tệ không phải là hệ thống bảo tồn, nên chúng là vô hạn ở bên phải.
Dave Harris
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.