MLE cho phân phối tam giác?


12

Có thể áp dụng quy trình MLE thông thường cho phân phối tam giác không? - Tôi đang cố gắng nhưng dường như tôi bị chặn ở bước này hay bước khác trong toán học bằng cách xác định phân phối. Tôi đang cố gắng sử dụng thực tế là tôi biết số lượng mẫu trên và dưới c (không biết c): 2 số này là cn và (1-c) n, nếu n là tổng số mẫu. Tuy nhiên, điều đó dường như không giúp đỡ trong việc phái sinh. Khoảnh khắc của khoảnh khắc đưa ra một công cụ ước tính cho c mà không có nhiều vấn đề. Bản chất chính xác của sự cản trở MLE ở đây là gì (nếu thực sự có một)?

Thêm chi tiết:

Hãy xem xét trong và phân phối được xác định trên bởi: c[0,1][0,1]

f(x;c)=2xc nếu x <c nếu c <= x
f(x;c)=2(1x)(1c)

Hãy lấy một mẫu iid từ mẫu phân phối này khả năng đăng nhập của c được cung cấp mẫu này:n{xi}

l^(c|{xi})=i=1nln(f(xi|c))

Sau đó tôi đang cố gắng sử dụng thực tế là đã cho dạng , chúng ta biết rằng các mẫu sẽ giảm xuống dưới (chưa biết) và sẽ giảm trên . IMHO, điều này cho phép phân tách tổng kết trong biểu thức của khả năng đăng nhập, do đó:fcnc(1c)nc

l^(c|{xi})=i=1cnln2xic+i=1(1c)nln2(1xi)1c

Ở đây, tôi không chắc chắn làm thế nào để tiến hành. MLE sẽ liên quan đến tham gia một wrt phái sinh của loga, nhưng tôi có như trên ràng buộc của tổng, mà dường như để chặn đó. Tôi có thể thử với một dạng khác của khả năng đăng nhập, sử dụng các hàm chỉ báo:cc

l^(c|{xi})=i=1n{xi<c}ln2xic+i=1n{c<=xi}ln2(1xi)1c

Nhưng việc tạo ra các chỉ số dường như cũng không dễ dàng, mặc dù Dirac deltas có thể cho phép tiếp tục (trong khi vẫn có các chỉ số, vì chúng ta cần lấy được sản phẩm).

Vì vậy, ở đây tôi bị chặn trong MLE. Bất kỳ ý tưởng?


Nếu đây là cho một số chủ đề xin vui lòng thêm thẻ tự học. Nếu không, vui lòng giải thích vấn đề phát sinh như thế nào.
Glen_b -Reinstate Monica

Cảm ơn các cập nhật; nó làm cho nó dễ dàng hơn nhiều để nói những điều hợp lý trong câu trả lời, vì nó làm giảm đáng kể phạm vi của các trường hợp để giải quyết. Bạn có thể vui lòng xem xét nhận xét trước đó của tôi. Điều này nằm trong thẻ tự học hoặc không, trong cả hai trường hợp tôi đã hỏi liệu bạn có làm gì không.
Glen_b -Reinstate Monica

Điều này không phải cho một bài tập về nhà hoặc một lớp học. Nó phát sinh tại công việc của tôi. Chúng tôi có một công cụ ước tính khác từ phương pháp của các khoảnh khắc, nhưng tôi đang cố gắng hiểu sâu hơn về những gì đang xảy ra với MLE ở đây.
Frank

Được chứ; Điều đó cho tôi nhiều thời gian hơn. Xem câu trả lời cập nhật của tôi. Tôi có thể sẽ bổ sung thêm sớm
Glen_b -Reinstate Monica

Đã thêm tài liệu tham khảo / liên kết
Glen_b -Reinstate Monica

Câu trả lời:


10

Có thể áp dụng quy trình MLE thông thường cho phân phối tam giác không?

Chắc chắn rồi! Mặc dù có một số điểm kỳ lạ để giải quyết, nhưng có thể tính toán MLE trong trường hợp này.

Tuy nhiên, nếu theo 'thủ tục thông thường', bạn có nghĩa là 'lấy đạo hàm của khả năng ghi nhật ký và đặt nó bằng 0', thì có thể không.

Bản chất chính xác của sự cản trở MLE ở đây là gì (nếu thực sự có một)?

Bạn đã thử vẽ khả năng?

-

Theo dõi sau khi làm rõ câu hỏi:

Câu hỏi về việc vẽ khả năng không phải là bình luận nhàn rỗi, mà là trung tâm của vấn đề.

MLE sẽ liên quan đến việc lấy đạo hàm

Không. MLE liên quan đến việc tìm argmax của hàm. Điều đó chỉ liên quan đến việc tìm các số không của một công cụ phái sinh trong một số điều kiện nhất định ... không giữ ở đây. Tốt nhất, nếu bạn quản lý để làm điều đó, bạn sẽ xác định được một vài cực tiểu địa phương .

Như câu hỏi trước đây của tôi đề xuất, hãy nhìn vào khả năng.

Đây là một mẫu, gồm 10 quan sát từ phân bố tam giác trên (0,1):y

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

Đây là các hàm khả năng và khả năng đăng nhập cho trên dữ liệu đó: ckhả năng đạt đỉnh tam giác

khả năng đăng nhập cho đỉnh của tam giác

Các đường màu xám đánh dấu các giá trị dữ liệu (có lẽ tôi đã tạo một mẫu mới để phân tách các giá trị tốt hơn). Các chấm đen đánh dấu khả năng / khả năng đăng nhập của các giá trị đó.

Đây là một phóng to gần tối đa khả năng, để xem chi tiết hơn:

Chi tiết khả năng

Như bạn có thể thấy từ khả năng, tại nhiều thống kê đơn hàng, hàm khả năng có các 'góc' sắc nét - những điểm mà đạo hàm không tồn tại (điều này không có gì ngạc nhiên - pdf gốc có một góc và chúng ta đang lấy sản phẩm của pdf). Điều này (có cusps tại thống kê đơn hàng) là trường hợp phân phối tam giác và tối đa luôn xảy ra tại một trong các thống kê đơn hàng. .

Như nó xảy ra trong mẫu của tôi, tối đa xảy ra như thống kê thứ tư, 0,3780912

Vì vậy, để tìm MLE của trên (0,1), chỉ cần tìm khả năng ở mỗi lần quan sát. Người có khả năng lớn nhất là MLE của .cc

Một tài liệu tham khảo hữu ích là chương 1 của " Beyond Beta " của Johan van Dorp và Samuel Kotz. Khi điều đó xảy ra, Chương 1 là một chương 'mẫu' miễn phí cho cuốn sách - bạn có thể tải xuống tại đây .

Có một bài báo nhỏ đáng yêu của Eddie Oliver về vấn đề này với sự phân bố hình tam giác, tôi nghĩ ở American Statistician (về cơ bản là cùng một điểm; tôi nghĩ rằng đó là trong Góc của Giáo viên). Nếu tôi có thể quản lý để xác định vị trí, tôi sẽ cung cấp nó làm tài liệu tham khảo.

Chỉnh sửa: đây là:

EH Oliver (1972), Sự kỳ quặc tối đa,
Nhà thống kê người Mỹ , Tập 26, Số 3, Tháng 6, p43-44

( liên kết nhà xuất bản )

Nếu bạn có thể dễ dàng nắm bắt nó, nó đáng để xem, nhưng chương Dorp và Kotz bao gồm hầu hết các vấn đề có liên quan vì vậy nó không quan trọng.


Bằng cách theo dõi câu hỏi trong các bình luận - ngay cả khi bạn có thể tìm ra cách nào đó để 'làm dịu' các góc, bạn vẫn phải đối phó với thực tế là bạn có thể nhận được nhiều cực đại cục bộ:

tối đa hai địa phương

Tuy nhiên, có thể tìm thấy các công cụ ước tính có các thuộc tính rất tốt (tốt hơn phương pháp của các khoảnh khắc), mà bạn có thể viết ra một cách dễ dàng. Nhưng ML trên tam giác trên (0,1) là một vài dòng mã.

Nếu đó là vấn đề về số lượng dữ liệu khổng lồ, điều đó cũng có thể được xử lý, nhưng tôi sẽ là một câu hỏi khác. Ví dụ, không phải mọi điểm dữ liệu đều có thể là tối đa, làm giảm công việc và có một số khoản tiết kiệm khác có thể được thực hiện.


Cảm ơn - Tôi sẽ cố gắng đăng nỗ lực thất bại của mình, hiển thị phân phối chính xác mà tôi đang nói về và nơi tôi nghĩ rằng tôi bị chặn.
Frank

Cảm ơn vì lời giải thích chi tiết! Mặc dù vậy, tôi đã có một ý tưởng khác: giả sử tôi có thể tìm thấy một họ các hàm hội tụ vào phân bố tam giác, nhưng sẽ không phải là từng phần - tôi có thể sử dụng nó để lấy MLE một cách phân tích, sau đó đưa ra giới hạn và cho rằng tôi sẽ có MLE của tam giác phân phối chính nó?
Frank

Có thể - Tôi nghĩ rằng điều đó có thể phụ thuộc vào quy trình giới hạn cụ thể mà bạn sử dụng ... và có thể bạn vẫn sẽ kết thúc với một số cực đại cục bộ nên có thể chỉ giúp bạn đánh giá khả năng gần thống kê đơn hàng cực kỳ - nhưng ngay cả khi nó làm việc, tại sao bạn thậm chí sẽ cố gắng làm một cái gì đó quá phức tạp? Có gì sai với ML trên phân bố tam giác? Nó thực sự khá đơn giản để làm trong thực tế.
Glen_b -Reinstate Monica

2
Tôi phải nói rằng, MLE này cho c dựa trên số liệu thống kê đơn hàng là khá tốt, mặc dù việc tạo ra trong chương trên có một số công việc (mặc dù không quá khó) - minh họa rất hay rằng bản chất của MLE là trong argmax (tất nhiên!), chứ không phải là công cụ phái sinh (như bạn đã chỉ ra, và tôi hoàn toàn đồng ý, tôi đã làm việc ngược dòng của bước phái sinh "thông thường" (nghĩa là chỉ lo lắng về việc tối đa hóa, bằng mọi cách), nhưng tôi đã không theo đuổi).
Frank

1
@Frank: Một tài liệu tham khảo bổ sung là Huang và Shen (2007) Nhiều khả năng khác biệt tối đa , Tạp chí Kế hoạch và Suy luận Thống kê, Tập 137, Số 7, Tháng 7, Trang 2151-2155. Glen: Theo thống kê đơn hàng , bạn có nghĩa là các giá trị được đặt hàng ? xi
COOLSerdash
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.