Kiểm tra giả thuyết và tổng khoảng cách biến đổi so với phân kỳ Kullback-Leibler


10

Trong nghiên cứu của tôi, tôi đã gặp phải vấn đề chung sau: Tôi có hai phân phối Q trên cùng một miền và một số lượng lớn (nhưng hữu hạn) các mẫu từ các phân phối đó. Các mẫu được phân phối độc lập và giống hệt nhau từ một trong hai phân phối này (mặc dù các phân phối có thể liên quan: ví dụ: Q có thể là hỗn hợp của P và một số phân phối khác.) Giả thuyết null là các mẫu đến từ P , giả thuyết thay thế là mẫu đến từ Q .PQQPPQ

Tôi cố gắng để đặc trưng cho loại I và loại II sai sót trong kiểm tra mẫu, biết phân phối Q . Đặc biệt, tôi đang quan tâm đến bounding một lỗi cho người khác, ngoài các kiến thức về PQ .PQPQ

Tôi đã hỏi một câu hỏi về math.SE liên quan đến mối quan hệ của khoảng cách Tổng biến đổi giữa Q với kiểm tra giả thuyết và nhận được câu trả lời mà tôi chấp nhận. Câu trả lời đó có ý nghĩa, nhưng tôi vẫn chưa thể hiểu được ý nghĩa sâu xa hơn đằng sau mối quan hệ của khoảng cách Tổng biến đổi và kiểm tra giả thuyết vì nó liên quan đến vấn đề của tôi. Vì vậy, tôi quyết định chuyển sang diễn đàn này.PQ

Câu hỏi đầu tiên của tôi là: tổng biến thể có bị ràng buộc vào tổng xác suất của lỗi Loại I và Loại II không phụ thuộc vào phương pháp kiểm tra giả thuyết mà người ta sử dụng không? Về bản chất, miễn là có một xác suất khác không mà mẫu có thể được tạo ra bởi một trong các phân phối, thì xác suất của ít nhất một trong các lỗi phải khác không. Về cơ bản, bạn không thể thoát khỏi khả năng người kiểm tra giả thuyết của bạn sẽ mắc lỗi, bất kể bạn xử lý tín hiệu bao nhiêu. Và tổng biến thể giới hạn khả năng chính xác. Tôi hiểu có đúng không?

PQ

Và câu hỏi cơ bản của tôi là: có một tập hợp các tình huống được quy định khi tôi nên sử dụng một trong hai ràng buộc hay đó hoàn toàn là vấn đề thuận tiện? Khi nào thì kết quả thu được bằng cách sử dụng một ràng buộc sử dụng cái kia?

Tôi xin lỗi nếu những câu hỏi này là tầm thường. Tôi là một nhà khoa học máy tính (vì vậy đây có vẻ như là một vấn đề phù hợp với mô hình phù hợp với tôi :).) Tôi biết lý thuyết thông tin một cách hợp lý và cũng có nền tảng tốt nghiệp về lý thuyết xác suất. Tuy nhiên, tôi mới bắt đầu tìm hiểu tất cả những thứ kiểm tra giả thuyết này. Nếu cần, tôi sẽ cố hết sức để làm rõ câu hỏi của mình.

Câu trả lời:


8

Văn học: Hầu hết các câu trả lời bạn cần chắc chắn có trong cuốn sách của Lehman và Romano . Cuốn sách của Ingster và Suslina xử lý các chủ đề nâng cao hơn và có thể cung cấp cho bạn câu trả lời bổ sung.

L1TVnL1

Phát triển: Hãy để chúng tôi biểu thị bằng

  • g1(α0,P1,P0)α0P0P1
  • g2(t,P1,P0)t(1t)P0P1

L1L1L1TV

L1χ2P1P0Pi=pin i=0,1p1p0nh(P1,P0)h(p1,p0)KLχ2L1

A1(ν1,ν0)ν1ν2

A1(ν1,ν0)=min(dν1,dν0)

|ν1ν0|1=|dν1dν0|

  • 2A1(ν1,ν0)=(ν1+ν0)|ν1ν0|1
  • g1(α0,P1,P0)=supt[0,1/α0](A1(P1,tP0)tα0)
  • g2(t,P1,P0)=A1(tP0,(1t)P1)

Tôi đã viết bằng chứng ở đây .

P1P0

12|P1P0|1h(P1,P0)K(P1,P0)χ2(P1,P0)

hKχ2L1


1
P0P1

Và cảm ơn bạn đã gợi ý cuốn sách của Lehmann và Romano, nó có vẻ rất hữu ích và không quá nhiều so với đầu tôi. Ngoài ra, thư viện của tôi sở hữu một bản sao! :)
MBM

A1

g1g2A1
12π|exp(x2/2σ12)σ1exp(x2/2σ22)σ2|dx
A1
12πmin(exp(x2/2σ12)σ1,exp(x2/2σ22)σ2)dx

(ν1+ν2)

1

Trả lời câu hỏi đầu tiên của bạn: Có, một trừ đi tổng khoảng cách biến thể là giới hạn dưới của tổng tỷ lệ lỗi Loại I + Loại II. Giới hạn dưới này áp dụng cho dù bạn chọn thuật toán kiểm tra giả thuyết nào.

A

(Nói đúng ra, dòng lý luận này cho rằng kiểm tra giả thuyết của bạn là một thủ tục xác định. Nhưng ngay cả khi bạn xem xét các thủ tục ngẫu nhiên, có thể chỉ ra rằng cùng một ràng buộc vẫn được áp dụng.)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.