Tin vào điều gì: thử nghiệm Kolmogorov-Smirnov hay cốt truyện QQ?


16

Tôi đang cố xác định xem tập dữ liệu liên tục của mình có tuân theo phân phối gamma với tham số hình dạng 1.7 và tỷ lệ 0,000063 hay không.= ===

Vấn đề là khi tôi sử dụng R để tạo một biểu đồ QQ của bộ dữ liệu của tôi so với gamma phân phối lý thuyết (1.7, 0,000063), tôi nhận được một biểu đồ cho thấy dữ liệu thực nghiệm gần như đồng ý với phân phối gamma. Điều tương tự cũng xảy ra với âm mưu ECDF.x

Tuy nhiên, khi tôi chạy thử nghiệm Kolmogorov-Smirnov, nó mang lại cho tôi giá trị nhỏ một cách vô lý .< 1 %p<1%

Tôi nên chọn tin vào điều gì? Đầu ra đồ họa hoặc kết quả từ thử nghiệm KS?

Cốt truyện QQplot và ECDF


bạn cũng có thể cung cấp các lô phân phối mật độ bạn có được?
Cào

13
Các xét nghiệm và âm mưu chẩn đoán không nhất quán. Phân phối tương tự như lý thuyết, như cốt truyện QQ cho thấy. Cỡ mẫu đủ lớn để bạn có thể nhận được những khác biệt nhỏ so với lý thuyết.
Glen_b -Reinstate Monica

Câu trả lời:


18

Tôi không thấy bất kỳ ý nghĩa nào khi không "tin" cốt truyện QQ (nếu bạn đã sản xuất đúng cách); nó chỉ là một biểu diễn đồ họa về thực tế của dữ liệu của bạn, gắn liền với phân phối xác định. Rõ ràng nó không phải là một kết hợp hoàn hảo, nhưng nếu nó đủ tốt cho mục đích của bạn, điều đó có thể ít nhiều là kết thúc của câu chuyện. Bạn có thể muốn kiểm tra câu hỏi liên quan này: Kiểm tra tính quy phạm 'về cơ bản là vô dụng'?

Giá trị từ kiểm tra KS về cơ bản cho bạn biết rằng kích thước mẫu của bạn đủ lớn để đưa ra bằng chứng mạnh mẽ chống lại giả thuyết khống rằng dữ liệu của bạn thuộc cùng phân phối với phân phối tham chiếu của bạn (Tôi giả sử bạn đã tham chiếu phân phối gamma; có thể muốn kiểm tra lại rằng bạn đã làm). Điều đó dường như đủ rõ ràng từ cốt truyện QQ (ví dụ, có một số mô hình sai lệch nhỏ nhưng có vẻ có hệ thống), vì vậy tôi không nghĩ có bất kỳ thông tin mâu thuẫn nào ở đây.p

Liệu dữ liệu của bạn có quá khác biệt so với phân phối gamma cho mục đích dự định của bạn hay không là một câu hỏi khác. Kiểm tra KS một mình không thể trả lời cho bạn (vì kết quả của nó sẽ phụ thuộc vào kích thước mẫu của bạn, trong số các lý do khác), nhưng cốt truyện QQ có thể giúp bạn quyết định. Bạn cũng có thể muốn xem xét các lựa chọn thay thế mạnh mẽ cho bất kỳ phân tích nào khác mà bạn dự định chạy và nếu bạn đặc biệt nghiêm túc về việc nhạy cảm với bất kỳ phân tích tiếp theo nào đối với các sai lệch so với phân phối gamma, bạn cũng có thể muốn xem xét thực hiện một số thử nghiệm mô phỏng .


15

Những gì bạn có thể làm là tạo nhiều mẫu từ phân phối lý thuyết của bạn và vẽ những mẫu trên nền của cốt truyện QQ của bạn. Điều đó sẽ cho bạn một ý tưởng về loại biến thiên mà bạn có thể mong đợi một cách hợp lý chỉ từ việc lấy mẫu.

Bạn có thể mở rộng ý tưởng đó để tạo một phong bì xung quanh dòng lý thuyết, sử dụng ví dụ từ các trang 86-89 của:

Venables, WN và Ripley, BD 2002. Thống kê áp dụng hiện đại với S. New York: Springer.

Đây sẽ là một phong bì điểm khôn ngoan. Bạn có thể mở rộng ý tưởng đó hơn nữa để tạo một phong bì tổng thể bằng cách sử dụng các ý tưởng từ trang 151-154 của:

Davison, AC và Hinkley, DV 1997. Phương pháp Bootstrap và ứng dụng của chúng. Cambridge: Nhà xuất bản Đại học Cambridge.

Tuy nhiên, đối với thăm dò cơ bản, tôi nghĩ chỉ cần vẽ một vài mẫu tham chiếu trong nền của cốt truyện QQ của bạn là quá đủ.


Ý tưởng tốt! Nhắc tôi để nâng cấp điều này trong 11 giờ (đã sử dụng hết số phiếu bầu của tôi trên phim hoạt hình ) ... Tôi đặc biệt thích bootstrapping ECDF như một cách làm phong phú cốt truyện đó.
Nick Stauner

1
Cũng có một cái nhìn về gói CRAN sfsmisc, có chức năng ecdf.ksCI tạo ra một dải tin cậy trên lô ecdf. Ý tưởng tương tự có thể được sử dụng để vẽ một nhóm tự tin trên cốt truyện QQ ...
kjetil b halvorsen

2

Kiểm tra KS giả định các thông số cụ thể của phân phối của bạn. Nó kiểm tra giả thuyết "dữ liệu được phân phối theo phân phối cụ thể này". Bạn có thể đã chỉ định các tham số này ở đâu đó. Nếu không, một số mặc định không phù hợp có thể đã được sử dụng. Lưu ý rằng kiểm tra KS sẽ trở nên thận trọng nếu các tham số ước tính được cắm vào giả thuyết.

Tuy nhiên, hầu hết các bài kiểm tra mức độ phù hợp được sử dụng sai cách làm tròn. Nếu thử nghiệm KS sẽ không cho thấy ý nghĩa, điều này không có nghĩa là mô hình bạn muốn chứng minh là phù hợp. Đó là những gì @Nick Stauner nói về cỡ mẫu quá nhỏ. Vấn đề này tương tự như các bài kiểm tra giả thuyết điểm và kiểm tra tương đương.

Vì vậy, cuối cùng: Chỉ xem xét các lô QQ.


-1

QQ Plot là một kỹ thuật phân tích dữ liệu thăm dò và nên được xử lý như vậy - tất cả các lô EDA khác cũng vậy. Chúng chỉ nhằm mục đích cung cấp cho bạn thông tin chi tiết sơ bộ về dữ liệu trên tay. Bạn không bao giờ nên quyết định hoặc dừng phân tích của mình dựa trên các lô EDA như cốt truyện QQ. Đó là một lời khuyên sai lầm khi chỉ xem xét các lô QQ. Bạn chắc chắn nên đi bằng các kỹ thuật định lượng như Kiểm tra KS. Giả sử bạn có một âm mưu QQ khác cho tập dữ liệu tương tự, làm thế nào bạn so sánh hai cái mà không có công cụ định lượng? Bước tiếp theo dành cho bạn, sau khi kiểm tra EDA và KS là tìm hiểu lý do tại sao kiểm tra KS lại cho giá trị p thấp (trong trường hợp của bạn, thậm chí có thể do một số lỗi).

Các kỹ thuật EDA KHÔNG có nghĩa là đóng vai trò là công cụ ra quyết định. Trong thực tế, tôi sẽ nói ngay cả số liệu thống kê suy luận chỉ có nghĩa là chỉ thăm dò. Họ cung cấp cho bạn các gợi ý về việc phân tích thống kê của bạn sẽ tiến hành theo hướng nào. Ví dụ: kiểm tra t trên mẫu sẽ chỉ cung cấp cho bạn mức độ tin cậy rằng mẫu có thể (hoặc không) thuộc về dân số, bạn vẫn có thể tiếp tục dựa trên hiểu biết đó về phân phối dữ liệu của bạn thuộc về cái gì và phân phối dữ liệu của bạn thuộc về cái gì là các tham số của nó, v.v. Trên thực tế, khi một số trạng thái mà ngay cả các kỹ thuật được triển khai như một phần của thư viện máy học cũng có tính chất khám phá !!! Tôi hy vọng họ có nghĩa là theo nghĩa này ...!

Để kết luận các quyết định thống kê trên cơ sở các âm mưu hoặc kỹ thuật trực quan đang tạo ra sự chế giễu những tiến bộ được thực hiện trong khoa học thống kê. Nếu bạn hỏi tôi, bạn nên sử dụng các lô này làm công cụ để truyền đạt kết luận cuối cùng dựa trên phân tích thống kê định lượng của bạn.


Điều này cấm tôi làm điều gì đó mà tôi thường làm và coi là hợp lý, đưa ra quyết định đưa ra một âm mưu thăm dò và dừng lại trước một thử nghiệm có ý nghĩa chính thức hơn. Không có sự nhạo báng được đòi hỏi. Đây là một nhận xét lặp đi lặp lại và giáo điều không thêm bất cứ điều gì hữu ích cho câu trả lời xuất sắc hiện có và nhiều sắc thái hơn. Thật dễ dàng để so sánh các lô QQ ...
Nick Cox

Tôi chưa đọc câu trả lời khác nhưng nếu họ cũng khuyến khích các phương pháp định lượng, tôi vẫn ổn. Đối với câu hỏi, tôi đã đưa ra câu trả lời của mình. Nhưng, tôi tò mò, không mất nhiều thời gian để thực hiện các bài kiểm tra định lượng chính thức (chỉ vài phút nữa để thực hiện kiểm tra KS) với các gói có sẵn như R, vậy tại sao mọi người sẽ dừng lại ở các lô EDA? Ngay sau khi xác nhận kết quả kiểm tra KS của R bằng bootstrapping, tôi nhận thấy ở một số nơi được đề cập là không thích sử dụng, v.v., có phải do nghi ngờ chung về các phương pháp thống kê truyền thống? Đây là lý do đằng sau những bình luận mạnh mẽ của tôi..không xúc phạm bất kỳ
Murugesan Narayanaswamy

Bạn thực sự nên đọc câu trả lời khác trước khi đăng. Hàm ý của việc đăng bài là bạn có một cái gì đó khác biệt (cũng như phòng thủ) để nói. Nhận xét của bạn rất khó hiểu khi ngụ ý rằng các lô QQ không phải là "phương pháp định lượng". Một âm mưu QQ cho thấy về nguyên tắc tất cả các thông tin định lượng có liên quan trong việc đánh giá sự phù hợp phân phối. Ngược lại, một bài kiểm tra như Kolmogorov-Smirnov cho phép giảm một chiều và giúp đỡ rất ít về những việc cần làm tiếp theo.
Nick Cox

Cốt truyện QQ so sánh phân phối lý thuyết với dữ liệu thử nghiệm nhất định và cung cấp một biểu diễn trực quan nhưng thử nghiệm KS thực hiện điều tương tự theo cách chặt chẽ hơn nhiều bằng cách sử dụng các khái niệm thống kê và cuối cùng đưa ra một giá trị xác suất. Bạn không thể so sánh hai lô QQ nhưng bạn sẽ nhận được sự khác biệt về số lượng khi bạn sử dụng thử nghiệm KS. Đó là cách hiểu sai rằng giá trị p thử nghiệm của KS là sai. Cũng sai khi không thể sử dụng tập dữ liệu theo kinh nghiệm để trích xuất các tham số phân phối. Cá nhân tôi đã thực hiện bootstrapping và xác minh với giá trị p bằng cả hai bảng và phân phối kolomogrov được tính toán thủ công.
Murugesan Narayanaswamy

Có rất nhiều quyền anh bóng tối trong bình luận của bạn, Ai đang tranh luận rằng bạn không thể sử dụng dữ liệu thực nghiệm ở đâu để có được ước tính tham số? Đó là những gì tất cả chúng ta nên đồng ý đang được thực hiện ở đây. Bạn sẽ phải tha thứ cho tôi vì không muốn theo đuổi một cuộc thảo luận. Tôi đứng trước phản ứng của tôi với câu trả lời của bạn.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.