Có bất kỳ kiểm tra thống kê nào là tham số và không tham số? Câu hỏi này đã được hỏi bởi một hội đồng phỏng vấn. Là câu hỏi hợp lệ?
Có bất kỳ kiểm tra thống kê nào là tham số và không tham số? Câu hỏi này đã được hỏi bởi một hội đồng phỏng vấn. Là câu hỏi hợp lệ?
Câu trả lời:
Về cơ bản rất khó để nói chính xác ý nghĩa của "kiểm tra tham số" và "kiểm tra không tham số", mặc dù có nhiều ví dụ cụ thể trong đó hầu hết sẽ đồng ý về việc kiểm tra là tham số hay không tham số (nhưng không bao giờ cả hai) . Một tìm kiếm nhanh đã đưa ra bảng này , mà tôi tưởng tượng đại diện cho một sự phân biệt thực tế phổ biến trong một số lĩnh vực giữa các xét nghiệm tham số và không tham số.
Ngay phía trên bảng đề cập đến có một nhận xét:
"... dữ liệu tham số có phân phối bình thường cơ bản .... Bất cứ điều gì khác là không tham số."
Nó có thể là một tiêu chí được chấp nhận trong một số lĩnh vực mà chúng tôi sử dụng tính quy tắc và sử dụng ANOVA, và đây là tham số, hoặc chúng tôi không giả định tính quy tắc và sử dụng các phương án không tham số.
Có lẽ đó không phải là một định nghĩa hay và theo tôi thì nó không thực sự đúng, nhưng nó có thể là một quy tắc thực tế. Chủ yếu là vì mục tiêu cuối cùng trong khoa học xã hội, là, để phân tích dữ liệu, và nó có thể tạo ra một mô hình tham số dựa trên phân phối không bình thường và sau đó không thể phân tích dữ liệu?
Một định nghĩa khác, là định nghĩa "các thử nghiệm không tham số" là các thử nghiệm không dựa trên các giả định phân phối và thử nghiệm tham số như bất kỳ thứ gì khác.
Định nghĩa trước cũng như định nghĩa sau được trình bày định nghĩa một lớp kiểm tra và sau đó định nghĩa lớp khác là phần bù (bất cứ thứ gì khác). Theo định nghĩa, quy tắc này chỉ ra rằng một bài kiểm tra có thể là tham số cũng như không tham số.
Sự thật là định nghĩa sau cũng có vấn đề. Điều gì xảy ra nếu có một số giả định "không tham số" tự nhiên, như đối xứng, có thể được áp đặt? Điều đó sẽ biến một thống kê kiểm tra mà không dựa vào bất kỳ giả định phân phối nào thành một thử nghiệm tham số? Hầu hết sẽ nói không!
Do đó, có các bài kiểm tra trong lớp các bài kiểm tra không tham số được phép đưa ra một số giả định phân phối miễn là chúng không "quá tham số". Đường biên giữa các xét nghiệm "tham số" và "không tham số" đã bị mờ, nhưng tôi tin rằng hầu hết sẽ ủng hộ rằng xét nghiệm là tham số hoặc không phải là tham số, có lẽ không thể nhưng nói rằng đó là cả hai làm cho ít ý nghĩa
Theo quan điểm khác nhau, nhiều xét nghiệm tham số là (tương đương) các thử nghiệm tỷ lệ khả năng. Điều này làm cho một lý thuyết chung có thể, và chúng tôi có một sự hiểu biết thống nhất về các tính chất phân phối của các thử nghiệm tỷ lệ khả năng trong các điều kiện đều đặn phù hợp. Ngược lại, các xét nghiệm không tham số không tương đương với các xét nghiệm tỷ lệ khả năng mỗi lần không có khả năng - và không có phương pháp thống nhất dựa trên khả năng chúng tôi phải lấy kết quả phân phối theo từng trường hợp cụ thể. Lý thuyết về khả năng thực nghiệmđược phát triển chủ yếu bởi Art Owen tại Stanford, tuy nhiên, là một sự thỏa hiệp rất thú vị. Nó đưa ra một cách tiếp cận dựa trên khả năng thống kê (một điểm quan trọng đối với tôi, vì tôi coi khả năng đó là một đối tượng quan trọng hơn so với giá trị , nói) mà không cần các giả định phân phối tham số điển hình. Ý tưởng cơ bản là sử dụng thông minh phân phối đa thức trên dữ liệu thực nghiệm, các phương pháp rất "tham số" nhưng hợp lệ mà không hạn chế các giả định tham số.
Các xét nghiệm dựa trên khả năng dựa trên kinh nghiệm, IMHO, ưu điểm của các xét nghiệm tham số và tính tổng quát của các xét nghiệm không tham số, do đó trong số các xét nghiệm tôi có thể nghĩ ra, chúng đến gần nhất để đủ điều kiện tham gia cũng như không tham số, mặc dù tôi sẽ không sử dụng thuật ngữ này.
Tham số được sử dụng trong (ít nhất) hai ý nghĩa: A - Để tuyên bố bạn đang giả sử họ phân phối tiếng ồn theo tham số của nó. B - Để tuyên bố bạn đang giả định mối quan hệ chức năng cụ thể giữa các biến giải thích và kết quả.
Vài ví dụ:
Thuật ngữ "bán tham số" thường dùng để chỉ trường hợp B và có nghĩa là bạn không giả định toàn bộ mối quan hệ chức năng, nhưng bạn có các giả định nhẹ hơn như "phụ gia trong một số biến đổi trơn tru của các yếu tố dự đoán".
Bạn cũng có thể có các giả định nhẹ hơn về phân phối tiếng ồn - chẳng hạn như "tất cả các khoảnh khắc là hữu hạn", mà không chỉ định cụ thể hình dạng của phân phối. Theo hiểu biết tốt nhất của tôi, không có thuật ngữ cho loại giả định này.
Lưu ý rằng câu trả lời liên quan đến các giả định cơ bản đằng sau quá trình tạo dữ liệu. Khi nói "kiểm tra tham số", người ta thường nói đến phi tham số theo nghĩa A. Trong đây là ý của bạn, sau đó tôi sẽ trả lời "không". Không thể là tham số và không tham số theo cùng một nghĩa cùng một lúc.
Tôi cho rằng điều đó phụ thuộc vào ý nghĩa của "tham số và không tham số"? Đồng thời chính xác cả hai, hoặc một sự pha trộn của hai?
Nhiều người coi mô hình mối nguy theo tỷ lệ Cox là bán tham số, vì nó không ước tính được tham số cơ bản về rủi ro cơ bản.
Hoặc bạn có thể chọn xem nhiều số liệu thống kê phi tham số là thực sự ồ ạt tham số.
Bradley, trong các thử nghiệm thống kê phân phối miễn phí phân phối cổ điển của mình (năm 1968, trang 15 Hóa16 - xem câu hỏi này để được trích dẫn) làm rõ sự khác biệt giữa các thử nghiệm không phân phối và không phân tích , mà ông nói thường bị lẫn lộn với nhau, và đưa ra một ví dụ về thử nghiệm không phân phối tham số như thử nghiệm Dấu hiệu cho trung vị. Thử nghiệm này không đưa ra giả định về phân phối cơ bản của dân số được lấy mẫu của các giá trị phương sai, vì vậy nó không có phân phối . Tuy nhiên, nếu trung vị được chọn là chính xác, các giá trị trên và dưới nó phải được chọn với xác suất bằng nhau, kiểm tra các mẫu ngẫu nhiên từ
Cập nhật