Sự khác biệt giữa thử nghiệm trên hệ thống giả thuyết của Viking và thử nghiệm tầm quan trọng của tầm cao là gì?


17

Có sự khác biệt giữa cụm từ "kiểm tra giả thuyết" và "kiểm tra ý nghĩa" hay chúng giống nhau không?

Sau câu trả lời chi tiết từ @Micheal Lew, tôi có một nhầm lẫn rằng ngày nay giả thuyết (ví dụ: kiểm tra t để kiểm tra trung bình) là ví dụ về "kiểm tra ý nghĩa" hay "kiểm tra giả thuyết"? Hay đó là sự kết hợp của cả hai? Làm thế nào bạn sẽ phân biệt chúng với ví dụ đơn giản?


3
Kiểm tra t của sinh viên có thể được sử dụng để cung cấp giá trị ap mà sau đó có thể được sử dụng trong kiểm tra xác nhận Ngư dân (giá trị p là mức ý nghĩa) hoặc trong kiểm tra giả thuyết Neyman-pearsonian (nếu giá trị p nhỏ hơn giá trị alpha đặt trước thì kết quả là "đáng kể"). Sự khác biệt nằm ở những gì được thực hiện với kết quả thử nghiệm t thay vì trường phái suy nghĩ thử nghiệm t đến từ đâu (mặc dù cách tiếp cận của Gossett có nhiều điểm tương đồng với Fisher hơn là với NP).
Michael Lew

Câu trả lời:


19

Kiểm tra tầm quan trọng là những gì Fisher nghĩ ra và kiểm tra giả thuyết là những gì Neyman và Pearson nghĩ ra để thay thế thử nghiệm quan trọng. Chúng không giống nhau và không tương thích lẫn nhau ở một mức độ sẽ gây ngạc nhiên cho hầu hết người dùng các bài kiểm tra giả thuyết null.

Các thử nghiệm quan trọng của Fisher mang lại giá trị ap đại diện cho mức độ quan sát cực đoan theo giả thuyết null. Giá trị p đó là một chỉ số bằng chứng chống lại giả thuyết null và mức độ quan trọng.

Các thử nghiệm giả thuyết của Neyman và Pearson đã thiết lập cả giả thuyết khống và giả thuyết thay thế và hoạt động như một quy tắc quyết định để chấp nhận giả thuyết khống. Tóm lại (có nhiều hơn tôi có thể đặt ở đây) bạn chọn tỷ lệ suy luận dương tính giả, alpha (thường là 0,05) và chấp nhận hoặc từ chối null dựa trên giá trị p ở trên hoặc dưới alpha. Bạn phải tuân theo quyết định của kiểm tra thống kê nếu bạn muốn bảo vệ chống lại các lỗi dương tính giả.

Cách tiếp cận của Fisher cho phép bạn xem xét bất cứ điều gì bạn muốn khi giải thích kết quả, ví dụ bằng chứng có sẵn có thể được đưa vào tài khoản một cách không chính thức trong việc giải thích và trình bày kết quả. Trong phương pháp NP chỉ có thể được thực hiện trong giai đoạn thiết kế thử nghiệm, và dường như hiếm khi được thực hiện. Theo tôi, cách tiếp cận Ngư dân hữu ích hơn trong công việc sinh học cơ bản hơn là phương pháp NP.

Có một tài liệu đáng kể về sự không nhất quán giữa kiểm tra ý nghĩa và kiểm tra giả thuyết và về sự lai tạo không may của cả hai. Bạn có thể bắt đầu với bài viết này: Goodman, Hướng tới thống kê y tế dựa trên bằng chứng. 1: Sai lầm giá trị P. http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371


2
@Micheal Lew - +1 tôi không biết rằng Newman / Pearson đã đặt ra thử nghiệm giả thuyết cụm từ và tôi đã diễn giải nó theo một cách khá không chính thức. Ngoài ra, bạn có thể vui lòng giải thích cách trả lời của tôi sai không, vì tôi muốn sửa bất kỳ lỗi nào và luôn mong muốn được nghe phản hồi.
richiemorrisroe

2
@richiemorrisroe - Neyman và Pearson đã làm nhiều hơn một cụm từ! Họ đã nghĩ ra một mô hình toàn bộ cho phân tích thống kê - một mô hình chiếm ưu thế trong nhiều lĩnh vực ngày nay (bất chấp ý kiến ​​của tôi và của Fisher) rằng nó không phù hợp với hầu hết các thí nghiệm khoa học. Fisher tuyên bố nhiều lần rằng phương pháp NP chỉ liên quan đến thử nghiệm chấp nhận công nghiệp. Hầu hết các văn bản thống kê giới thiệu không bao gồm đủ chi tiết và lịch sử để cho phép sinh viên hiểu rằng có những khác biệt quan trọng giữa các trường phái tư tưởng về kiểm tra thống kê. Thật không may.
Michael Lew

0

Trong nhiều trường hợp, hai tuyên bố này có nghĩa là cùng một điều. Tuy nhiên, chúng cũng có thể khá khác nhau.

Kiểm tra một giả thuyết bao gồm đầu tiên nói những gì bạn tin sẽ xảy ra với một số hiện tượng, sau đó phát triển một loại thử nghiệm cho hiện tượng này và sau đó xác định xem hiện tượng đó có thực sự xảy ra hay không. Trong nhiều trường hợp, kiểm tra một giả thuyết không cần phải có bất kỳ loại kiểm tra thống kê nào. Tôi nhắc nhở về câu nói này của nhà vật lý Ernest Rutherford - Nếu thí nghiệm của bạn cần số liệu thống kê, bạn nên thực hiện một thí nghiệm tốt hơn. Điều đó đang được nói, kiểm tra các giả thuyết thường sử dụng một số loại công cụ thống kê.

Ngược lại, kiểm tra ý nghĩa là một khái niệm thống kê thuần túy. Về bản chất, người ta có hai giả thuyết - giả thuyết khống, nói rằng không có sự khác biệt giữa hai (hoặc nhiều) bộ sưu tập dữ liệu của bạn. Giả thuyết thay thế là có sự khác biệt giữa hai mẫu của bạn không xảy ra tình cờ.

Dựa trên thiết kế nghiên cứu của bạn, sau đó bạn so sánh hai (hoặc nhiều) mẫu bằng cách sử dụng kiểm tra thống kê, cung cấp cho bạn một số, sau đó bạn so sánh với phân phối tham chiếu (như phân phối bình thường, t hoặc F) và nếu thống kê kiểm tra này vượt quá giá trị tới hạn, bạn từ chối giả thuyết khống và kết luận rằng có sự khác biệt giữa hai (hoặc nhiều) mẫu. Tiêu chí này thông thường là xác suất của sự khác biệt xảy ra do tình cờ là ít hơn một phần hai (p <0,05), mặc dù những người khác đôi khi được sử dụng.


Bạn có thể vui lòng cho một số ví dụ trong đó kiểm tra giả thuyết không liên quan đến bất kỳ loại kiểm tra thống kê nào không?
chỉ số tình yêu

Đây là một đại diện không chính xác của kiểm tra ý nghĩa và kiểm tra giả thuyết.
Michael Lew

@ user152509 giả sử tôi thực hiện một nghiên cứu trong đó tôi phỏng vấn người dùng và không sử dụng một sản phẩm cụ thể. Tôi đưa ra giả thuyết rằng những người không sử dụng sẽ tập trung vào những nhược điểm của sản phẩm nói trên, trong khi người dùng sẽ nói về cách sản phẩm giúp họ. Đây là những gì tôi quan sát, do đó một giả thuyết được kiểm tra mà không có số liệu thống kê.
richiemorrisroe

2
Điều quan trọng là phân biệt giữa một giả thuyết khoa học và một giả thuyết thống kê. Giả thuyết null được kiểm tra bằng các kiểm tra thống kê giả thuyết null thường chỉ là e sau. Kiểm tra một giả thuyết thống kê được thiết kế tốt có thể cho phép suy luận về giả thuyết khoa học, nhưng không phải lúc nào cũng như vậy.
Michael Lew

@Micheal Lew, tôi có một nhầm lẫn rằng ngày nay giả thuyết (ví dụ: kiểm tra t để kiểm tra trung bình) là ví dụ về "kiểm tra ý nghĩa" hay "kiểm tra giả thuyết"? Hay đó là sự kết hợp của cả hai? Làm thế nào bạn sẽ phân biệt chúng với ví dụ đơn giản?
số liệu thống kê tình yêu
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.