Hướng dẫn chung về làm thế nào để rút ra một bài kiểm tra thống kê giả thuyết?


7

Nói chung, quá trình kiểm tra giả thuyết có thể được chia thành 4 bước:

  1. Xây dựng vấn đề thực tế về mặt giả thuyết.
  2. Tính một thống kê , một hàm hoàn toàn của dữ liệu. Tất cả các thống kê kiểm tra tốt phải có hai thuộc tính: (a) chúng có xu hướng hành xử khác nhau khi đúng từ khi đúng; và (b) phân phối xác suất của chúng phải được tính toán theo giả định rằng là đúng.TH0H1H0
  3. Chọn một khu vực quan trọng. Chúng ta phải có khả năng quyết định loại giá trị sẽ mạnh nhất chỉ ra là đúng thay vì là đúng.TH1H0
  4. Quyết định kích thước của khu vực quan trọng. Điều này liên quan đến việc xác định mức độ rủi ro lớn mà chúng ta đã chuẩn bị để đưa ra kết luận không chính xác. Chúng tôi xác định mức ý nghĩa hoặc kích thước của thử nghiệm mà chúng tôi biểu thị bằng , vì rủi ro chúng tôi sẵn sàng chấp nhận từ chối khi thực tế là đúng.αH0

Có vẻ như các bước sáng tạo nhất, một trong đó thực sự đặt ra một thử nghiệm cụ thể ngoài những người khác là sự lựa chọn của số liệu thống kê . Do đó, câu hỏi của tôi là: Làm thế nào các tác giả của các bài kiểm tra giả thuyết thống kê đưa ra số liệu thống kê của họ?T

Đưa ra một vấn đề cụ thể, có phải luôn luôn rõ ràng lý tưởng (nếu điều này có thể xác định được trên cơ sở khách quan nào không) thống kê phải là gì? Có vẻ như hai yêu cầu được liệt kê trong bước 2 ở trên là hai yêu cầu rộng và nhiều thống kê khác nhau có thể được đưa ra để kiểm tra các giả thuyết tương tự. Chẳng hạn, nó có phải là một thử nghiệm thay thế khác cho thử nghiệm t dựa trên trung bình hoặc thống kê khác không ...?


Bốn bước đến từ đâu? Bạn đang trích dẫn một cái gì đó?
Glen_b -Reinstate Monica

Tôi muốn nói rằng thông thường các bước 1 và 2 của bạn được kết hợp (ít nhất là ngầm). Đó là, về mặt khái niệm bạn có thể tưởng tượng bạn có hai bộ dữ liệu: Một bộ được thu thập trước khi hình thành giả thuyết, và bộ kia sau đó được thu thập để kiểm tra giả thuyết. (Đầu tiên có thể là ẩn, ví dụ từ tài liệu hiện có / công việc trước đó.) Sau đó, bạn thực hiện phân tích dữ liệu khám phá và tìm thấy một số thống kê có vẻ phù hợp với giả thuyết sơ bộ (ví dụ: "các nhóm phụ này dường như đến từ các quần thể bình thường khác nhau) Sau đó, việc này được chính thức hóa.
GeoMatt22

Câu trả lời:


7

Làm thế nào các tác giả của các bài kiểm tra giả thuyết thống kê đưa ra số liệu thống kê của họ?

Có nhiều cách để xác định số liệu thống kê kiểm tra, tùy thuộc vào hoàn cảnh. Điều quan trọng là cố gắng xác định các lựa chọn thay thế mà bạn thấy là quan trọng để chọn và cố gắng có được sức mạnh chống lại những điều đó, dưới một số giả định hợp lý.

Nếu bạn có một giả thuyết liên quan đến phương tiện dân số (thực tế, hãy làm cho nó đơn giản và xem xét thử nghiệm một mẫu), ví dụ, một thống kê dựa trên trung bình mẫu có vẻ như là một lựa chọn rõ ràng cho thống kê, vì nó sẽ có xu hướng để hành xử khác nhau dưới null và thay thế. Tuy nhiên (ví dụ), nếu bạn đang tìm kiếm các lựa chọn thay thế cho gia đình theo cấp số nhân Laplace / nhân đôi ( ), một cái gì đó dựa trên trung vị mẫu sẽ là lựa chọn tốt hơn cho một thử nghiệm về sự thay đổi trong ý nghĩa hơn là một cái gì đó dựa trên giá trị trung bình mẫu.DExp(μ,τ)

Nếu bạn có một mô hình tham số cụ thể (dựa trên một số họ phân phối cụ thể), thì ít nhất bạn nên xem xét thử nghiệm tỷ lệ khả năng , vì chúng có một số tính chất hấp dẫn cho các mẫu lớn.

Trong nhiều tình huống khi bạn đang cố gắng thiết kế một bài kiểm tra từ đầu, một thống kê kiểm tra sẽ dựa trên số lượng quan trọng . Thống kê kiểm tra trong thử nghiệm t một mẫu (cũng như với nhiều thử nghiệm khác mà bạn có thể đã thấy trước đây) là một đại lượng quan trọng.

Đưa ra một vấn đề cụ thể, có phải luôn luôn rõ ràng lý tưởng (nếu điều này có thể xác định được trên cơ sở khách quan nào không) thống kê phải là gì?

Không có gì. Ví dụ, xem xét một thử nghiệm về tính quy tắc chung đối với một sự thay thế ominibus. Có nhiều cách để đo độ lệch so với tính chuẩn (hàng chục thử nghiệm như vậy đã được đề xuất) và ở các cỡ mẫu điển hình, không có cách nào mạnh nhất để chống lại mọi phương án.

Khi cố gắng thiết kế một thử nghiệm cho một tình huống như vậy, một lượng sáng tạo nhất định được yêu cầu đưa ra một lựa chọn sẽ có sức mạnh tốt để chống lại các loại thay thế mà bạn quan tâm nhất.

Có vẻ như hai yêu cầu được liệt kê trong bước 2 ở trên là quá rộng và nhiều số liệu thống kê khác nhau có thể được đưa ra để kiểm tra các giả thuyết tương tự.

Thật. Nếu bạn đưa ra một số giả định tham số (giả sử dữ liệu được rút ra từ một số họ phân phối và sau đó đưa ra giả thuyết của bạn liên quan đến một hoặc nhiều tham số của nó) thì có thể có một thử nghiệm khả thi nhất cho tất cả các tình huống như vậy (cụ thể là mạnh nhất kiểm tra), nhưng ngay cả khi đó nếu giả định tham số của bạn giống như một phỏng đoán sơ bộ, thì mong muốn về sự mạnh mẽ đối với giả định đó có thể thay đổi mọi thứ khá nhiều.

Ví dụ: (một lần nữa, thực hiện một thử nghiệm mẫu về dịch chuyển vị trí là đơn giản), nếu tôi lấy mẫu từ một dân số bình thường thì thử nghiệm t sẽ là tốt nhất. Nhưng hãy nói rằng tôi nghĩ rằng nó có thể không chính xác bình thường và trên hết có thể có một lượng nhỏ ô nhiễm bởi một số quy trình khác với một cái đuôi nặng vừa phải, sau đó là một thứ gì đó mạnh mẽ hơn (thậm chí có thể thay thế dựa trên xếp hạng như đã ký kiểm tra xếp hạng) có thể có xu hướng thực hiện tốt hơn trong một loạt các tình huống như vậy.


3

Một thống kê kiểm tra hữu ích là một phân phối có phân phối phụ thuộc vào tham số quan tâm và không có phần nào khác của mô hình thống kê. Bằng cách đó, phân phối của nó theo giả thuyết null (nghĩa là khi tham số quan tâm có giá trị được chỉ định bởi giả thuyết null) có thể được chỉ định đầy đủ. Một thống kê kiểm tra lý tưởng cho biết thêm rằng tính chất của việc có phân phối phụ thuộc mạnh vào tham số quan tâm để thử nghiệm kết quả có sức mạnh tốt.

Hãy xem xét bài kiểm tra của sinh viên. Nó được phát triển như một thử nghiệm có ý nghĩa (xem Sự khác biệt giữa "thử nghiệm giả thuyết" và "thử nghiệm ý nghĩa" là gì? ) Đối với phương tiện mẫu nhỏ. Khó khăn mà Gossett gặp phải là việc phân phối giá trị trung bình của một mẫu nhỏ từ dân số bình thường phụ thuộc vào tham số quan tâm, , nhưng cũng là một 'tham số phiền toái', độ lệch chuẩn của dân số, . Điều kiện mẫu nhỏ có nghĩa là độ lệch chuẩn được ước tính từ mẫu, , không phải là ước tính đầy đủ của . Để giải quyết vấn đề, Gossett đã nghĩ ra thống kê kiểm traμσsσt=n×x¯/schỉ phụ thuộc vào dữ liệu và có phân phối xác định cho mọi kích thước mẫu đã cho, . Điều quan trọng, phân phối đó hoàn toàn không bị ảnh hưởng bởi . (Trên thực tế, hình thức thống kê kiểm tra đó là bản sửa đổi của Fisher, nếu tôi nhớ chính xác.)nσ

Ngày nay, không phải lúc nào cũng dễ dàng nhận thấy thiên tài về giải pháp của Gossett, đặc biệt là thống kê t của anh ta trông gần giống với thống kê z cho một phân phối bình thường với phương sai đã biết (chỉ thay thế cho ). Phần khó là xác định bản chất của phân phối thống kê kiểm tra. Bằng chứng là phân phối của Gossett là chính xác đã không xuất hiện cho đến một bài báo sau của Fisher.σs

Trong nhiều trường hợp, các kiểm tra thống kê được đưa ra bằng cách tìm các thống kê kiểm tra có phân phối có thể được chứng minh là gần đúng các phân phối đã biết theo các giả định có thể chấp nhận được. Ví dụ, nhiều thử nghiệm dựa trên các xấp xỉ với phân phối bình phương chi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.