Chúng ta có thể từ chối một giả thuyết null với các khoảng tin cậy được tạo ra thông qua lấy mẫu chứ không phải là giả thuyết null?


9

Tôi đã được dạy rằng chúng ta có thể tạo ra một ước tính tham số dưới dạng khoảng tin cậy sau khi lấy mẫu từ dân số. Ví dụ: khoảng tin cậy 95%, không có giả định vi phạm, nên có tỷ lệ thành công 95% chứa bất cứ thông số thực nào mà chúng tôi ước tính có trong dân số.

I E,

  1. Tạo ước tính điểm từ một mẫu.
  2. Tạo ra một loạt các giá trị về mặt lý thuyết có 95% cơ hội chứa giá trị thực mà chúng tôi đang cố gắng ước tính.

Tuy nhiên, khi chủ đề đã chuyển sang kiểm tra giả thuyết, các bước được mô tả như sau:

  1. Giả sử một số tham số là giả thuyết null.
  2. Tạo ra một phân phối xác suất về khả năng nhận được các ước tính điểm khác nhau được đưa ra giả thuyết không có giá trị này là đúng.
  3. Từ chối giả thuyết null nếu ước tính điểm chúng tôi nhận được sẽ được tạo ra dưới 5% thời gian nếu giả thuyết null là đúng.

Câu hỏi của tôi là:

Có cần thiết phải tạo ra các khoảng tin cậy của chúng tôi bằng cách sử dụng giả thuyết null để từ chối null không? Tại sao không chỉ làm thủ tục đầu tiên và lấy ước tính của chúng tôi cho tham số thực (không sử dụng rõ ràng giá trị giả định của chúng tôi trong việc tính toán khoảng tin cậy) sau đó từ chối giả thuyết null nếu nó không nằm trong khoảng này?

Điều này có vẻ tương đương với tôi bằng trực giác, nhưng tôi sợ rằng tôi đang thiếu một cái gì đó rất cơ bản vì có lẽ có một lý do nó được dạy theo cách này.


Tôi xin lỗi vì không rõ ràng, Martijn. Tôi sẽ chỉnh sửa bài viết của mình trong thời gian ngắn để mọi người tìm kiếm những câu hỏi tương tự trong tương lai rõ ràng hơn. Ý tôi là chúng ta có thể tính toán ước tính tham số từ một mẫu hoặc chúng ta có thể tính toán một phạm vi ước tính mà chúng ta sẽ cho là để hỗ trợ giả thuyết null bằng giả thuyết null. Tôi không hiểu tại sao cần phải sử dụng null để xem liệu ước tính điểm của chúng tôi có nằm trong khoảng này không, thay vì chỉ sử dụng ước tính tham số của chúng tôi và kiểm tra xem liệu null có nằm trong giới hạn của ước tính tham số không. Tôi hy vọng điều đó đúng!
Nikli

Một thử nghiệm suy nghĩ thú vị là nếu ai đó cố gắng bán cho bạn xúc xắc có trọng lượng. Họ cuộn chúng, sau đó nói rằng chúng có trọng số theo hướng bạn quan sát (ví dụ 6 tăng 20% ​​thời gian). Chúng có trọng lượng (đã đủ số lần ném mẫu được thực hiện chưa), bao nhiêu và có đáng để thực hiện các bài kiểm tra ném xúc xắc (thêm) của riêng bạn không? Người bán và người mua có các mục tiêu khác nhau ...
Philip Oakley

Câu trả lời:


5

Ví dụ, một vấn đề đơn giản được đưa ra bằng cách kiểm tra giá trị trung bình của một dân số bình thường với phương sai đã biết . Sau đó, một trục - một đại lượng có phân phối không phụ thuộc vào tham số, được cho bởi . Các giá trị quan trọng thỏa mãn, trong trường hợp đối xứng này, và .ˉ Y - μ ~ N ( 0 , 1 / n ) z α / 2 Φ ( - z α / 2 ) = α / 2 Φ ( z α / 2 ) = 1 - α / 2σ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2Φ(zα/2)=1α/2

Do đó, sao cho là khoảng tin cậy của cấp .

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

Đồng thời, sự kiện trong dòng đầu tiên của màn hình chính xác cũng là sự kiện mà giả thuyết null không bị từ chối cho . Vì phần còn lại chỉ chứa các cải cách tương đương, nên ci thực sự chứa tất cả mà null không bị từ chối và không cần tham chiếu đến "dưới null".μμ

Dưới đây là một âm mưu tương tự như trực quan +1 của Martijn nhằm mục đích hiển thị cái được gọi là tính hai mặt giữa khoảng tin cậy và phép thử. biểu thị khoảng tin cậy thuộc về một số và vùng chấp nhận thuộc một số giả thuyết .Cx¯A(μ0)μ=μ0

nhập mô tả hình ảnh ở đây


10

Có, bạn có thể thay thế một thử nghiệm giả thuyết (so sánh mẫu với phân phối giả định về kết quả thử nghiệm) bằng cách so sánh với khoảng tin cậy được tính từ mẫu. Nhưng gián tiếp, khoảng tin cậy đã là một loại kiểm tra giả thuyết, cụ thể là:

  • Bạn có thể thấy các khoảng tin cậy khi được xây dựng dưới dạng một phạm vi các giá trị mà thử nghiệm giả thuyết cấp sẽ thành côngα và ngoài phạm vi thử nghiệm giả thuyết cấp sẽ thất bại.α

Hậu quả của việc tạo phạm vi như vậy là phạm vi chỉ thất bại một phần của thời gian.α

Thí dụ

Tôi đang sử dụng một hình ảnh từ một câu trả lời cho câu hỏi dưới đây: Khoảng tin cậy: cách xử lý chính thức vớiP(L(X)θ,U(X)θ)=1α

Nó là một biến thể của đồ thị từ Clopper-Pearson . Hãy tưởng tượng trường hợp của 100 thử nghiệm Bernoulli nơi xác suất thành công là và chúng tôi quan sát tổng số thành công .θX

xác suất fiducial

Lưu ý rằng:

  • Theo hướng dọc, bạn thấy thử nghiệm giả thuyết. Ví dụ: đối với một giá trị giả định nhất định bạn từ chối giả thuyết nếu đo được ở trên hoặc dưới các đường chấm màu đỏ hoặc xanh lục.θX

  • Theo hướng ngang, bạn thấy khoảng tin cậy Clopper-Pearson. Nếu với bất kỳ quan sát đã cho X nào bạn sử dụng các khoảng tin cậy này thì bạn sẽ chỉ sai 5% thời gian

    (bởi vì bạn sẽ chỉ quan sát X như vậy, trên đó bạn căn cứ vào khoảng 'sai', 5% thời gian)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.