Nếu tất cả 1000 bệnh nhân thử nghiệm không được chữa khỏi bằng thuốc, chúng ta có thể nói rằng chúng ta chấp nhận giả thuyết không?


9

Ở nhiều nơi tôi đã đọc rằng chúng ta không bao giờ có thể nói rằng chúng ta "chấp nhận" giả thuyết khống. Thay vào đó, chúng ta phải nói rằng chúng ta "không từ chối" giả thuyết khống.

Nhưng tôi không thấy làm thế nào mà hình vuông với ví dụ đơn giản này: Giả sử chúng tôi đang thử nghiệm một loại thuốc được cho là chữa khỏi bệnh tiểu đường hoàn toàn trong vòng 24 giờ. Chúng tôi thử trên 1000 bệnh nhân và tất cả họ vẫn bị tiểu đường sau khi dùng thuốc.

Không rõ ràng là thuốc này không chữa được bệnh tiểu đường? tức là chúng ta chấp nhận giả thuyết khống?

Tôi chắc chắn sẽ không đặt niềm tin vào loại thuốc này.


Giả thuyết Null: Thuốc không có tác dụng đối với bệnh nhân.

Giả thuyết thay thế: Thuốc chữa bệnh tiểu đường


6
Chính xác thì các giả thuyết null & thay thế được cho là gì trong kịch bản này? Hơn nữa, kịch bản này được cho là có liên quan / khái quát đến các tình huống (thực tế) khác và logic của kiểm tra giả thuyết như thế nào?
gung - Tái lập Monica

@gung Giả thuyết khống là thuốc không có tác dụng với bệnh nhân. Giả thuyết thay thế là thuốc chữa bệnh tiểu đường. Không phải rõ ràng là giả thuyết null là đúng sao?
Jonathan Aquino

@gung Điều này liên quan đến logic của kiểm tra giả thuyết bởi vì tôi đang cố gắng hiểu tại sao chúng ta không bao giờ có thể nói rằng chúng ta "chấp nhận" giả thuyết null và trong trường hợp này dường như chúng ta có thể nói rằng chúng ta "chấp nhận" giả thuyết null.
Jonathan Aquino

4
Mặc dù trong một số trường hợp, tình huống có thể là "hiển nhiên", nếu bạn muốn sử dụng ngôn ngữ kiểm tra giả thuyết để biện minh cho yêu cầu bồi thường, bạn cũng nên tuân theo lý lẽ của nó. Nếu có điều gì đó rõ ràng, hãy mô tả điều rõ ràng đó (ví dụ: "Rõ ràng là không có lợi ích thiết thực từ thuốc"; tránh các thuật ngữ thống kê để tránh sự cần thiết phải tranh luận về thống kê)
Glen_b -Reinstate Monica

2
Đây là một trường hợp trong đó khoảng tin cậy hoặc ước tính kích thước hiệu ứng có thể nhiều thông tin hơn. Thực tế không phải là nhị phân, thuốc có thể hoạt động theo nghĩa triết học (nghĩa là nó làm tăng tỷ lệ chữa bệnh), nhưng hãy ít ỏi đến mức thực tế không đáng kể. Kiểm tra giả thuyết là quá thô sơ của một công cụ cho việc này, nhưng các quy mô và hiệu ứng có thể đưa bạn đến đó. Nếu CI rất hẹp về 0, thì bất kỳ lợi ích có thể có khả năng là rất nhỏ.

Câu trả lời:


15

Khả năng thứ nhất: Thuốc có tác dụng rất nhỏ. Có lẽ nó chữa được 0,0001% số người dùng nó. Bài kiểm tra bạn vạch ra chỉ ngụ ý không có đủ bằng chứng cho sự thay thế kịch tính mà bạn đã đề xuất.

Khả năng hai: Thuốc có tác dụng tiêu cực rất mạnh. (tín dụng cho @ssdecontrol) Có lẽ thuốc không có tác dụng và tất cả những bệnh nhân đó sẽ tự khỏi hơn, nhưng do thuốc không có bệnh nhân nào hồi phục.

Nếu không có bất kỳ kiến ​​thức nào trước đó, dữ liệu sẽ phù hợp với các khả năng này cũng như khả năng null là đúng.

Vì vậy, việc không từ chối null không có nghĩa là null hoàn toàn đúng hơn các khả năng khác.


4
Ngoài ra, điều gì sẽ xảy ra nếu thuốc không có tác dụng và tất cả những bệnh nhân đó sẽ tự khỏi hơn.
Shadowtalker

1
Tôi nghĩ rằng câu trả lời này là thiếu một mảnh. Bạn đúng rằng những khả năng này có thể đúng, nhưng cũng đúng là không ai có thể thực sự biết bất cứ điều gì. Đây là lý do tại sao chúng tôi sẵn sàng từ chối null khi nó đạt đến một mức độ không khả thi nhất định, thay vì chờ đợi bằng chứng chắc chắn, không thể đạt được. Nhưng nếu đó là sự thật, tại sao chúng ta không sẵn sàng chấp nhận null khi chúng ta tích lũy được một mức độ bằng chứng nhất định?
octern

Jason - Tôi rất muốn nghe phản hồi của bạn về nhận xét của @ octern ở trên.
Jonathan Aquino

@octern Câu hỏi rất hay. Điều gì xảy ra nếu giả thuyết khống là thuốc có tác dụng tích cực rất, rất, rất nhỏ? Chúng tôi cũng sẽ không từ chối null. Rõ ràng chúng ta không nên xuất bản một bài báo nói rằng thuốc có tác dụng tích cực rất, rất, rất nhỏ. Nhưng sau đó sẽ nghi ngờ không kém khi xuất bản một bài báo nói rằng thuốc không có tác dụng. Dữ liệu phù hợp với nhiều khả năng và chúng tôi không biết khả năng nào còn lại là đúng. Xem (sai lầm logic chính thức) [ en.wikipedia.org/wiki/Argument_from_ignorance]
Jason Sanchez

Tôi hiểu rồi, bạn khá đúng. Bây giờ tôi hiểu thêm một chút về lý do tại sao kiểm tra giả thuyết thường xuyên luôn đề cập đến việc bác bỏ các giả thuyết thay vì chấp nhận chúng. Vì vậy, cách tiếp cận NHST để chấp nhận giả thuyết về hiệu ứng bằng 0 sẽ là 1) xác định mức độ nhỏ của một hiệu ứng có thể được tính là 0 và 2) thu thập đủ bằng chứng để bác bỏ giả thuyết rằng có ít nhất ảnh hưởng của kích thước đó (thực sự là hai các giả thuyết, một trong mỗi hướng). Đúng?
octern

6

Có một số câu trả lời tốt ở đây, nhưng những gì tôi nghĩ là vấn đề chính không được nêu rõ ràng ở bất cứ đâu. Nói tóm lại, công thức của bạn về các giả thuyết không và thay thế là không hợp lệ. Các giả thuyết không và thay thế phải loại trừ lẫn nhau (nghĩa là cả hai đều không thể đúng). Công thức của bạn đáp ứng tiêu chí đó. Tuy nhiên, chúng cũng phải được tập hợp toàn diện (nghĩa là một trong số chúng phải đúng). Công thức của bạn không đáp ứng tiêu chí này.

Bạn không thể có một giả thuyết khống rằng thuốc có cơ hội chữa khỏi bệnh tiểu đường và một giả thuyết thay thế rằng thuốc có khả năng chữa khỏi bệnh tiểu đường. Hãy tưởng tượng rằng xác suất thực sự mà thuốc sẽ chữa khỏi bệnh tiểu đường là , sau đó cả hai giả thuyết không và giả thuyết thay thế của bạn đều sai. Đó là vấn đề của bạn. 0%100%50%

Giả thuyết null nguyên mẫu là một giá trị điểm (ví dụ: trên dòng số thực hoặc thường nhất là khi đề cập đến xác suất, nhưng đó chỉ là quy ước). Ngoài ra, nếu bạn đang làm việc với một không gian tham số bị ràng buộc (như bạn đang ở đây thì xác suất của phạm vi phải nằm trong phạm vi ), việc thử kiểm tra các giá trị ở giới hạn (nghĩa là hoặc ). Sau khi lựa chọn một giá trị điểm như rỗng của bạn (giá trị mà bạn muốn từ chối), bạn có thể nhận được bằng chứng chống lại nó, nhưng không thể có được bằng chứng cho nó từ dữ liệu của bạn (x @ John câu trả lời sâu sắc ). Để hiểu thêm về điều này, nó có thể giúp bạn đọc câu trả lời của tôi ở đây:050%[0, 1]01Tại sao các nhà thống kê nói rằng một kết quả không có ý nghĩa có nghĩa là bạn không thể từ chối null null trái ngược với việc chấp nhận giả thuyết null? Để áp dụng những ý tưởng đó vào tình huống của bạn một cách cụ thể hơn, ngay cả khi null của bạn là (và do đó, giả thuyết thay thế của bạn là ), và bạn đã thử thuốc trên bệnh nhân mà không có một ai Đã chữa khỏi, bạn không thể chấp nhận giả thuyết của mình: Dữ liệu vẫn phù hợp với khả năng xác suất là (xem: Làm thế nào để biết xác suất thất bại nếu không có thất bại? ). 0%π0100,0000.00003

Mặt khác, bạn không cần phải có điểm null. Chẳng hạn, các giả thuyết null một đuôi (ví dụ: ) không phải là điểm. Chúng là tập hợp các điểm vô hạn. Tương tự, bạn cũng có thể có một giả thuyết về phạm vi / khoảng (ví dụ: tham số nằm trong ). Trong trường hợp đó, bạn có thể chấp nhận null của mình trên cơ sở bằng chứng bằng chứng đó là tất cả những gì về kiểm tra tương đương. (Tất nhiên, bạn vẫn có thể mắc lỗi loại I). <θ0[a, b]


Vì vậy, một thử nghiệm có ý nghĩa giả thuyết null (Ho: x = 0; Ha: x> 0) không thể hỗ trợ null, nhưng thử nghiệm một đầu (Ho: x <= δ; Ha: x>) có thể hỗ trợ null. Tôi có đúng không?
Jonathan Aquino

@JonathanAquino, miễn là (hay nói cách khác là trên ranh giới của không gian tham số) và do đó là một tập hợp điểm vô hạn, bạn có thể chấp nhận null nếu toàn bộ khoảng tin cậy nằm trong khoảng null. Bạn nên đọc câu trả lời tôi liên kết đến. θ00H0:xθ
gung - Phục hồi Monica

+1 từ lâu nhưng khi đọc lại bây giờ tôi có một sự ngụy biện: Tôi không nghĩ rằng H0 và H1 nhất thiết phải là "toàn diện", ít nhất là không theo cách tiếp cận của Neyman-Pearson (trong đó H1 thường tương ứng với một cụ thể kích thước hiệu ứng và điều này được sử dụng để thực hiện các tính toán sức mạnh).
amip

@amoeba, vì mục đích lập kế hoạch nghiên cứu & phân tích sức mạnh, bạn có một kích thước hiệu ứng cụ thể trong tâm trí, nhưng bản chất của kiểm tra giả thuyết là H0: mu1 = m2; Hà: mu1! = Mu2. Đó là sơ đồ logic của bài kiểm tra giả thuyết. Có 2 ý nghĩa khác nhau của giả thuyết thay thế tùy thuộc vào bối cảnh.
gung - Phục hồi Monica

2

Như những người dùng khác đã nhận xét, vấn đề chấp nhận giả thuyết khống là chúng tôi không có đủ bằng chứng (cũng sẽ không bao giờ) để kết luận rằng hiệu ứng là chính xác 0. Về mặt toán học, kiểm tra giả thuyết thường không có khả năng trả lời các câu hỏi như vậy .

Tuy nhiên, điều đó không có nghĩa là mục đích của câu hỏi của bạn không phải là hợp lệ! Trên thực tế, đây thường là mục đích trong các thử nghiệm lâm sàng đối với thuốc generic: mục tiêu không phải là cho thấy bạn đã sản xuất một loại thuốc hiệu quả hơn, mà là thuốc của bạn về cơ bản có hiệu quả như nhãn hiệu (và bạn có thể sản xuất nó với chi phí thấp hơn nhiều). Sự tương đương thường được coi là giả thuyết khống.

Để giải quyết câu hỏi này bằng cách sử dụng kiểm tra giả thuyết, câu hỏi được cải cách theo cách mà nó có thể được trả lời. Câu hỏi được định dạng lại trông giống như thế này:

Ho:βgβnb×0.75

Ha:βg>βnb×0.75

Trong đó là tác dụng của thuốc generic và là tác dụng của thuốc thương hiệu. Vì vậy, bây giờ nếu chúng ta bác bỏ giả thuyết khống, chúng ta có thể kết luận chung chung có hiệu quả ít nhất 75% như namebrand. Rõ ràng, điều này không giống như nói chính xác tương đương, nhưng nó đặt ra câu hỏi mà bạn quan tâm (và theo cách mà tôi tin là một câu hỏi hợp lý hơn về mặt toán học).β n bβgβnb

Chúng tôi có thể tiếp cận câu hỏi của bạn theo cách tương tự. Thay vì cố gắng nói "chúng ta có đủ bằng chứng để kết luận 0 hiệu lực không?", Chúng ta có thể hỏi "đưa ra bằng chứng, hiệu quả tối đa mà kết quả của chúng ta không quá bất thường là gì?". Với và 0 thành công, có thể khẳng định chúng tôi có đủ bằng chứng để kết luận rằng xác suất thành công là dưới 0,3% (dựa trên thử nghiệm chính xác của Fisher, ).α = 0,05n=1000α=0.05

Từ kết quả này, chắc chắn bạn vẫn có thể kết luận rằng đây không phải là thuốc bạn sẽ có niềm tin.


2
Chà, nếu tỷ lệ thành công thực sự là 0,3% và thuốc là một ly nước hoặc mười phút đi bộ trong công viên, nó vẫn có thể xứng đáng là một "toa thuốc" chung
Hagen von Eitzen

1

Giả sử rằng thuốc hoạt động, nhưng chỉ trên 0,00001% dân số. Thuốc có tác dụng, thời kỳ. Tỷ lệ phát hiện, theo thống kê, nó hoạt động như thế nào một mẫu của 10000 người? 100.000 người? 1.000.000 người?


Bạn sẽ nói gì khi trả lời bình luận của @ octern?
Jonathan Aquino

1

Thật không đúng khi nói rằng bạn không bao giờ có thể chấp nhận giả thuyết khống. Bạn đang lấy thông tin sách giáo khoa ra khỏi bối cảnh. Những gì bạn không thể làm là sử dụng một bài kiểm tra giả thuyết không để chấp nhận nó. Bài kiểm tra là để bác bỏ giả thuyết. Lưu ý rằng lập luận của riêng bạn để chấp nhận có ít liên quan đến kết quả kiểm tra. Đó là về dữ liệu. Nó sẽ là khá điên rồ khi chạy một bài kiểm tra trong ví dụ của bạn. Bạn có thể sử dụng dữ liệu của mình để lập luận rằng bạn chấp nhận giả thuyết khống. Không có gì sai với điều đó. Bạn không thể sử dụng kết quả của bài kiểm tra để làm như vậy.

Lý do mà bạn không thể tự mình sử dụng một bài kiểm tra giả thuyết là vì nó không được thiết kế để làm điều đó. Nếu bạn không hiểu điều đó từ sách giáo khoa thì có thể hiểu được. Đây thực sự là một nghịch lý thú vị rằng giá trị p chỉ thực sự có nghĩa là một cái gì đó nếu null là đúng nhưng không thể được sử dụng để chứng minh null là đúng. Để làm cho nó dễ dàng hơn có lẽ chỉ cần xem xét độ nhạy năng lượng. Bạn luôn có thể thu thập quá ít mẫu và không từ chối null. Vì bạn có thể làm điều đó nên rõ ràng việc kiểm tra một mình không phải là lý do hợp lệ để chấp nhận null. Nhưng một lần nữa, điều đó không có nghĩa là bạn không bao giờ có thể nói null là đúng. Nó chỉ có nghĩa là bài kiểm tra không có cơ sở để lập luận null là đúng.

LƯU Ý : Có một đối số dao cạo của Occam rằng bạn nên chấp nhận null khi bạn không từ chối; nhưng bài kiểm tra không bảo bạn chấp nhận null. Những gì bạn đang làm là chấp nhận null làm mặc định và nếu bạn không từ chối với thử nghiệm thì bạn sẽ duy trì trạng thái mặc định. Vì vậy, ngay cả trong trường hợp này, null không được chấp nhận vì thử nghiệm.


1

Nhìn qua ý kiến ​​của bạn, tôi nghĩ rằng bạn rất quan tâm đến câu hỏi này: tại sao chúng ta có thể tích lũy đủ bằng chứng để từ chối null , nhưng không phải là sự thay thế , tức là điều gì làm cho giả thuyết thử nghiệm một con đường một chiều?

Điều rất quan trọng để suy nghĩ là những giá trị nào cấu thành giả thuyết null? Trong ví dụ của bạn, nó chỉ là một giá trị duy nhất, , . Thay vào đó, ngược lại, là . p = 0 p > 0i.e.p=0p>0

Chúng tôi chấp nhận một trong hai giả thuyết nếu tất cả "giá trị hợp lý" (nghĩa là các giá trị trong khoảng tin cậy của chúng tôi) hoàn toàn nằm trong phạm vi được đưa ra bởi giả thuyết đó. Vì vậy, nếu tất cả các giá trị hợp lý của chúng tôi lớn hơn 0, chúng tôi sẽ chấp nhận thay thế. Mặt khác, giả thuyết null chỉ là một điểm duy nhất, 0! Vì vậy, để chấp nhận null, chúng ta sẽ phải có khoảng tin cậy có độ dài 0 . Vì (nói chung), khoảng tin cậy độ dài tiếp cận 0 là , nhưng không đạt được độ dài 0 cho hữu hạn , chúng tôi sẽ cần thu thập một lượng dữ liệu vô hạn để kết luận rằng chúng tôi không có biên độ sai số trong ước tính.nnn

Nhưng lưu ý rằng nếu chúng ta xác định giả thuyết null không chỉ là một điểm duy nhất, tức là kiểm tra giả thuyết một phía như

Ho:p0.5

Ha:p>0.5

chúng tôi thực sự có thể chấp nhận giả thuyết null. Giả sử khoảng tin cậy của chúng tôi là (0,35, 0,45). Tất cả các giá trị này nhỏ hơn hoặc bằng 0,5, nằm trong vùng của giả thuyết null. Vì vậy, trong trường hợp đó, chúng tôi có thể chấp nhận null.

Nhỏ, kỹ thuật, lạm dụng số liệu thống kê lưu ý: nếu một người thực sự sẵn sàng lạm dụng lý thuyết tiệm cận, thì người ta thực sự có thể (nhưng không nên ...) chấp nhận null trong ví dụ của bạn: lỗi tiêu chuẩn tiệm cận là . Vì vậy, khoảng tin cậy tiệm cận của bạn sẽ là (0,0), tất cả đều thuộc về giả thuyết null. Nhưng điều này chỉ lạm dụng kết quả tiệm cận; lưu ý rằng bạn nhận được kết luận tương tự ngay cả khi = 1.n(p^(1p^)/n)=0n


0

Tôi biết bạn đang đối phó với giả thuyết null, nhưng vấn đề thực sự là ví dụ được đưa ra hoặc như đã nêu Ví dụ đơn giản. 1.000 người được cho một loại thuốc và nó không hoạt động. Những người khác đã làm những gì mà những người này có, độ tuổi và giai đoạn tuyệt vọng của họ. Để tuyên bố một giả thuyết không có thêm thông tin; có lẽ là chi tiết; phải được đưa ra để làm cho công việc này trong một môi trường khoa học.


Cho dù chúng ta thêm bao nhiêu thông tin - dù ở độ tuổi hay giai đoạn bệnh - chúng ta không bao giờ có thể chấp nhận giả thuyết khống. Tôi đang cố gắng để hiểu tại sao.
Jonathan Aquino
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.