Có thể chứng minh một giả thuyết không?


37

Như câu hỏi nêu - Có thể chứng minh giả thuyết không? Từ sự hiểu biết (hạn chế) của tôi về giả thuyết, câu trả lời là không nhưng tôi không thể đưa ra một lời giải thích nghiêm ngặt cho nó. Câu hỏi có câu trả lời dứt khoát không?


4
Nó phụ thuộc vào những gì bạn có nghĩa là "chứng minh." Như đã nêu, đây là một câu hỏi triết học, không phải là một câu hỏi thống kê và không có câu trả lời dứt khoát (mặc dù, ít nhất là từ thời David Hume, hầu hết mọi người sẽ trả lời "không").
whuber

Đây là một phần của một câu hỏi đặt ra. Chúng ta cần biết các điều kiện theo đó "bằng chứng" này sẽ xảy ra.
xác suất

Có lẽ một câu hỏi được đặt ra tốt hơn là "Trong những điều kiện / giả định nào có thể chứng minh giả thuyết null?"
xác suất

Câu trả lời:


19

Nếu bạn đang nói về thế giới thực & logic không chính thức, câu trả lời là tất nhiên. "Bằng chứng" của bất cứ điều gì bằng các phương tiện thực nghiệm phụ thuộc vào sức mạnh của suy luận mà người ta có thể thực hiện, do đó được xác định bởi tính hợp lệ của quá trình thử nghiệm được đánh giá theo mọi thứ người ta biết về cách thế giới hoạt động (ví dụ, lý thuyết). Bất cứ khi nào người ta chấp nhận rằng một số kết quả thực nghiệm nhất định biện minh cho việc bác bỏ giả thuyết "không", người ta nhất thiết phải đưa ra phán đoán thuộc loại này (tính hợp lệ của thiết kế; thế giới hoạt động theo cách nào đó), do đó phải đưa ra các giả định tương tự cần thiết để chứng minh "bằng chứng suy luận" null "hoàn toàn không có vấn đề gì.

Vậy các giả định tương tự là gì? Dưới đây là một ví dụ về "chứng minh null" là điều phổ biến trong khoa học sức khỏe & trong khoa học xã hội. (1) Xác định "null" hoặc "không có hiệu lực" theo một cách nào đó thực sự có ý nghĩa. Chúng ta hãy nói rằng tôi tin rằng tôi nên tiến hành như thể không có sự khác biệt có ý nghĩa giữa 2 phương pháp điều trị, t1 & t2, đối với một căn bệnh trừ khi một phương pháp có khả năng phục hồi cao hơn 3% so với phương pháp khác. (2) Tìm ra một thiết kế hợp lệ để kiểm tra xem có bất kỳ ảnh hưởng nào không - trong trường hợp này, liệu có sự khác biệt về khả năng phục hồi giữa t1 & t2 hay không. (3) Thực hiện phân tích công suất để xác định xem cỡ mẫu nào là cần thiết để tạo ra khả năng đủ cao-- một mức mà tôi tự tin dựa vào việc đưa ra cái gì 'giả sử nó tồn tại Thông thường mọi người nói rằng sức mạnh là đủ nếu khả năng quan sát hiệu ứng được chỉ định ở mức alpha được chỉ định ít nhất là 0,80, nhưng mức độ tin cậy đúng đắn thực sự là vấn đề khiến bạn không thích lỗi như thế nào - giống như khi bạn chọn p - ngưỡng giá trị cho "từ chối null." (4) Thực hiện kiểm tra theo kinh nghiệm và quan sát hiệu quả. Nếu nó nằm dưới giá trị "khác biệt có ý nghĩa" được chỉ định - 3% trong ví dụ của tôi - bạn đã "chứng minh" rằng "không có hiệu lực".

Để có cách xử lý tốt vấn đề này, hãy xem Streiner, DL Unicorns Do Exist: Hướng dẫn về cách chứng minh giả thuyết Null giả thuyết . Tạp chí Tâm thần học Canada 48, 756-761 (2003).


1
+1. Đây là một ví dụ hay về tầm quan trọng của việc rõ ràng về tiêu chuẩn "bằng chứng" của một người. Trong nhiều ứng dụng, ứng dụng bạn gọi ở đây - tiêu chuẩn "hành động như thể", nếu tôi có thể gọi nó là - yếu đến mức không ai chấp nhận nó là "bằng chứng". Tuy nhiên, tôi không phủ nhận tiện ích của nó và ủng hộ cách tiếp cận này để hỗ trợ cho việc ra quyết định hợp lý. (Nhưng có lẽ các phương pháp Bayes tốt hơn ... :-)
whuber

1
(+1) Câu trả lời hay. Tôi đã thêm một liên kết đến một phiên bản trực tuyến của bài viết của Streiner; Tôi hy vọng bạn không phiền (cứ thoải mái xóa).
chl

1
thêm một vài điều nữa: (1) Việc coi việc không từ chối null là bằng chứng ủng hộ null là một lỗi phổ biến gây sốc & là dịp thông thường đối với quan điểm của Streiner. Lỗi này về cơ bản biến ác cảm mạnh mẽ thành lỗi loại 1 trong định mức "p <0,05" thành giấy phép để biến loại 2. S nói, "chờ đợi - bạn cần sức mạnh ..." (2) Whuber trích dẫn lập luận nổi tiếng của Hume. Pt của H thực sự chỉ là lật đổ các bằng chứng thực nghiệm bác bỏ null như bằng chứng của null. H nói rằng cảm ứng không thể hỗ trợ suy luận nguyên nhân. Được; nhưng không có sự thay thế cho nghiên cứu thực nghiệm! Đi Pearl (& Bayes), không phải Hume, về nhân quả!
dmk38

1
câu hỏi này về kiểm tra tương đương cũng có một số thống kê gợi ý hay.stackexchange.com/questions/3038/iêu
Jeromy Anglim

Điều này có tương đương với giả định "không phải là null" như giả thuyết null mới và sau đó bác bỏ giả thuyết null mới này không?

16

Trả lời từ phía toán học: có thể nếu và chỉ khi "các giả thuyết là số ít".

Nếu bằng cách "chứng minh", bạn có nghĩa là có một quy tắc có thể "chấp nhận" (tôi nên nói vậy :)) với xác suất mắc lỗi là 0, thì bạn đang tìm kiếm cái gọi là "thử nghiệm lý tưởng" và điều này tồn tại :H0

H 0 : X P 0 H 1 : X P 1 P 1P 0 P 1 P 0XP0P1H0:XP0H1:XP1 P1P0P1P0

Nếu bạn không biết "số ít lẫn nhau" nghĩa là gì thì tôi có thể cho bạn một ví dụ: và (đồng phục trên và ) là số ít lẫn nhau. Điều này có nghĩa là nếu bạn muốn kiểm traU [ 3 , 4 ] [ 0 , 1 ] [ 3 , 4 ]Bạn[0,1]Bạn[3,4][0,1][3,4]

H0:XBạn[0,1] so vớiH1:XBạn[3,4]

sau đó tồn tại một bài kiểm tra lý tưởng (đoán xem đó là gì :)): một bài kiểm tra không bao giờ sai!

Nếu và không ít lẫn nhau, thì điều này không tồn tại (kết quả này từ "chỉ khi phần")!P1P0

Theo thuật ngữ phi toán học, điều này có nghĩa là bạn có thể chứng minh null khi và chỉ khi bằng chứng đã có trong các giả định của bạn (nghĩa là nếu và chỉ khi bạn đã chọn giả thuyết và khác nhau đến không thể xác định được một quan sát từ như một từ và ngược lại). H0H1H0H1


4
+1 Câu trả lời hay. Một biểu hiện đơn giản của toán học là null và các lựa chọn thay thế của nó được giả định để mang lại các kết quả rời rạc; ví dụ, có một con ngựa vằn trong phòng này hoặc không có. Tất nhiên "chứng minh" ở đây bao gồm "điều kiện trên mô hình", bản thân nó không bao giờ được thiết lập với cùng một sự nghiêm ngặt như, như, một định lý toán học; nó ngầm bao gồm "điều kiện về tính chính xác của các quan sát;" và nó bao gồm ngầm rằng các giả thuyết có thể được giải thích rõ ràng. (Đối với những lời chỉ trích sau này, hãy xem Phụ nữ, Lửa và Những điều nguy hiểm của George Lakoff . )
whuber

11

Vâng, có một câu trả lời dứt khoát. Câu trả lời đó là: Không, không có cách nào để chứng minh một giả thuyết khống. Điều tốt nhất bạn có thể làm, theo như tôi biết, là đưa ra các khoảng tin cậy xung quanh ước tính của bạn và chứng minh rằng hiệu ứng này rất nhỏ đến mức về cơ bản nó không tồn tại.


4
Nói chung, vấn đề trong thống kê không phải là bạn không thể chứng minh giả thuyết khống, mà là bạn không thể đưa ra bất kỳ ước tính điểm nào một cách chắc chắn. Đó là, giống như bạn không thể nói "không có tác động của biến", bạn không thể nói rằng "kích thước hiệu ứng của biến là 1,95". Thống kê luôn có khoảng tin cậy.
russellpierce

1
Đồng ý rằng câu trả lời là KHÔNG lớn và vì một lý do rất mạnh mẽ: bằng cách xây dựng giả thuyết thống kê. Thực tế là câu trả lời được chấp nhận là yêu cầu khác là hoàn toàn bi thảm. Thử nghiệm giả thuyết nào cung cấp như một câu trả lời là: giả sử giả thuyết của tôi là đúng , dữ liệu mà tôi đã lấy mẫu có phù hợp với nó không? Và không có nghĩa là cách khác xung quanh. Không cần nhiều lý do để hiểu rằng bạn không thể suy luận từ đó cho dù giả thuyết đó có đúng hay không.
Barshe

4

Đối với tôi, khung lý thuyết quyết định trình bày cách dễ nhất để hiểu "giả thuyết khống". Về cơ bản nó nói rằng phải có ít nhất hai lựa chọn thay thế: giả thuyết Null và ít nhất một lựa chọn thay thế. Sau đó, "vấn đề quyết định" là chấp nhận một trong những lựa chọn thay thế và từ chối những cái khác (mặc dù chúng ta cần phải chính xác về ý nghĩa của chúng ta bằng cách "chấp nhận" và "từ chối" giả thuyết). Tôi thấy câu hỏi "chúng ta có thể chứng minh giả thuyết không?" tương tự như "chúng ta luôn có thể đưa ra quyết định chính xác?". Từ góc độ lý thuyết quyết định, câu trả lời rõ ràng là có nếu

1) không có sự không chắc chắn trong quá trình ra quyết định, sau đó nó là một bài tập toán học để tìm ra quyết định chính xác là gì.

2) chúng tôi chấp nhận tất cả các tiền đề / giả định khác của vấn đề. Điều quan trọng nhất (tôi nghĩ) là giả thuyết mà chúng ta đang quyết định là toàn diện, và một (và chỉ một) trong số chúng phải đúng và những cái khác phải sai.

Từ quan điểm triết học hơn, không thể "chứng minh" bất cứ điều gì, theo nghĩa là "bằng chứng" phụ thuộc hoàn toàn vào các giả định / tiên đề dẫn đến "bằng chứng" đó. Tôi thấy bằng chứng là một loại tương đương logic chứ không phải là "thực tế" hay "sự thật" theo nghĩa là nếu bằng chứng đó sai, các giả định dẫn đến nó cũng sai.

Áp dụng điều này vào "chứng minh giả thuyết khống" tôi có thể "chứng minh" nó là đúng bằng cách đơn giản cho rằng nó đúng hoặc bằng cách giả sử rằng nó đúng nếu đáp ứng một số điều kiện nhất định (chẳng hạn như giá trị của thống kê).


3

Vâng, có thể chứng minh null - theo nghĩa chính xác tương tự rằng có thể chứng minh bất kỳ thay thế nào cho null. Trong một phân tích Bayes, hoàn toàn có thể cho các tỷ lệ cược có lợi cho null so với bất kỳ giải pháp thay thế được đề xuất nào để nó trở nên lớn tùy ý. Hơn nữa, thật sai lầm khi khẳng định, như một số câu trả lời ở trên khẳng định, người ta chỉ có thể chứng minh null nếu các lựa chọn thay thế cho nó không khớp nhau (không trùng với null). Trong một phân tích Bayes, mọi giả thuyết đều có phân phối xác suất trước. Phân phối này trải một khối đơn vị xác suất trước ra ngoài các phương án được đề xuất. Giả thuyết khống đặt tất cả các xác suất trước vào một phương án duy nhất. Về nguyên tắc, các lựa chọn thay thế cho null có thể đặt tất cả các xác suất trước vào một số thay thế không null (trên một "điểm" khác), nhưng điều này là hiếm Nói chung, hàng rào thay thế, nghĩa là, chúng lan truyền cùng một khối lượng xác suất trước ra ngoài các lựa chọn thay thế khác - hoặc để loại trừ thay thế null, hoặc, phổ biến hơn, bao gồm cả thay thế null. Sau đó, câu hỏi đặt ra là giả thuyết nào đặt xác suất trước nhiều nhất khi dữ liệu thực nghiệm rơi xuống. Nếu dữ liệu rơi xuống xung quanh nơi null nói rằng họ nên rơi, thì đó sẽ là sự ưu tiên về tỷ lệ cược (trong số các giả thuyết được đề xuất) NGAY CẢ KHI NÓ ĐÃ BAO GỒM (NESTED IN, KHÔNG PHẢI TUYỆT ĐỐI VỚI NÓ). Việc tin rằng không thể thay thế lồng nhau có khả năng cao hơn tập hợp mà nó được lồng phản ánh sự thất bại trong việc phân biệt giữa xác suất và khả năng. Mặc dù không thể có một thành phần của tập hợp có thể xảy ra ít hơn so với toàn bộ tập hợp, nhưng khả năng về sau của một thành phần của một tập hợp giả thuyết là lớn hơn khả năng của tập hợp sau. Khả năng sau của một giả thuyết là sản phẩm của hàm khả năng và phân phối xác suất trước mà giả thuyết đặt ra. Nếu một giả thuyết đặt tất cả các xác suất trước vào đúng chỗ (ví dụ: trên null), thì nó sẽ có khả năng về sau cao hơn so với một giả thuyết đặt một số xác suất trước đó vào sai vị trí (không phải là null). Khả năng sau của một giả thuyết là sản phẩm của hàm khả năng và phân phối xác suất trước mà giả thuyết đặt ra. Nếu một giả thuyết đặt tất cả các xác suất trước vào đúng chỗ (ví dụ: trên null), thì nó sẽ có khả năng về sau cao hơn so với một giả thuyết đặt một số xác suất trước đó vào sai vị trí (không phải là null). Khả năng sau của một giả thuyết là sản phẩm của hàm khả năng và phân phối xác suất trước mà giả thuyết đặt ra. Nếu một giả thuyết đặt tất cả các xác suất trước vào đúng chỗ (ví dụ: trên null), thì nó sẽ có khả năng về sau cao hơn so với một giả thuyết đặt một số xác suất trước đó vào sai vị trí (không phải là null).


2

Về mặt kỹ thuật, không, một giả thuyết không thể được chứng minh. Đối với bất kỳ kích thước mẫu cố định, hữu hạn nào, sẽ luôn có một số kích thước hiệu ứng nhỏ nhưng khác không mà kiểm tra thống kê của bạn hầu như không có sức mạnh. Tuy nhiên, thực tế hơn, bạn có thể chứng minh rằng bạn đang ở trong một số epsilon nhỏ của giả thuyết null, sao cho độ lệch nhỏ hơn epsilon này không thực sự có ý nghĩa.


2

Có một trường hợp mà một bằng chứng là có thể. Giả sử bạn có một trường học và giả thuyết không có giá trị của bạn là số con trai và con gái bằng nhau. Khi kích thước mẫu tăng lên, sự không chắc chắn về tỷ lệ giữa nam và nữ có xu hướng giảm, cuối cùng đạt được sự chắc chắn (đó là điều tôi cho là bạn có nghĩa là bằng chứng) khi toàn bộ học sinh được lấy mẫu.

Nhưng nếu bạn không có dân số hữu hạn hoặc nếu bạn đang lấy mẫu bằng vật thay thế và không thể phát hiện ra các cá thể được lấy mẫu lại, thì bạn không thể giảm độ không đảm bảo về 0 bằng một mẫu hữu hạn.


0

Tôi muốn thảo luận ở đây một điểm rất nhiều người dùng có phần bối rối. Ý nghĩa thực sự của tuyên bố giả thuyết Null H0: p = 0 là gì? Có phải chúng ta đang cố gắng xác định xem tham số p có bằng không? Tất nhiên là không, không có cách nào để đạt được mục tiêu như vậy.

Những gì chúng tôi dự định thiết lập là, với tập dữ liệu, giá trị tham số được đánh giá là (hoặc không) không thể nhận biết được từ 0. Hãy nhớ rằng NHST "không công bằng" đối với các giả thuyết thay thế: null được gán cho Mức tin cậy 95% và chỉ 5% cho mức thay thế. Do đó, một kết quả không quan trọng "không có nghĩa là H0 giữ mà chỉ đơn giản là chúng tôi không tìm thấy đủ bằng chứng cho thấy sự thay thế có khả năng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.